CN1726285A

CN1726285A - 用于抗hiv免疫的方法和组合物

Info

Publication number: CN1726285A
Application number: CNA2003801060851A
Authority: CN
Inventors: Y·黄; D·D·侯; Z·陈
Original assignee: Aaron Diamond AIDS Research Center
Current assignee: Aaron Diamond AIDS Research Center
Priority date: 2002-10-18
Filing date: 2003-10-17
Publication date: 2006-01-25
Also published as: WO2004035006A3; ZA200504021B; AP2005003316A0; CN1490056A; WO2004035006A2; US20090227658A1; AU2003286486A1; EP1570067A2; AU2003286486A8; EP1570067A4

Abstract

本发明涉及用于预防HIV感染的核酸和减毒痘苗病毒载体，以及在对HIV感染易感的受试者体内引发免疫应答的方法。本发明的预防性疫苗方案包括用包含两种新型DNA载体的接种物进行初次免疫，然后用表达相应HIV蛋白的修饰痘苗病毒Ankara(MVA)重组病毒载体进行加强免疫。

Description

用于抗HIV免疫的方法和组合物

相关申请的交叉引用

本申请要求于2002年10月18日申请的编号为60/419,465的美国临时申请的优先权。

所有前述申请，以及所有前述申请中引用的文件(“申请文件”)和申请文件中引用或参考的所有文件都通过引用结合到本文中。此外，本申请所引用的所有文件(“本文引用的文件”)和本文引用的文件中引用或参考的所有文件都通过引用结合到本文中。另外，在每个申请文件或本文引用的文件中所引用或提及的任何产品的制造商的说明书或产品目录都通过引用结合到本文中。通过引用结合到本文中的文件或其中任何描述都可用于本发明的实践。通过引用结合到本文中的文件并不承认是现有技术。

关于联邦资助研究下所作的本发明的权利声明

艾伦·戴蒙德爱滋病研究中心(Aaron Diamond AIDS ResearchCenter，ADARC)和国际爱滋病疫苗发起组织(International AIDSVaccine Initiative，IAVI)为本发明提供了研发基金，因此ADARC和IAVI在本发明中可享有一定的权利。

发明领域

本发明涉及用于治疗和预防人免疫缺陷病毒(HIV)感染的核酸和减毒痘苗病毒载体，以及在对HIV感染易感的受试者体内引发免疫应答的方法。本发明的治疗性和预防性疫苗方案包括用包含两种新型核酸载体的接种物进行初次免疫，然后用表达相应HIV蛋白的修饰痘苗病毒Ankara(MVA)重组病毒载体进行加强免疫。本发明的其它方面在以下发明内容中有描述或者是显而易见的，并且都包括本发明的范围之内。

发明背景

尽管经过20多年的努力抗争，但是全球HIV流行仍然持续不断地危害人类。面对这一前所未有的医学挑战，科学界在病毒学、免疫学和药学领域上已经取得了重大进展。尽管如此，已经异常艰难地证明了感染在全世界的扩散，以及在大多数感染者中预防疾病的发展。自流行开始，已有6500万人被感染。全球至今有超过4200万活着的HIV感染者，仅在2002年就有500万新增感染病例(AIDSepidemic update，December 2002.Joint UNAIDS/WHO)。自大流行开始，已有超过2500万人死于该病；仅在2002年就有300万人死于爱滋病(AIDS)。超过95％的新增HIV感染病例是发生在发展中国家，绝大多数感染是发生在撒哈拉非洲次大陆和东南亚。在接受抗逆转录病毒药物的感染者中，有5％的人因副作用而明显不耐受可用的药物，而另一部分人则携带抗药性病毒变异株。虽然公共卫生工作在某些地区有助于减缓HIV传播速率，但是对全球性难题来说，显而易见，保护性疫苗才是最令人满意的解决方案。

已鉴定出两种主要的HIV病毒，即HIV-1和HIV-2。HIV-1的3个亚型组已在全球扩散：M(主要亚型组，major)、O(外亚型组，outlying)和N(新亚型组，new)。其中M组占已报告HIV/AIDS病例的90％以上；在M组中，病毒包膜变化多样，使得该组被进一步划分成9个主要的基因亚型(包括A-D、F-H、J和K)以及多个循环重组型。病毒多样性看来是从撒哈拉非洲次大陆发散开来，在这里生活着的总共4000万人中超过2800万人被感染。另一类逆转录病毒即HIV-2，以前多在西非流行，但目前也已广泛流行。在非洲以外的地区已观察到散在病例，但该病毒看来致病性明显小于HIV-1。

HIV-1的一个特殊亚型看来已获得系统发生优势(phylogeneticdominance)。目前全球亚型C病毒占新增HIV-1感染的50％强。具体地讲，该基因亚型已在大部分撒哈拉非洲次大陆肆虐，并且目前已蔓延到印度支那(Beyrer，C.等，(2000)AIDS，14(1)：75-83；Yu，X.F.，(2001)AIDS 15(4)：523-5；Piyasirisilp，S.等，(2000)AIDS 74(23)：11286-95)。通过印度和缅甸，亚型C在中华人民共和国找到立足点，据推测是在中国西南地区的静脉吸毒者(IVDU)之间进行传播。云南省的负担特别重，占全中国将近半数的HIV-1病例。根据云南省卫生厅，在该省的IVDU中HIV-1感染的感染率在2000年为29％，到2005年预期可达40.7％。云南5个县(文山、红河、德宏、临沧和大理)感染率最高，估计在50％至75％之间。HIV-1亚型C也波及邻省，例如四川和广西，并且也是遥远的新疆发生大量感染的原因。

DNA疫苗或基因免疫在疫苗学上是有希望的新策略。已知细胞介导免疫(CMI)是控制HIV-1复制的关键(Ogg等，(1998)Science 279：2103-6；Schmitz等，(1999)Science 283：857-60；Jin等，(1999)J.Exp.Med.189：991-8；McMichael等，(2001)Nature 410：980-7)。设计抗HIV-1疫苗的早期工作显示，蛋白/亚单位或灭活病毒等常规方法对逆转录病毒感染无效。也许作为从头表达的结果，DNA疫苗看来容许对产生CMI的更好的抗原呈递。在一项研究中，DNA疫苗对用病原性SHIV进行实验性攻击的恒河猴(rhesus macaque)产生至少部分保护性(Barouch等，(2000)Science 290：486-92)。然而，当在初次-加强方案中与重组载体联用时，证明DNA疫苗在刺激CMI和含有SHIV感染中甚至能更有效(Robinson等，(1999)Nat.Med.5：526-34；Hanke等，(1999)Vaccine 17：589-96；Hanke等，(1999)J.Virol.73：7524-32；Allen等，(2000)J.Immunol.164：4968-78；Amara等，(2001)Science 292：69-74；Barouch等，(2001)J.Virol.75：5151-8)。

普遍认为，按照HIV自身而设计的减毒活疫苗用于抗病毒，具有不可接受的风险。因此，在其它疫苗策略迄今未获成功的情况下，单用核酸或与减毒的非慢病毒加强联用的有效疫苗方案将提供显著的进步。

发明概述

迄今为止，安全而有效的治疗性和预防性抗HIV疫苗一直是一个重大挑战。传统疫苗方法已证明对HIV是无效或不安全的，然而，已经意想不到地显示，单独给予或者与减毒痘病毒联合用于加强给予抗HIV的核酸疫苗，在抗选定HIV抗原决定簇的免疫应答的刺激中是有效的。因此，本发明涉及用于治疗和预防HIV感染的核酸和减毒痘苗病毒载体，以及在对HIV感染易感的受试者体内引发免疫应答的组合物和方法。本发明的治疗性和预防性疫苗方案包括用含两种新型核酸载体的接种物进行初次免疫，然后用表达相应HIV蛋白的重组MVA进行加强免疫。

本发明的其它方面在以下发明内容中有描述或者是显而易见的，并且包括在本发明的范围之内。

本发明的第一方面提供核酸载体，所述载体包含至少一个有效连接启动子的HIV序列，并且该序列编码不能装配成病毒颗粒的蛋白。

另一方面，所述核酸载体包含至少两个HIV序列，其中所述HIV序列分别与各自的启动子有效连接，并且其中所述HIV序列编码不能装配成病毒颗粒的蛋白。

本文所述的HIV序列选自env、gag、pol、tat、rev、nef、vif、vpr、vpu、vpx、其突变体、融合体及其部分。

启动子包含选自以下的异源启动子：原核启动子、真核启动子和病毒启动子。在一个实施方案中，所述真核启动子是人类真核起始因子-1α启动子，而所述核酸载体的病毒启动子是巨细胞病毒立即/早期启动子。

本发明也描述了位于HIV序列下游的转录终止序列在所述核酸载体中的用途。所述转录终止子可以是选自以下的聚腺苷酸化信号：牛生长激素聚腺苷酸化信号、SV40聚腺苷酸化信号和痘苗病毒聚腺苷酸化信号。

本发明还描述了至少一个与异源前导序列有效连接的HIV序列。所述前导序列可以是组织纤溶酶原激活物(tPA)前导序列，但也可以包含酵母α-因子交配信息素前导序列、前胰岛素原前导序列和转化酶前导序列、免疫球蛋白A前导序列和卵白蛋白前导序列。

本发明的核酸载体包含与tPA前导序列有效连接的HIV Gag，使得病毒颗粒不能装配。在本发明的一个实施方案中，所述HIV序列选自SEQ ID NO：7、SEQ ID NO：9、SEQ ID NO：11、SEQ ID NO：13；SEQ ID NO：17；和SEQ ID NO：19。

本发明的核酸载体也包括在单细胞生物中指导核酸载体复制和扩增的复制起点。这些起点可以是但不限于colE1(pMB1)起点、2μ酵母起点、真核着丝粒区、真核自主复制序列、SV40起点和巨细胞病毒(CMV)起点。

本发明的核酸载体还包含选择性标记基因，所述基因可以是抗生素抗性基因。所述抗性基因可以是抗以下抗生素的基因：氨苄青霉素、四环素、卡那霉素、强力霉素、新霉素、潮霉素、博来霉素、零霉素(zeocin)、嘌呤霉素和氯霉素。

在本发明的另一方面，提供包含至少两个HIV序列的核酸载体，其中所述HIV序列分别与各自的启动子有效连接，并且编码不能装配成病毒颗粒的蛋白。此外，至少一个HIV序列与异源前导序列有效连接。所述载体还任选包含下游转录终止子、复制起点和选择性标记基因。

本发明的核酸载体可以是病毒载体，例如修饰痘苗病毒Ankara(MVA)载体、ALVAC载体、NYVAC.1载体或NYVAC.2载体。所述病毒载体最好是MVA载体，所述MVA载体包含至少两个插入到MVA基因组缺失位点III的HIV序列，其中所述HIV序列分别与各自的启动子有效连接，并且其中所述HIV序列编码不能装配成病毒颗粒的蛋白。

用于表达所述HIV序列的痘病毒启动子选自痘病毒7.5K启动子、疸病毒40K启动子、痘病毒H5启动子、痘病毒11K启动子、痘病毒I3启动子、痘病毒合成(SYN)启动子和痘病毒合成早期/晚期启动子。在另一个实施方案中，所述启动子是不同的启动子。

另一方面使用核酸载体，所述载体是MVA载体，所述MVA载体包含至少两个插入到MVA基因组缺失位点III的HIV序列、至少一个插入到MVA基因组缺失位点II的HIV序列；并且其中所述HIV序列分别与各自的启动子有效连接。此外，这些HIV序列编码不能装配成病毒颗粒的蛋白。

本发明内容中描述的HIV序列选自env、gag、pol、tat、rev、nef、vif、vpr、vpu、vpx、其突变体、融合体及其部分。

本发明病毒载体中描述的启动子选自痘病毒7.5K启动子、痘病毒40K启动子、痘病毒H5启动子、痘病毒11K启动子、疸病毒I3启动子、痘病毒合成(SYN)启动子和痘病毒合成早期/晚期启动子。在另一个实施方案中，所述启动子是不同的启动子。

本发明的HIV序列还包含选自以下的异源前导序列：tPA前导序列、酵母α-因子交配信息素前导序列、前胰岛素原前导序列、转化酶前导序列、免疫球蛋白A前导序列、β-珠蛋白前导序列和卵白蛋白前导序列。

在本发明的一个实施方案中，HIV序列SEQ ID NO：17和SEQ IDNO：19插入到MVA的缺失位点III，而SEQ ID NO：21插入到MVA的缺失位点II。

本发明也描述了一种核酸载体，所述载体包含选自以下的病毒载体：ALVAC、MVA、NYVAC.1和NYVAC.2。本发明的一个实施方案提供MVA载体，所述载体包含插入到MVA缺失位点III的tPA-δV2 env和tPA-gag-pol，以及插入到MVA缺失位点II的tPA-nef-tat。

包含本文描述的核酸载体的组合物也包括在本发明内容中。在一个实施方案中，每个核酸载体包含不同的HIV序列。优选tPA-env和tPA-gag在第一核酸载体上，而tPA-nef-tat在第二核酸载体上。甚至更优选SEQ ID NO：7和SEQ ID NO：9在第一核酸载体上，而SEQ IDNO：11和SEQ ID NO：13在第二核酸载体上。

本发明的另一方面描述了一种组合物，其中tPA-env和tPA-gag在第一核酸载体上，而tPA-pol和tPA-nef-tat在第二核酸载体上。所述组合物还包含插入到MVA缺失位点III的tPA-δ V2 env和tPA-gag-pol以及插入到MVA缺失位点II的tPA-nef-tat。SEQ ID NO：7和SEQ ID NO：9最好是在第一核酸载体上，而SEQ ID NO：11和SEQ IDNO：13在第二核酸载体上。所述组合物还包含插入到MVA缺失位点II的SEQ ID NO：17和SEQ ID NO：19。

本发明还涉及药用组合物，所述组合物包含上述核酸载体，以及药学上可接受的载体、辅料或赋形剂。

此外，本发明涉及在对HIV相关疾病或病症易感的受试者体内引发免疫应答的方法。所述方法包括将本发明内容中描述的核酸载体、组合物和药用组合物给予所述受试者，从而引发抗HIV的免疫应答。

附图简述

以下详述仅作为实例，并不是将本发明限制在具体描述的实施方案中，可以结合附图来理解这些详述，所述详述通过引用结合到本文中。以非限制性实例的方式并参考以下附图来描述本发明的各种优选特征和实施方案，其中：

图1是pVAX1的示意图。

图2是pADVAX的示意图，所述载体是包括人延伸因子1α(hEF1α)作为第二启动子的修饰pVAX1载体。

图3柱状图，显示出当用市售的ELISA试剂盒定量测定HIV Gag(p24)时，在瞬时转染天然pVAX1、密码子最优化pADVAX和密码子最优化tPA pADVAX的293T细胞中gag基因表达。

图4是env在用以下DNA构建体转染的293T细胞中表达的蛋白质印迹：带有rev的天然gp160(A)、带有天然信号肽的最优化gp160(B)和带有tPA信号肽的最优化gp160。

图5是蛋白质印迹，显示由pADVAX双启动子-载体驱动的env和gag的表达。垂直箭头指示从ADVAXI的蛋白表达。

图6为ADVAX II制备的pol基因的修饰示意图，其中PR＝蛋白酶，RT＝逆转录酶，IN＝整合酶。蛋白酶的缺失(DTGA)包含野生型基因的氨基酸25-28。逆转录酶的点突变(M→G)位于野生型基因的184位。对用pVAX1-tPA-突变型pol(A)和单独的pVAX1(B)转染的293T细胞的细胞裂解液进行蛋白质印迹。未切割的tPA-Pol为110kD。

图7是蛋白质印迹，显示用nef-tat转染的细胞培养上清液中表达的蛋白。

图8是蛋白质印迹，显示用tPA-nef-tat转染的细胞培养上清液中表达的蛋白。

图9显示用以下nef构建体转染的293T细胞表达I类MHC的流式细胞仪分析结果：单独的载体、nef、tPA-nef和tPA-nef-tat。

图10是ADVAXI和ADVAXII的示意图。

图11显示对来自Env和Gag的肽库的IFN-γ酶联免疫斑点测定的应答。肽是重叠10次的20-mers。每库含有12个肽，只是Gag A-I除外，后者代表先前在BALB/c小鼠中被鉴定为抗原特异性CD8+表位的特异性9-mer(AMGMLKDTI)(SEQ ID NO：2)。Env PI包含氨基酸24-144，Env P4包含氨基酸403-573，Gag P3包含氨基酸251-380，而Gag A-I包含氨基酸217-225。

图12显示用不同剂量的ADVAX I免疫的小鼠中Env-和Gag特异性IFN-γ酶联免疫斑点测定的应答。

图13显示，小鼠肌内接种不同的DNA疫苗后，在第0、3和6周，用血清抗Gag抗体进行ELISA分析。

图14显示针对来自Pol、Tat和Nef的肽库的IFN-γ酶联免疫斑点测定的应答。

图15显示用不同剂量的ADVAX II免疫的小鼠中Pol-和Nef-Tat特异性IFN-γ酶联免疫斑点测定的应答。

图16是蛋白质印迹，显示将nef基因引入MVA基因组的不同插入位点后HIV-1 nef的表达。

图17显示由293T细胞表达的DV2 Env介导与携带第一受体CD4和第二受体CCR5的HOS细胞的细胞融合。

图18是ADMVA的基因组图。

图19是示意图，显示从pLW7构建pZC1和pZC3。

图20显示，通过用抗Env抗体的免疫染色(左图)和蛋白质印迹分析(右图)，重组env-gag-pol MVA的表达。

图21是示意图，显示从pLW22构建pZC22。

图22和图23显示，通过用抗Env抗体和抗Nef抗体的双重免疫染色，重组ADMVA表达Env和Nef。

图24是蛋白质印迹，显示所有5种插入在ADMVA中的基因。

图25显示用10³-10⁸ADMVA，HIV-1 Env的免疫染色。

图26显示用ADMVA感染人类细胞。

图27是柱状图，表示针对肽库中来自HIV-1 Env、Gag、Pol、Nef和Tat的肽的IFN-γ酶联免疫斑点测定的应答。

图28表示BALB/c小鼠中针对来自同源亚型C Env、Gag、Pol、Nef和Tat的肽或肽库的IFN-γ酶联免疫斑点测定的应答。

图29表示B6×B10小鼠中针对来自同源亚型C Env、Gag、Pol、Nef和Tat的肽或肽库的IFNγ酶联免疫斑点测定的应答。

图30显示用不同剂量ADMVA接种的BALB/c小鼠中Env特异性IFN-γ酶联免疫斑点测定的应答。

图31是柱状图，显示BALB/c小鼠中针对Gag和gp120蛋白的HIV-1特异性抗体反应。

图32显示BALB/c小鼠中针对gp120的HIV-1特异性抗体反应。

图33是柱状图，显示通过不同免疫途径接种ADMVA的BALB/c小鼠中Env特异性IFN-γ酶联免疫斑点测定的应答。

图34显示用不同剂量MVA接种的BALB/c小鼠中MVA特异性IFN-γ酶联免疫斑点测定的应答。

发明详述

本文所用的以下术语的含义如下。

术语“HIV感染相关疾病”或“HIV-1相关疾病”等，在本文中是指以HIV感染为特征的疾病状态。所述HIV感染相关疾病包括但不限于爱滋病、卡波西肉瘤(Kaposi′s sarcoma)、由卡氏肺囊虫(Pneumocystis carinii)和结核分枝杆菌(Mycobacterium tuberculosis)等引起的机会性感染；包括鹅口疮、毛状白斑和口疮性溃疡在内的口腔溃疡；全身淋巴结病；带状疱疹；血小板减少症；无菌性脑膜炎；神经病例如弓形虫病、隐球菌病、CMV感染、原发性CNS淋巴瘤和HIV相关性痴呆；周围神经病；癫痫；以及肌病。

“受试者”是脊椎动物，优选哺乳动物，更优选人类。哺乳动物包括但不限于人类、农场动物、运动动物和宠物。

对HIV感染或HIV相关病症或疾病“易感”的受试者是指在全部群体中对HIV感染风险更高的群体所属的受试者。

术语“免疫原性组合物”、“免疫组合物”和“疫苗”是指这样的免疫组合物：所述组合物含有引发局部或全身免疫应答的载体(或其表达产物)。所述应答可以具有、但并不一定具有保护性。同样，含有本发明重组体或载体(或其表达产物)的免疫原性组合物引发可以具有、但并不一定具有保护性的局部或全身免疫应答。疫苗组合物引发局部或全身保护性应答。因此，术语“免疫组合物”和“免疫原性组合物”包括“疫苗组合物”(因为前两个术语可以是保护性组合物)。本发明包括免疫组合物、免疫原性组合物或疫苗组合物。

术语“治疗有效剂量”是指能产生给药所需效果的剂量。准确剂量取决于治疗目的，可由本领域技术人员采用已知技术来确定(参见例如Lieberman(1992)Pharmaceutical Dosage Forms第1-3卷；Lloyd(1999)The Art，Science and Technology of PharmaceuticalCompounding；和Pickar(1999)Dosage Calculations)。就治疗有效量的本发明DNA疫苗而论，所述治疗有效量是在治疗个体HIV感染或AIDS中达到任何成功指标所需的剂量，包括任何客观或主观标准，例如HIV病毒抑制，HIV感染和AIDS相关症状的减少，或患者身体或精神上良好状态的改善。

“载体”是允许或促进一个实体从一个环境转移到另一个环境的工具(参见″The Development of Human Gene Therapy″T.Friedmann主编，1999，Cold Spring Harbor Press)。例如，一些用于重组DNA技术的载体允许实体(例如一段DNA(例如一个异源转基因))转移到靶细胞中。一旦在靶细胞中，所述载体任选起到将其转基因保留在胞内的作用，或者可作为DNA复制单位起作用。用于重组DNA技术的载体的实例包括质粒、染色体、人工染色体或病毒。本发明的载体可以通过非病毒载体(质粒)或病毒载体转移到靶位点。

当抗原和抗体特异性结合/反应时，本文所用的抗原或抗原决定簇(例如HIV的基因产物)，对抗该抗原而产生的抗体来说是“有活性”的。

术语“宿主细胞”是指其中引入了重组DNA分子的一种或多种细胞。本发明的宿主细胞包括但不限于细菌细胞、酵母细胞、动物细胞、昆虫细胞和植物细胞。宿主细胞可以是单细胞，或者可以在液体培养基的组织培养物中生长的单层细胞等。宿主细胞也可以直接或间接来源于组织。

当核酸从胞外环境转移到细胞中时，该宿主细胞被所述核酸“转化”。任何将核酸转移到细胞中的方法均可采用；除非另有说明，该术语并不特指任何将核酸转移到细胞中的具体方法，也不特指任何待转移的具体细胞类型。本领域使用的另一术语是“转染”。非病毒传递系统包括但不限于DNA转染方法。在此，转染包括采用非病毒载体将基因传递给真核靶细胞(例如哺乳动物细胞)的方法。典型转染方法包括DNA直接注射、电穿孔、DNA生物射弹(biolistics)、脂质介导转染、紧密DNA介导转染、脂质体、免疫脂质体、脂转染、阳离子试剂介导转染、阳离子两亲性表面活性剂(CFA)(NatureBiotechnology 1996 14；556)和它们的组合。

“表达控制序列”是调节基因表达(即转录、RNA形成和/或翻译)的核酸序列。表达控制序列可以是不同的，取决于例如所选宿主细胞或生物体(例如原核细胞宿主和和真核宿主)、转录单位的类型(例如其中RNA聚合酶必须识别该序列)、该基因在其中能正常表达的细胞类型(换句话说，生物因子在该细胞类型中正常出现)。

“启动子”就是一个这样的表达控制序列，在本文中是指一组控制、调节和/或指导下游(3′)核酸序列转录的核酸序列。本文所用的启动子包括靠近转录起始位点的必需核酸序列，例如在聚合酶II类启动子的情况下，是TATA元件。

术语“有效连接”是指核酸表达控制序列(诸如启动子或一组转录因子结合位点)和第二核酸序列之间的功能性连接，其中所述表达控制序列指导对应于第二序列的核酸转录。

术语“重组体”当在本文中用于核酸或蛋白部分时，是指核酸包含2个或多个亚序列，而在自然界没有发现同样的相互关系。例如，重组产生的核酸通常具有来自不同基因或相同基因非邻近区的2个或多个序列，经人工排列而产生编码新蛋白的新核酸序列。本文所用的术语“重组”是指通过本领域技术人员已知的标准技术产生重组蛋白或重组核酸的方法，所述方法描述于例如Sambrook等，Molecular Cloning；A Laboratory Manual，第2版(1989)。

在本申请中的术语“异源”是指与其有效连接的核酸分子正常情况下两者并不相连的元件，例如质粒载体的组分(例如启动子、前导序列)。

在本发明公开内容中，“包含”、“含有”和“具有”等全都具备美国专利法中规定的含义，并且可以表示“包括”等；“基本上由......组成”或“基本组成为”同样具备美国专利法中规定的含义；该术语是开放式的，即允许存在未指出的含义，只要基本特性或者新的特性并不因所指出的含义而改变即可，但并不包括现有技术实施方案。

本发明的第一方面提供核酸载体，所述载体包含至少一个有效连接启动子的HIV序列，该序列编码不能装配成病毒颗粒的蛋白。

另一方面，所述核酸载体包含至少两个HIV序列，这些HIV序列分别与各自的启动子有效连接，并且这些序列编码不能装配成病毒颗粒的蛋白。

本文描述的HIV序列选自env、gag、pol、tat、rev、nef、vif、vpr、vpu、vpx、其突变体、融合体及其部分。

所述启动子包括选自以下的异源启动子：原核启动子、真核启动子和病毒启动子。在一个实施方案中，所述真核启动子是人类真核起始因子-1α启动子，而核酸载体的病毒启动子是巨细胞病毒立即/早期启动子。

本发明也描述了位于HIV序列下游的转录终止序列在所述核酸载体中的应用。所述转录终止子可以是选自以下的聚腺苷酸化信号：牛生长激素聚腺苷酸化信号、SV40聚腺苷酸化信号和痘苗病毒聚腺苷酸化信号。

本发明还描述了至少一个有效连接异源前导序列的HIV序列。所述前导序列可以是组织纤溶酶原激活物(tPA)前导序列，此外也可包含酵母α-因子交配信息素前导序列、前胰岛素原前导序列和转化酶前导序列、免疫球蛋白A前导序列和卵白蛋白前导序列。

本发明的核酸载体包含有效连接tPA前导序列的HIV Gag，以使病毒颗粒不能装配。在本发明的一个实施方案中，所述HIV序列选自本文提供的以下序列：SEQ ID NO：7、SEQ ID NO：9、SEQ IDNO：11、SEQ ID NO：13；SEQ ID NO：17；和SEQ ID NO：19。

本发明的核酸载体也包括在单细胞生物中指导核酸载体复制和扩增的复制起点。这些起点可以是但不限于colE1(pMB1)起点、2μ酵母起点、真核着丝粒起点、真核自主复制序列、SV40起点和巨细胞病毒(CMV)起点。

本发明的核酸载体还包含选择性标记基因，所述基因可以是抗生素抗性基因。所述抗性基因可以是抗以下抗生素的基因：氨苄青霉素、四环素、卡那霉素、强力霉素、新霉素、潮霉素、博来霉素、零霉素、嘌呤霉素、氯霉素。

本发明的另一方面提供核酸载体，所述载体包含至少两个HIV序列，其中所述HIV序列分别与各自的启动子有效连接，并且编码不能装配成病毒颗粒的蛋白。此外，至少一个HIV序列与异源前导序列有效连接。所述载体任选还包含下游转录终止子、复制起点和选择性标记基因。

本发明的核酸载体可以是病毒载体，例如修饰痘苗病毒Ankara(MVA)载体、ALVAC载体、NYVAC.1载体或NYVAC.2载体。所述病毒载体最好是包含至少两个插入到MVA基因组缺失位点III的HIV序列的MVA载体，其中所述HIV序列分别与各自的启动子有效连接，并且其中所述HIV序列编码不能装配成病毒颗粒的蛋白。

用于表达所述HIV序列的疸病毒启动子选自痘病毒7.5K启动子、痘病毒40K启动子、痘病毒H5启动子、痘病毒11K启动子、痘病毒I3启动子、痘病毒合成(SYN)启动子和痘病毒合成早期/晚期启动子。在另一个实施方案中，所述启动子是不同的启动子。

另一方面利用核酸载体，所述载体是MVA载体，所述载体包含至少两个插入到MVA基因组缺失位点III的HIV序列，至少一个插入到MVA基因组缺失位点II的HIV序列，且其中所述HIV序列分别与各自的启动子有效连接。此外，这些HIV序列编码不能装配成病毒颗粒的蛋白。

本发明病毒载体中描述的启动子选自痘病毒7.5K启动子、痘病毒40K启动子、痘病毒H5启动子、痘病毒11K启动子、痘病毒I3启动子、痘病毒合成(SYN)启动子和痘病毒合成早期/晚期启动子。在另一个实施方案中，所述启动子是不同的启动子。

在本发明的一个实施方案中，HIV序列SEQ ID NO：17和SEQ IDNO：19插入到MVA的缺失位点III，而HIV序列SEQ ID NO：21插入到MVA的缺失位点II。

本发明还描述了一种核酸载体，所述载体包含选自以下的病毒载体：ALVAC、MVA、NYVAC.1和NYVAC.2。本发明的一个实施方案提供MVA载体，所述载体包含插入到MVA缺失位点III的tPA-δV2 env和tPA-gag-pol，以及插入到MVA缺失位点II的tPA-nef-tat。

本发明内容中也包括组合物，所述组合物包含本文描述的任何核酸载体。在一个实施方案中，每个核酸载体包含不同的HIV序列。优选tPA-env和tPA-gag在第一核酸载体上，而tPA-nef-tat在第二核酸载体上。甚至更优选SEQ ID NO：7和SEQ ID NO：9在第一核酸载体上，而SEQ ID NO：11和SEQ ID NO：13在第二核酸载体上。

本发明的另一方面描述了一种组合物，其中tPA-env和tPA-gag在第一核酸载体上，而tPA-pol和tPA-nef-tat在第二核酸载体上。所述组合物还包含插入到MVA缺失位点III的tPA-δV2 env和tPA-gag-pol，以及插入到MVA缺失位点II的tPA-nef-tat。优选SEQ IDNO：7和SEQ ID NO：9在第一核酸载体上，而SEQ ID NO：11和SEQ IDNO：13在第二核酸载体上。所述组合物还包含插入到MVA缺失位点II的SEQ ID NO：17和SEQ ID NO：19。

可以利用各种各样的核酸载体，以携带用于本发明组合物和疫苗的HIV核酸序列。对于本领域技术人员来说，显然，本发明的核酸载体必须具有高容量产生的能力，并且同时还必须在目标宿主中能够表达。因此，核酸载体可含有允许在单细胞宿主(例如细菌或酵母)中表达和扩增的序列。有用的表达载体包括但不限于pVAX1、pGEM、pSP72、pcDNA和其它市售的克隆载体。

设计作为疫苗组合物并可在细菌中扩增的核酸必须进行进一步纯化，以便去除可引起感染、炎症和疾病的细菌细胞壁组分。这些“内毒素”也称为“脂多糖”或“LPS”。可通过本领域已知的过滤方法去除内毒素。质粒载体扩增的替代方法是使用酵母，例如酿酒酵母(Saccharomyces cerevisiae)。

另外，在下文中也可与同义词“启动子”交替使用的各种表达控制序列，可用于核酸载体，以表达用于本发明组合物和方法的HIV序列。在选择表达控制序列时，也会考虑各种因素。这些因素包括例如启动子序列的相对强度、其控制能力及其与本发明所述肽的DNA序列的相容性，特别是与潜在二级结构的相容性。所述有用的表达控制序列包括异源表达控制序列，例如原核启动子、真核启动子和病毒启动子。

有用的病毒启动子的实例包括例如SV40早期和晚期启动子、巨细胞病毒启动子、牛乳头瘤病毒启动子、巨细胞病毒启动子、包括慢病毒在内的逆转录病毒启动子、腺伴随病毒启动子和腺病毒启动子、T3启动子和T7启动子、λ噬菌体主要操纵子(major operator)和启动子区、fd外壳蛋白的控制区。也可使用原核启动子，例如但不限于 lac系统、 trp系统、TAC系统或TRC系统。可有利地用于表达本发明核酸载体中的HIV序列的真核启动子包括但不限于人类真核起始因子1启动子、3-磷酸甘油酸激酶启动子、乙醇脱氢酶启动子、丙酮酸激酶启动子或其它糖酵解酶的启动子、酸性磷酸酶启动子例如Pho5、α-肌动蛋白启动子和β-肌动蛋白启动子、以及已知控制原核细胞或真核细胞或它们的病毒的基因表达的其它组成型和诱导型启动子序列，以及它们的各种组合。

人们知道，并不是所有载体和启动子在本文提到的核酸和组合物中都能同样好的起到表达所述HIV序列的作用。然而，本领域技术人员可以不需要进行过多实验、也不偏离本发明范围，在这些载体、启动子和宿主中进行选择。例如，在选择载体时，必须考虑其宿主，因为所述载体必须在其中进行复制。也应考虑该载体的拷贝数、控制拷贝数的能力、控制整合的能力、增强子序列的存在和使用(如果有的话)，以及该载体所编码的其它蛋白(例如抗生素标记或其它选择标记)的表达。

HIV序列的最佳表达也得益于插入序列3’端所添加的转录终止序列。转录终止子在生物体中各不相同，可包含核酸序列，所述序列可在体内有利地形成二级结构，例如茎-环结构。在这种情况下，终止取决于RNA产物，而不单由转录过程中DNA序列来确定。众所周知的原核终止机制包括内部终止，其中在缺乏任何其它因子时，所述RNA聚合酶核心酶可在某位点终止。另一个已表征的终止机制取决于原核生物的Rho因子，即一种46kD的蛋白，该蛋白与RNA聚合酶从相关RNA链的脱离密切相关。其它转录终止子都是本领域众所周知的，包括聚腺苷酸化信号，例如牛生长激素聚腺苷酸化信号和病毒聚腺苷酸化信号，例如来自痘苗病毒和猿猴病毒40的病毒聚腺苷酸化信号。聚腺苷酸化后，在下游的相对位点上常发生转录终止，所述位点在大多数真核mRNA的3’端。聚腺苷酸化是无需模板的50-200nt的聚腺苷酸链(polyA)的插入。切割必须先于聚腺苷酸化。这些聚腺苷酸化信号常包含序列AAUAAA，所述序列当缺失或突变时，阻止聚腺苷酸化mRNA的产生。

前导序列定义为在核酸(DNA和RNA)或蛋白一端的序列，所述序列必须被切掉，以容许成熟分子的专一性功能。前导序列在特定细胞区室中指导蛋白的定位。前导序列的一个类似的术语是“信号序列”。对于ER中驻留的蛋白和欲进入溶酶体或过氧化物酶体的蛋白来说，信号序列指导它们返回它们各自的细胞区室中。膜蛋白和欲分泌的蛋白也需要信号序列，其中指导所述蛋白进入通向质膜、胞外空间或通过内体分选的特定的分泌途径。信号序列没有显示出序列保守性。信号序列通常在N-端的10个氨基酸内开始。它们的长度在20个和30个残基之间，特征是中心为约10-15(但不小于6)个残基的疏水核心，以亮氨酸或丙氨酸为优先选择。它们通过极性残基带正电荷序列段邻接N-端一侧，并通过中性的极性残基邻接C-端区。它们明显能耐受氨基酸取代，只要它们的中心疏水特征能保留。在本发明的一个实施方案中，组织纤溶酶原激活物有利地用于指导翻译的HIV序列进入分泌途径，这不同于天然HIV蛋白，使得病毒颗粒不能产生。前导序列的其它实例包括酵母α-因子交配信息素前导序列、前胰岛素原前导序列、转化酶前导序列、免疫球蛋白A前导序列、β-珠蛋白前导序列和卵白蛋白前导序列。

选择性标记可用于分析目标宿主或宿主细胞中核酸载体的存在与否。常用的选择性标记包括当表达时导致宿主抗生素抗性的基因。所述基因赋予各种抗生素抗性，例如但不限于氨苄青霉素、四环素、强力霉素、卡那霉素、新霉素、博来霉素、嘌呤霉素、零霉素、潮霉素、氯霉素。也可使用报道基因，来监测载体的表达(例如lacZ基因产物)，但是这并不推荐采用，因为本领域常用的报道基因编码外源蛋白，当给予受试者时，所述蛋白能刺激不需要的或无法预料的免疫应答。

同样，在其中不需要抗生素抗性的某些环境下(例如当目的是高收率地产生用于临床给药的纯的生物制品时)，抗生素的使用会产生三大问题。首先，在高密度培养条件(例如高生物量或连续培养)下选择压力的丧失会导致抗生素降解或失活，结果导致产品收率下降。其次，产物不可避免地污染残留的抗生素，在某些情况下，这会增加免疫致敏的危险性，甚至在受试者体内产生过敏反应。最后，还存在着基因转移后抗药性传播到环境生物(具体来说是病原体)的风险。一个阻抑蛋白滴定系统，可有利地用于在原核宿主中扩增核酸产物，而无需存在抗生素抗性基因；所述系统的方法通过引用结合到本文中(Williams，S.G.等，(1998)Nucleic Acids Res.26(9)：2120-2124；美国专利第5,972,708号)。

通过采用比染色体基因组过量的质粒分子，来竞争性结合来自宿主选择性基因的阻抑蛋白，可以选择含有所述质粒的细胞。换句话说，所述系统使用质粒分子本身来激活选择。这需要1)宿主菌株含有编码细胞存活或生长必需产物的染色体基因，2)基因被阻抑蛋白例如λ阻抑蛋白负调节，3)胞内阻抑蛋白浓度刚好足以达到阻抑所述基因，4)质粒合有该阻抑蛋白的结合位点，和5)每个细胞中质粒拷贝数足以达到阻抑蛋白滴定。

复制起点定义为在其中发现复制起始位点的DNA上的位置。在质粒产生的起始序列的情况下，起点是DNA序列，所述序列当加入到非复制的DNA中时能使之复制。起点也可以描述为DNA序列，所述序列在体外是酶复合物的结合靶位，已知所述酶复合物的功能是启动DNA复制。通常使用的起点是colE1(pMB1)起点、酵母2μ起点、真核自主复制序列(ARS)、真核着丝粒序列、SV40起点、CMV起点。

病毒传递系统包括但不限于腺病毒载体、腺伴随病毒(AAV)载体、疱疹病毒载体、逆转录病毒载体或慢病毒载体。载体的其它实例包括离体传递系统，其中包括但不限于DNA转染方法，例如电穿孔、DNA生物射弹、脂质介导的转染、紧密DNA介导的转染。在一个优选的实施方案中，痘病毒载体用于传递核酸。更优选所用的疸病毒载体是修饰痘苗病毒Ankara病毒载体，所述载体以下还将进一步讨论。

目前，痘苗病毒作为用于在哺乳动物细胞的细胞质内表达基因的唯一的活载体(Hu，S.L.等，(1986)Nature 320：537-40；Moss，B.等，(1996)Adv.Exp.Med.Biol.397：7-13；Sutter，G.和B.Moss.(1992)Proc.Natl.Acad.Sci.USA 89：10847-51)。痘苗病毒在本领域已有充分的描述，可参见美国专利号6,340,462；5,972,597；5,942,235；5,225,336；5,204,243；5,155,020；5,110,587；4,769,330；4,722,848；和4,603,112。作为科学工具，重组痘苗病毒已用于研究抗具体的感染性疾病(包括爱滋病)的保护所需的免疫应答类型(Girard，M.(1990)Cancer Detect.Prev.14：411-3；Haynes，B.F.(1996)Lancet 348：933-7；Moss，B.(1996)Proc.Natl.Acad.Sci.USA 93：11341-8)。因为痘苗病毒感染人类，所以使用活痘苗病毒载体的主要担心的是其安全性。常规痘苗病毒不能用于无免疫应答的患者，例如患有HIV、血液恶性肿瘤的患者，或者是经历化疗的患者(Mayr，A.和K.Danner，(1978)Dev Biol Stand41：225-34)。因此，已经开发出几株高度减毒的痘苗病毒株，用作天花疫苗(Paoletti(1996)Proc.Natl.Acad.Sci.USA 93：11349-53)(Moss，B.等，(1996)Adv.Exp.Med.Biol.397：7-13；Sutter，G.和B.Moss.(1992)Proc.Natl.Acad.Sci.USA 89：10847-51；Blanchard，T.J.等，(1998)JGen Virol 79：1159-67；Paoletti，E.(1996)Proc Natl Acad Sci USA 93：11349-53)。尽管这些减毒病毒不再需要用于抗天花的免疫，但是它们早就用于人类，提供了严格的安全信息，以指导对用于爱滋病疫苗开发的合适毒株的选择。

三种高度减毒而有效的基于痘病毒的载体，包括NYVAC(美国专利号6,596,279；5,762,938；5,494,807；5,453,364；5,378,457；364,773，金丝雀痘病毒(Canarypox)(ALVAC；美国专利号5,863,542；5,766,598；5,756,103)和修饰痘苗病毒Ankara(MVA)，可用于人用和兽用重组疫苗的定向应用中(Moss等，(1996)Adv.Exp.Med.Biol.397：7-13)。MVA的应用描述于美国专利第5,185,146号。最好是使用宿主范围有局限性的、并且只能在幼仓鼠肾细胞(BHK)和鸡胚成纤维细胞(CEF)中复制的正痘病毒或禽痘病毒。美国专利第5,494,807号公开了ALVAC和NYVAC两者在特定宿主中复制能力的差异。具体地讲，MVA已用于超过12万人初次接种的大规模疫苗试验和临床实践。没有与其应用相关的副作用，甚至当高危患者接受初次接种时也是如此(Mayr等，(1978)ZBL Bakt Hyg.I Abt.Orig.B 167：375-90)。MVA是宿主范围局限性痘苗病毒株(Sutter，G.和B.Moss，(1995)Dev Biol Stand 84：195-200；Wyatt，L.S.等，(1998)Virology 251：334-42)。所述MVA株在鸡胚成纤维细胞(CEF)中已经传代超过570次，并且已经失去其在大多数哺乳动物细胞系中的复制能力，因为与WR痘苗病毒株相比，其基因组合有6个大缺失(Altenburger等，(1989)Arch.Virol.105：15-27；Meyer等，(1991)J.Gen.Virol，71-1031-8；Mayr，A.，(1978)Zentralbl Bakteriol[B]167：375-90；Meyer，H.等，(1991)J GenVirol 72：1031-8；Stickl，H.等，(1974)Dtsch Med Wochenschr 99：2386-92)。这些缺失位于病毒基因组两端附近。值得注意的是，一个缺失影响55K以及32K人类宿主范围基因。进一步分析表明，约三分之二的宿主范围基因的缺失部分造成病毒的减毒。MVA株在禽类细胞中生长良好，但是在人类和大多数所试验的其它哺乳动物细胞中不能繁殖。尽管如此，MVA DNA的复制看来是正常的，而且在人类细胞中合成了早期和晚期病毒蛋白(Sutter等，(1992)Proc.Natl.Acad.Sci.USA 89：10847-51；Sutter，G.和B.Moss.(1992)Proc Natl Acad SciUSA 89：10847-51；Sutter，G.等，(1994).Vaccine 12：1032-40)。因为重组基因表达在非容许人类细胞中未受破坏，所以MVA仍可作为高效且特别安全的载体(Moss，B.等，(1996)Adv Exp Med Biol 397：7-13)。重要的是，在对付天花的战役中，MVA株已用于对超过12万人进行初次接种的大规模疫苗试验和临床实践。没有与其应用相关的副作用，甚至当免疫抑制恒河猴(macaque)或患者接受初次接种时也是如此(Mayr，A.等，(1978)Zentralbl Bakteriol[B]167：375-90；Hochstein-Mintzel，V.等，(1972)Z Immunitatsforsch Exp Klin Immunol 144：104-56；Stittelaar，K.J.等，(2001)Vaccine 19：3700-9)。

已经证明，高度减毒和复制缺陷型重组MVA的免疫原性和保护功效比许多常规痘苗病毒(VV)强。采用感染复数(MOI)≥1，高度减毒株MVA是诱导显著量的IFN α/β的VV的唯一代表，IFN α/β起到抗病毒效应。来自5种众所周知的常规VV株以及中国VV天坛株(VVTT)用作重组疫苗的复制型病毒不能诱导白细胞的IFN(IFNα；Buttner，M.等，(1995)Vet.Immunol.46：237-50)。在小动物中，表达HA-NP基因的重组MVA株不仅诱导血清IgG抗体、粘膜IgA抗体和强烈的CTL应答，而且保护免疫小鼠免受流感病毒攻击而造成的肺部感染，甚至当口服免疫后(Bender，B.S.等，(1996)J.Virol.70：6418-24)。最重要的是，用SIV/SHIV重组MVA免疫的恒河猴比用SIV重组NYCBH-VV免疫的恒河猴来说更会成为长期无进展者(non-progressors)(Hirsch，V.M.等，(1996)70：3741-52；Amara，R.R.等，(2001)Science 292：69-74)。这些恒河猴，就象感染HIV的人类长期无进展者一样，最初具有低水平的血浆病毒血症，然后是病毒复制的持续性限制，这与正常淋巴细胞亚组和完整的淋巴样结构的维持有关。这些结果，与先前的MVA在人类的安全性数据一起，表明重组MVA用于人类爱滋病预防性接种的潜在用途。目前，尚没有构建HIV重组MVA或者用于人类HIV-1免疫接种。

多基因重组ADMVA是设计作为同源加强剂，对应于用于HIV-1亚型C初次免疫的质粒DNA。该构建体编码HIV-1结构基因(env、gag、pol)和调节基因(nef、tat)。在我们的疫苗中使用的基因来自基因亚型C株(循环重组型007或HIV_CHN·AD，其也含有基因亚型B的片段)，该株在云南省是优势亚型。其它HIV基因亚型也可在本发明的核酸和病毒载体中被有利地取代，无需进行过多实验。

当采用痘苗病毒作为基因转移或基因表达的载体时，痘苗病毒启动子是必要的，因为所述病毒在感染细胞的细胞质中复制。因为这一特征，所述病毒编码其自身的复制和转录机，所述机器特异性识别痘苗病毒启动子。与之相反，其它病毒利用宿主自身的机制来进行复制、转录和用于病毒繁殖的其它过程。在MVA载体中可有利地使用的启动子包括但不限于7.5K启动子、11K启动子、40K启动子、H5启动子、I3启动子、SYN(合成)启动子和合成早期/晚期启动子(sE/L)(Moss等，Biotechniques)。

MVA通过在鸡胚成纤维细胞中超过570次连续传代而实现减毒。对MVA基因组的分析表明，减毒可以归功于大片段的缺失，所述缺失大多是在被认为是非必需基因的区域。在MVA中，有6个大的自然发生的缺失，称之为缺失I-VI。推测这些缺失位点含有非必需基因，因此提供异源基因的插入位点。使用缺失位点I-VI的任何一个，可产生效果并增强目的基因表达。另外，非必需胸苷激酶基因也提供另一个位点，在该位点可以插入外源基因。优选的实施方案使用缺失位点III。缺失位点II也可单独使用，或者与缺失位点III一起使用。

同样，其它减毒痘病毒具有含工程化缺失的基因组区，所述缺失可以是或不是必需的。美国专利第5,766,882号描述了一种缺陷型痘病毒，使之缺乏其亲本痘病毒的必需区所赋予的功能。减毒NYVAC载体描述了基因组的类似区域，其中胸苷激酶基因、出血区、A型包涵体区、血凝素基因、宿主范围基因区和大亚基、核糖核苷酸还原酶已从中缺失(美国专利第5,364,773号)。此外，NYVAC载体可额外包含产生干扰素的基因的缺失，因此增加了在目标宿主中的安全性。

有2种用于制备重组MVA的基本方法，即同源重组和体外连接。同源重组是最早用于制备重组MVA的方法，并且仍然是最广泛使用的方法(参见美国专利第4,769,330号)。用转移质粒来转染细胞以及用病毒来感染细胞，所述质粒含有处于痘苗病毒启动子控制之下的重组基因，该启动子邻接来自痘苗病毒的几百个碱基对的DNA。重组发生在转移质粒和病毒基因组的同源序列之间。各种方法均可用于分离重组MVA，这些方法包括：根据溴脱氧尿苷或抗生素抗性进行选择、对表达显色标记的报道基因进行检测、宿主范围的补充或小噬斑表型(参见例如美国专利第5,155,020号)，以及噬斑的直接抗体染色或DNA杂交。选择性标记的稳定整合阻碍其在第二基因选择上的应用；另外，在用于受试者的重组MVA中不希望存在额外的遗传物质。已经开发了如下方案：其中整合了抗生素抗性基因或颜色标记基因，并且其后通过重组而自发缺失；所述方案包括多轮噬斑纯化(Chakrabarti，S.等，(1985)Mol.Cell.Biol.5(12)：3403-9)。

外源基因与MVA基因组的体外连接也为同源重组提供了替代方法(参见美国专利第6,265,183；5,866,383；5,445,953号)。因为MVADNA不具有感染性，所以用MVA DNA来转染细胞，以及用宿主限制性辅助病毒、条件致死病毒或其它缺陷病毒来感染细胞(美国专利第5,204,243号)。这些技术有效地容许相当大的DNA片段或者甚至将DNA片段文库直接插入到痘苗病毒基因组中。已经使用启动子和唯一限制位点来构建重组VV基因组，以便进行克隆和表达(Pfleiderer，M.等，(1995)J.Gen.Virol.76(Pt.12)：2957-62；Merchlinsky，M.和B.Moss(1992)Virology 190(1)：522-6)。

人免疫缺陷病毒是一种逆转录病毒，逆转录病毒有许多种类。逆转录病毒的一些实例包括但不限于：鼠白血病病毒(MLV)、人免疫缺陷病毒(HIV)、马传染性贫血病毒(EIAV)、小鼠乳腺瘤病毒(MMTV)、劳斯肉瘤病毒(RSV)、弗吉纳米肉瘤病毒(Fujinami sarcomavirus，FuSV)、莫洛尼鼠类白血病病毒(Mo-MLV)、FBR鼠类骨肉瘤病毒(FBR MSV)、莫洛尼鼠类肉瘤病毒(Mo-MSV)、艾贝尔逊鼠类白血病病毒(Abelson murine leukemia virus，A-MLV)、禽类成髓细胞瘤病毒-29(MC29)和禽类成红细胞增生病毒(AEV)以及包括慢病毒属在内的所有其它逆转录病毒科。逆转录病毒的详细一览表可在Coffin等(″Retrovirus″1997 Cold Spring Harbour Laboratory Press：JM Coffin，SM Hughes，HE Varmus主编，第758-763页)中找到。

逆转录病毒一般分为2大类，即“单纯型”和“复合型”。逆转录病毒还可再细分为7组。其中5组代表致癌的逆转录病毒。余下2组是慢病毒和泡沫病毒。有关这些逆转录病毒的综述可参见Coffin等，1997(同上)。慢病毒家族与其它类型逆转录病毒之间的区别在于：慢病毒具有既感染分裂细胞又感染非分裂细胞的能力(Lewis，P.等，(1992)EMBO J.11：3053-3058；Lewis，P、F、和M.Emerman(1994)J.Virol.68：510-516)。与之相反，其它逆转录病毒，例如MLV，不能感染已分化细胞等非分裂细胞，例如肌肉、脑、肺和肝组织。HIV属于“慢病毒”类。在本申请中，可有利地使用其它慢病毒序列，例如FIV、SIV、EIAV等。

本领域可以找到某些慢病毒的基因组结构详述。有关HIV基因组的详述在NCBI Genbank数据库(即Genome检索号AF033819；SEQD NO：23-41)中可以找到。HIV逆转录病毒基因组包含gag基因、pol基因和env基因，这些基因编码病毒体的蛋白和酶。这些基因的两端邻接被称为长末端重复序列(LTR)的区域。LTR负责原病毒的整合和转录。它们也起到增强子-启动子序列的作用。换句话说，LTR可以控制病毒基因的表达。逆转录病毒RNA的脱衣壳是通过位于病毒基因组5’端的ψ序列来进行。

LTR本身是相同的序列，可分为三个元件，称之为U3、R和U5。U3来自只有该RNA的3’端才有的独特序列。R来自该RNA两端的重复序列，而U5来自只有该RNA的5’端才有的独特序列。这三个元件的大小在不同的逆转录病毒中变化很大。对于病毒基因组，转录起始位点在左侧LTR的U3和R间的边界上，而聚腺苷酸附加序列位点(终止位点)在右侧LTR R和U5间的边界上。U3含有绝大多数原病毒转录控制元件，其中包括对细胞转录活化蛋白起反应的启动子和多个增强子序列，在某些情况下包括对病毒转录活化蛋白起反应的启动子和多个增强子序列。

对于结构基因gag、pol和env本身来说，gag编码病毒内部结构蛋白。Gag蛋白被蛋白酶水解而加工成成熟蛋白MA(基质)、CA(衣壳)和NC(核衣壳)。pol基因编码逆转录酶(RT)，所述酶含有与RNA酶H和整合酶(IN)相关的DNA聚合酶，该酶介导基因组的复制。env基因编码病毒体的表面(SU)糖蛋白和跨膜(TM)蛋白，所述蛋白形成与细胞受体蛋白特异性相互作用的复合体。所述相互作用通过病毒膜与细胞膜的融合而最终导致感染。

gag、pol和env的共表达，结果形成感染性的病毒颗粒。对于制备免疫原性组合物和疫苗的目的来说，感染性病毒颗粒的形成将导致危险和不可接受的风险局面。尽管所述基因各自的突变(例如在pol特异区的突变)引起病毒感染性的失活，然而，仍然会发生病毒颗粒的形成。本发明提供HIV序列的表达，其中所述序列编码不能装配成感染性或非感染性病毒颗粒的蛋白。用于本文目的的蛋白表达，其作用是诱导免疫应答。对于在有需要的受试者体内引发免疫应答来说，所述蛋白的活性、或者甚至是全长蛋白的存在，通常并不是必需的。先前已经描述了包含HIV序列的质粒。美国专利第5,665,577号描述了HIV序列，所述序列可以在质粒载体中表达，但是该序列编码的蛋白形成的病毒体却没有足够的HIV RNA，以产生有复制能力的HIV病毒体。美国专利第6,451,304号描述了用于制备不能复制的逆转录病毒载体的方法，所述方法包括用第一原病毒质粒、第二原病毒质粒和第三构建体来转染细胞；所述第一原病毒质粒编码gag，但不编码pol或包膜蛋白；第二原病毒质粒编码pol，但不编码gag或包膜蛋白；而第三构建体编码单独的包膜蛋白。

HIV也含有除编码gag、pol和env蛋白之外的额外基因。HIV中的额外基因是vif、vpr、vpx、vpu、tat、rev和nef。额外基因编码的蛋白具有各种功能，其中的一些可以通过细胞蛋白提供复制功能。在HIV中，tat起到病毒LTR的转录活化物的作用。它与稳定的茎-环RNA二级结构结合，被称为TAR。Rev通过rev效应元件(RRE)来调节和辅助病毒基因的表达。

在发达西方国家中发现的优势亚型即基因亚型B，与非洲和亚洲(这里居住着绝大多数的HIV感染者)存在的其它亚型和重组株很不相同。因此，医生们在北美和欧洲遇到的亚型B逆转录病毒与那些在全球范围危害人类的病毒亚型之间存在着很大的差异(Spira，S.等，(2003)J.Antimicrob.Chemother.51(2)：229-40)。在不同地理区域的病毒亚型的大的基因组多样性，是HIV逆转录酶(RT)惊人的高错配误差率、再加上缺乏核酸外切酶校正活性的结果。引起遗传多样性高度变化的其它因子包括每种病毒亚型的复制率、每次复制周期产生的突变数、基因组重组和病毒适合度的病毒倾向性。另外，基因组进化的高速率也可由宿主、环境和/或治疗性选择压力而引起。

3类HIV-1已经在全球扩散：M(主要亚型组)、O(外亚型组)和N(新亚型组)。其中M组占已报告HIV/AIDS病例的90％以上；在M组中，病毒包膜变化多样，使得该组被进一步划分成9个主要的基因亚型(包括A-D、F-H、J和K)以及多个循环重组型。病毒多样性看来是从撒哈拉非洲次大陆发散开来，在这里生活着的总共4000万人中超过2800万人被感染。

A和A/G重组变异株在西非和中非占优势。B在欧洲和美洲成为优势种。然而，随着移民和全球化的增加，在欧洲，＞40％的新增感染呈现非B非洲变异株和亚洲变异株。C在南非和东非、印度和尼泊尔占优势。的确，基因亚型C因为在以下国家未受控制地扩散，而已成为近年来HIV大流行的中心：博茨瓦纳、津巴布韦、马拉维、赞比亚、纳米比亚、莱索托、南非、印度、尼泊尔和中国。D一般局限于东非和中非，并在南非和西非观察到散在病例。E从未单独出现，但泰国、菲律宾、中国和中非却检测到A/E嵌合状态。F已在中非、南美和东欧有报道。G和A/G重组病毒已在西非和东非以及中欧发现。H仅在中非被检测到。J仅在中美洲报道过。K目前已在刚果民主共和国和喀麦隆被鉴定。

该表并不详尽，因为还在不断发现更多亚型，而且移民群体正带来新的感染模式。需要特别关注的是HIV-1基因亚型C和A，以及A/G和A/E重组型，这些代表了非洲和亚洲的优势亚型，而非洲和亚洲又是HIV病最危险的失控地区。

与此形成鲜明对比的是，其它种类的逆转录病毒如HIV-2，除了在西非正在流行外，并未更多地扩散到西非以外的地区。仅在非洲观察到一些散在的病例，但是该病毒的致病性看来明显低于HIV-1。

根据包膜(env)核苷酸序列中20-50％的差异，可将HIV-1基因亚型按系统发生进行分类。M组和O组的Env蛋白可有多达30-50％的差异。但是，N亚型看来与M和O在系统发生上是等距的。在M组内，观察到基因亚型间env变异的不同达20-30％，而基因亚型内的变异为10-15％。

HIV-1的pol区的变异性比env小2-3倍，因为该区编码2种极其重要的酶，即RT和蛋白酶，所以该区如果过分突变则会导致该病毒不起作用。Gag序列甚至更不耐受突变，因为它们编码更严格的核心蛋白序列。

基因亚型间和基因亚型内pol序列的变异特别有关，因为该区编码许多抗病毒药物所针对的RT和蛋白酶蛋白。因此，在这些区域的变异可影响药物敏感性，并且发展抗药性。埃塞俄比亚基因亚型C分离株与基因亚型B有6.8-10％的差异(就RT而言)，并且已经报道来自非洲、印度和南美毒株的基因亚型内差异达3.5-5.8％。

值得注意的是这一事实：核苷酸序列中一定的百分率变异翻译成较低的氨基酸序列变异，因为许多遗传突变是沉默型的。例如在基因亚型E和B中RT序列间有10％的核苷酸变异，仅产生7％的氨基酸残基的变异。

不仅基因亚型与基因亚型间的env基因基本上不同，而且长末端重复(LTR)序列也不同，所述序列含有HIV复制的转录启动子。每个基因亚型具有其自身的LTR拷贝数以及精确的增强子和启动子结构核苷酸序列，虽然在其它LTR均一性的特征在于，即Spl位点、TATA盒和TAT效应元件。此外，在各种转录启动子中都观察到多样性。这些包括NF-κB结合位点(C中有3-4个，B中有2个，而E中仅1个)，以及在NF-κB位点上游序列(例如nef重叠USF基因，该基因仅存在于基因亚型B中)，和AP-1转录因子结合位点(所述位点在亚型C、E和G中存在1个，在A和F中存在2个，而在B或D中不存在)。不仅在基因亚型A、C、D或O中具有含NF-IL6转录因子(C/EBP-B)特异性基序的U3的-170区，而且在B中也具有。该因子反式激活来自单核细胞的细胞中的HIV-1 LTR。此外，与基因亚型B的检测相比，在基因亚型C、D和E中观察到负调节元件(NRE)之间的亚型差异。

最近实验表明，在HIV-1基因亚型间，病毒调节蛋白序列Nef也不同，变异范围从14.4％到23.8％，其中B和D的Nef构型最接近。目前，Nef序列多样性的临床意义尚不明确，但是可能是意义重大，因为近期观察到，在基因亚型B的感染者中，Nef序列可随疾病进程而变化。

最后，有证据表明，其它的调节和辅助HIV-1基因在亚型多样性中发挥重要作用。这部分地涉及这一事实：基因亚型C含有独特的截短Rev蛋白和增加的Vpu产物，以及发现基因亚型D表达C端缺失的Tat蛋白。

在优选的实施方案中，本发明提供含有HIV-1基因亚型C以及循环重组型007(也称为HIV_CHN.AD)的核酸和MVA载体，所述载体也含有基因亚型B的区段)，所述亚型在云南省是优势亚型。此外，其它基因亚型也可任选用于替代实施方案。

先前在WO 99/41397中已经描述了密码子最优化。不同细胞对具体密码子的使用不同。这种“密码子偏倚”符合在该细胞类型中特定tRNA相对丰度的偏倚。通过改变序列中的密码子，使它们更加匹配相应的tRNA的相对丰度，可以增加表达。同样，可以通过为已知在特定细胞类型中稀有的相应tRNA来刻意选择密码子，以降低表达。因此，可以进行额外程度的翻译控制。

许多病毒，包括HIV和其它慢病毒在内，均大量使用稀有密码子；通过将其改变成相应的哺乳动物通用密码子，可以在哺乳动物生产细胞中达到增加所包装组分的表达。哺乳动物细胞和其它各种生物的密码子使用表是本领域已知的。

密码子最优化具有许多其它优点。由于改变其序列，在生产细胞/包装细胞中编码装配病毒颗粒所需的病毒颗粒包装组分的核苷酸序列具有从中消除的RNA不稳定序列(INS)。同时，保留了包装组分氨基酸序列的编码序列，使得所述序列所编码的病毒组分保持相同，或者至少十分相似，使得所述包装组分功能没有降低。密码子最优化也克服了输出、独立赋予最佳序列Rev所需的Rev/RRE。密码子最优化也可在载体系统中降低不同构建体之间的同源重组(例如在gag-pol和env可读框重叠区之间)。因此，密码子最优化的总体效果是显著增加病毒滴度并提高了安全性。

本发明涉及将编码病毒抗原的DNA直接注射到皮肤或肌肉的策略。然后局部细胞可吸收所述质粒并自己表达所述外源蛋白，原位产生疫苗免疫原。任选使用MVA初次免疫和加强免疫，以在具有HIV感染或HIV相关疾病危险的受试者中增强免疫应答。该方法既经济又灵活多变。然而，更重要的是体内潜在的功效。

本发明还包括使用所述核酸载体，在已经感染所述病毒的感染者体内刺激免疫应答。此外，本发明的载体可用于在感染者体内产生针对该载体提供的抗HIV序列的抗体，或者是抗预先存在的循环HIV序列的抗体。因此，本发明还预期在HIV或HIV相关疾病的诊断试剂盒中使用本文公开的载体而产生的抗体的用途。

药学上可接受的载体部分取决于在给予所述化合物时所使用的具体组合物以及具体方法。本发明包括给予包含核酸的药用组合物，并任选与MVA病毒加强剂联用。在一个替代实施方案中，可以单独给予MVA，而不给予核酸。因此，这些核酸的药用组合物有许多合适的制剂(参见例如Remington′s Pharmaceutical Sciences，第17版.1989)。可以采用任何常规方式给药，例如注射、口服给药、吸入、经皮给药，或者直肠给药。当采用粘膜给药时，可以采用口服、眼用或鼻腔途径。

适于胃肠外给药的制剂，例如通过肌内、皮内和皮下途径，包括含水和不含水的、等渗无菌注射液，其中可含有抗氧化剂、缓冲剂、抑菌剂以及赋予该制剂与预期给予的受体血液等渗的溶质；以及含水和不含水的、等渗无菌混悬液，其中可含有悬浮剂、增溶剂、增稠剂、稳定剂和防腐剂。在本发明的实践中，可以给予组合物，例如通过静脉内输注、口服、局部、腹膜内、膀胱内或鞘内方式。胃肠外给药是优选给药方式。所述制剂可呈单位剂型或多剂量密封容器形式，例如安瓿和小瓶。

可以通过本领域已知方法制备纯化疫苗溶液，供给药用，所述方法可包括将溶液过滤除菌、稀释溶液、加入佐剂并稳定该溶液。疫苗可以是冻干疫苗，以生产易于运输和贮藏的干形式抗HIV疫苗。此外，可以制备供初次接种用的单独的ADVAX I和ADVAX II疫苗或联合疫苗，以及供加强免疫用的单独的ADMVA疫苗，或可含有至少一种其它抗原，只要所加抗原不干扰初次或加强免疫疫苗的有效性，并且不额外增加或协同增加副作用和不良反应。重组痘病毒或免疫原可以与合适的载体、稀释剂或赋形剂(如无菌水、生理盐水等)混合。组合物也可以冻干或冷冻。所述组合物可含有辅料，例如润湿剂或乳化剂、pH缓冲剂、佐剂、防腐剂等，这取决于给药途径和所需制剂。

药学上可接受的佐剂，例如完全或不完全弗氏佐剂、RIBI(胞壁酰二肽)、ISCOM(免疫刺激复合物)、霍乱毒素B、氢氧化铝等矿物凝胶剂，以及溶血卵磷脂、复合多元醇、聚阴离子等表面活性剂，肽类、含油乳剂、匙孔血蓝蛋白和二硝基苯酚。BCG(卡介苗)和小棒状杆菌(Corynebacterium parvum)是潜在有用的人用佐剂，它们可以通过将核酸和/或病毒载体螯合在局部贮库中以防止其快速分散，或者它们可含有某些物质，所述物质刺激宿主分泌巨噬细胞趋化因子和其它免疫系统组分。免疫程序可以涉及或不涉及两种或多种多肽的给药，时间可以跨越数周。

本发明包括在动物中诱导抗HIV的免疫性或保护性免疫应答的方法，所述方法包括将所述免疫原性组合物或疫苗组合物给予所述动物。

本发明还包括抗HIV的初次-加强免疫或接种，其中所述初次免疫是采用DNA疫苗或免疫组合物或免疫原性组合物，它们含有在体内编码和表达HIV免疫原、抗原或表位的核酸分子；而所述加强免疫是采用疫苗或免疫组合物或免疫原性组合物，它们是HIV失活制剂或减毒制剂或亚单位(抗原、免疫原和/或表位)制剂，和/或重组或修饰病毒疫苗或免疫组合物或免疫原性组合物，所述疫苗和组合物含有在体内编码和表达HIV免疫原、抗原或表位的核酸分子。因此，本发明提供抗HIV的初次-加强免疫或接种方法，例如包括以下的抗HIV的初次-加强免疫或接种：将含有在体内编码和表达HIV抗原、免疫原或表位的核酸分子的本发明DNA疫苗或免疫组合物或免疫原性组合物给予目标动物(作为初次接种)，然后给予含有在体内编码和表达HIV免疫原、抗原或表位的核酸分子的重组或修饰病毒疫苗或免疫组合物或免疫原性组合物，最好给予体内表达HIV免疫原、抗原或表位的重组疫苗或免疫组合物或免疫原性组合物(作为加强免疫)。加强免疫最好与初次免疫相匹配，例如加强免疫含有或表达至少一种被初次免疫表达的抗原、表位或免疫原。

给药方法可包括给予有效量的本发明的免疫原性组合物或疫苗。可以采用一次或多次给药，例如两次给药。本发明包括用于不同给药途径的组合物形式。按已知因素确定有效剂量和给药途径，例如年龄、性别、体重以及已知的其它筛选程序，而无需进行过多的实验。对于亚单位的免疫原性组合物、免疫组合物或疫苗组合物，每种活性剂的剂量可以是按照本文引用文件(或本文引用文件所参考或引用的文件)和/或其范围可以从一微克或几微克到几百微克或几千微克，例如1μg-1mg。

初次免疫和加强免疫的给药量和给药途径可以是如本文所讨论的，例如按照本发明和本领域的知识，可以实施初次-加强方案，而无需进行过多的实验。此外，按照本文公开内容和本领域的知识，技术人员可以对上面提到的目标物种使用所述方法、试剂盒等。

可以用无针的液体喷射注射器或粉末喷射注射器注射所述疫苗或免疫原性组合物。对于质粒，也可使用包埋质粒的金颗粒并采用所述方法喷射而穿透待免疫受试者的皮肤细胞(Tang等，Nature 1992，356，152-154)。本发明的疫苗或免疫原性组合物的给药方法和仪器可以参考引用并结合到本文的其它文件。无针注射器也可以是例如Biojector 2000(Bioject Inc.，Portland OR，USA)。

本发明的免疫原性组合物和疫苗最好包含有效量的引发免疫应答和/或保护性免疫应答的本文讨论的一种或多种表达载体和/或多肽；并且，有效量可以按照本发明内容(包括结合到本文中的文件)和本领域的知识来确定，而无需进行过多的实验。

在基于质粒载体的免疫原性组合物或疫苗的情况下，剂量通常可包含约10μg至约2000μg，最好约50μg至约1000μg。给药体积可以在约0.1ml和约2ml之间，最好在约0.2ml和约1ml之间。

可以按合适剂量给予重组载体，以达到本文和/或本文所引用文件所描述剂量的相应的体内表达。例如，可以凭经验来确定病毒悬液的合适范围。本发明的病毒载体或重组株可以按每剂至少10³pfu的量给予受试者或感染或转染到细胞中；更优选约10⁴pfu至约10¹⁰pfu，例如约10⁵pfu至约10⁹pfu，例如约10⁶pfu至约10⁸pfu，例如每剂2ml。如果不止一种重组株表达不止一种基因产物，每个重组株可以按这些量给予；或者，每个重组株可以与包含这些剂量的重组株联合、共同给予。在本发明使用的重组载体组合物中，剂量可以按照本文引用文件描述或按照本文描述或按照本文引用文件中的参考或引用文件来确定。例如，重组载体组合物中每种DNA的合适量可以是1μg至2mg，最好是50μg至1mg。技术人员可以参考本文引用文件(或本文引用文件中的引用或参考文件)中关于DNA载体的内容，来确定本发明重组DNA载体组合物的其它合适剂量，而无需进行过多的实验。

然而，引发合适的免疫应答的组合物剂量、其中的组分浓度和给予所述组合物的时间可以通过血清抗体滴定等方法来确定，例如通过受试者体内的ELISA和/或血清中和测定分析和/或通过接种攻击评估。所述确定方法可按照技术人员的知识、本发明内容和本文引用文件，而无需进行过多的实验。而且，序贯给药时间同样可以按照本发明内容和本领域的知识来确定，而无需进行过多的实验。

以下给出实施例，是为了给本领域普通技术人员提供完整发明内容和怎样进行和采用本发明的测定、筛选和治疗性方法的详述，并且不是用来限制本发明人所考虑的本发明的范围的。

实施例

实施例1：DNA疫苗ADVAX I和II的构建

本发明预防性疫苗方案包括两种新型DNA载体，以及用重组表达相应的HIV-1蛋白的修饰痘苗病毒Ankara(MVA)的加强免疫。本疫苗所采用的基因来自HIV-1基因亚型C株、循环重组型007或HIV_CHN.AD，所述基因也含有在云南作为优势亚型的基因亚型B的小区段。nef基因产物和tat基因产物在病毒生命周期早期表达，并且代表HIV-1感染的免疫控制的关键靶。另外，也选择Gag、pol和env结构基因。因此，在本发明的DNA疫苗策略中包括结构基因和调控基因，是为最大量包括免疫原性表位而设计的。

本发明的DNA疫苗基于pVAX1，这是一种Invitrogen市售质粒(图1)。该载体是专为用于开发DNA疫苗而设计的，而且按照美国食品及药品管理局(FDA)规程的要求来构建(Center for BiologicsEvaluation和Research，FDA，1996年12月22日，卷号96N-0400)。但是，原来的载体通过插入额外的启动子而被修饰。采用PCR，从市售载体pBudCE4.1(Invitrogen)扩增人延伸因子1α(hEF1a)启动子。所述启动子克隆到pVAX1的EcoRI/NotI位点，该新构建体经测序证实。hEF1a启动子已经由他人表征(Najjar，S.M.等，(1999)Gene230：41-5；Nishimura，Y.等，(1999)Vaccine 18：675-80；Wallich，R.等，(2001)Infect.Immun.69：2130-6)。pVAX1的这一变化，产生pADVAX(图2)，已发现后者容许独立的高水平表达第二基因插入序列。pADVAX的双顺反子容量比用内部核糖体进入位点或IRES更加有效(10-20倍)(Martinez-Salas，E.(1999)Curr.Opin.Biotechnol.10：458-64)。蛋白质印迹显示，处于pADVAX双启动子控制之下的每个基因的蛋白表达水平与pVAX1中单由CMV启动子驱动的表达水平相当。

构建pADVAX载体后，制备用于插入的HIV病毒基因。合成HIV-1 env基因和gag基因，使之包含对于哺乳动物表达最优化的密码子。密码子最优化代表Rev/RRE独立型核输出的促进作用(Schneider，R.等，(1997)J.Virol.71：4892-903；Kotsopoulou，E.等，(2000)J.Virol.74：4839-52)，这与病毒基因表达增加是一致的。用重叠PCR，将寡核苷酸(80-mers至90-mers，重叠16-18次)与序列结合，反映理想的密码子选择。经ELISA或蛋白质印迹测定，这增加了基因表达100倍至1000倍。

通过掺入组织纤溶酶原激活物(tPA)前导序列(MDAMKRGLCCVLLLCGAVFVSAR)(SEQ ID NO：1)来替代天然env序列和补充gag基因，进一步修饰所述基因。认为该序列通过促进蛋白从内质网(ER)转运到高尔基体而部分增强表达(Haddad，D.等(1997)FEMS Immunol.Med.Microbiol.18：193-202；Li，Z.等，(1999)Infect.Immun.67：4780-6；Weiss，R.等，(1999)Vaccine 18：81524；Qiu，J.T.等，(2000)J.Virol 74：5997-6005)。有了这样的修饰，基因表达可进一步增加3-5倍。图3显示经定量测定HIV-1 Gag(p24)的ELISA(Abbott Laboratories)法检测，天然gag(NAT)、密码子最优化gag(OPT)和密码子最优化gag/tPA(tPA OPT)的表达。采用抗env基因产物的多克隆抗体，进行蛋白质印迹测定，得到因密码子最优化和添加tPA前导序列而得到的增加的env表达的类似结果(图4)。结果表明，Env功能保留了遗传修饰。在涉及携带CD4/CCR5(HIV-1受体/共同受体)的HeLa细胞的融合测定中，用tPA-最优化env载体转染的293T细胞能够融合而形成合胞体(结果未显示)。

有了合适位置的所需遗传修饰，两个HIV-1基因克隆到pADVAX中，产生第一疫苗即ADVAX I。经蛋白质印迹证实双顺反子表达(图5)。如上所述再构建第二疫苗即ADVAX II，用重叠PCR结合密码子最优化寡核苷酸，来合成pol、nef和tat。然而，采取额外措施，以保证体内应用的安全性。首先，pol基因包括蛋白酶(PR)活性位点的缺失，以阻止多肽加工(Loeb，D.D.等，(1989)Nature 340：307-400)，结果用蛋白质印迹证实(图6)。采取额外的谨慎步骤，以在逆转录酶(RT)活性位点以及pol基因中掺入点突变(Wakefield，J.K.等，(1992)J.Virol66：6806-12；Chao，S.F.等，(1995)Nucleic Acids Res.23：803-10)。

为了将这三个基因全部掺入到一个基于pADVAX的载体中，重叠PCR产生nef-tat融合基因。这两个遗传序列都保持完整，因而在所得融合蛋白中保留所有的免疫原性表位。如上所述，将tPA前导序列加入到pol和nef-tat中。用蛋白质印迹分析用相关载体转染的293T细胞的两种裂解物和上清液，证实得到增加的表达和分泌效率(图7-8)。所用抗体是多克隆兔抗Nef抗体(由Cecilia Cheng-Mayer博士提供)。因为有了Pol，所以考虑了用于体内的nef-tat融合蛋白的安全性，并进行了如下分析。

已知Nef负调节CD4和I类MHC的表面表达(Collins，K.L.等，(1998)Nature 391：397-401；Aiken，C.等，(1994)Cell 76：853-64；Collins，K.L.等，(1999)Immunol.Rev.168：65-74)，而tat具有免疫抑制效应，推测起到通用反式激活物的作用(Goldstein，G.(1996)Nat.Med.2：960-4；Garber，M.E.等，(1999)Curr.Opin.Immunol.11：460-5)。然而，采用流式细胞仪分析，我们证明Nef对I类MHC表达的影响被tPA前导序列抵消(图9)。同样，在nef-tat融合蛋白的情况下，tat丧失其反式激活能力。在“MAGI”测定中，可明确观察到该现象，所述测定包括使用HeLa细胞，该细胞经工程化以便在功能性HIV-1 Tat存在下表达β-半乳糖苷酶基因(Kimpton，J.等，(1992)J.Virol.66：2232-9)。随着X-gal(5-溴-4-氯-3-吲哚-β-D-吡喃半乳糖苷)底物的加入，该细胞变蓝，如果tat有活性的话(结果未显示)。因此，可以推导出，由该疫苗产生的Nef-Tat融合蛋白将不再具有体内免疫抑制效应。确实，甚至不顾通用反式激活的风险，已经知道，编码野生型HIV-1 tat的DNA在无免疫应答个体中用作疫苗是安全的(Calarota，S.A.等，(1999)J.Immunol.163：2330-8)。图10图示这些载体。

实施例2：ADVAX I和II-细胞介导应答的体内免疫原性评价

如上所述，用酶联免疫斑点测定来评价针对ADVAX I和II的细胞介导的免疫应答(另参见Hanke，T.等，(1998)J.Gen.Virol 79：83-90；Carvalho，L.H.等，(2001)J.Immunol.Methods 252：207-18；Tobery，T.W.等，(2001)J.Immunol.Methods 254：59-66；Novitsky，V.等，(2001)J.Virol.75：9210-28)。用ADVAX 1的GLP级贮液(Aldeveon，Fargo，ND)来免疫6-8周龄雌性BALB/c小鼠。分别在第0、3和6周肌内给予200μg所述疫苗。用以下构建体接种总共5组小鼠，每组6只：pVAX1-env、pVAX1gag、pVAX1-env+pVAX1-gag、pVAX1(对照)和ADVAX1。呈现特定表位的肽如下：Env 34(VPVWKEAKTTLFCASDAKAY)(SEQ ID NO：3)已知能引发CD4+细胞介导的应答，Env 43(RNVSSDGTYNETYNEIKNCS)(SEQ ID NO：4)引发CD8+细胞介导的应答，Gag 26(TSNPPIPVGDIYKRWIILGL)(SEQ ID NO：5)引发CD4+细胞介导的应答，以及Gag A-I(AMQMLKDTI)(SEQ ID NO：6或2)引发CD8+细胞介导的应答。

第3次注射后2周，处死小鼠。然后从每组收集脾细胞，并且在用Env和Gag抗原特异性肽库(NIH AIDS Research and ReferenceReagent Program)进行体外再次刺激期间，用酶联免疫斑点测定来检测它们分泌干扰素-γ(IFNγ)的能力。就在本文写成之时，仅来自异源株(HIV_96zM65.8，产品目录号3993)的Gag肽可用。同样，在我们进行酶联免疫斑点测定时，我们尚不具备全套同源Env肽(HIV_CHN.AD，产品目录号4974，80％完整性)。尽管如此，结果显示出对每种单启动子驱动的载体(pVAX1-env和pVAX1-gag)的强烈免疫应答，每种都产生约700斑点形成细胞(SFC)/10⁶脾细胞。ADVAX I诱导的免疫应答比较显著，约600 SFC/10⁶脾细胞对所检测的Env和Gag肽库具有特异性。预期针对pVAX1控制的应答是nil，而且在脾细胞合并液缺乏CD8+细胞时，没有检测到针对Gag A-I的酶联免疫斑点测定的应答(图11)。总的来讲，检测了抗至少9个不同表位的细胞介导免疫应答，所述表位包括对CD8+或CD4+T细胞具有特异性的表位(数据未显示)。没有检测到ADVAX I的两种基因产物间的免疫原性协同或干扰的证据。剂量提高实验揭示出清楚的剂量-反应效应(图12)。对于至少一个表位(Env 34)，发现150μg的定量酶联免疫斑点测定的应答约为5μg的7倍。尽管如此，剂量-反应趋势对于所有检测的表位都适用，不管对CD4+或CD8+细胞介导的应答是否有特异性。

实施例3：体内临床前免疫原性评价

以下数据支持ADVAX I的体内体液免疫原性。在小鼠实验的最后一次(第3次)免疫后两周，收集血清样品，用ELISA检测抗Gag抗体。尽管在接种pVAXI-gag的小鼠中观察到最高滴度，但是，与接受pVAXI-env+pVAXI-gag的动物延迟的应答相比，在用ADVAX I免疫的一组动物中也有基础滴度(图13)。通过蛋白质印迹，证明从ADVAX I组收集的血清样品也有抗EnV抗体应答。用ADVAX II进行了相似的体内研究。具体地讲，用ADVAX II的GLP级贮液(Aldevron，Fargo，ND)来免疫6-8周龄雌性BALB/c小鼠。分别在第0、3和6周肌内注射给予200μg所述疫苗。用以下构建体共接种5组小鼠，每组5只：pVAX1-pol、pVAX1-nef-tat、pVAX1-pol+pVAX1-nef-tat、pVAX1(对照)和ADVAXII(唯一的双启动子载体)。

第3次注射后2周，处死小鼠。然后从每组收集脾细胞，并且在用来自肽库的pol、tat和nef进行体外再次刺激期间，用酶联免疫斑点测定来检测它们分泌干扰素-γ的能力。要注意的是，检测时，没有可用的基因亚型C肽。所述抗原特异性肽由基于基因亚型B共有序列的15-mers(NIH AIDS Research and Reference Reagent Program：Tat的产品目录号5138，Nef的产品目录号5189和Pol的产品目录号6208)组成。尽管如此，正如在ADVAX I实验中一样，我们比较性地观察了单基因载体和双启动子疫苗的良好应答。抗Pol库的应答，例如，对于pVAX1 pol单用是最好的(300-800 SFC/10⁶脾细胞，取决于库)。对于pVAX1 pol+pVAX1 nef-tat，结果范围是180-500 SFC/10⁶脾细胞，而对于ADVAX II，应答在180-600 SFC/10⁶脾细胞之间。由于有了Tat库，对于pVAXI-nef tat来说应答为-180 SFC，而对于pVAX1 pol+pVAX1 nef-tat和ADVAX II来说为-100 SFC。使用Nef库，对于pVAX1 nef-tat来说应答为30-200 SFC，而对于pVAX1 pol+pVAX1 nef-tat和ADVAX II为20-150 SFC(图14)。

我们用ADVAX II还进行了剂量增加研究，证明了明确的剂量-反应效应(图15)。分别在第0、3和6周，经肌内注射给予小鼠5μg、10μg、50μg、100μg或150μg的DNA。在第8周处死小鼠后，收集脾细胞，用来自基因亚型B共有序列的肽进行体外再次刺激。Pol应答随剂量的增加而增加，从10μg时的250-500SFC增加到100μg时的500-700SFC。150μg时的应答与100μg时的相当。Nef应答范围从-20SFC到-200SFC，而Tat应答从-25SFC到-100SFC。

进行了ADVAX I+II联合接种的体内试验。分别在第0、3和6周，经肌内注射给予各组小鼠5μg、10μg、50μg、100μg或150μg的ADVAX I+II。对照组接受pVAX1 gag、pVAX1 env、pVAX1 pol和pVAX1-nef-tat各50μg的混合物。最后一次免疫后2周，处死小鼠，收集各组的脾细胞，用酶联免疫斑点法测定干扰素-γ的释放。用含有CD4+和CD8+T细胞表位的Env特异性肽、Gag特异性肽和Pol特异性肽进行体外再次刺激，如同自体亚型C Tat和Nef序列一样。正如在单用ADVAX I和ADVAX II的试验中所观察的，该联合接种试验的结果表明对这两种疫苗载体的比较好的应答。用ADVAX I+II接种的小鼠具有抗所有受试肽(肽库)的抗原特异性应答，而且所述应答是以剂量依赖性方式诱导的(表1)。

表1.针对联合接种和对照的抗原特异性干扰素-γ

酶联免疫斑点测定的应答

疫苗	IFN-γ斑点形成细胞(SFC)/10⁶脾细胞
疫苗	IFN-γ斑点形成细胞(SFC)/10⁶脾细胞										剂量	Gag26	GagA-I	Env34	EnvT-I	Pol223	PolYLI	PolVGI	Tat库	Nef库1	Nef库2
pVAX1-gag+pVAX1-env+pVAX1-pol+pVAX1-nef-tat(各50μg)	120	150	350	700	70	500	500	110	400	300	剂量	Gag26	GagA-I	Env34	EnvT-I	Pol223	PolYLI	PolVGI	Tat库	Nef库1	Nef库2
pVAX1-gag+pVAX1-env+pVAX1-pol+pVAX1-nef-tat(各50μg)	120	150	350	700	70	500	500	110	400	300	ADVAXI+II(各150μg)	112	252	400	700	117	700	830	120	225	370
ADVAXI+II(各100μg)	70	210	400	600	100	550	500	70	200	330	ADVAXI+II(各150μg)	112	252	400	700	117	700	830	120	225	370
ADVAXI+II(各100μg)	70	210	400	600	100	550	500	70	200	330	ADVAXI+II(各50μg)	30	100	220	500	84	400	420	50	140	160
ADVAXI+II(各10μg)	30	60	180	250	70	275	375	30	110	140	ADVAXI+II(各50μg)	30	100	220	500	84	400	420	50	140	160
ADVAXI+II(各10μg)	30	60	180	250	70	275	375	30	110	140	ADVAXI+II(各5μg)	10	30	110	180	60	250	370	20	70	140

注意：根据两种细胞输入水平的双份重复孔，斑点数都标准化每10⁶脾细胞，并且计算每种样品和抗原的平均数。Gag 26、Env 34和Pol 223含有CD4表位，而Gag A-I、Env T-I、Pol YLI和Pol VGI含有CD8表位。用于Tat和Nef的肽库来自自体亚型-C序列。

注意，在该试验中，在用来自亚型C的Nef和Tat肽库对脾细胞进行体外再次刺激时，观察到特别强烈的应答；相比之下，先前在ADVAX I试验中观察到较温和的应答。这一差异可能归结于异源蛋白和自体蛋白间的差异。因此，我们认为，事实上，在ADVAX II中的nef-tat融合基因能诱导非常有效的免疫应答。此外，联合接种试验证明，通过干扰素-γ酶联免疫斑点测定，在不同的抗原特异性应答中没有可检测的干扰。

实施例4：构建重组MVA病毒载体作为抗HIV-1疫苗

我们采用的MVA穿梭载体最先得自美国国立卫生研究院的Bernard Moss博士。该载体经进一步修饰，使之符合美国食品及药品管理局(FDA)的规范。我们先通过除去我们不希望引入人体的报道基因或抗药性基因，来修饰原载体。然后我们评价了用于表达HIV-1蛋白的3个MVA插入位点(del II、del III和HA)。通过蛋白质印迹，我们发现，对于基因表达来说，del II和del III优于HA位点(图16)。此外，我们注意到，痘苗病毒特异性启动子按以下顺序驱动外源基因表达：pSYN＞pH5＞p7.5。因此，我们选用del II和delIII位点，以及痘苗病毒启动子pSYN和pH5，用于构建我们的疫苗。采用该策略，以保证HIV-1蛋白的高水平表达。

评价了MVA系统中的HIV-1的基因表达。尽管序列“人源化”有助于提高DNA疫苗中的蛋白表达，但是，通过蛋白质印迹检测，与插入到del II位点的人源化和野生型nef基因相比，MVA的HIV-1的蛋白表达没有任何优势。因此，选用野生型HIV-1序列，来构建我们的疫苗。此外，MVA不能耐受全长HIV包膜蛋白，可能是因为它对痘苗病毒的毒性(Amara，R.R.等，(2001)Science 292：69-74；Barouch，D.H.等，(2001)J Virol 75：5151-8；Men，R.等，(2000)Vaccine18：3113-22；Ourmanov，I.等，(2000)J Virol 74：2740-51；Takahashi，H.等，(1988)Proc Natl Acad Sci USA 85：3105-9)。因此，通常将HIV-1gp41区的羧基端截短，以产生活的重组HIV-1-MVA。考虑到这些发现，通过在其可变(V)区引入缺失，来修饰病毒包膜序列。与野生型相比，gp120 V2区(DV2)的缺失，可使重组MVA达到更高滴度，即＞10⁸TCID₅₀/ml。

该修饰保留了gp41内的所有免疫原性表位。DV2包膜可以作为更好的免疫原，诱导抗HIV-1的广泛的中和抗体，因为增加了对某些关键抗体表位的暴露(Barnett，S.W.等，(2001)J Virol 75：5526-40；Cherpelis，S.等，(2001)Immunol Lett 79：47-55；Cherpelis，S.等，(2001)JVirol 75：1547-50；Donnelly，J.J.等，(2002)Science 297：1277-8；discussion 1277-8；Ly，A.和L.Stamatatos.(2000)J Virol 74：6769-76；Stamatatos，L.等，(2000)AIDS Res Hum Retroviruses 16：981-94)。注意，DV2也消除了痘苗病毒转录终止信号，所述信号能影响全长包膜的表达(Moss，B.等，(1996)Adv Exp Med Biol.397：7-13；Moss，B.(1996)Proc Natl Acad Sci USA 93：11341-8)。重要的是，尽管进行了修饰，但保留了DV2包膜的功能性特征。在采用携带CD4/CCR5(HIV-1受体/共同受体)的HOS细胞的融合测定中，用修饰的DV2 env载体转染的293T细胞能够融合，形成合胞体(图17)。

既然理想的插入位点仅限于MVA，所以重叠PCR产生gag-pol和nef-tat融合基因。这样，就完整地保留了两个遗传序列，因而在所得融合蛋白中保留了所有的免疫原性表位。为了与在我们的质粒DNA疫苗中增加表达的方法相一致，通过掺入组织纤溶酶原激活物(tPA)前导序列(氨基酸：MDAMKRGLCCVLLLCGAVFVSAR)，再加上gag-pol和nef-tat融合基因，对所述基因进行进一步修饰。

正如DNA疫苗所述，还进行了其它工作，以保证体内应用的安全性。在pol基因中，引入蛋白酶(PR)活性位点的缺失，使多肽加工受阻(Loeb DD等，(1989)Nature Aug 3；340(6232)：397-400)。蛋白酶的缺失(DTGA)包括野生型基因的氨基酸25-28。在逆转录酶(RT)活性位点也引入了点突变，使得逆转录病毒反转录失活(Wakefield，J.K.等，(1992)J Virol.66(11)：6806-12；Chao S.F.等，(1995)Nucleic acidsRes 23(5)：803-10)。逆转录酶中的点突变(YMDD→YGDD)对应于野生型基因的184位。引入nef和tat基因，作为包含tPA前导序列的nef-tat融合基因。当在MAGI测定中进行评价时，该tPA nef-tat融合基因，在质粒DNA疫苗候选者的情况下，显示出不具有通常与天然tat表达相关的反式激活功能。将用表达tPA nef-tat的质粒转染的细胞与用仅表达天然nef的构建体转染的细胞相比较，通过对293T细胞进行流式细胞仪分析，证明nef对I类MHC表面表达的负调节效应，被tPA前导序列的引入所抵消。

为了将所有的5个基因掺入到一个重组MVA病毒中，构建了双启动子穿梭载体pZC1。采用这一新型载体，将env和gag-pol基因都通过同源重组插入到MVA缺失III中。

Moss和Wyatt博士(NIAID，the National Institutes of Health)提供的MVA穿梭质粒pLW7，含有SYN启动子并能指导重组到MVA缺失III中。从获得的数据来划分痘苗病毒特异性启动子的效率，pLW7质粒通过添加处于H5启动子控制之下的克隆位点的修饰，产生新型双启动子插入质粒。因为pZC1含有两个不同的启动子，所以不存在启动子竞争的潜在问题。采用插入双启动子的质粒ZC1，来构建穿梭质粒pZC4，所述质粒含有处于SYN启动子控制之下的DV2Env，以及处于H5启动子控制之下的tPA gag-pol。所构建的这一新型插入载体pZC1并不只将一个外源基因、而是将两个外源基因传递给MVA基因组的Del III区。因此，pZC1可以将位于同一插入盒中、但分别处于各自不同的痘苗病毒启动子控制之下的env和gag-pol，传递给MVA的Del III区(图1 9)。

因为包膜免疫染色已经证明是灵敏和可靠的方法，所以采用 env作为替代标记，以筛选gag-pol的存在，因为gag-pol本身是难以检测的。因此，包膜染色阳性细胞的基因组上也整合了gag-pol基因。经过多轮浓缩后，可以用蛋白质印迹法证实gag-pol表达，该方法比原位免疫染色法灵敏得多。

正如先前描述的，插入的HIV-1 env和gag-pol都分别处于各自的启动子控制之下，称为pZC4。env-gag-pol pZC4通过同源重组插入到野生型MVA的Del III区中。通过免疫染色并使用抗Env抗体，鉴定了该重组env-gag-pol MVA，然后通过蛋白质印迹分析检测gag-pol表达，进行进一步证实。因此，在双启动子构建体中表达了这两个基因(图20)。通过采用抗Env抗体的富集/选择，进一步繁殖重组env-gag-pol MVA株(“ADMVA”)。

感染亲株MVA P585的CEF细胞，用质粒pZC4(env/gag-pol)转染，通过同源重组，产生表达DV2env和tPA gag-pol的重组MVA。从转染培养物中收获的细胞的裂解物，经超声处理，稀释，然后接种在CEF细胞上。对所得单层进行免疫染色，挑出单个色点。通过灭活人抗Env血清(Km94)染色，对阳性色点进行鉴定。将色点转移到装有含2％FCS的DMEM的试管中。进行数次冻融循环，裂解细胞并释放结合的病毒。内容物经离心澄清。将上清液吸出，通过感染盛于150ml TC瓶的CEF细胞来进行病毒扩增。48小时后收获感染细胞，通过裂解细胞，释放结合的病毒。将病毒在36％蔗糖层中经超速离心而纯化，然后测定滴度。根据滴定结果，通过有限稀释来稀释病毒，然后再进行下一轮色点纯化。色点纯化步骤连续进行11次。所选分离株称为ZC4PCRE11/12。通过免疫染色证实插入DV2env基因的表达，同时通过蛋白质印迹分析证实gag-pol表达。

通过上述重组MVA克隆感染的CEF细胞以及穿梭质粒pZC22之间的同源重组，产生多基因重组，又称为ADMVA；其中穿梭质粒pZC22指导tPA修饰的nef-tat融合基因插入到MVA缺失II中，该MVA缺失II位于del III区上游的120kbp(图1 8)。从转染培养物中收获的细胞的裂解物，经超声处理，稀释，然后接种在CEF细胞上。对所得单层进行免疫染色，挑出单个色点。通过双重染色选择技术、采用兔抗nef血清和灭活人抗env血清，对阳性色点进行鉴定。如上所述，进行9轮连续色点纯化循环。在特征鉴定之前，最终分离株通过5次传代进一步随机扩增，得到ADMVA研究种子贮液，其滴度等于2.15×10⁶ TCID₅₀/ml。

MVA穿梭质粒pLW22含有SYN启动子，并指导重组到MVA缺失II中(图21)。del II区在del III区上游120kbp处。修饰pLW22质粒，得到含有处于SYN启动子控制之下的tPA nef-tat融合基因的穿梭质粒pZC22。通过限制酶分析证实穿梭质粒pZC4和pZC22的身份。进行PCR分析，证实所插入的转基因的身份。所述修饰消除了报道基因的存在。理论上讲，通过使用pZCI载体和pZC22载体，可将多个HIV-1基因重组到一个MVA基因组中。为了将5个HIV-1基因用于DNA疫苗，构建了第二个ADMVA变异体。通过同源重组，将HIV-1 nef-tat基因插入到pZC22中，再将这个nef-tat pZC22引入到空斑纯化的ADMVA的del II区。通过双重免疫染色、采用抗Env和抗Nef抗体，鉴定所述重组ADMVA(图22-23)。通过用抗Env抗体和抗Nef抗体的选择，对重组ADMVA株进行空斑纯化。

用富集ADMVA，评价了5个HIV-1基因产物在感染后的细胞中的表达。通过蛋白质印迹分析证实了所有5个基因的有效表达(图24)。此外，所有5个基因可以从ADMVA基因组DNA扩增。序列分析已经证实所插入的基因的身份。ADMVA的感染性可达到10⁸-10⁹TCID₅₀/mL(图25)，所述病毒可以按1∶10的比例容易地扩增。ADMVA在体外经6次传代后仍保持稳定。除了鸡胚成纤维细胞外，ADMVA还可感染人类细胞(图26)。

实施例5：ADMVA的临床前体内免疫原性评价

在完成ADMVA构建和体外表征后，我们试图确定该重组病毒的体内免疫原性。为了测定细胞介导的免疫(CMI)应答，具体地讲，我们首先选用了酶联免疫斑点测定法，该方法对于CD8+和CD4+T细胞活性的检测来说，快速、可重现而且灵敏。采用组合肽库矩阵和缺乏CD4+T细胞或CD8+T细胞的脾细胞，鉴定了存在于BALB/c小鼠上Env、Gag和Pol中的CD4和CD8表位。通过使用SYFPEITHI预测对于CD8(Env和Gag)的最小9mer表位，随后在IFN-γ酶联免疫斑点测定中得到证实；其中SYFPEITHI是用于MHC配体和肽基序的数据库(www.uni-tuebingen.de/uni.kxi)，购自Sigma Genosys(Woodlands，TX)。

肽序列如下：Env特异性CD4+T细胞表位(Env 34：VPVWKEAKTTLFCASDAKAY-20mer)和CD8+T细胞表位(Env T-I：TYNETYNEI-9mer)。Gag特异性CD4+T细胞表位(Gag 26：TSNPPIPVGDIYKRWIILGL-20mer)和CD8+T细胞表位(Gag A-I：AMQMLKDTI-9mer)。Pol特异性CD4+T细胞表位(Pol 223：TAVQMAVFIHNFKRK-15mer)和CD8+T细胞表位(Pol 118：VHGVYYDPSKDLIAE-15mer)。Tat特异性CD4+T细胞表位(Tat12：ISYGRKKRRQRRRAP-15mer)。

除了用于初步酶联免疫斑点测定中的亚型B共有肽库以外，用于Nef和Tat的肽库来自自体序列。肽是重叠11次的15mer，得自IAVICore Laboratory，Imperial College，London，UK。有包含完整Nef区的51肽。这些51肽分为两个肽库。Nef肽库1(C.NefP1)含有肽1至肽24，而库2(C.NefP2)含有肽25至肽51。用于Tat的肽库(C.Tatp1)含有包含全长Tat的23肽。

采用ADMVA的研究种子贮液来免疫6-8周龄雌性BALB/c小鼠。具体地讲，分别在第0周和第3周肌内(IM)给予ADMVA疫苗。用以下疫苗接种总共3组小鼠，每组各6只：10⁶TCID₅₀的ADMVA、10⁶TCID₅₀的野生型MVA和盐水对照。第2次注射后2周，处死小鼠。然后从每组收集脾细胞，并且在用HIV-1抗原特异性肽进行体外再次刺激期间，用酶联免疫斑点测定来检测它们分泌干扰素-γ(IFNγ)的能力(NIH AIDS Research and Reference Reagent Program)。结果表明，疫苗诱导出对该5种免疫原(gag、pol、env、nef和tat)明显的免疫应答，对于最强烈的表位即Env TI，产生约750斑点形成细胞(SFC)/10⁶脾细胞(图27)。野生型MVA所引起的非特异性基础免疫应答约为50 SFC/10⁶脾细胞。预测对盐水对照的应答小于10。注意，对nef和tat的CMI应答并不是最佳的，因为该测定使用来自亚型B的肽。

当采用亚型C特异性同源肽进行刺激，来重复所述实验时，抗nef和tat的SFC数显著增加(图28)。总的来讲，这些CMI应答是针对至少9个不同的表位，包括对CD8+(Env TI、Gag AI、Pol 118)或CD4+(Env 34、Gag 26、Pol 223、Tat T12)T细胞具有特异性的表位。还应注意的是，尽管在ADMVA感染的细胞中，调节蛋白nef和tat是与结构蛋白env、gag和pol共表达的，但是对后者的CMI应答并未消除或受限制。

为了进一步确定在BALB/c小鼠中引发的CMI应答是否具有株特异性现象，用ADMVA来免疫6-8周龄雌性B6×B10小鼠。同样，在第0周和第3周肌内给予该疫苗。用10⁶ TCID₅₀的ADMVA接种总共6只小鼠。第2次注射后2周，处死小鼠。用同源亚型-C肽再次刺激，对脾细胞进行酶联免疫斑点测定(图29)。根据所得SFC计数，在该品系小鼠中也得到类似CMI应答。因此，ADMVA诱导广泛CMI应答的能力并不限于单一小鼠品系。

在小鼠中进行剂量增加实验时，我们发现了明确的剂量-反应效应(图30)。例如，针对Env TI CD8表位，对于10⁶TCID₅₀的剂量，观察到定量酶联免疫斑点测定的应答比10³TCID₅₀高约20倍。此外，对所有受试表位，剂量-反应趋势都适用，无论特异性是针对CD4+细胞介导的应答还是CD8+细胞介导的应答。另外，对于所有受试表位，在第二免疫后，都具有明显的MVA加强效应。对于每个剂量，所有免疫小鼠都能很好地耐受疫苗。在免疫小鼠中，ADMVA不引起任何疾病症状或致病效应。

除了CMI应答之外，我们也测定了ADMVA在小鼠中引发体液免疫应答的能力。通过直接(对于Gag)或间接(对于gp120)ELISA来监测抗体应答。为了定量测定抗体应答，用不同稀释度的免疫小鼠血清进行了ELISA。来自用10⁶TCID₅₀ ADMVA免疫小鼠的数据显示，在第二次免疫后2周，容易测定抗gp120和Gag的抗体(图31)。在第二次免疫后，抗gp120抗体滴度超过1∶20,000。

我们测定了Th1和Th2在诱导抗gp120抗体中的作用。在小鼠中，Th1往往促成IgG2a的产生，而Th2往往促成IgG1的产生。通过测定IgG1和IgG2a的稀释滴度，我们发现每个亚类的相似抗gp120抗体水平(图32)。因此，ADMVA引发相当平衡的抗gp120的Th1和Th2应答。目前，我们正在测定这些动物中中和抗体水平。采用ADVAX env/gag质粒DNA+ADVAX pol/hef-tat质粒DNA(ADVAX)和ADMVA的1∶1的混合物，在用不同方案免疫的BALB/c小鼠中，进行了初步的初次-加强实验。如下显示每组4只小鼠接受不同的免疫方案。在加强免疫后2周处死小鼠，用于免疫应答评价。免疫时间表如表2所示。初次-加强实验结果概括于表3.

表2.初次-加强接种时间表

组别	初次(第0周)	加强(第3周)
组别	初次(第0周)	加强(第3周)	1	ADVAX	ADVAX
2	ADVAX	ADMVA	1	ADVAX	ADVAX
2	ADVAX	ADMVA	3	ADMVA	ADVAX
4	ADMVA	ADMVA	3	ADMVA	ADVAX

ADVAXDNA剂量：每次注射(IM)20μg总DNA

ADMVA剂量：每次注射(IM)10⁶ TCID₅₀

表3.4种不同免疫方案诱导的CMI应答

抗原特异性IFN-γSFC/10⁶脾细胞
抗原特异性IFN-γSFC/10⁶脾细胞										疫苗方案	Gag26	GagA-I	Env34	EnvT-I	Pol223	PolVGI	Tat64	Tat60	Nef库
ADVAX+ADVAX	20	50	280	380	70	550	22	20	60	疫苗方案	Gag26	GagA-I	Env34	EnvT-I	Pol223	PolVGI	Tat64	Tat60	Nef库
ADVAX+ADVAX	20	50	280	380	70	550	22	20	60	ADVAX+ADMVA	90	285	260	670	135	600	200	100	245
ADMVA+ADVAX	40	54	310	585	70	410	40	40	125	ADVAX+ADMVA	90	285	260	670	135	600	200	100	245
ADMVA+ADVAX	40	54	310	585	70	410	40	40	125	ADMVA+ADMVA	35	40	105	220	42	155	70	55	125

根据两种细胞输入水平的双份重复孔，斑点数都标准化每10⁶脾细胞，并且计算

每种样品和抗原的平均数。

Gag 26、Env 34、Pol 223和Tat 64含有CD4表位，而Gag A-I、Env T-1、Pol VGI和Tat 60含有CD8表位。

用于测定抗Nef应答的肽库基于自体亚型-C序列。

尽管通过所有4种方案、针对所有5种MVA-编码的HIV-1免疫原的表位，来诱导CD4+细胞介导应答和CD8+T细胞介导应答，但是ADVAX(DNA)初次+ADMVA加强免疫诱导最强的总体应答。

在用多价重组ADMVA株免疫的BALB/c小鼠中，诱导抗所有5种HIV免疫原的同源HIV-1亚型C肽特异性CTL应答。此外，ADMVA诱导CMI应答与用于小鼠的给药途径无关，这与临床运用中肌内途径所观察到的强烈应答是一致的(图33)。尽管在ADMVA单次免疫后产生强烈的MVA特异性T细胞应答，但是在初次应答后3周，第2次用ADMVA免疫后，小鼠证明产生加强的HIV特异性CMI应答。重组MVA疫苗在两个不同品系的小鼠中引发类似的CTL应答。当检测抗gp120抗体和抗gag抗体滴度时，也观察到了体液免疫应答。当比较所得抗gp 120抗体应答的IgG亚类时，ADMVA在BALB/c小鼠中引发平衡的Th1和Th2应答，正如类似的IgG1和IgG2a env特异性抗体滴度所示。

在中国，因为1980年前出生的人都接种了天花疫苗，所以他们可能已经具有抗我们的重组MVA载体的免疫性。因此，我们试图在接种病毒后，采用改良的酶联免疫斑点测定法，测定小鼠中针对ADMVA的CMI应答的数量级。在该测定中，在用野生型MVA进行感染(MOI为1)后，采用H-2d限制性A20细胞作为抗原呈递细胞。在用ADMVA以10⁶TCID₅₀和10⁷TCID₅₀的剂量进行初次免疫后2周，针对MVA本身的SFC数达到700～800(图34)。尽管如此，当第二次给予时，相同剂量的病毒能引发免疫应答约1.5倍(图29)。因为将使用ADMVA作为加强组分用于我们的人体试验，所以，我们的发现支持这一前提：ADMVA将用作有效的疫苗加强剂，甚至在预先已具有一定水平的针对该病毒载体的免疫性的情况下也是如此。

在采用ADVAX质粒DNA和ADMVA候选疫苗的几个初次-加强方案的评价中，所述DNA初次+MVA加强方案诱导抗由5个HIV-1转基因所表达的肽(代表表位)的最强烈的CMI应答。

实施例6：测定免疫动物中的抗HIV-1 Gag抗体

在4℃下，在0.1M NaHCO₃，pH 9.6中，将一个板用100μl Gag蛋白(0.5μg/孔)包被过夜(Inanulon-2，Dynex Technologies，Chantilly，VA或Costar EIA/RIA强结合96孔板9018，Corning Inc.，Corning，NY)。该板用200μl磷酸缓冲盐溶液(PBS)洗涤1次，然后在室温下，用5％脱脂奶和0.5％BSA的PBS封闭1-2小时。加入用封闭缓冲液连续稀释的动物血清或对照，然后将该板在室温下孵育1小时。该板用含0.05％Tween-20的PBS洗涤4次。加入碱性磷酸酶标记的山羊抗小鼠IgG(Pharmingen BD)；在10ml封闭缓冲液中制备每1μl缀合物的1∶10,000的稀释液，然后该板在室温下孵育30分钟。将该板用AmpliQ洗涤缓冲液洗涤4次。在AmpliQ说明书中包括下述步骤：在室温下，每孔加入100μl新制底物(50μl溶液A与50μl溶液B混合)，为时15分钟。反应用AmpliQ终止液终止，然后在15分钟内用分光光度计在490nm对该板读数(AmpliQ；DAKO DiagnosticsLtd.)。

实施例7：针对HIV-1 gp120的体液免疫应答

用间接ELISA测定抗HIV-1 gp120的抗体。在4℃，将CostarEIA/RIA强结合96孔板(Corning Inc.，Corning，NY)用100μl的5μg/ml抗gp120 C端的绵羊抗gp120抗体(International Enzymes，Inc.，Fallbrook，CA)的0.1M NaHCO₃(pH 9.6)包被过夜。然后用PBS洗涤，在室温下，通过加入5％脱脂奶、0.5％BSA的PBS而使其封闭2小时。在室温下，加入预滴定亚型C gp120上清液达1小时。然后，该板用PBST洗涤4次。加入免疫小鼠的连续稀释血清或合适的对照，并在室温下孵育1小时。该板如上所述进行洗涤，在室温下加入1∶10,000稀释的碱性磷酸酶标记的山羊抗小鼠IgG(Pharmingen BD)达30分钟。将该板用AmpliQ洗涤缓冲液(DAKO Diagnostics Ltd.)洗涤3次，用AmpliQ底物溶液显影，颜色反应用AmpliQ终止液终止，在15分钟内在490nm进行读数。

实施例8：小鼠IFNγ酶联免疫斑点测定

在第1天，加入1∶50稀释的捕获Ab(例如小鼠IFNγ)以及包被缓冲液(例如125μl的5ml包被缓冲液)，预包被酶联免疫斑点测定滤板。用100μl捕获Ab/包被缓冲液包被各孔，然后覆盖并在4℃孵育过夜。在第2天，收获细胞，该板用PBS-Tween洗涤4次。在37℃，各孔用R10(200μl/孔)封闭2小时。根据具体接种计划加入细胞(例如0.5-1.0×10⁶细胞/孔)。然后加入肽并在CO₂培养箱中在37℃孵育过夜。在第3天，各板用PBS-T洗涤5次，然后加入100μl/孔的1∶60稀释于1％BSA中的检测Ab。各板在4℃孵育过夜。在第4天，各板用PBS-T洗涤4次，然后加入以1∶60稀释于1％BSA中的100μl/孔SAP。各板在室温下孵育2小时，用PBS-T洗涤4次，随后用双蒸水洗涤1次。每孔含有100μl底物，然后在室温下避光孵育约15分钟或直到完全显色。这些板用自来水洗涤，充分干燥，目测免疫反应斑点。

已经在本发明的详细优选实施方案进行了描述，可以理解，所附权利要求书定义的本发明并不限于以上描述中给出的具体细节，因为可以在不违背本发明的精神或范围下对其进行的许多明显改变。本文所述方法和设备的修改和改变，对于本领域技术人员来说是显而易见的，并且将包括在所附权利要求书中。

参考文献

AIDS Epidemic Update，December 2002，Joint UNAIDS/WHO。

Aiken，C.，Konner，J.，Landau，N.R.，Lenburg，M.E.，Trono，D.：″Nef induces CD4 endocytosis：requirement for a critical dileucine motifin the membrane-proximal CD4 cytoplasmic domain(Nef诱导CD4胞吞作用：对膜近侧CD4胞质结构域中关键性二亮氨酸基序的要求)″.(1994)Cell 76(5)：853-64。

Allen，T.M.，Vogel，T.U.，Fuller，D.H.，Mothe，B.R.，Steffen，S.，Boyson，J.E.，Shipley，T.，Fuller，J.，Hanke，T.，Sette，A.，Altman，J.D.，Moss，B.，McMichael，A.J.和Watkins D.I.：″Induction of AIDS virus-specific CTL activity in fresh，unstimulated peripheral blood lymphocytesfrom rhesus macaques vaccinated with a DNA prime/modified vacciniavirus Ankara boost regimen(对来自用DNA初次/修饰痘苗病毒Ankara加强免疫方案免疫的恒河猴的新鲜、未受刺激的外周血淋巴细胞中爱滋病病毒特异性CTL活性的诱导)″.(2000)J.Immunol.164(9)：4968-78。

Altenburger，W.，美国专利第5,185,146号。

Altenburger，W.，Suter，C.P.和Altenburger，J.：″Partial deletion ofthe human host range gene in the attenuated vaccinia virus MVA(在减毒痘苗病毒MVA中人类宿主范围基因的部分缺失)″.(1989)Arch Virol.105(1-2)：15-27。

Amara，R.R.，Villinger，F.，Altman，J.D.，Lydy，S.L.，O′Neil，S.P.，Staprans，S.I.，Montefiori，D.C.，Xu，Y.，Hemdon，J.G.，Wyatt，L.S.，Candido，M.A.，Kozyr，N.L.，Earl，P.L.，Smith，J.M.，Ma，H.L.，Grimm，B.D.，Hulsey，M.L.，Miller，J.，McClure，H.M.，McNicholl，J.M.，Moss，B.，Robinson，H.L.：″Control of a mucosal challenge and prevention ofAIDS by a multiprotein DNA/MVA vaccine(用多蛋白DNA/MVA疫苗对粘膜攻击的控制和爱滋病的预防)″.(2001)Science 292(5514)：69-74。

Barnett，S.W.，Lu，S.Srivastava，I.Cherpelis，S.Gettie，A.Blanchard，J.Wang，S.Mboudjeka，I.Leung，L.Lian，Y.Fong，A.Buckner，C.Lv，A.Hilt，S.Ulmer，J.Wild，C.T.Mascola，J.R.和Stamatatos，L.：″The ability of an oligomeric human immunodeficiencyvirus type 1(HIV-1)envelope antigen to elicit neutralizing antibodiesagainst primary HIV-1 isolates is improved following partial deletion ofthe second hypervariable region(第2超变区部分缺失后，提高寡聚人免疫缺陷病毒1型(HIV-1)包膜抗原引发抗原代HIV-1分离株的中和抗体的能力)″.(2001)J.Virol.75：5526-40。

Barouch，D.H.，Santra，S.，Schmitz，J.E.，Kuroda，M.J.，Fu，T.M.，Wagner，W.，Bilska，M.，Craiu，A.，Zheng，X.X.，Krivulka，G.R.，Beaudry，K.，Lifton，M.A.，Nickerson，C.E.，Trigona，W.L.，Punt，K.，Freed，D.C.，Guan，L.，Dubey，S.，Casimiro，D.，Simon，A.，Davies，M.E.，Chastain，M.，Strom，T.B.，Gelman，R.S.，Montefiori，D.C.，Lewis，M.G.，Emini，E.A.，Shiver，J.W.和Letvin，N.L.：″Control of viremia andprevention of clinical AIDS in rhesus monkeys by cytokine-augmentedDNA vaccination(用增大细胞因子的DNA接种对恒河猴病毒血症的控制和临床爱滋病的预防)″.(2000)Science 290(5491)：486-92。

Barouch，D.H.，Santra，S.，Kuroda，M.J.，Schmitz，J.E.，Plishka，R.，Buckler-White，A.，Gaitan，A.E.，Zin，R.，Nam，J.H.，Wyatt，L.S.，Lifton，M.A.，Nickerson，C.E.，Moss，B.，Montefiori，D.C.，Hirsch，V.M.和Letvin，N.L.：″Reduction of simian-human immunodeficiency virus 89.6Pviremia in rhesus monkeys by recombinant modified vaccinia virusAnkara vaccination(用重组修饰痘苗病毒Ankara疫苗降低恒河猴的猿猴-人免疫缺陷病毒89.6P病毒血症)″.(2001)J Virol.75(11)：5151-8。

Bender，B.S.，Rowe，C.A.，Taylor，S.F.，Wyatt，L.S.，Moss，B.，Small，P.A.Jr.：″Oral immunization with a replication-deficientrecombinant vaccinia virus protects mice against influenza(复制缺陷型重组痘苗病毒口服免疫保护小鼠免患流感)″.(1996)J virol.70(9)：6418-24。

Beyrer，C.，Razak，M.H.，Lisam，K.，Chen，J.，Lui，W.和Yu，X.F.：″Overland heroin trafficking routes and HIV-1 spread in South andSoutheast Asia(陆路海洛因交易路线和HIV-1在南亚和东南亚的扩散)″.(2000)AIDS 14(1)：75-83。

Blanchard，T.J.，Alcami，A.，Andrea，P.和Smith，G.L.：″Modifiedvaccinia virus Ankara undergoes limited replication in human cells andlacks several immunomodulatory proteins：implications for use as ahuman vaccine(修饰痘苗病毒Ankara在人类细胞中经历有限复制并缺乏一些免疫调节蛋白：用作人用疫苗的意义)″.(1998)J Gen Virol.79(Pt 5)：1159-67。

Buttner，M.，Czerny，C.P.，Lehner，K.H.和Wertz，K.：″Interferoninduction in peripheral blood mononuclear leukocytes of man and farmanimals by poxvirus vector candidates and some poxvirus constructs(通过痘病毒载体候选者和一些痘病毒构建体在人和农场动物的外周血单核白细胞中的干扰素诱导)″.(1995)Vet Immunol Immunopathol.46(3-4)：237-50。

Chakrabarti，S.，Brechling，K.和Moss，B.：″Vaccinia virusexpression vector：coexpression of beta-galactosidase provides visualscreening of recombinant virus plaques(痘苗病毒表达载体：β-半乳糖苷酶共表达使得可以目测筛选重组病毒空斑)″.(1985)Mol.Cell.Biol.5(12)：3403-9。

Calarota，S.A.，Leandersson，A.C.，Bratt，G.，Hinkula，J.，Klinman，D.M.，Weinhold，K.J.，Sandstrom，E.和Wahren，B.：″Immune responsesin asymptomatic HIV-1-infected patients after HIV-DNA immunizationfollowed by highly active antiretroviral treatment(在HIV-DNA免疫后，用高活性抗逆转录病毒疗法，无症状HIV-1感染者中的免疫应答)″.(199)J Immunol.163(4)：2330-8。

Carvalho，L.H.，Hafalla，J.C.和Zavala F.：″ELISPOT assay tomeasure antigen-specific murine CD8(+)T cell responses(用酶联免疫斑点测定法来测量抗原特异性鼠CD8(+)T细胞应答)″.(2001)J ImmunolMethods.252(1-2)：207-18。

Chao，S.F.，Chan，V.L.，Juranka，P.，Kaplan，A.H.，Swanstrom，R.，Hutchison，C.A.3rd.：″Mutational sensitivity patterns define criticalresidues in the palm subdomain of the reverse transcriptase of humanimmunodeficiency virus type 1(突变敏感模式确定人免疫缺陷病毒1型逆转录酶的掌状亚结构域中的关键残基)″.(1995)Nucleic Acids Res.23(5)：803-10。

Cherpelis，S.，Jin，X.Gettie，A.Ho，D.D.，Barnett，S.W.Shrivastava，I.和Stamatatos，L.；″DNA-immunization with a V2 deleted HIV-1envelope elicits protective antibodies in macaques(用缺失V2的HIV-1包膜的DNA免疫在恒河猴中引发保护性抗体)″.(2001)Immunol Lett79：47-55。

Cherpelis，S.，Shrivastava，I.Gettie，A.Jin，X.Ho，D.D.Barnett，S.W.和Stamatatos L.：″DNA vaccination with the humanimmunodeficiency virus type 1 SF162DeltaV2 envelope elicits immuneresponses that offer partial protection from simian/humanimmunodeficiency virus infection to CD8(+)T-cell-depleted rhesusmacaques(含有人免疫缺陷病毒1型SF162δV2包膜的DNA疫苗引发免疫应答，给CD8(+)T细胞耗竭的恒河猴提供抗猿猴/人免疫缺陷病毒感染的部分保护性)″.(2001)J Virol 75：1547-50。

Coffin，JM Hughes，SM Varmus，HE，″Retroviruses″.(1997)ColdSpring Harbor Laboratory Press，第758-763页。

Collins，K.L.，Chen，B.K.，Kalams，S.A.，Walker，B.D.和Baltimore，D.：″HIV-1 Nef protein protects infected primary cells againstkilling by cytotoxic T lymphocytes(HIV-1 Nef蛋白保护感染原代细胞免于细胞毒性T淋巴细胞的杀伤)″.(1998)Nature 391(6665)：397-401。

Collins，K.L.和Baltimore，D.：″HIV′s evasion of the cellularimmune response(HIV逃避细胞免疫应答)″.(1999)Immunol Rev.168：65-74。

Donnelly，J.J.，Barnett，S.W.Dorenbaum，A.和Stamatatos，L.：″Envelope-based HIV vaccines(基于包膜的HIV疫苗)″.(2002)Science297：1277-8；discussion 1277-8。

Dorner，F.，美国专利第6,265,183号。

Dorner，F.，美国专利第5,445,953号。

Falkner，F.G.，美国专利第5,766,882号。

Friedmann，T.，美国专利第6,451,304号。

Friedmann，T.主编，The development of human gene therapy(1999)Cold Spring Harbor Press。

Garber，M.E.，Jones，K.A.：″HIV-1 Tat：coping with negativeelongation factors(HIV-1 Tat：用负延伸因子处理)″.(1999)Curr OpinImmunol.11(4)：460-5。

Girard M.：″Prospects for an AIDS vaccine(爱滋病疫苗展望)″.(1990)Cancer Detect Prev.14(3)：411-3。

Goldstein，G.：″HIV-1 Tat protein as a potential AIDS vaccine(HIV-1 Tat蛋白作为潜在的爱滋病疫苗)″.(1996)Nat Med.2(9)：960-4。

Garber，M.E.和Jones，K.A.：′HIV-1 Tat：coping with negativeelongation factors(HIV-1 Tat：用负延伸因子处理)′.(1999)Curr OpinImmunol.11(4)：460-5。

Haddad，D.，Liljeqvist，S.，Stahl，S.，Andersson，I.，Perlmann，P.，Berzins，K.和Ahlborg，N.：″Comparative study of DNA-basedimmunization vectors：effect of secretion signals on the antibodyresponses in mice(基于DNA的免疫载体的比较性研究：分泌信号对小鼠抗体应答的影响)″.(1997)FEMS Immunol Med Microbiol.18(3)：193-202。

Hanke，T.，Blanchard，T.J.，Schneider，J.，Ogg，G.S.，Tan，R.，Becker，M.，Gilbert，S.C.，Hill，A.V.，Smith，G.L.和McMichael，A.：″Immunogenicities of intravenous and intramuscular administrations ofmodified vaccinia virus Ankara-based multi-CTL epitope vaccine forhuman immunodeficiency virus type 1 in mice(静脉内和肌内给予基于修饰痘苗病毒Ankara的多CTL表位疫苗在小鼠中对于人免疫缺陷病毒1型的免疫原性)″.(1998)J Gen Virol.79(Pt1)：83-90。

Hanke，T.，Neumann，V.C.，Blanchard，T.J.，Sweeney，P.，Hill，A.V.，Smith，G.L.和McMichael，A.：″Effective induction of HIV-specificCTL by multi-epitope using gene gun in a combined vaccination regime(在联合疫苗方案中，使用基因枪，多表位有效诱导HIV特异性CTL)″.(1999)Vaccine.17(6)：589-96。

Hanke，T.，Samuel，R.V.，Blanchard，T.J.，Neumann，V.C.，Allen，T.M.，Boyson，J.E.，Sharpe，S.A.，Cook，N.，Smith，G.L.，Watkins，D.I.，Cranage，M.P.和McMichael，A.J.：″Effective induction of simianimmunodeficiency virus-specific cytotoxic T lymphocytes in macaques byusing a multiepitope gene and DNA prime-modified vaccinia virus Ankaraboost vaccination regimen(通过使用多表位基因和DNA初次-修饰痘苗病毒Ankara加强免疫方案，在恒河猴中有效诱导猿猴免疫缺陷病毒特异性细胞毒性T淋巴细胞)″.(1999)J Virol.73(9)：7524-32。

Haynes，B.F.：″HIV vaccines；where we are and where we are going(用V疫苗：目前的状况和未来的方向)″.(1996)Lancet.348(9032)：933-7。

Hirsch，V.M.，Fuerst，T.R.，Sutter，G.，Carroll，M.W.，Yang，L.C.，Goldstein，S.，Piatak，M.Jr，Elkins，W.R.，Alvord，W.G.，Montefiori，D.C.，Moss，B.和Lifson，J.D.：″Patterns of viral replication correlate withoutcome in simian immunodeficiency virus(SIV)-infected macaques：efiect of prior immunization with a trivalent SIV vaccine in modifiedvaccinia virus Ankara(病毒复制模式与猿猴免疫缺陷病毒(SIV)感染恒河猴的关系：在修饰痘苗病毒Ankara中用三价SIV疫苗的预先免疫效应)″.(1996)J Virol.70(6)：3741-52。

Hu，S.L.，Kosowski，S.G.和Dalrymple，J.M.：″Expression of AIDSvirus envelope gene in recombinant vaccinia viruses(爱滋病病毒包膜基因在重组痘苗病毒中的表达)″.(1986)Nature 320：537-40。

Jin，X.，Bauer，D.E.，Tuttleton，S.E.，Lewin，S.，Gettie，A.，Blanchard，J.，Irwin，C.E.，Safrit，J.T.，Mittler，J.，Weinberger，L.，Kostrikis，L.G.，Zhang，L.，Perelson，A.S.和Ho，D.D.：″Dramatic rise inplasma viremia after CD8(+)T cell depletion in simian immunodeficiencyvirus-infected macaques(在猿猴免疫缺陷病毒感染的恒河猴中，CD8(+)T细胞耗竭后，血浆病毒血症的显著升高)″.(1999)J Exp Med.189(6)：991-8。

Kimpton，J.和Emerman，M.：′Detection of replication-competent andpseudotyped human immunodeficiency virus with a sensitive cell line onthe basis of activation of an integrated beta-galactosidase gene(在激活整合的β-半乳糖苷酶基因的基础上，用敏感细胞系检测复制型和假型人免疫缺陷病毒)″.(1992)J Virol.66(4)：2232-9。

Kingsman，A.J.WO 99/41397。

Kotsopoulou，E.，Kim，V.N.，Kingsman，A.J.，Kingsman，S.M.和Mitrophanous，K.A.：″A Rev-independent human immunodeficiencyvirus type 1(HIV-1)-based vector that exploits a codon-optimized HIV-1gag-pol gene(利用密码子最优化HIV-1 gag-pol基因、基于Rev独立型人免疫缺陷病毒1型(HIV-1)的载体)″.(2000)J Virol.74(10)：4839-52。

Lewis，P.，Hensel，M.，Emerman，M.：″Human immunodeficiencyvirus infection of cells arrested in the cell cycle(感染人免疫缺陷病毒的细胞停滞在细胞周期中)″.(1992)EMBO J.11(8)：3053-8。

Lewis，P.F.和Emerman，M.：″Passage through mitosis is requiredfor oncoretroviruses but not for the human immunodeficiency virus(致癌逆转录病毒而不是人免疫缺陷病毒需要通过有丝分裂传代)″.(1994)JVirol.68(1)：510-6。

Li，Z.，Howard，A.，Kelley，C.，Delogu，G.，Collins，F.和Morris，S.：″Immunogenicity of DNA vaccines expressing tuberculosis proteins fusedto tissue plasminogen activator signal sequences(表达与组织纤溶酶原激活物信号序列融合的结核病蛋白的DNA疫苗的免疫原性)″.(1999)Infect Immun.67(9)：4780-6。

Lieberman，H.A.Pharmaceutical dosage forms(1991)MarcelDekker第1-3卷。

Allen，L.V.，Lachman，L.，Schwartz，J.B.，(1999)The Art，Science，and Technology of Pharmaceutical Compounding。

Loeb，D.D.，Swanstrom，R.，Everitt，L.，Manchester，M.，Stamper，S.E.和Hutchison，C.A.3rd.：″Complete mutagenesis of the HIV-1 protease(HIV-1蛋白酶的完全诱变)″.(1989)Nature 340(6232)：397-400。

Ly，A.和Stamatatos，L.：″V2 loop glycosylation of the humanimmunodeficiency virus type 1 SF162 envelope facilitates interaction ofthis protein with CD4 and CCR5 receptors and protects the virus fromneutralization by anti-V3 loop and anti-CD4 binding site antibodies(人免疫缺陷病毒1型SF162包膜的V2环糖基化促进该蛋白与CD4和CCR5受体的相互作用，并保护病毒免于抗V3环和抗CD4结合位点抗体的中和作用)″.(2001)J Virol 74：6769-76。

Martinez-Salas，E.：″Internal ribosome entry site biology and its usein expression vectors(内部核糖体进入位点的生物学及其在表达载体中的应用)″.(1999)Curr Opin Biotechnol.10(5)：458-64。

Mayr，A.和Danner，K.：″Vaccination against pox diseases underimmunosuppressive conditions(免疫抑制条件下的抗痘病疫苗)″.(1978)Dev Biol Stand 41：225-34。

Mayr，A.，Stickl，H.，Muller，H.K.，Danner，K.和Singer，H.：″Thesmallpox vaccination strain MVA：marker，genetic structure，experiencegained with the parenteral vaccination and behavior in organisms with adebilitated defence mechanism(天花疫苗株MVA：标记、遗传结构、胃肠外接种的经验以及在具有弱化防御机制的生物体中的行为)″.(1978)Zentralbl Bakteriol[B].167(5-6)：375-90。

McMichael，A.J.和Rowland-Jones，S.L.：″Cellular immuneresponses to HIV(抗HIV的细胞免疫应答)″.(2001)Nature.410(6831)：980-7。

Men，R.，Wyatt，L.Tokimatsu，I.Arakaki，S.Shameem，G.Elkins，R.Chanock，R.Moss，B.和Lai，C.J.：″Immunization of rhesus monkeys witha recombinant of modified vaccinia virus Ankara expressing a truncatedenvelope glycoprotein of dengue type 2 virus induced resistance to denguetype 2 virus challenge(用表达登革2型病毒的截短包膜糖蛋白的修饰痘苗病毒Ankara重组株免疫恒河猴，诱导对登革2型病毒攻击的抗性)″.(2000)Vaccine 18：3113-22。

Merchlinsky，M.和Moss，B.：″Introduction of foreign DNA into thevaccinia virus genome by in vitro ligation：recombination-independentselectable clonihg vectors(将外源DNA经体外连接引入痘苗病毒基因组：重组独立型选择性克隆载体)″.(1992)Virology 190(1)：522-6.

Meyer，H.，Sutter，G.和Mayr，A.：″Mapping of deletions in thegenome of the highly attenuated vaccinia virus MVA and their influenceon virulence(高减毒痘苗病毒MVA的基因组缺失作图及其对毒力的影响)″.(1991)J Gen Virol.72(Pt 5)：1031-8。

Moss，B.，美国专利第5,866,383号。

Moss，B.，Carroll，M.W.，Wyatt，L. S.，Bennink，J.R.，Hirsch，V.M.，Goldstein，S.，Elkins，W.R.，Fuerst，T.R.，Lifson，J.D.，Piatak，M.，Restifo，N.P.，Overwijk，W.，Chamberlain，R.，Rosenberg，S.A.和Sutter，G.：″Host range restricted，non-replicating vaccinia virus vectors as vaccinecandidates.(宿主范围受限的、非复制型痘苗病毒载体作为疫苗候选者)″.(1996)Adv Exp Med Biol.397：7-13。

Moss B.：″Genetically engineered poxviruses for recombinant geneexpression，vaccination，and safety(遗传工程化痘病毒用于重组基因表达、疫苗接种和安全性)″.(1996)Proc Natl Acad Sci USA.93(21)：11341-8。

Najjar，S.M.和Lewis，R.E.：′Persistent expression of foreign genesin cultured hepatocytes： expression vectors.(外源基因在培养肝细胞中的持续表达：表达载体)″.(1999)Gene.230(1)：41-5。

Nishimura，Y.，Kamei，A.，Uno-Furuta，S.，Tamaki，S.，Kim，G.，Adachi，Y.，Kuribayashi，K.，Matsuura，Y.，Miyamura，T.，Yasutomi，Y.：″A single immunization with a plasmid encoding hepatitis C virus(HCV)structural proteins under the elongation factor 1-alpha promoter elicitsHCV-specific cytotoxic T-lymphocytes(CTL)(用编码丙型肝炎病毒(HCV)结构蛋白且处于延伸因子1-α启动子控制之下的质粒，进行单次免疫接种，引发HCV特异性细胞毒性T淋巴细胞(CTL))″.(1999)Vaccine 18(7-8)：675-80。

Novitsky，V.，Rybak，N.，McLane，M.F.，Gilbert，P.，Chigwedere，P.，Klein，I.，Gaolekwe，S.，Chang，S.Y.，Peter，T.，Thior，I.，Ndung′u，T.，Vannberg，F.，Foley，B.T.，Marlink，R.，Lee，T.H.和Essex，M.：″Identification of human immunodeficiency virus type 1 subtype C Gag-，Tat-，Rev-，and Nef-specific elispot-based cytotoxic T-lymphocyteresponses for AIDS vaccine design(基于人免疫缺陷病毒1型的亚型CGag-，Tat-，Rev-和Nef-特异性酶联免疫斑点测定的细胞毒性T淋巴细胞应答的鉴定，用于爱滋病疫苗设计)″.(2001)J Virol.75(19)：9210-28。

Ogg，G.S.，Jin，X.，Bonhoeffer，S.，Dunbar，P.R.，Nowak，M.A.，Monard，S.，Segal，J.P.，Cao，Y.，Rowland-Jones，S.L.，Cerundolo，V.，Hurley，A.，Markowitz，M.，Ho，D.D.，Nixon，D.F.和McMichael，A.J.：″Quantitation of HIV-1-specific cytotoxic T lymphocytes and plasma loadof viral RNA(HIV-1特异性细胞毒性T淋巴细胞和血浆中病毒RNA载量的定量测定)″.(1998)Science 279(5359)：2103-6。

Ourmanov，I.，Brown，C.R.Moss，B.Carroll，M.Wyatt，L.Pletneva，L.Goldstein，S.Venzon，D.和Hirsch，V.M.：″Comparative efficacy ofrecombinant modified vaccinia virus Ankara expressing simianimmunodeficiency virus(SIV)Gag-Pol and/or Env in macaqueschallenged with pathogenic SIV(表达猿猴免疫缺陷病毒(SIV)Gag-Pol和/或Env的重组修饰痘苗病毒Ankara在用致病性SIV攻击的恒河猴中的比较功效)″.(2000)J Virol 74：2740-51。

Paoletti，E.，美国专利第5,972,708号。

Paoletti，E.，美国专利第6,340,462号。

Paoletti，E.，美国专利第5,972,597号。

Paoletti，E.，美国专利第5,225,336号。

Paoletti，E.，美国专利第5,204,243号。

Paoletti，E.，美国专利第5,155,020号。

Paoletti，E.，美国专利第5,110,587号。

Paoletti，E.，美国专利第4,769,330号。

Paoletti，E.，美国专利第4,722,848号。

Paoletti，E.，美国专利第4,603,112号。

Paoletti，E.，美国专利第6,596,279号。

Paoletti，E.，美国专利第5,762,938号。

Paoletti，E.，美国专利第5,453,364号。

Paoletti，E.，美国专利第5,378,457号。

Paoletti，E.，美国专利第5,364,773号。

Paoletti，E.，美国专利第5,863,542号。

Paoletti，E.，美国专利第5,766,598号。

Paoletti，E.，美国专利第5,756,103号。

Paoletti，E.，美国专利第5,494,807号。

Paoletti，E.，美国专利第5,364,773号。

Paoletti，E.，美国专利第4,769,330号。

Paoletti，E.，美国专利第5,155,020号。

Paoletti，E.，美国专利第5,204,243号。

Paoletti E.：″Applications of poxvirus vectors to vaccination：anupdate(目前疸病毒载体在免疫接种中的应用)″.(1996)Proc Natl AcadSci USA.93(21)：11349-53。

Pfleiderer，M.，Falkner，F.G.和Dorner，F.：″A novel vaccinia virusexpression system allowing construction of recombinants without the needfor selection markers，plasmids and bacterial hosts(一种容许构建重组体而无需选择性标记、质粒和细菌宿主的新型痘苗病毒表达系统)″.(1995)J Gen Virol.76(Pt 12)：2957-62。

Pickar，G.D.Dosage Calculations(1999)Delmar Learning，第6版。

Piyasirisilp，S.，McCutchan，F.E.，Carr，J.K.，Sanders-Buell，E.，Liu，W.，Chen，J.，Wagner，R.，Wolf，H.，Shao，Y，Lai，S.，Beyrer，C.和Yu，X.F.：″A recent outbreak of human immunodeficiency virus type 1 infectionin southern China was initiated by two highly homogeneousgeographically separated strains，circulating recombinant form AE and anovel BC recombinant(中国南部地区近期爆发的人免疫缺陷病毒1型感染是由2种高度同源的地理分隔株即循环重组型AE和一种新型BC重组株引起)″.(2000)J.Virol.74(23)：11286-95。

Qiu，J.T.，Liu，B.，Tian，C.，Pavlakis，G.N.和Yu，X.F.：″Enhancement of primary and secondary cellular immune responsesagainst human immunodeficiency virus type 1 gag by using DNAexpression vectors that target Gag antigen to the secretory pathway(通过使用使Gag抗原靶向分泌途径的DNA表达载体，增强抗人免疫缺陷病毒1型gag的初级和次级细胞免疫应答)″.(2000)J Virol.74(13)：5997-6005。

Remington′s Pharmaceutical Sciences，第17版(1989)MackPublishing。

Robinson，H.L.，Montefiori，D.C.，Johnson，R.P.，Manson，K.H.，Kalish，M.L.，Lifson，J.D.，Rizvi，T.A.，Lu，S.，Hu，S.L.，Mazzara，G.P.，Panicali，D.L.，Herndon，J.G.，Glickman，R.，Candido，M.A.，Lydy，S.L.，Wyand，M.S.和McClure，H.M.：″Neutralizing antibody-independentcontainment of immunodeficiency virus challenges by DNA priming andrecombinant pox virus booster immunizations(DNA初次免疫和重组痘病毒加强免疫对免疫缺陷病毒攻击的中和抗体独立性保护)″.(1999)Nat Med.5(5)：526-34。

Sambrook，V.，Fritsch，E.F.和Maniatis，T.，Molecular Cloning：ALaboratory Manual第2版(1989)Cold Spring Harbor LaboratoryPress。

Schmitz，J.E.，Kuroda，M.J.，Santra，S.，Sasseville，V.G.，Simon，M.A.，Lifton，M.A.，Racz，P.，Tenner-Racz，K.，Dalesandro，M.，Scallon，B.J.，Ghrayeb，J.，Forman，M.A.，Montefiori，D.C.，Rieber，E.P.，Letvin，N.L.和Reimann，K.A.：″Control of viremia in simian immunodeficiencyvirus infection by CD8+lymphocytes(在猿猴免疫缺陷病毒感染中CD8+淋巴细胞对病毒血症的控制)″.(1999)Science 283(5403)：857-60。

Schneider，R.，Campbell，M.，Nasioulas，G.，Felber，B.K.和Pavlakis，G.N.：″Inactivation of the human immunodeficiency virus type 1inhibitory elements allows Rev-independent expression of Gag andGag/protease and particle formation(人免疫缺陷病毒1型抑制元件的失活允许Rev独立性表达Gag和Gag/蛋白酶和颗粒形成)″.(1997)JVirol.71(7)：4892-903。

Sodroski，J.G.，美国专利第5,665,577号。

Spira，S.，Wainberg，M.A.，Loemba，H.，Turner，D.和Brenner，B.G.：″Impact of clade diversity on HIV-1 virulence，antiretroviral drugsensitivity and drug resistance(基因亚型多样性对HIV-1毒力、抗逆转录病毒药物敏感性和抗药性的影响)″.(2003)J Antimicrob Chemother.51(2)：229-40。

Stamatatos，L.，Lim，M.和Cheng-Mayer，C.：″Generation andstructural analysis of soluble oligomeric gp140 envelope proteins derivedfrom neutralization-resistant and neutralization-susceptible primary HIVtype 1 isolates(来自中和作用抗性和中和作用敏感性的原代HIV-1型分离株的可溶性寡聚gp140包膜蛋白的产生和结构分析)″.(2000)AIDS Res Hum Retroviruses 16：981-94。

Stickl，H.，Hochstein-Mintzel，V.Mayr，A.Huber，H.C.Schafer，H.和Holzner，A.：″MVA vaccination against smallpox：clinical tests with anattenuated live vaccinia virus strain(MVA)(抗天花的MVA疫苗：用减毒活痘苗病毒株(MVA)的临床试验)(author′s transl)″.(1974)DtschMed Wochenschr 99：23 86-92。

Sutter，G.和Moss，B.：″Nonreplicating vaccinia vector efficientlyexpresses recombinant genes(非复制型痘苗病毒载体有效表达重组基因)″.(1992)Proc Natl Acad Sci USA.89(22)：10847-51。

Sutter，G.，Wyatt，L.S.Foley，P.L.Bennink，J.R.和Moss，B.：″Arecombinant vector derived from the host range-restricted and highlyattenuated MVA strain of vaccinia virus stimulates protective immunity inmice to influenza virus(一种来自宿主范围局限性和高度减毒痘苗病毒MVA株的重组载体刺激小鼠产生抗流感病毒的保护性免疫)″.(1994)Vaccine 12：1032-40。

Takahashi，H.，Cohen，J.Hosmalin，A.Cease，K.B.Houghten，R.Cornette，J.L.DeLisi，C.Moss，B.Germain，R.N.和Berzofsky，J.A.：″An immunodominant epitope of the human immunodeficiency virusenvelope glycoprotein gp160 recognized by class I majorhistocompatibility complex molecule-restricted murine cytotoxic Tlymphocytes(一种人免疫缺陷病毒包膜糖蛋白gp160的优势免疫表位，被I类主要组织相容性复合物分子一限制性鼠细胞毒性T淋巴细胞所识别)″.(1988)Proc Natl Acad Sci USA 85：3105-9。

Tang，D.C.，Devit，M.，Johnston，S.A.：″Genetic Immunization is aSimple Method for Eliciting an Immune Response(遗传免疫是引发免疫应答的简单方法)″.(1992)Nature 356：152-154。

Tobery，T.W.，Wang，S.，Wang，X.M.，Neeper，M.P.，Jansen，K.U.，McClements，W.L.和Caulfield，M.J.：″A simple and efficient method torthe monitoring of antigen-specific T cell responses using peptide poolarrays in a modified ELISpot assay(一种简单而有效的监测抗原特异性T细胞应答的方法，在改良酶联免疫斑点测定法中采用肽库阵列)″.(2001)J Immunol Methods.254(1-2)：59-66。

Wakefield，J.K.，Jablonski，S.A.和Morrow，C.D.：″In vitroenzymatic activity of human immunodeficiency virus type 1 reversetranscriptase mutants in the highly conserved YMDD amino acid motifcorrelates with the infectious potential of the proviral genome(在高度保守YMDD氨基酸基序中人免疫缺陷病毒1型逆转录酶突变体的体外酶活性与原病毒基因组感染潜力有关)″.(1992)J Virol.66(11)：6806-12。

Walker，S.，Sofia，M.J.，Kakarla，R.，Kogan，N.A.，Wierichs，L.，Longley，C.B.，Bruker，K.，Axelrod，H.R.，Midha，S.，Babu，S.和Kahne，D.：″Cationic facial amphiphiles：a promising class of transfection agents(阳离子表面两亲性化合物：一类有希望的转染剂)″.(1996)Proc NatlAcad Sci USA.93(4)：1 585-90。

Wallich，R.，Siebers，A.，Jahraus，O.，Brenner，C.，Stehle，T.和Simon，M.M.：″DNA vaccines expressing a fusion product of outer surfaceproteins A and C from Borrelia burgdofferi induce protective antibodiessuitable for prophylaxis but Not for resolution of Lyme disease(表达来自布氏疏螺旋体外表面蛋白A和C的融合产物的DNA疫苗诱导适用于预防但不能用于消除莱姆病的保护性抗体)″.(2001)Infect Immun.69(4)：2130-6。

Weiss，R.，Durnberger，J.，Mostbock，S.，Scheiblhofer，S.，Hartl，A.，Breitenbach，M.，Strasser，P.，Dorner，F.，Livey，I.，Crowe，B.和Thalhamer，J.：″Improvement of the immune response against plasmidDNA encoding OspC of Borrelia by an ER-targeting leader sequence(用靶向ER的前导序列提高抗编码疏螺旋体的OspC的质粒DNA的免疫应答)″.(1999)Vaccine 18(9-10)：815-24。

Williams，S.G.，Cranenburgh，R.M.，Weiss，A.M.，Wrighton，C.J.，Sherratt，D.J.和Hanak，J.A.：″Repressor titration：a novel system forselection and stable maintenance of recombinant plasmids(阻抑蛋白滴定：一个用于选择和稳定保持重组质粒的新系统)″.(1998)NucleicAcids Res.26(9)：2120-4。

Yu，X.F.，Liu，W.，Chen，J.，Kong，W.，Liu，B.，Yang，J.，McCutchan，F.，Piyasirisilp，S.，Lai，S.：″Rapid dissemination of a novel B/Crecombinant HIV-1 among injection drug users in southern China(新型B/C重组HIV-1在中国南部地区注射吸毒者中的快速扩散)″.(2001)AIDS 15(4)：523-5。

序列表

<110>艾伦·戴蒙德研究所(Aaron Diamond Institute)

<120>用于抗HIV-1免疫的方法和组合物

<130>678501-2001.WO

<160>41

<170>PatentIn version 3.2

<210>1

<211>23

<212>PRT

<213>人工序列

<220>

<223>片段

<400>1

Met Asp Ala Met Lys Arg Gly Leu Cys Cys Val Leu Leu Leu Cys Gly

1 5 10 15

Ala Val Phe Val Ser Ala Arg

20

<210>2

<211>9

<212>PRT

<213>人工序列

<220>

<223>片段

<400>2

Ala Met Gly Met Leu Lys Asp Thr Ile

1 5

<210>3

<211>20

<212>PRT

<213>人工序列

<220>

<223>片段

<400>3

Val Pro Val Trp Lys Glu Ala Lys Thr Thr Leu Phe Cys Ala Ser Asp

1 5 10 15

Ala Lys Ala Tyr

20

<210>4

<211>20

<212>PRT

<213>人工序列

<220>

<223>片段

<400>4

Arg Asn Val Ser Ser Asp Gly Thr Tyr Asn Glu Thr Tyr Asn Glu Ile

1 5 10 15

Lys Asn Cys Ser

20

<210>5

<211>20

<212>PRT

<213>人工序列

<220>

<223>片段

<400>5

Thr Ser Asn Pro Pro Ile Pro Val Gly Asp Ile Tyr Lys Arg Trp Ile

1 5 10 15

Ile Leu Gly Leu

20

<210>6

<211>9

<212>PRT

<213>人工序列

<220>

<223>片段

<400>6

Ala Met Gln Met Leu Lys Asp Thr Ile

1 5

<210>7

<211>2520

<212>DNA

<213>人(Homo sapiens)

<400>7

atggatgcaa tgaagagagg gctctgctgt gtgctgctgc tgtgtggagc agtcttcgtt 60

agcgccgccg agaacttgtg ggtgaccgtg tactacggcg tgcccgtgtg gaaggaggcc 120

aagaccaccc tgttctgcgc ctccgacgcc aaggcctacg agaaggaggt gcacaacgtg 180

tgggccaccc acgcctgcgt gcccaccgac cccaaccccc aggagatggt gttggagaac 240

gtgaccgaga acttcaacat gtggaagaac gacatggtga accagatgca cgaggacgtc 300

atcagcttgt gggaccagag cctgaagccc tgcgtgaagt tgacccccct gtgcgtgacc 360

ttggagtgca ggaacgtgag cagcaacggc acctacaacg agacctacaa cgagatcaag 420

aactgctcct tcaacgccac caccgtgttg agggacagga agcagaccgt gtacgccctg 480

ttctacaggc tggacatcgt gcccctgaac aagaagaact ccagcgagaa ctccagcgag 540

tactacaggt tgatcaactg caacacctcc gccatcaccc aggcctgccc caaggtgacc 600

ttcgacccca tccccatcca ctactgcacc cccgccggct acgccatcct gaagtgcaac 660

gacaagacct tcaacggcac cggcccctgc cacaacgtga gcaccgtgca gtgcacccac 720

ggcatcaagc ccgtggtgtc cacccagctg ctgttgaacg gcagcctggc cgagagggag 780

atcatcatca ggtccgagaa cctgaccaac aacgtgaaga ccatcatcgt gcacctgaac 840

cagtccgtgg agatcgtgtg caccaggccc aacaacaaca ccaggaagag catcaggatc 900

ggccccggcc agaccttcta cgccaccggc gacatcatcg gcgacatcag gcaggcccac 960

tgcaacatca gcaaggacaa gtggaaggag accttgcaga gggtgggcaa gaagttggcc 1020

gagcacttcc ccaacaaagc catcgagttc gcctcctcct ccggcggcga cctggagatc 1080

accacccaca gcttcaactg caggggcgag ttcttctact gcaacacctc cagcctgttc 1140

aacggcacct acatgcccaa cggcaccgag ggcaactcca gctccatcat caccatcccc 1200

tgcaggatca agcagatcat caacatgtgg caggaggtgg gccgcgccat gtacgccccc 1260

cccatcgagg gcaacatcac ctgcaagtcc aacatcaccg gcctgctgtt ggtgcgcgac 1320

ggcggcaagg agaccaacga caccgagacc ttcaggcccg gcggcggcga catgagggac 1380

aactggagga gcgagttgta caagtacaag gtggtggaga tcaagccctt gggcatcgcc 1440

cccaccgccg ccaagaggag ggtggtggag agggagaaga gggccgtggg catcggcgcc 1500

gtgttcctgg gcttcctggg cgccgccggc agcaccatgg gcgccgccag catcaccctg 1560

accgtgcagg cccgccagct gctgagcggc atcgtgcagc agcagagcaa cctgctgcgc 1620

gccatcgagg cccagcagca cctgctgcag ctgaccgtgt ggggcatcaa gcagctgcag 1680

acccgcgtcc tggccatcga gcgctacctg aaggaccagc agctgctggg catctggggc 1740

tgcagcggca agctgatctg caccaccgcc gtgcactgga acagcagctg gagcaaccgc 1800

agccaggagg agatctggaa caacatgacc tggatgcagt gggaccgcga gatcagcaac 1860

tacaccaaca ccatctaccg cctgctggag gacagccaga accagcagga gcgcaacgag 1920

aaggacctgc tggccctgga caactggaag aacctgtgga gctggttcga catcaccaac 1980

tggctgtggt acatccgcat cttcatcatg atcgtgggcg gcctgatcgg cctgcgcatc 2040

atcttcgccg tgctgagcat cgtgaaccgc gtgcgccagg gctacagccc cctgagcttc 2100

cagaccctga cccccaaccc cggcggcccc gaccgcctgg gccgcatcga ggaggagggc 2160

ggcgagcagg acaagaaccg cagcatccgc ctggtgaacg gcttcctggc cctggcctgg 2220

gacgacctgc gcaacctgtg ccgcttcagc taccacctgc tgcgcgacct gctgctgatc 2280

gtggcccgca tcgtggagct gctgggccgc cgcggctggg aggccctgcg ctactggtgg 2340

aacctgctga agtactgggt gcaggagctg aagaacagcg ccgtgagcct gctgaacgcc 2400

accgccatcg ccgtggccga gggcaccgac cgcgtgatcg aggtggtgca gggcgcctac 2460

cgcgccatcc tgcacatccc ccgccgcatc cgccagggct tcgaggccgc cctgcagtaa 2520

<210>8

<211>839

<212>PRT

<213>人(Homo sapiens)

<400>8

Met Asp Ala Met Lys Arg Gly Leu Cys Cys Val Leu Leu Leu Cys Gly

1 5 10 15

Ala Val Phe Val Ser Ala Ala Glu Asn Leu Trp Val Thr Val Tyr Tyr

20 25 30

Gly Val Pro Val Trp Lys Glu Ala Lys Thr Thr Leu Phe Cys Ala Ser

35 40 45

Asp Ala Lys Ala Tyr Glu Lys Glu Val His Asn Val Trp Ala Thr His

50 55 60

Ala Cys Val Pro Thr Asp Pro Asn Pro Gln Glu Met Val Leu Glu Asn

65 70 75 80

Val Thr Glu Asn Phe Asn Met Trp Lys Asn Asp Met Val Asn Gln Met

85 90 95

His Glu Asp Val Ile Ser Leu Trp Asp Gln Ser Leu Lys Pro Cys Val

100 105 110

Lys Leu Thr Pro Leu Cys Val Thr Leu Glu Cys Arg Asn Val Ser Ser

115 120 125

Asn Gly Thr Tyr Asn Glu Thr Tyr Asn Glu Ile Lys Asn Cys Ser Phe

130 135 140

Asn Ala Thr Thr Val Leu Arg Asp Arg Lys Gln Thr Val Tyr Ala Leu

145 150 155 160

Phe Tyr Arg Leu Asp Ile Val Pro Leu Asn Lys Lys Asn Ser Ser Glu

165 170 175

Asn Ser Ser Glu Tyr Tyr Arg Leu Ile Asn Cys Asn Thr Ser Ala Ile

180 185 190

Thr Gln Ala Cys Pro Lys Val Thr Phe Asp Pro Ile Pro Ile His Tyr

195 200 205

Cys Thr Pro Ala Gly Tyr Ala Ile Leu Lys Cys Asn Asp Lys Thr Phe

210 215 220

Asn Gly Thr Gly Pro Cys His Asn Val Ser Thr Val Gln Cys Thr His

225 230 235 240

Gly Ile Lys Pro Val Val Ser Thr Gln Leu Leu Leu Asn Gly Ser Leu

245 250 255

Ala Glu Arg Glu Ile Ile Ile Arg Ser Glu Asn Leu Thr Asn Asn Val

260 265 270

Lys Thr Ile Ile Val His Leu Asn Gln Ser Val Glu Ile Val Cys Thr

275 280 285

Arg Pro Asn Asn Asn Thr Arg Lys Ser Ile Arg Ile Gly Pro Gly Gln

290 295 300

Thr Phe Tyr Ala Thr Gly Asp Ile Ile Gly Asp Ile Arg Gln Ala His

305 310 315 320

Cys Asn Ile Ser Lys Asp Lys Trp Lys Glu Thr Leu Gln Arg Val Gly

325 330 335

Lys Lys Leu Ala Glu His Phe Pro Asn Lys Thr Ile Glu Phe Ala Ser

340 345 350

Ser Ser Gly Gly Asp Leu Glu Ile Thr Thr His Ser Phe Asn Cys Arg

355 360 365

Gly Glu Phe Phe Tyr Cys Asn Thr Ser Ser Leu Phe Asn Gly Thr Tyr

370 375 380

Met Pro Asn Gly Thr Glu Gly Asn Ser Ser Ser Ile Ile Thr Ile Pro

385 390 395 400

Cys Arg Ile Lys Gln Ile Ile Asn Met Trp Gln Glu Val Gly Arg Ala

405 410 415

Met Tyr Ala Pro Pro Ile Glu Gly Asn Ile Thr Cys Lys Ser Asn Ile

420 425 430

Thr Gly Leu Leu Leu Val Arg Asp Gly Gly Lys Glu Thr Asn Asp Thr

435 440 445

Glu Thr Phe Arg Pro Gly Gly Gly Asp Met Asp Asp Asn Trp Arg Ser

450 455 460

Glu Leu Tyr Lys Tyr Lys Val Val Glu Ile Lys Pro Leu Gly Ile Ala

465 470 475 480

Pro Thr Ala Ala Lys ArgArg Val Val Glu Arg Glu Lys Arg Ala Val

485 490 495

Gly Ile Gly Ala Val Phe Leu Gly Phe Leu Gly Ala Ala Gly Ser Thr

500 505 510

Met Gly Ala Ala Ser Ile Thr Leu Thr Val Gln Ala Arg Gln Leu Leu

515 520 525

Ser Gly Ile Val Gln Gln Gln Ser Asn Leu Leu Arg Ala Ile Glu Ala

530 535 540

Gln Gln His Leu Leu Gln Leu Thr Val Trp Gly Ile Lys Gln Leu Gln

545 550 555 560

Thr Arg Val Leu Ala Ile Glu Arg Tyr Leu Lys Asp Gln Gln Leu Leu

565 570 575

Gly Ile Trp Gly Cys Ser Gly Lys Leu Ile Cys Thr Thr Ala Val His

580 585 590

Trp Asn Ser Ser Trp Ser Asn Arg Ser Gln Glu Glu Ile Trp Asn Asn

595 600 605

Met Thr Trp Met Gln Trp Asp Arg Glu Ile Ser Asn Tyr Thr Asn Thr

610 615 620

Ile Tyr Arg Leu Leu Glu Asp Ser Gln Asn Gln Gln Glu Arg Asn Glu

625 630 635 640

Lys Asp Leu Leu Ala Leu Asp Asn Trp Lys Asn Leu Trp Ser Trp Phe

645 650 655

Asp Ile Thr Asn Trp Leu Trp Tyr Ile Arg Ile Phe Ile Met Ile Val

660 665 670

Gly Gly Leu Ile Gly Leu Arg Ile Ile Phe Ala Val Leu Ser Ile Val

675 680 685

Asn Arg Val Arg Gln Gly Tyr Ser Pro Leu Ser Phe Gln Thr Leu Thr

690 695 700

Pro Asn Pro Gly Gly Pro Asp Arg Leu Gly Arg Ile Glu Glu Glu Gly

705 710 715 720

Gly Glu Gln Asp Lys Asn Arg Ser Ile Arg Leu Val Asn Gly Phe Leu

725 730 735

Ala Leu Ala Trp Asp Asp Leu Arg Asn Leu Cys Arg Phe Ser Tyr His

740 745 750

Leu Leu Arg Asp Leu Leu Leu Ile Val Ala Arg Ile Val Glu Leu Leu

755 760 765

Gly Arg Arg Gly Trp Glu Ala Leu Arg Tyr Trp Trp Asn Leu Leu Lys

770 775 780

Tyr Trp Val Gln Glu Leu Lys Asn Ser Ala Val Ser Leu Leu Asn Ala

785 790 795 800

Thr Ala Ile Ala Val Ala Glu Gly Thr Asp Arg Val Ile Glu Val Val

805 810 815

Gln Gly Ala Tyr Arg Ala Ile Leu His Ile Pro Arg Arg Ile Arg Gln

820 825 830

Gly Phe Glu Ala Ala Leu Gln

835

<210>9

<211>1545

<212>DNA

<213>人(Homo sapiens)

<400>9

atggacgcca tgaagcgcgg cctgtgctgc gtgctgctgc tgtgcggcgc cgtgttcgtg 60

agcgcccgca tgggcgcccg cgccagcatc ctgcgcggcg gcaagctgga caagtgggag 120

aagatccgcc tgcgccccgg cggcaagaag cactacatgc tgaagcacct ggtgtgggcc 180

agccgcgagc tggagcgctt cgccctgaac cccggcctgc tggagaccag cgagggctgc 240

aagcagatca tcaagcagct gcagcccgcc ctgcagaccg gcaccgagga gctgcgcagc 300

ctgttcaaca ccgtggccac cctgtactgc gtgcacgagg gcatcgagat ccgcgacacc 360

aaggaggccc tggacaagat cgaggaggag cagaacaaga tccagcagaa gacccagcag 420

gccaagaagg ccgacgagaa ggtgagccag aactacccca tcgtgcagaa cctgcagggc 480

cagatggtgc accaggccat ctcccccagg accttgaacg cctgggtgaa ggtgatcgag 540

gagaaggcct tcagccccga ggtgatcccc atgttcaccg ccttgtccga gggcgccacc 600

ccccaggact tgaacaccat gttgaacacc gtgggcggcc accaggccgc catgcagatg 660

ttgaaggaca ccatcaacga ggaggccgcc gagtgggaca gggtgcaccc cgtgcacgcc 720

ggccccatcg cccccggcca gatgagggag cccaggggca gcgacatcgc cggcaccacc 780

agcaccctgc agggccagat cgcctggatg accagcaacc cccccgtgcc cgtgggcgag 840

atctacaaga ggtggatcat cctgggcttg aacaagatcg tgaggatgta cagccccgtg 900

agcatcttgg acatcaagca gggccccaag gagcccttca gggactacgt ggaccgcttc 960

ttcaagacct tgagggccga gcaggccacc caggacgtga agaactggat gaccgacacc 1020

ttgttggtgc agaacgccaa ccccgactgc aagaccatct tgagggcctt gggccccggc 1080

gcctccttgg aggagatgat gaccgcctgc cagggcgtgg gcggccccag ccacaaggcc 1140

agggtgttgg ccgaggccat gagccaggcc aacggcacca tcctgatgca gaggagcaac 1200

ttcaagggct ccaagaggat cgtgaagtgc ttcaactgcg gcaaggaggg ccacatcgcc 1260

aggaactgca gggcccccag gaagaagggc tgctggaagt gcggcaagga gggccaccag 1320

atgaaggact gcaccgagag gcaggccaac ttcttgggca agatctggcc ctcccacaag 1380

ggcaggcccg gcaacttcct gcagagcagg cccgagccca ccgccccccc cgccgagagc 1440

ttcaggttcg aggagaccac ccccgccccc aagcaggagc ccaaggacag ggagcccttg 1500

acctccctga agtccctgtt cggcagcgac cccttgtccc agtaa 1545

<210>10

<211>514

<212>PRT

<213>人(Homo sapiens)

<400>10

Met Asp Ala Met Lys Arg Gly Leu Cys Cys Val Leu Leu Leu Cys Gly

1 5 10 15

Ala Val Phe Val Ser Ala Arg Met Gly Ala Arg Ala Ser Ile Leu Arg

20 25 30

Gly Gly Lys Leu Asp Lys Trp Glu Lys Ile Arg Leu Arg Pro Gly Gly

35 40 45

Lys Lys His Tyr Met Leu Lys His Leu Val Trp Ala Ser Arg Glu Leu

50 55 60

Glu Arg Phe Ala Leu Asn Pro Gly Leu Leu Glu Thr Ser Glu Gly Cys

65 70 75 80

Lys Gln Ile Ile Lys Gln Leu Gln Pro Ala Leu Gln Thr Gly Thr Glu

85 90 95

Glu Leu Arg Ser Leu Phe Asn Thr Val Ala Thr Leu Tyr Cys Val His

100 105 110

Glu Gly Ile Glu Ile Arg Asp Thr Lys Glu Ala Leu Asp Lys Ile Glu

115 120 125

Glu Glu Gln Asn Lys Ile Gln Gln Lys Thr Gln Gln Ala Lys Lys Ala

130 135 140

Asp Glu Lys Val Ser Gln Asn Tyr Pro Ile Val Gln Asn Leu Gln Gly

145 150 155 160

Gln Met Val His Gln Ala Ile Ser Pro Arg Thr Leu Asn Ala Trp Val

165 170 175

Lys Val Ile Glu Glu Lys Ala Phe Ser Pro Glu Val Ile Pro Met Phe

180 185 190

Thr Ala Leu Ser Glu Gly Ala Thr Pro Gln Asp Leu Asn Thr Met Leu

195 200 205

Asn Thr Val Gly Gly His Gln Ala Ala Met Gln Met Leu Lys Asp Thr

210 215 220

Ile Asn Glu Glu Ala Ala Glu Trp Asp Arg Val His Pro Val His Ala

225 230 235 240

Gly Pro Ile Ala Pro Gly Gln Met Arg Glu Pro Arg Gly Ser Asp Ile

245 250 255

Ala Gly Thr Thr Ser Thr Leu Gln Gly Gln Ile Ala Trp Met Thr Ser

260 265 270

Asn Pro Pro Val Pro Val Gly Glu Ile Tyr Lys Arg Trp Ile Ile Leu

275 280 285

Gly Leu Asn Lys Ile Val Arg Met Tyr Ser Pro Val Ser Ile Leu Asp

290 295 300

Ile Lys Gln Gly Pro Lys Glu Pro Phe Arg Asp Tyr Val Asp Arg Phe

305 310 315 320

Phe Lys Thr Leu Arg Ala Glu Gln Ala Thr Gln Asp Val Lys Asn Trp

325 330 335

Met Thr Asp Thr Leu Leu Val Gln Asn Ala Asn Pro Asp Cys Lys Thr

340 345 350

Ile Leu Arg Ala Leu Gly Pro Gly Ala Ser Leu Glu Glu Met Met Thr

355 360 365

Ala Cys Gln Gly Val Gly Gly Pro Ser His Lys Ala Arg Val Leu Ala

370 375 380

Glu Ala Met Ser Gln Ala Asn Gly Thr Ile Leu Met Gln Arg Ser Asn

385 390 395 400

Phe Lys Gly Ser Lys Arg Ile Val Lys Cys Phe Asn Cys Gly Lys Glu

405 410 415

Gly His Ile Ala Arg Asn Cys Arg Ala Pro Arg Lys Lys Gly Cys Trp

420 425 430

Lys Cys Gly Lys Glu Gly His Gln Met Lys Asp Cys Thr Glu Arg Gln

435 440 445

Ala Asn Phe Leu Gly Lys Ile Trp Pro Ser His Lys Gly Arg Pro Gly

450 455 460

Asn Phe Leu Gln Ser Arg Pro Glu Pro Thr Ala Pro Pro Ala Glu Ser

465 470 475 480

Phe Arg Phe Glu Glu Thr Thr Pro Ala Pro Lys Gln Glu Pro Lys Asp

485 490 495

Arg Glu Pro Leu Thr Ser Leu Lys Ser Leu Phe Gly Ser Asp Pro Leu

500 505 510

Ser Gln

<210>11

<211>2901

<212>DNA

<213>人(Homo sapiens)

<400>11

atggacgcca tgaagcgcgg cctgtgctgc gtgctgctgc tgtgcggcgc cgtgttcgtg 60

agcgcccgcc cccagatcac cctgtggcag cgccccctgg tgtccatccg cgtgggcggc 120

cagatcaagg aggccctgct ggacgacacc gtgttggagg aggtgaactt gcccggcaag 180

tggaagccca agatgatcgg cggcatcggc ggcttcatca aggtgaggca gtacgaccag 240

atccccatcg agatctgcgg caagaaggcc atcggcaccg tgttggtggg ccccaccccc 300

gtgaacatca tcggcaggaa catgttgacc cagctgggct gcaccctgaa cttccccatc 360

agccccatcg agaccatccc cgtgaagctg aagcccggca tggacggccc ccgcgtgaag 420

cagtggcccc tgaccgagga gaagatcaag gccctgaccg ccatctgcga cgagatggag 480

aaggagggca agatcaccaa gatcggcccc gagaacccct acaacacccc cgtgttcgcc 540

atcaagaaga aggacagcac caagtggcgc aagctggtgg acttccgcga gctgaacaag 600

cgcacccagg acttctggga ggtgcagctg ggcatccccc accccgccgg cctgaagaag 660

aagaagtccg tgaccgtgct ggacgtgggc gacgcctact tctccgtgcc cctgtacgag 720

gacttccgca agtacaccgc cttcaccatc cccagcatca acaacgagac ccccggcatc 780

cgctaccagt accacgtgct gccccagggc tggaagggct cccccgccat cttccagtgc 840

agcatgacca agatcctgga gcccttccgg gcccagaacc ccgagatcgt gatctaccag 900

tacggcgacg acctgtacgt gggctccgac ctggagatcg gccagcaccg cgccaagatc 960

gaggagttgc gcgagcacct gctgaagtgg ggcttcacca cccccgacaa gaagcaccag 1020

aaggagcccc ccttcctgtg gatgggctac gagctgcacc ccgacaagtg gaccgtgcag 1080

cccatccagc tgcccgagaa ggacagctgg accgtgaacg acatccagaa gctggtgggc 1140

aagctgaact gggccagcca gatctacccc ggcatcaagg tgcgccagct gtgcaagctg 1200

ctgcgcggcg ccaaggccct gaccgacatc atccccctga ccgaggaggc cgagctggag 1260

ctggccgaga accgcgagat cctgaaggag cccgtgcacg gcgcctacta cgacccctcc 1320

aaggacctga tcgccgagat ccagaagcag ggccaggacc agtggaccta ccagatctac 1380

caggagccct tcaagaacct gaagaccggc aagtacgcca agatgcgcac cgcccacacc 1440

aacgacgtga agcagctgac cgaggccgtg cagaagatct ccatggagag catcgtgatc 1500

tggggcaaga tccccaagtt ccgcctgccc atccagaagg agacctggga gacccgctgg 1560

accgcctact ggcaggccac ctggatcccc gagtgggagt tcgtgaacac cccccccctg 1620

gtgaagctgt ggtaccagct ggagaaggac cccatcgccg gcgtggagac cttctacgtg 1680

gacggcgccg ccaaccgcga gaccaagatg ggcaaggccg gctacgtgac cgaccgcggc 1740

cgccagaaga tcgtgtccct gaccgagacc accaaccaga agaccgagct gcaggccatc 1800

tgcctggcct tgcaggactc cggctccgag gtgaacatcg tgaccgactc ccagtacgcc 1860

ctgggcatca tccaggccca gcccgacaag agcgagtccg agctggtgaa ccagatcatc 1920

gagcagctga tcaagaagga gcgcgtgtac ctgtcctggg tgcccgccca caagggcatc 1980

ggcggcaacg agcaggtgga caagctggtg agcaacggca tccgcaaggt gctgttcctg 2040

gacggcatcg acaaggccca ggaggagcac gagaagtacc acagcaactg gcgcgccatg 2100

gccagcgact tcaacctgcc ccccatcgtg gccaaggaga tcgtggccag ctgcgaccag 2160

tgccagctga agggcgaggc catgcacggc caggtggact gcagccccgg catctggcag 2220

ctggactgca cccacctgga gggcaagatc atcctggtgg ccgtgcacgt ggccagcggc 2280

tacatcgagg ccgaggtgat ccccgccgag accggccagg agaccgccta cttcatcctg 2340

aagctggccg gccgctggcc cgtgaagatc atccacaccg acaacggcag caacttcacc 2400

agcgccgccg tgaaggccgc ctgctggtgg gccggcatcc agcaggagtt cggcatcccc 2460

tacaaccccc agagccaggg cgtggtggag tccatgaaca aggagctgaa gaagatcatc 2520

ggccaggtgc gcgaccaggc cgagcacctg aagaccgccg tgcagatggc cgtgttcatc 2580

cacaacttca agcgcaaggg cggcatcggc ggctacagcg ccggcgagcg catcatcgac 2640

atcatcgcca ccgacatcca gaccaaggag ctgcagaagc agatcatcaa gatccagaac 2700

ttccgcgtgt actaccgcga cagccgcgac cccatctgga agggccccgc caagctgctg 2760

tggaagggcg agggcgccgt ggtgatccag gacaacagcg acatcaaggt ggtgccccgc 2820

cgcaaggcca agatcatcaa ggactacggc aagcagatgg ccggcgccga ctgcgtggcc 2880

agccgccagg acgaggacta g 2901

<210>12

<211>966

<212>PRT

<213>人(Homo sapiens)

<400>12

Met Asp Ala Met Lys Arg Gly Leu Cys Cys Val Leu Leu Leu Cys Gly

1 5 10 15

Ala Val Phe Val Ser Ala Arg Pro Gln Ile Thr Leu Trp Gln Arg Pro

20 25 30

Leu Val Ser Ile Arg Val Gly Gly Gln Ile Lys Glu Ala Leu Leu Asp

35 40 45

Asp Thr Val Leu Glu Glu Val Asn Leu Pro Gly Lys Trp Lys Pro Lys

50 55 60

Met Ile Gly Gly Ile Gly Gly Phe Ile Lys Val Arg Gln Tyr Asp Gln

65 70 75 80

Ile Pro Ile Glu Ile Cys Gly Lys Lys Ala Ile Gly Thr Val Leu Val

85 90 95

Gly Pro Thr Pro Val Asn Ile Ile Gly Arg Asn Met Leu Thr Gln Leu

100 105 110

Gly Cys Thr Leu Asn Phe Pro Ile Ser Pro Ile Glu Thr Ile Pro Val

115 120 125

Lys Leu Lys Pro Gly Met Asp Gly Pro Arg Val Lys Gln Trp Pro Leu

130 135 140

Thr Glu Glu Lys Ile Lys Ala Leu Thr Ala Ile Cys Asp Glu Met Glu

145 150 155 160

Lys Glu Gly Lys Ile Thr Lys Ile Gly Pro Glu Asn Pro Tyr Asn Thr

165 170 175

Pro Val Phe Ala Ile Lys Lys Lys Asp Ser Thr Lys Trp Arg Lys Leu

180 185 190

Val Asp Phe Arg Glu Leu Asn Lys Arg Thr Gln Asp Phe Trp Glu Val

195 200 205

Gln Leu Gly Ile Pro His Pro Ala Gly Leu Lys Lys Lys Lys Ser Val

210 215 220

Thr Val Leu Asp Val Gly Asp Ala Tyr Phe Ser Val Pro Leu Tyr Glu

225 230 235 240

Asp Phe Arg Lys Tyr Thr Ala Phe Thr Ile Pro Ser Ile Asn Asn Glu

245 250 255

Thr Pro Gly Ile Arg Tyr Gln Tyr Asn Val Leu Pro Gln Gly Trp Lys

260 265 270

Gly Ser Pro Ala Ile Phe Gln Cys Ser Met Thr Lys Ile Leu Glu Pro

275 280 285

Phe Arg Ala Gln Asn Pro Glu Ile Val Ile Tyr Gln Tyr Gly Asp Asp

290 295 300

Leu Tyr Val Gly Ser Asp Leu Glu Ile Gly Gln His Arg Ala Lys Ile

305 310 315 320

Glu Glu Leu Arg Glu His Leu Leu Lys Trp Gly Phe Thr Thr Pro Asp

325 330 335

Lys Lys His Gln Lys Glu Pro Pro Phe Leu Trp Met Gly Thr Glu Leu

340 345 350

His Pro Asp Lys Trp Thr Val Gln Pro Ile Gln Leu Pro Glu Lys Asp

355 360 365

Ser Trp Thr Val Asn Asp Ile Gln Lys Leu Val Gly Lys Leu Asn Trp

370 375 380

Ala Ser Gln Ile Tyr Pro Gly Ile Lys Val Arg Gln Leu Cys Lys Leu

385 390 395 400

Leu Arg Gly Ala Lys Ala Leu Thr Asp Ile Ile Pro Leu Thr Glu Glu

405 410 4l5

Ala Glu Leu Glu Leu Ala Glu Asn Arg Glu Ile Leu Lys Glu Pro Val

420 425 430

His Gly Ala Tyr Tyr Asp Pro Ser Lys Asp Leu Ile Ala Glu Ile Gln

435 440 445

Lys Gln Gly Gln Asp Gln Trp Thr Tyr Gln Ile Tyr Gln Glu Pro Phe

450 455 460

Lys Asn Leu Lys Thr Gly Lys Tyr Ala Lys Met Arg Thr Ala His Thr

465 470 475 480

Asn Asp Val Lys Gln Leu Thr Glu Ala Val Gln Lys Ile Ser Met Glu

485 490 495

Ser Ile Val Ile Gln Gly Lys Ile Pro Lys Phe Arg Leu Pro Ile Gln

500 505 510

Lys Glu Thr Trp Glu Thr Arg Trp Thr Ala Tyr Trp Gln Ala Thr Trp

515 520 525

Ile Pro Glu Trp Glu Phe Val Asn Thr Pro Pro Leu Val Lys Leu Trp

530 535 540

Trp Gln Leu Glu Lys Asp Pro Ile Ala Gly Val Glu Thr Phe Tyr Val

545 550 555 560

Asp Gly Ala Ala Asn Arg Glu Thr Lys Met Gly Lys Ala Gly Tyr Val

565 570 575

Thr Asp Arg Gly Arg Gln Lys Ile Val Ser Leu Thr Glu Thr Thr Asn

580 585 590

Gln Lys Thr Glu Leu Gln Ala Ile Cys Leu Ala Leu Gln Asp Ser Gly

595 600 605

Ser Glu Val Asn Ile Val Thr Asp Ser Gln Tyr AIa Leu Gly Ile Ile

610 615 620

Gln Ala Gln Pro Asp Lys Ser Glu Ser Glu Leu Val Asn Gln Ile Ile

625 630 635 640

Glu Gln Leu Ile Lys Lys Glu Arg Val Tyr Leu Ser Thr Val Pro Ala

645 650 655

His Lys Gly Ile Gly Gly Asn Glu Gln Val Asp Lys Leu Val Ser Asn

660 665 670

Gly Ile Arg Lys Val Leu Phe Leu Asp Gly Ile Asp Lys Ala Gln Glu

675 680 685

Glu His Glu Lys Tyr His Ser Asn Trp Arg Ala Met Ala Ser Asp Phe

690 695 700

Asn Leu Pro Pro Ile Val Ala Lys Glu Ile Val Ala Ser Cys Asp Gln

705 710 715 720

Cys Gln Leu Lys Gly Glu Ala Met His Gly Gln Val Asp Cys Ser Pro

725 730 735

Gly Ile Trp Gln Leu Asp Cys Thr His Leu Glu Gly Lys Ile Ile Leu

740 745 750

Val Ala Val His Val Ala Ser Gly Tyr Ile Glu Ala Glu Val Ile Pro

755 760 765

Ala Glu Thr Gly Gln Glu Thr Ala Tyr Phe Ile Leu Lys Leu Ala Gly

770 775 780

Arg Trp Pro Val Lys Ile Ile His Thr Asp Asn Gly Ser Asn Phe Thr

785 790 795 800

Ser Ala Ala Val Lys Ala Ala Cys Trp Trp Ala Gly Ile Gln Gln Glu

805 810 815

Phe Gly Ile Pro Tyr Asn Pro Gln Ser Gln Gly Val Val Glu Ser Met

820 825 830

Asn Lys Glu Leu Lys Lys Ile Ile Gly Gln Val Arg Asp Gln Ala Glu

835 840 845

His Leu Lys Thr Ala Val Gln Met Ala Val Phe Ile His Asn Phe Lys

850 855 860

Arg Lys Gly Gly Ile Gly Gly Tyr Ser Ala Gly Glu Arg Ile Ile Asp

865 870 875 880

Ile Ile Ala Thr Asp Ile Gln Thr Lys Glu Leu Gln Lys Gln Ile Ile

885 890 895

Lys Ile Gln Asn Phe Arg Val Tyr Tyr Arg Asp Ser Arg Asp Pro Ile

900 905 910

Trp Lys Gly Pro Ala Lys Leu Leu Trp Lys Gly Glu Gly Ala ValVal

915 920 925

Ile Gln Asp Asn Ser Asp Ile Lys Val Val Pro Arg Arg Lys Ala Lys

930 935 940

Ile Ile Lys Asp Tyr Gly Lys Gln Met Ala Gly Ala Asp Cys Val Ala

945 950 955 960

Ser Arg Gln Asp Glu Asp

965

<210>13

<2ll>993

<212>DNA

<213>人(Homo sapiens)

<400>13

atggacgcca tgaagcgcgg cctgtgctgc gtgctgctgc tgtgcggcgc cgtgttcgtg 60

agcgcccgca tgggcggcaa gtggtccaag agcagcatcg tgggctggcc cgccatccgc 120

gagcgcattc gccgcaccga gcccgccgcc gacggcgtgg gcgccgtgtc tcgcgacctg 180

gagaagcatg gcgccatcac cagtaacaac accgccgaca ccaacgccga ctgcgcctgg 240

ctggagaccc aggaggagga ggaggtgggc ttccccgtcc gcccccaggt gcccttgcgc 300

cccatgacct tcaagggcgc cttggacctc agcttcttcc tgaaggagaa gggcggcctg 360

gaggggttga tctacagcaa gaagaggcag gagatcctgg acttgtgggt ctaccacacc 420

cagggctact tccccgactg gcacaactac acccccggcc ccggcgtccg cttccccctg 480

accttcggct ggtgcttcaa gctggtgccc gtggaccccg gcgaggtgga ggaggccaac 540

gagggcgaga acaactgctt gctgcacccc gtctgccagc acggcatgga cgacgagcac 600

cgcgaggtgc tgaagtggaa gttcgacagc cagctggccc accgccacag ggcccgcgag 660

ctgcacccgg agttctacaa ggactgcatg gagcccgtgg accccaacct ggagccctgg 720

aaccaccccg gcagccagcc cgagaccgcc tgcaacaact gctactgcaa gcgctgcagc 780

taccactgcc tggtgtgctt ccagaagaag ggcctgggca tcagctacgg ccgcaagaag 840

cgccgccagc gccgcagcgc cccccccagc agcgaggacc accagaaccc catcagcaag 900

cagcccctgc cccgcaccca gggcgacccc accggcagcg aggagagcaa gaagaaggtg 960

gagagcaaga ccaagaccga ccccttcgac tag 993

<210>14

<211>330

<212>PRT

<213>人(Homo sapiens)

<400>14

Met Asp Ala Met Lys Arg Gly Leu Cys Cys Val Leu Leu Leu Cys Gly

1 5 10 15

Ala Val Phe Val Ser Ala Arg Met Gly Gly Lys Trp Ser Lys Ser Ser

20 25 30

Ile Val Gly Trp Pro Ala Ile Arg Glu Arg Ile Arg Arg Thr Glu Pro

35 40 45

Ala Ala Asp Gly Val Gly Ala Val Ser Arg Asp Leu Glu Lys His Gly

50 55 60

Ala Ile Thr Ser Asn Asn Thr Ala Asp Thr Asn Ala Asp Cys Ala Trp

65 70 75 80

Leu Glu Thr Gln Glu Glu Glu Glu Val Gly Phe Pro Val Arg Pro Gln

85 90 95

Val Pro Leu Arg Pro Met Thr Phe Lys Gly Ala Leu Asp Leu Ser Phe

100 105 110

Phe Leu Lys Glu Lys Gly Gly Leu Glu Gly Leu Ile Tyr Ser Lys Lys

115 120 125

Arg Gln Glu Ile Leu Asp Leu Trp Val Tyr His Thr Gln Gly Tyr Phe

130 135 140

Pro Asp Trp His Asn Tyr Thr Pro Gly Pro Gly Val Arg Phe Pro Leu

145 150 155 160

Thr Phe Gly Trp Cys Phe Lys Leu Val Pro Val Asp Pro Gly Glu Val

165 170 175

Glu Glu Ala Asn Glu Gly Glu Asn Asn Cys Leu Leu His Pro Val Cys

180 185 190

Gln His Gly Met Asp Asp Glu His Arg Glu Val Leu Lys Trp Lys Phe

195 200 205

Asp Ser Gln Leu Ala His Arg His Arg Ala Arg Glu Leu His Pro Glu

210 215 220

Phe Tyr Lys Asp Cys Met Glu Pro Val Asp Pro Asn Leu Glu Pro Trp

225 230 235 240

Asn His Pro Gly Ser Gln Pro Glu Thr Ala Cys Asn Asn Cys Tyr Cys

245 250 255

Lys Arg Cys Ser Tyr His Cys Leu Val Cys Phe Gln Lys Lys Gly Leu

260 265 270

Gly Ile Ser Tyr Gly Arg Lys Lys Arg Arg Gln Arg Arg Ser Ala Pro

275 280 285

Pro Ser Ser Glu Asp His Gln Asn Pro Ile Ser Lys Gln Pro Leu Pro

290 295 300

Arg Thr Gln Gly Asp Pro Thr Gly Ser Glu Glu Ser Lys Lys Lys Val

305 310 315 320

Glu Ser Lys Thr Lys Thr Asp Pro Phe Asp

325 330

<210>15

<211>8186

<212>DNA

<213>人(Homo sapiens)

<400>15

gctgcttcgc gatgtacggg ccagatatac gcgttgacat tgattattga ctagttatta 60

atagtaatca attacggggt cattagttca tagcccatat atggagttcc gcgttacata 120

acttacggta aatggcccgc ctggctgacc gcccaacgac ccccgcccat tgacgtcaat 180

aatgacgtat gttcccatag taacgccaat agggactttc cattgacgtc aatgggtgga 240

gtatttacgg taaactgccc acttggcagt acatcaagtg tatcatatgc caagtacgcc 300

ccctattgac gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt acatgacctt 360

atgggacttt cctacttggc agtacatcta cgtattagtc atcgctatta ccatggtgat 420

gcggttttgg cagtacatca atgggcgtgg atagcggttt gactcacggg gatttccaag 480

tctccacccc attgacgtca atgggagttt gttttggcac caaaatcaac gggactttcc 540

aaaatgtcgt aacaactccg ccccattgac gcaaatgggc ggtaggcgtg tacggtggga 600

ggtctatata agcagagctc tctggctaac tagagaaccc actgcttact ggcttatcga 660

aattaatacg actcactata gggagaccca agctggctag ccgccaccat ggatgcaatg 720

aagagggggc tctgctgtgt gctgctgctg tgtggagcag tcttcgttag cgccgccgag 780

aacttgtggg tgaccgtgta ctacggcgtg cccgtgtgga aggaggccaa gaccaccctg 840

ttctgcgcct ccgacgccaa ggcctacgag aaggaggtgc acaacgtgtg ggccacccac 900

gcctgcgtgc ccaccgaccc caacccccag gagatggtgt tggagaacgt gaccgagaac 960

ttcaacatgt ggaagaacga catggtgaac cagatgcacg aggacgtcat cagcttgtgg 1020

gaccagagcc tgaagccctg cgtgaagttg acccccctgt gcgtgacctt ggagtgcagg 1080

aacgtgagca gcaacggcac ctacaacgag acctacaacg agatcaagaa ctgctccttc 1140

aacgccacca ccgtgttgag ggacaggaag cagaccgtgt acgccctgtt ctacaggctg 1200

gacatcgtgc ccctgaacaa gaagaactcc agcgagaact ccagcgagta ctacaggttg 1260

atcaactgca acacctccgc catcacccag gcctgcccca aggtgacctt cgaccccatc 1320

cccatccact actgcacccc cgccggctac gccatcctga agtgcaacga caagaccttc 1380

aacggcaccg gcccctgcca caacgtgagc accgtgcagt gcacccacgg catcaagccc 1440

gtggtgtcca cccagctgct gttgaacggc agcctggccg agagggagat catcatcagg 1500

tccgagaacc tgaccaacaa cgtgaagacc atcatcgtgc acctgaacca gtccgtggag 1560

atcgtgtgca ccaggcccaa caacaacacc aggaagagca tcaggatcgg ccccggccag 1620

accttctacg ccaccggcga catcatcggc gacatcaggc aggcccactg caacatcagc 1680

aaggacaagt ggaaggagac cttgcagagg gtgggcaaga agttggccga gcacttcccc 1740

aacaagacca tcgagttcgc ctcctcctcc ggcggcgacc tggagatcac cacccacagc 1800

ttcaactgca ggggcgagtt cttctactgc aacacctcca gcctgttcaa cggcacctac 1860

atgcccaacg gcaccgaggg caactccagc tccatcatca ccatcccctg caggatcaag 1920

cagatcatca acatgtggca ggaggtgggc cgcgccatgt acgccccccc catcgagggc 1980

aacatcacct gcaagtccaa catcaccggc ctgctgttgg tgcgcgacgg cggcaaggag 2040

accaacgaca ccgagacctt caggcccggc ggcggcgaca tgagggacaa ctggaggagc 2100

gagttgtaca agtacaaggt ggtggagatc aagcccttgg gcatcgcccc caccgccgcc 2160

aagaggaggg tggtggagag ggagaagagg gccgtgggca tcggcgccgt gttcctgggc 2220

ttcctgggcg ccgccggcag caccatgggc gccgccagca tcaccctgac cgtgcaggcc 2280

cgccagctgc tgagcggcat cgtgcagcag cagagcaacc tgctgcgcgc catcgaggcc 2340

cagcagcacc tgctgcagct gaccgtgtgg ggcatcaagc agctgcagac ccgcgttctg 2400

gccatcgagc gctacctgaa ggaccagcag ctgctgggca tctggggctg cagcggcaag 2460

ctgatctgca ccaccgccgt gcactggaac agcagctgga gcaaccgcag ccaggaggag 2520

atctggaaca acatgacctg gatgcagtgg gaccgcgaga tcagcaacta caccaacacc 2580

atctaccgcc tgctggagga cagccagaac cagcaggagc gcaacgagaa ggacctgctg 2640

gccctggaca actggaagaa cctgtggagc tggttcgaca tcaccaactg gctgtggtac 2700

atccgcatct tcatcatgat cgtgggcggc ctgatcggcc tgcgcatcat cttcgccgtg 2760

ctgagcatcg tgaaccgcgt gcgccagggc tacagccccc tgagcttcca gaccctgacc 2820

cccaaccccg gcggccccga ccgcctgggc cgcatcgagg aggagggcgg cgagcaggac 2880

aagaaccgca gcatccgcct ggtgaacggc ttcctggccc tggcctggga cgacctgcgc 2940

aacctgtgcc gcttcagcta ccacctgctg cgcgacctgc tgctgatcgt ggcccgcatc 3000

gtggagctgc tgggccgccg cggctgggag gccctgcgct actggtggaa cctgctgaag 3060

tactgggtgc aggagctgaa gaacagcgcc gtgagcctgc tgaacgccac cgccatcgcc 3120

gtggccgagg gcaccgaccg cgtgatcgag gtggtgcagg gcgcctaccg cgccatcctg 3180

cacatccccc gccgcatccg ccagggcttc gaggccgccc tgcagtaaga attccgtgag 3240

gctccggtgc ccgtcagtgg gcagagcgca catcgcccac agtccccgag aagttggggg 3300

gaggggtcgg cgattgaacc ggtgcctaga gaaggtggcg cggggtaaac tgggaaagtg 3360

atgtcgtgta ctggctccgc ctttttcccg agggtggggg agaaccgtat ataagtgcag 3420

tagtcgccgt gaacgttctt tttcgcaacg ggtttgccgc cagaacacag gtaagtgccg 3480

tgtgtggttc ccgcgggcct ggcctcttta cgggttatgg cccttgcgtg ccttgaatta 3540

cttccacctg gctgcagtac gtgattcttg atcccgagct tcgggttgga agtgggtggg 3600

agagttcgag gccttgcgct taaggagccc cttcgcctcg tgcttgagtt gaggcctggc 3660

ctgggcgctg gggccgccgc gtgcgaatct ggtggcacct tcgcgcctgt ctcgctgctt 3720

tcgataagtc tctagccatt taaaattttt gatgacctgc tgcgacgctt tttttctggc 3780

aagatagtct tgtaaatgcg ggccaagatc tgcacactgg tatttcggtt tttggggccg 3840

cgggcggcga cggggcccgt gcgtcccagc gcacatgttc ggcgaggcgg ggcctgcgag 3900

cgcggccacc gagaatcgga cgggggtagt ctcaagctgg ccggcctgct ctggtgcctg 3960

gcctcgcgcc gccgtgtatc gccccgccct gggcggcaag gctggcccgg tcggcaccag 4020

ttgcgtgagc ggaaagatgg ccgcttcccg gccctgctgc agggagctca aaatggagga 4080

cgcggcgctc gggagagcgg gcgggtgagt cacccacaca aaggaaaagg gcctttccgt 4140

cctcagccgt cgcttcatgt gactccacgg agtaccgggc gccgtccagg cacctcgatt 4200

agttctcgag cttttggagt acgtcgtctt taggttgggg ggaggggttt tatgcgatgg 4260

agtttcccca cactgagtgg gtggagactg aagttaggcc agcttggcac ttgatgtaat 4320

tctccttgga atttgccctt tttgagtttg gatcttggtt cattctcaag cctcagacag 4380

tggttcaaag tttttttctt ccatttcagg tgtcgtgaag cggccgccgc caccatggac 4440

gccatgaagc gcggcctgtg ctgcgtgctg ctgctgtgcg gcgccgtgtt cgtgagcgcc 4500

cgcatgggcg cccgcgccag catcctgcgc ggcggcaagc tgggcaagtg ggagaagatc 4560

cgcctgcgcc ccggcgacaa gaagcactac atgctgaagc acctggtgtg ggccagccgc 4620

gagctggagc gcttcgccct gaaccccggc ctgctggaga ccagcgaggg ctgcaagcag 4680

atcatcaagc agctgcagcc cgccctgcag accggcaccg aggagctgcg cagcctgttc 4740

aacaccgtgg ccaccctgta ctgcgtgcac gagggcatcg agatccgcga caccaaggag 4800

gccctggaca agatcgagga ggagcagaac aagatccagc agaagaccca gcaggccaag 4860

aaggccgacg agaaggtgag ccagaactac cccatcgtgc agaacctgca gggccagatg 4920

gtgcaccagg ccatctcccc caggaccttg aacgcctggg tgaaggtgat cgaggagaag 4980

gccttcagcc ccgaggtgat ccccatgttc accgccttgt ccgagggcgc caccccccag 5040

gacttgaaca ccatgttgaa caccgtgggc ggccaccagg ccgccatgca gatgttgaag 5100

gacaccatca acgaggaggc cgccgagtgg gacagggtgc accccgtgca cgccggcccc 5160

attgcccccg gccagatgag ggagcccagg ggcagcgaca tcgccggcac caccagcacc 5220

ctgcagggcc agatcgcctg gatgaccagc aacccccccg tgcccgtggg cgagatctac 5280

aagaggtgga tcatcctggg cttgaacaag atcgtgagga tgtacagccc cgtgagcatc 5340

ttggacatca agcagggccc caaggagccc ttcagggact acgtggaccg cttcttcaag 5400

accttgaggg ccgagcaggc cacccaggac gtgaagaact ggatgaccga caccttgttg 5460

gtgcagaacg ccaaccccga ctgcaagacc atcttgaggg ccttgggccc cggcgcctcc 5520

ttggaggaga tgatgaccgc ctgccagggc gtgggcggcc ccagccacaa ggccagggtg 5580

ttggccgagg ccatgagcca ggccaacggc accatcctga tgcagaggag caacttcaag 5640

ggctccaaga ggatcgtgaa gtgcttcaac tgcggcaagg agggccacat cgccaggaac 5700

tgcagggccc ccaggaagaa gggctgctgg aagtgcggca aggagggcca ccagatgaag 5760

gactgcaccg agaggcaggc caacttcttg ggcaagatct ggccctccca caagggcagg 5820

cccggcaact tcctgcagag caggcccgag cccaccgccc cccccgccga gagcttcagg 5880

ttcgaggaga ccacccccgc ccccaagcag gagcccaagg acagggagcc cttgacctcc 5940

ctgaagtccc tgttcggcag cgaccccttg tcccagtaat ctagagggcc cgtttaaacc 6000

cgctgatcag cctcgactgt gccttctagt tgccagccat ctgttgtttg cccctccccc 6060

gtgccttcct tgaccctgga aggtgccact cccactgtcc tttcctaata aaatgaggaa 6120

attgcatcgc attgtctgag taggtgtcat tctattctgg ggggtggggt ggggcaggac 6180

agcaaggggg aggattggga agacaatagc aggcatgctg gggatgcggt gggctctatg 6240

gcttctactg ggcggtttta tggacagcaa gcgaaccgga attgccagct ggggcgccct 6300

ctggtaaggt tgggaagccc tgcaaagtaa actggatggc tttcttgccg ccaaggatct 6360

gatggcgcag gggatcaagc tctgatcaag agacaggatg aggatcgttt cgcatgattg 6420

aacaagatgg attgcacgca ggttctccgg ccgcttgggt ggagaggcta ttcggctatg 6480

actgggcaca acagacaatc ggctgctctg atgccgccgt gttccggctg tcagcgcagg 6540

ggcgcccggt tctttttgtc aagaccgacc tgtccggtgc cctgaatgaa ctgcaagacg 6600

aggcagcgcg gctatcgtgg ctggccacga cgggcgttcc ttgcgcagct gtgctcgacg 6660

ttgtcactga agcgggaagg gactggctgc tattgggcga agtgccgggg caggatctcc 6720

tgtcatctca ccttgctcct gccgagaaag tatccatcat ggctgatgca atgcggcggc 6780

tgcatacgct tgatccggct acctgcccat tcgaccacca agcgaaacat cgcatcgagc 6840

gagcacgtac tcggatggaa gccggtcttg tcgatcagga tgatctggac gaagagcatc 6900

aggggctcgc gccagccgaa ctgttcgcca ggctcaaggc gagcatgccc gacggcgagg 6960

atctcgtcgt gacccatggc gatgcctgct tgccgaatat catggtggaa aatggccgct 7020

tttctggatt catcgactgt ggccggctgg gtgtggcgga ccgctatcag gacatagcgt 7080

tggctacccg tgatattgct gaagagcttg gcggcgaatg ggctgaccgc ttcctcgtgc 7140

tttacggtat cgccgctccc gattcgcagc gcatcgcctt ctatcgcctt cttgacgagt 7200

tcttctgaat tattaacgct tacaatttcc tgatgcggta ttttctcctt acgcatctgt 7260

gcggtatttc acaccgcatc aggtggcact tttcggggaa atgtgcgcgg aacccctatt 7320

tgtttatttt tctaaataca ttcaaatatg tatccgctca tgagacaata accctgataa 7380

atgcttcaat aatagcacgt gctaaaactt catttttaat ttaaaaggat ctaggtgaag 7440

atcctttttg ataatctcat gaccaaaatc ccttaacgtg agttttcgtt ccactgagcg 7500

tcagaccccg tagaaaagat caaaggatct tcttgagatc ctttttttct gcgcgtaatc 7560

tgctgcttgc aaacaaaaaa accaccgcta ccagcggtgg tttgtttgcc ggatcaagag 7620

ctaccaactc tttttccgaa ggtaactggc ttcagcagag cgcagatacc aaatactgtt 7680

cttctagtgt agccgtagtt aggccaccac ttcaagaact ctgtagcacc gcctacatac 7740

ctcgctctgc taatcctgtt accagtggct gctgccagtg gcgataagtc gtgtcttacc 7800

gggttggact caagacgata gttaccggat aaggcgcagc ggtcgggctg aacggggggt 7860

tcgtgcacac agcccagctt ggagcgaacg acctacaccg aactgagata cctacagcgt 7920

gagctatgag aaagcgccac gcttcccgaa gggagaaagg cggacaggta tccggtaagc 7980

ggcagggtcg gaacaggaga gcgcacgagg gagcttccag ggggaaacgc ctggtatctt 8040

tatagtcctg tcgggtttcg ccacctctga cttgagcgtc gatttttgtg atgctcgtca 8100

ggggggcgga gcctatggaa aaacgccagc aacgcggcct ttttacggtt cctggccttt 8160

tgctggcctt ttgctcacat gttctt 8186

<210>16

<211>8017

<212>DNA

<213>人(Homo sapiens)

<400>16

gctgcttcgc gatgtacggg ccagatatac gcgttgacat tgattattga ctagttatta 60

atagtaatca attacggggt cattagttca tagcccatat atggagttcc gcgttacata 120

acttacggta aatggcccgc ctggctgacc gcccaacgac ccccgcccat tgacgtcaat 180

aatgacgtat gttcccatag taacgccaat agggactttc cattgacgtc aatgggtgga 240

gtatttacgg taaactgccc acttggcagt acatcaagtg tatcatatgc caagtacgcc 300

ccctattgac gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt acatgacctt 360

atgggacttt cctacttggc agtacatcta cgtattagtc atcgctatta ccatggtgat 420

gcggttttgg cagtacatca atgggcgtgg atagcggttt gactcacggg gatttccaag 480

tctccacccc attgacgtca atgggagttt gttttggcac caaaatcaac gggactttcc 540

aaaatgtcgt aacaactccg ccccattgac gcaaatgggc ggtaggcgtg tacggtggga 600

ggtctatata agcagagctc tctggctaac tagagaaccc actgcttact ggcttatcga 660

aattaatacg actcactata gggagaccca agctggctag cgccgccacc atggacgcca 720

tgaagcgcgg cctgtgctgc gtgctgctgc tgtgcggcgc cgtgttcgtg agcgcccgcc 780

cccagatcac cctgtggcag cgccccctgg tgtccatccg cgtggggggc cagatcaagg 840

aggccctgct ggacgacacc gtgttggagg aggtgaactt gcccggcaag tggaagccca 900

agatgatcgg cggcatcggc ggcttcatca aggtgaggca gtacgaccag atccccatcg 960

agatctgcgg caagaaggcc atcggcaccg tgttggtggg ccccaccccc gtgaacatca 1020

tcggcaggaa catgttgacc cagctgggct gcaccctgaa cttccccatc agccccatcg 1080

agaccatccc cgtgaagctg aagcccggca tggacggccc ccgcgtgaag cagtggcccc 1140

tgaccgagga gaagatcaag gccctgaccg ccatctgcga cgagatggag aaggagggca 1200

agatcaccaa gatcggcccc gagaacccct acaacacccc cgtgttcgcc atcaagaaga 1260

aggacagcac caagtggcgc aagctggtgg acttccgcga gctgaacaag cgcacccagg 1320

acttctggga ggtgcagctg ggcatccccc accccgccgg cctgaagaag aagaagtccg 1380

tgaccgtgct ggacgtgggc gacgcctact tctccgtgcc cctgtacgag gacttccgca 1440

agtacaccgc cttcaccatc cccagcatca acaacgagac ccccggcatc cgctaccagt 1500

acaacgtgct gccccagggc tggaagggct cccccgccat cttccagtgc agcatgacca 1560

agatcctgga gcccttccgg gcccagaacc ccgagatcgt gatctaccag tacggcgacg 1620

acctgtacgt gggctccgac ctggagatcg gccagcaccg cgccaagatc gaggagttgc 1680

gcgagcacct gctgaagtgg ggcttcacca cccccgacaa gaagcaccag aaggagcccc 1740

ccttcctgtg gatgggctac gagctgcacc ccgacaagtg gaccgtgcag cccatccagc 1800

tgcccgagaa ggacagctgg accgtgaacg acatccagaa gctggtgggc aagctgaact 1860

gggccagcca gatctacccc ggcatcaagg tgcgccagct gtgcaagctg ctgcgcggcg 1920

ccaaggccct gaccgacatc atccccctga ccgaggaggc cgagctggag ctggccgaga 1980

accgcgagat cctgaaggag cccgtgcacg gcgcctacta cgacccctcc aaggacctga 2040

tcgccgagat ccagaagcag ggccaggacc agtggaccta ccagatctac caggagccct 2100

tcaagaacct gaagaccggc aagtacgcca agatgcgcac cgcccacacc aacgacgtga 2160

agcagctgac cgaggccgtg cagaagatct ccatggagag catcgtgatc tggggcaaga 2220

tccccaagtt ccgcctgccc atccagaagg agacctggga gacccgctgg accgcctact 2280

ggcaggccac ctggatcccc gagtgggagt tcgtgaacac cccccccctg gtgaagctgt 2340

ggtaccagct ggagaaggac cccatcgccg gcgtggagac cttctacgtg gacggcgccg 2400

ccaaccgcga gaccaagatg ggcaaggccg gctacgtgac cgaccgcggc cgccagaaga 2460

tcgtgtccct gaccgagacc accaaccaga agaccgagct gcaggccatc tgcctggcct 2520

tgcaggactc cggctccgag gtgaacatcg tgaccgactc ccagtacgcc ctgggcatca 2580

tccaggccca gcccgacaag agcgagtccg agctggtgaa ccagatcatc gagcagctga 2640

tcaagaagga gcgcgtgtac ctgtcctggg tgcccgccca caagggcatc ggcggcaacg 2700

agcaggtgga caagctggtg agcaacggca tccgcaaggt gctgttcctg gacggcatcg 2760

acaaggccca ggaggagcac gagaagtacc acagcaactg gcgcgccatg gccagcgact 2820

tcaacctgcc ccccatcgtg gccaaggaga tcgtggccag ctgcgaccag tgccagctga 2880

agggcgaggc catgcacggc caggtggact gcagccccgg catctggcag ctggactgca 2940

cccacctgga gggcaagatc atcctggtgg ccgtgcacgt ggccagcggc tacatcgagg 3000

ccgaggtgat ccccgccgag accggccagg agaccgccta cttcatcctg aagctggccg 3060

gccgctggcc cgtgaagatc atccacaccg acaacggcag caacttcacc agcgccgccg 3120

tgaaggccgc ctgctggtgg gccggcatcc agcaggagtt cggcatcccc tacaaccccc 3180

agagccaggg cgtggtggag tccatgaaca aggagctgaa gaagatcatc ggccaggtgc 3240

gcgaccaggc cgagcacctg aagaccgccg tgcagatggc cgtgttcatc cacaacttca 3300

agcgcaaggg cggcatcggc ggctacagcg ccggcgagcg catcatcgac atcatcgcca 3360

ccgacatcca gaccaaggag ctgcagaagc agatcatcaa gatccagaac ttccgcgtgt 3420

actaccgcga cagccgcgac cccatctgga agggccccgc caagctgctg tggaagggcg 3480

agggcgccgt ggtgatccag gacaacagcg acatcaaggt ggtgccccgc cgcaaggcca 3540

agatcatcaa ggactacggc aagcagatgg ccggcgccga ctgcgtggcc agccgccagg 3600

acgaggacta ggaattccgt gaggctccgg tgcccgtcag tgggcagagc gcacatcgcc 3660

cacagtcccc gagaagttgg ggggaggggt cggcaattga accggtgcct agagaaggtg 3720

gcgcggggta aactgggaaa gtgatgtcgt gtactggctc cgcctttttc ccgagggtgg 3780

gggagaaccg tatataagtg cagtagtcgc cgtgaacgtt ctttttcgca acgggtttgc 3840

cgccagaaca caggtaagtg ccgtgtgtgg ttcccgcggg cctggcctct ttacgggtta 3900

tggcccttgc gtgccttgaa ttacttccac ctggctgcag tacgtgattc ttgatcccga 3960

gcttcgggtt ggaagtgggt gggagagttc gaggccttgc gcttaaggag ccccttcgcc 4020

tcgtgcttga gttgaggcct ggcctgggcg ctggggccgc cgcgtgcgaa tctggtggca 4080

ccttcgcgcc tgtctcgctg ctttcgataa gtctctagcc atttaaaatt tttgatgacc 4140

tgctgcgacg ctttttttct ggcaagatag tcttgtaaat gcgggccaag atctgcacac 4200

tggtatttcg gtttttgggg ccgcgggcgg cgacggggcc cgtgcgtccc agcgcacatg 4260

ttcggcgagg cggggcctgc gagcgcggcc accgagaatc ggacgggggt agtctcaagc 4320

tgcccggcct gctctggtgc ctggcctcgc gccgccgtgt atcgccccgc cctgggcggc 4380

aaggctggcc cggtcggcac cagttgcgtg agcggaaaga tggccgcttc ccggccctgc 4440

tgcagggagc tcaaaatgga ggacgcggcg ctcgggagag cgggcgggtg agtcacccac 4500

acaaaggaaa agggcctttc cgtcctcagc cgtcgcttca tgtgactcca cggagtaccg 4560

ggcgccgtcc aggcacctcg attagttctc gagcttttgg agtacgtcgt ctttaggttg 4620

gggggagggg ttttatgcga tggagtttcc ccacactgag tgggtggaga ctgaagttag 4680

gccagcttgg cacttgatgt aattctcctt ggaatttgcc ctttttgagt ttggatcttg 4740

gttcattctc aagcctcaga cagtggttca aagttttttt cttccatttc aggtgtcgtg 4800

aagcggccgc cgccaccatg gacgccatga agcgcggcct gtgctgcgtg ctgctgctgt 4860

gcggcgccgt gttcgtgagc gcccgcatgg gcggcaagtg gtccaagagc agcatcgtag 4920

gctggcccgc catccgcgag cgcatccgcc gcaccgagcc cgccgccgac ggcgtgggcg 4980

ccgtgtctcg cgacctggag aagcatggcg ccatcaccag taacaacacc gccgacacca 5040

acgccgactg cgcctggctg gagacccagg aggaggagga ggtgggcttc cccgtccgcc 5100

cccaggtgcc cttgcgcccc atgaccttca agggcgcctt ggacctcagc ttcttcctga 5160

aggagaaggg cggcctggag gggttgatct acagccagaa gaggcaggag atcctggact 5220

tgtgggtcta ccacacccag ggctacttcc ccgactggca caactacacc cccggccccg 5280

gcgtccgctt ccccctgacc ttcggctggt gcttcaagct ggtgcccgtg gaccccggcg 5340

aggtggagga ggccaacgag ggcgagaaca actgcttgct gcaccccgtc tgccagcacg 5400

gcatggacga cgagcaccgc gaggtgctga agtggaagtt cgacagccag ctggcccacc 5460

gccacagggc ccgcgagctg cacccggagt tctacaagga ctgcatggag cccgtggacc 5520

ccaacctgga gccctggaac caccccggca gccagcccga gaccgcctgc aacaactgct 5580

actacaagcg ctgcagctac cactgcctgg tgtgcttcca gaagaagggc ctgggcatca 5640

gctacggccg caagaagcgc cgccagcgcc gtagcgcccc ccccagcagc gaggaccacc 5700

agaaccccat cagcaagcag cccctgcccc gcacccaggg cgaccccacc ggcagcgagg 5760

agagcaagaa gaaggtggag agcaagacca agaccgaccc cttcgactag tctagagggc 5820

ccgtttaaac ccgctgatca gcctcgactg tgccttctag ttgccagcca tctgttgttt 5880

gcccctcccc cgtgccttcc ttgaccctgg aaggtgccac tcccactgtc ctttcctaat 5940

aaaatgagga aattgcatcg cattgtctga gtaggtgtca ttctattctg gggggtgggg 6000

tggggcagga cagcaagggg gaggattggg aagacaatag caggcatgct ggggatgcgg 6060

tgggctctat ggcttctact gggcggtttt atggacagca agcgaaccgg aattgccagc 6120

tggggcgccc tctggtaagg ttgggaagcc ctgcaaagta aactggatgg ctttcttgcc 6180

gccaaggatc tgatggc gca ggggatcaag ctctgatcaa gagacaggat gaggatcgtt 6240

tcgcatgatt gaacaagatg gattgcacgc aggttctccg gccgcttggg tggagaggct 6300

attcggctat gactgggcac aacagacaat cggctgctct gatgccgccg tgttccggct 6360

gtcagcgcag gggcgcccgg ttctttttgt caagaccgac ctgtccggtg ccctgaatga 6420

actgcaagac gaggcagcgc ggctatcgtg gctggccacg acgggcgttc cttgcgcagc 6480

tgtgctcgac gttgtcactg aagcgggaag ggactggctg ctattgggcg aagtgccggg 6540

gcaggatctc ctgtcatctc accttgctcc tgccgagaaa gtatccatca tggctgatgc 6600

aatgcggcgg ctgcatacgc ttgatccggc tacctgccca ttcgaccacc aagcgaaaca 6660

tcgcatcgag cgagcacgta ctcggatgga agccggtctt gtcgatcagg atgatctgga 6720

cgaagagcat caggggctcg cgccagccga actgttcgcc aggctcaagg cgagcatgcc 6780

cgacggcgag gatctcgtcg tgacccatgg cgatgcctgc ttgccgaata tcatggtgga 6840

aaatggccgc ttttctggat tcatcgactg tggccggctg ggtgtggcgg accgctatca 6900

ggacatagcg ttggctaccc gtgatattgc tgaagagctt ggcggcgaat gggctgaccg 6960

cttcctcgtg ctttacggta tcgccgctcc cgattcgcag cgcatcgcct tctatcgcct 7020

tcttgacgag ttcttctgaa ttattaacgc ttacaatttc ctgatgcggt attttctcct 7080

tacgcatctg tgcggtattt cacaccgcat caggtggcac ttttcgggga aatgtgcgcg 7140

gaacccctat ttgtttattt ttctaaatac attcaaatat gtatccgctc atgagacaat 7200

aaccctgata aatgcttcaa taatagcacg tgctaaaact tcatttttaa tttaaaagga 7260

tctaggtgaa gatccttttt gataatctca tgaccaaaat cccttaacgt gagttttcgt 7320

tccactgagc gtcagacccc gtagaaaaga tcaaaggatc ttcttgagat cctttttttc 7380

tgcgcgtaat ctgctgcttg caaacaaaaa aaccaccgct accagcggtg gtttgtttgc 7440

cggatcaaga gctaccaact ctttttccga aggtaactgg cttcagcaga gcgcagatac 7500

caaatactgt tcttctagtg tagccgtagt taggccacca cttcaagaac tctgtagcac 7560

cgcctacata cctcgctctg ctaatcctgt taccagtggc tgctgccagt ggcgataagt 7620

cgtgtcttac cgggttggac tcaagacgat agttaccgga taaggcgcag cggtcgggct 7680

gaacgggggg ttcgtgcaca cagcccagct tggagcgaac gacctacacc gaactgagat 7740

acctacagcg tgagctatga gaaagcgcca cgcttcccga agggagaaag gcggacaggt 7800

atccggtaag cggcagggtc ggaacaggag agcccacgag ggagcttcca gggggaaacg 7860

cctggtatct ttatagtcct gtcgggtttc gccacctctg acttgagcgt cgatttttgt 7920

gatgctcgtc aggggggcgg agcctatgga aaaacgccag caacgcggcc tttttacggt 7980

tcctggcctt ttgctggcct tttgctcaca tgttctt 8017

<210>17

<211>2442

<212>DNA

<213>人(Homo sapiens)

<400>17

atgagagtga cggggatcag gaagaactat cagcatttat ggagatgggg caccatgctc 60

cttgggatgt tgatgatctg tagtgctgca gaaaacttgt gggtcacagt ctattatggg 120

gtacctgtgt ggaaagaagc caaaactact ctattctgtg cgtcagatgc taaagcatat 180

gagaaagaag tgcataatgt ctgggctaca catgcctgtg tacccacaga ccccaaccca 240

caagaaatgg ttttggaaaa tgtaacagaa aattttaaca tgtggaaaaa tgacatggtg 300

aatcagatgc atgaggatgt aatcagttta tgggatcaaa gcctaaagcc atgtgtaaag 360

ttgaccccac tctgtgtcac tttagaatgt agaaatgtta gcagtaatgg tacctacaat 420

gagacctaca atgagatcaa aaattgctct ttcggggccg ggtattatag attaataaat 480

tgtaatacct cagccataac acaagcctgt ccaaaggtca cttttgatcc aattcctata 540

cactattgca ctccagctgg ttatgcgatt ctaaagtgta atgataagac attcaatgga 600

acaggaccat gccataatgt tagtacagta caatgtacac atggaattaa gccagtggta 660

tcaactcaac tactgttaaa tggtagccta gcagaaagag agataataat tagatctgaa 720

aatctgacaa acaatgtcaa aacaataata gtacatctta atcaatctgt agaaattgta 780

tgtacaagac ccaacaataa tacaagaaaa agtataagga taggaccagg acaaacattc 840

tatgcaacag gagacataat aggagatata agacaagcac attgtaacat tagtaaagat 900

aaatggaatg aaactttaca aagggtaggt aaaaaattag cagaacactt ccctaataaa 960

acaatagaat ttgcatcatc ctcaggaggg gacctagaaa ttacaacaca tagctttaat 1020

tgtagaggag aatttttcta ttgtaataca tcaatcctgt ttaatggtac atacatgcct 1080

aatggtacag aaggtaattc aagctcaatc atcacaatcc catgcagaat aaagcaaatt 1140

ataaacatgt ggcaggaggt aggacgagca atgtatgccc ctcccattga gggaaacata 1200

acatgtaaat caaatatcac aggactacta ttggtacgtg atggaggaaa agagacaaat 1260

gatacagaga cattcagacc tggaggagga gatatgaggg acaattggag aagtgaatta 1320

tataaatata aagtggtaga aattaagcca ttgggaatag cacccactgc agcaaaaagg 1380

agagtggtgg agagagaaaa aagagcagtg ggaataggag ctgtgttcct tgggttcttg 1440

ggagcagcag gaagcactat gggcgcggcg tcaataacgc tgacggtaca gtccagacaa 1500

ttgttgtctg gtatagtgca acagcaaagc aatttgctga gggctataga ggcgcaacag 1560

catctgttgc aactcacggt ctggggcatt aagcagctcc agacaagagt cctggctata 1620

gaaagatacc taaaggatca acagctccta gggatttggg gctgctctgg aaaactcatc 1680

tgcactactg ctgtacattg gaactccagt tggagtaaca gatctcaaga agagatttgg 1740

aataacatga cttggatgca gtgggataga gaaattagta attacacaaa cacaatatac 1800

aggttgcttg aagactcgca aaaccagcag gaaagaaatg aaaaagattt actagcattg 1860

gacaattgga aaaatctatg gagttggttt gacataacaa attggctgtg gtatataaga 1920

atattcataa tgatagtagg aggcttgata ggtttaagaa taatttttgc tgtgctctct 1980

atagtgaata gagttaggca gggatactca cctttgtcgt ttcagaccct taccccgaac 2040

ccagggggac ccgacaggct cggaagaatc gaagaagaag gtggagagca agacaaaaac 2100

agatccattc gattagtgaa cggattctta gcacttgcct gggacgacct gcggaacctg 2160

tgccgcttca gctaccacct cttgagagac ttactcttga ttgtagcaag gattgtggaa 2220

cttctgggac gcagggggtg ggaagccctc agatattggt ggaatctcct gaagtattgg 2280

gttcaggaac taaagaatag tgctgttagt ttgctcaatg ccacagctat agcagtagct 2340

gaggggacag atagggttat agaagtagta caaggagctt atagagctat tctccacata 2400

cctagaagaa taagacaggg ctttgaagca gctttgcaat aa 2442

<210>18

<211>813

<212>PRT

<213>人(Homo sapiens)

<400>18

Met Arg Val Thr Gly Ile Arg Lys Asn Tyr Gln His Leu Trp Arg Trp

1 5 10 15

Gly Thr Met Leu Leu Gly Met Leu Met Ile Cys Ser Ala Ala Glu Asn

20 25 30

Leu Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Lys Glu Ala Lys

35 40 45

Thr Thr Leu Phe Cys Ala Ser Asp Ala Lys Ala Tyr Glu Lys Glu Val

50 55 60

His Asn Val Trp Ala Thr His Ala Cys Val Pro Thr Asp Pro Asn Pro

65 70 75 80

Gln Glu Met Val Leu Glu Asn Val Thr Glu Asn Phe Asn Met Trp Lys

85 90 95

Asn Asp Met Val Asn Gln Met His Glu Asp Val Ile Ser Leu Trp Asp

100 105 110

Gln Ser Leu Lys Pro Cys Val Lys Leu Thr Pro Leu Cys Val Thr Leu

115 120 125

Glu Cys Arg Asn Val Ser Ser Asn Gly Thr Tyr Asn Glu Thr Tyr Asn

130 135 140

Glu Ile Lys Asn Cys Ser Phe Gly Ala Gly Tyr Tyr Arg Leu Ile Asn

145 150 155 160

Cys Asn Thr Ser Ala Ile Thr Gln Ala Cys Pro Lys Val Thr Phe Asp

165 170 175

Pro Ile Pro Ile His Tyr Cys Thr Pro Ala Gly Tyr Ala Ile Leu Lys

180 185 190

Cys Asn Asp Lys Thr Phe Asp Gly Thr Gly Pro Cys His Asn Val Ser

195 200 205

Thr Val Gln Cys Thr His Gly Ile Lys Pro Val Val Ser Thr Gln Leu

210 215 220

Leu Leu Asn Gly Ser Leu Ala Glu Arg Glu Ile Ile Ile Arg Ser Glu

225 230 235 240

Asn Leu Thr Asn Asn Val Lys Thr Ile Ile Val His Leu Asn Gln Ser

245 250 255

Val Glu Ile Val Cys Thr Arg Pro Asn Asn Asn Thr Arg Lys Ser Ile

260 265 270

Arg Ile Gly Pro Gly Gln Thr Phe Tyr Ala Thr Gly Asp Ile Ile Gly

275 280 285

Asp Ile Arg Gln Ala His Cys Asn Ile Ser Lys Asp Lys Trp Asn Glu

290 295 300

Thr Leu Gln Arg Val Gly Lys Lys Leu Ala Glu His Phe Pro Asn Lys

305 310 315 320

Thr Ile Glu Phe Ala Ser Ser Ser Gly Gly Asp Leu Glu Ile Thr Thr

325 330 335

His Ser Phe Asn Cys Arg Gly Glu Phe Phe Tyr Cys Asn Thr Ser Ile

340 345 350

Leu Phe Asn Gly Thr Tyr Met Pro Asn Gly Thr Glu Gly Asn Ser Ser

355 360 365

Ser Ile Ile Thr Ile Pro Cys Arg Ile Lys Gln Ile Ile Asn Met Trp

370 375 380

Gln Glu Val Gly Arg Ala Met Tyr Ala Pro Pro Ile Glu Gly Asn Ile

385 390 395 400

Thr Cys Lys Ser Asn Ile Thr Gly Leu Leu Leu Val Arg Asp Gly Gly

405 410 415

Lys Glu Thr Asn Asp Thr Glu Thr Phe Arg Pro Gly Gly Gly Asp Met

420 425 430

Arg Asp Asn Trp Arg Ser Glu Leu Tyr Lys Tyr Lys Val Val Glu Ile

435 440 445

Lys Pro Leu Gly Ile Ala Pro Thr Ala Ala Lys Arg Arg Val Val Glu

450 455 460

Arg Glu Lys Arg Ala Val Gly Ile Gly Ala Val Phe Leu Gly Phe Leu

465 470 475 480

Gly Ala Ala Gly Ser Thr Met Gly Ala Ala Ser Ile Thr Leu Thr Val

485 490 495

Gln Ser Arg Gln Leu Leu Ser Gly Ile Val Gln Gln Gln Ser Asn Leu

500 505 510

Leu Arg Ala Ile Glu Ala Gln Gln His Leu Leu Gln Leu Thr Val Trp

515 520 525

Gly Ile Lys Gln Leu Gln Thr Arg Val Leu Ala Ile Glu Arg Tyr Leu

530 535 540

Lys Asp Gln Gln Leu Leu Gly Ile Trp Gly Cys Ser Gly Lys Leu Ile

545 550 555 560

Cys Thr Thr Ala Val His Trp Asn Ser Ser Trp Ser Asn Arg Ser Gln

565 570 575

Glu Glu Ile Trp Asn Asn Met Thr Trp Met Gln Trp Asp Arg Glu Ile

580 585 590

Ser Asn Tyr Thr Asn Thr Ile Tyr Arg Leu Leu Glu Asp Ser Gln Asn

595 600 605

Gln Gln Glu Arg Asn Glu Lys Asp Leu Leu Ala Leu Asp Asn Trp Lys

610 615 620

Asn Leu Trp Ser Trp Phe Asp Ile Thr Asn Trp Leu Trp Tyr Ile Arg

625 630 635 640

Ile Arg Ile Met Ile Val Gly Gly Leu Ile Gly Leu Arg Ile Ile Phe

645 650 655

Ala Val Leu Ser Ile Val Asn Arg Val Arg Gln Gly Tyr Ser Pro Leu

660 665 670

Ser Phe Gln Thr Leu Thr Pro Asn Pro Gly Gly Pro Asp Arg Leu Gly

675 680 685

Arg Ile Gln Glu Glu Gly Gly Glu Gln Asp Lys Asn Arg Ser Ile Arg

690 695 700

Leu Val Asn Gly Phe Leu Ala Leu Ala Trp Asp Asp Leu Arg Asn Leu

705 710 715 720

Cys Arg Phe Ser Tyr His Leu Leu Arg Asp Leu Leu Leu Ile Val Ala

725 730 735

Arg Ile Val Glu Leu Leu Gly Arg Arg Gly Trp Glu Ala Leu Arg Tyr

740 745 750

Trp Trp Asn Leu Leu Lys Tyr Trp Val Gln Glu Leu Lys Asn Ser Ala

755 760 765

Val Ser Leu Leu Asn Ala Thr Ala Ile Ala Val Ala Glu Gly Thr Asp

770 775 780

Arg Val Ile Glu Val Val Gln Gly Ala Tyr Arg Ala Ile Leu His Ile

785 790 795 800

Pro ArgArg Ile Arg Gln Gly Phe Glu Ala Ala Leu Gln

805 810

<210>19

<211>4404

<212>DNA

<213>人(Homo sapiens)

<400>19

gccgccacca tggacgccat gaagcgcggc ctgtgctgcg tgctgctgct gtgcggcgcc 60

gtgttcgtga gcgcccgcat gggtgcgaga gcgtcaatat taagaggggg aaaattagat 120

aaatgggaaa aaattaggtt aaggccaggg ggaaagaaac actatatgct aaaacacata 180

gtatgggcaa gcagagagct ggaaagattt gcacttaacc ctggcctttt agagacatca 240

gaaggctgta aacaaataat aaaacagcta caaccagctc ttcagacagg aacagaggaa 300

cttagatcat tattcaacac agtagcaact ctctattgtg tacatgcagg gatagaagta 360

cgagacacca aagaagcctt agacaagata gaggaagaac aaaacaaaat gcagcaaaaa 420

acacagcagg caaaagaggc tgacgggaag gtcagtcaaa attatcctat agtgcagaat 480

ctccaagggc aaatggtgca ccaggccata tcacctagaa ctttgaatgc atgggtaaaa 540

gtaatagagg aaaaggcttt tagcccagag gtaataccca tgtttacagc attatcagaa 600

ggagccaccc cacaagattt aaacaccatg ttaaatacag tagggggaca tcaggcagcc 660

atgcaaatgt taaaagatac tatcaatgaa gaggctgcag aatgggatag agtacatcca 720

gtacatgcag ggcctattgc accaggccaa atgagagaac caaggggaag t gacatagca 780

ggaactacta gtacccttca gggacaaata gcatggatga cgagtaaccc acctgttcca 840

gtgggagaaa tctataaaag atggataatt ctggggttaa ataaaatagt aagaatgtat 900

agccctgtga gcattttgga cataaaacaa gggccaaagg aaccctttag agactatgta 960

gaccggttct ttaaaacttt aagagctgaa caagctacac aagatgtaaa aaattggatg 1020

acagacacct tgttggtcca aaatgcgaac ccagattgta agaccatttt aagagcatta 1080

ggaccagggg cttcattaga agagatgatg acagcatgtc agggagtggg aggacctaac 1140

cacaaagcaa gagtgttggc tgaggcaatg agccaagcaa acggtaccat actgatgcag 1200

agaagcaatt ttaaaggctc taaaagaatt gttaaatgtt tcaactgtgg caaggaaggg 1260

cacatagcca gaaattgcag ggcccctagg aaaaaaggct gttggaaatg tggaaaggaa 1320

ggacaccaaa tgaaagactg cactgaaagg caggctaatt ttttagggaa aatttggcct 1380

ccccacaagg ggaggccagg gaatttcctc cagagcagac cagagccaac agccccacca 1440

gcagagagct tcgggttcga ggagacaacc ccagctccga agcaggagcc gaaagacagg 1500

gaacccttaa cttccctcaa atcactcttt ggcagcgacc ccttgtctca acctcaaatc 1560

actctttggc agcgacccct tgtctcaata agagtagggg gccagataaa agaggctctc 1620

ttagatgata cagtattaga agaagtaaat ttgccaggaa aatggaaacc aaaaatgata 1680

ggaggaattg gaggttttat caaagtaaga caatatgatc aaatacctat agaaatttgt 1740

ggaaaaaagg ctataggtac agtattagtg ggacccacac ctgtcaacat aattggaaga 1800

aatatgttga ctcaacttgg atgcacacta aattttccaa tcagtcccat tgaaactata 1860

ccagtaaaat taaagccagg aatggatggc ccaagggtta aacaatggcc attgacagaa 1920

gagaaaataa aagcattaac agcaatttgt gatgaaatgg agaaggaagg aaaaattaca 1980

aaaattgggc ctgaaaatcc atataacact ccagtatttg ccataaaaaa gaaggacagt 2040

actaagtgga gaaaattagt agatttcagg gaactcaata aaagaactca agatttttgg 2100

gaagttcaat taggaatacc acacccagca gggttaaaaa agaaaaaatc agtgacagta 2160

ctggatgtgg gggatgcata tttttcagtt cctttatatg aagacttcag aaaatatact 2220

gcattcacca tacctagtat aaacaatgaa acaccaggga tcaggtatca atataatgtg 2280

cttccacagg gatggaaggg atcaccagca atattccagt gtagcatggc aaaaatctta 2340

gagcccttta gggcacaaaa tccagaaata gtcatctatc aatatggcga tgacttgtat 2400

gtaggatctg acttagagat agggcaacat agagcaaaaa tagaggagtt aagagaacat 2460

ctgttaaagt ggggatttac cacaccagac aagaaacatc agaaagaacc tccatttctt 2520

tggatggggt atgaactcca tcctgacaaa tggacagtac agcctataca gctgccagaa 2580

aaggatagct ggactgtcaa tgatatacag aagttagtgg gaaaattaaa ctgggcaagt 2640

cagatttacc caggaattaa agtaaggcaa ctttgtaaac tccttagggg ggccaaagca 2700

ctaacagaca taataccact aactgaagaa gcagaattgg agttggcaga aaacagggaa 2760

attctaaaag aaccagtaca tggagcatat tatgacccat caaaagactt gatagctgaa 2820

atacagaaac aggggcagga ccaatggaca tatcaaattt accaagaacc attcaaaaat 2880

ctgaaaacag ggaaatatgc aaaaatgagg actgcccaca ctaatgatgt aaaacagtta 2940

acagaggctg tgcagaaaat atccatggaa agcatagtaa tatggggaaa aattcctaaa 3000

tttaggttac ccatcccaaa agaaacctgg gagacacggt ggacagccta ttggcaagcc 3060

acctggattc ctgagtggga atttgttaat acccctccct tagtaaaatt atggtaccag 3120

ctggagaaag atcccatagc aggagtagaa actttctatg tagatggagc agctaatagg 3180

gaaattaaaa tgggaaaagc agggtatgtt actgacagag gaaggcagaa aattgtgtct 3240

ctaactgaaa caacaaatca gaagactgaa ttgcaagcaa tttgtctagc tttgcaagat 3300

tcaggatcag aagtaaatat agtaacagat tcacagtatg cattaggaat cattcaagca 3360

caaccagata agagtgagtc agagttagtt aaccaaataa tagaacaatt aataaaaaag 3420

gaaagggtct acctgtcgtg ggtaccagca cataaaggaa ttggaggaaa tgaacaagta 3480

gataaattag taagtaatgg aatcaggaaa gtgctatttc tagatggaat agataaagct 3540

caagaagagc atgaaaagta tcacagcaat tggagagcaa tggctagtga ctttaatctg 3600

ccacccatag tagcaaaaga aatagtagct agctgtgatc aatgtcagct aaaaggggaa 3660

gccatgcatg gacaagtaga ctgtagtcca gggatatggc aattagattg tacacattta 3720

gaaggaaaaa tcatcctggt agcagtccat gtagccagtg gctacataga agcagaagtt 3780

atcccagcag aaacaggaca agaaacagca tactttatac taaaattagc aggaagatgg 3840

ccagtcaaaa taatacatac agacaatggt agcaatttca ccagtgctgc agttaaggca 3900

gcctgttggt gggcaggtat ccaacaggaa tttggaattc cctacaatcc ccaaagtcag 3960

ggagtagtag aatccatgaa taaagaatta aagaaaatta tagggcaggt aagagatcaa 4020

gctgagcacc ttaagacagc agtacaaatg gcagtattca ttcacaattt taaaagaaaa 4080

ggggggattg gggggtacag tgcaggggaa agaataatag acataatagc aacagacata 4140

caaactaaag aattacaaaa acaaattata aagattcaaa attttcgggt ttattacaga 4200

gacagcagag accccatttg gaaaggacca gccaaactac tctggaaagg tgaaggggca 4260

gtagtaatac aagataatag tgacataaag gtagtaccaa ggaggaaagc aaaaatcatt 4320

aagggctatg gaaaacagat ggcaggtgct gattgtgtgg caagtagaca ggatgaagat 4380

tagtaatttt ttatgcggcc gcta 4404

<210>20

<211>1457

<212>PRT

<213>人(Homo sapiens)

<400>20

Met Asp Ala Met Lys Arg Gly Leu Cys Cys Val Leu Leu Leu Cys Gly

1 5 10 15

Ala Val Phe Val Ser AlaArg Met Gly Ala Arg Ala Ser Ile Leu Arg

20 25 30

Gly Gly Lys Leu Asp Lys Trp Glu Lys Ile Arg Leu Arg Pro Gly Gly

35 40 45

Lys Lys His Tyr Met Leu Lys His Ile Val Trp Ala Ser Arg Glu Leu

50 55 60

Glu Arg Phe Ala Leu Asn Pro Gly Leu Leu Glu Thr Ser Glu Gly Cys

65 70 75 80

Lys Gln Ile Ile Lys Gln Leu Gln Pro Ala Leu Gln Thr Gly Thr Glu

85 90 95

Glu Leu Arg Ser Leu Phe Asn Thr Val Ala Thr Leu Tyr Cys Val His

100 105 110

Ala Gly Ile Glu Val Arg Asp Thr Lys Glu Ala Leu Asp Lys Ile Glu

115 120 125

Glu Glu Gln Asn Lys Met Gln Gln Lys Thr Gln Gln Ala Lys Glu Ala

130 135 140

Asp Gly Lys Val Ser Gln Asn Tyr Pro Ile Val Gln Asn Leu Gln Gly

145 150 155 160

Gln Met Val His Gln Ala Ile Ser Pro Arg Thr Leu Asn Ala Trp Val

165 170 175

Lys Val Ile Glu Glu Lys Ala Phe Ser Pro Glu Val Ile Pro Met Phe

180 185 190

Thr Ala Leu Ser Glu Gly Ala Thr Pro Gln Asp Leu Asn Thr Met Leu

195 200 205

Asn Thr Val Gly Gly His Gln Ala Ala Met Gln Met Leu Lys Asp Thr

210 215 220

Ile Asn Glu Glu Ala Ala Glu Trp Asp Arg Val His Pro Val His Ala

225 230 235 240

Gly Pro Ile Ala Pro Gly Gln Met Arg Glu Pro Arg Gly Ser Asp Ile

245 250 255

Ala Gly Thr Thr Ser Thr Leu Gln Gly Gln Ile Ala Trp Met Thr Ser

260 265 270

Asn Pro Pro Val Pro Val Gly Glu Ile Tyr Lys Arg Trp Ile Ile Leu

275 280 285

Gly Leu Asn Lys Ile Val Arg Met Tyr Ser Pro Val Ser Ile Leu Asp

290 295 300

Ile Lys Gln Gly Pro Lys Glu Pro Phe Arg Asp Tyr Val Asp Arg Phe

305 310 315 320

Phe Lys Thr Leu Arg Ala Glu Gln Ala Thr Gln Asp Val Lys Asn Trp

325 330 335

Met Thr Asp Thr Leu Leu Val Gln Asn Ala Asn Pro Asp Cys Lys Thr

340 345 350

Ile Leu Arg Ala Leu Gly Pro Gly Ala Ser Leu Glu Glu Met Met Thr

355 360 365

Ala Cys Gln Gly Val Gly Gly Pro Asn His Lys Ala Arg Val Leu Ala

370 375 380

Glu Ala Met Ser Gln Ala Asn Gly Thr Ile Leu Met Gln Arg Ser Asn

385 390 395 400

Phe Lys Gly Ser Lys Arg Ile Val Lys Cys Phe Asn Cys Gly Lys Glu

405 410 415

Gly His Ile Ala Arg Asn Cys Arg Ala Pro Arg Lys Lys Gly Cys Trp

420 425 430

Lys Cys Gly Lys Glu Gly His Gln Met Lys Asp Cys Thr Glu Arg Gln

435 440 445

Ala Asn Phe Leu Gly Lys Ile Trp Pro Pro His Lys Gly Arg Pro Gly

450 455 460

Asn Phe Leu Gln Ser Arg Pro Glu Pro Thr Ala Pro Pro Ala Glu Ser

465 470 475 480

Phe Gly Phe Glu Glu Thr Thr Pro Ala Pro Leu Gln Glu Pro Lys Asp

485 490 495

Arg Glu Pro Leu Thr Ser Leu Lys Ser Leu Phe Gly Ser Asp Pro Leu

500 505 510

Ser Gln Pro Gln Ile Thr Leu Trp Gln Arg Pro Leu Val Ser Ile Arg

515 520 525

Val Gly Gly Gln Ile Lys Glu Ala Leu Leu Asp Asp Thr Val Leu Glu

530 535 540

Glu Val Asn Leu Pro Gly Lys Trp Lys Pro Lys Met Ile Gly Gly Ile

545 550 555 560

Gly Gly Phe Ile Lys Val Arg Gln Tyr Asp Gln Ile Pro Ile Glu Ile

565 570 575

Cys Gly Lys Lys Ala Ile Gly Thr Val Leu Val Gly Pro Thr Pro Val

580 585 590

Asn Ile Ile Gly Arg Asn Met Leu Thr Gln Leu Gly Cys Thr Leu Asn

595 600 605

Phe Pro Ile Ser Pro Ile Glu Thr Ile Pro Val Lys Leu Lys Pro Gly

610 615 620

Met Asp Gly Pro Arg Val Lys Gln Trp Pro Leu Thr Glu Glu Lys Ile

625 630 635 640

Lys Ala Leu Thr Ala Ile Cys Asp Glu Met Glu Lys Glu Gly Lys Ile

645 650 655

Thr Lys Ile Gly Pro Glu Asn Pro Tyr Asn Thr Pro Val Phe Ala Ile

660 665 670

Lys Lys Lys Asp Ser Thr Lys Trp Arg Lys Leu Val Asp Phe Arg Glu

675 680 685

Leu Asn Lys Arg Thr Gln Asp Phe Trp Glu Val Gln Leu Gly Ile Pro

690 695 700

His Pro Ala Gly Leu Lys Lys Lys Lys Ser Val Thr Val Leu Asp Val

705 710 715 720

Gly Asp Ala Tyr Phe Ser Val Pro Leu Tyr Glu Asp Phe Arg Lys Tyr

725 730 735

Thr Ala Phe Thr Ile Pro Ser Ile Asn Asn Glu Thr Pro Gly Ile Arg

740 745 750

Tyr Gln Tyr Asn Val Leu Pro Gln Gly Trp Lys Gly Ser Pro Ala Ile

755 760 765

Phe Gln Cys Ser Met Ala Lys Ile Leu Glu Pro Phe Arg Ala Gln Asn

770 775 780

Pro Glu Ile Val Ile Tyr Gln Tyr Gly Asp Asp Leu Tyr Val Gly Ser

785 790 795 800

Asp Leu Glu Ile Gly Gln His Arg Ala Lys Ile Glu Glu Leu Arg Glu

805 810 815

His Leu Leu Lys Trp Gly Phe Thr Thr Pro Asp Lys Lys His Gln Lys

820 825 830

Glu Pro Pro Phe Leu Trp Met Gly Tyr Glu Leu His Pro Asp Lys Trp

835 840 845

Thr Val Gln Pro Ile Gln Leu Pro Glu Lys Asp Ser Trp Thr Val Asn

850 855 860

Asp Ile Gln Lys Leu Val Gly Lys Leu Asn Trp Ala Ser Gln Ile Tyr

865 870 875 880

Pro Gly Ile Lys Val Arg Gln Leu Cys Lys Leu Leu Arg Gly Ala Lys

885 890 895

Ala Leu Thr Asp Ile Ile Pro Leu Thr Glu Glu Ala Glu Leu Glu Leu

900 905 910

Ala Glu Asn Arg Glu Ile Leu Lys Glu Pro Val His Gly Ala Tyr Tyr

915 920 925

Asp Pro Ser Lys Asp Leu Ile Ala Glu Ile Gln Lys Gln Gly Gln Asp

930 935 940

Gln Trp Thr Tyr Gln Ile Tyr Gln Glu Pro Phe Lys Asn Leu Lys Thr

945 950 955 960

Gly Lys Tyr Ala Lys Met Arg Thr Ala His Thr Asn Asp Val Lys Gln

965 970 975

Leu Thr Glu Ala Val Gln Lys Ile Ser Met Glu Ser Ile Val Ile Trp

980 985 990

Gly Lys Ile Pro Lys Phe Arg Leu Pro Ile Pro Lys Glu Thr Trp Glu

995 1000 1005

Thr Arg Trp Thr Ala Tyr Trp Gln Ala Thr Trp Ile Pro Glu Trp

1010 1015 1020

Glu Phe Val Asn Thr Pro Pro Leu Val Lys Leu Trp Tyr Gln Leu

1025 1030 1035

Glu Lys Asp Pro Ile Ala Gly Val Glu Thr Phe Tyr Val Asp Gly

1040 1045 1050

Ala Ala Asn Arg Glu Thr Lys Met Gly Lys Ala Gly Tyr Val Thr

1055 1060 1065

Asp Arg Gly Arg Gln Lys Ile Val Ser Leu Thr Glu Thr Thr Asn

1070 1075 1080

Gln Lys Thr Glu Leu Gln Ala Ile Cys Leu Ala Leu Gln Asp Ser

1085 1090 1095

Gly Ser Glu Val Asn Ile Val Thr Asp Ser Gln Tyr Ala Leu Gly

1100 1105 1110

Ils Ile Gln Ala Gln Pro Asp Lys Ser Glu Ser Glu Leu Val Asn

1115 1120 1125

Gln Ile Ile Glu Gln Leu Ile Lys Lys Glu Arg Val Tyr Leu Ser

1130 1135 1140

Trp Val Pro Ala His Lys Gly Ile Gly Gly Asn Glu Gln Val Asp

1145 1150 1155

Lys Leu Val Ser Asn Gly Ile Arg Lys Val Leu Phe Leu Asp Gly

1160 1165 1170

Ile Asp Lys Ala Gln Glu Glu His Glu Lys Tyr His Ser Asn Trp

1175 1180 1185

Arg Ala Met Ala Ser Asp Phe Asn Leu Pro Pro Ile Val Ala Lys

1190 1195 1200

Glu Ile Val Ala Ser Cys Asp Gln Cys Gln Leu Lys Gly Glu Ala

1205 1210 1215

Met His Gly Gln Val Asp Cys Ser Pro Gly Ile Trp Gln Leu Asp

1220 1225 1230

Cys Thr His Leu Gln Gly Lys Ile Ile Leu Val Ala Val His Val

1235 1240 1245

Ala Ser Gly Tyr Ile Glu Ala Glu Val Ile Pro Ala Glu Thr Gly

1250 1255 1260

Gln Glu Thr Ala Tyr Phe Ile Leu Lys Leu Ala Gly Arg Trp Pro

1265 1270 1275

Val Lys Ile Ile His Thr Asp Asn Gly Ser Asn Phe Thr Ser Ala

1280 1285 1290

Ala Val Lys Ala Ala Cys Trp Trp Ala Gly Ile Gln Gln Glu Phe

1295 1300 1305

Gly Ile Pro Tyr Asn Pro Gln Ser Gln Gly Val Val Glu Ser Met

1310 1315 1320

Asn Lys Glu Leu Lys Lys Ile Ile Gly Gln Val Arg Asp Gln Ala

1325 1330 1335

Glu His Leu Lys Thr Ala Val Gln Met Ala Val Phe Ile His Asn

1340 1345 1350

Phe Lys Arg Lys Gly Gly Ile Gly Gly Tyr Ser Ala Gly Glu Arg

1355 1360 1365

Ile Ile Asp Ile Ile Ala Thr Asp Ile Gln Thr Lys Glu Leu Gln

1370 1375 1380

Lys Gln Ile Ile Lys Ile Gln Asn Phe Arg Val Tyr Tyr Arg Asp

1385 1390 1395

Ser Arg Asp Pro Ile Trp Lys Gly Pro Ala Lys Leu Leu Trp Lys

1400 1405 1410

Gly Glu Gly Ala Val Val Ile Gln Asp Asn Ser Asp Ile Lys Val

1415 1420 1425

Val Phe Arg Arg Lys Ala Lys Ile Ile Lys Gly Tyr Gly Lys Gln

1430 1435 1440

Met Ala Gly Ala Asp Cys Val Ala Ser Arg Gln Asp Glu Asp

1445 1450 1455

<210>21

<211>1011

<212>DNA

<213>人(Homo sapiens)

<400>21

gccgccacca tggacgccat gaagcgcggc ctgtgctgcg tgctgctgct gtgcggcgcc 60

gtgttcgtga gcgcccgcat ggggggcaag tggtcaaaaa gtagcatagt tggatggcct 120

gctataagag aaagaataag acgaactgaa ccagcagcag atggggtggg agcagtatct 180

cgagacctgg aaaaacatgg agcaatcaca agtaacaaca cagcagatac taatgctgat 240

tgtgcctggc tagaaacaca agaggaggag gaggtgggtt ttccagtcag acctcaggta 300

cccttaagac caatgacttt taagggagca ttggatctca gcttcttttt aaaagaaaag 360

gggggactgg aagggttaat ttactctaag aaaaggcaag agatccttga tttgtgggtc 420

tatcacacac aaggctactt ccctgactgg cacaactaca caccaggacc aggggtcaga 480

ttcccactga cttttgggtg gtgcttcaag ctagtaccag ttgacccagg ggaagtggaa 540

gaggccaatg aaggagaaaa caactgtttg ctacaccctg tctgccagca tggaatggat 600

gatgaacaca gagaagtatt aaagtggaag tttgacagtc aactagcaca cagacacagg 660

gcccgcgagc tacatccgga gttttacaaa gactgcatgg agccagtaga tcctaaccta 720

gagccctgga accatccagg aagtcagcct gaaactgctt gcaataactg ttattgtaaa 780

cgctgtagct accattgtct agtttgcttt cagaaaaaag gcttaggcat ttcctatggc 840

aggaagaagc ggagacagcg acgaagcgct cctccaagca gtgaggatca tcaaaatcct 900

atatcaaagc agcccttacc ccgaacccag ggggacccga caggctcgga agaatcgaag 960

aagaaggtgg agagcaagac aaaaacagat ccattcgatt agtaattttt t 1011

<210>22

<211>330

<212>PRT

<213>人(Homo sapiens)

<400>22

Met Asp Ala Met Lys Arg Gly Leu Cys Cys Val Leu Leu Leu Cys Gly

1 5 10 15

Ala Val Phe Val Ser Ala Arg Met Gly Gly Lys Trp Ser Lys Ser Ser

20 25 30

Ile Val Gly Trp Pro Ala Ile Arg Glu Arg Ile Arg Arg Thr Glu Pro

35 40 45

Ala Ala Asp Gly Val Gly Ala Val Ser Arg Asp Leu Glu Lys His Gly

50 55 60

Ala Ile Thr Ser Asn Asn Thr Ala Asp Thr Asn Ala Asp Cys Ala Trp

65 70 75 80

Leu Glu Thr Gln Glu Glu Glu Glu Val Gly Phe Pro Val Arg Pro Gln

85 90 95

Val Pro Leu Arg Pro Met Thr Phe Lys Gly Ala Leu Asp Leu Ser Phe

100 105 110

Phe Leu Lys Glu Lys Gly Gly Leu Glu Gly Leu Ile Tyr Ser Lys Lys

115 120 125

Arg Gln Glu Ile Leu Asp Leu Trp Val Tyr His Thr Gln Gly Tyr Phe

130 135 140

Pro Asp Trp His Asn Tyr Thr Pro Gly Pro Gly Val Arg Phe Pro Leu

145 150 155 160

Thr Phe Gly Trp Cys Phe Lys Leu Val Pro Val Asp Pro Gly Glu Val

165 170 175

Glu Glu Ala Asn Glu Gly Glu Asn Asn Cys Leu Leu His Pro Val Cys

180 185 190

Gln His Gly Met Asp Asp Glu His Arg Glu Val Leu Lys Trp Lys Phe

195 200 205

Asp Ser Gln Leu Ala His Arg His Arg Ala Arg Glu Leu His Pro Glu

210 215 220

Phe Tyr Lys Asp Cys Met Glu Pro Val Asp Pro Asn Leu Glu Pro Trp

225 230 235 240

Asn His Pro Gly Ser Gln Pro Glu Thr Ala Cys Asn Asn Cys Tyr Cys

245 250 255

Lys Arg Cys Ser Tyr His Cys Leu Val Cys Phe Gln Lys Lys Gly Leu

260 265 270

Gly Ile Ser Tyr Gly Arg Lys Lys Arg Arg Gln Arg Arg Ser Ala Pro

275 280 285

Pro Ser Ser Glu Asp His Gln Asn Pro Ile Ser Lys Gln Pro Leu Pro

290 295 300

Arg Thr Gln Gly Asp Pro Thr Gly Ser Glu Glu Ser Lys Lys Lys Val

305 310 315 320

Glu Ser Lys Thr Lys Thr Asp Pro Phe Asp

325 330

<210>23

<211>9181

<212>DNA

<213>人免疫缺陷病毒1型

<400>23

ggtctctctg gttagaccag atctgagcct gggagctctc tggctaacta gggaacccac 60

tgcttaagcc tcaataaagc ttgccttgag tgcttcaagt agtgtgtgcc cgtctgttgt 120

gtgactctgg taactagaga tccctcagac ccttttagtc agtgtggaaa atctctagca 180

gtggcgcccg aacagggacc tgaaagcgaa agggaaacca gaggagctct ctcgacgcag 240

gactcggctt gctgaagcgc gcacggcaag aggcgagggg cggcgactgg tgagtacgcc 300

aaaaattttg actagcggag gctagaagga gagagatggg tgcgagagcg tcagtattaa 360

gcgggggaga attagatcga tgggaaaaaa ttcggttaag gccaggggga aagaaaaaat 420

ataaattaaa acatatagta tgggcaagca gggagctaga acgattcgca gttaatcctg 480

gcctgttaga aacatcagaa ggctgtagac aaatactggg acagctacaa ccatcccttc 540

agacaggatc agaagaactt agatcattat ataatacagt agcaaccctc tattgtgtgc 600

atcaaaggat agagataaaa gacaccaagg aagctttaga caagatagag gaagagcaaa 660

acaaaagtaa gaaaaaagca cagcaagcag cagctgacac aggacacagc aatcaggtca 720

gccaaaatta ccctatagtg cagaacatcc aggggcaaat ggtacatcag gccatatcac 780

ctagaacttt aaatgcatgg gtaaaagtag tagaagagaa ggctttcagc ccagaagtga 840

tacccatgtt ttcagcatta tcagaaggag ccaccccaca agatttaaac accatgctaa 900

acacagtggg gggacatcaa gcagccatgc aaatgttaaa agagaccatc aatgaggaag 960

ctgcagaatg ggatagagtg catccagtgc atgcagggcc tattgcacca ggccagatga 1020

gagaaccaag gggaagtgac atagcaggaa ctactagtac ccttcaggaa caaataggat 1080

ggatgacaaa taatccacct atcccagtag gagaaattta taaaagatgg ataatcctgg 1140

gattaaataa aatagtaaga atgtatagcc ctaccagcat tctggacata agacaaggac 1200

caaaggaacc ctttagagac tatgtagacc ggttctataa aactctaaga gccgagcaag 1260

cttcacagga ggtaaaaaat tggatgacag aaaccttgtt ggtccaaaat gcgaacccag 1320

attgtaagac tattttaaaa gcattgggac cagcggctac actagaagaa atgatgacag 1380

catgtcaggg agtaggagga cccggccata aggcaagagt tttggctgaa gcaatgagcc 1440

aagtaacaaa ttcagctacc ataatgatgc agagaggcaa ttttaggaac caaagaaaga 1500

ttgttaagtg tttcaattgt ggcaaagaag ggcacacagc cagaaattgc agggccccta 1560

ggaaaaaggg ctgttggaaa tgtggaaagg aaggacacca aatgaaagat tgtactgaga 1620

gacaggctaa ttttttaggg aagatctggc cttcctacaa gggaaggcca gggaattttc 1680

ttcagagcag accagagcca acagccccac cagaagagag cttcaggtct ggggtagaga 1740

caacaactcc ccctcagaag caggagccga tagacaagga actgtatcct ttaacttccc 1800

tcaggtcact ctttggcaac gacccctcgt cacaataaag ataggggggc aactaaagga 1860

agctctatta gatacaggag cagatgatac agtattagaa gaaatgagtt tgccaggaag 1920

atggaaacca aaaatgatag ggggaattgg aggttttatc aaagtaagac agtatgatca 1980

gatactcata gaaatctgtg gacataaagc tataggtaca gtattagtag gacctacacc 2040

tgtcaacata attggaagaa atctgttgac tcagattggt tgcactttaa attttcccat 2100

tagccctatt gagactgtac cagtaaaatt aaagccagga atggatggcc caaaagttaa 2160

acaatggcca ttgacagaag aaaaaataaa agcattagta gaaatttgta cagagatgga 2220

aaaggaaggg aaaatttcaa aaattgggcc tgaaaatcca tacaatactc cagtatttgc 2280

cataaagaaa aaagacagta ctaaatggag aaaattagta gatttcagag aacttaataa 2340

gagaactcaa gacttctggg aagttcaatt aggaatacca catcccgcag ggttaaaaaa 2400

gaaaaaatca gtaacagtac tggatgtggg tgatgcatat ttttcagttc ccttagatga 2460

agacttcagg aagtatactg catttaccat acctagtata aacaatgaga caccagggat 2520

tagatatcag tacaatgtgc ttccacaggg atggaaagga tcaccagcaa tattccaaag 2580

tagcatgaca aaaatcttag agccttttag aaaacaaaat ccagacatag ttatctatca 2640

atacatggat gatttgtatg taggatctga cttagaaata gggcagcata gaacaaaaat 2700

agaggagctg agacaacatc tgttgaggtg gggacttacc acaccagaca aaaaacatca 2760

gaaagaacct ccattccttt ggatgggtta tgaactccat cctgataaat ggacagtaca 2820

gcctatagtg ctgccagaaa aagacagctg gactgtcaat gacatacaga agttagtggg 2880

gaaattgaat tgggcaagtc agatttaccc agggattaaa gtaaggcaat tatgtaaact 2940

ccttagagga accaaagcac taacagaagt aataccacta acagaagaag cagagctaga 3000

actggcagaa aacagagaga ttctaaaaga accagtacat ggagtgtatt atgacccatc 3060

aaaagactta atagcagaaa tacagaagca ggggcaaggc caatggacat atcaaattta 3120

tcaagagcca tttaaaaatc tgaaaacagg aaaatatgca agaatgaggg gtgcccacac 3180

taatgatgta aaacaattaa cagaggcagt gcaaaaaata accacagaaa gcatagtaat 3240

atggggaaag actcctaaat ttaaactgcc catacaaaag gaaacatggg aaacatggtg 3300

gacagagtat tggcaagcca cctggattcc tgagtgggag tttgttaata cccctccctt 3360

agtgaaatta tggtaccagt tagagaaaga acccatagta ggagcagaaa ccttctatgt 3420

agatggggca gctaacaggg agactaaatt aggaaaagca ggatatgtta ctaatagagg 3480

aagacaaaaa gttgtcaccc taactgacac aacaaatcag aagactgagt tacaagcaat 3540

ttatctagct ttgcaggatt cgggattaga agtaaacata gtaacagact cacaatatgc 3600

attaggaatc attcaagcac aaccagatca aagtgaatca gagttagtca atcaaataat 3660

agagcagtta ataaaaaagg aaaaggtcta tctggcatgg gtaccagcac acaaaggaat 3720

tggaggaaat gaacaagtag ataaattagt cagtgctgga atcaggaaag tactattttt 3780

agatggaata gataaggccc aagatgaaca tgagaaatat cacagtaatt ggagagcaat 3840

ggctagtgat tttaacctgc cacctgtagt agcaaaagaa atagtagcca gctgtgataa 3900

atgtcagcta aaaggagaag ccatgcatgg acaagtagac tgtagtccag gaatatggca 3960

actagattgt acacatttag aaggaaaagt tatcctggta gcagttcatg tagccagtgg 4020

atatatagaa gcagaagtta ttccagcaga aacagggcag gaaacagcat attttctttt 4080

aaaattagca ggaagatggc cagtaaaaac aatacatact gacaatggca gcaatttcac 4140

cggtgctacg gttagggccg cctgttggtg ggcgggaatc aagcaggaat ttggaattcc 4200

ctacaatccc caaagtcaag gagtagtaga atctatgaat aaagaattaa agaaaattat 4260

aggacaggta agagatcagg ctgaacatct taagacagca gtacaaatgg cagtattcat 4320

ccacaatttt aaaagaaaag gggggattgg ggggtacagt gcaggggaaa gaatagtaga 4380

cataatagca acagacatac aaactaaaga attacaaaaa caaattacaa aaattcaaaa 4440

ttttcgggtt tattacaggg acagcagaaa tccactttgg aaaggaccag caaagctcct 4500

ctggaaaggt gaaggggcag tagtaataca agataatagt gacataaaag tagtgccaag 4560

aagaaaagca aagatcatta gggattatgg aaaacagatg gcaggtgatg attgtgtggc 4620

aagtagacag gatgaggatt agaacatgga aaagtttagt aaaacaccat atgtatgttt 4680

cagggaaagc taggggatgg ttttatagac atcactatga aagccctcat ccaagaataa 4740

gttcagaagt acacatccca ctaggggatg ctagattggt aataacaaca tattggggtc 4800

tgcatacagg agaaagagac tggcatttgg gtcagggagt ctccatagaa tggaggaaaa 4860

agagatatag cacacaagta gaccctgaac tagcagacca actaattcat ctgtattact 4920

ttgactgttt ttcagactct gctataagaa aggccttatt aggacacata gttagcccta 4980

ggtgtgaata tcaagcagga cataacaagg taggatctct acaatacttg gcactagcag 5040

cattaataac accaaaaaag ataaagccac ctttgcctag tgttacgaaa ctgacagagg 5100

atagatggaa caagccccag aagaccaagg gccacagagg gagccacaca atgaatggac 5160

actagagctt ttagaggagc ttaagaatga agctgttaga cattttccta ggatttggct 5220

ccatggctta gggcaacata tctatgaaac ttatggggat acttgggcag gagtggaagc 5280

cataataaga attctgcaac aactgctgtt tatccatttt cagaattggg tgtcgacata 5340

gcagaatagg cgttactcga cagaggagag caagaaatgg agccagtaga tcctagacta 5400

gagccctgga agcatccagg aagtcagcct aaaactgctt gtaccaattg ctattgtaaa 5460

aagtgttgct ttcattgcca agtttgtttc ataacaaaag ccttaggcat ctcctatggc 5520

aggaagaagc ggagacagcg acgaagagct catcagaaca gtcagactca tcaagcttct 5580

ctatcaaagc agtaagtagt acatgtaatg caacctatac caatagtagc aatagtagca 5640

ttagtagtag caataataat agcaatagtt gtgtggtcca tagtaatcat agaatatagg 5700

aaaatattaa gacaaagaaa aatagacagg ttaattgata gactaataga aagagcagaa 5760

gacagtggca atgagagtga aggagaaata tcagcacttg tggagatggg ggtggagatg 5820

gggcaccatg ctccttggga tgttgatgat ctgtagtgct acagaaaaat tgtgggtcac 5880

agtctattat ggggtacctg tgtggaagga agcaaccacc actctatttt gtgcatcaga 5940

tgctaaagca tatgatacag aggtacataa tgtttgggcc acacatgcct gtgtacccac 6000

agaccccaac ccacaagaag tagtattggt aaatgtgaca gaaaatttta acatgtggaa 6060

aaatgacatg gtagaacaga tgcatgagga tataatcagt ttatgggatc aaagcctaaa 6120

gccatgtgta aaattaaccc cactctgtgt tagtttaaag tgcactgatt tgaagaatga 6180

tactaatacc aatagtagta gcgggagaat gataatggag aaaggagaga taaaaaactg 6240

ctctttcaat atcagcacaa gcataagagg taaggtgcag aaagaatatg cattttttta 6300

taaacttgat ataataccaa tagataatga tactaccagc tataagttga caagttgtaa 6360

cacctcagtc attacacagg cctgtccaaa ggtatccttt gagccaattc ccatacatta 6420

ttgtgccccg gctggttttg cgattctaaa atgtaataat aagacgttca atggaacagg 6480

accatgtaca aatgtcagca cagtacaatg tacacatgga attaggccag tagtatcaac 6540

tcaactgctg ttaaatggca gtctagcaga agaagaggta gtaattagat ctgtcaattt 6600

cacggacaat gctaaaacca taatagtaca gctgaacaca tctgtagaaa ttaattgtac 6660

aagacccaac aacaatacaa gaaaaagaat ccgtatccag agaggaccag ggagagcatt 6720

tgttacaata ggaaaaatag gaaatatgag acaagcacat tgtaacatta gtagagcaaa 6780

atggaataac actttaaaac agatagctag caaattaaga gaacaatttg gaaataataa 6840

aacaataatc tttaagcaat cctcaggagg ggacccagaa attgtaacgc acagttttaa 6900

ttgtggaggg gaatttttct actgtaattc aacacaactg tttaatagta cttggtttaa 6960

tagtacttgg agtactgaag ggtcaaataa cactgaagga agtgacacaa tcaccctccc 7020

atgcagaata aaacaaatta taaacatgtg gcagaaagta ggaaaagcaa tgtatgcccc 7080

tcccatcagt ggacaaatta gatgttcatc aaatattaca gggctgctat taacaagaga 7140

tggtggtaat agcaacaatg agtccgagat cttcagacct ggaggaggag atatgaggga 7200

caattggaga agtgaattat ataaatataa agtagtaaaa attgaaccat taggagtagc 7260

acccaccaag gcaaagagaa gagtggtgca gagagaaaaa agagcagtgg gaataggagc 7320

tttgttcctt gggttcttgg gagcagcagg aagcactatg ggcgcagcct caatgacgct 7380

gacggtacag gccagacaat tattgtctgg tatagtgcag cagcagaaca atttgctgag 7440

ggctattgag gcgcaacagc atctgttgca actcacagtc tggggcatca agcagctcca 7500

ggcaagaatc ctggctgtgg aaagatacct aaaggatcaa cagctcctgg ggatttgggg 7560

ttgctctgga aaactcattt gcaccactgc tgtgccttgg aatgctagtt ggagtaataa 7620

atctctggaa cagatttgga atcacacgac ctggatggag tgggacagag aaattaacaa 7680

ttacacaagc ttaatacact ccttaattga agaatcgcaa aaccagcaag aaaagaatga 7740

acaagaatta ttggaattag ataaatgggc aagtttgtgg aattggttta acataacaaa 7800

ttggctgtgg tatataaaat tattcataat gatagtagga ggcttggtag gtttaagaat 7860

agtttttgct gtactttcta tagtgaatag agttaggcag ggatattcac cattatcgtt 7920

tcagacccac ctcccaaccc cgaggggacc cgacaggccc gaaggaatag aagaagaagg 7980

tggagagaga gacagagaca gatccattcg attagtgaac ggatccttgg cacttatctg 8040

ggacgatctg cggagcctgt gcctcttcag ctaccaccgc ttgagagact tactcttgat 8100

tgtaacgagg attgtggaac ttctgggacg cagggggtgg gaagccctca aatattggtg 8160

gaatctccta cagtattgga gtcaggaact aaagaatagt gctgttagct tgctcaatgc 8220

cacagccata gcagtagctg aggggacaga tagggttata gaagtagtac aaggagcttg 8280

tagagctatt cgccacatac ctagaagaat aagacagggc ttggaaagga ttttgctata 8340

agatgggtgg caagtggtca aaaagtagtg tgattggatg gcctactgta agggaaagaa 8400

tgagacgagc tgagccagca gcagataggg tgggagcagc atctcgagac ctggaaaaac 8460

atggagcaat cacaagtagc aatacagcag ctaccaatgc tgcttgtgcc tggctagaag 8520

cacaagagga ggaggaggtg ggttttccag tcacacctca ggtaccttta agaccaatga 8580

cttacaaggc agctgtagat cttagccact ttttaaaaga aaagggggga ctggaagggc 8640

taattcactc ccaaagaaga caagatatcc ttgatctgtg gatctaccac acacaaggct 8700

acttccctga ttagcagaac tacacaccag ggccaggggt cagatatcca ctgacctttg 8760

gatggtgcta caagctagta ccagttgagc cagataagat agaagaggcc aataaaggag 8820

agaacaccag cttgttacac cctgtgagcc tgcatgggat ggatgacccg gagagagaag 8880

tgttagagtg gaggtttgac agccgcctag catttcatca cgtggcccga gagctgcatc 8940

cggagtactt caagaactgc tgacatcgag cttgctacaa gggactttcc gctggggact 9000

ttccagggag gcgtggcctg ggcgggactg gggagtggcg agccctcaga tcctgcatat 9060

aagcagctgc tttttgcctg tactgggtct ctctggttag accagatctg agcctgggag 9120

ctctctggct aactagggaa cccactgctt aagcctcaat aaagcttgcc ttgagtgctt 9180

c 9181

<210>24

<211>1503

<212>DNA

<213>人免疫缺陷病毒1型

<220>

<221>CDS

<222>(1)..(1503)

<223>SEQ ID NO：23的位置336-1838上的CDS。

<400>24

atg ggt gcg aga gcg tca gta tta agc ggg gga gaa tta gat cga tgg 48

Met Gly Ala Arg Ala Ser Val Leu Ser Gly Gly Glu Leu Asp Arg Trp

1 5 10 15

gaa aaa att cgg tta agg cca ggg gga aag aaa aaa tat aaa tta aaa 96

Glu Lys Ile Arg Leu Arg Pro Gly Gly Lys Lys Lys Tyr Lys Leu Lys

20 25 30

cat ata gta tgg gca agc agg gag cta gaa cga ttc gca gtt aat cct 144

His Ile Val Trp Ala Ser Arg Glu Leu Glu Arg Phe Ala Val Asn Pro

35 40 45

ggc ctg tta gaa aca tca gaa ggc tgt aga caa ata ctg gga cag cta 192

Gly Leu Leu Glu Thr Ser Glu Gly Cys Arg Gln Ile Leu Gly Gln Leu

50 55 60

caa cca tcc ctt cag aca gga tca gaa gaa ctt aga tca tta tat aat 240

Gln Pro Ser Leu Gln Thr Gly Ser Glu Glu Leu Arg Ser Leu Tyr Asn

65 70 75 80

aca gta gca acc ctc tat tgt gtg cat caa agg ata gag ata aaa gac 288

Thr Val Ala Thr Leu Tyr Cys Val His Gln Arg Ile Glu Ile Lys Asp

85 90 95

acc aag gaa gct tta gac aag ata gag gaa gag caa aac aaa agt aag 336

Thr Lys Glu Ala Leu Asp Lys Ile Glu Glu Glu Gln Asn Lys Ser Lys

100 105 110

aaa aaa gca cag caa gca gca gct gac aca gga cac agc aat cag gtc 384

Lys Lys Ala Gln Gln Ala Ala Ala Asp Thr Gly His Ser Asn Gln Val

115 120 125

agc caa aat tac cct ata gtg cag aac atc cag ggg caa atg gta cat 432

Ser Gln Asn Tyr Pro Ile Val Gln Asn Ile Gln Gly Gln Met Val His

130 135 140

cag gcc ata tca cct aga act tta aat gca tgg gta aaa gta gta gaa 480

Gln Ala Ile Ser Pro Arg Thr Leu Asn Ala Trp Val Lys Val Val Glu

145 150 155 160

gag aag gct ttc agc cca gaa gtg ata ccc atg ttt tca gca tta tca 528

Glu Lys Ala Phe Ser Pro Glu Val Ile Pro Met Phe Ser Ala Leu Ser

165 170 175

gaa gga gcc acc cca caa gat tta aac acc atg cta aac aca gtg ggg 576

Glu Gly Ala Thr Pro Gln Asp Leu Asn Thr Met Leu Asn Thr Val Gly

180 185 190

gga cat caa gca gcc atg caa atg tta aaa gag acc atc aat gag gaa 624

Gly His Gln Ala Ala Met Gln Met Leu Lys Glu Thr Ile Asn Glu Glu

195 200 205

gct gca gaa tgg gat aga gtg cat cca gtg cat gca ggg cct att gca 672

Ala Ala Glu Trp Asp Arg Val His Pro Val His Ala Gly Pro Ile Ala

210 215 220

cca ggc cag atg aga gaa cca agg gga agt gac ata gca gga act act 720

Pro Gly Gln Met Arg Glu Pro Arg Gly Ser Asp Ile Ala Gly Thr Thr

225 230 235 240

agt acc ctt cag gaa caa ata gga tgg atg aca aat aat cca cct atc 768

Ser Thr Leu Gln Glu Gln Ile Gly Trp Met Thr Asn Asn Pro Pro Ile

245 250 255

cca gta gga gaa att tat aaa aga tgg ata atc ctg gga tta aat aaa 816

Pro Val Gly Glu Ile Tyr Lys Arg Trp Ile Ile Leu Gly Leu Asn Lys

260 265 270

ata gta aga atg tat agc cct acc agc att ctg gac ata aga caa gga 864

Ile Val Arg Met Tyr Ser Pro Thr Ser Ile Leu Asp Ile Arg Gln Gly

275 280 285

cca aag gaa ccc ttt aga gac tat gta gac cgg ttc tat aaa act cta 912

Pro Lys Glu Pro Phe Arg Asp Tyr Val Asp Arg Phe Tyr Lys Thr Leu

290 295 300

aga gcc gag caa gct tca cag gag gta aaa aat tgg atg aca gaa acc 960

Arg Ala Glu Gln Ala Ser Gln Glu Val Lys Asn Trp Met Thr Glu Thr

305 310 315 320

ttg ttg gtc caa aat gcg aac cca gat tgt aag act att tta aaa gca 1008

Leu Leu Val Gln Asn Ala Asn Pro Asp Cys Lys Thr Ile Leu Lys Ala

325 330 335

ttg gga cca gcg gct aca cta gaa gaa atg atg aca gca tgt cag gga 1056

Leu Gly Pro Ala Ala Thr Leu Glu Glu Met Met Thr Ala Cys Gln Gly

340 345 350

gta gga gga ccc ggc cat aag gca aga gtt ttg gct gaa gca atg agc 1104

Val Gly Gly Pro Gly His Lys Ala Arg Val Leu Ala Glu Ala Met Ser

355 360 365

caa gta aca aat tca gct acc ata atg atg cag aga ggc aat ttt agg 1152

Gln Val Thr Asn Ser Ala Thr Ile Met Met Gln Arg Gly Asn Phe Arg

370 375 380

aac caa aga aag att gtt aag tgt ttc aat tgt ggc aaa gaa ggg cac 1200

Asn Gln Arg Lys Ile Val Lys Cys Phe Asn Cys Gly Lys Glu Gly His

385 390 395 400

aca gcc aga aat tgc agg gcc cct agg aaa aag ggc tgt tgg aaa tgt 1248

Thr Ala Arg Asn Cys Arg Ala Pro Arg Lys Lys Gly Cys Trp Lys Cys

405 410 415

gga aag gaa gga cac caa atg aaa gat tgt act gag aga cag gct aat 1296

Gly Lys Glu Gly His Gln Met Lys Asp Cys Thr Glu Arg Gln Ala Asn

420 425 430

ttt tta ggg aag atc tgg cct tcc tac aag gga agg cca ggg aat ttt 1344

Phe Leu Gly Lys Ile Trp Pro Ser Tyr Lys Gly Arg Pro Gly Asn Phe

435 440 445

ctt cag agc aga cca gag cca aca gcc cca cca gaa gag agc ttc agg 1392

Leu Gln Ser Arg Pro Glu Pro Thr Ala Pro Pro Glu Glu Ser Phe Arg

450 455 460

tct ggg gta gag aca aca act ccc cct cag aag cag gag ccg ata gac 1440

Ser Gly Val Glu Thr Thr Thr Pro Pro Gln Lys Gln Glu Pro Ile Asp

465 470 475 480

aag gaa ctg tat cct tta act tcc ctc agg tca ctc ttt ggc aac gac 1488

Lys Glu Leu Tyr Pro Leu Thr Ser Leu Arg Ser Leu Phe Gly Asn Asp

485 490 495

ccc tcg tca caa taa 1503

Pro Ser Ser Gln

500

<210>25

<211>500

<212>PRT

<213>人免疫缺陷病毒1型

<400>25

Met Gly Ala Arg Ala Ser Val Leu Ser Gly Gly Glu Leu Asp Arg Trp

1 5 10 15

Glu Lys Ile Arg Leu Arg Pro Gly Gly Lys Lys Lys Tyr Lys Leu Lys

20 25 30

His Ile Val Trp Ala Ser Arg Glu Leu Glu Arg Phe Ala Val Asn Pro

35 40 45

Gly Leu Leu Glu Thr Ser Glu Gly Cys Arg Gln Ile Leu Gly Gln Leu

50 55 60

Gln Pro Ser Leu Gln Thr Gly Ser Glu Glu Leu Arg Ser Leu Tyr Asn

65 70 75 80

Thr Val Ala Thr Leu Tyr Cys Val His Gln Arg Ile Glu Ile Lys Asp

85 90 95

Thr Lys Glu Ala Leu Asp Lys Ile Glu Glu Glu Gln Asn Lys Ser Lys

100 105 110

Lys Lys Ala Gln Gln Ala Ala Ala Asp Thr Gly His Ser Asn Gln Val

115 120 125

Ser Gln Asn Tyr Pro Ile Val Gln Asn Ile Gln Gly Gln Met Val His

130 135 140

Gln Ala Ile Ser Pro Arg Thr Leu Asn Ala Trp Val Lys Val Val Glu

145 150 155 160

Glu Lys Ala Phe Ser Pro Glu Val Ile Pro Met Phe Ser Ala Leu Ser

165 170 175

Glu Gly Ala Thr Pro Gln Asp Leu Asn Thr Met Leu Asn Thr Val Gly

180 185 190

Gly His Gln Ala Ala Met Gln Met Leu Lys Glu Thr Ile Asn Glu Glu

195 200 205

Ala Ala Glu Trp Asp Arg Val His Pro Val His Ala Gly Pro Ile Ala

210 215 220

Pro Gly Gln Met Arg Glu Pro Arg Gly Ser Asp Ile Ala Gly Thr Thr

225 230 235 240

Ser Thr Leu Gln Glu Gln Ile Gly Trp Met Thr Asn Asn Pro Pro Ile

245 250 255

Pro Val Gly Glu Ile Tyr Lys Arg Trp Ile Ile Leu Gly Leu Asn Lys

260 265 270

Ile Val Arg Met Tyr Ser Pro Thr Ser Ile Leu Asp Ile Arg Gln Gly

275 280 285

Pro Lys Glu Pro Phe Arg Asp Tyr Val Asp Arg Phe Tyr Lys Thr Leu

290 295 300

Arg Ala Glu Gln Ala Ser Gln Glu Val Lys Asn Trp Met Thr Glu Thr

305 310 315 320

Leu Leu Val Gln Asn Ala Asn Pro Asp Cys Lys Thr Ile Leu Lys Ala

325 330 335

Leu Gly Pro Ala Ala Thr Leu Glu Glu Met Met Thr Ala Cys Gln Gly

340 345 350

Val Gly Gly Pro Gly His Lys Ala Arg Val Leu Ala Glu Ala Met Ser

355 360 365

Gln Val Thr Asn Ser Ala Thr Ile Met Met Gln Arg Gly Asn Phe Arg

370 375 380

Asn Gln Arg Lys Ile Val Lys Cys Phe Asn Cys Gly Lys Glu Gly His

385 390 395 400

Thr Ala Arg Asn Cys Arg Ala Pro Arg Lys Lys Gly Cys Trp Lys Cys

405 410 415

Gly Lys Glu Gly His Gln Met Lys Asp Cys Thr Glu Arg Gln Ala Asn

420 425 430

Phe Leu Gly Lys Ile Trp Pro Ser Tyr Lys Gly Arg Pro Gly Asn Phe

435 440 445

Leu Gln Ser Arg Pro Glu Pro Thr Ala Pro Pro Glu Glu Ser Phe Arg

450 455 460

Ser Gly Val Glu Thr Thr Thr Pro Pro Gln Lys Gln Glu Pro Ile Asp

465 470 475 480

Lys Glu Leu Tyr Pro Leu Thr Ser Leu Arg Ser Leu Phe Gly Asn Asp

485 490 495

Pro Ser Ser Gln

500

<210>26

<211>3012

<212>DNA

<213>人免疫缺陷病毒1型

<220>

<221>CDS

<222>(1)..(3012)

<223>SEQ ID NO：23的位置1631-4642上的CDS。

<400>26

ttt ttt agg gaa gat ctg gcc ttc cta caa ggg aag gcc agg gaa ttt 48

Phe Phe Arg Glu Asp Leu Ala Phe Leu Gln Gly Lys Ala Arg Glu Phe

1 5 10 15

tct tca gag cag acc aga gcc aac agc ccc acc aga aga gag ctt cag 96

Ser Ser Glu Gln Thr Arg Ala Asn Ser Pro Thr Arg Arg Glu Leu Gln

20 25 30

gtc tgg ggt aga gac aac aac tcc ccc tca gaa gca gga gcc gat aga 144

Val Trp Gly Arg Asp Asn Asn Ser Pro Ser Glu Ala Gly Ala Asp Arg

35 40 45

caa gga act gta tcc ttt aac ttc cct cag gtc act ctt tgg caa cga 192

Gln Gly Thr Val Ser Phe Asn Phe Pro Gln Val Thr Leu Trp Gln Arg

50 55 60

ccc ctc gtc aca ata aag ata ggg ggg caa cta aag gaa gct cta tta 240

Pro Leu Val Thr Ile Lys Ile Gly Gly Gln Leu Lys Glu Ala Leu Leu

65 70 75 80

gat aca gga gca gat gat aca gta tta gaa gaa atg agt ttg cca gga 288

Asp Thr Gly Ala Asp Asp Thr Val Leu Glu Glu Met Ser Leu Pro Gly

85 90 95

aga tgg aaa cca aaa atg ata ggg gga att gga ggt ttt atc aaa gta 336

Arg Trp Lys Pro Lys Met Ile Gly Gly Ile Gly Gly Phe Ile Lys Val

100 105 110

aga cag tat gat cag ata ctc ata gaa atc tgt gga cat aaa gct ata 384

Arg Gln Tyr Asp Gln Ile Leu Ile Glu Ile Cys Gly His Lys Ala Ile

115 120 125

ggt aca gta tta gta gga cct aca cct gtc aac ata att gga aga aat 432

Gly Thr Val Leu Val Gly Pro Thr Pro Val Asn Ile Ile Gly Arg Asn

130 135 140

ctg ttg act cag att ggt tgc act tta aat ttt ccc att agc cct att 480

Leu Leu Thr Gln Ile Gly Cys Thr Leu Asn Phe Pro Ile Ser Pro Ile

145 150 155 160

gag act gta cca gta aaa tta aag cca gga atg gat ggc cca aaa gtt 528

Glu Thr Val Pro Val Lys Leu Lys Pro Gly Met Asp Gly Pro Lys Val

165 170 175

aaa caa tgg cca ttg aca gaa gaa aaa ata aaa gca tta gta gaa att 576

Lys Gln Trp Pro Leu Thr Glu Glu Lys Ile Lys Ala Leu Val Glu Ile

180 185 190

tgt aca gag atg gaa aag gaa ggg aaa att tca aaa att ggg cct gaa 624

Cys Thr Glu Met Glu Lys Glu Gly Lys Ile Ser Lys Ile Gly Pro Glu

195 200 205

aat cca tac aat act cca gta ttt gcc ata aag aaa aaa gac agt act 672

Asn Pro Tyr Asn Thr Pro Val Phe Ala Ile Lys Lys Lys Asp Ser Thr

210 215 220

aaa tgg aga aaa tta gta gat ttc aga gaa ctt aat aag aga act caa 720

Lys Trp Arg Lys Leu Val Asp Phe Arg Glu Leu Asn Lys Arg Thr Gln

225 230 235 240

gac ttc tgg gaa gtt caa tta gga ata cca cat ccc gca ggg tta aaa 768

Asp Phc Trp Glu Val Gln Leu Gly Ile Pro His Pro Ala Gly Leu Lys

245 250 255

aag aaa aaa tca gta aca gta ctg gat gtg ggt gat gca tat ttt tca 816

Lys Lys Lys Ser Val Thr Val Leu Asp Val Gly Asp Ala Tyr Phe Ser

260 265 270

gtt ccc tta gat gaa gac ttc agg aag tat act gca ttt acc ata cct 864

Val Pro Leu Asp Glu Asp Phe Arg Lys Tyr Thr Ala Phe Thr Ile Pro

275 280 285

agt ata aac aat gag aca cca ggg att aga tat cag tac aat gtg ctt 912

Ser Ile Asn Asn Glu Thr Pro Gly Ile Arg Tyr Gln Tyr Asn Val Leu

290 295 300

cca cag gga tgg aaa gga tca cca gca ata ttc caa agt agc atg aca 960

Pro Gln Gly Trp Lys Gly Ser Pro Ala Ile Phe Gln Ser Ser Met Thr

305 310 315 320

aaa atc tta gag cct ttt aga aaa caa aat cca gac ata gtt atc tat 1008

Lys Ile Leu Glu Pro Phe Arg Lys Gln Asn Pro Asp Ile Val Ile Tyr

325 330 335

caa tac atg gat gat ttg tat gta gga tct gac tta gaa ata ggg cag 1056

Gln Tyr Met Asp Asp Leu Tyr Val Gly Ser Asp Leu Glu Ile Gly Gln

340 345 350

cat aga aca aaa ata gag gag ctg aga caa cat ctg ttg agg tgg gga 1104

His Arg Thr Lys Ile Glu Glu Leu Arg Gln His Leu Leu Arg Trp Gly

355 360 365

ctt acc aca cca gac aaa aaa cat cag aaa gaa cct cca ttc ctt tgg 1152

Leu Thr Thr Pro Asp Lys Lys His Gln Lys Glu Pro Pro Phe Leu Trp

370 375 380

atg ggt tat gaa ctc cat cct gat aaa tgg aca gta cag cct ata gtg 1200

Met Gly Tyr Glu Leu His Pro Asp Lys Trp Thr Val Gln Pro Ile Val

385 390 395 400

ctg cca gaa aaa gac agc tgg act gtc aat gac ata cag aag tta gtg 1248

Leu Pro Glu Lys Asp Ser Trp Thr Val Asn Asp Ile Gln Lys Leu Val

405 410 415

ggg aaa ttg aat tgg gca agt cag att tac cca ggg att aaa gta agg 1296

Gly Lys Leu Asn Trp Ala Ser Gln Ile Tyr Pro Gly Ile Lys Val Arg

420 425 430

caa tta tgt aaa ctc ctt aga gga acc aaa gca cta aca gaa gta ata 1344

Gln Leu Cys Lys Leu Leu Arg Gly Thr Lys Ala Leu Thr Glu Val Ile

435 440 445

cca cta aca gaa gaa gca gag cta gaa ctg gca gaa aac aga gag att 1392

Pro Leu Thr Glu Glu Ala Glu Leu Glu Leu Ala Glu Asn Arg Glu Ile

450 455 460

cta aaa gaa cca gta cat gga gtg tat tat gac cca tca aaa gac tta 1440

Leu Lys Glu Pro Val His Gly Val Tyr Tyr Asp Pro Ser Lys Asp Leu

465 470 475 480

ata gca gaa ata cag aag cag ggg caa ggc caa tgg aca tat caa att 1488

Ile Ala Glu Ile Gln Lys Gln Gly Gln Gly Gln Trp Thr Tyr Gln Ile

485 490 495

tat caa gag cca ttt aaa aat ctg aaa aca gga aaa tat gca aga atg 1536

Tyr Gln Glu Pro Phe Lys Asn Leu Lys Thr Gly Lys Tyr Ala Arg Met

500 505 510

agg ggt gcc cac act aat gat gta aaa caa tta aca gag gca gtg caa 1584

Arg Gly Ala His Thr Asn Asp Val Lys Gln Leu Thr Glu Ala Val Gln

515 520 525

aaa ata acc aca gaa agc ata gta ata tgg gga aag act cct aaa ttt 1632

Lys Ile Thr Thr Glu Ser Ile Val Ile Trp Gly Lys Thr Pro Lys Phe

530 535 540

aaa ctg ccc ata caa aag gaa aca tgg gaa aca tgg tgg aca gag tat 1680

Lys Leu Pro Ile Gln Lys Glu Thr Trp Glu Thr Trp Trp Thr Glu Tyr

545 550 555 560

tgg caa gcc acc tgg att cct gag tgg gag ttt gtt aat acc cct ccc 1728

Trp Gln Ala Thr Trp Ile Pro Glu Trp Glu Phe Val Asn Thr Pro Pro

565 570 575

tta gtg aaa tta tgg tac cag tta gag aaa gaa ccc ata gta gga gca 1776

Leu Val Lys Leu Trp Tyr Gln Leu Glu Lys Glu Pro Ile Val Gly Ala

580 585 590

gaa acc ttc tat gta gat ggg gca gct aac agg gag act aaa tta gga 1824

Glu Thr Phe Tyr Val Asp Gly Ala Ala Asn Arg Glu Thr Lys Leu Gly

595 600 605

aaa gca gga tat gtt act aat aga gga aga caa aaa gtt gtc acc cta 1872

Lys Ala Gly Tyr Val Thr Asn Arg Gly Arg Gln Lys Val Val Thr Leu

610 615 620

act gac aca aca aat cag aag act gag tta caa gca att tat cta gct 1920

Thr Asp Thr Thr Asn Gln Lys Thr Glu Leu Gln Ala Ile Tyr Leu Ala

625 630 635 640

ttg cag gat tcg gga tta gaa gta aac ata gta aca gac tca caa tat 1968

Leu Gln Asp Ser Gly Leu Glu Val Asn Ile Val Thr Asp Ser Gln Tyr

645 650 655

gca tta gga atc att caa gca caa cca gat caa agt gaa tca gag tta 2016

Ala Leu Gly Ile Ile Gln Ala Gln Pro Asp Gln Ser Glu Ser Glu Leu

660 665 670

gtc aat caa ata ata gag cag tta ata aaa aag gaa aag gtc tat ctg 2064

Val Asn Gln Ile Ile Glu Gln Leu Ile Lys Lys Glu Lys Val Tyr Leu

675 680 685

gca tgg gta cca gca cac aaa gga att gga ggaaat gaa caa gta gat 2112

Ala Trp Val Pro Ala His Lys Gly Ile Gly Gly Asn Glu Gln Val Asp

690 695 700

aaa tta gtc agt gct gga atc agg aaa gta cta ttt tta gat gga ata 2160

Lys Leu Val Ser Ala Gly Ile Arg Lys Val Leu Phe Leu Asp Gly Ile

705 710 715 720

gat aag gcc caa gat gaa cat gag aaa tat cac agt aat tgg aga gca 2208

Asp Lys Ala Gln Asp Glu His Glu Lys Tyr His Ser Asn Trp Arg Ala

725 730 735

atg gct agt gat ttt aac ctg cca cct gta gta gca aaa gaa ata gta 2256

Met Ala Ser Asp Phe Asn Leu Pro Pro Val Val Ala Lys Glu Ile Val

740 745 750

gcc agc tgt gat aaa tgt cag cta aaa gga gaa gcc atg cat gga caa 2304

Ala Ser Cys Asp Lys Cys Gln Leu Lys Gly Glu Ala Met His Gly Gln

755 760 765

gta gac tgt agt cca gga ata tgg caa cta gat tgt aca cat tta gaa 2352

Val Asp Cys Ser Pro Gly Ile Trp Gln Leu Asp Cys Thr His Leu Glu

770 775 780

gga aaa gtt atc ctg gta gca gtt cat gta gcc agt gga tat ata gaa 2400

Gly Lys Val Ile Leu Val Ala Val His Val Ala Ser Gly Tyr Ile Glu

785 790 795 800

gca gaa gtt att cca gca gaa aca ggg cag gaa aca gca tat ttt ctt 2448

Ala Glu Val Ile Pro Ala Glu Thr Gly Gln Glu Thr Ala Tyr Phe Leu

805 810 815

tta aaa tta gca gga aga tgg cca gta aaa aca ata cat act gac aat 2496

Leu Lys Leu Ala Gly Arg Trp Pro Val Lys Thr Ile His Thr Asp Asn

820 825 830

ggc agc aat ttc acc ggt gct acg gtt agg gcc gcc tgt tgg tgg gcg 2544

Gly Ser Asn Phe Thr Gly Ala Thr Val Arg Ala Ala Cys Trp Trp Ala

835 840 845

gga atc aag cag gaa ttt gga att ccc tac aat ccc caa agt caa gga 2592

Gly Ile Lys Gln Glu Phe Gly Ile Pro Tyr Asn Pro Gln Ser Gln Gly

850 855 860

gta gta gaa tct atg aat aaa gaa tta aag aaa att ata gga cag gta 2640

Val Val Glu Ser Met Asn Lys Glu Leu Lys Lys Ile Ile Gly Gln Val

865 870 875 880

aga gat cag gct gaa cat ctt aag aca gca gta caa atg gca gta ttc 2688

Arg Asp Gln Ala Glu His Leu Lys Thr Ala Val Gln Met Ala Val Phe

885 890 895

atc cac aat ttt aaa aga aaa ggg ggg att ggg ggg tac agt gca ggg 2736

Ile His Asn Phe Lys Arg Lys Gly Gly Ile Gly Gly Tyr Ser Ala Gly

900 905 910

gaa aga ata gta gac ata ata gca aca gac ata caa act aaa gaa tta 2784

Glu Arg Ile Val Asp Ile Ile Ala Thr Asp Ile Gln Thr Lys Glu Leu

915 920 925

caa aaa caa att aca aaa att caa aat ttt cgg gtt tat tac agg gac 2832

Gln Lys Gln Ile Thr Lys Ile Gln Asn Phe Arg Val Tyr Tyr Arg Asp

930 935 940

agc aga aat cca ctt tgg aaa gga cca gca aag ctc ctc tgg aaa ggt 2880

Ser Arg Asn Pro Leu Trp Lys Gly Pro Ala Lys Leu Leu Trp Lys Gly

945 950 955 960

gaa ggg gca gta gta ata caa gat aat agt gac ata aaa gta gtg cca 2928

Glu Gly Ala Val Val Ile Gln Asp Asn Ser Asp Ile Lys Val Val Pro

965 970 975

aga aga aaa gca aag atc att agg gat tat gga aaa cag atg gca ggt 2976

Arg Arg Lys Ala Lys Ile Ile Arg Asp Tyr Gly Lys Gln Met Ala Gly

980 985 990

gat gat tgt gtg gca agt aga cag gat gag gat tag 3012

Asp Asp Cys Val Ala Ser Arg Gln Asp Glu Asp

995 1000

<210>27

<211>1003

<212>PRT

<213>人免疫缺陷病毒1型

<400>27

Phe Phe Arg Glu Asp Leu Ala Phe Leu Gln Gly Lys Ala Arg Glu Phe

1 5 10 15

Ser Ser Glu Gln Thr Arg Ala Asn Ser Pro Thr Arg Arg Glu Leu Gln

20 25 30

Val Trp Gly Arg Asp Asn Asn Ser Pro Ser Glu Ala Gly Ala Asp Arg

35 40 45

Gln Gly Thr Val Ser Phe Asn Phe Pro Gln Val Thr Leu Trp Gln Arg

50 55 60

Pro Leu Val Thr Ile Lys Ile Gly Gly Gln Leu Lys Glu Ala Leu Leu

65 70 75 80

Asp Thr Gly Ala Asp Asp Thr Val Leu Glu Glu Met Ser Leu Pro Gly

85 90 95

Arg Trp Lys Pro Lys Met Ile Gly Gly Ile Gly Gly Phe Ile Lys Val

100 105 110

Arg Gln Tyr Asp Gln Ile Leu Ile Glu Ile Cys Gly His Lys Ala Ile

115 120 125

Gly Thr Val Leu Val Gly Pro Thr Pro Val Asn Ile Ile Gly Arg Asn

130 135 140

Leu Leu Thr Gln Ile Gly Cys Thr Leu Asn Phe Pro Ile Ser Pro Ile

145 150 155 160

Glu Thr Val Pro Val Lys Leu Lys Pro Gly Met Asp Gly Pro Lys Val

165 170 175

Lys Gln Trp Pro Leu Thr Glu Glu Lys Ile Lys Ala Leu Val Glu Ile

180 185 190

Cys Thr Glu Met Glu Lys Glu Gly Lys Ile Ser Lys Ile Gly Pro Glu

195 200 205

Asn Pro Tyr Asn Thr Pro Val Phe Ala Ile Lys Lys Lys Asp Ser Thr

210 215 220

Lys Trp Arg Lys Leu Val Asp Phe Arg Glu Leu Asn Lys Arg Thr Gln

225 230 235 240

Asp Phe Trp Glu Val Gln Leu Gly Ile Pro His Pro Ala Gly Leu Lys

245 250 255

Lys Lys Lys Ser Val Thr Val Leu Asp Val Gly Asp Ala Tyr Phe Ser

260 265 270

Val Pro Leu Asp Glu Asp Phe Arg Lys Tyr Thr Ala Phe Thr Ile Pro

275 280 285

Ser Ile Asn Asn Glu Thr Pro Gly Ile Arg Tyr Gln Tyr Asn Val Leu

290 295 300

Pro Gln Gly Trp Lys Gly Ser Pro Ala Ile Phe Gln Ser Ser Met Thr

305 310 315 320

Lys Ile Leu Glu Pro Phe Arg Lys Gln Asn Pro Asp Ile Val Ile Tyr

325 330 335

Gln Tyr Met Asp Asp Leu Tyr Val Gly Ser Asp Leu Glu Ile Gly Gln

340 345 350

His Arg Thr Lys Ile Glu Glu Leu Arg Gln His Leu Leu Arg Trp Gly

355 360 365

Leu Thr Thr Pro Asp Lys Lys His Gln Lys Glu Pro Pro Phe Leu Trp

370 375 380

Met Gly Tyr Glu Leu His Pro Asp Lys Trp Thr Val Gln Pro Ile Val

385 390 395 400

Leu Pro Glu Lys Asp Ser Trp Thr Val Asn Asp Ile Gln Lys Leu Val

405 410 415

Gly Lys Leu Asn Trp Ala Ser Gln Ile Tyr Pro Gly Ile Lys Val Arg

420 425 430

Gln Leu Cys Lys Leu Leu Arg Gly Thr Lys Ala Leu Thr Glu Val Ile

435 440 445

Pro Leu Thr Glu Glu Ala Glu Leu Glu Leu Ala Glu Asn Arg Glu Ile

450 455 460

Leu Lys Glu Pro Val His Gly Val Tyr Tyr Asp Pro Ser Lys Asp Leu

465 470 475 480

Ile Ala Glu Ile Gln Lys Gln Gly Gln Gly Gln Trp Thr Tyr Gln Ile

485 490 495

Tyr Gln Glu Pro Phe Lys Asn Leu Lys Thr Gly Lys Tyr Ala Arg Met

500 505 510

Arg Gly Ala His Thr Asn Asp Val Lys Gln Leu Thr Glu Ala Val Gln

515 520 525

Lys Ile Thr Thr Glu Ser Ile Val Ile Trp Gly Lys Thr Pro Lys Phe

530 535 540

Lys Leu Pro Ile Gln Lys Glu Thr Trp Glu Thr Trp Trp Thr Glu Tyr

545 550 555 560

Trp Gln Ala Thr Trp Ile Pro Glu Trp Glu Phe Val Asn Thr Pro Pro

565 570 575

Leu Val Lys Leu Trp Tyr Gln Leu Glu Lys Glu Pro Ile Val Gly Ala

580 585 590

Glu Thr Phe Tyr Val Asp Gly Ala Ala Asn Arg Glu Thr Lys Leu Gly

595 600 605

Lys Ala Gly Tyr Val Thr Asn Arg Gly Arg Gln Lys Val Val Thr Leu

610 615 620

Thr Asp Thr Thr Asn Gln Lys Thr Glu Leu Gln Ala Ile Tyr Leu Ala

625 630 635 640

Leu Gln Asp Ser Gly Leu Glu Val Asn Ile Val Thr Asp Ser Gln Tyr

645 650 655

Ala Leu Gly Ile Ile Gln Ala Gln Pro Asp Gln Ser Glu Ser Glu Leu

660 665 670

Val Asn Gln Ile Ile Glu Gln Leu Ile Lys Lys Glu Lys Val Tyr Leu

675 680 685

Ala Trp Val Pro Ala His Lys Gly Ile Gly Gly Asn Glu Gln Val Asp

690 695 700

Lys Leu Val Ser Ala Gly Ile Arg Lys Val Leu Phe Leu Asp Gly Ile

705 710 715 720

Asp Lys Ala Gln Asp Glu His Glu Lys Tyr His Ser Asn Trp Arg Ala

725 730 735

Met Ala Ser Asp Phe Asn Leu Pro Pro Val Val Ala Lys Glu Ile Val

740 745 750

Ala Ser Cys Asp Lys Cys Gln Leu Lys Gly Glu Ala Met His Gly Gln

755 760 765

Val Asp Cys Ser Pro Gly Ile Trp Gln Leu Asp Cys Thr His Leu Glu

770 775 780

Gly Lys Val Ile Leu Val Ala Val His Val Ala Ser Gly Tyr Ile Glu

785 790 795 800

Ala Glu Val Ile Pro Ala Glu Thr Gly Gln Glu Thr Ala Tyr Phe Leu

805 810 815

Leu Lys Leu Ala Gly Arg Trp Pro Val Lys Thr Ile His Thr Asp Asn

820 825 830

Gly Ser Asn Phe Thr Gly Ala Thr Val Arg Ala Ala Cys Trp Trp Ala

835 840 845

Gly Ile Lys Gln Glu Phe Gly Ile Pro Tyr Asn Pro Gln Ser Gln Gly

850 855 860

Val Val Glu Ser Met Asn Lys Glu Leu Lys Lys Ile Ile Gly Gln Val

865 870 875 880

Arg Asp Gln Ala Glu His Leu Lys Thr Ala Val Gln Met Ala Val Phe

885 890 895

Ile His Asn Phe Lys Arg Lys Gly Gly Ile Gly Gly Tyr Ser Ala Gly

900 905 910

Glu Arg Ile Val Asp Ile Ile Ala Thr Asp Ile Gln Thr Lys Glu Leu

915 920 925

Gln Lys Gln Ile Thr Lys Ile Gln Asn Phe Arg Val Tyr Tyr Arg Asp

930 935 940

Ser Arg Asn Pro Leu Trp Lys Gly Pro Ala Lys Leu Leu Trp Lys Gly

945 950 955 960

Glu Gly Ala Val Val Ile Gln Asp Asn Ser Asp Ile Lys Val Val Pro

965 970 975

Arg Arg Lys Ala Lys Ile Ile Arg Asp Tyr Gly Lys Gln Met Ala Gly

980 985 990

Asp Asp Cys Val Ala Ser Arg Gln Asp Glu Asp

995 1000

<210>28

<211>579

<212>DNA

<213>人免疫缺陷病毒1型

<220>

<221>CDS

<222>(1)..(579)

<223>SEQ ID NO：23的位置4587-5165上的CDS。

<400>28

atg gaa aac aga tgg cag gtg atg att gtg tgg caa gta gac agg atg 48

Met Glu Asn Arg Trp Gln Val Met Ile Val Trp Gln Val Asp Arg Met

1 5 10 15

agg att aga aca tgg aaa agt tta gta aaa cac cat atg tat gtt tca 96

Arg Ile Arg Thr Trp Lys Ser Leu Val Lys His His Met Tyr Val Ser

20 25 30

ggg aaa gct agg gga tgg ttt tat aga cat cac tat gaa agc cct cat 144

Gly Lys Ala Arg Gly Trp Phe Tyr Arg His His Tyr Glu Ser Pro His

35 40 45

cca aga ata agt tca gaa gta cac atc cca cta ggg gat gct aga ttg 192

Pro Arg Ile Ser Ser Glu Val His Ile Pro Leu Gly Asp Ala Arg Leu

50 55 60

gta ata aca aca tat tgg ggt ctg cat aca gga gaa aga gac tgg cat 240

Val Ile Thr Thr Tyr Trp Gly Leu His Thr Gly Glu Arg Asp Trp His

65 70 75 80

ttg ggt cag gga gtc tcc ata gaa tgg agg aaa aag aga tat agc aca 288

Leu Gly Gln Gly Val Ser Ile Glu Trp Arg Lys Lys Arg Tyr Ser Thr

85 90 95

caa gta gac cct gaa cta gca gac caa cta att cat ctg tat tac ttt 336

Gln Val Asp Pro Glu Leu Ala Asp Gln Leu Ile His Leu Tyr Tyr Phe

100 105 110

gac tgt ttt tca gac tct gct ata aga aag gcc tta tta gga cac ata 384

Asp Cys Phe Ser Asp Ser Ala Ile Arg Lys Ala Leu Leu Gly His Ile

115 120 125

gtt agc cct agg tgt gaa tat caa gca gga cat aac aag gta gga tct 432

Val Ser Pro Arg Cys Glu Tyr Gln Ala Gly His Asn Lys Val Gly Ser

130 135 140

cta caa tac ttg gca cta gca gca tta ata aca cca aaa aag ata aag 480

Leu Gln Tyr Leu Ala Leu Ala Ala Leu Ile Thr Pro Lys Lys Ile Lys

145 150 155 160

cca cct ttg cct agt gtt acg aaa ctg aca gag gat aga tgg aac aag 528

Pro Pro Leu Pro Ser Val Thr Lys Leu Thr Glu Asp Arg Trp Asn Lys

165 170 175

ccc cag aag acc aag ggc cac aga ggg agc cac aca atg aat gga cac 576

Pro Gln Lys Thr Lys Gly His Arg Gly Ser His Thr Met Asn Gly His

180 185 190

tag 579

<210>29

<211>192

<212>PRT

<213>人免疫缺陷病毒1型

<400> 29

Met Glu Asn Arg Trp Gln Val Met Ile Val Trp Gln Val Asp Arg Met

1 5 10 15

Arg Ile Arg Thr Trp Lys Ser Leu Val Lys His His Met Tyr Val Ser

20 25 30

Gly Lys Ala Arg Gly Trp Phe Tyr Arg His His Tyr Glu Ser Pro His

35 40 45

Pro Arg Ile Ser Ser Glu Val His Ile Pro Leu Gly Asp Ala Arg Leu

50 55 60

Val Ile Thr Thr Tyr Trp Gly Leu His Thr Gly Glu Arg Asp Trp His

65 70 75 80

Leu Gly Gln Gly Val Ser Ile Glu Trp Arg Lys Lys Arg Tyr Ser Thr

85 90 95

Gln Val Asp Pro Glu Leu Ala Asp Gln Leu Ile His Leu Tyr Tyr Phe

100 105 110

Asp Cys Phe Ser Asp Ser Ala Ile Arg Lys Ala Leu Leu Gly His Ile

115 120 125

Val Ser Pro Arg Cys Glu Tyr Gln Ala Gly His Asn Lys Val Gly Ser

130 135 140

Leu Gln Tyr Leu Ala Leu Ala Ala Leu Ile Thr Pro Lys Lys Ile Lys

145 150 155 160

Pro Pro Leu Pro Ser Val Thr Lys Leu Thr Glu Asp Arg Trp Asn Lys

165 170 175

Pro Gln Lys Thr Lys Gly His Arg Gly Ser His Thr Met Asn Gly His

180 185 190

<210>30

<211>237

<212>DNA

<213>人免疫缺陷病毒1型

<220>

<221>CDS

<222>(1)..(237)

<223>SEQ ID NO：23的位置5105-5341上的CDS。

<400>30

atg gaa caa gcc cca gaa gac caa ggg cca cag agg gag cca cac aat 48

Met Glu Gln Ala Pro Glu Asp Gln Gly Pro Gln Arg Glu Pro His Asn

1 5 10 15

gaa tgg aca cta gag ctt tta gag gag ctt aag aat gaa gct gtt aga 96

Glu Trp Thr Leu Glu Leu Leu Glu Glu Leu Lys Asn Glu Ala Val Arg

20 25 30

cat ttt cct agg att tgg ctc cat ggc tta ggg caa cat atc tat gaa 144

His Phe Pro Arg Ile Trp Leu His Gly Leu Gly Gln His Ile Tyr Glu

35 40 45

act tat ggg gat act tgg gca gga gtg gaa gcc ata ata aga att ctg 192

Thr Tyr Gly Asp Thr Trp Ala Gly Val Glu Ala Ile Ile Arg Ile Leu

50 55 60

caa caa ctg ctg ttt atc cat ttt cag aat tgg gtg tcg aca tag 237

Gln Gln Leu Leu Phe Ile His Phe Gln Asn Trp Val Ser Thr

65 70 75

<210>31

<211>78

<212>PRT

<213>人免疫缺陷病毒1型

<400> 31

Met Glu Gln Ala Pro Glu Asp Gln Gly Pro Gln Arg Glu Pro His Asn

1 5 10 15

Glu Trp Thr Leu Glu Leu Leu Glu Glu Leu Lys Asn Glu Ala Val Arg

20 25 30

His Phe Pro Arg Ile Trp Leu His Gly Leu Gly Gln His Ile Tyr Glu

35 40 45

Thr Tyr Gly Asp Thr Trp Ala Gly Val Glu Ala Ile Ile Arg Ile Leu

50 55 60

Gln Gln Leu Leu Phe Ile His Phe Gln Asn Trp Val Ser Thr

65 70 75

<210>32

<211>261

<212>DNA

<213>人免疫缺陷病毒1型

<220>

<22l>CDS

<222>(1)..(261)

<223>SEQ ID NO：23的位置5377-5591和7925-7970上连接的CDS。

<400>32

atg gag cca gta gat cct aga cta gag ccc tgg aag cat cca gga agt 48

Met Glu Pro Val Asp Pro Arg Leu Glu Pro Trp Lys His Pro Gly Ser

l 5 l0 15

cag cct aaa act gct tgt acc aat tgc tat tgt aaa aag tgt tgc ttt 96

Gln Pro Lys Thr Ala Cys Thr Asn Cys Tyr Cys Lys Lys Cys Cys Phe

20 25 30

cat tgc caa gtt tgt ttc ata aca aaa gcc tta ggc atc tcc tat ggc 144

His Cys Gln Val Cys Phe Ile Thr Lys Ala Leu Gly Ile Ser Tyr Gly

35 40 45

agg aag aag cgg aga cag cga cga aga gct cat cag aac agt cag act 192

Arg Lys Lys Arg Arg Gln Arg Arg Arg Ala His Gln Asn Ser Gln Thr

50 55 60

cat caa gct tct cta tca aag caa ccc acc tcc caa ccc cga ggg gac 240

His Gln Ala Ser Leu Ser Lys Gln Pro Thr Ser Gln Pro Arg Gly Asp

65 70 75 80

ccg aca ggc ccg aag gaa tag 261

Pro Thr Gly Pro Lys Glu

85

<210>33

<211>86

<212>PRT

<213>人免疫缺陷病毒1型

<400>33

Met Glu Pro Val Asp Pro Arg Leu Glu Pro Trp Lys His Pro Gly Ser

1 5 10 15

Gln Pro Lys Thr Ala Cys Thr Asn Cys Tyr Cys Lys Lys Cys Cys Phe

20 25 30

His Cys Gln Val Cys Phe Ile Thr Lys Ala Leu Gly Ile Ser Tyr Gly

35 40 45

Arg Lys Lys Arg Arg Gln Arg Arg Arg Ala His Gln Asn Ser Gln Thr

50 55 60

His Gln Ala Ser Leu Ser Lys Gln Pro Thr Ser Gln Pro Arg Gly Asp

65 70 75 80

Pro Thr Gly Pro Lys Glu

85

<210>34

<211>351

<212>DNA

<213>人免疫缺陷病毒1型

<220>

<221>CDS

<222>(1)..(351)

<223>SEQ ID NO：23的位置5516-5591和7925-8199上连接的CDS。

<400>34

atg gca gga aga agc gga gac agc gac gaa gag ctc atc aga aca gtc 48

Met Ala Gly Arg Ser Gly Asp Ser Asp Glu Glu Leu Ile Arg Thr Val

1 5 10 15

aga ctc atc aag ctt ctc tat caa agc aac cca cct ccc aac ccc gag 96

Arg Leu Ile Lys Leu Leu Tyr Gln Ser Asn Pro Pro Pro Asn Pro Glu

20 25 30

ggg acc cga cag gcc cga agg aat aga aga aga agg tgg aga gag aga 144

Gly Thr Arg Gln Ala Arg Arg Asn Arg Arg Arg Arg Trp Arg Glu Arg

35 40 45

cag aga cag atc cat tcg att agt gaa cgg atc ctt ggc act tat ctg 192

Gln Arg Gln Ile His Ser Ile Ser Glu Arg Ile Leu Gly Thr Tyr Leu

50 55 60

gga cga tct gcg gag cct gtg cct ctt cag cta cca ccg ctt gag aga 240

Gly Arg Ser Ala Glu Pro Val Pro Leu Gln Leu Pro Pro Leu Glu Arg

65 70 75 80

ctt act ctt gat tgt aac gag gat tgt gga act tct ggg acg cag ggg 288

Leu Thr Leu Asp Cys Asn Glu Asp Cys Gly Thr Ser Gly Thr Gln Gly

85 90 95

gtg gga agc cct caa ata ttg gtg gaa tct cct aca gta ttg gag tca 336

Val Gly Ser Pro Gln Ile Leu Val Glu Ser Pro Thr Val Leu Glu Ser

100 105 110

gga act aaa gaa tag 351

Gly Thr Lys Glu

115

<210>35

<211>116

<212>PRT

<213>人免疫缺陷病毒1型

<400>35

Met Ala Gly Arg Ser Gly Asp Ser Asp Glu Glu Leu Ile Arg Thr Val

1 5 10 15

Arg Leu Ile Lys Leu Leu Tyr Gln Ser Asn Pro Pro Pro Asn Pro Glu

20 25 30

Gly Thr Arg Gln Ala Arg Arg Asn Arg Arg Arg Arg Trp Arg Glu Ark

35 40 45

Gln Arg Gln Ile His Ser Ile Ser Glu Arg Ile Leu Gly Thr Tyr Leu

50 55 60

Gly Arg Ser Ala Glu Pro Val Pro Leu Gln Leu Pro Pro Leu Glu Arg

65 70 75 80

Leu Thr Leu Asp Cys Asn Glu Asp Cys Gly Thr Ser Gly Thr Gln Gly

85 90 95

Val Gly Ser Pro Gln Ile Leu Val Glu Ser Pro Thr Val Leu Glu Ser

100 105 110

Gly Thr Lys Glu

115

<210>36

<211>249

<212>DNA

<213>人免疫缺陷病毒1型

<220>

<221>CDS

<222>(1)..(249)

<223>SEQ ID NO：23的位置5608-5856上的CDS。

<400>36

atg caa cct ata cca atagta gca ata gta gca tta gta gta gca ata 48

Met Gln Pro Ile Pro Ile Val Ala Ile Val Ala Leu Val Val Ala Ile

1 5 10 15

ata ata gca ata gtt gtg tgg tcc ata gta atc ata gaa tat agg aaa 96

Ile Ile Ala Ile Val Val Trp Ser Ile Val Ile Ile Glu Tyr Arg Lys

20 25 30

ata tta aga caa aga aaa ata gac agg tta att gat aga cta ata gaa 144

Ile Leu Arg Gln Arg Lys Ile Asp Arg Leu Ile Asp Arg Leu Ile Glu

35 40 45

aga gca gaa gac agt ggc aat gag agt gaa gga gaa ata tca gca ctt 192

Arg Ala Glu Asp Ser Gly Asn Glu Ser Glu Gly Glu Ile Ser Ala Leu

50 55 60

gtg gag atg ggg gtg gag atg ggg cac cat gct cct tgg gat gtt gat 240

Val Glu Met Gly Val Glu Met Gly His His Ala Pro Trp Asp Val Asp

65 70 75 80

gat ctg tag 249

Asp Leu

<210>37

<211>82

<212>PRT

<213>人免疫缺陷病毒1型

<400>37

Met Gln Pro Ile Pro Ile Val Ala Ile Val Ala Leu Val Val Ala Ile

1 5 10 15

Ile Ile Ala Ile Val Val Trp Ser Ile Val Ile Ile Glu Tyr Arg Lys

20 25 30

Ile Leu Arg Gln Arg Lys Ile Asp Arg Leu Ile Asp Arg Leu Ile Glu

35 40 45

Arg Ala Glu Asp Ser Gly Asn Glu Ser Glu Gly Glu Ile Ser Ala Leu

50 55 60

Val Glu Met Gly Val Glu Met Gly His His Ala Pro Trp Asp Val Asp

65 70 75 80

Asp Leu

<210>38

<211>2571

<212>DNA

<213>人免疫缺陷病毒1型

<220>

<221>CDS

<222>(1)..(2571)

<223>SEQ ID NO：23的位置5771-8341上的CDS。

<400>38

atg aga gtg aag gag aaa tat cag cac ttg tgg aga tgg ggg tgg aga 48

Met Arg Val Lys Glu Lys Tyr Gln His Leu Trp Arg Trp Gly Trp Arg

l 5 10 15

tgg ggc acc atg ctc ctt ggg atg ttg atg atc tgt agt gct aca gaa 96

Trp Gly Thr Met Leu Leu Gly Met Leu Met Ile Cys Ser Ala Thr Glu

20 25 30

aaa ttg tgg gtc aca gtc tat tat ggg gta cct gtg tgg aag gaa gca 144

Lys Leu Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Lys Glu Ala

35 40 45

acc acc act cta ttt tgt gca tca gat gct aaa gca tat gat aca gag 192

Thr Thr Thr Leu Phe Cys Ala Ser Asp Ala Lys Ala Tyr Asp Thr Glu

50 55 60

gta cat aat gtt tgg gcc aca cat gcc tgt gta ccc aca gac ccc aac 240

Val His Asn Val Trp Ala Thr His Ala Cys Val Pro Thr Asp Pro Asn

65 70 75 80

cca caa gaa gta gta ttg gta aat gtg aca gaa aat ttt aac atg tgg 288

Pro Gln Glu Val Val Leu Val Asn Val Thr Glu Asn Phe Asn Met Trp

85 90 95

aaa aat gac atg gta gaa cag atg cat gag gat ata atc agt tta tgg 336

Lys Asn Asp Met Val Glu Gln Met His Glu Asp Ile Ile Ser Leu Trp

100 105 110

gat caa agc cta aag cca tgt gta aaa tta acc cca ctc tgt gtt agt 384

Asp Gln Ser Leu Lys Pro Cys Val Lys Leu Thr Pro Leu Cys Val Ser

115 120 125

tta aag tgc act gat ttg aag aat gat act aat acc aat agt agt agc 432

Leu Lys Cys Thr Asp Leu Lys Asn Asp Thr Asn Thr Asn Ser Ser Ser

130 135 140

ggg aga atg ata atg gag aaa gga gag ata aaa aac tgc tct ttc aat 480

Gly Arg Met Ile Met Glu Lys Gly Glu Ile Lys Asn Cys Ser Phe Asn

145 150 155 160

atc agc aca agc ata aga ggt aag gtg cag aaa gaa tat gca ttt ttt 528

Ile Ser Thr Ser Ile Arg Gly Lys Val Gln Lys Glu Tyr Ala Phe Phe

165 170 175

tat aaa ctt gat ata ata cca ata gat aat gat act acc agc tat aag 576

Tyr Lys Leu Asp Ile Ile Pro Ile Asp Asn Asp Thr Thr Ser Tyr Lys

180 185 190

ttg aca agt tgt aac acc tca gtc att aca cag gcc tgt cca aag gta 624

Leu Thr Ser Cys Asn Thr Ser Val Ile Thr Gln Ala Cys Pro Lys Val

195 200 205

tcc ttt gag cca att ccc ata cat tat tgt gcc ccg gct ggt ttt gcg 672

Ser Phe Glu Pro Ile Pro Ile His Tyr Cys Ala Pro Ala Gly Phe Ala

210 215 220

att cta aaa tgt aat aat aag acg ttc aat gga aca gga cca tgt aca 720

Ile Leu Lys Cys Asn Asn Lys Thr Phe Asn Gly Thr Gly Pro Cys Thr

225 230 235 240

aat gtc agc aca gta caa tgt aca cat gga att agg cca gta gta tca 768

Asn Val Ser Thr Val Gln Cys Thr His Gly Ile Arg Pro Val Val Ser

245 250 255

act caa ctg ctg tta aat ggc agt cta gca gaa gaa gag gta gta att 816

Thr Gln Leu Leu Leu Asn Gly Ser Leu Ala Glu Glu Glu Val Val Ile

260 265 270

aga tct gtc aat ttc acg gac aat gct aaa acc ata ata gta cag ctg 864

Arg Ser Val Asn Phe Thr Asp Asn Ala Lys Thr Ile Ile Val Gln Leu

275 280 285

aac aca tct gta gaa att aat tgt aca aga ccc aac aac aat aca aga 912

Asn Thr Ser Val Glu Ile Asn Cys Thr Arg Pro Asn Asn Asn Thr Arg

290 295 300

aaa aga atc cgt atc cag aga gga cca ggg aga gca ttt gtt aca ata 960

Lys Arg Ile Arg Ile Gln Arg Gly Pro Gly Arg Ala Phe Val Thr Ile

305 310 315 320

gga aaa ata gga aat atg aga caa gca cat tgt aac att agt aga gca 1008

Gly Lys Ile Gly Asn Met Arg Gln Ala His Cys Asn Ile Ser Arg Ala

325 330 335

aaa tgg aat aac act tta aaa cag ata gct agc aaa tta aga gaa caa 1056

Lys Trp Asn Asn Thr Leu Lys Gln Ile Ala Ser Lys Leu Arg Glu Gln

340 345 350

ttt gga aat aat aaa aca ata atc ttt aag caa tcc tca gga ggg gac 1104

Phe Gly Asn Asn Lys Thr Ile Ile Phe Lys Gln Ser Ser Gly Gly Asp

355 360 365

cca gaa att gta acg cac agt ttt aat tgt gga ggg gaa ttt ttc tac 1152

Pro Glu Ile Val Thr His Ser Phe Asn Cys Gly Gly Glu Phe Phe Tyr

370 375 380

tgt aat tca aca caa ctg ttt aat agt act tgg ttt aat agt act tgg 1200

Cys Asn Ser Thr Gln Leu Phe Asn Ser Thr Trp Phe Asn Ser Thr Trp

385 390 395 400

agt act gaa ggg tca aat aac act gaa gga agt gac aca atc acc ctc 1248

Ser Thr Glu Gly Ser Asn Asn Thr Glu Gly Ser Asp Thr Ile Thr Leu

405 410 415

cca tgc aga ata aaa caa att ata aac atg tgg cag aaa gta gga aaa 1296

Pro Cys Arg Ile Lys Gln Ile Ile Asn Met Trp Gln Lys Val Gly Lys

420 425 430

gca atg tat gcc cct ccc atc agt gga caa att aga tgt tca tca aat 1344

Ala Met Tyr Ala Pro Pro Ile Ser Gly Gln Ile Arg Cys Ser Ser Asn

435 440 445

att aca ggg ctg cta tta aca aga gat ggt ggt aat agc aac aat gag 1392

Ile Thr Gly Leu Leu Leu Thr Arg Asp Gly Gly Asn Ser Asn Asn Glu

450 455 460

tcc gag atc ttc aga cct gga gga gga gat atg agg gac aat tgg aga 1440

Ser Glu Ile Phe Arg Pro Gly Gly Gly Asp Met Arg Asp Asn Trp Arg

465 470 475 480

agt gaa tta tat aaa tat aaa gta gta aaa att gaa cca tta gga gta 1488

Ser Glu Leu Tyr Lys Tyr Lys Val Val Lys Ile Glu Pro Leu Gly Val

485 490 495

gca ccc acc aag gca aag aga aga gtg gtg cag aga gaa aaa aga gca 1536

Ala Pro Thr Lys Ala Lys Arg Arg Val Val Gln Arg Glu Lys Arg Ala

500 505 510

gtg gga ata gga gct ttg ttc ctt ggg ttc ttg gga gca gca gga agc 1584

Val Gly Ile Gly Ala Leu Phe Leu Gly Phe Leu Gly Ala Ala Gly Ser

515 520 525

act atg ggc gca gcc tca atg acg ctg acg gta cag gcc aga caa tta 1632

Thr Met Gly Ala Ala Ser Met Thr Leu Thr Val Gln Ala Arg Gln Leu

530 535 540

ttg tct ggt ata gtg cag cag cag aac aat ttg ctg agg gct att gag 1680

Leu Ser Gly Ile Val Gln Gln Gln Asn Asn Leu Leu Arg Ala Ile Glu

545 550 555 560

gcg caa cag cat ctg ttg caa ctc aca gtc tgg ggc atc aag cag ctc 1728

Ala Gln Gln His Leu Leu Gln Leu Thr Val Trp Gly Ile Lys Gln Leu

565 570 575

cag gca aga atc ctg gct gtg gaa aga tac cta aag gat caa cag ctc 1776

Gln Ala Arg Ile Leu Ala Val Glu Arg Tyr Leu Lys Asp Gln Gln Leu

580 585 590

ctg ggg att tgg ggt tgc tct gga aaa ctc att tgc acc act gct gtg 1824

Leu Gly Ile Trp Gly Cys Ser Gly Lys Leu Ile Cys Thr Thr Ala Val

595 600 605

cct tgg aat gct agt tgg agt aat aaa tct ctg gaa cag att tgg aat 1872

Pro Trp Asn Ala Ser Trp Ser Asn Lys Ser Leu Glu Gln Ile Trp Asn

610 615 620

cac acg acc tgg atg gag tgg gac aga gaa att aac aat tac aca agc 1920

His Thr Thr Trp Met Glu Trp Asp Arg Glu Ile Asn Asn Tyr Thr Ser

625 630 635 640

tta ata cac tcc tta att gaa gaa tcg caa aac cag caa gaa aag aat 1968

Leu Ile His Ser Leu Ile Glu Glu Ser Gln Asn Gln Gln Glu Lys Asn

645 650 655

gaa caa gaa tta ttg gaa tta gat aaa tgg gca agt ttg tgg aat tgg 2016

Glu Gln Glu Leu Leu Glu Leu Asp Lys Trp Ala Ser Leu Trp Asn Trp

660 665 670

ttt aac ata aca aat tgg ctg tgg tat ata aaa tta ttc ata atg ata 2064

Phe Asn Ile Thr Asn Trp Leu Trp Tyr Ile Lys Leu Phe Ile Met Ile

675 680 685

gta gga ggc ttg gta ggt tta aga ata gtt ttt gct gta ctt tct ata 2112

Val Gly Gly Leu Val Gly Leu Arg Ile Val Phe Ala Val Leu Ser Ile

690 695 700

gtg aat aga gtt agg cag gga tat tca cca tta tcg ttt cag acc cac 2160

Val Asn Arg Val Arg Gln Gly Tyr Ser Pro Leu Ser Phe Gln Thr His

705 710 715 720

ctc cca acc ccg agg gga ccc gac agg ccc gaa gga ata gaa gaa gaa 2208

Leu Pro Thr Pro Arg Gly Pro Asp Arg Pro Glu Gly Ile Glu Glu Glu

725 730 735

ggt gga gag aga gac aga gac aga tcc att cga tta gtg aac gga tcc 2256

Gly Gly Glu Arg Asp Arg Asp Arg Ser Ile Arg Leu Val Asn Gly Ser

740 745 750

ttg gca ctt atc tgg gac gat ctg cgg agc ctg tgc ctc ttc agc tac 2304

Leu Ala Leu Ile Trp Asp Asp Leu Arg Ser Leu Cys Leu Phe Ser Tyr

755 760 765

cac cgc ttg aga gac tta ctc ttg att gta acg agg att gtg gaa ctt 2352

His Arg Leu Arg Asp Leu Leu Leu Ile Val Thr Arg Ile Val Glu Leu

770 775 780

ctg gga cgc agg ggg tgg gaa gcc ctc aaa tat tgg tgg aat ctc cta 2400

Leu Gly Arg Arg Gly Trp Glu Ala Leu Lys Tyr Trp Trp Asn Leu Leu

785 790 795 800

cag tat tgg agt cag gaa cta aag aat agt gct gtt agc ttg ctc aat 2448

Gln Tyr Trp Ser Gln Glu Leu Lys Asn Ser Ala Val Ser Leu Leu Asn

805 810 815

gcc aca gcc ata gca gta gct gag ggg aca gat agg gtt ata gaa gta 2496

Ala Thr Ala Ile Ala Val Ala Glu Gly Thr Asp Arg Val Ile Glu Val

820 825 830

gta caa gga gct tgt aga gct att cgc cac ata cct aga aga ata aga 2544

Val Gln Gly Ala Cys Arg Ala Ile Arg His Ile Pro Arg Arg Ile Arg

835 840 845

cag ggc ttg gaa agg att ttg cta taa 2571

Gln Gly Leu Glu Arg Ile Leu Leu

850 855

<210>39

<211>856

<212>PRT

<213>人免疫缺陷病毒1型

<400>39

Met Arg Val Lys Glu Lys Tyr Gln His Leu Trp Arg Trp Gly Trp Arg

1 5 10 15

Trp Gly Thr Met Leu Leu Gly Met Leu Met Ile Cys Ser Ala Thr Glu

20 25 30

Lys Leu Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Lys Glu Ala

35 40 45

Thr Thr Thr Leu Phe Cys Ala Ser Asp Ala Lys Ala Tyr Asp Thr Glu

50 55 60

Val His Asn Val Trp Ala Thr His Ala Cys Val Pro Thr Asp Pro Asn

65 70 75 80

Pro Gln Glu Val Val Leu Val Asn Val Thr Glu Asn Phe Asn Met Trp

85 90 95

Lys Asn Asp Met Val Glu Gln Met His Glu Asp Ile Ile Ser Leu Trp

100 105 110

Asp Gln Ser Leu Lys Pro Cys Val Lys Leu Thr Pro Leu Cys Val Ser

115 120 125

Leu Lys Cys Thr Asp Leu Lys Asn Asp Thr Asn Thr Asn Ser Ser Ser

130 135 140

Gly Arg Met Ile Met Glu Lys Gly Glu Ile Lys Asn Cys Ser Phe Asn

145 150 155 160

Ile Ser Thr Ser Ile Arg Gly Lys Val Gln Lys Glu Tyr Ala Phe Phe

165 170 175

Tyr Lys Leu Asp Ile Ile Pro Ile Asp Asn Asp Thr Thr Ser Tyr Lys

180 185 190

Leu Thr Ser Cys Asn Thr Ser Val Ile Thr Gln Ala Cys Pro Lys Val

195 200 205

Ser Phe Glu Pro Ile Pro Ile His Tyr Cys Ala Pro Ala Gly Phe Ala

210 215 220

Ile Leu Lys Cys Asn Asn Lys Thr Phe Asn Gly Thr Gly Pro Cys Thr

225 230 235 240

Asn Val Ser Thr Val Gln Cys Thr His Gly Ile Arg Pro Val Val Ser

245 250 255

Thr Gln Leu Leu Leu Asn Gly Ser Leu Ala Glu Glu Glu Val Val Ile

260 265 270

Arg Ser Val Asn Phe Thr Asp Asn Ala Lys Thr Ile Ile Val Gln Leu

275 280 285

Asn Thr Ser Val Glu Ile Asn Cys Thr Arg Pro Asn Asn Asn Thr Arg

290 295 300

Lys Arg Ile Arg Ile Gln Arg Gly Pro Gly Arg Ala Phe Val Thr Ile

305 310 315 320

Gly Lys Ile Gly Asn Met Arg Gln Ala His Cys Asn Ile Ser Arg Ala

325 330 335

Lys Trp Asn Asn Thr Leu Lys Gln Ile Ala Ser Lys Leu Arg Glu Gln

340 345 350

Phe Gly Asn Asn Lys Thr Ile Ile Phe Lys Gln Ser Ser Gly Gly Asp

355 360 365

Pro Glu Ile Val Thr His Ser Phe Asn Cys Gly Gly Glu Phe Phe Tyr

370 375 380

Cys Asn Ser Thr Gln Leu Phe Asn Ser Thr Trp Phe Asn Ser Thr Trp

385 390 395 400

Ser Thr Glu Gly Ser Asn Asn Thr Glu Gly Ser Asp Thr Ile Thr Leu

405 410 415

Pro Cys Arg Ile Lys Gln Ile Ile Asn Met Trp Gln Lys Val Gly Lys

420 425 430

Ala Met Tyr Ala Pro Pro Ile Ser Gly Gln Ile Arg Cys Ser Ser Asn

435 440 445

Ile Thr Gly Leu Leu Leu Thr Arg Asp Gly Gly Asn Ser Asn Asn Glu

450 455 460

Ser Glu Ile Phe Arg Pro Gly Gly Gly Asp Met Arg Asp Asn Trp Arg

465 470 475 480

Ser Glu Leu Tyr Lys Tyr Lys Val Val Lys Ile Glu Pro Leu Gly Val

485 490 495

Ala Pro Thr Lys Ala Lys Arg Arg Val Val Gln Arg Glu Lys Arg Ala

500 505 510

Val Gly Ile Gly Ala Leu Phe Leu Gly Phe Leu Gly Ala Ala Gly Ser

515 520 525

Thr Met Gly Ala Ala Ser Met Thr Leu Thr Val Gln Ala Arg Gln Leu

530 535 540

Leu Ser Gly Ile Val Gln Gln Gln Asn Asn Leu Leu Arg Ala Ile Glu

545 550 555 560

Ala Gln Gln His Leu Leu Gln Leu Thr Val Trp Gly Ile Lys Gln Leu

565 570 575

Gln Ala Arg Ile Leu Ala Val Glu Arg Tyr Leu Lys Asp Gln Gln Leu

580 585 590

Leu Gly Ile Trp Gly Cys Ser Gly Lys Leu Ile Cys Thr Thr Ala Val

595 600 605

Pro Trp Asn Ala Ser Trp Ser Asn Lys Ser Leu Glu Gln Ile Trp Asn

610 615 620

His Thr Thr Trp Met Glu Trp Asp Arg Glu Ile Asn Asn Tyr Thr Ser

625 630 635 640

Leu Ile His Ser Leu Ile Glu Glu Ser Gln Asn Gln Gln Glu Lys Asn

645 650 655

Glu Gln Glu Leu Leu Glu Leu Asp Lys Trp Ala Ser Leu Trp Asn Trp

660 665 670

Phe Asn Ile Thr Asn Trp Leu Trp Tyr Ile Lys Leu Phe Ile Met Ile

675 680 685

Val Gly Gly Leu Val Gly Leu Arg Ile Val Phe Ala Val Leu Ser Ile

690 695 700

Val Asn Arg Val Arg Gln Gly Tyr Ser Pro Leu Ser Phe Gln Thr His

705 710 715 720

Leu Pro Thr Pro Arg Gly Pro Asp Arg Pro Glu Gly Ile Glu Glu Glu

725 730 735

Gly Gly Glu Arg Asp Arg Asp Arg Ser Ile Arg Leu Val Asn Gly Ser

740 745 750

Leu Ala Leu Ile Trp Asp Asp Leu Arg Ser Leu Cys Leu Phe Ser Tyr

755 760 765

His Arg Leu Arg Asp Leu Leu Leu Ile Val Thr Arg Ile Val Glu Leu

770 775 780

Leu Gly Arg Arg Gly Trp Glu Ala Leu Lys Tyr Trp Trp Asn Leu Leu

785 790 795 800

Gln Tyr Trp Ser Gln Glu Leu Lys Asn Ser Ala Val Ser Leu Leu Asn

805 810 815

Ala Thr Ala Ile Ala Val Ala Glu Gly Thr Asp Arg Val Ile Glu Val

820 825 830

Val Gln Gly Ala Cys Arg Ala Ile Arg His Ile Pro Arg Arg Ile Arg

835 840 845

Gln Gly Leu Glu Arg Ile Leu Leu

850 855

<210>40

<211>372

<212>DNA

<213>人免疫缺陷病毒1型

<220>

<221>CDS

<222>(1)..(372)

<223>SEQ ID NO：23的位置8343-8714上的CDS。

<400>40

atg ggt ggc aag tgg tca aaa agt agt gtg att gga tgg cct act gta 48

Met Gly Gly Lys Trp Ser Lys Ser Ser Val Ile Gly Trp Pro Thr Val

1 5 10 15

agg gaa aga atg aga cga gct gag cca gca gca gat agg gtg gga gca 96

Arg Glu Arg Met Arg Arg Ala Glu Pro Ala Ala Asp Arg Val Gly Ala

20 25 30

gca tct cga gac ctg gaa aaa cat gga gca atc aca agt agc aat aca 144

Ala Ser Arg Asp Leu Glu Lys His Gly Ala Ile Thr Ser Ser Asn Thr

35 40 45

gca gct acc aat gct gct tgt gcc tgg cta gaa gca caa gag gag gag 192

Ala Ala Thr Asn Ala Ala Cys Ala Trp Leu Glu Ala Gln Glu Glu Glu

50 55 60

gag gtg ggt ttt cca gtc aca cct cag gta cct tta aga cca atg act 240

Glu Val Gly Phe Pro Val Thr Pro Gln Val Pro Leu Arg Pro Met Thr

65 70 75 80

tac aag gca gct gta gat ctt agc cac ttt tta aaa gaa aag ggg gga 288

Tyr Lys Ala Ala Val Asp Leu Ser His Phe Leu Lys Glu Lys Gly Gly

85 90 95

ctg gaa ggg cta att cac tcc caa aga aga caa gat atc ctt gat ctg 336

Leu Glu Gly Leu Ile His Ser Gln Arg Arg Gln Asp Ile Leu Asp Leu

100 105 110

tgg atc tac cac aca caa ggc tac ttc cct gat tag 372

Trp Ile Tyr His Thr Gln Gly Tyr Phe Pro Asp

115 120

<210>41

<211>123

<212>PRT

<213>人免疫缺陷病毒1型

<400>41

Met Gly Gly Lys Trp Ser Lys Ser Ser Val Ile Gly Trp Pro Thr Val

1 5 10 15

Arg Glu Arg Met Arg Arg Ala Glu Pro Ala Ala Asp Arg Val Gly Ala

20 25 30

Ala Ser Arg Asp Leu Glu Lys His Gly Ala Ile Thr Ser Ser Asn Thr

35 40 45

Ala Ala Thr Asn Ala Ala Cys Ala Trp Leu Glu Ala Gln Glu Glu Glu

50 55 60

Glu Val Gly Phe Pro Val Thr Pro Gln Val Pro Leu Arg Pro Met Thr

65 70 75 80

Tyr Lys Ala Ala Val Asp Leu Ser His Phe Leu Lys Glu Lys Gly Gly

85 90 95

Leu Glu Gly Leu Ile His Ser Gln Arg Arg Gln Asp Ile Leu Asp Leu

100 105 110

Trp Ile Tyr His Thr Gln Gly Tyr Phe Pro Asp

115 120

Claims

1.一种核酸载体，所述载体包含至少一个与启动子有效连接的HIV序列，其中所述HIV序列编码不能装配成病毒颗粒的蛋白。

2.一种包含至少两个HIV序列的核酸载体，其中所述HIV序列分别与各自的启动子有效连接，并且其中所述HIV序列编码不能装配成病毒颗粒的蛋白。

3.权利要求1或2的核酸载体，其中所述HIV序列选自env、gag、pol、tat、rev、nef、vif、vpr、vpu、vpx、其突变体、融合体及其部分。

4.权利要求1或2的核酸载体，其中所述启动子是异源启动子。

5.权利要求4的核酸载体，其中所述异源启动子选自原核启动子、真核启动子和病毒启动子。

6.权利要求2的核酸载体，其中所述启动子是不同的启动子。

7.权利要求1或2的核酸载体，所述载体还包含所述HIV序列的下游转录终止子。

8.权利要求7的核酸载体，其中所述转录终止子是聚腺苷酸化信号。

9.权利要求8的核酸载体，其中所述转录终止子是选自以下的聚腺苷酸化信号：牛生长激素(bGH)聚腺苷酸化信号、SV40聚腺苷酸化信号和痘苗病毒聚腺苷酸化信号。

10.权利要求1或2的核酸载体，其中至少一个HIV序列与异源前导序列有效连接。

11.权利要求10的核酸载体，其中所述前导序列选自组织纤溶酶原激活物(tPA)前导序列、α-因子前导序列、前胰岛素原前导序列、转化酶前导序列、免疫球蛋白A前导序列、卵白蛋白前导序列和β-珠蛋白前导序列。

12.权利要求10的核酸载体，其中病毒颗粒因tPA-gag导致不能装配。

13.权利要求1或2的核酸载体，其中所述HIV序列选自SEQ IDNO：7、SEQ ID NO：9、SEQ ID NO：11、SEQ ID NO：13、SEQ ID NO：17和SEQ ID NO：19。

14.权利要求1或2的核酸载体，所述载体还包括复制起点。

15.权利要求1或2的核酸载体，所述载体还包括选择性标记基因。

16.一种包含至少两个HIV序列的核酸载体，其中所述HIV序列：

a)分别与各自的启动子有效连接，

b)编码不能装配成病毒颗粒的蛋白，

c)至少一个HIV序列与异源前导序列有效连接，所述载体还任选包含下游转录终止子、复制起点和选择性标记基因。

17.权利要求16的核酸载体，其中所述HIV序列编码tPA-env和tPA-gag。

18.权利要求16的核酸载体，其中所述HIV序列是SEQ ID NO：7和SEQ ID NO：9。

19.权利要求16的核酸载体，其中所述HIV序列编码tPA-pol和tPA-nef-tat。

20.权利要求16的核酸载体，其中所述HIV序列是SEQ ID NO：11和SEQ ID NO：13。

21.前述权利要求中任一项的核酸载体，其中所述载体是病毒载体。

22.权利要求21的核酸载体，其中所述病毒载体选自修饰疫苗病毒Ankara(MVA)、ALVAC、NYVAC.1和NYVAC.2。

23.权利要求22的核酸载体，其中所述载体是修饰痘苗病毒Ankara(MVA)载体。

24.权利要求22的核酸载体，其中所述启动子选自痘病毒7.5K启动子、痘病毒40K启动子、痘病毒H5启动子、痘病毒11K启动子、痘病毒I3启动子、痘病毒合成(SYN)启动子和痘病毒合成早期/晚期启动子。

25.一种核酸载体，其中所述载体是修饰痘苗病毒Ankara(MVA)载体，所述载体包含：

a)至少两个插入到MVA基因组缺失位点III的HIV序列；和

b)至少一个插入到MVA基因组缺失位点II的HIV序列；其中所述HIV序列分别与各自的启动子有效连接，并且其中所述HIV序列编码不能装配成病毒颗粒的蛋白。

26.权利要求25的核酸载体，其中所述HIV序列选自env、gag、pol、tat、rev、nef、vif、vpr、vpu、vpx、其突变体、融合体及其部分。

27.权利要求25的核酸载体，其中所述启动子选自痘病毒7.5K启动子、痘病毒40K启动子、痘病毒H5启动子、痘病毒11K启动子、痘病毒I3启动子、痘病毒合成(SYN)启动子和痘病毒合成早期/晚期启动子。

28.权利要求25的核酸载体，其中所述HIV序列还包含异源前导序列。

29.权利要求25的核酸载体，其中所述异源前导序列选自组织纤溶酶原激活物(tPA)前导序列、α-因子前导序列、前胰岛素原前导序列、转化酶前导序列、免疫球蛋白A前导序列、卵白蛋白前导序列和β-珠蛋白前导序列。

30.权利要求25的核酸载体，其中tPA-δV2 env和tPA-gag-pol插入到MVA的缺失位点III，而tPA-nef-tat插入到MVA的缺失位点II。

31.权利要求25的核酸载体，其中SEQ ID NO：17和SEQ IDNO：19插入到MVA的缺失位点III，而SEQ ID NO：21插入到MVA的缺失位点II。

32.一种组合物，所述组合物包含至少一种前述权利要求中任一项的核酸载体。

33.权利要求32的组合物，其中tPA-env和tPA-gag是在第一核酸载体上，而tPA-pol和tPA-nef-tat是在第二核酸载体上。

34.权利要求32的组合物，其中SEQ ID NO：7和SEQ ID NO：9是在第一核酸载体上，而SEQ ID NO：11和SEQ ID NO：13是在第二核酸载体上。

35.权利要求32的组合物，其中至少一种载体是病毒载体。

36.权利要求35的组合物，其中所述病毒载体选自修饰疫苗病毒Ankara(MVA)、ALVAC、NYVAC.1和NYVAC.2。

37.权利要求36的组合物，其中所述病毒载体是MVA载体。

38.权利要求37的组合物，其中：

a)tPA-env和tPA-gag是在第一核酸载体上，而tPA-pol和tPA-nef-tat是在第二核酸载体上；

b)tPA-δ V2 env和tPA-gag-pol插入到MVA的缺失位点III，而tPA-nef-tat插入到MVA的缺失位点II。

39.权利要求37的组合物，其中：

a)SEQ ID NO：7和SEQ ID NO：9是在第一核酸载体上，而SEQ IDNO：11和SEQ ID NO：13是在第二核酸载体上；

b)SEQ ID NO：17和SEQ ID NO：19插入到MVA的缺失位点III，而SEQ ID NO：21插入到MVA的缺失位点II。

40.一种药用组合物，所述组合物包含权利要求1-31中任一项的核酸载体，以及药学上可接受的载体、辅料或赋形剂。

41.一种药用组合物，所述组合物包含权利要求32-39中任一项的组合物，以及药学上可接受的载体、辅料或赋形剂。

42.一种在对HIV相关疾病易感的受试者体内引发免疫应答的方法，所述方法包括将权利要求1-31中任一项的核酸载体给予所述受试者，从而引发抗HIV的免疫应答。

43.一种在对HIV相关疾病易感的受试者体内引发免疫应答的方法，所述方法包括将权利要求32-39中任一项的组合物给予所述受试者，从而引发抗HIV的免疫应答。

44.一种在对HIV相关疾病易感的受试者体内引发免疫应答的方法，所述方法包括将权利要求40或41的组合物给予所述受试者，从而引发抗HIV的免疫应答。

45.一种核酸载体，所述载体包含至少一个有效连接启动子的慢病毒序列，其中所述慢病毒序列编码不能装配成病毒颗粒的蛋白。

46.权利要求45的核酸载体，其中所述慢病毒序列包含HIV、FIV、SIV和EIAV序列。

47.一种包含至少两个慢病毒序列的核酸载体，其中所述慢病毒序列分别与各自的启动子有效连接，并且其中所述HIV序列编码不能装配成病毒颗粒的蛋白。

48.权利要求47的核酸载体，其中所述慢病毒序列包含HIV、FIV、SIV和EIAV序列。

49.一种包含至少两个慢病毒序列的核酸载体，其中所述慢病毒序列：

a)分别与各自的启动子有效连接，

b)编码不能装配成病毒颗粒的蛋白，

c)至少一个慢病毒序列与异源前导序列有效连接，所述载体还任选包含下游转录终止子、复制起点和选择性标记基因。

50.权利要求49的核酸载体，其中所述慢病毒序列包含HIV、FIV、SIV和EIAV序列。

51.一种核酸载体，其中所述载体是修饰痘苗病毒Ankara(MVA)载体，所述载体包含：

a)至少两个插入到MVA基因组缺失位点III的慢病毒序列；和

b)至少一个插入到MVA基因组缺失位点II的慢病毒序列；其中所述慢病毒序列分别与各自的启动子有效连接，并且其中所述慢病毒序列编码不能装配成病毒颗粒的蛋白。

52.权利要求51的核酸载体，其中所述慢病毒序列包含HIV、FIV、SIV和EIAV序列。