CN1255163A

CN1255163A - 化合物

Info

Publication number: CN1255163A
Application number: CN98804929A
Authority: CN
Inventors: S·C·埃默里; D·C·布拉凯
Original assignee: Zeneca Ltd
Current assignee: AstraZeneca UK Ltd; Syngenta Ltd
Priority date: 1997-05-10
Filing date: 1998-05-05
Publication date: 2000-05-31
Anticipated expiration: 2018-05-05
Also published as: EP0979292A2; CA2286875A1; GB2338484A; TR199902731T2; MY140975A; BR9808769A; KR100508136B1; AU7225498A; RU2218404C2; PL337007A1; KR20010012441A; WO1998051787A2; DE69840165D1; ATE412755T1; US6339070B1; IL132348A0; HUP0001931A2; CN1268743C; ZA983931B; GB9922815D0

Abstract

本发明提供一种基因构建体,该构建体编码细胞靶向部分和异源性前体药物活化酶而用作哺乳动物中的药物,其中的基因构建体能够表达细胞靶向部分和酶而作为哺乳动物宿主靶细胞中的缀合物并且其中的缀合物注定要离开此细胞然后选择性定位于由该细胞靶向部分所识别的细胞表面抗原上。

Description

化合物

本发明特别涉及用原位抗体产生以提供增强选择性特别是用于癌症治疗的基因定向的酶前体药物疗法(GDEPT)。

已知基于基因治疗的前体药物治疗方法包括病毒定向的酶前体药物疗法(VDEPT)和基因定向的酶前体药物疗法(GDEPT)，后一个术语同时包括VDEPT和非病毒载体系统。VDEPT包括用带有编码能够活化前体药物酶基因的病毒载体靶向肿瘤细胞。病毒载体进入肿瘤细胞并且由细胞中的该酶基因表达酶，在GDEPT中，其它的方法如显微注射-脂质体运送和受体介导的DNA摄入以及病毒可用于转运编码此酶的基因。

在VDEPT和GDEPT中，该酶基因都受能够在哺乳动物细胞如肿瘤细胞中选择性活化的DNA序列的转录调节(EP 415 731(Wellcome)；Huber等，美国国家科学院院报，88，8039-8043，1991)。尽管达到一定程度的选择性，基因表达也可在非靶细胞中发生且当此方法用于活化前体药物成为潜在细胞毒剂时此效应显然不理想。此外，与用病毒启动子相比，这些调节序列一般将导致该酶表达下降且此将导致在靶组织中转化前体药物能力的下降。

前体药物活化酶在细胞内部的表达与定位具有缺点。前体药物设计受到以下事实的严重限制，即前体药物必须能够穿过细胞膜并且在细胞内由活化酶转成成药之前是无毒的。大多数前体药物利用亲水基团以阻止进入细胞且因此减少细胞毒性。活化酶对前体药物的转移产生可进入细胞的较少亲水性的药物从而产生抗癌效应。当活化酶在细胞内部表达时不可用此方法。另一个缺点是缺乏胞内活化酶的靶细胞将难以攻击因为它们不能够产生活性药物。为了达到此理想的“旁观者活性”(或“邻近细胞杀伤”)，该活性药物将必须能够扩散出含有活化酶的细胞以达到缺乏酶表达的靶细胞。当在细胞内部产生时许多活性药物将不能够逃离该细胞而完成此旁观者效应。

已提出对GDEPT的一些改进从而克服上述的一些问题。首先描述了这样的载体，据称它们通过附着信号肽与跨膜区域到活化酶上而在靶细胞(WO 96/03515)表面上表达活化酶。如果可行，该方法将克服大细胞内部具有活化酶的问题但仍将不得不依赖于能够选择性表达于靶细胞中的转录调节序列从而限制细胞表达。如上述用这些序列也有缺点。其次，描述了导致该酶从靶细胞分泌的载体(WO 96/16179)。在此方法中该酶将能够从其产生位点扩散出去因为其为细胞外的且没有附着到细胞表面上。从靶位点扩散出来的酶将能够在非靶位点活化前体药物从而导致不必要的毒性。为了达到一定的选择性，建议可使用这样的酶前体，即通过病理学相关的蛋白酶将其切割以形成活性酶。通过此方法可能达到一定的选择性但活化仅在靶位点发生是不可能的。此外一旦活化，该酶将仍然自靶位点扩散出去且因此遭受与上述相同的弊端。

对于GDEPT方法，可观察到三个水平的选择性。首先，在细胞感染时期具有选择性从而仅靶向特异性的细胞类型。例如，可通过基因运载系统本身提供细胞选择性。在国际专利申请WO 95/26412(UAB研究基金)中提出了这种选择性的实例，其中描述了掺入细胞持异性配体的修饰腺病毒纤维蛋白的使用。细胞特异性靶向的其它实例包括体外转移基因至特异细胞类群如淋巴细胞中和直接注射DNA至肌肉组织中。

第二档次水平的选择性是在细胞感染后例如通过使用细胞或组织特异性启动子控制基因表达。如果该基因以选择性的方式导入细胞类型中那么选择与该细胞类型中活性相容的启动子是重要的。

第三水平的选择性可认为是表达的基因构建体的选择性。此水平的选择性到目前为止受到很少注意。在国际专利申请WO 96/16179(Wellcome Foundation)中，建议使用这样的酶前体，即通过以病理学相关的蛋白酶切割此前体以形成活性酶。通过此方法可能达到一定的选择性但活化将仅在此靶位点发生是不可能的。此外，一旦活化，该酶将仍然自由从靶位点扩散出来且因此在非靶位点遭受活化前体药物相同的弊端而导致不必要的毒性。

还存在更为选择性GDEPT系统的必要以减少由于错误的前体药物活化而导致正常组织中不必要的效应。

本发明是基于这样的发现，即抗体-异源性酶基因构建体可在胞内表达并用于GDEPT系统(或其它系统如AMIRACS-见下文)中从而由于抗体的特异性进行细胞靶向因而以选择性方式运载可得到的细胞表面上的酶。此方法可任选与任何其它适当的特异性增强技术如靶细胞感染和/或组织特异性表达联合使用。

根据本发明的一个方面，提供了编码细胞靶向抗体和异源性酶的基因构建体从而用作哺乳动物宿主中的药物，其中的基因构建体能够表达抗体和酶作为哺乳动物宿主靶细胞中的缀合物且其中的缀合物可离开细胞然后选择性定位于由该抗体所识别的细胞表面抗原。

根据本发明的另一方面，提供了编码细胞靶向部分和异源前体药物活化酶的基因构建体从而用作哺乳动物宿主中的药物，其中的基因构建体能够表达细胞靶向部分和异源前体药物活化酶作为哺乳动物宿主细胞内的缀合物并且其中的缀合物定向离开此细胞然后选择性定位于由该细胞靶向部分所识别的细胞表面抗原。

“细胞靶向部分”定义为通过识别细胞表面抗原而选择性结合到宿主中特定细胞类型上的任何多肽或其片段。优选此细胞靶向部分为抗体。除抗体以外的细胞靶向部分包括配体如在国际专利申请WO97/26918(癌症研究运动技术有限公司)中所述的用于配体介导的酶前体药物治疗中的那些配体，例如表皮生长因子、heregulin、c-erdB2和血管内皮生长因子，其中以后者为优选的。

“细胞靶向抗体”定义为通过识别细胞表面抗原而选择性结合到宿主中特定细胞类型上的抗体或其片段。优选的细胞靶向抗体为实体瘤特异性抗体，更为优选为直肠结肠癌特异性抗体，更为优选为抗-CEA抗体，更为优选为抗体A5B7或806.077抗体，其中以806.077抗体为尤其优选的抗体。杂交瘤806.077抗体根据布达佩斯条约以许可号96022936于1996年2月29日保藏于欧洲动物细胞保藏中心(ECACC)，PHLS应用微生物及研究中心，Porton Down，Salisbury，Wiltshire SP4 OJG，英国。

抗体A5B7结合人癌胚抗原(CEA)并特别适用于靶向直肠结肠癌。A5B7可获自DAKO有限公司，16 Manor Courtyard，HughendenAvenue，High Wycombe，Bucks HP13 5RE，英国。一般地，该抗体(或抗体片段)-酶缀合物应该至少为二价的，那即是说能够结合至少2种肿瘤相关抗原(可相同或不同)。可通过已知的方法将抗体分子人源化如通过EP239400中公开的“CDR嫁接”或通过US 4816567中所述将例如来自鼠抗体的完整可变区嫁接到人恒定区上(“嵌合抗体”)。人源化抗体对于减少抗体(或抗体片段)的免疫原性可能是有用的。抗体A5B7的人源化版本已公开于国际专利申请WO 92/01059(Celltech)中。

产生单克隆抗体A5B7的杂交瘤保藏于欧洲动物细胞保藏中心，生物部，PHLS应用微生物及研究中心，Porton Down，Salisbury，Wiltshire SP4 OJG，英国。保藏日期为1993年7月14日且许可号为No.93071411。用本领域已知的标准技术如Fenge C，Fraune E &Schuegerl K在“来自培养动物细胞生物制品的制备”(Spier RE，Griffiths JR & Meignier B，编)Butterworth-Heinemann，1991，262-265中所述的技术及Anderson BL & Gruenberg ML在“商业制备单克隆抗体”(Seaver S.编)中所述技术可从保藏的杂交瘤中获取抗体A5B7。

为了维持高水平抗体的产生，这些细胞可能需要通过有限稀释不时地重新克隆。

“异源酶”定义为用于转换已施用至宿主中底物的酶并且该酶天然不存在于宿主中的有关区域。该酶对于哺乳动物宿主也许是外源性的(如，细菌酶如CPG2)或者其可能天然不出现于有关的宿主部分中(例如，用溶菌酶作为ADEPT酶(为了解释ADEPT，见下面)是可能的因为溶菌酶天然不出现于循环中，见US 5433955，Akzo NK)。有关的宿主部分指其中分布有底物的哺乳动物宿主的部分。优选的酶为适于ADEPT或AMIRACS(在癌症病灶中通过失活营救剂的抗代谢物；见Bagshawe(1994)，细胞生物物理24/25，83-91)的酶组ADEPT酶为优选的。抗体导向的酶前体药物治疗(ADEPT)为已知的癌症治疗方法。ADEPT使用交联至酶上的肿瘤选择性抗体。将该缀合物施用至病人(通常静脉内施用)，让其它位于肿瘤病灶并从血液和其它正常组织中清除掉。然后将该前体药物施用至病人，在此其通过(位于肿瘤病灶中的)酶而转换成杀死肿瘤细胞-细胞毒药物。

在96年7月14日公开的国际专利申请WO 96/20011中，我们提出了基于突变人酶的“反极性”ADEPT系统，与例如细菌酶相比，这些酶具有低免疫原性的优点。特定的宿主酶为人胰CPB(见例如，实施例15[D253K]人CPB &16[D253R]人CPB)及其前体药物(见其中的实施例18及19)。将宿主酶突变从而得到与天然宿主酶相比就底物识别而言酶与前体药物间相互作用方式的改变。在我们随后的国际专利申请No PCT/GB 96/01975(97年3月6日公开为WO 97/07796)中描述了用于ADEPT的突变CPB酶/前体药物组合的进一步工件。适于ADEPT的优选酶为任何一种CPG2或反极性的CPB酶，例如任一种[D253K]HCPB，[G251T，D253K]HCPB或[A248S，G251T，D253K]HCPB。优选的CPG2形式为其中的多肽糖基化位点受到突变从而在哺乳动物细胞中表达时防止或减少糖基化的多肽(见，WO 96/03515，癌症研究运动技术中心)；这得到改良的酶活性。进一步的考虑来自这样的酶如需要原区域(Pre-domain)促进正确折叠的CPB；这里原区域或者可单独(反式)表达或者作为融合蛋白的一部分而表达且然后去除。

Sherwood等(1985)在欧洲生化杂志.，148，447-453中描述了从假单胞菌RS-16中大规模纯化CPG2。CPG2可获自应用微生物学及研究中心，Rorton Down，Salisbury，Wiltshire SP4 OJG，英国。CPG2也可通过重组技术获得。CPG2的核苷酸序列编码已由Minton.，N.P等.，在基因，31(1984)，31-38中公开。已报导在大肠杆菌(Chambers，S.P.等.，应用微生物学，生物技术.(1988)，29，572-578)和酵母(Clarke，L.E.等.，J Gen Microbiol，(1985)131，897-904)中此编码序列的表达。全基因合成已由M.Edwards在动物生物技术实验室(1987)，5，38-44中描述过。异源蛋白在大肠杆菌中的表达已由F.A.O.Marston在DNA克隆第III卷，实践方法系列，(IRL出版社(编者D M Glover)，1987，59-88)中综述过。酵母中蛋白的表达已由C.Guthrie和G R Fink编的酶学方法194卷，(学术出版社，1991)中综述过。

只要靶抗原可被筛选并且适当的酶/前体药物组合可以制备、当进行癌症治疗方法时本发明也可应用于其它治疗领域。例如，炎症疾病如类风湿性关节炎可通过例如用对滑液细胞选择性的并融合至能够将前体药物形式的抗炎症药物转换为抗炎症药物酶上的抗体加以治疗，用抗体靶向类风湿性关节炎疾病已由Blakey等，1988，Scand在类风湿病学杂志、增刊、76，279-287中描述过。

抗体与酶之间的“缀合物”可为融合蛋白(共价键)或者此缀合物可通过抗体与原位形成的酶之间的非共价结合而形成、优选该缀合物为融合蛋白的形式，更为优选融合的抗体部分至少为二价的(用于与一价抗体相比改进的结合活性)。缺乏Fc部分的抗体构建体。尤其是Fab或F(ab′)₂片段是优选的。对于CPG2融合(或与任何非单体酶的融合)，特定的考虑适用因为CPG2为二聚体酶并且该抗体优选为二价的因此存在2种分子间不必要竟争二聚化的可能。因此，优选的CPG2融合为这样的融合，即其中的融合蛋白通过连接抗体Fab重链的C末端(即缺乏铰链区)至CPG2分子的N-末端而形成；然后这些Fab-CPG2分子中的2个通过CPG2二聚化区域而二聚化从而形成(Fab-CPG)₂缀合物。对于具有单体酶的抗体构建体，F(ab′)₂片段，尤其是具有人IgG3铰链区的F(ab′)₂片段是优选的。抗体与酶之间的融合可任选通过短肽接头例如(G4S)₃来完成。优选的融合构建体为其中的酶经其重链或轻链融合到此抗体C-末端的那些酶，其中以经抗体重链的融合为优选的。因此，优选的基因构建体为用作这里所述药物的基因构建体，其中的抗体-酶CPG2缀合物为其中的酶经其重链或轻链融合至抗体C-末端的融合蛋白，由此为表达时，编码缀合物的二聚化通过CPG2上的二聚化区域发生。更为优选的基因构建体为用作药物的这样的基因构建体，其中的融合蛋白经过连接抗体Fab重链的C-末端至CPG2分子的N-末端上以形成Fab-CPG2而形成，由此，当表达时2个Fab-CPG2分子经CPG2而二聚化从而形成(Fab-CPG2)₂缀合物。在本发明的另一实施方案中，用作药物的优选基因构建体为这样的构建体，其中的羧肽酶选自[D253K]HCPB，[G251T，D253K]HCPB或[A248S，G251T，D253K]HCPB。

应当注意到如果获得单体形成的天然多聚体酶而同时基本上维持酶活性是可能的，那么单体形式的酶可用于形成本发明的缀合物。类似地，应当注意到如果获得多聚体形式的天然单体酶而同时基本上维持酶活性是可能的，那么多聚体形式的酶可用于形成本发明缀合物。

此缀合物在此表达后注定要通过用分泌引导序列而离开此细胞，当该缀合物穿过细胞膜时被切割掉。优选此分泌引导区为抗体天然存在的分泌引导区。

根据本发明的另一方面，提供了用编码细胞靶向抗体和异源酶的基因构建体制备用于哺乳动物宿主中癌症治疗的药物，其中的基因构建体能够表达抗体和酶作为哺乳动物宿主靶细胞中的缀合物，并且其中的缀合物可离开细胞然后选择性定位于由该抗体所识别的细胞表面抗原。

任何适当的运载系统可应用于运载本发明的基因构建体，包括病毒和非病毒系统，病毒系统包括反转录病毒载体、腺病毒载体、腺伴随病毒、牛痘、单纯疱疹病毒、HIV、小鼠微小病毒、乙型肝炎病毒和流感病毒。非病毒系统包括非复合DNA、DNA-脂质体复合体、DNA-蛋白复合体和DNA-包被的金颗粒。

反转录病毒载体缺乏免疫原性蛋白并且没有预先存在的宿主免疫性但限于感染正在分裂的细胞。反转录病毒已用于临床试验(Rosenberg等.，N.Engl.J.Med.，1990，323：570-578)。反转录病毒由包裹于源自宿主细胞膜包括中的RNA基因组和病毒蛋白所组成。为了基因表达，其必需首先反转录其正链RNA基因组成双链DNA，然后用反转录病毒颗粒中包含的反转录酶和整合酶蛋白将其整合入宿主细胞的DNA中。整合的原病毒能够用宿主细胞装置进行基因表达。

鼠的血病病毒受到广泛使用(Miller等.，酶学方法.，1993，217：581-599)。通过去除gag、pol和env基因从而为有关的有效负载腾出空间并排除该病毒的复制功能而构建反转录病毒载体。去除毒性编码的mRNAs并且此去除了对转导细胞的任何潜在的免疫应答。常包括编码抗生素抗性的基因作为筛选的手段。例如也可包括启动子和增强子功能以在体内施用后提供组织特异性表达。在长末端重复中含有的启动子与增强子功能也可使用。

这些病毒仅可在病毒包装细胞系中产生。包装细胞系可通过以下方式加以构建，即稳定插入缺失的病毒基因(gag、pol和env)至细胞中从而他们位于不同的染色体上以防止重组。包装细胞系用于通过插入重组原病毒DNA构建发生细胞系，这将产生含有有关有效负荷基因的复制缺陷的逆转录病毒。用标准的用于DNA转移和摄入的技术(电穿孔、钙沉淀等)将含有壳体化序列和目的基因的在小部分gag基因两侧含有长末端重复序列的质粒DNA转染入包装细胞系。已经利用该方法的变异体降低产生复制活性病毒的可能性(Jolly，D.，癌症基因治疗，1994，1，51-64)。此病毒的宿主细胞范围通过包被基因(env)加以测定并且具有不同细胞特异性的env基因的替代可以利用。掺入适当的配体至包被蛋白中也可用于靶向。

施用可通过任何适当的技术完成，如通过直接注射病毒至组织中而体外转导患者细胞和通过施用反转录病毒生产者细胞。

体外方法的缺点在于其要求在患者细胞的组织培养物中分离和维持，但其具有这样的优势，即基因转换的程度可容易地定量并且可靶向特定的细胞类群。此外，可达到高比例的病毒颗粒对靶细胞的比例且因此提高转导效率(Anderson等.，人类基因治疗.，1990，1：331-341；Rosenberg等.，N.Engl.J.Med.，1990，323：570-578；Culver等.，人类基因治疗.，1991，2：107-109，Nienhuis等.，癌症，1991，67：2700-2704，Anderson等.，人类基因治疗.，1990，1：331-341，Grossman等.，Nat.Genet.，1994，6：335-341，Lotze等.，人类基因治疗，1992，3：167-177；Lotze，M.T.，细胞移植，1993，2：33-41；Lotze等，人类基因治疗.，1994，5：41-55和美国专利5399346(Anderson)。在有些情况下直接在体内导入病毒是必需的。反转录病毒已用于治疗脑瘤，其中的反转录病毒仅感染正在分裂的细胞(肿瘤细胞)的能力可能是优别优越的。

为了增加效率，Oldfield等在人类基因治疗1993，4：39-69中提出将反转录病毒生产者细胞系直接施用至患者脑瘤中。鼠生产者细胞将在脑瘤中存活一些天，并将分泌能够转录周围脑瘤的反转录病毒。带有疱疹病毒胸苷激酶基因的病毒使细胞对丙氧鸟苷的杀伤易感，该化合物被胸苷激酶代谢成细胞毒性化合物。反转录病毒的专利参考为：EP334301，WO 91/02805及WO 92/05266(Viagene)和；US 4650764(威斯康星大学)。

人腺病毒感染已被描述过(见Horwitz，M.S.，病毒学，第2版.Raven出版社，纽约，1990，pp.1723-1740)。大多数成年人以前曾暴露于腺病毒并且具有抗腺病毒抗体。这些病毒具有双链DNA基因组，并且不随宿主细胞分裂而复制。

腺病毒载体具有优越的特性。它们能够转导广泛的人组织并且可在正在分裂与非正在分裂细胞中获得高水平的基因表达。多种施用途径可以使用，包括静脉内、胆管内、腹膜内、囊泡内(intravesicular)、颅内和椎管内注射，和直接进行靶器官注射。因此，基于解剖边界的靶向是易行的。

腺病毒基因组编码大约15种蛋白并且感染包括纤维蛋白结合至细胞表面受体。病毒衣壳的五邻体基涉及细胞表面上的整合素受体区域(α3β3，或β3β5)从而导致此病毒的内化。病毒DNA进入细胞核并开始转录而无细胞分裂。表达与复制在E1A和E1B基因控制之下(见Horwitz，M.S.，病毒学，第2版，1990，pp.1723-1740)。去除E1基因使病毒复制失活。腺病毒蛋白的表达同时导致可能限制效应特别是对重复施用的限制效应的免疫应答。然而，最近的方法(其中的其它腺病毒基因如E2a基因(其控制纤维柄及许多其它病毒蛋白的表达)也从病毒基因组中去除)可去除或大大降低许多种这些病毒蛋白在靶细胞中的表达。

腺病毒血清型2和5已广泛用于载体构建。Bett等.，美国自然科学院院报，1994，91：8802-8806使用了缺乏E1和E3腺病毒基因的腺病毒血清型5载体系统。293人胚肾细胞系已被加工成表达E1蛋白并可因此反式互补E1-缺陷性的病毒基因组。此病毒可从293细胞培养基中分离并通过有限稀释噬斑分析加以纯化(Graham，F.L.和Prevek，L.分子生物学方法：基因转移和表达方法，Humana出版社，1991，pp.109-128)。重组病毒可在293细胞系培养物中培养并通过裂解感染细胞和氯化铯密度梯度离心纯化而分离。293细胞制备重组病毒的一个困难是由于E1基因额外的侧翼区，它们在病毒颗粒产生过程中可能产生复制感受态的腺病毒(RCA)。尽管此材料仅为野生型腺病毒并且为非复制活性、但其对所需腺病毒材料终产量具有明显影响并导致制备成本增加、制备过程中的质量控制问题及为了临床使用的批量接受问题。已开发出别的细胞系如PER.C6，其较293细胞系具有更为有限的E1基因(即含有不位于病毒序列两侧的序列)，这将不允许有产生RCA的重组事件且因此具有克服上述病毒产生问题的可能。

由于免疫系统清除和靶细胞分裂过程中的稀释丧失，腺病毒载体具有相对较短时间转基因表达的缺点但载体设计的改进又是所预期的。腺病毒的专利参考有：WO 96/03517(Boehringer)，WO 96/13596(Rhone Poulenc Rorer)；WO 95/29993(密西根大学)和；WO96/24969(Canji)。Bilbao等在Exp.Opin.Ther.Patents，1997，7(12)：1427-1446中综述了腺病毒载体用于癌症基因治疗的最新进展，包括开发降低免疫原性的策略。嵌合腺病毒/反转录病毒载体和有条件(或限制的)复制重组腺病毒系统。

腺伴随病毒(AAV)(Kotin，R.M.，人类基因治疗.，1994，5：793-801)为能够整合入很宽宿主范围的非分裂细胞基因组中的单链DNA非自主复制的细小病毒。AAV没有显示出与人类疾病相关并不诱发免疫应答。

AAV具有2种不同的生活周期时相。野生型病毒将感染宿主细胞，整合并保持潜伏状态。在腺病毒存在下，病毒的裂解相受到诱导，其依赖于早期腺病毒基因的表达，并导致活性病毒的复制。AAV基因组由2个开放阅读框(称为rep和cap)所组成，此阅读框两侧为末端反向重复(ITR)序列。rep区域编码四种蛋白，其介导AAV复制、病毒DNA转录和用于宿主基因组整合的核酸内切酶功能。rep基因为病毒复制所需的唯一AAV序列。cap序列编码形成病毒衣壳的结构蛋白。ITRs含有病毒复制起点、提供衣壳化信号、和参与病毒DNA整合。已开发用于基因治疗的重组、复制缺陷型病毒缺乏rep和cap序列。复制缺陷的AAV可通过将AAV复制必需的分离的元件共转染入许可的293细胞系而加以制备。有关AAV的专利参考包括：WO 94/13788(匹兹堡大学)和US 4797368(美国卫生部)。

来自痘病毒的基因治疗载体已经描述过(Moss，B.和Flexner，C.，免疫学年鉴.，1987，5：305-324；Moss，B.，病毒学，1990，pp.2079-2111)。牛痘为大型的在感染细胞的胞浆中复制的包被的DNA病毒。感染来自许多不同组织的非正在分裂和正在分裂细胞，并观察未整合基因组的基因表达。重组病毒可通过将转基因插入来源于牛痘的质粒中并且将此DNA转染入牛痘感染的细胞中而制备，其中的同源重组导致病毒产生。明显的缺点是其诱发对150到200种病毒编码的蛋白的宿主免疫应答，导致重复施用困难。

单纯疱疹病毒为适于基因转移的在感染细胞的细胞核中复制的大型双链DNA病毒(见Kennedy，P.G.E和Steiner，I.，Q.J.Med.，1993，86：697-702)。代替包括广泛的宿主细胞范围，感染正在分裂和非正在分裂的细胞，并且大的外源DNA序列可通过同源重组插入病毒基因组中。缺点是难以去除病毒制品中复制活性的病毒和潜在的免疫应答。病毒胸苷激酶基因的缺失使病毒在具有低水平胸苷激酶的细胞中复制缺失。正在进行活性细胞分裂的细胞(如，肿瘤细胞)具有足够的胸苷激酶活从而产生复制。Cantab药丁有一项有关疱疹病毒的公开的专利申请(WO 92/05263)。

许多种其它病毒，包括HIV、小鼠细小病毒、乙型肝炎病毒和流感病毒被认为是用于基因转移的可能载体(见Jolly，D.，癌症基因治疗，1994，1：51-64)。

也已提出用特异性靶向和复制于低氧环境(如肿瘤坏死中心中所见的环境)中的减毒伤害沙门氏菌作为基于前体药物酶治疗(称为TAPETTM的肿瘤扩增的前体药物酶治疗)的基因转换载体并正由Vion药丁开发之中。此系统为下述的病毒和非病毒转移方法提供了进一步的基因转移方案。

非病毒DNA转移策略也是可用的。这些DNA转移系统包括未复合的质粒DNA、DNA-脂质体复合体、DNA-蛋白复合体，和DNA包被的金颗粒。

纯化的核酸可直接注射入组织并导致例如肌肉组织中暂时的基因表达，这对再生肌肉尤为有效(Wolff等，科学1990，247：1465-1468)。Davis等.，在人类基因治疗.，(1993，4：733-740)中公开了直接将DNA注射入成熟肌肉中。骨骼肌和心肌一般是优选的。专利参考有：WO 90/11092，US 5589466(Vical)和WO 97/05185(用于注射的生物可降解DNA浸渗的水凝胶，Focal)。

金颗粒上的质粒DNA可用基因枪“打”入细胞(如.，表皮或黑素瘤)。将DNA共沉淀于金颗粒上且然后用电火花或高压气体作为推力打入(Fynen等.，美国自然科学院院报，1993，90：11478-11482)。通过用利用多-针排列的电穿孔探针和脉冲旋转电场，电穿孔也用于使DNA能够转移入实体瘤中(Nishi等，癌症研究.，1996，56：1050-1055)。已要求保护向皮下肿瘤的高效基因转换，其与肿瘤内注射方法相比具有显著的细胞转染增强功能和更好的分布特征。

脂质体通过用疏水分子环绕亲水分子以利于细胞进入而发挥作用。脂质体是由脂类所构成的单层或多层球体。脂类的组成和制备方法影响脂质体结构。其它分子可掺入脂膜。脂质体可为阴离子或阴离型。Nicolau等.，美国自然科学院院报.，1983，80：1068-1072公开了由注射入大鼠中的阴离子脂质体进行胰岛素的表达。除非另有靶向，否则阴离子脂质体主要靶向肝脏的网状内皮细胞。分子可掺入脂质体的表面以改变其行为，例如细胞选择性转换(Wu G.Y.和Wu，C.H.生物化学杂志.，1987，262：4429-4432)。

Felgner等.，美国自然科学院院报，1987，84：7413-7417公开了阳离子脂质体、证明其通过静电相互作用而结合核酸并显示出细胞进入当注射于至器官的流入血流中时，静脉内注射阳离子脂质体导致大多数器官的转基因表达。可通过气溶胶施用阳离子脂质体以靶向肺上皮(Brigham等.，美国医学杂志.，1989，289：278-281)。脂质体的专利参考为：WO 90/11092、WO 91/17424、WO 91/16024、WO 93/14788(Vical)和；WO 90/01543(Intracel)。

用阳离子脂质体转基因转移的体内研究已在下面文献中发表：包括Nabel等.，人类基因治疗综述.，1994，5：79-92；Hyde等.，自然，1993，362：250-255和；Conary等.，临床研究杂志.，1994，93：1834-1840)。

正在研究微粒作为转移DNA至吞噬细胞的系统，这种方法已由Pangaea药丁在其ENDOSHERETM微囊化转移系统中应用过，该系统已用于更为有效地转录吞噬细胞如摄入微球体的巨噬细胞。微球体将编码强免疫原性肽的质粒DNA，这些肽表达时通过细胞表面上的MHC分子导致肽显示，这可刺激抗这些肽和含有相同表位蛋白序列的免疫应答。该方法目前旨在抗肿瘤和病原体疫苗开发中的潜在作用但可能具有其它可能的基因治疗应用。

用与合成聚合物相同的方式包装DNA，该方法用于包装能够均一自我装配成病毒样颗粒(VLPs)的DNA天然病毒外壳蛋白。人多形瘤病毒的主要结构外壳蛋白的VP1可作为重组蛋白表达并且能够在自我装配过程中将质粒DNA包装进入VLP。得到的颗粒可随后用于转导各种细胞系，而预先研究显示对此基于VP1的VLPs很少有免疫原性应答。这些系统可提供合成聚合物非病毒载体和别的病毒转移系统之间的具有重要意义的中间体因为它们可提供组合优势如制备的简单性和高水平的转导效率。

为了提高基因转移的特异性和治疗基因的表达，已经单独和与许多先前描述的转移系统一起研究将靶元件包括进转移载体和调节表达元件的使用。

也已经制备了DNA载体中的一些改进并且有可能适用于所有的非病毒转移系统。这些包括由RPR Gencell报导的超螺旋小环(既无细菌的复制起点又无抗生素抗性基因且因此尽管其表现出高水平的生物污染物但相当安全)、由Copernicus Gene Systems Inc开发的附加型表达载体(复制附加型表达系统，其中的质粒在细胞核内染色体外扩增并因此避免了整合事件)和由Progenitor开发的T7系统(严格的细胞质表达载体，其中的载体本身用第一启动子产生的聚合酶表达噬菌体T7 RNA聚合酶且治疗基因由第二个T7启动子所驱动)。对DNA载体技术的其它更为一般的改进包括用顺式作用元件达到高水平的表达(Vical)、源自alphoid重复DNA的序列提供每细胞周期一次的复制和核靶向序列(来自EBNA-1基因(Calos于Stanford，用Megabios)；SV40早期启动子/增强子或附着于DNA上的肽序列)。

基于通过连接到DNA上配体的细胞受体识别的靶向系统已由Michacl，S.I.和Curiel，D.T.，在基因治疗，1994，1：223-232中描述过。用该受体识别的配体，此DNA变得选择性结合并内在入靶细胞中(Wu G.Y.和Wu，C.H.生物化学杂志.，1987，262：4429-4432)。聚L-赖氨酸(PLL)，一种聚阳离子，已用于通过化学交联方法偶联多种蛋白配体至DNA。靶向系统已由下列文献中发表，包括Zenke等.，美国自然科学院院报.，1990，87，3655-3659，使用转铁蛋白受体；Wu G.Y.和Wu，C.H.生物化学杂志.，1987，262：4429-4432，使用脱唾液酸血清类粘蛋白的受体和Batra等.，基因治疗，1994，1：255-260，用细胞表面碳水化合物。试剂如氯奎或共同定位的腺病毒可用于减少溶酶体中DNA的降解(见Fisher，K.J.和Wilson，J.M.，生化杂志.，1994，299，49-58)。Cristiano等(美国自然科学院院报.，1993，90：11548-11552)构建了腺病毒-DNA-配体复合体。有关受体介导的内容作用的专利参考为：WO 92/05250(脱噬液酸糖蛋白，康涅狄格大学)和US 5354844(转铁蛋白受体，Boehringer)。

DNA和配体可包被于腺病毒的表面以创建包被的腺病毒(Fisher，K.J.和Wilson，J.M.，生化杂志.，1994，299，49-58)。然而，用于DNA进入的2种受体途径(配体受体和腺病毒受体)的存在降低了此转移系统的特异性，但腺病毒受体途径可用抗腺病毒纤维蛋白的抗体作为连接至DNA上的手段而排除(Michael，S.I.和Curiel，D.T.，在基因治疗，1994，1：223-232)。用纯化的内体裂解(endosomalytic)蛋白而不是完整的腺病毒颗粒是另一种选择(Seth，P.，病毒学杂志.，1994，68：1204-1206)。

本发明基因构建体在其靶位点的表达优选在转录调节序列(TRS)的控制下。TRS为任选与增强子和/或控制元件组合的启动子如下述的遗传开关。

TRS的一个实例为这样的“遗传开关”，其一旦被转移入靶细胞中可用于控制本发明基因构建体的表达。用原核调节元件控制更高等真核细胞中的基因表达(为本发明优选的)已由Gossen等在TIBS，1993年12月18日，471-475中综述过。适当的系统包括大肠杆菌lac操纵子且特别优选为大肠杆菌四环素抗性启动子。四环素系统的文献包括Gossen等(1995)科学268，1766；Damke等(1995)，酶学方法257，学术出版社；Yin等(1996)生化年鉴235，195和；专利US5464758、US 558 9362、WO 96/01313和WO 94/29442(Bujard)。基于蜕皮激素的开关(国际专利申请No.PCT/GB 96/01195，公开号WO 96/37609，Zeneca)为别一种选择。其它选择方案如下。ConnaughtLaboratories(WO-93/20218)描述了一种合成可诱导的真核启动子，其包括至少2种不同类的可诱导元件。Rhone-Poulenc Rorer(WO96/30512)描述了有关四环素应用于有条件的基因表达系统。Ariad(WO 94/18317)描述了一种已显示其体内活性的基于蛋白二聚化的系统。Baylor医学院的Bert O′Melley(WO 93/2343、US 5364791、WO 97/10337)描述了基于用修饰的类固醇受体的分子开关。白头研究所具有NF-κB可诱导的基因表达系统(WO 88/05083)。BatelleMemorial描述了应激可诱导的启动子(欧洲专利EP 263908)。

不依赖于细胞类型的TRS实例包括如下内容：巨细胞病毒启动子/增强子、SV40启动子/增强子和反转录病毒长末端重复启动子/增强子。依赖于细胞类型(以达到额外靶向程度)的TRS的实例包括以下启动子：用于靶向直肠结肠、肺和乳腺的癌胚抗原(CEA)；用于靶向转化肝细胞的α-甲胎蛋白(AFP)；用于靶向成神经细胞瘤的酪氨酸羟化酶、乙酰胆碱转移酶或神经元特异性的烯醇化酶；用于靶向胰脏的胰岛素和；用于靶向胶质母细胞瘤的胶质纤维酸性蛋白。也可使用一些在有些肿瘤中选择性表达的癌基因，如乳腺中的HER-2(neu或c-erbB2和神经母细胞瘤中的N-myc。

因此，用作药物的优选基因构建体为包括转录调节序列的构建体，此调节序列包括为控制此基因构建体表达遗传开关的启动子和控制元件。优选的遗传开关控制元件受四环素或蜕皮素存在的调节。优选的启动子依赖于细胞类型并且选自下面的启动子：癌胚抗原(CEA)；α-甲胎蛋白(AFP)；酪氨酸羟化酶；乙酰胆碱转移酶；神经元特异性烯醇化酶；胰岛素；胶质纤维酸性蛋白；HER-2/neu；c-erbB2；和N-myc。优选用作这里所述药物的基因构建体包装于腺病毒中从而转移至哺乳动物宿主中。靶向基因治疗的一般综述列于Douglas等.，肿瘤靶向，1995，1：67-84。

由本发明基因构建体编码的抗体可为任何形式的抗体构建体如F(ab′)₂；F(ab′)、Fab、Fv、单链FV及V-min。应考虑任何适当的抗体构建体，例如新近描述的抗体片段为“L-F(ab)₂”由Zapata(1995)在蛋白质工程，8，1057-1062中所述。也应考虑二硫链结合的Fvs。对于基于CPG2酶的构建体，经过酶二聚化而二聚化的Fab片段构建体是优选的。非-人抗体可人化而用于人类以降低宿主免疫反应。人化抗体、相关片段或抗体结合结构为主要由来源于人免疫球蛋白序列的结构框架所组成，其中的免疫球蛋白序列支持抗原结合位点(互补决定区或CDRs)内或周围的非来源于人的氨基酸序列。例如，在WO 91/09967、EP 0328404和Queen等.，美国自然科学院院报86，10029，Mountain和Adair(1989)生物技术与遗传工程综述10，1(1992)中已详述过适当的方法学，尽管也可考虑其它的人化方法如抗体表面残基的镶嵌(veneering)(EP 519596，Merck/NIH，Padlan等)。

根据本发明的另一方面，提供了设计用于哺乳动物宿主中匹配的2种组分系统，其中的组分包括：(i)包括编码细胞靶向抗体和异源前体药物活化酶基因构建体的第一种成分，其中的基因构建体能够表达抗体和酶作为哺乳动物宿主靶细胞中的缀合物并且其中的缀合物可离开此细胞然后选择性定位于由该抗体所识别的细胞表面抗原和；(ii)包括可由酶转换成活性药物的前体药物的第2种成分。

抗体导向的酶前体药物疗法(ADEPT)为已知的癌症治疗方法。ADEPT使用交联至酶上的肿瘤选择性抗体。将此缀合物施用至患者(通常静脉内施用)，使其定位于肿瘤病灶并从血液和其它正常组织下清除。然后将前体药物施用至患者，由此酶(位于肿瘤病灶)将其转换成杀死肿瘤细胞的细胞毒性药物。

本发明可应用至任何的ADEPT系统。ADEPT系统适当的实例包括基于任何下面的酶的那些系统：羧肽酶G2；羧肽酶A；氨肽酶；碱性磷酸酶；糖苷酶；β-葡萄醛酸酶；青霉素酰胺酶；β-内酰胺酶；半胱氨酸脱氨酶；硝基还原酶；或突变的宿主酶包括羰肽酶A、羧肽酶B和核糖核酸酶。关于ADEPT系统的适当文献包括MeltonRG(1996)，国立癌症研究院院报88，1；Niculescu-Duvaz I(1995)，当今药物化学2，687；Knox RJ(1995)临床免疫治疗，3，136；WO 88/07378(RCT)；Blackey等.，癌症研究，56，3287-92，1996；US 5587161(CRCT和Zeneca)；WO 97/07769(Zeneca)；和WO95/13095(Wellcome)。此异源酶可以为催化抗体的形式；参见例如EP 745673(Zeneca)。有关ADEPT系统的综述文章包括Hay &Denny(1996)，未来药物，21(9)，917-931和Blakey(1997)，Exp.Opin.Ther.Patents，7(9)，965-977。

优选匹配的2种组分系统为这样的系统：其中的第一种组分包括编码异源酶CPG2的基因；且第二种组分的前体药物选自N-(4-[N，N-双(2-碘乙基)氨基]苯氧羰基)-L-谷氨酸，N-(4-[N，N-双(2-氯乙基)氨基]-苯氧羰基)-L-谷氨酸-γ-(3，5-二羧基)酰基苯胺或N-(4-[N，N-双(2-氯乙基)氨基]-苯氧羰基)-L-谷氨酸或其药物上可接受的盐。使用CPG2的优选前体药物描述于下面的来自Zeneca有限公司和癌症研究运动技术有限公司的美国专利：US 5714148，US 5405990、5587161 & 5660829。

在本发明的另一方面中，提供了用于转移细胞毒性药物至病灶的方法，包括将包括这里所述的基因构建体的第一种组分施用至宿主；然后给宿主施用第二种组分，该组分包括可由第一种组分编码的异源酶转换成细胞毒性药物的前体药物的第二种组分。转移细胞毒性药物至病灶的优选方法为这样的方法、其中的第一种组分包括编码异源酶CPG2的基因；并且第二种组分前体药物选自N-(4-[N，N-双(2-碘乙基)氨基]苯氧羰基)-L-谷氨酸，N-(4-[N，N-双(2-氯乙基)氨基]-苯氧羰基)-L-谷氨酸-γ-(3，5-二羧基)酰基苯胺或N-(4-[N，N-双(2-氯乙基)氨基]-苯氧羰基)-L-谷氨酸或其药物上可接受的盐。

在此使用的简称包括：AAV 腺伴随病毒ADEPT 抗体导向的酶前体药物疗法AFP α-甲胎蛋白AMIRACS 在癌症病灶具有挽救剂失活的抗代谢物APS 过硫酸铵b.p. 碱基对BPB 溴酚蓝CDRs 互补决定区CEA 癌胚抗原CL 抗体轻链恒定区CPB 羧肽酶BCPG2 羧肽酶G2CPG2R6 被突变以防止在真核细胞中表达时糖基化的羧肽酶

G2，见实施例1dDAB 底物3，3′-2氨基联苯胺四盐酸DEPC 焦碳酸二乙酯DMEM Dulbecco改进的Eagle培养基ECACC 欧洲动物细胞保藏中心EIA 酶免疫分析ELISA 酶联免疫吸附分析FAS 补充的甲酰四氢叶酸FCS 胎牛血清Fd 任选含有铰链区的Fab、Fab′或F(ab′)₂的重链GDEPT 基因导向的酶前体药物疗法HAMA 人抗小鼠抗体HCPB 人羧肽酶B，优选为胰脏(来源)(IgG)铰链含有连接2条重链半胶氨酸的富含脯氨酸的短肽HRPO或HRP 辣根过氧化物酶IRES 内部核糖体进入位点MTX 氨甲喋呤MCA 非特异性交联反应抗原NCIMB 国家工业及海洋微生物保藏有限公司OPD 邻苯二胺PBS 磷酸缓冲盐溶液PCR 聚合酶链式反应PGP N-(4-[N，N-双(2-氯乙基)氨基]-苯氧羰基)

-L-谷氨酸preproCPB 具有N-末端前导序列的原CPBproCPB 具有其N-末端原区的CPBscFV 单链FvSDS-PAGE 十二烷基磺酸钠-聚丙烯酰胺凝胶电泳SSC 柠檬酸钠盐TBS Tris-缓冲盐Temed N，N，N′，N′-四甲基乙二胺TFA 三氟乙酸TRS 转录调节序列VDEPT 病毒导向的酶前体药物疗法VH 抗体重链的可变区VK 抗体轻链的可变区。

在本说明书中，应当考虑特异氨基酸序列的保守氨基酸类似物，其维持本发明组分的相关生物学特性但在序列中有一个或更多个保守氨基酸替代、缺失或添加的差异。然而，特异性列出的氨基酸序列是优选的。典型的保守氨基酸替代列表如下。原始的氨基酸典型的取代优选的取代Ala(A) Val；Leu；Ile ValArg(R) Lys；Gln；Asn LysAsn(N) Gln；His；Lys；Arg GlnAsp(D) Glu GluCys(C) Ser SerGln(Q) Asn AsnGlu(E) Asp AspGly(G) Pro ProHis(H) Asn；Gln；Lys；Arg ArgIle(I) Leu；Val；Met；Ala；Phe； Leu

正亮氨酸Leu(L) 正亮氨酸；Ile；Val； Ile

Met；Ala；PheLys(K) Arg；Gln；Asn ArgMet(M) Leu；Phe；Ile LeuPhe(F) Leu；Val；Ile；Ala LeuPro(P) Gly GlySer(S) Thr ThrThr(T) Ser SerTrp(W) Tyr TyrTyr(Y) Trp；Phe；Thr；Ser PheVal(V) Ile；Leu；Met；Phe； Leu

Ala；正亮氨酸氨基酸命名如下。丙氨酸 Ala A精氨酸 Arg R天冬酰胺 Asn N天冬氨酸 Asp D半胱氨酸 Cys C谷氨酸 Glu E谷氨酰胺 Gln Q甘氨酸 Gly G组氨酸 His H异亮氨酸 Ile I亮氨酸 Leu L赖氨酸 Lys K甲硫氨酸 Met M苯丙氨酸 Phe F脯氨酸 Pro P丝氨酸 Ser S苏氨酸 Thr T色氨酸 Trp W酪氨酸 Tyr Y缬氨酸 Val V任何氨基酸 Xaa X

在此说明书中，应该考虑具体核酸序列的核酸变异(缺失、替代和添加)，这些变异的核酸在严格的条件下维持与这里提及特异性序列杂交的能力。严格的条件定义为6×SSC，0.1％SDS于60℃5分钟。然而，具体列出的核酸序列是优选的。应当考虑天然核酸结构的化学类似物如“肽核酸”(PNA)可能为可接受的等价物，特别是为了无需翻译蛋白的目的(Wittung(1994)自然368，561)。

本发明现将参照下面的非限定实施例加以说。温度为摄氏度。图1显示融合基因构建体的图解，该融合基因构建体包括A5B7抗体重链Fd片段，其C-末端通过弹性的(G4S)₃肽接头连接至CPG2多肽的N-末端上。SS代表信号序列。L代表接头序列。CPG2/R6代表其糖基化位点经突变而失活的CPG2如文中所述。图2a显示(Fab-CPG2)₂融合蛋白的图解，其中的二聚化通过2个CPG2分子间的非共价键而发生。图2b显示F(ab′)₂抗体片段的图解。图3显示分泌的融合蛋白材料基于细胞的ELISA分析。仅仅CEA阳性线与增加量的加入融合蛋白具有增加的结合水平，而CEA阴性细胞线整个过程中仅具有恒定的背景结合。纵轴代表在490nm处测得的光密度读数且横轴代表以ng蛋白计量的加入融合蛋白的量。该图显示获自实验的数据，其中众多的细胞系和阴性对照(无细胞)用实施例6中所述的细胞分析方法与增加量的融合蛋白孵育。结果显示仅仅LoVo(CEA阳性)细胞系显示出相应于增加量加入融合蛋白的增加的OD490读数。所有其它的细胞系(CEA阴性)和对照(无细胞)仅仅显示出不随融合蛋白加入而增加的背景OD490nm读数。这些结果提供这样的证据，即该融合蛋白材料特异性地以剂量依赖性的方式结合CEA阳性细胞系并且不结合CEA阴性细胞系。图4显示分泌至重组LoVo肿瘤细胞融合蛋白的保留。纵轴代表在490nm处测得的光密度读数并且横轴代表以ng/ml蛋白测得的加入抗-CEA抗体(IIE6)的量。实验用不同的细胞系按实施例7中所述进行，包括重组LoVo和Colo 320DM细胞系(其自身分泌融合蛋白)和对照不分泌融合蛋白的母本LoVo细胞系。首先，将细胞系固定，并且清洗以去除存在的上清和未结合物质，然后加入逐渐增加浓度的抗-CEA抗体(IIE6)至固定细胞中。按文中所述开发此方法以测定任何分泌材料的保留水平和是否进一步加入的抗体将增加此信号。结果显示不加入抗-CEA抗体，对照母本Lovo线仅仅显示出背景OD490nm读数(如预期的)而重组的LoVo线得到很强的OD490nm读数表明此融合蛋白物质保留于CEA阳性的LoVO细胞中。CEA阴性重组Colo 320DM较LoVo细胞得到更为微弱的读数而此信号高于背景(可能由于在早期分析方法中分泌抗体没有固定)。加入至固定细胞中的逐渐增加浓度的抗-CEA抗体(IIE6)在母本LoVo细胞的情况中显示出剂量相关的应答。因此表明它们为CEA阳性且可结合CEA结合物质(如如果存在或添加的融合蛋白)。重组的Colo320DM和Lovo细胞用逐渐增加量的抗体时在总的OD490信号中几乎没有表现出增加，除了在最高抗体剂量时表现出略微应答之外。由于重组Colo320DM为CEA阴性，故由于抗-CEA抗体没有信号增加，这些细胞的结果将是所预期的。在重组LoVo细胞的情况，由于加入此分析中抗体的量的增加信号除了最高剂量时以外由于原初信号的相对强度可能会下降。图5显示分泌至重组LoVo肿瘤细胞中融合蛋白的保留。纵轴代表适中的肿瘤体积(cm³)并且横轴代表施以前体药物后以天为单位的时间。实验用60mg/kg剂量的前体药物按实施例12中所述进行。结果显示对照GAD(c)(无前体药物处理)的肿瘤在收获肿瘤时的11天(施以剂量后的天数)长至其起始大小的6倍，前体药物处理的肿瘤GAD(d)显示出显著更慢的生长速率并且至16天(施以剂量后天数)仅达到其起始大小的3倍。此数据表明至少有11天的肿瘤生长延缓。

在下面的实施例中，除非另有说明，否则应用下面的方法学和材料。

用GENECLEAN^TM II试剂盒(Stratech科学有限公司或Bio 101有限公司)回收和纯化DNA。此试剂盒含有：1)6M的碘化钠；2)氯化钠的浓缩液，用于制备氯化钠/乙醇/水洗液的Tris和EDTA；3)玻璃乳(Glassmilk)。含有1.25ml在水中特异性制备硅基质的悬液。这是基于美国科学院院报(1979)76卷615页中发表的Vogelstein和Gillesole方法的DNA纯化技术。简言之，此试剂盒方法如下。向1体积的凝胶切片中加入3体积来自该试剂盒的碘化钠溶液。通过于55℃加热混和物10分钟而熔化琼脂糖且然后加入玻璃乳(5-10ml)，充分混合并置于环境温度中静置10分钟，离心玻璃乳并用试剂盒的NEWWASH^TM(0.5ml)清洗3次。从玻璃乳中去除清洗缓冲液并通过将玻璃乳水(5-10ml)在55℃孵育5-10分钟而洗脱DNA。离心回收含有洗脱DNA的水溶性上清。洗脱步骤可从重复并且上清可以合并。

感受态大肠杆菌DH5α获自生活技术有限公司(MAX^TM效率DH5α感受态细胞)。

用Bio 101有限公司(目录号2070-400)的RPM^TM DNA制备试剂盒或类似的产品小量制备双链质粒DNA-该试剂盒含有碱性裂解液从而从细菌细胞中释放质粒DNA并在旋转滤器(spinfilter)中含有玻璃乳以吸收释放的DNA，然后从pH 7.5的无菌水或10mM Tris-HCl，1mM EDTA将其洗脱。

标准的PCR反应含有100ng质粒DNA(除了特别说明的之外)，5μl dNTPs(2.5mM)、5μl 10×酶缓冲液(500mM KCl，100mMTris pH 8.3)、15mM MgCl₂和0.1％明胶)、1μl 25pM/μl每条引物的贮备液，0.5μl热稳定的DNA聚合酶和水以得到50μl的体积。标准的PCR条件为：94℃ 90秒；55℃ 60秒；72℃ 120秒15个PCR循环，最后一个循环以进一步72℃孵育10分钟而结束。

可从Perkin-Elmer Cetus得到的AMPLITAQ^TM用作热稳定的DNA聚合酶的来源。

一般的分子生物学方法可遵循“分子克隆-实验指南”第二版，Sambrook，Fritsch和Maniatis(冷却泉实验室，1989)中所述的任何方法。

无血清培养基为OPTIMEM^TM I减少的血清培养基，Gibco BRL目录号31985。这是改进的以Hepes和碳酸氢钠缓冲的Eagle基本必需培养基，并补充以次黄嘌呤核苷、胸腺嘧啶脱氧核苷、丙酮酸钠、L-谷氨酰胺、痕量元素和生长因子。

LIPOFECTIN^TM试剂(GibcoBRL目录号18292-011)为1∶1(w/w)的滤膜过滤的水中的阳离子脂N-[1-(2，3-二油酰氧基(dioleyloxy))丙基]-n，n，n-三甲铵氯化物(DOTMA)和二油酰基磷脂酰乙醇胺(DOPE)的脂质体制剂。其自发与DNA结合以形成脂-DNA复合体-见Felgner等美国自然科学院院报(1987)84，7431。

G418(磷酸盐)为GENETICIN^TM，GibcoBRL目录号11811，一种用作分子遗传实验中筛选剂的与为他霉素有关的氨基糖苷类抗生素；

对于CEA ELISA，将96孔免疫板(NUNC MAXISORB^TM)的每只孔以50mM pH 9.6的碳酸盐/碳酸氢盐包被缓冲液(缓冲胶囊-Sigma C3041)中的50ng CEA包被并于4℃孵育过夜。将平板以PBS-TWEEN^TM(PBS+0.05％TWEEN^TM20)洗三次然后以150μl每孔的位于PBS-TWEEN^TM中的1％BSA于室温封闭1小时。将平板用PBS-TWEEN^TM洗三次，每孔加入100μl测试样品并于室温孵育2小时。将平板从PBS-TWEEN^TM洗三次，将100μl每孔的HRPO-标记的羊抗人卡巴抗体(Sigma A 7164)的1/500稀释液加入PBS-TWEEN^TM中的1％BSA中并于室温在摇床上孵育至少1小时。将平板以PBS-TWEEN^TM洗三次，且然后再以PBS洗一次。为了检测结合，每孔加入100μl显影液(溶于100ml H₂O中的一胶囊磷酸柠檬酸盐缓冲液-Sigma P4922，向其中加入一粒30mg的邻苯二胺二盐酸片剂-Sigma P8412)并孵育达15分钟。通过加入75μl 2M H₂SO₄而终止反应并于490nm处读数吸收值。

用抗CPG2报告抗体的CEA ELISA基本上与上述相同但不是用HRPO-标记的羊抗人卡巴抗体，而是加入位于PBS-TWEEN^TM中1％PBS中的1/1000稀释的兔抗-CPG2多克隆血清并于室温在摇床上孵育至少2小时。将平板以PBS-TWEEN^TM洗三次。然后加入羊-抗兔HRPO标记抗体(Sigma A-6154)的1/2000稀释液并于室温在摇床上孵育1小时，将平板以PBS-TWEEN^TM洗三次并以PBS洗一次。为了检测结合，每孔加入100μl显影液(溶于100ml H₂O中的一胶囊磷酸盐-柠檬酸缓冲液-Sigma P4922，其中加入一个30mg邻苯二胺二盐酸片剂-Sigma P8412)并孵育达15分钟。通过加入75μl 2MH₂SO₄而终止反应并于490nm处读数吸收值。

按如下进行转染上清的Western印迹分析。用适当的微凝胶系统(HOEFER MIGHTY SMALL^TM)制备用于分析融合蛋白转染的10％微型凝胶。10％电泳凝胶为：20ml丙烯酰胺、6ml 10×电泳凝胶缓冲液；34ml H₂O；300ml 20％SDS；600μl APS；30μlTemed。电泳凝胶10x缓冲液为3.75M pH 8.6的Tris。6％积层胶为：9ml丙烯酰胺；4.5ml 10×积层胶缓冲液；31.5ml H₂O；225μl 20％的SDS；45μl 10％的APS；24μl Temed)。10x积层胶缓冲液为1.25M pH 6.8的Tris。SDS/PAGE的5×电泳缓冲液为249mMTris、799mM甘氨酸、0.6％w/v SDS(pH未调节)。

样品的制备2×Laemmli缓冲液为0.125M Tris，4％ SDS；30％甘油；4M尿素；任选含有5％β-巯基乙醇的0.002％ BPB。上清：25μl样品+25μl 2×Laemmli缓冲液；上样40μl。标准的F(ab′)₂和CPG2：2μl 10mg/ml标准品；8μl H₂O；10μl 2×Laemmli缓冲液(-巯基乙醇)；上样20μl。分子量标记(AmershamRAINBOW^TM)：8μl样品；8μl 2×Laemmli缓冲液(+巯基乙醇)：上样10μl电泳条件：30毫安直到染料前沿至凝胶底部(大约1小时)。印迹：用半干印迹仪(LKB)印迹至硝酸纤维素膜上。毫安＝0.7×cm²，45分钟。封闭：用PBS-TWEEN^TM中5％干燥脱脂牛奶40分钟。

F(ab′)₂的检测：用PBS-TWEEN^TM中0.5％干燥的脱脂牛奶1/2500稀释的羊抗人卡巴轻链HRPO标记的抗体。

CPG2的检测：用小鼠抗CPG2单克隆(与PBS-TWEEN^TM中0.5％干燥脱脂牛奶中的1/2000稀释液)孵育过夜；用羊抗小鼠卡巴轻链HRPO标记的抗体Sigma 674301-(于PBS-TWEEN^TM中0.5％干燥脱脂牛奶中的1/10000稀释液)孵育至少2小时。

印迹的显色：使用增强剂存在下根据鲁米诺底物(PierceSUPERSIGNAL^TM底物)对HRPO进行化学发光检测。按如下制备底物工作液：建议的体积：0.125ml/cm²的印迹表面。混合等体积的鲁米诺/增强剂溶液和稳定的过氧化物溶液，将印迹与工作液孵育5-10分钟，去除溶液并将印迹置于膜保护器中并对放射自显影胶片曝光(通常30秒到5分钟)。

微生物保藏：质粒pNG3-Vkss-HuCk根据布达佩斯条约以保藏号NCIMB 40798于1996年4月11日保藏于国立工业和海洋微生物保藏有限公司(NCIMB)，α3 St Machar Drive，Aberdeen ABZ 1RY，Scotland，英国。质粒pNG4-VHss-HuIgG2CH1根据布达佩斯条约以保藏号NCIMB 40797于1996年4月11日保藏于国立工业和海洋微生物保藏有限公司(NCIMB)，23 St Machar Drive，Aberdeen AB21RY，Scotland，英国。质粒pNG3-Vkss-HuGk-NEO根据布达佩斯条约以保藏号NCIMB 40799于1996年4月11日保藏于国立工业和海洋微生物保藏有限公司(NCIMB)，23 St Machar Drive，AberdeenAB2 1RY，Scotland，英国。质料pICI266根据布达佩斯条约以许可号NCIMB 40589于1993年10月11日保藏于国立工业和海洋微生物保藏有限公司(NCIMB)，St Machar Drive，Aberdeen AB2 1RY，Scotland英国。

胰蛋白酶作用(Typsinisation)：将胰蛋白酶EDTA(Gibco BRL453000-019)和Hanks平衡的盐溶液(HBSS；Gibco BRL 14170-088)于37℃水浴中预温。存在的培养基从培养物中去除并以一定体积的HBSS(以前培养基体积的一半)代替并通过细心振荡平板或培养瓶从而去除含有培养基的任何残余血清而清洗细胞层。去除HBSS并加入一定体积的胰蛋白酶溶液(为原初培养基体积的四分之一)，轻轻振荡培养瓶以确保细胞层被完全覆盖并静置5分钟。通过加入适当的正常培养基(2×体积的胰蛋白酶液)而失活胰蛋白酶。然后将此细胞悬液或者计数或者进一步稀释用于根据待进行的方法而继续培养。

胎牛血清(FCS)的加热灭活：将FCS(Viralex A15-651认可的批号-Non European)贮存于-20℃。为了使用，将血清于4℃完全融化4℃第二天，将此血清于37℃水浴中孵育15分钟且然后转移至56℃水浴中孵育15分钟。取出血清并在其分成50ml等份之前冷却至室温并贮存于-20℃。

常规的DMEM培养基(用Gibco BRL成分)：向500ml DMEM(41966-086)中加入12.5ml Hepes(15630-056)；5ml NEAA(11140-035)；5ml pen/strep(10378-016)；和50ml热灭活的FCS。

FAS培养基(除非另有说明，否则用Gibco BRL成分)：490mlDMEM(41966-086)；12.5ml Hepes(15630-056)；5ml非必需氨基酸(11140-035)；5ml pen/strep(10378-016)；5ml维他命(11120-037)；5ml基本氨基酸(51051-019)；甲酰四氢叶酸(Sigma F8259)至10μg/ml的终培养基浓度；50ml加热灭活的FCS；5ml dNTP混合物；和50mg/ml的G41850贮备液(以制备适当的筛选浓度)。

dNTP混合物：将35mg G(Sigma G6264)，35mg C(SigmaC4654)，35mg A(Sigma A4036)，35mg U (SigmaU3003)，125mg T(Sigma T2895)溶解于100ml水中，过滤除菌并贮存于-20℃。

G418筛选：对于LoVo细胞(ATCC CCL 209)，筛选在1.25mg/ml进行，对于HCT 116(ATCC CCL 247)细胞和Colo 320 DM(ATCCCCL 220)细胞，除非另有说明，否则筛选在1.5mg/ml进行。

BLUESCRIPT^TM载体获自Stratagene克隆系统。

Tet-On基因表达载体获自Clontech(Palo Alto，加利福尼亚)目录号K1621-1。

除非另有说明或从上下文中显而易见，否则在实施例中所称的抗体-CPG2融合构建体使用突变的CPG2以防止糖基化。实施例1(A5B7 Fab-CPG2)₂融合蛋白的构建

为了获得同时表现CPG2酶活性的二价人癌胚抗原(CEA)结合分子的目的而安排(A5B7 Fab-CPG2)₂酶融合的构建。向其末端设计起始的构建体从而含有A5B7抗体重链Fd片段，该片段通过弹性的(G4S)₃肽接头连接至CPG2多肽的N-末端(图1)。

抗体A5B7结合人癌胚抗原(CEA)并特别适用于靶向结肠癌或其它具有CEA抗原的细胞(CEA作为癌症相关抗原的重要性由Shively，J.E.和Beatty，J.D.在“癌症学/血液学中的CRC关键性综述”第2卷，p 355-399，1994中进行了综述)。CPG2酶在自然界中为天然二聚化形式，由2种连接的相同多肽亚单位所组成。此分子二聚体的每种亚单位由较大的催化结构域和形成二聚体界面的第二个较小结构域所组成。

一般地，抗体(或抗体片段)-酶缀合物或融合蛋白应该至少为二价的，即是说能够结合至少2种(可为相同或不同的)肿瘤相关抗原。在(A5B7 Fab-CPG2)₂融合蛋白的情况，酶组分的二聚化与天然酶一样在表达后发生，因而形成含有2个Fab抗体片段(且因此相对于抗体结合位点而言对二价的)和2分子CPG2的酶促分子(图2a)。a)A5B7抗体基因的克隆

重组鼠A5B7 F(ab′)₂抗体的制备、纯化和特征分析方法已经发表(国际专利申请，Zeneca有限公司，WO 96/2001，见这里的参考实施例5)。在参考实施例5中f部分，将A5B7抗体基因克隆入GS-SYSTEMTM(Celltech)载体中，见国际专利申请WO 87/04462，WO 89/01036，WO 86/05807和WO 89/10404，其中的A5B7 Fd克隆入pEE6并将轻链克隆入pEE12。这些载体为构建A5B7 Fab-CPG2融合蛋白的A5B7抗体基因的来源。b)嵌合A5B7载体构建体

用适当的PCR引物通过PCR从pEE6和pEE12质粒载体中扩增A5B7鼠抗体可变区，其中的PCR引物包括必需的限制位点用于以正确的框架分别将重链和轻链可变区克隆入载体pNG4-VHss-HuIgG2CHI′(NCIMB保藏号40797)和pNG3-Vkss-HuCk-NEO(NCIMB保藏号407997)中。将得到的载体命名为pNG4/A5B7VH-IgG2CHI′(A5B7嵌合重链Fd′)和pNG3/A5B7VK-HuCk-NEO(A5B7嵌合轻链)。c)CPG2基因的克隆

CPG2编码基因可获自应用微生物和研究中心，Porton Down，Salisbury，Wiltshire SP4 OJG，英国。CPG2也可通过重组技术获得。CPG2的核苷酸编码序列已由Minton，MP等在基因，(1984)31，31-38中发表。此编码序列在大肠杆菌中的表达(Chambers，S.P.等.，应用微生物，生物技术(1988)，29，572-578)和在酿酒酵母中的表达(Clarke，L.E.等.，普通微生物学杂志(1985)，31，897-904)已有报导。此外，CPG2基因可通过多种方法而制备成合成DNA构建体并用作进一步实验的来源。全基因合成已描述于M.Edwards美国生物技术实验室(1987)，5，38-44，Jayarman等.，(1991)美国自然科学院院报88，4084-4088，Foguet和Lubbert(1992)生物技术13，674-675和Pierce(1994)生物技术16，708。

在准备克隆CPG2基因过程中，构建载体pNG3-Vkss，其为pNG3-Vkss-HuCk-NEO(NCIMB保藏号40799)的一种简单衍生物。通过以下方法构建此载体，首先用限制酶XbaI消化而去除新霉素基因(因为其含有EcoRI限制酶位点)，然后分离载体片段且然后再连接以形成质粒pNG3/Vkss-HuCk。用SacII和EcoRI消化此中间载体，从而切下HuCk基因片段。然后将消化产物上样于1％的琼脂糖凝胶中并从剩余的载体中分离切下的片段，然后从凝胶中切下载体DNA并加以纯化。设计和合成2条寡核苷酸CME 00261和CME 00262(SEQ IDNO：1和2)。通过加入200pmoles每种寡核苷酸至总共30μl H₂O中，加热至95℃并让此溶液缓慢冷却至30℃而将这2种寡核苷酸进行杂交。然后将100pmoles退火的DNA产品直接连接入前面制备的载体中并将连接混合物转化入大肠杆菌中。在得到的克隆中，导入此DNA“弹夹”产生一种新的多接头序列而备用于随后的CPG2基因克隆以制备载体pNG3-Vkss。

用适当的DNA寡核苷酸引物和标准的PCR反应条件通过PCR扩增编码包括氨基酸残基Q26-K415的CPG2结构基因。反应产物用1％琼脂糖凝胶进行分析，将预期大小的(大约12000bp)条带切下，纯化并于20μl H₂O中进行洗脱。然后用限制酶SacII消化此物质，然后将反应液上样于1％琼脂糖凝胶中并切下预期大小(大约250bp)的条带且随后进行纯化。将此片段连接至预先以限制酶SacII消化的去磷酸化的质粒载体pNG3Vkss中，于1％的琼脂糖凝胶中电泳，将线性化的载体切下纯化并将连接混合物转化入大肠杆菌。通过用BglII和FseI进行DNA限制性分析而分析得到克隆的CPG2 SacII片段的存在与方向。通过DNA测序确证似乎具有正确大小与方向片段的克隆。此中间质粒称为pNG3-Vkss-SacIICPGfrag。将此质粒用限制酶AgeI和EcoRI消化、去磷酸化并将载体片段分离。将最初的CPG2基因PCR产物也以AgeI和EcoRI消化，分离到大约1000bp的片段，连接并转化入大肠杆菌中。通过用限制酶HindIII和EcoRI消化而分析得到克隆的全长CPG2基因(大约1200bp)；对具有正确大小的插入子的克隆进行测序以确证一致性。最后，将此质粒(pNG3/Vkss-CPG2)以XbaI消化，去磷酸，分离载体片段并将XbaI新霉素基因片段(也在早期分离的大约1000bp)重新连接入质粒中并转化入大肠杆菌中。通过以XbaI和EcoRI分别消化而检查得到克隆中新霉素基因的存在与方向。将此载体命名为pNG2-Vkss-CPG2-NEO。d)CPG2 R6变异体的构建

质粒pNG3-Vkss/CPG2-NEO用作对CPG2基因进行PCR诱变的模板从而突变在天然细菌酶序列中鉴定到的3个潜在的糖基化位点。用Minton，N.P.等在基因(1984)31，31-38中发表定位计数方法在位置222(N-I-T)、264(N-W-T)和272(N-V-S)观察到推断的氨基酸糖基化位点(N-X-T/S)。3个糖基化位点的天冬酰胺残基(N)被突变成谷氨酰胺(Q)因此使此糖基化位点无效以避免完成CPG2表达或酶活性的任何糖基化位点。

其中的所有3个位点在单一反应系列中被突变的PCR诱变技术用于建立CPG2 R6基因变异体。载体pNG3/Vkss/CPG2-NEO用作三个起始PCR反应的模板。反应R1使用合成寡核苷酸序列引物CME00395并且CME 00397(SEQ ID NOS：3和4)，反应2使用合成寡核苷酸序列引物CME 00395和CME 00399(SEQ ID NOS：3和5)并且反应R3使用合成寡核苷酸序列引物CME 00396和CME00400(SEQ ID NOS：6和7)。PCR反应R1与R2的产物分别含有突变的222和264+272糖基化位点，其中的R3产物为CPG2基因C-末端片段的拷贝。琼脂糖凝胶分离和纯化后，将R2和R3产物(R大约750bp；R3大约360bp)加入进一步的PCR反应中。制备不同量的产物R2和R3的混合物并用合成寡核苷酸CME 00395和CME00396(SEQ ID NOS：3和6)进行PCR反应。得到的产物R4(大约1200bps)再次用寡核苷酸CME 00398和CME 00396(SEQ IDNOS：8和6)扩增。将得到产物R5(大约600bp)加入终PCR反应中的产物P1(大约620bp)中，此PCR反应用寡核苷酸CME 00395和CME 00396(SEQ ID NOS：3和6)进行。可将现含有所有三个突变糖基化位点的得到的PCR产物R6(大约1200bp)(在用限制酶AgeI和BsrGI消化和分离得到的片段后)克隆入(预先以限制酶AgeI和BsrGI和随后分离的)载体pNG3/Vkss-CPG-2-Neo中。这在表达载体pNG3/Kvss-CPG2 R6-NEO内建立了所需的编码CPG2/R6蛋白序列(SEQ ID NO：10)的DNA。e)A5B7重链Fd-CPG2融合蛋白基因的构建

重链抗体片段和CPG2酶基因均通过PCR扩增质粒模板而获得。用引物CME 0096(SEQ ID NO：11)和CME 00969(SEQ IDNO：12)扩增质粒pNG4/A5B7VH-IgGCH′获得A5B7 Fd组分(大约300bp)并且用引物CME 00967(SEQ ID NO：13)和CME 00968(SEQ ID NO：14)扩增质粒pNG3/Vkss/CPG2 R6-NED以获得酶组分(大约1350bp)。在每种情况下上样反应产物并于1％琼脂糖凝胶上分离，切下正确产物大小的条带，随后纯化并于20μl H₂O中洗脱。

进行进一步的PCR反应从而将2种纯化的PCR反应产物连接(或剪接)到一起。使用标准的PCR反应条件但每种产物量有变化(在0.5～2μl之间)且用25个循环(代替正常的15个循环)。反应产物用1％琼脂糖凝胶分析并切下预期大小(大约1650bp)的条带、纯化并于20μlH₂O中洗脱。然后用限制酶NheI和BamHI消化此物质，然后回收预期大小的(大约1600bp)条带。通过以限制酶NheI和BamHI消化后将DNA去磷酸化并分离较小的NheI和BamHI片段与较大的载体带。回收载体带、纯化并随后将类似限制性消化的PCR产物连接入制备的载体中并将连接混合物转化入大肠杆菌。从得到的克隆中制备DNA且随后测序以确证此融合基因序列。发现许多克隆为正确的并将这些克隆中的一个克隆(命名为R2.8)重新命名为pNG4/A5B7VH-IgG2CH1/CPG2R6(SEQ ID NO：15和SEQ ID NO：16)。f)共转染，暂时表达

用下述的基于LIPOFECTIN^TM的方法将(编码抗体嵌合Fd-CPG2融合蛋白)的质粒pNG4/A5B7VH-IgGCH1/CPG2R6和(编码抗体嵌合轻链；SEQ ID NO：17和SEQ ID NO：18)的pNG3/A5B7VK-HuCk-NEO共转染入COS-7细胞。将来自亚汇合培养的COS7细胞以2×10⁵细胞/2ml/孔种植于6孔平板中并于37℃5％CO₂中培养过夜。LIPOFECTIN^TM无血清培养基混合物组成如下：12ml LIPOFECTIN^TM加上200ml无血清培养基并于室温孵育30分钟。DNA/无血清培养基混合物组成如下：4mg DNA(每种构建体2mg)加上200ml无血清培养基。然后将200ml LIPOFECTIN^TM/无血清培养基混合物加入到DNA混合物中并于室温孵育15分钟。然后将60ml无血清培养基加入每种样品中。用2ml无血清培养基冲洗细胞一次然后将1ml LIPOFECTIN^TM/DNA混合物加入细胞中并于37℃5％CO₂中孵育5小时。从细胞中去除LIPOFECTIN^TM/DNA混合物并加入标准的培养基，然后于37℃ 5％CO₂中将细胞孵育72小时。收获细胞上清。g)抗体-酶融合蛋白的分析

通过以下方法分析上清物质中抗体融合蛋白的存在，包括用抗人卡巴轻链受体抗体通过结合-CEA ELISA(测定抗体的存在)，用抗-CPG2受体抗体通过结合-CEA ELISA(测定结合CEA的CPG2融合蛋白的存在)，基于HPLC的CPG2酶活性分析(以测定特异的CPG2的活性)和SDS/PAGE及(用抗人卡巴轻链受体或抗CPG2报告抗体)的Western印迹以测定表面的物质。

基于HPLC的酶活性分析清晰地显示CPG2酶活性存在于细胞上清中且两种抗CEA ELISA分析表现出蛋白以相当的水平与二价A5B7抗体分子结合。用抗-CPG2报告抗体检测的抗CEA ELISA也表现出清晰的CEA结合的事实表明不仅抗体而且抗体-CPG2融合蛋结合CEA。

同时用2种报告抗体分析的Western印迹分析显示出预期的大约90kDa大小而无降解的融合蛋白亚单位或可观察到的较小产物(如Fab或酶)。

由于已知CPG2仅在其为二聚化状态时表现出酶活性并且因为仅仅抗体酶融合蛋白存在，故此表明90kDa的融合蛋白(在SDS-PAGE条件下所见到的)通过天然的CPG2二聚化机制二聚化以在“天然”缓冲液条件中形成180kDa二聚化抗体-酶融合蛋白分子(图2a)。此外，该分子同时显示出CPG2酶活性和CEA抗原结合特性，这与仅仅酶或抗体相比在融合蛋白中似乎没有明显不同。h)在体外细胞毒性分析中表达的融合蛋白与CPG2前体药物的使用

进行体外细胞杀伤分析，将其中的(A5B7-CPG2R6)₂融合蛋白与“常规的”通过用化学异双功能试剂将A5B7 F(ab′)₂连接至CPG2而形成的A5B7 F(ab′)₂-CPG2缀合物进行比较。在每种情况下，将表现出等量CPG2酶活性或等量抗体-CPG2蛋白的物质与带有CEA的LoVo肿瘤细胞孵育。然后冲洗细胞以去除未结合的蛋白材料且随后重悬于含有CPG2酶前体药物的培养基(PGP，见下面实施例2)中1小时，然后冲洗细胞并重悬于新鲜培养基中并让其增殖4天。最后将细胞用SRB染色处理并测定其数目。

得到的结果清楚地显示与等量水平的(与前体药物)的A5B7F(ab)₂-CPG2缀合物相比，(与相同前体药物)的(A5B7-CPG2R6)₂融合蛋白导致至少相当的细胞杀伤并在分析结束时得到更少数目的细胞。(高于基准对照水平)的细胞杀伤仅在前体药物由CPG2酶转化为活性药时可能发生(并且由于细胞被冲洗以去除未结合蛋白，所以仅仅结合细胞的酶将在加入前体药物时保留)。因此，此实验显示与作为更大程度细胞杀伤的常规A5B7F(ab′)₂-CPG2缀合物相比，至少相同水平的A5B7-CPG2R6融合蛋白保持结合(可能是由于更多的前体药物至药物转换)发生。i)用于在短暂和稳定细胞系中表达的其表达融合蛋白载体的构建

为了更为简单的转染方法和直接将2种表达弹夹偶联至单一筛选标记上，用(编码抗体Fd-CPG2融合蛋白)的现存载体pNG4/A5B7VH-IgG2CH1/CPG2R6和(编码抗体轻链)的pNG3/A5B7VK-HuCk-NEO构建用于融合蛋白表达的其-表达载体。将pNG4/A5B7VH-IgG2CH1/CPG2 R6质粒首先用限制酶SacI消化，将反应液上样于1％琼脂糖凝胶中并从凝胶中切下线性载体并纯化。此载体DNA然后用限制酶BglII和BamHI消化，反应液上样于1％琼脂糖凝胶中，回收所需的带(大约2700bp)并加以纯化。用限制酶BamHI消化质粒pNG3/A5B7VK-HuCk-NEO，然后将此DNA去磷酸且然后上样于1％琼脂糖凝中并从凝胶中切下载体条带并加以纯化。将重链表达弹夹片段连接入制备的载体中并将连接混合物转化入大肠杆菌中。通过多种限制性消化检查此方向并筛选具有与轻链相同方向重链弹夹的克隆。将这些质粒命名为pNG3-A5B7-CPG2/R6-coexp.-NEO。j)用于蛋白表达的基因开关

已预见CPG2和CPG2融合蛋白在哺乳动物细胞中的体外表达可能降解培养基叶酸从而导致缓慢的细胞生长或细胞死亡。高活性的CPG2酶有可能使此叶酸缺陷难以通过培养基补充来克服。然而，认为在CPG2或CPG2融合蛋白表达在哺乳动物体内细胞中表达的情况，有可能这些问题将会发生，因为这些细胞将通过正常的循环和细胞机制而不断地补充所有生长需求。

已考虑过许多避免可能的体外叶酸耗竭问题的方案。其中的一种解决方法包括使用紧密控制但可诱导的基因开关系统如“TET开”或“TET关”(Grossen，M.等(1995)科学268：1766-1769)或蜕皮素/muristerone A开关(No，D等(1996)PNAS 93：3346-3351)。这些系统使准确控制目的基因的表达成为可能并可从以编码毒性或潜在有害表达产物的基因稳定转化哺乳动物细胞。基因开关将允许掺入CPG2融合基因的重组稳定细胞系可能更容易建立、维持和扩增而用于蛋白表达和种子培养而用于体内肿瘤生长研究。实施例2表达抗体-酶融合蛋白的HCT116肿瘤细胞在体外受到前体药物的选择性杀伤

用实施例1的抗体-CPG2融合蛋白基因转染的HCT116结肠癌细胞(ATCC CCL247)可由前体药物选择性杀伤，此前体药物由该酶转换为活性药物。

为了测定此杀伤，将对照未转染的HCT116细胞或以抗体-CPG2融合蛋白基因转染的HCT116细胞与前体药物，4-[N，N-双(2-氯乙基)氨基]-苯氧羰基-L-谷氨酸(PGP；Blakey等，英国癌症杂志72，1083，1995)或由CPG2释放的相应药物，4-[N，N-双(2-氯乙基)氨基]酚孵育。将高于5×10^-4到5×10^-8M浓度范围的药物加入含有1000-2,500个HCT116细胞/孔的96孔微滴定板中于37℃1小时。然后冲洗细胞并于37℃进一步孵育3天。冲洗去除死细胞后，加入TCA并按Skehan等所述(国立癌症研究院院报，82，1107，1990)通过加入SRB染料而分析附着到此平板上的细胞蛋白的量。通过抑制50％生长抑制(IC₅₀)所需的浓度分析此前体药物或药物的效价。

用该药物处理未转染或转染的HCT116细胞导致大约1μm的IC₅₀。相反，PGP前体药物对未转染的细胞导致大约200μm的IC₅₀并且对转染的细胞导致大约1μm的IC₅₀。这些结果证明表达抗体-CPG2融合蛋白的转染细胞可将PGP前体药物转换成更为有效的活性药物而未转染的HCT116细胞不能够转换此前体药物。因此，就细胞杀伤而言与未转染的HCT116细胞相比，转染的HCT116细胞对PGP前体药物敏感100多倍。(见实施例1j)中关于包括细胞中可能的叶酸耗竭问题。

这些研究证明用抗体-酶融合蛋白基因转染肿瘤细胞可导致前体药物选择性肿瘤细胞杀伤。实施例3表达抗体-CPG2融合蛋白的HCT116肿瘤中PGP前体药物的抗肿瘤活性

可按如下证明在表达抗体-CPG2融合蛋白的HCT116肿瘤中PGP前体药物的体内抗-肿瘤活性。将以抗体-CPG2融合蛋白基因转染的HCT116肿瘤细胞或对照未转染的HCT116肿瘤细胞皮下注射至无胸腺裸鼠(10⁷个肿瘤细胞/只子鼠)中。当肿瘤为5-7mm直径时，将PGP前体药物腹膜内注射至小鼠(以5-25mg kg^-1的剂量范围每小时间隔经2小时3次剂量)。通过以2个方向测定肿瘤长度并用下面公式计算肿瘤体积而判断抗-肿瘤效应：

体积＝π/6×D²×d其中D为肿瘤较大的直径且d为肿瘤较小的直径。

肿瘤体积以相对于施用PGP前体药的时的肿瘤体积表示。抗肿瘤活性与对照组进行比较，对照组接受转染或未转染的肿瘤细胞和PBS(170mM NaCl，3.4mM KCl，12mM Na₂HPO₄和1.8mM KH₂PO₄，pH 7.2)而不是PGP前体药物。通过与PBS处理的肿瘤相比PGP处理肿瘤体积的减小以及与PBS处理肿瘤相比PGP处理的肿瘤明显需要更长时间以达到其最初肿瘤体积的4倍来判定。施用PGP至从转染HCT116细胞而建立的HCT116肿瘤细胞得到显著的抗肿瘤效应。相反，施用PGP至从未转染细胞建立的HCT116肿瘤细胞没有导致明显的抗肿瘤活性。

类似的研究可用于证明当与PGP前体药物联合使用时，在适当的载体中运载从而从未转染HCT116细胞建立的HCT116肿瘤的抗体-酶基因可导致明显的抗肿瘤活性。因此，将未转染的HCT116细胞注射入无胸腺裸鼠(每只鼠1×10⁷肿瘤细胞)且一旦肿瘤达到5-7mm的直径，将含有抗体酶融合蛋白基因的载体注射入肿瘤内。使抗体-酶融合蛋白由HCT116肿瘤细胞表达并与其结合1-3天后，按上述施用PGP前体药物。与接受PBS而非PGP前体药物的对照小鼠相比，这导致了明显的抗肿瘤活性。实施例4

用补充FAS的培养基和/或V-79滋养细胞改进对附着细胞系的转染

已经预见CPG2和CPG2融合蛋白在哺乳动物细胞中的体外表达可能降解培养基叶酸，从而导致缓慢的细胞生长或细胞死亡。开发这里所述的用于表达CPG2和CPG2融合蛋白细胞系的FAS(补充叶酸)的培养基从而更好地支持这些细胞系的生长。

在准备转染过程中，将附着细胞系在常规DMEM培养基中培养并在转染之前至少传代三次。将V-79(获自MPC放射学公司，(Harwell，Oxford.，英国)的仓鼠肺成纤维细胞)饲料细胞培养于常规的DMEM培养基中并在用前传代三次。为了转染，进行粘附细胞进行存活计数(用血细胞计数器/苔酚蓝染色)并以2×10⁵个细胞/孔将细胞铺于6孔平板(Costar 3516)并放置18-24小时而让细胞再次粘附。

对于每次单独的转染，将20μl LIPOFECTIN^TM加入80μl无血清培养基中并置室温30分钟。将目的质粒DNA(2μg)加入100μl无血清培养基中且随后加入LIPOFECTIN^TM混合物中并进一步放置15分钟。将每个6孔平板用每孔2ml无血清培养基冲洗以去除任何血清并代之以800μl新鲜无血清培养基。将预先制备的200μl DNA/LIPOFECTIN^TM/无血清培养基混合物加入每个细胞孔中。将平板于37℃孵育5小时，其除培养基并加入2ml新鲜的常规培养基且进一步孵育48小时。刮干净6孔板中转染的细胞，取出细胞悬液并离心。去除所有的上清并将细胞沉淀重悬于20ml含有适当用于转染DNA(如G418)筛选剂的适当新鲜培养基(如.FAS DMEM培养基)中。从每孔(200μl)等份铺板于96孔平板中(1.25×10⁴个细胞每孔)。

为了增强克隆扩增，可将成纤维细胞饲料细胞加入转染的细胞中。用胰蛋白酶消化半汇合的V-79滋养细胞并进行存活计数。将细胞以1×10⁶细胞/ml重悬于无菌玻璃容器中，用暴露至5000拉德的铯源12分钟进行辐射。然后将细胞贮存于4℃ 24-48小时(辐射过的细胞代谢上有活性但将不分裂，且因此可作其它细胞的“滋养”而不污染培养物)。滋养细胞应以4×10⁴个细胞每孔铺板于96孔平板中以制备用于出现重组克隆。滋养细胞最初附着于平板上但随着时间推移而又脱离(平板)并漂浮入培养基中，使任何重组克隆仍附着于孔中。每周更换培养基(每次200μl)2次以去除漂浮的细胞并补充培养基。让克隆形成10-14天，然后通过标准的ELISA分析筛选上清中的融合蛋白分泌。

为了测定(A5B7-CPG)₂融合基因构建体的表达速率，将重组细胞从10ml新鲜常规培养基1×10⁶个细胞接种恰好24小时。然后取出上清离心以去除细胞废物并通过上述的ELISA和HPLC方法分析融合蛋白和酶活性。多种重组(A5B7-CPG)₂融合蛋白细胞系的结果如下。

细胞系克隆 ng/10⁶个细胞/24小时

HCT116 F7 6550

C12 3210

HCT116 F6 15560

C1 6151

B3 4502

A8 4650

D5 630

H9 610

G11 2081

H4 2380

A4 1634

LoVo B9 8370

C1 7350

F12 2983

C7 10770

G10 41

Colo 320DM B3 10540

G4 4720

B9 885

B10 3090

F12 35660实施例5

稳定可诱导的表达(A5B7-CPG2)₂融合蛋白肿瘤细胞系的构建a)可诱导的融合蛋白表达载体的构建

为了利于从单个可诱导哺乳动物细胞启动子的表达、构建了基于IRES(内部核糖体进入位点；见Y.Sugimoto等.，生物技术(1994)，12，694-8)的(A5B7-CPG2)₂融合蛋白版本。构建体pNG3 pNG3/A5B7VK-HuCk-NEO(A5B7嵌合轻链；描述于上面实施例16中)用作扩增轻链基因的模板。用寡核苷酸CME 3153和CME 3231(SEQ IDNOS 19和20)扩增此基因。纯化预期大小(大约700bp)的PCR产物。此产物然后用限制酶EcoRI和BamHI消化并随后进行纯化。将此片段克隆入Bluescript^TM KS⁺载体(通过用相同的限制酶EcoRI和BamHI消化而制备成接受此片段)中，然后将此DNA去磷酸并纯化较大的载体带。将类似限制性消化的PCR片段连接入此制备的载体中并将连接混合物转化入大肠杆菌中。从这些获得的克隆中制备DNA并通过限制性消化分析之以检查PCR片段的插入。对适当的克隆进行测序以确证此基因序列。获得多个具有正确序列的克隆并将其中的一个克隆给以质粒命名A5B7 Bluescript^TM。

以类似的方式，用寡核苷酸CME 3151和CME 3152(SEQ IDNOS 21和22)通过PCR从质粒pNG4/A5B7VH-IgG2CH1/CPG2R6(在上面的实施例1e中描述过)中扩增嵌合A5B7重链。纯化预期大小(大约1800bp)的PCR反应产物。然后用限制酶BamHI和XbaI消化此产物后纯化此片段条带。也将此片段克隆入已用相同的限制酶BamHI和XbaI消化而制备成接受上述片段的Bluescript^TM KS⁺载体中，其中的限制酶消化过的载体DNA被去磷酸并纯化较大的载体片段。将类似限制性消化的PCR片段连接入制备的载体中并将连接混合物转化入大肠杆菌中。从得到的克隆中制备DNA并通过限制性消化加以分析以检查PCR片段的插入，对适当的克隆进行测序以确证该基因序列。获得多个具有正确序列的克隆并将其中的一个克隆给以质粒命名Bluescript^TMFd-CPG2 R6。

IRES序列源自载体pSXLC(Y.Sugimoto等.，生物技术(1994)，12，694-8)中描述过并获自这些作者)。通过限制酶BamHI和NcoI消化而切下IRES序列。纯化预期大小的(大约500bp条带并将其连接入(预先以相同酶限制性消化而制备的)Bluescript^TM Fd-CPG2 R6质粒中。将此连接混合物转化入大肠杆菌中并以得到的克隆中制备DNA。通过限制性消化分析此DNA以检查此片段的插入并对适当的克隆进行测序以确证此基因序列。获得多个具有正确序列的克隆并将其中一个给以质粒命名Bluescript^TM IRES Fd-CPG2 R6。

为了利于以后的克隆步骤，缺失IRES片段中带有的XbaI位点是必需的。这通过用寡核苷酸引物CME 3322和CME 3306(SEQ IDNOS：23和24)和Bluescript^TM IRES Fd-CPG2 R6作为模板DNA通过PCR诱变进行。纯化预期大小(大约500bp)的PCR反应产物，用限制酶BamHI和NcoI消化并连接入(预先用相同的限制酶限制性消化而制备的)Bluescript^TM IRES Fd-CPG2 R6质粒中。将连接混合物转化入大肠杆菌中并以得到的克隆中制备DNA。通过限制性消化分析此DNA以检查此片段的插入并对适当的克隆随后进行测序以确证此基因序列。得到多个具有正确序列的克隆并将其中一个给以质粒命名Bluescript^TM IRES Fd-CPG2 R6-Xba del。

通过限制酶EcoRI和BamHI消化而从质粒A5B7 Bluescript^TM质粒中切下A5B7嵌合轻链片段。纯化预期大小的(大约700bp)的条带，将其连接入适当制备的Bluescript^TM IRES Fd-CPG2 R6-Xba del质粒中并将连接混合物转化入大肠杆菌中。从得到的克隆中制备DNA并通过限制性消化分析之以检查该片段的插入。对适当的克隆随后进行测序以确证该基因序列。得到多个具有正确序列的克隆并将其中一个给以质粒命名Bluescript^TM A5B7 IRES Fd-CPG2 R6-Xba del。完整的基于IRES的A5B7嵌合蛋白基因序列示于SEQ ID NO：52中。

然后将基于IRES的A5B7嵌合融合蛋白基因转入四环素调节的表达载体中，用于Ter On基因表达系统的载体获自Clontech。通过用限制酶EcoRI和Xba I消化、去磷酸化并纯化较大的载体条带制备四环素可开关的表达载体pTRE(又称为pHUD10-3，见Gossen等，(1992)，PNAS，89，5547-51)以接受基于IRES的融合蛋白弹夹。用相同的限制酶从Bluescript^TM A5B7 IRES Fd-CPG2 R6-Xba del质粒中切下IRES基因弹夹。将获得的大约3000bp的片段连接入制备的载体中并将连接混合物转化入大肠杆菌中。从得到的克隆中制备DNA并通过限制性消化分析之以检查PCR片段的插入。对适当的克隆随后进行测序以确证此基因序列。得到多个具有正确序列的克隆并将其中的一个克隆给以质粒命名pHUD10-3/A5B7 IRES Fd-CPG2 R6。b)稳定可诱导的表达融合蛋白的细胞系的构建。

用标准的脂质转染法(如前面所述但不使用滋养细胞)制备重组的HCT116肿瘤细胞系。用1μg pHUD10-3/A5B7 IRES Fd-CPG2 R6质料和1μg pTet-On反式激活表达质粒(来自Clontech试剂盒)进行共转染并用含有750μg G418/ml的FAS培养基筛选阳性克隆。c)重组HCT116可诱导细胞系的诱导研究

将得到的克隆培养物分配至2个48孔平板，每孔含1×10⁶个细胞。将细胞培养48小时，其中的一只平板用2μg/ml强力霉素加以诱导并且另一只平板用作未诱导的对照。用实施例1g中所述的ELISA/Western印迹分析测试细胞上清中(A5B7-CPG2)₂融合蛋白的表达。这些结果可清楚地证明用强力霉素对可诱导细胞系融合蛋白的诱导，例如，得到的一个克隆(F11)中，诱导的细胞在上清中产生120ng/ml融合蛋白而未诱导细胞仅产生背景水平的融合蛋白(低于1ng/ml)。实施例6分泌的融合蛋白物质基于细胞的ELISA分析

将细胞以每孔100μl常规培养基1×10⁴个细胞的浓度接种于96孔平板(Becton Dickinson Biocoat^TM poly-D-Lysine，35-6461)中并于37℃放置约40小时。将100μl 6％的甲醛稀释于DMEM中并于4℃放置1小时。离心平板并通过浸泡于含有0.05％Tween^TM的PBS中冲洗3次(头2次洗2分钟且最后一次5分钟)。

将100μl含有融合蛋白或嵌合A5B7抗-CEA的细胞培养上清2倍稀释液适当地加入每孔中并将平板于4℃孵育过夜。按上述冲洗平板并且在嵌合融合蛋白的情况，加入100μl HRP标记的抗人卡巴抗体(Sigma A-7164)的1∶1000稀释液并于室温孵育2小时(抗-CPG2检测方法可用于鼠scFv融合蛋白的情况中)。按上述冲洗平板并用OPD底物(Sigma P-8412)检测HRP。使显色大约5分钟，用每孔75μl 2MH₂SO₄终止显色并于490nm处计数OD值。

在(A5B7-CPG2)₂融合蛋白的情况，物质从重组Colo 320DM肿瘤细胞(CEA-ve)的上清中产生。通过用上述的CEA ELISAs测定融合蛋白的含量。加入逐渐增加量的融合蛋白至许多CEA阴性细胞系和CEA阳性LoVo亲本细胞系。示于图3中的结果清楚地显示仅仅CEA阳性细胞系随着加入融合蛋白量的增加而结合水平增加而CEA阴性细胞系整个过程仅仅显示出恒定的背景结合水平。这清楚地证明该融合蛋白特异性结合并维持于CEA阳性Lovo细胞中。实施例7表达抗体-酶融合蛋白的重组Lovo肿瘤细胞表现融合蛋白在细胞表面上的滞留

从(A5B7-CPG2)₂融合蛋白基因转染的LoVo结肠癌细胞已表现出又分泌同时在其细胞表面上又维持有融合蛋白，这可能过在对分泌的融合蛋白进行基于细胞的ELISA中分析提出的条件下比较母本和表达重组融合蛋白的LoVo细胞而加以证明(图4)。在显色反应中可以重组LoVo细胞通过显示出高水平的颜色而维持有表达的融合蛋白。在对照实验中，用表达Colo320DM融合蛋白的细胞，该分析显示有些融合蛋白的保留(可能是非特异性的)和母本LoVo细胞仅仅显示出背景活性。其中加入CEA结合抗体至表达测试重组融合蛋白的肿瘤细胞以及加入到母本LoVo对照中的阳性对照得到了从母本LoVo获得的信号(因此证明CEA存在于母本细胞上)但来自Colo320DM(CEA阴性)的信号没有增加。此重组的LoVo细胞仍然得到如此强裂的起始信号从而加入的抗体对获得的总的信号几乎没有影响，该信号比任何对照实验要高得多。因此，似乎从CEA阳性肿瘤细胞系分泌的抗-CEA抗体酶-CPG2融合蛋白通过CEA结合到细胞表面而CEA阴性肿瘤表达的相同蛋白没有表现出这种结合。实施例8表达抗体-酶融合蛋白的LoVo肿瘤细胞受前体药物的选择性杀伤

用(A5B7-CPG2)₂融合蛋白基因转染的LoVo结肠癌肿瘤细胞可受前体药物的选择性杀伤，该前体药物由CPG2酶转化成活性的药物。

为了证明此对照未转染的LoVo细胞或者将以抗体-CPG2融合蛋白基因转染的LoVo细胞与前体药物，4-[N，N-双(2-氯乙基)氨基]-苯氧羰基-L-谷氨酸(PGP；Blakey等，(1995)英国癌症杂志72，p1083)或由CPG2，4-[N，N-双(2-氯乙基)氨基]酚所释放的相应药物一起孵育，如实施例2中所述的HCT116细胞一样。

表达抗体-CPG2融合蛋白的转染细胞可将PGP前体药物转化成更为有活性的药物而未转染的LoVo细胞不能够转换此前体药物。

这些研究证明以抗体-酶融合蛋白基因转染肿瘤细胞可导致用前体药物对肿瘤细胞的选择性杀伤。实施例9表达融合蛋白的LoVo肿瘤异体移植在无胸腺小鼠中的建立

将重组的表达融合蛋白(A5B7-CPG2)₂的LoVo肿瘤细胞或将重组及母本LoVo细胞混合物皮下注射至无胸腺裸鼠(每只小鼠10⁷个肿瘤细胞)。同时将100％重组LoVo细胞及重组：母体LoVo细胞10％：80％的混合物的肿瘤生长速率与仅仅母本细胞肿瘤的生长速率相比较。在观察到的生长曲线中没有见到明显的差异，显示在细胞系间的比较过程中无需校正。观察到的肿瘤生长速率显示在每种异体移植肿瘤的情况中，达到10×10mm的大小大约需要12天。实施例10肿瘤异体移植样品中酶活性的测定

为了用作测定的标准，在20％的正常肿瘤(母本细胞肿瘤)的匀浆物中制备CPG2酶标准曲线。随后与正常肿瘤20％的匀浆物相同而制备样品稀释液。

从-80℃保藏(预先快速冷冻干液氮中)取出切下的肿瘤组织并使其融化。将肿瘤用手术刀切成小片段之前去除残余的皮肤组织。将肿瘤组织转入预先称量好的试管中并称取该肿瘤组织的重量。将含有0.2mMZnCl₂溶液的PBS加入每种肿瘤样品中以达到20％(w/v)混合物，匀浆并置于冰上。制备例如，干净的1/10、1/20和1/40的(于20％正常肿瘤匀浆物中)样品肿瘤的稀释液。

为了标准曲线，将CPG2酶稀释液制成400μl终体积中下面的浓度。类似地，也制备400μl每种重组肿瘤样品稀释液。平衡至30℃后，加入4μl的10mM氨甲喋呤(MTX)溶液。精确地在10分钟后通过加入600μl冰冷的甲醇+0.2％TFA而终止反应，离心并收集上清。然后通过HPLC(用阳离子交换柱，HICROM^TM S5SCX-100A，移动相260％甲醇，40％60mM的甲酸铵/0.1％TFA，300nm处检测)分离上清中的底物与产物。为了计算肿瘤组织中的酶活性，将标准曲线绘成氨甲喋呤代谢物面积的单位(此标准的这样，即仅仅20-30％的底物被代谢从而确保此为非速度限制性的)。通过比较代谢物单位面积与标准曲线且然后乘以稀释因子而分析测试样品。最后，制作1ml＝1g的工作假设，将结果乘以5(因为样品最初被稀释至20％的匀浆物)。

用表达(A5B7Fab-CPG2)₂融合蛋白的20％重组：80％母本LoVo细胞得到的结果显示下面的结果：于第5天取出的肿瘤具有平均酶活性＝0.26U/g(在0.18-0.36U/g之间的范围)且在第12天具有平均酶活性＝0.65U/g(在0.19-1.1U/g的范围)。实施例11血浆样品中酶活性的测定

为了用作测定的标准，在20％正常血浆中制备至下面浓度的CPG2酶标准曲线：0.2、0.4、0.6、0.8和1.0U/ml。类似地也将所有的测试血浆样品稀释至20％的正常血浆。同时用20％的正常血清制备这些样品的进一步稀释液，如干净的1/10、1/20和1/50稀释液。将200ml等份的每种CPG2标准和测试样品稀释液平衡至30℃。加入2μl 10mM的MTX至每只试管中并充分混合至30℃。准确地在10分钟后通过加入500μl冰冷的甲醇+0.2％TFA而终止反应(以增加测定的敏感性并可将孵育时间增加至30分钟)并按上面实施例10中所述用HPLC检测分析产物。

当肿瘤中酶活性水平超过2.0U/g时除了在少数情况外在血浆中没有见到活性，这些少数情况中的血浆酶水平测定为0.013至0.045U/ml的范围。实施例12CPG前体药物在表达抗体-CPG2融合蛋白的LoVo肿瘤中的抗肿瘤活性。

按实施例9中所述将表达(A5B5-CPG2)₂融合蛋白的重组LoVo肿瘤细胞或重组与母本LoVo细胞的混合物皮下注射至无胸腺裸晶中。

当肿瘤达到5.7mm直径时将PGP前体药物经腹膜内施用至小鼠(于DMSO/0.15M碳酸氢钠缓冲液以小时为间隔经2个小时3个剂量，剂量为40-80mg kg^-1)。

通过在2个方向测定肿瘤的长度并用下面的公式计算肿瘤体积而判定抗癌效应

体积＝π/×D²×d其中的D为肿瘤的较大直径且d为肿瘤的较小直径。肿瘤体积可以相对于施用PGP前体药物时的肿瘤体积来表示或者作为选择可计算平均的肿瘤体积。将该抗肿瘤活性与接受转染肿瘤细胞或未转染肿瘤细胞与无PGP前体药物的缓冲液的对照组相比较。

与对照相比PGP处理的肿瘤体积的减小并且与对照相比其需要明显更长的时间使PGP处理的肿瘤达到其起始肿瘤体积的4倍(图5)，由此所示施用PGP至从重组LoVo细胞或重组LoVo/母体LoVo细胞混合物建立的LoVo肿瘤导致了明显的抗肿瘤效应。施用PGP至从未转染细胞建立的LoVo肿瘤没有导致明显的抗肿瘤活性。

类似的研究可用于证明用适当的基因转移载体转移至从非转染母本LoVo细胞建立的LoVo肿瘤中的抗体-酶基因当与PGP前体药物联合使用时可导致显著的抗肿瘤活性。因此，将未转染的LoVo细胞注射至无胸腺裸鼠(每只小鼠1×10⁷个肿瘤细胞)并且一旦肿瘤达到5-7mm的直径，将含有抗体-酶融合蛋白基因的载体注射至肿瘤内。使LoVo肿瘤细胞表达抗体-酶融合蛋白1-3天后并结合至其上，按上述施用PGP前体药物。与对照相比这导致了显著的抗肿瘤活性。实施例13(806.077 Fab-CPG2)融合蛋白的构建

为了获得也表现出CPG2酶活性的二价人癌胚抗原(CEA)结合分子，计划构建(806.077 Fab-CPG2)₂酶融合。设计此最初构建体的末端含有806.077抗体重链Fd片段，该片段通过弹性的(G4S)3肽接头将其C-末端连接至CPG2多肽的N-末端(如图1中所示但从806.077代替A5B7)。

抗体806.077(在Zeneca有限公司的国际专利申请WO 97/42329中描述过)以很高程度的特异性与人CEA结合。因此，806.077抗体特别适用于靶向结肠癌或其它带有CEA抗原的细胞。

一般地，抗体(或抗体片段)-酶缀合物或融合蛋白应该至少为二价的，即是说能够结合至少2种肿瘤相关抗原(可为相同的或不同的)。在(806.077 Fab-CPG2)₂融合蛋白的情况，酶成分的二聚化(在表达后，与天然酶一样)发生，因而形成含有2个Fab抗体片段(且因此就抗体结合位点来说是二价的)和2个CPG2分子的酶促分子(图2a)。a)806.077抗体基因的克隆

重组鼠806.077 F(ab′)₂抗体的克隆及特征分析的方法已经公开(国际专利申请WO 97/42329，实施例7)，参考实施例7.5描述了将806.077抗体可变区基因克隆入Bluescript^TM KS+载体中。这些载体然后用作806.077可变区基因的来源而用于构建806.077嵌合轻链和重链Fd基因。b)嵌合806.077抗体载体构建体

国际专利申请WO 97/42329，实施例8公开描述了将806.077嵌合轻链和重链Fd基因克隆入载体pNG3-Vkss-HuCk-NEO(NCIMB保藏号40799)和pNG4-VHss-HuIgG2CH1′(NCIMB保藏号40797)中将得到的载体命名为pNG4/VHss 806.077VH-IgG2CH1′(806.077)嵌合重链Fd′和pNG3/Vkss806.077VK-HuCk-NEO(806.077嵌合轻链)。这些载体为用于构建806.077 Fab-CPG2融合蛋白的806.077抗体基因的来源。c)806.077重链Fd-CPG2融合蛋白基因的构建

所用的CPG2基因的克隆与构建描述于实施例1c和d部分中。类似地，用于构建806.077重链Fd-CPG2构建的pNG4/A5B7VH-IgGCH1/CPG2R6载体的构建描述于实施例1的e部分中，通过用限制酶HindIII和NheI消化而从pNG4/VHss 806.077VH-IgG2CH1′载体中切下806.077可变区重链基因并纯化含有此可变区基因的预期大小的(难300bp)的条带。为了准备将用806.077可变区代替A5B7抗体的可变区，用相同的限制酶(HindIII/NheI)消化载体pNG4/A5B7VH-IgG2CH1/CPG2R6。消化后，将DNA去磷酸然后分离和纯化较大的载体带。然后将类似限制性消化的可变区基因连接入此制备的载体中并将连接混合物转化入大肠杆菌中。从得到的克隆中制备DNA并通过限制性消化分析加以分析并且随后进行测序以确证融合基因序列。发现许多克隆为正确的并挑选其中一个克隆，pNG4/VHss806VH-IgG2CH1/CPG2R6用于进一步工作。构建的806.077重链Fd-CPG2融合蛋白的基因的序列示于SEQ ID NOS：25与26。d)共转染、融合蛋白的暂时表达与分析

用上面实施例1f中描述的基于LIPOFECTIN^TM的方法将(编码抗体嵌合Fd-CPG2融合蛋白的)质粒pNG4/VHss806.077VH-IgG2CH1/CPG2R6和(编码抗体嵌合轻链的)质粒pNG3/VHss806.077VK-HuCk-NEO共转染入COS-7细胞中。按实施例18中所述对融合蛋白进行分析。基于HPLC的酶活性测定清楚地显示CPG2酶活性存在于细胞上清中并且两种抗-CEA ELISA分析显示出以与二价的806.077抗体分子相当的水平的蛋白结合，用抗-CPG2报告抗体的抗-CEA ELISA测定也显示出清晰的CEA结合的事实表明不仅抗体而且抗体-CPG2融合蛋白结合CEA。同时用两种报告抗体的Western印迹分析清楚地显示出预期的大约90kDa大小的(806.077 Fab-CPG2)₂融合蛋白亚单位，其中仅可观察到小量的降解或更小的产物(如Fab或酶)。由于仅知道CPG2仅在其为二聚化状态时显示出酶活性并且由于仅仅抗体酶融合蛋白存在，这表明90kDa的融合蛋白(在SDS/PAGE条件下所见到的)在“自然”缓冲液条件下通过天然CPG2二聚化机制二聚化从而形成180kDa的二聚化抗体-酶融合蛋白分子孔(图2a)。此外，该分子同时显示出CPG2酶促活性和CEA抗原结合活性，似乎与仅仅酶或抗体相比此融合蛋白有显著不同。e)用于暂时及稳定细胞系表达的(806.077 Fab-CPG2)₂融合蛋白共表达载体的构建

为了更为简单的转染方法和直接偶联2种表达弹夹与单一筛选标记，用(编码抗体Fd-CPG2融合蛋白)的现存载体pNG4/VHss806.077VH-IgG2CH1/CPG2和(编码抗体轻链的)现存载体pNG3/VHss806.077VK-HuCk-NEO构建融合蛋白表达的共-表达载体。首先用限制酶ScaI消化pNG4/VHss806.077VH-IgG2CH1/CPG2质粒，纯化纯性载体带，用限制酶BglII和BamHI消化并纯化所需的条带(大约2700bp)。用限制酶BamHI消化质粒pNG3/VHss806.077VK-HuCk-NEO，将DNA去磷酸并纯化载体带。将重链表达弹夹片段连接入制备的载体中并将连接混合物转化入大肠杆菌中，通过多种限制性消化检查方向并筛选具有与轻链方向相同的重链弹夹的克隆。该质粒命名为pNG3-806.077-CPG2/R6-coexp.-NEO。实施例14(55.1 scFv-CPG2)₂融合蛋白的构建

美国专利5,665,357中所述的55.1抗体识别CA55.1肿瘤相关抗原，该抗原表达于大多数结肠癌并具在正常结肠组织中仅仅微弱表达或不表达。55.1重轻链cDNA序列的测定描述于前述的美国专利的实施例3中。允许用单一pelB前导序列(pICI266)将抗体片段分泌至大肠杆菌周质中的质粒表达载体已于1993年10月11日根据布达佩期条约以许可号NCIMB 40589保藏于国立工业及海洋微生物保藏有限公司(NCIMB)23St Machar Drive，Aberdeen，AB2 1RY，苏格兰，英国，按美国专利5,665,357的实施例3.3a中所述修饰此载体以构建pICI1646；按在实例3的进一步子部分中所述用此质粒克隆各种55.1抗体片段，包括命名为pICI1657的55.1 scFv构建体的制备。

用(又称为pICI-55.1 scFV)的pICI 1657作为构建(55.1ScFv-CPG2)₂融合蛋白的起点。用寡核苷酸CME 3270和CME 3272(分别为SEQ ID NOS：27与28)以及用质粒pICI1657作为模板DNA而扩增55.1 scFv基因。纯化大约790bp的得到的PCR产物带。类似地，按上面实施例1e中所述将pNG4/A5B7VH-IgG2CH1/CPG2 R6质粒用作标准PCR反应中的模板DNA用寡核苷酸引物CME 3274和CME 3275(分别为SEQ ID NOS：29和30)扩增CPG2基因。纯化大约1200bp的预期PCR产物条带。

进行进一步的PCR反应从而将2种纯化的PCR反应产物连接(或剪接)起来。使用标准的PCR反应条件，用不同量(0.5到2μl之间)的每种PCR产物但使用25轮循环(而不是通常的15轮循环)，用寡核苷酸CME 3270和CME 3275(SEQ ID NOS：27与30)。切下预期大小的(大约2000bp)反应产物，纯化并于20μl H₂O中洗脱，用限制酶RcoRI消化并加以纯化。通过以限制酶EcoRI消化、支磷酸、分离出较大载体带与较小片段并纯化而制备载体pNG4/VHss806.077VH-IgG2CH1/CPG2以接受上面的PCR产物。将类似限制性消化的PCR产物连接入制备的载体中并将连接混合物转化入大肠杆菌中。从得到的克隆中制备DNA并通过HindIII/NotI限制性消化分析以检查正确的方向且随后对适当的克隆测序以确证此融合基因序列。得到多个具有正确序列的克隆并将其中的一个给以质粒命称pNG4/55.1scFv/CPG2R6。此DNA及融合蛋白的氨基酸序列示于SEQID NOS：31与32中。实施例15修饰质粒pNG4/55.1 scFv/CPG2 R6以促进scFv基因交换

在构建pNG4/55.1 scFv/CPG2 R6过程中，将独特的BspEI(AccIII的同裂酶)导入位于抗体与CPG2基因之间的弹性(G₄S)₃接头编码序列中。为了利于克隆其它的scFv构建体，将pNG4/55.1 scFv/CPG2 R6中的CPG2基因3′端的EcoRI位点缺失从而能够通过EcoRI/BspEI片段克隆在该质粉信号序列后和CPG2基因的5′端在框内插入其它的scFv抗体基因。此修饰通过PCR诱变完成，诱变过程中首先将pNG4/55.1scFv/CPG2 R6用寡核苷酸CME 3903和CME 3906(分别为SEQ IDNOS：33和34)加以扩增。其次，用寡核苷酸CME 4040和CME 3905(分别为SEQ ID NOS：35和36)再次扩增pNG4/55.1 scFv/CPG2R6。纯化大约420bp的第一条预期的PCR产物条带。类似处理第二个PCR反应并纯化大约450bp的预期的PCR产物条带。

进行进一步的PCR反应以将两上纯化的PCR反应产物连接(或剪接)到一起。使用标准的PCR反应条件，使用不同量的(在0.5到2μl)每种PCR产物但用寡核苷酸CME 3905和CME 3906(SEQ IDNOS：36及34)进行15到20个循环。预期大小的(大约840bp)的反应产物进行纯化，用限制酶NotI和XbaI进行消化并纯化大约460bp的预期片段条带。

通过以限制酶NotI和XbaI消化、去磷酸并分离较大载体带与较小片段而将最初的pNG4/55.1 scFv/CPG2 R6制备成接受上面的PCR产物。纯化载体知带并且随后将类似限制性消化的PCR产物连接入此制备的载体中并将连接混合物转化入大肠杆菌中。从得到的克隆中制备DNA普通过EcoRI限制性消化分析以检查此修饰片段的插入并且随后对适当的克隆测序以证实此序列变化。获得多个具有正确序列的克隆并将其中的一个克隆给以质粒命名pNG4/55.1scFv/CPG2 R6/delEcoRI。此突变去除了CPG2基因3′的EcoRI位点并同时导入了额外的终止密码子。达到并包括2个终止密码子的此融合蛋白基因DNA序列示于SEQ ID NO：37中。实施例16806.077 scFv抗体基因的构建

用为806.077 VH和VK可变压基因来源的载体pNG4/VHss806.077VH-IgG2CH1′和pNG3/VKss806.077VK-HuCk-NEO构建806.077 scFv。用寡核苷酸CME3260和CME 3266(分别为SEQ ID NOS：39和40)用标准的PCR条件从pNG4/VHss806.077VH-IgG2CH1′质粒中扩增806.077VH基因。用寡核苷酸CME 3262和CME 3267(分别为SEQ ID NOS：41与42)从pNG3/VKss806.077VK-HuCk-NEO质粒中扩增806.077VK。纯化VH和VK PCR反应产物。

进行进一步的PCR反应从而将这2个纯化的PCR反应产物连接(剪接)起来。使用标准的PCR反应条件，使用不同量的(0.5到2μl)每种PCR产物但用两侧寡核苷酸CME 3260和CME 3262(SEQ IDNOS：39和41)进行15到25个循环。纯化预期大小(大约730bp)的反应产物，用限制酶NcoI和XhoI消化并纯化大约720bp的预期片段条带。

通过标准的克隆技术在存在的XhoI和EcoRI限制性位点之间插入从2个寡核苷酸CME 3143和CME 3145(SEQ ID NOS：45和46)制备的双链DNA弹夹而进一步修饰pICI1657质粒(又称为pICI 55.1scFv)从而构建载体pICI 266-55.1 scFvtag/his(得到的55.1 scFvtag/his基因的DNA序列示于SEQ ID NO：47中)。通过以限制酶NcoI和XhoI消化、去磷酸并分离较大的载体带与较小的片段而接受上面的PCR产物。纯化此载体带并且随后将类似限制性消化的PCR产物连接入制备的载体中并将连接混合物转化入大肠杆菌中。从获得的克隆中制备DNA并通过EcoRI限制性消化分析检查此修饰片段的插入并且随后对适当的克隆进行测序以证实此序列变化。得到多个具有正确序列的克隆并将其中一个给以质粒命名pICI266/806IscFvtag/his(又称为pICI266.806VH/VLssFvtag/his)。806I scFvtag/his基因的DNA与蛋白序列示于(SEQ ID NOS：25与26中)。实施例17(806.077 scFv-CPG2)₂融合蛋白的构建

将pICI266/806 IscFvtag/his质粒用作806scFv的来源。用寡核苷酸CME 3907和CME 3908(SEQ ID NOS：48和49)扩增此基因并纯化预期大小的条带。然后用限制酶EcoRI和BspEI消化此片段后纯化大约760bp的预期片段条带。

通过用限制酶EcoRI和BspEI消化上述片段，去磷酸并分离较大载体与较小片段而制备pNG4/55.1 scFv/CPG2 R6/del EcoRI质粒。纯化载体带并随后将类似地限制性消化的片段连接入制备的载体中并将连接混合物转化入大肠杆菌中。从得到的克隆中制备DNA并通过EcoRI限制性消化分析以检查修饰片段的插入。随后将适当的克隆测序以确证此基因序列。得到多个具有正确序列的克隆并将其中一个给以质粒命名pNG4/806 IscFv/CPG2 R6/del EcoRI。此融合蛋白基因806 IscFv/CPG2R6的DNA和蛋白序列示于(SEQ ID NOS：50与51中)。实施例18共转染，抗体-CPG2融合蛋白的暂时表达

如实施例1f中所述，可用给定的标准条件转染编码其它融合蛋白变异体的质粒以获得其编码的融合蛋白在COS7细胞中的暂时表达。，在(Fab-CPG2)₂融合蛋白的情况，可同时共转染适当的质粒或转染共表达蛋白。类似地，也可通过相同的方法轨染(scFv-CPG2)₂融合蛋白的单一表面质粒。在每种情况下，在每次转染中使用最多共4mgDNA。实施例19蛋白表达的基因开关

如实施例1j中所述，紧密控制但可诱导的基因开关系统如“TET开”或“TET关”(Grossen，M.等(1995)科学268：1766-1769)或蜕皮素/muristerone A(No.D.等(1996)PNAS 93：3346-3351)可用于表达融合蛋白。可用实施例5中所述的适当方法与克隆策略进行需要IRES序列的抗体Fab-酶融合表达。如果此融合蛋白产物为单一多肽链如scFv-酶构建体可以使用将适当的基因弹夹插入到可开关的表达载体中。实施例20分泌抗体酶融合蛋白的COS7细胞特性的测定

可按实施例1g中所述分析COS7细胞上清物质中抗体融合蛋白的存在。类似地可按前面实施例1h中所述用表达的融合蛋白与CPG2前体药物与体外细胞毒性分析中。基于HPLC的酶活性分析可显示CPG2酶活性存在于细胞上清中并可用抗CPG2报告抗体进行抗-CEAELISA检测以证实与二价A5B7抗体分子以相同的水平结合蛋白并且同时证明抗体-CPG2融合蛋白(不仅仅为抗体成分)结合CEA。

同时用2种报告抗体分析的Western印迹分析清楚地显示预期大小的融合蛋白亚单位。由于CPG2仅已知在二聚化状态的显示出酶活性并且因为仅仅抗体酶融合蛋白的存在，故表明该融合蛋白(在SDS/PAGE条件下所见到的)在“天然”缓冲条件中通过天然CPG2二聚化机制二聚化以形成二聚化的抗体酶融合蛋白分子。此外，此分子同时显示出CPG2酶促活性和CEA抗原结合特性，这与单独的酶或抗体比较在融合蛋白方面中没有显著不同。从细胞毒性分析中获得的结果可证明抗体-酶融合蛋白(与前体药物一起)与相当水平的A5B7 F(ab′)₂-CPG2缀合物(与相同二前体药物)相比导致至少相同二细胞杀伤并在分析结束时得到更少数目的细胞。由于细胞杀伤(高于基本对照水平)仅可在此前体药物被CPG2酶转移成活性药物时发生(并且由于冲洗这些细胞以去除未结合的蛋白，当加入前体药物时仅仅结合细胞的酶将会保持)。因此，该实验可证明与常规的A5B7 F(ab)₂-CPG2缀合物相比至少有更大程度的细胞杀伤数量的(A5B7-CPG2 R6)₂融合蛋白保持结合(可能由于更多的前体药物至药物的转换)发生。实施例21重组肿瘤细胞表达的抗体酶融合蛋白特性体外及体内的测定

可按实施例4中所述构建表达融合蛋白的肿瘤细胞系。

可用实施例7中所述的技术显示融合蛋白质在表达抗体酶融合蛋白的重组LoVo肿瘤细胞表面上的滞留。可按实施例8中所述证明前体药物(由CPG2转换成活性药物)通过抗体CPG2融合蛋白基因对转杂的培养LoVo肿瘤细胞的选择性杀伤。可按实施例9中所述在无胸腺小鼠中建立表达抗体酶融合蛋白的LoVo肿瘤的异体移植。也可按实施例10中所述测定肿瘤导体移植样品中的酶活性。

按实施例11中所述测定血浆样品中的酶活性。可用实施例12中所述的方法评估PGP前体药物在表达抗体CPG2融合蛋白LoVo肿瘤中的抗肿瘤活性。

这些实验结果可用于显示CEA阳性肿瘤细胞系分泌的抗体-CPG2融合蛋白(通过CEA)结合到细胞表面上而由CEA阴性肿瘤表达的相同蛋白没有显示出这种结合。

这些结果可证明表达抗体-CPG2融合蛋白的转染细胞可将PGP前体药物转换成更为活性的药物而未转染的LoVo细胞不能够转换前体药物。因此，与未转染的LoVo细胞相比，就细胞杀伤而言转染的LoVo细胞对PGP前体药物的敏感性要高100倍，因此证明用抗体-酶融合蛋白基因转染肿瘤细胞可导致前体药物对肿瘤：选择性细胞杀伤。

通过与仅仅用制备缓冲液处理的情况相比PGP处理的肿瘤体积减小并且与制备缓冲液处理的肿瘤相比，PGP处理的肿瘤要花费显著更长的时间达到其最初体积的4倍来判断，施用PGP至从重组LoVo细胞或重组LoVo/母本LoVo细胞混合物建立的LoVo肿瘤可导致明显的抗肿瘤效应。相反，施用PGP至从未转染细胞建立的LoVo肿瘤中没有导致明显的抗肿瘤活性。

类似的研究可用于证明于适当的基因转换载体中转移至从未转染的母本LoVo细胞制备的LoVo肿瘤中的抗体酶基因当与PGP前体药物联合使用时可导致显著的抗肿瘤活性。因此，将未转染的LoVo细胞注射至无胸腺裸鼠(每只小鼠1×10⁷个肿瘤细胞)中且一旦肿瘤为5-7mm的直径，将含有抗体-酶融合蛋白基因的载体注射至肿瘤内。使抗体-酶融合蛋白表达并结合至LoVo肿瘤细胞上1-7天后，按前述施用PGP前体药物。这与接受制备缓冲液而不是PGP前体药物的对照小鼠相比得到了显著的抗肿瘤活性。实施例22(鼠A5B7 Fab-CPG2)₂融合蛋白的制备

基本上按国际专利申请WO 97/42329(Zeneca有限公司，1997年11月13日公开)的实施例48(d)部分中所述通过将在其C-端通过弹性的(G₄S)₃肽接头连接至CPG2上的A5B7轻链及A5B7 Fd基因克隆至pee14共表达载体中而由COS-7和CHO细胞表达(鼠A5B7 fab-CPG2)₂。

从(国际专利申请WO 96/20011(Zeneca有限公司)的参考实施例5的g部分中所述的)pAF8中分离鼠A5B7轻链。用EcoRI切割质粒pAF8并通过于1％琼脂糖凝胶上的电泳分离得到的732bp的片段。将此片段克隆入用EcoRI类似切割的pEE14(由Bebbington在方法：酶学方法指南(1991)2，136-145中所述)中并用得到的质粒转化大肠杆菌菌株DH5α。将转化的细胞铺板于含氨苄青霉素(100μg/ml)的L-琼脂上。通过DNA序列分析(SEQ ID NO：57)证实含有具有正确序列与方向质粒的克隆并将该质粒命名为pEE14/A5B7muVkmnCk。编码的信号序列(氨基酸残基1到22)和鼠轻链(氨基酸残基23到235)的氨基酸序列示于SEQ ID NO：58中。

从CPG2基因的R6变异体(实施例1d)和pAF1中的鼠A5B7 Fd序列(描述于国际专利申请WO 96/20011(Zeneca有限公司)参考实施例5中d部分中所述)中制备鼠Fd-CPG2基因。用寡核苷酸SEQ IDNOS：53和54对pAF1进行PCR反应得到247bp的片段。此片段用HindIII和BamHI切割并克隆入类似的pUC19中。得到的质粒用于转化大肠杆菌DH5α菌株。将转化的细胞铺盘于含氨苄青霉素(100μg/ml)的L琼脂上。将含有具有正确序列质粒的克隆命名为pUC19/muCH1/NcoI-AccIII(Fd)。用寡核苷酸SEQ ID NOS：55和56对pNG/VKss/CPG2/R6-neo(实施例1)的第二次PCR得到265bp的片段，用HindIII与EcoRI切割并克隆入类似上述切割的pUC19中以得到质粒pUC19/muCH1-接头-CPG2/AccIII-SacII。用HindIII和AccIII切割质粒pUC19/muCH1/NcoI-AccIII(Fd)并通过于1％琼脂糖凝胶上电泳而分离出258bp的片段。将此片段克隆入HindIII与AccIII切割的pUC19/muCH1-接头-CPG2/AccIII-SacII中以得到质粒pUC19/muCH1-接头-CPG2/AccIII-SacI。通过用SacII和EcoRI切割之而以pNG/VKss/CPG2/R6-neo中分离956bp的片段。将该片段克隆入SacII和EcoRI切割的pUC19/muCH1-接头-RC/CPG2(R6)。通过从pAF1中分离HindIII到NcoI片段的498bp的片段并将之克隆入HindIII与NcoI切割的pUC19/muCH1-接头-RC/CPG2(R6)中而制备完整的基因构建体。将得到的质粒用于转化大肠杆菌DH5α菌株。将转化的细胞铺盘于含有氨苄青霉素(100μg/ml)的L-琼脂上。含有具有正确序列与方向质粒的克隆通过DNA序列分析(SEQ ID NO：59)加以证实将将此质粒命名为pUC19/muA5B7-RC/CPG2(R6)。编码的信号序列(氨基酸残基1到19)与鼠Fd-接头-CPG2(氨基酸残基20到647)的氨基酸序列示于SEQ ID NO：60中作为选择，可通过全基因合成获取实施例1中所述的CPG2基因序列并按实施例1d中所转变为R6变异体。在该情况中，SEQ ID NO：59中位置933的碱基C变为G、SEQ ID NO：60的氨基酸序列保持不变。

为了在pEE14载体中的表达，将该基因首先克隆入pEE6(此为pee6.hCMV的衍生物stephems和Cockett，1989，核酸研究17，7110，其中的hCMV启动子上游的HindIII位点已转换成BglII位点)。质粒pUC19/muA5B7-RC/CPG2(R6)用HindIII和EcoRI切割并通过在1％的琼脂糖凝胶上电泳而分离1974bp的片段。将此克隆入大肠杆菌DH5α中HinDIII和EcoRI切割的pEE6中以得到质粒pEE6/muA5B7-RC/CPG2(R6)。通过首先以Bgl值和BamHI切割pEE6/muA5B7-RC/CPG2(R6)。并于1％琼脂糖凝胶上分离4300bp的片段而制备pEE114共表达载体。将此片段克隆入BglII和BamHI切割的pEE14/A5B7muCK中。将得到的质粒用于转化大胸杆菌DH5α菌株，将转化的细胞铺盘于含氨基卡青霉素(100μg/ml)的L琼脂上。通过DNA序列分析证实含有具有正确序列与方向质粒的克隆并将此质粒命名为pEE14/muA5B7-RC/CPG2(R6)。

为了(鼠A5B7 Fab-CPG2)₂的表达，用质粒pEE14/muA5B7-RC/CPG2(R6)转染COS-7或XHO细胞，此操作按1997年11月13日公开的Zenoca有限公司的国际专利申请WO 97/42329的实施例48中所述进行。按实施例1中所述分析COS细胞上清和CHO克隆上清中的活性并且显示具有CEA结合和CPG2酶活性。实施例23药物组合物

下面说明含有可与适当的前体药物联合用于治疗的本发明基因构建体的代表性药物剂量形式。

用于肠道外或直接注射入肿瘤组织中的无菌水溶液，含有10⁷-10¹¹个包括实施例1中所述基因构建体的腺病毒颗粒。3-7天后，将3个1g剂量的前体药物以小时为间隔作为无菌液而施用。前体药物选自N-(4-[N，N-双(2-碘乙基)氨基]苯氧羰基)-L-谷氨酸，N-(4-[N，N-双(2-氯乙基)氨基]-苯氧羰基)-L-谷氨酸-γ-(3，5-二羧基)酰基苯胺或N-(4-[N，N-双(2-氯乙基)氨基]-苯氧羰基)-L-谷氨酸或其药物上可接受的盐。

序列表(1)一般信息：(i)申请人：

(A)名称：Zeneca有限公司

(B)街道：15 Stanhope Gate

(C)城市：伦敦

(D)联邦：英格兰

(E)国家：英国

(F)邮编(ZIP)：W1Y 6LN

(G)电话：0171 304 5000

(H)电传：0171 304 5151

(I)电报：0171 304 2042(ii)发明题目：化合物(iii)序列数目：60(iv)计算机可读形式：

(A)介质类型：软盘

(B)计算机：IBM PC兼容机

(C)操作系统：PC-DOS/MS-DOS

(D)软件：专利发布#1.0，#1.30版本(EPO)(iv)优先申请数据：

(A)申请号：GB 9709421.3

(B)提交日期：1997年5月10日(2)SEQ ID NO：1信息：(i)序列特征：

(A)长度：21个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性(ii)分子类型：其它核酸(xi)序列描述：SEQ ID NO：1：GGGAATTCCT CGAGGAGCTC C 21(2)SEQ ID NO：2信息：(i)序列特征：

(A)长度：27个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性(ii)分子类型：其它核酸(xi)序列描述：SEQ ID NO：2：CCGGGGAGCT CCTCGAGGAA TTCCCGC 27(2)SEQ ID NO：3信息：(i)序列特征：

(A)长度：18个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性(ii)分子类型：其它核酸(xi)序列描述：SEQ ID NO：3：CAGAAGCGCG ACAACGTG 18(2)SEQ ID NO：4信息：(i)序列特征：

(A)长度：39个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性(ii)分子类型：其它核酸(xi)序列描述：SEQ ID NO：4：CGAGGCCTTG CCGGTGATCT GGACCTGCAC GTAGGCGAT 39(2)SEQ ID NO：5信息：(i)序列特征：

(A)长度：63个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性(ii)分子类型：其它核酸(xi)序列描述：SEQ ID NO：5：GGGGATGATG TTCGAGACCT GGCCGGCCTT GGCGATGGTC CACTGGAAGC GCAGGTTCTT 60CGC 63(2)SEQ ID NO：6信息：(i)序列特征：

(A)长度：18个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性(ii)分子类型：其它核酸(xi)序列描述：SEQ ID NO：6：CTTGCCGGCG CCCAGATC 18(2)SEQ ID NO：7信息：(i)序列特征：

(A)长度：18个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性(ii)分子类型：其它核酸(xi)序列描述：SEQ ID NO：7：GTCTCGAACA TCATCCCC 18(2)SEQ ID NO：8信息：(i)序列特征：

(A)长度：18个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性(ii)分子类型：其它核酸(xi)序列描述：SEQ ID NO：8：ATCACCGGCA AGGCCTCG 18(2)SEQ ID NO：9信息：(i)序列特征：

(A)长度：1236个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性(ii)分子类型：其它核酸(xi)序列描述：SEQ ID NO：9：ATGGATTTTC AAGTGCAGAT TTTCAGCTTC CTGCTAATCA GTGCTTCAGT CATAATGTCC 60CGCGGGCAGA AGCGCGACAA CGTGCTGTTC CAGGCAGCTA CCGACGAGCA GCCGGCCGTG 120ATCAAGACGC TGGAGAAGCT GGTCAACATC GAGACCGGCA CCGGTGACGC CGAGGGCATC 180GCCGCTGCGG GCAACTTCCT CGAGGCCGAG CTCAAGAACC TCGGCTTCAC GGTCACGCGA 240AGCAAGTCGG CCGGCCTGGT GGTGGGCGAC AACATCGTGG GCAAGATCAA GGGCCGCGGC 300GGCAAGAACC TGCTGCTGAT GTCGCACATG GACACCGTCT ACCTCAAGGG CATTCTCGCG 360AAGGCCCCGT TCCGCGTCGA AGGCGACAAG GCCTACGGCC CGGGCATCGC CGACGACAAG 420GGCGGCAACG CGGTCATCCT GCACACGCTC AAGCTGCTGA AGGAATACGG CGTGCGCGAC 480TACGGCACCA TCACCGTGCT GTTCAACACC GACGAGGAAA AGGGTTCCTT CGGCTCGCGC 540GACCTGATCC AGGAAGAAGC CAAGCTGGCC GACTACGTGC TCTCCTTCGA GCCCACCAGC 600GCAGGCGACG AAAAACTCTC GCTGGGCACC TCGGGCATCG CCTACGTGCA GGTCCAGATC 660ACCGGCAAGG CCTCGCATGC CGGCGCCGCG CCCGAGCTGG GCGTGAACGC GCTGGTCGAG 720GCTTCCGACC TCGTGCTGCG CACGATGAAC ATCGACGACA AGGCGAAGAA CCTGCGCTTC 780CAGTGGACCA TCGCCAAGGC CGGCCAGGTC TCGAACATCA TCCCCGCCAG CGCCACGCTG 840AACGCCGACG TGCGCTACGC GCGCAACGAG GACTTCGACG CCGCCATGAA GACGCTGGAA 900GAGCGCGCGC AGCAGAAGAA GCTGCCCGAG GCCGACGTGA AGGTGATCGT CACGCGCGGC 960CGCCCGGCCT TCAATGCCGG CGAAGGCGGC AAGAAGCTGG TCGACAAGGC GGTGGCCTAC 1020TACAAGGAAG CCGGCGGCAC GCTGGGCGTG GAAGAGCGCA CCGGCGGCGG CACCGACGCG 1080GCCTACGCCG CGCTCTCAGG CAAGCCAGTG ATCGAGAGCC TGGGCCTGCC GGGCTTCGGC 1140TACCACAGCG ACAAGGCCGA GTACGTGGAC ATCAGCGCGA TTCCGCGCCG CCTGTACATG 1200GCTGCGCGCC TGATCATGGA TCTGGGCGCC GGCAAG 1236(2)SEQ ID NO：10信息：(i)序列特征：

(A)长度：412个氨基酸

(B)类型：氨基酸

(C)链型：单链

(D)拓扑学：线性(ii)分子类型：蛋白质(xi)序列描述：SEQ ID NO：10：Met Asp Phe Gln Val Gln Ile Phe Ser Phe Leu Leu Ile Ser Ala Ser1 5 10 15Val Ile Met Ser Arg Gly Gln Lys Arg Asp Asn Val Leu Phe Gln Ala

20 25 30Ala Thr Asp Glu Gln Pro Ala Val Ile Lys Thr Leu Glu Lys Leu Val

35 40 45Asn Ile Glu Thr Gly Thr Gly Asp Ala Glu Gly Ile Ala Ala Ala Gly

50 55 60Asn Phe Leu Glu Ala Glu Leu Lys Asn Leu Gly Phe Thr Val Thr Arg65 70 75 80Ser Lys Ser Ala Gly Leu Val Val Gly Asp Asn Ile Val Gly Lys Ile

85 90 95Lys Gly Arg Gly Gly Lys Asn Leu Leu Leu Met Ser His Met Asp Thr

100 105 110Val Tyr Leu Lys Gly Ile Leu Ala Lys Ala Pro Phe Arg Val Glu Gly

115 120 125Asp Lys Ala Tyr Gly Pro Gly Ile Ala Asp Asp Lys Gly Gly Asn Ala

130 135 140Val Ile Leu His Thr Leu Lys Leu Leu Lys Glu Tyr Gly Val Arg Asp145 150 155 160Tyr Gly Thr Ile Thr Val Leu Phe Asn Thr Asp Glu Glu Lys Gly Ser

165 170 175Phe Gly Ser Arg Asp Leu Ile Gln Glu Glu Ala Lys Leu Ala Asp Tyr

180 185 190Val Leu Ser Phe Glu Pro Thr Ser Ala Gly Asp Glu Lys Leu Ser Leu

195 200 205Gly Thr Ser Gly Ile Ala Tyr Val Gln Val Gln Ile Thr Gly Lys Ala

210 215 220Ser His Ala Gly Ala Ala Pro Glu Leu Gly Val Asn Ala Leu Val Glu225 230 235 240Ala Ser Asp Leu Val Leu Arg Thr Met Asn Ile Asp Asp Lys Ala Lys

245 250 255Asn Leu Arg Phe Gln Trp Thr Ile Ala Lys Ala Gly Gln Val Ser Asn

260 265 270Ile Ile Pro Ala Ser Ala Thr Leu Asn Ala Asp Val Arg Tyr Ala Arg

275 280 285Asn Glu Asp Phe Asp Ala Ala Met Lys Thr Leu Glu Glu Arg Ala Gln

290 295 300Gln Lys Lys Leu Pro Glu Ala Asp Val Lys Val Ile Val Thr Arg Gly305 310 315 320Arg Pro Ala Phe Asn Ala Gly Glu Gly Gly Lys Lys Leu Val Asp Lys

325 330 335Ala Val Ala Tyr Tyr Lys Glu Ala Gly Gly Thr Leu Gly Val Glu Glu

340 345 350Arg Thr Gly Gly Gly Thr Asp Ala Ala Tyr Ala Ala Leu Ser Gly Lys

355 360 365Pro Val Ile Glu Ser Leu Gly Leu Pro Gly Phe Gly Tyr His Ser Asp

370 375 380Lys Ala Glu Tyr Val Asp Ile Ser Ala Ile Pro Arg Arg Leu Tyr Met385 390 395 400Ala Ala Arg Leu Ile Met Asp Leu Gly Ala Gly Lys

405 410(2)SEQ ID NO：11信息：(i)序列特征：

(A)长度：21个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性(ii)分子类型：其它核酸(xi)序列描述：SEQ ID NO：11：CCACTCTCAC AGTGAGCTCG G 21(2)SEQ ID NO：12信息：(i)序列特征：

(A)长度：55个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性(ii)分子类型：其它核酸(xi)序列描述：SEQ ID NO：12：ACCGCTACCG CCACCACCAG AGCCACCACC GCCAACTGTC TTGTCCACCT TGGTG 55(2)SEQ ID NO：13信息：(i)序列特征：

(A)长度：18个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性(ii)分子类型：其它核酸(xi)序列描述：SEQ ID NO：13：ACCCCCTCTA GAGTCGAC 18(2)SEQ ID NO：14信息：(i)序列特征：

(A)长度：54个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性(ii)分子类型：其它核酸(xi)序列描述：SEQ ID NO：14：TCTGGTGGTG GCGGTAGCGG TGGCGGGGGT TCCCAGAAGC GCGACAACGT GCTG 54(2)SEQ ID NO：15信息：(i)序列特征：

(A)长度：1929个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性(ii)分子类型：其它核酸(xi)序列描述：SEQ ID NO：15：ATGGAGTTGT GGCTGAACTG GATTTTCCTT GTAACACTTT TAAATGGTAT CCAGTGTGAG 60GTGAAGCTGG TGGAGTCTGG AGGAGGCTTG GTACAGCCTG GGGGTTCTCT GAGACTCTCC 120TGTGCAACTT CTGGGTTCAC CTTCACTGAT TACTACATGA ACTGGGTCCG CCAGCCTCCA 180GGAAAGGCAC TTGAGTGGTT GGGTTTTATT GGAAACAAAG CTAATGGTTA CACAACAGAG 240TACAGTGCAT CTGTGAAGGG TCGGTTCACC ATCTCCAGAG ATAAATCCCA AAGCATCCTC 300TATCTTCAAA TGAACACCCT GAGAGCTGAG GACAGTGCCA CTTATTACTG TACAAGAGAT 360AGGGGGCTAC GGTTCTACTT TGACTACTGG GGCCAAGGCA CCACTCTCAC AGTGAGCTCG 420GCTAGCACCA AGGGACCATC GGTCTTCCCC CTGGCCCCCT GCTCCAGGAG CACCTCCGAG 480AGCACAGCCG CCCTGGGCTG CCTGGTCAAG GACTACTTCC CCGAACCGGT GACGGTGTCG 540TGGAACTCAG GCGCTCTGAC CAGCGGCGTG CACACCTTCC CGGCTGTCCT ACAGTCCTCA 600GGACTCTACT CCCTCAGCAG CGTCGTGACG GTGCCCTCCA GCAACTTCGG CACCCAGACC 660TACACCTGCA ACGTAGATCA CAAGCCCAGC AACACCAAGG TGGACAAGAC AGTTGGCGGT 720GGTGGCTCTG GTGGTGGCGG TAGCGGTGGC GGGGGTTCCC AGAAGCGCGA CAACGTGCTG 780TTCCAGGCAG CTACCGACGA GCAGCCGGCC GTGATCAAGA CGCTGGAGAA GCTGGTCAAC 840ATCGAGACCG GCACCGGTGA CGCCGAGGGC ATCGCCGCTG CGGGCAACTT CCTCGAGGCC 900GAGCTCAAGA ACCTCGGCTT CACGGTCACG CGAAGCAAGT CGGCCGGCCT GGTGGTGGGC 960GACAACATCG TGGGCAAGAT CAAGGGCCGC GGCGGCAAGA ACCTGCTGCT GATGTCGCAC 1020ATGGACACCG TCTACCTCAA GGGCATTCTC GCGAAGGCCC CGTTCCGCGT CGAAGGCGAC 1080AAGGCCTACG GCCCGGGCAT CGCCGACGAC AAGGGCGGCA ACGCGGTCAT CCTGCACACG 1140CTCAAGCTGC TGAAGGAATA CGGCGTGCGC GACTACGGCA CCATCACCGT GCTGTTCAAC 1200ACCGACGAGG AAAAGGGTTC CTTCGGCTCG CGCGACCTGA TCCAGGAAGA AGCCAAGCTG 1260GCCGACTACG TGCTCTCCTT CGAGCCCACC AGCGCAGGCG ACGAAAAACT CTCGCTGGGC 1320ACCTCGGGCA TCGCCTACGT GCAGGTCCAG ATCACCGGCA AGGCCTCGCA TGCCGGCGCC 1380GCGCCCGAGC TGGGCGTGAA CGCGCTGGTC GAGGCTTCCG ACCTCGTGCT GCGCACGATG 1440AACATCGACG ACAAGGCGAA GAACCTGCGC TTCCAGTGGA CCATCGCCAA GGCCGGCCAG 1500GTCTCGAACA TCATCCCCGC CAGCGCCACG CTGAACGCCG ACGTGCGCTA CGCGCGCAAC 1560GAGGACTTCG ACGCCGCCAT GAAGACGCTG GAAGAGCGCG CGCAGCAGAA GAAGCTGCCC 1620GAGGCCGACG TGAAGGTGAT CGTCACGCGC GGCCGCCCGG CCTTCAATGC CGGCGAAGGC 1680GGCAAGAAGC TGGTCGACAA GGCGGTGGCC TACTACAAGG AAGCCGGCGG CACGCTGGGC 1740GTGGAAGAGC GCACCGGCGG CGGCACCGAC GCGGCCTACG CCGCGCTCTC AGGCAAGCCA 1800GTGATCGAGA GCCTGGGCCT GCCGGGCTTC GGCTACCACA GCGACAAGGC CGAGTACGTG 1860GACATCAGCG CGATTCCGCG CCGCCTGTAC ATGGCTGCGC GCCTGATCAT GGATCTGGGC 1920GCCGGCAAG 1929(2)SEQ ID NO：16信息：(i)序列特征：

(A)长度：643个氨基酸

(B)类型：氨基酸

(C)链型：单链

(D)拓扑学：线性(ii)分子类型：蛋白质(xi)序列描述：SEQ ID NO：16：Met Glu Leu Trp Leu Asn Trp Ile Phe Leu Val Thr Leu Leu Asn Gly1 5 10 15Ile Gln Cys Glu Val Lys Leu Val Glu Ser Gly Gly Gly Leu Val Gln

20 25 30Pro Gly Gly Ser Leu Arg Leu Ser Cys Ala Thr Ser Gly Phe Thr Phe

35 40 45Thr Asp Tyr Tyr Met Asn Trp Val Arg Gln Pro Pro Gly Lys Ala Leu

50 55 60Glu Trp Leu Gly Phe Ile Gly Asn Lys Ala Asn Gly Tyr Thr Thr Glu65 70 75 80Tyr Ser Ala Ser Val Lys Gly Arg Phe Thr Ile Ser Arg Asp Lys Ser

85 90 95Gln Ser Ile Leu Tyr Leu Gln Met Asn Thr Leu Arg Ala Glu Asp Ser

100 105 110Ala Thr Tyr Tyr Cys Thr Arg Asp Arg Gly Leu Arg Phe Tyr Phe Asp

115 120 125Tyr Trp Gly Gln Gly Thr Thr Leu Thr Val Ser Ser Ala Ser Thr Lys

130 135 140Gly Pro Ser Val Phe Pro Leu Ala Pro Cys Ser Arg Ser Thr Ser Glu145 150 155 160Ser Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro

165 170 175Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr

180 185 190Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val

195 200 205Val Thr Val Pro Ser Ser Asn Phe Gly Thr Gln Thr Tyr Thr Cys Asn

210 215 220Val Asp His Lys Pro Ser Asn Thr Lys Val Asp Lys Thr Val Gly Gly225 230 235 240Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gln Lys Arg

245 250 255Asp Asn Val Leu Phe Gln Ala Ala Thr Asp Glu Gln Pro Ala Val Ile

260 265 270Lys Thr Leu Glu Lys Leu Val Asn Ile Glu Thr Gly Thr Gly Asp Ala

275 280 285Glu Gly Ile Ala Ala Ala Gly Asn Phe Leu Glu Ala Glu Leu Lys Asn

290 295 300Leu Gly Phe Thr Val Thr Arg Ser Lys Ser Ala Gly Leu Val Val Gly305 310 315 320Asp Asn Ile Val Gly Lys Ile Lys Gly Arg Gly Gly Lys Asn Leu Leu

325 330 335Leu Met Ser His Met Asp Thr Val Tyr Leu Lys Gly Ile Leu Ala Lys

340 345 350Ala Pro Phe Arg Val Glu Gly Asp Lys Ala Tyr Gly Pro Gly Ile Ala

355 360 365Asp Asp Lys Gly Gly Asn Ala Val Ile Leu His Thr Leu Lys Leu Leu

370 375 380Lys Glu Tyr Gly Val Arg Asp Tyr Gly Thr Ile Thr Val Leu Phe Asn385 390 395 400Thr Asp Glu Glu Lys Gly Ser Phe Gly Ser Arg Asp Leu Ile Gln Glu

405 410 415Glu Ala Lys Leu Ala Asp Tyr Val Leu Ser Phe Glu Pro Thr Ser Ala

420 425 430Gly Asp Glu Lys Leu Ser Leu Gly Thr Ser Gly Ile Ala Tyr Val Gln

435 440 445Val Gln Ile Thr Gly Lys Ala Ser His Ala Gly Ala Ala Pro Glu Leu

450 455 460Gly Val Asn Ala Leu Val Glu Ala Ser Asp Leu Val Leu Arg Thr Met465 470 475 480Asn Ile Asp Asp Lys Ala Lys Asn Leu Arg Phe Gln Trp Thr Ile Ala

485 490 495Lys Ala Gly Gln Val Ser Asn Ile Ile Pro Ala Ser Ala Thr Leu Asn

500 505 510Ala Asp Val Arg Tyr Ala Arg Asn Glu Asp Phe Asp Ala Ala Met Lys

515 520 525Thr Leu Glu Glu Arg Ala Gln Gln Lys Lys Leu Pro Glu Ala Asp Val

530 535 540Lys Val Ile Val Thr Arg Gly Arg Pro Ala Phe Asn Ala Gly Glu Gly545 550 555 560Gly Lys Lys Leu Val Asp Lys Ala Val Ala Tyr Tyr Lys Glu Ala Gly

565 570 575Gly Thr Leu Gly Val Glu Glu Arg Thr Gly Gly Gly Thr Asp Ala Ala

580 585 590Tyr Ala Ala Leu Ser Gly Lys Pro Val Ile Glu Ser Leu Gly Leu Pro

595 600 605Gly Phe Gly Tyr His Ser Asp Lys Ala Glu Tyr Val Asp Ile Ser Ala

610 615 620Ile Pro Arg Arg Leu Tyr Met Ala Ala Arg Leu Ile Met Asp Leu Gly625 630 635 640Ala Gly Lys(2)SEQ ID NO：17信息：(i)序列特征：

(A)长度：705个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性(ii)分子类型：其它核酸(xi)序列描述：SEQ ID NO：17：ATGGATTTTC AAGTGCAGAT TTTCAGCTTC CTGCTAATCA GTGCTTCAGT CATAATGTCC 60AGAGGACAAA CTGTTCTCTC CCAGTCTCCA GCAATCCTGT CTGCATCTCC AGGGGAGAAG 120GTCACAATGA CTTGCAGGGC CAGCTCAAGT GTAACTTACA TTCACTGGTA CCAGCAGAAG 180CCAGGTTCCT CCCCCAAATC CTGGATTTAT GCCACATCCA ACCTGGCTTC TGGAGTCCCT 240GCTCGCTTCA GTGGCAGTGG GTCTGGGACC TCTTACTCTC TCACAATCAG CAGAGTGGAG 300GCTGAAGATG CTGCCACTTA TTACTGCCAA CATTGGAGTA GTAAACCACC GACGTTCGGT 360GGAGGCACCA AGCTCGAGAT CAAACGGACT GTGGCTGCAC CATCTGTCTT CATCTTCCCG 420CCATCTGATG AGCAGTTGAA ATCTGGAACT GCCTCTGTTG TGTGCCTGCT GAATAACTTC 480TATCCCAGAG AGGCCAAAGT ACAGTGGAAG GTGGATAACG CCCTCCAATC GGGTAACTCC 540CAGGAGAGTG TCACAGAGCA GGACAGCAAG GACAGCACCT ACAGCCTCAG CAGCACCCTG 600ACGCTGAGCA AAGCAGACTA CGAGAAACAC AAAGTCTACG CCTGCGAAGT CACCCATCAG 660GGCCTGAGTT CGCCCGTCAC AAAGAGCTTC AACAGGGGAG AGTGT 705(2)SEQ ID NO：18信息：(i)序列特征：

(A)长度：235个氨基酸

(B)类型：氨基酸

(C)链型：单链

(D)拓扑学：线性(ii)分子类型：蛋白质(xi)序列描述：SEQ ID NO：18：Met Asp Phe Gln Val Gln Ile Phe Ser Phe Leu Leu Ile Ser Ala Ser1 5 10 15Val Ile Met Ser Arg Gly Gln Thr Val Leu Ser Gln Ser Pro Ala Ile

20 25 30Leu Ser Ala Ser Pro Gly Glu Lys Val Thr Met Thr Cys Arg Ala Ser

35 40 45Ser Ser Val Thr Tyr Ile His Trp Tyr Gln Gln Lys Pro Gly Ser Ser

50 55 60Pro Lys Ser Trp Ile Tyr Ala Thr Ser Asn Leu Ala Ser Gly Val Pro65 70 75 80Ala Arg Phe Ser Gly Ser Gly Ser Gly Thr Ser Tyr Ser Leu Thr Ile

85 90 95Ser Arg Val Glu Ala Glu Asp Ala Ala Thr Tyr Tyr Cys Gln His Trp

100 105 110Ser Ser Lys Pro Pro Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile Lys

115 120 125Arg Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu

130 135 140Gln Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe145 150 155 160Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln

165 170 175Ser Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser

180 185 190Thr Tyr Ser Leu Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu

195 200 205Lys His Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser

210 215 220Pro Val Thr Lys Ser Phe Asn Arg Gly Glu Cys225 230 235(2)SEQ ID NO：19信息：(i)序列特征：

(A)长度：39个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性(ii)分子类型：其它核酸(xi)序列描述：SEQ ID NO：9：AAGCTTGAAT TCGCCGCCAC TATGGATTTT CAAGTGCAG 39(2)SEQ ID NO：20信息：(i)序列特征：

(A)长度：44个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性(ii)分子类型：其它核酸(xi)序列描述：SEQ ID NO：20：TTAATTGGAT CCGAGCTCCT ATTAACACTC TCCCCTGTTG AAGC 44(2)SEQ ID NO：21信息：(i)序列特征：

(A)长度：50个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性(ii)分子类型：其它核酸(xi)序列描述：SEQ ID NO：21：AAGCTTCCGG ATCCCTGCAG CCATGGAGTT GTGGCTGAAC TGGATTTTCC 50(2)SEQ ID NO：22信息：(i)序列特征：

(A)长度：38个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性(ii)分子类型：其它核酸(xi)序列描述：SEQ ID NO：22：AAGCTTAGTC TAGATTATCA CTTGCCGGCG CCCAGATC 38(2)SEQ ID NO：23信息：(i)序列特征：

(A)长度：46个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性(ii)分子类型：其它核酸(xi)序列描述：SEQ ID NO：23：CGGGGGATCC AGATCTGAGC TCCTGTAGAC GTCGACATTA ATTCCG 46(2)SEQ ID NO：24信息：(i)序列特征：

(A)长度：30个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性(ii)分子类型：其它核酸(xi)序列描述：SEQ ID NO：24：GGAAAATCCA GTTCAGCCAC AACTCCATGG 30(2)SEQ ID NO：25信息：(i)序列特征：

(A)长度：1926个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性(ii)分子类型：其它核酸(xi)序列描述：SEQ ID NO：25：ATGAAGTTGT GGCTGAACTG GATTTTCCTT GTAACACTTT TAAATGGAAT TCAGTGTGAG 60GTGCAGCTGC AGCAGTCTGG GGCAGAGCTT GTGAGGTCAG GGGCCTCAGT CAAGTTGTCC 120TGCACAGCTT CTGGCTTCAA CATTAAAGAC AACTATATGC ACTGGGTGAA GCAGAGGCCT 180GAACAGGGCC TGGAGTGGAT TGCATGGATT GATCCTGAGA ATGGTGATAC TGAATATGCC 240CCGAAGTTCC GGGGCAAGGC CACTTTGACT GCAGACTCAT CCTCCAACAC AGCCTACCTG 300CACCTCAGCA GCCTGACATC TGAGGACACT GCCGTCTATT ACTGTCATGT CCTGATCTAT 360GCTGGTTATT TGGCTATGGA CTACTGGGGT CAAGGAACCT CAGTCGCCGT GAGCTCGGCT 420AGCACCAAGG GACCATCGGT CTTCCCCCTG GCCCCCTGCT CCAGGAGCAC CTCCGAGAGC 480ACAGCCGCCC TGGGCTGCCT GGTCAAGGAC TACTTCCCCG AACCGGTGAC GGTGTCGTGG 540AACTCAGGCG CTCTGACCAG CGGCGTGCAC ACCTTCCCGG CTGTCCTACA GTCCTCAGGA 600CTCTACTCCC TCAGCAGCGT CGTGACGGTG CCCTCCAGCA ACTTCGGCAC CCAGACCTAC 660ACCTGCAACG TAGATCACAA GCCCAGCAAC ACCAAGGTGG ACAAGACAGT TGGCGGTGGT 720GGCTCTGGTG GTGGCGGTAG CGGTGGCGGG GGTTCCCAGA AGCGCGACAA CGTGCTGTTC 760CAGGCAGCTA CCGACGAGCA GCCGGCCGTG ATCAAGACGC TGGAGAAGCT GGTCAACATC 840GAGACCGGCA CCGGTGACGC CGAGGGCATC GCCGCTGCGG GCAACTTCCT CGAGGCCGAG 900CTCAAGAACC TCGGCTTCAC GGTCACGCGA AGCAAGTCGG CCGGCCTGGT GGTGGGCGAC 960AACATCGTGG GCAAGATCAA GGGCCGCGGC GGCAAGAACC TGCTGCTGAT GTCGCACATG 1020GACACCGTCT ACCTCAAGGG CATTCTCGCG AAGGCCCCGT TCCGCGTCGA AGGCGACAAG 1080GCCTACGGCC CGGGCATCGC CGACGACAAG GGCGGCAACG CGGTCATCCT GCACACGCTC 1140AAGCTGCTGA AGGAATACGG CGTGCGCGAC TACGGCACCA TCACCGTGCT GTTCAACACC 1200GACGAGGAAA AGGGTTCCTT CGGCTCGCGC GACCTGATCC AGGAAGAAGC CAAGCTGGCC 1260GACTACGTGC TCTCCTTCGA GCCCACCAGC GCAGGCGACG AAAAACTCTC GCTGGGCACC 1320TCGGGCATCG CCTACGTGCA GGTCCAGATC ACCGGCAAGG CCTCGCATGC CGGCGCCGCG 1380CCCGAGCTGG GCGTGAACGC GCTGGTCGAG GCTTCCGACC TCGTGCTGCG CACGATGAAC 1440ATCGACGACA AGGCGAAGAA CCTGCGCTTC CAGTGGACCA TCGCCAAGGC CGGCCAGGTC 1500TCGAACATCA TCCCCGCCAG CGCCACGCTG AACGCCGACG TGCGCTACGC GCGCAACGAG 1560GACTTCGACG CCGCCATGAA GACGCTGGAA GAGCGCGCGC AGCAGAAGAA GCTGCCCGAG 1620GCCGACGTGA AGGTGATCGT CACGCGCGGC CGCCCGGCCT TCAATGCCGG CGAAGGCGGC 1680AAGAAGCTGG TCGACAAGGC GGTCGCCTAC TACAAGGAAG CCGGCGGCAC GCTGGGCGTG 1740GAAGAGCGCA CCGGCGGCGG CACCGACGCG GCCTACGCCG CGCTCTCAGG CAAGCCAGTG 1800ATCGAGAGCC TGGGCCTGCC GGGCTTCGGC TACCACAGCG ACAAGGCCGA GTACGTGGAC 1860ATCAGCGCGA TTCCGCGCCG CCTGTACATG GCTGCGCGCC TGATCATGGA TCTGGGCGCC 1920GGCAAG 1926(2)SEQ ID NO：26信息：(i)序列特征：

(A)长度：642个氨基酸

(B)类型：氨基酸

(C)链型：单链

(D)拓扑学：线性(ii)分子类型：蛋白质(xi)序列描述：SEQ ID NO：26：Met Lys Leu Trp Leu Asn Trp Ile Phe Leu Val Thr Leu Leu Asn Gly1 5 10 15Ile Gln Cys Glu Val Gln Leu Gln Gln Ser Gly Ala Glu Leu Val Arg

20 25 30Ser Gly Ala Ser Val Lys Leu Ser Cys Thr Ala Ser Gly Phe Asn Ile

35 40 45Lys Asp Asn Tyr Met His Trp Val Lys Gln Arg Pro Glu Gln Gly Leu

50 55 60Glu Trp Ile Ala Trp Ile Asp Pro Glu Asn Gly Asp Thr Glu Tyr Ala65 70 75 80Pro Lys Phe Arg Gly Lys Ala Thr Leu Thr Ala Asp Ser Ser Ser Asn

85 90 95Thr Ala Tyr Leu His Leu Ser Ser Leu Thr Ser Glu Asp Thr Ala Val

100 105 110Tyr Tyr Cys His Val Leu Ile Tyr Ala Gly Tyr Leu Ala Met Asp Tyr

115 120 125Trp Gly Gln Gly Thr Ser Val Ala Val Ser Ser Ala Ser Thr Lys Gly

130 135 140Pro Ser Val Phe Pro Leu Ala Pro Cys Ser Arg Ser Thr Ser Glu Ser145 150 155 160Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro Val

165 170 175Thr Val Ser Trp Asn Sar Gly Ala Leu Thr Ser Gly Val His Thr Phe

180 185 190Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val

195 200 205Thr Val Pro Ser Ser Asn Phe Gly Thr Gln Thr Tyr Thr Cys Asn Val

210 215 220Asp His Lys Pro Ser Asn Thr Lys Val Asp Lys Thr Val Gly Gly Gly225 230 235 240Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gln Lys Arg Asp

245 250 255Asn Val Leu Phe Gln Ala Ala Thr Asp Glu Gln Pro Ala Val Ile Lys

260 265 270Thr Leu Glu Lys Leu Val Asn Ile Glu Thr Gly Thr Gly Asp Ala Glu

275 280 285Gly Ile Ala Ala Ala Gly Asn Phe Leu Glu Ala Glu Leu Lys Asn Leu

290 295 300Gly Phe Thr Val Thr Arg Ser Lys Ser Ala Gly Leu Val Val Gly Asp305 310 315 320Asn Ile Val Gly Lys Ile Lys Gly Arg Gly Gly Lys Asn Leu Leu Leu

325 330 335Met Ser His Met Asp Thr Val Tyr Leu Lys Gly Ile Leu Ala Lys Ala

340 345 350Pro Phe Arg Val Glu Gly Asp Lys Ala Tyr Gly Pro Gly Ile Ala Asp

355 360 365Asp Lys Gly Gly Asn Ala Val Ile Leu His Thr Leu Lys Leu Leu Lys

370 375 380Glu Tyr Gly Val Arg Asp Tyr Gly Thr Ile Thr Val Leu Phe Asn Thr385 390 395 400Asp Glu Glu Lys Gly Ser Phe Gly Ser Arg Asp Leu Ile Gln Glu Glu

405 410 415Ala Lys Leu Ala Asp Tyr Val Leu Ser Phe Glu Pro Thr Ser Ala Gly

420 425 430Asp Glu Lys Leu Ser Leu Gly Thr Ser Gly Ile Ala Tyr Val Gln Val

435 440 445Gln Ile Thr Gly Lys Ala Ser His Ala Gly Ala Ala Pro Glu Leu Gly

450 455 460Val Asn Ala Leu Val Glu Ala Ser Asp Leu Val Leu Arg Thr Met Asn465 470 475 480Ile Asp Asp Lys Ala Lys Asn Leu Arg Phe Gln Trp Thr Ile Ala Lys

485 490 495Ala Gly Gln Val Ser Asn Ile Ile Pro Ala Ser Ala Thr Leu Asn Ala

500 505 510Asp Val Arg Tyr Ala Arg Asn Glu Asp Phe Asp Ala Ala Met Lys Thr

515 520 525Leu Glu Glu Arg Ala Gln Gln Lys Lys Leu Pro Glu Ala Asp Val Lys

530 535 540Val Ile Val Thr Arg Gly Arg Pro Ala Phe Asn Ala Gly Glu Gly Gly545 550 555 560Lys Lys Leu Val Asp Lys Ala Val Ala Tyr Tyr Lys Glu Ala Gly Gly

565 570 575Thr Leu Gly Val Glu Glu Arg Thr Gly Gly Gly Thr Asp Ala Ala Tyr

580 585 590Ala Ala Leu Ser Gly Lys Pro Val Ile Glu Ser Leu Gly Leu Pro Gly

595 600 605Phe Gly Tyr His Ser Asp Lys Ala Glu Tyr Val Asp Ile Ser Ala Ile

610 615 620Pro Arg Arg Leu Tyr Met Ala Ala Arg Leu Ile Met Asp Leu Gly Ala625 630 635 640Gly Lys(2)SEQ ID NO：27信息：(i)序列特征：

(A)长度：39个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性(ii)分子类型：其它核酸(xi)序列描述：SEQ ID NO：27：AAGCTTGGAA TTCAGTGTCA GGTCCAACTG CAGCAGCCT 39(2)SEQ ID NO：28信息：(i)序列特征：

(A)长度：54个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性(ii)分子类型：其它核酸(xi)序列描述：SEQ ID NO：28：GCTACCGCCA CCTCCGGAGC CACCACCGCC CCGTTTGATC TCGAGCTTGG TGCC 54(2)SEQ ID NO：29信息：(i)序列特征：

(A)长度：58个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性(ii)分子类型：其它核酸(xi)序列描述：SEQ ID NO：29：TCCGGAGGTG GCGGTAGCGG TGGCGGGGGT TCCCAGAAGC GCGACAACGT GCTGTTCC 58(2)SEQ ID NO：30信息：(i)序列特征：

(A)长度：24个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性(ii)分子类型：其它核酸(xi)序列描述：SEQ ID NO：30：CCTCGAGGAA TTCTTTCACT TGCC 24(2)SEQ ID NO：31信息：(i)序列特征：

(A)长度：2019个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性(ii)分子类型：其它核酸(xi)序列描述：SEQ ID NO：31：ATGAAGTTGT GGCTGAACTG GATTTTCCTT GTAACACTTT TAAATGGAAT TCAGTGTCAG 60GTCCAACTGC AGCAGCCTGG GGCTGAACTG GTGAAGCCTG GGGCTTCAGT GCAGCTGTCC 120TGCAAGGCTT CTGGCTACAC CTTCACCGGC TACTGGATAC ACTGGGTGAA GCAGAGGCCT 180GGACAAGGCC TTGAGTGGAT TGGAGAGGTT AATCCTAGTA CCGGTCGTTC TGACTACAAT 240GAGAAGTTCA AGAACAAGGC CACACTGACT GTAGACAAAT CCTCCACCAC AGCCTACATG 300CAACTCAGCA GCCTGACATC TGAGGACTCT GCGGTCTATT ACTGTGCAAG AGAGAGGGCC 360TATGGTTACG ACGATGCTAT GGACTACTGG GGCCAAGGGA CCACGGTCAC CGTCTCCTCA 420GGTGGCGGTG GCTCGGGCGG TGGTGGGTCG GGTGGCGGCG GATCTGACAT TGAGCTCTCA 480CAGTCTCCAT CCTCCCTGGC TGTGTCAGCA GGAGAGAAGG TCACCATGAG CTGCAAATCC 540AGTCAGAGTC TCCTCAACAG TAGAACCCGA AAGAACTACT TGGCTTGGTA CCAGCAGAGA 600CCAGGGCAGT CTCCTAAACT GCTGATCTAT TGGGCATCCA CTAGGACATC TGGGGTCCCT 660GATCGCTTCA CAGGCAGTGG ATCTGGGACA GATTTCACTC TCACCATCAG CAGTGTGCAG 720GCTGAAGACC TGGCAATTTA TTACTGCAAG CAATCTTATA CTCTTCGGAC GTTCGGTGGA 780GGCACCAAGC TCGAGATCAA ACGGGGCGGT GGTGGCTCCG GAGGTGGCGG TAGCGGTGGC 840GGGGGTTCCC AGAAGCGCGA CAACGTGCTG TTCCAGGCAG CTACCGACGA GCAGCCGGCC 900GTGATCAAGA CGCTGGAGAA GCTGGTCAAC ATCGAGACCG GCACCGGTGA CGCCGAGGGC 960ATCGCCGCTG CGGGCAACTT CCTCGAGGCC GAGCTCAAGA ACCTCGGCTT CACGGTCACG 1020CGAAGCAAGT CGGCCGGCCT GGTGGTGGGC GACAACATCG TGGGCAAGAT CAAGGGCCGC 1080GGCGGCAAGA ACCTGCTGCT GATGTCGCAC ATGGACACCG TCTACCTCAA GGGCATTCTC 1140GCGAAGGCCC CGTTCCGCGT CGAAGGCGAC AAGGCCTACG GCCCGGGCAT CGCCGACGAC 1200AAGGGCGGCA ACGCGGTCAT CCTGCACACG CTCAAGCTGC TGAAGGAATA CGGCGTGCGC 1260GACTACGGCA CCATCACCGT GCTGTTCAAC ACCGACGAGG AAAAGGGTTC CTTCGGCTCG 1320CGCGACCTGA TCCAGGAAGA AGCCAAGCTG GCCGACTACG TGCTCTCCTT CGAGCCCACC 1380AGCGCAGGCG ACGAAAAACT CTCGCTGGGC ACCTCGGGCA TCGCCTACGT GCAGGTCCAG 1440ATCACCGGCA AGGCCTCGCA TGCCGGCGCC GCGCCCGAGC TGGGCGTGAA CGCGCTGGTC 1500GAGGCTTCCG ACCTCGTGCT GCGCACGATG AACATCGACG ACAAGGCGAA GAACCTGCGC 1560TTCCAGTGGA CCATCGCCAA GGCCGGCCAG GTCTCGAACA TCATCCCCGC CAGCGCCACG 1620CTGAACGCCG ACGTGCGCTA CGCGCGCAAC GAGGACTTCG ACGCCGCCAT GAAGACGCTG 1680GAAGAGCGCG CGCAGCAGAA GAAGCTGCCC GAGGCCGACG TGAAGGTGAT CGTCACGCGC 1740GGCCGCCCGG CCTTCAATGC CGGCGAAGGC GGCAAGAAGC TGGTCGACAA GGCGGTGGCC 1800TACTACAAGG AAGCCGGCGG CACGCTGGGC GTGGAAGAGC GCACCGGCGG CGGCACCGAC 1860GCGGCCTACG CCGCGCTCTC AGGCAAGCCA GTGATCGAGA GCCTGGGCCT GCCGGGCTTC 1920GGCTACCACA GCGACAAGGC CGAGTACGTG GACATCAGCG CGATTCCGCG CCGCCTGTAC 1980ATGGCTGCGC GCCTGATCAT GGATCTGGGC GCCGGCAAG 2019(2)SEQ ID NO：32信息：(i)序列特征：

(A)长度：673个氨基酸

(B)类型：氨基酸

(C)链型：单链

(D)拓扑学：线性(ii)分子类型：蛋白质(xi)序列描述：SEQ ID NO：32：Met Lys Leu Trp Leu Asn Trp Ile Phe Leu Val Thr Leu Leu Asn Gly1 5 10 15Ile Gln Cys Gln Val Gln Leu Gln Gln Pro Gly Ala Glu Leu Val Lys

20 25 30Pro Gly Ala Ser Val Gln Leu Ser Cys Lys Ala Ser Gly Tyr Thr Phe

35 40 45Thr Gly Tyr Trp Ile His Trp Val Lys Gln Arg Pro Gly Gln Gly Leu

50 55 60Glu Trp Ile Gly Glu Val Asn Pro Ser Thr Gly Arg Ser Asp Tyr Asn65 70 75 80Glu Lys Phe Lys Asn Lys Ala Thr Leu Thr Val Asp Lys Ser Ser Thr

85 90 95Thr Ala Tyr Met Gln Leu Ser Ser Leu Thr Ser Glu Asp Ser Ala Val

100 105 110Tyr Tyr Cys Ala Arg Glu Arg Ala Tyr Gly Tyr Asp Asp Ala Met Asp

115 120 125Tyr Trp Gly Gln Gly Thr Thr Val Thr Val Ser Ser Gly Gly Gly Gly

130 135 140Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Asp Ile Glu Leu Ser145 150 155 160Gln Ser Pro Ser Ser Leu Ala Val Ser Ala Gly Glu Lys Val Thr Met

165 170 175Ser Cys Lys Ser Ser Gln Ser Leu Leu Asn Ser Arg Thr Arg Lys Asn

180 185 190Tyr Leu Ala Trp Tyr Gln Gln Arg Pro Gly Gln Ser Pro Lys Leu Leu

195 200 205Ile Tyr Trp Ala Ser Thr Arg Thr Ser Gly Val Pro Asp Arg Phe Thr

210 215 220Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Val Gln225 230 235 240Ala Glu Asp Leu Ala Ile Tyr Tyr Cys Lys Gln Ser Tyr Thr Leu Arg

245 250 255Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile Lys Arg Gly Gly Gly Gly

260 265 270Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gln Lys Arg Asp Asn

275 280 285Val Leu Phe Gln Ala Ala Thr Asp Glu Gln Pro Ala Val Ile Lys Thr

290 295 300Leu Glu Lys Leu Val Asn Ile Glu Thr Gly Thr Gly Asp Ala Glu Gly305 310 315 320Ile Ala Ala Ala Gly Asn Phe Leu Glu Ala Glu Leu Lys Asn Leu Gly

325 330 335Phe Thr Val Thr Arg Ser Lys Ser Ala Gly Leu Val Val Gly Asp Asn

340 345 350Ile Val Gly Lys Ile Lys Gly Arg Gly Gly Lys Asn Leu Leu Leu Met

355 360 365Ser His Met Asp Thr Val Tyr Leu Lys Gly Ile Leu Ala Lys Ala Pro

370 375 380Phe Arg Val Glu Gly Asp Lys Ala Tyr Gly Pro Gly Ile Ala Asp Asp385 390 395 400Lys Gly Gly Asn Ala Val Ile Leu His Thr Leu Lys Leu Leu Lys Glu

405 410 415Tyr Gly Val Arg Asp Tyr Gly Thr Ile Thr Val Leu Phe Asn Thr Asp

420 425 430Glu Glu Lys Gly Ser Phe Gly Ser Arg Asp Leu Ile Gln Glu Glu Ala

435 440 445Lys Leu Ala Asp Tyr Val Leu Ser Phe Glu Pro Thr Ser Ala Gly Asp

450 455 460Glu Lys Leu Ser Leu Gly Thr Ser Gly Ile Ala Tyr Val Gln Val Gln465 470 475 480Ile Thr Gly Lys Ala Ser His Ala Gly Ala Ala Pro Glu Leu Gly Val

485 490 495Asn Ala Leu Val Glu Ala Ser Asp Leu Val Leu Arg Thr Met Asn Ile

500 505 510Asp Asp Lys Ala Lys Asn Leu Arg Phe Gln Trp Thr Ile Ala Lys Ala

515 520 525Gly Gln Val Ser Asn Ile Ile Pro Ala Ser Ala Thr Leu Asn Ala Asp

530 535 540Val Arg Tyr Ala Arg Asn Glu Asp Phe Asp Ala Ala Met Lys Thr Leu545 550 555 560Glu Glu Arg Ala Gln Gln Lys Lys Leu Pro Glu Ala Asp Val Lys Val

565 570 575Ile Val Thr Arg Gly Arg Pro Ala Phe Asn Ala Gly Glu Gly Gly Lys

580 585 590Lys Leu Val Asp Lys Ala Val Ala Tyr Tyr Lys Glu Ala Gly Gly Thr

595 600 605Leu Gly Val Glu Glu Arg Thr Gly Gly Gly Thr Asp Ala Ala Tyr Ala

610 615 620Ala Leu Ser Gly Lys Pro Val Ile Glu Ser Leu Gly Leu Pro Gly Phe625 630 635 640Gly Tyr His Ser Asp Lys Ala Glu Tyr Val Asp Ile Ser Ala Ile Pro

645 650 655Arg Arg Leu Tyr Met Ala Ala Arg Leu Ile Met Asp Leu Gly Ala Gly

660 665 670Lys(2)SEQ ID NO：33信息：(i)序列特征：

(A)长度：37个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性(ii)分子类型：其它核酸(xi)序列描述：SEQ ID NO：33：GGGCGCCGGC AAGTGATAAA ATTCCTCGAG GAGCTCC 37(2)SEQ ID NO：34信息：(i)序列特征：

(A)长度：19个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性(ii)分子类型：其它核酸(xi)序列描述：SEQ ID NO：34：CGCCACCTCT GACTTGAGC 19(2)SEQ ID NO：35信息：(i)序列特征：

(A)长度：37个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性(ii)分子类型：其它核酸(xi)序列描述：SEQ ID NO：35：GGAGCTCCTC GAGGAATTTT ATCACTTGCC GGCGCCC 37(2)SEQ ID NO：36信息：(i)序列特征：

(A)长度：19个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性(ii)分子类型：其它核酸(xi)序列描述：SEQ ID NO：36：GCTGAACGCC GACGTGCGC 19(2)SEQ ID NO：37信息：(i)序列特征：

(A)长度：2025个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性(ii)分子类型：其它核酸(xi)序列描述：SEQ ID NO：37：ATGAAGTTGT GGCTGAACTG GATTTTCCTT GTAACACTTT TAAATGGAAT TCAGTGTCAG 60GTCCAACTGC AGCAGCCTGG GGCTGAACTG GTGAAGCCTG GGGCTTCAGT GCAGCTGTCC 120TGCAAGGCTT CTGGCTACAC CTTCACCGGC TACTGGATAC ACTGGGTGAA GCAGAGGCCT 180GGACAAGGCC TTGAGTGGAT TGGAGAGGTT AATCCTAGTA CCGGTCGTTC TGACTACAAT 240GAGAAGTTCA AGAACAAGGC CACACTGACT GTAGACAAAT CCTCCACCAC AGCCTACATG 300CAACTCAGCA GCCTGACATC TGAGGACTCT GCGGTCTATT ACTGTGCAAG AGAGAGGGCC 360TATGGTTACG ACGATGCTAT GGACTACTGG GGCCAAGGGA CCACGGTCAC CGTCTCCTCA 420GGTGGCGGTG GCTCGGGCGG TGGTGGGTCG GGTGGCGGCG GATCTGACAT TGAGCTCTCA 480CAGTCTCCAT CCTCCCTGGC TGTGTCAGCA GGAGAGAAGG TCACCATGAG CTGCAAATCC 540AGTCAGAGTC TCCTCAACAG TAGAACCCGA AAGAACTACT TGGCTTGGTA CCAGCAGAGA 600CCAGGGCAGT CTCCTAAACT GCTGATCTAT TGGGCATCCA CTAGGACATC TGGGGTCCCT 660GATCGCTTCA CAGGCAGTGG ATCTGGGACA GATTTCACTC TCACCATCAG CAGTGTGCAG 720GCTGAAGACC TGGCAATTTA TTACTGCAAG CAATCTTATA CTCTTCGGAC GTTCGGTGGA 780GGCACCAAGC TCGAGATCAA ACGGGGCGGT GGTGGCTCCG GAGGTGGCGG TAGCGGTGGC 840GGGGGTTCCC AGAAGCGCGA CAACGTGCTG TTCCAGGCAG CTACCGACGA GCAGCCGGCC 900GTGATCAAGA CGCTGGAGAA GCTGGTCAAC ATCGAGACCG GCACCGGTGA CGCCGAGGGC 960ATCGCCGCTG CGGGCAACTT CCTCGAGGCC GAGCTCAAGA ACCTCGGCTT CACGGTCACG 1020CGAAGCAAGT CGGCCGGCCT GGTGGTGGGC GACAACATCG TGGGCAAGAT CAAGGGCCGC 1080GGCGGCAAGA ACCTGCTGCT GATGTCGCAC ATGGACACCG TCTACCTCAA GGGCATTCTC 1140GCGAAGGCCC CGTTCCGCGT CGAAGGCGAC AAGGCCTACG GCCCGGGCAT CGCCGACGAC 1200AAGGGCGGCA ACGCGGTCAT CCTGCACACG CTCAAGCTGC TGAAGGAATA CGGCGTGCGC 1260GACTACGGCA CCATCACCGT GCTGTTCAAC ACCGACGAGG AAAAGGGTTC CTTCGGCTCG 1320CGCGACCTGA TCCAGGAAGA AGCCAAGCTG GCCGACTACG TGCTCTCCTT CGAGCCCACC 1380AGCGCAGGCG ACGAAAAACT CTCGCTGGGC ACCTCGGGCA TCGCCTACGT GCAGGTCCAG 1440ATCACCGGCA AGGCCTCGCA TGCCGGCGCC GCGCCCGAGC TGGGCGTGAA CGCGCTGGTC 1500GAGGCTTCCG ACCTCGTGCT GCGCACGATG AACATCGACG ACAAGGCGAA GAACCTGCGC 1560TTCCAGTGGA CCATCGCCAA GGCCGGCCAG GTCTCGAACA TCATCCCCGC CAGCGCCACG 1620CTGAACGCCG ACGTGCGCTA CGCGCGCAAC GAGGACTTCG ACGCCGCCAT GAAGACGCTG 1680GAAGAGCGCG CGCAGCAGAA GAAGCTGCCC GAGGCCGACG TGAAGGTGAT CGTCACGCGC 1740GGCCGCCCGG CCTTCAATGC CGGCGAAGGC GGCAAGAAGC TGGTCGACAA GGCGGTGGCC 1800TACTACAAGG AAGCCGGCGG CACGCTGGGC GTGGAAGAGC GCACCGGCGG CGGCACCGAC 1860GCGGCCTACG CCGCGCTCTC AGGCAAGCCA GTGATCGAGA GCCTGGGCCT GCCGGGCTTC 1920GGCTACCACA GCGACAAGGC CGAGTACGTG GACATCAGCG CGATTCCGCG CCGCCTGTAC 1980ATGGCTGCGC GCCTGATCAT GGATCTGGGC GCCGGCAAGT GATAA 2025(2)SEQ ID NO：38信息：(i)序列特征：

(A)长度：288个氨基酸

(B)类型：氨基酸

(C)链型：单链

(D)拓扑学：线性(ii)分子类型：蛋白质(xi)序列描述：SEQ ID NO：38：Met Lys Tyr Leu Leu Pro Thr Ala Ala Ala Gly Leu Leu Leu Leu Ala1 5 10 15Ala Gln Pro Ala Met Ala Gln Val Gln Leu Gln Gln Pro Gly Ala Glu

20 25 30Leu Val Lys Pro Gly Ala Ser Val Gln Leu Ser Cys Lys Ala Ser Gly

35 40 45Tyr Thr Phe Thr Gly Tyr Trp Ile His Trp Val Lys Gln Arg Pro Gly

50 55 60Gln Gly Leu Glu Trp Ile Gly Glu Val Asn Pro Ser Thr Gly Arg Ser65 70 75 80Asp Tyr Asn Glu Lys Phe Lys Asn Lys Ala Thr Leu Thr Val Asp Lys

85 90 95Ser Ser Thr Thr Ala Tyr Met Gln Leu Ser Ser Leu Thr Ser Glu Asp

100 105 110Ser Ala Val Tyr Tyr Cys Ala Arg Glu Arg Ala Tyr Gly Tyr Asp Asp

115 120 125Ala Met Asp Tyr Trp Gly Gln Gly Thr Thr Val Thr Val Ser Ser Gly

130 135 140Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Asp Ile145 150 155 160Glu Leu Ser Gln Ser Pro Ser Ser Leu Ala Val Ser Ala Gly Glu Lys

165 170 175Val Thr Met Ser Cys Lys Ser Ser Gln Ser Leu Leu Asn Ser Arg Thr

180 185 190Arg Lys Asn Tyr Leu Ala Trp Tyr Gln Gln Arg Pro Gly Gln Ser Pro

195 200 205Lys Leu Leu Ile Tyr Trp Ala Ser Thr Arg Thr Ser Gly Val Pro Asp

210 215 220Arg Phe Thr Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser225 230 235 240Ser Val Gln Ala Glu Asp Leu Ala Ile Tyr Tyr Cys Lys Gln Ser Tyr

245 250 255Thr Leu Arg Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile Lys Arg Glu

260 265 270Gln Lys Leu Ile Ser Glu Glu Asp Leu Asn His His His His His His

275 280 285(2)SEQ ID NO：39信息：(i)序列特征：

(A)长度：36个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性(ii)分子类型：其它核酸(xi)序列描述：SEQ ID NO：39：GCCCAACCAG CCATGGCCGA GGTGCAGCTG CAGCAG 36(2)SEQ ID NO：40信息：(i)序列特征：

(A)长度：54个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性(ii)分子类型：其它核酸(xi)序列描述：SEQ ID NO：40：CGACCCACCA CCGCCCGAGC CACCGCCACC CGAGCTCACG GCGACTGAGG TTCC 54(2)SEQ ID NO：41信息：(i)序列特征：

(A)长度：54个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性(ii)分子类型：其它核酸(xi)序列描述：SEQ ID NO：41：TCGGGCGGTG GTGGGTCGGG TGGCGGCGGA TCTCAGATTG TGCTCACCCA GTCT 54(2)SEQ ID NO：42信息：(i)序列特征：

(A)长度：24个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性(ii)分子类型：其它核酸(xi)序列描述：SEQ ID NO：42：CCGTTTGATC TCGAGCTTGG TCCC 24(2)SEQ ID NO：43信息：(i)序列特征：

(A)长度：843个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性(ii)分子类型：其它核酸(xi)序列描述：SEQ ID NO：43：ATGAAATACC TATTGCCTAC GGCAGCCGCT GGATTGTTAT TACTCGCTGC CCAACCAGCC 60ATGGCCGAGG TGCAGCTGCA GCAGTCTGGG GCAGAGCTTG TGAGGTCAGG GGCCTCAGTC 120AAGTTGTCCT GCACAGCTTC TGGCTTCAAC ATTAAAGACA ACTATATGCA CTGGGTGAAG 180CAGAGGCCTG AACAGGGCCT GGAGTGGATT GCATGGATTG ATCCTGAGAA TGGTGATACT 240GAATATGCCC CGAAGTTCCG GGGCAAGGCC ACTTTGACTG CAGACTCATC CTCCAACACA 300GCCTACCTGC ACCTCAGCAG CCTGACATCT GAGGACACTG CCGTCTATTA CTGTCATGTC 360CTGATCTATG CTGGTTATTT GGCTATGGAC TACTGGGGTC AAGGAACCTC AGTCGCCGTG 420AGCTCGGGTG GCGGTGGCTC GGGCGGTGGT GGGTCGGGTG GCGGCGGATC TCAGATTGTG 480CTCACCCAGT CTCCAGCAAT CATGTCTGCA TCTCCAGGGG AGAAGGTCAC CATAACCTGC 540AGTGCCAGCT CAAGTGTAAC TTACATGCAC TGGTTCCAGC AGAAGCCAGG CACTTCTCCC 600AAACTCTGGA TTTATAGCAC ATCCAACCTG GCTTCTGGAG TCCCTGCTCG CTTCAGTGGC 660AGTGGATCTG GGACCTCTTA CTCTCTCACA ATCAGCCGAA TGGAGGCTGA AGATGCTGCC 720ACTTATTACT GCCAGCAAAG GAGTACTTAC CCGCTCACGT TCGGTGGTGG GACCAAGCTC 780GAGATCAAAC GGGAACAAAA ACTCATCTCA GAAGAAGATC TGAATCACCA CCATCACCAC 840CAT 843(2)SEQ ID NO：44信息：(i)序列特征：

(A)长度：28个氨基酸

(B)类型：氨基酸

(C)链型：单链

(D)拓扑学：线性(ii)分子类型：蛋白质(xi)序列描述：SEQ ID NO：44：Met Lys Tyr Leu Leu Pro Thr Ala Ala Ala Gly Leu Leu Leu Leu Ala1 5 10 15Ala Gln Pro Ala Met Ala Glu Val Gln Leu Gln Gln Ser Gly Ala Glu

20 25 30Leu Val Arg Ser Gly Ala Ser Val Lys Leu Ser Cys Thr Ala Ser Gly

35 40 45Phe Asn Ile Lys Asp Asn Tyr Met His Trp Val Lys Gln Arg Pro Glu

50 55 60Gln Gly Leu Glu Trp Ile Ala Trp Ile Asp Pro Glu Asn Gly Asp Thr65 70 75 80Glu Tyr Ala Pro Lys Phe Arg Gly Lys Ala Thr Leu Thr Ala Asp Ser

85 90 95Ser Ser Asn Thr Ala Tyr Leu His Leu Ser Ser Leu Thr Ser Glu Asp

100 105 110Thr Ala Val Tyr Tyr Cys His Val Leu Ile Tyr Ala Gly Tyr Leu Ala

115 120 125Met Asp Tyr Trp Gly Gln Gly Thr Ser Val Ala Val Ser Ser Gly Gly

130 135 140Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gln Ile Val145 150 155 160Leu Thr Gln Ser Pro Ala Ile Met Ser Ala Ser Pro Gly Glu Lys Val

165 170 175Thr Ile Thr Cys Ser Ala Ser Ser Ser Val Thr Tyr Met His Trp Phe

180 185 190Gln Gln Lys Pro Gly Thr Ser Pro Lys Leu Trp Ile Tyr Ser Thr Ser

195 200 205Asn Leu Ala Ser Gly Val Pro Ala Arg Phe Ser Gly Ser Gly Ser Gly

210 215 220Thr Ser Tyr Ser Leu Thr Ile Ser Arg Met Glu Ala Glu Asp Ala Ala225 230 235 240Thr Tyr Tyr Cys Gln Gln Arg Ser Thr Tyr Pro Leu Thr Phe Gly Ala

245 250 255Gly Thr Lys Leu Glu Ile Lys Arg Glu Gln Lys Leu Ile Ser Glu Glu

260 265 270Asp Leu Asn His His His His His His

275 280(2)SEQ ID NO：45信息：(i)序列特征：

(A)长度：72个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性(ii)分子类型：其它核酸(xi)序列描述：SEQ ID NO：45：TCGAGATCAA ACGGGAACAA AAACTCATCT CAGAAGAAGA TCTGAATCAC CACCATCACC 60ACCATTAATG AG 72(2)SEQ ID NO：46信息：(i)序列特征：

(A)长度：72个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性(ii)分子类型：其它核酸(xi)序列描述：SEQ ID NO：46：AATTCTCATT AATGGTGGTG ATGGTGGTGA TTCAGATCTT CTTCTGAGAT GAGTTTTTGT 60TCCCGTTTGA TC 72(2)SEQ ID NO：47信息：(i)序列特征：

(A)长度：864个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性(ii)分子类型：其它核酸(xi)序列描述：SEQ ID NO：47：ATGAAATACC TATTGCCTAC GGCAGCCGCT GGATTGTTAT TACTCGCTGC CCAACCAGCC 60ATGGCCCAGG TCCAACTGCA GCAGCCTGGG GCTGAACTGG TGAAGCCTGG GGCTTCAGTG 120CAGCTGTCCT GCAAGGCTTC TGGCTACACC TTCACCGGCT ACTGGATACA CTGGGTGAAG 180CAGAGGCCTG GACAAGGCCT TGAGTGGATT GGAGAGGTTA ATCCTAGTAC CGGTCGTTCT 240GACTACAATG AGAAGTTCAA GAACAAGGCC ACACTGACTG TAGACAAATC CTCCACCACA 300GCCTACATGC AACTCAGCAG CCTGACATCT GAGGACTCTG CGGTCTATTA CTGTGCAAGA 360GAGAGGGCCT ATGGTTACGA CGATGCTATG GACTACTGGG GCCAAGGGAC CACGGTCACC 420GTCTCCTCAG GTGGCGGTGG CTCGGGCGGT GGTGGGTCGG GTGGCGGCGG ATCTGACATT 480GAGCTCTCAC AGTCTCCATC CTCCCTGGCT GTGTCAGCAG GAGAGAAGGT CACCATGAGC 540TGCAAATCCA GTCAGAGTCT CCTCAACAGT AGAACCCGAA AGAACTACTT GGCTTGGTAC 600CAGCAGAGAC CAGGGCAGTC TCCTAAACTG CTGATCTATT GGGCATCCAC TAGGACATCT 660GGGGTCCCTG ATCGCTTCAC AGGCAGTGGA TCTGGGACAG ATTTCACTCT CACCATCAGC 720AGTGTGCAGG CTGAAGACCT GGCAATTTAT TACTGCAAGC AATCTTATAC TCTTCGGACG 780TTCGGTGGAG GCACCAAGCT CGAGATCAAA CGGGAACAAA AACTCATCTC AGAAGAAGAT 840CTGAATCACC ACCATCACCA CCAT 864(2)SEQ ID NO：48信息：(i)序列特征：

(A)长度：34个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性(ii)分子类型：其它核酸(xi)序列描述：SEQ ID NO：48：AAGCTTGGAA TTCAGTGTGA GGTGCAGCTG CAGC 34(2)SEQ ID NO：49信息：(i)序列特征：

(A)长度：45个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性(ii)分子类型：其它核酸(xi)序列描述：SEQ ID NO：49：CGCCACCTCC GGAGCCACCA CCGCCCCGTT TGATCTCGAG CTTGG 45(2)SEQ ID NO：50信息：(i)序列特征：

(A)长度：1998个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性(ii)分子类型：其它核酸(xi)序列描述：SEQ ID NO：50：ATGAAGTTGT GGCTGAACTG GATTTTCCTT GTAACACTTT TAAATGGAAT TCAGTGTGAG 60GTGCAGCTGC AGCAGTCTGG GGCAGAGCTT GTGAGGTCAG GGGCCTCAGT CAAGTTGTCC 120TGCACAGCTT CTGGCTTCAA CATTAAAGAC AACTATATGC ACTGGGTGAA GCAGAGGCCT 180GAACAGGGCC TGGAGTGGAT TGCATGGATT GATCCTGAGA ATGGTGATAC TGAATATGCC 240CCGAAGTTCC GGGGCAAGGC CACTTTGACT GCAGACTCAT CCTCCAACAC AGCCTACCTG 300CACCTCAGCA GCCTGACATC TGAGGACACT GCCGTCTATT ACTGTCATGT CCTGATCTAT 360GCTGGTTATT TGGCTATGGA CTACTGGGGT CAAGGAACCT CAGTCGCCGT GAGCTCGGGT 420GGCGGTGGCT CGGGCGGTGG TGGGTCGGGT GGCGGCGGAT CTCAGATTGT GCTCACCCAG 480TCTCCAGCAA TCATGTCTGC ATCTCCAGGG GAGAAGGTCA CCATAACCTG CAGTGCCAGC 540TCAAGTGTAA CTTACATGCA CTGGTTCCAG CAGAAGCCAG GCACTTCTCC CAAACTCTGG 600ATTTATAGCA CATCCAACCT GGCTTCTGGA GTCCCTGCTC GCTTCAGTGG CAGTGGATCT 660GGGACCTCTT ACTCTCTCAC AATCAGCCGA ATGGAGGCTG AAGATGCTGC CACTTATTAC 720TGCCAGCAAA GGAGTACTTA CCCGCTCACG TTCGGTGCTG GGACCAAGCT CGAGATCAAA 780CGGGGCGGTG GTGGCTCCGG AGGTGGCGGT AGCGGTGGCG GGGGTTCCCA GAAGCGCGAC 840AACGTGCTGT TCCAGGCAGC TACCGACGAG CAGCCGGCCG TGATCAAGAC GCTGGAGAAG 900CTGGTCAACA TCGAGACCGG CACCGGTGAC GCCGAGGGCA TCGCCGCTGC GGGCAACTTC 960CTCGAGGCCG AGCTCAAGAA CCTCGGCTTC ACGGTCACGC GAAGCAAGTC GGCCGGCCTG 1020GTGGTGGGCG ACAACATCGT GGGCAAGATC AAGGGCCGCG GCGGCAAGAA CCTGCTGCTG 1080ATGTCGCACA TGGACACCGT CTACCTCAAG GGCATTCTCG CGAAGGCCCC GTTCCGCGTC 1140GAAGGCGACA AGGCCTACGG CCCGGGCATC GCCGACGACA AGGGCGGCAA CGCGGTCATC 1200CTGCACACGC TCAAGCTGCT GAAGGAATAC GGCGTGCGCG ACTACGGCAC CATCACCGTG 1260CTGTTCAACA CCGACGAGGA AAAGGGTTCC TTCGGCTCGC GCGACCTGAT CCAGGAAGAA 1320GCCAAGCTGG CCGACTACGT GCTCTCCTTC GAGCCCACCA GCGCAGGCGA CGAAAAACTC 1380TCGCTGGGCA CCTCGGGCAT CGCCTACGTG CAGGTCCAGA TCACCGGCAA GGCCTCGCAT 1440GCCGGCGCCG CGCCCGAGCT GGGCGTGAAC GCGCTGGTCG AGGCTTCCGA CCTCGTGCTG 1500CGCACGATGA ACATCGACGA CAAGGCGAAG AACCTGCGCT TCCAGTGGAC CATCGCCAAG 1560GCCGGCCAGG TCTCGAACAT CATCCCCGCC AGCGCCACGC TGAACGCCGA CGTGCGCTAC 1620GCGCGCAACG AGGACTTCGA CGCCGCCATG AAGACGCTGG AAGAGCGCGC GCAGCAGAAG 1680AAGCTGCCCG AGGCCGACGT GAAGGTGATC GTCACGCGCG GCCGCCCGGC CTTCAATGCC 1740GGCGAAGGCG GCAAGAAGCT GGTCGACAAG GCGGTGGCCT ACTACAAGGA AGCCGGCGGC 1800ACGCTGGGCG TGGAAGAGCG CACCGGCGGC GGCACCGACG CGGCCTACGC CGCGCTCTCA 1860GGCAAGCCAG TGATCGAGAG CCTGGGCCTG CCGGGCTTCG GCTACCACAG CGACAAGGCC 1920GAGTACGTGG ACATCAGCGC GATTCCGCGC CGCCTGTACA TGGCTGCGCG CCTGATCATG 1980GATCTGGGCG CCGGCAAG 1998(2)SEQ ID NO：51信息：(i)序列特征：

(A)长度：666个氨基酸

(B)类型：氨基酸

(C)链型：单链

(D)拓扑学：线性(ii)分子类型：蛋白质(xi)序列描述：SEQ ID NO：51：Met Lys Leu Trp Leu Asn Trp Ile Phe Leu Val Thr Leu Leu Asn Gly1 5 10 15Ile Gln Cys Glu Val Gln Leu Gln Gln Ser Gly Ala Glu Leu Val Arg

20 25 30Ser Gly Ala Ser Val Lys Leu Ser Cys Thr Ala Ser Gly Phe Asn Ile

35 40 45Lys Asp Asn Tyr Met His Trp Val Lys Gln Arg Pro Glu Gln Gly Leu

85 90 95Thr Ala Tyr Leu His Leu Ser Ser Leu Thr Ser Glu Asp Thr Ala Val

100 105 110Tyr Tyr Cys His Val Leu Ile Tyr Ala Gly Tyr Leu Ala Met Asp Tyr

115 120 125Trp Gly GAn Gly Thr Ser Val Ala Val Ser Ser Gly Gly Gly Gly Ser

130 135 140Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gln Ile Val Leu Thr Gln145 150 155 160Ser Pro Ala Ile Met Ser Ala Ser Pro Gly Glu Lys Val Thr Ile Thr

165 170 175Cys Ser Ala Ser Ser Ser Val Thr Tyr Met His Trp Phe Gln Gln Lys

180 185 190Pro Gly Thr Ser Pro Lys Leu Trp Ile Tyr Ser Thr Ser Asn Leu Ala

195 200 205Ser Gly Val Pro Ala Arg Phe Ser Gly Ser Gly Ser Gly Thr Ser Tyr

210 215 220Ser Leu Thr Ile Ser Arg Met Glu Ala Glu Asp Ala Ala Thr Tyr Tyr225 230 235 240Cys Gln Gln Arg Ser Thr Tyr Pro Leu Thr Phe Gly Ala Gly Thr Lys

245 250 255Leu Glu Ile Lys Arg Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly

260 265 270Gly Gly Gly Ser Gln Lys Arg Asp Asn Val Leu Phe Gln Ala Ala Thr

275 280 285Asp Glu Gln Pro Ala Val Ile Lys Thr Leu Glu Lys Leu Val Asn Ile

290 295 300Glu Thr Gly Thr Gly Asp Ala Glu Gly Ile Ala Ala Ala Gly Asn Phe305 310 315 320Leu Glu Ala Glu Leu Lys Asn Leu Gly Phe Thr Val Thr Arg Ser Lys

325 330 335Ser Ala Gly Leu Val Val Gly Asp Asn Ile Val Gly Lys Ile Lys Gly

340 345 350Arg Gly Gly Lys Asn Leu Leu Leu Met Ser His Met Asp Thr Val Tyr

355 360 365Leu Lys Gly Ile Leu Ala Lys Ala Pro Phe Arg Val Glu Gly Asp Lys

370 375 380Ala Tyr Gly Pro Gly Ile Ala Asp Asp Lys Gly Gly Asn Ala Val Ile385 390 395 400Leu His Thr Leu Lys Leu Leu Lys Glu Tyr Gly Val Arg Asp Tyr Gly

405 410 415Thr Ile Thr Val Leu Phe Asn Thr Asp Glu Glu Lys Gly Ser Phe Gly

420 425 430Ser Arg Asp Leu Ile Gln Glu Glu Ala Lys Leu Ala Asp Tyr Val Leu

435 440 445Ser Phe Glu Pro Thr Ser Ala Gly Asp Glu Lys Leu Ser Leu Gly Thr

450 455 460Ser Gly Ile Ala Tyr Val Gln Val Gln Ile Thr Gly Lys Ala Ser His465 470 475 480Ala Gly Ala Ala Pro Glu Leu Gly Val Asn Ala Leu Val Glu Ala Ser

485 490 495Asp Leu Val Leu Arg Thr Met Asn Ile Asp Asp Lys Ala Lys Asn Leu

500 505 510Arg Phe Gln Trp Thr Ile Ala Lys Ala Gly Gln Val Ser Asn Ile Ile

515 520 525Pro Ala Ser Ala Thr Leu Asn Ala Asp Val Arg Tyr Ala Arg Asn Glu

530 535 540Asp Phe Asp Ala Ala Met Lys Thr Leu Glu Glu Arg Ala Gln Gln Lys545 550 555 560Lys Leu Pro Glu Ala Asp Val Lys Val Ile Val Thr Arg Gly Arg Pro

565 570 575Ala Phe Asn Ala Gly Glu Gly Gly Lys Lys Leu Val Asp Lys Ala Val

580 585 590Ala Tyr Tyr Lys Glu Ala Gly Gly Thr Leu Gly Val Glu Glu Arg Thr

595 600 605Gly Gly Gly Thr Asp Ala Ala Tyr Ala Ala Leu Ser Gly Lys Pro Val

610 615 620Ile Glu Ser Leu Gly Leu Pro Gly Phe Gly Tyr His Ser Asp Lys Ala625 630 635 640Glu Tyr Val Asp Ile Ser Ala Ile Pro Arg Arg Leu Tyr Met Ala Ala

645 650 655Arg Leu Ile Met Asp Leu Gly Ala Gly Lys

660 665(2)SEQ ID NO：52信息：(i)序列特征：

(A)长度：3217个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性(ii)分子类型：其它核酸(xi)序列描述：SEQ ID NO：52：GAATTCGCCG CCACTATGGA TTTTCAAGTG CAGATTTTCA GCTTCCTGCT AATCAGTGCT 60TCAGTCATAA TGTCCAGAGG ACAAACTGTT CTCTCCCAGT CTCCAGCAAT CCTGTCTGCA 120TCTCCAGGGG AGAAGGTCAC AATGACTTGC AGGGCCAGCT CAAGTGTAAC TTACATTCAC 180TGGTACCAGC AGAAGCCAGG TTCCTCCCCC AAATCCTGGA TTTATGCCAC ATCCAACCTG 240GCTTCTGGAG TCCCTGCTCG CTTCAGTGGC AGTGGGTCTG GGACCTCTTA CTCTCTCACA 300ATCAGCAGAG TGGAGGCTGA AGATGCTGCC ACTTATTACT GCCAACATTG GAGTAGTAAA 360CCACCGACGT TCGGTGGAGG CACCAAGCTC GAGATCAAAC GGACTGTGGC TGCACCATCT 420GTCTTCATCT TCCCGCCATC TGATGAGCAG TTGAAATCTG GAACTGCCTC TGTTGTGTGC 480CTGCTGAATA ACTTCTATCC CAGAGAGGCC AAAGTACAGT GGAAGGTGGA TAACGCCCTC 540CAATCGGGTA ACTCCCAGGA GAGTGTCACA GAGCAGGACA GCAAGGACAG CACCTACAGC 600CTCAGCAGCA CCCTGACGCT GAGCAAAGCA GACTACGAGA AACACAAAGT CTACGCCTGC 660GAAGTCACCC ATCAGGGCCT GAGTTCGCCC GTCACAAAGA GCTTCAACAG GGGAGAGTGT 720TAATAGGAGC TCGGATCCAG ATCTGAGCTC CTGTAGACGT CGACATTAAT TCCGGTTATT 780TTCCACCATA TTGCCGTCTT TTGGCAATGT GAGGGCCCGG AAACCTGGCC CTGTCTTCTT 840GACGAGCATT CCTAGGGGTC TTTCCCCTCT CGCCAAAGGA ATGCAAGGTC TGTTGAATGT 900CGTGAAGGAA GCAGTTCCTC TGGAAGCTTC TTGAAGACAA ACAACGTCTG TAGCGACCCT 960TTGCAGGCAG CGGAACCCCC CACCTGGCGA CAGGTGCCTC TGCGGCCAAA AGCCACGTGT 1020ATAAGATACA CCTGCAAAGG CGGCACAACC CCAGTGCCAC GTTGTGAGTT GGATAGTTGT 1080GGAAAGAGTC AAATGGCTCT CCTCAAGCGT ATTCAACAAG GGGCTGAAGG ATGCCCAGAA 1140GGTACCCCAT TGTATGGGAT CTGATCTGGG GCCTCGGTGC ACATGCTTTA CATGTGTTTA 1200GTCGAGGTTA AAAAACGTCT AGGCCCCCCG AACCACGGGG ACGTGGTTTT CCTTTGAAAA 1260ACACGATGAT AATACCATGG AGTTGTGGCT GAACTGGATT TTCCTTGTAA CACTTTTAAA 1320TGGTATCCAG TGTGAGGTGA AGCTGGTGGA GTCTGGAGGA GGCTTGGTAC AGCCTGGGGG 1380TTCTCTGAGA CTCTCCTGTG CAACTTCTGG GTTCACCTTC ACTGATTACT ACATGAACTG 1440GGTCCGCCAG CCTCCAGGAA AGGCACTTGA GTGGTTGGGT TTTATTGGAA ACAAAGCTAA 1500TGGTTACACA ACAGAGTACA GTGCATCTGT GAAGGGTCGG TTCACCATCT CCAGAGATAA 1560ATCCCAAAGC ATCCTCTATC TTCAAATGAA CACCCTGAGA GCTGAGGACA GTGCCACTTA 1620TTACTGTACA AGAGATAGGG GGCTACGGTT CTACTTTGAC TACTGGGGCC AAGGCACCAC 1680TCTCACAGTG AGCTCGGCTA GCACCAAGGG ACCATCGGTC TTCCCCCTGG CCCCCTGCTC 1740CAGGAGCACC TCCGAGAGCA CAGCCGCCCT GGGCTGCCTG GTCAAGGACT ACTTCCCCGA 1800ACCGGTGACG GTGTCGTGGA ACTCAGGCGC TCTGACCAGC GGCGTGCACA CCTTCCCGGC 1860TGTCCTACAG TCCTCAGGAC TCTACTCCCT CAGCAGCGTC GTGACGGTGC CCTCCAGCAA 1920CTTCGGCACC CAGACCTACA CCTGCAACGT AGATCACAAG CCCAGCAACA CCAAGGTGGA 1980CAAGACAGTT GGCGGTGGTG GCTCTGGTGG TGGCGGTAGC GGTGGCGGGG GTTCCCAGAA 2040GCGCGACAAC GTGCTGTTCC AGGCAGCTAC CGACGAGCAG CCGGCCGTGA TCAAGACGCT 2100GGAGAAGCTG GTCAACATCG AGACCGGCAC CGGTGACGCC GAGGGCATCG CCGCTGCGGG 2160CAACTTCCTC GAGGCCGAGC TCAAGAACCT CGGCTTCACG GTCACGCGAA GCAAGTCGGC 2220CGGCCTGGTG GTGGGCGACA ACATCGTGGG CAAGATCAAG GGCCGCGGCG GCAAGAACCT 2280GCTGCTGATG TCGCACATGG ACACCGTCTA CCTCAAGGGC ATTCTCGCGA AGGCCCCGTT 2340CCGCGTCGAA GGCGACAAGG CCTACGGCCC GGGCATCGCC GACGACAAGG GCGGCAACGC 2400GGTCATCCTG CACACGCTCA AGCTGCTGAA GGAATACGGC GTGCGCGACT ACGGCACCAT 2460CACCGTGCTG TTCAACACCG ACGAGGAAAA GGGTTCCTTC GGCTCGCGCG ACCTGATCCA 2520GGAAGAAGCC AAGCTGGCCG ACTACGTGCT CTCCTTCGAG CCCACCAGCG CAGGCGACGA 2580AAAACTCTCG CTGGGCACCT CGGGCATCGC CTACGTGCAG GTCCAGATCA CCGGCAAGGC 2640CTCGCATGCC GGCGCCGCGC CCGAGCTGGG CGTGAACGCG CTGGTCGAGG CTTCCGACCT 2700CGTGCTGCGC ACGATGAACA TCGACGACAA GGCGAAGAAC CTGCGCTTCC AGTGGACCAT 2760CGCCAAGGCC GGCCAGGTCT CGAACATCAT CCCCGCCAGC GCCACGCTGA ACGCCGACGT 2820GCGCTACGCG CGCAACGAGG ACTTCGACGC CGCCATGAAG ACGCTGGAAG AGCGCGCGCA 2880GCAGAAGAAG CTGCCCGAGG CCGACGTGAA GGTGATCGTC ACGCGCGGCC GCCCGGCCTT 2940CAATGCCGGC GAAGGCGGCA AGAAGCTGGT CGACAAGGCG GTGGCCTACT ACAAGGAAGC 3000CGGCGGCACG CTGGGCGTGG AAGAGCGCAC CGGCGGCGGC ACCGACGCGG CCTACGCCGC 3060GCTCTCAGGC AAGCCAGTGA TCGAGAGCCT GGGCCTGCCG GGCTTCGGCT ACCACAGCGA 3120CAAGGCCGAG TACGTGGACA TCAGCGCGAT TCCGCGCCGC CTGTACATGG CTGCGCGCCT 3180GATCATGGAT CTGGGCGCCG GCAAGTGATA ATCTAGA 3217(2)SEQ ID NO：53信息：(i)序列特征：

(A)长度：35个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性(ii)分子类型：其它核酸(xi)序列描述：SEQ ID NO：53：TGGATCTGAA GCTTAAACTA ACTCCATGGT GACCC 35(2)SEQ ID NO：54信息：(i)序列特征：

(A)长度：61个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性(ii)分子类型：其它核酸(xi)序列描述：SEQ ID NO：54：GCCACGGATC CCGCCACCTC CGGAGCCACC ACCGCCACAA TCCCTGGGCA CAATTTTCTT 60G 61(2)SEQ ID NO：55信息：(i)序列特征：

(A)长度：94个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性(ii)分子类型：其它核酸(xi)序列描述：SEQ ID NO：55：GCCCAGGAAG CTTGGCGGTG GTGGCTCCGG AGGTGGCGGT AGCGGTGGCG GGGGTTCCCA 60GAAGCGCGAC AACGTGCTGT TCCAGGCAGC TACC 94(2)SEQ ID NO：56信息：(i)序列特征：

(A)长度：51个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性(ii)分子类型：其它核酸(xi)序列描述：SEQ ID NO：56：ATGTGCGAAT TCAGCAGCAG GTTCTTGCCG CCGCGGCCCT TGATCTTGCC C 51(2)SEQ ID NO：57信息：(i)序列特征：

(A)长度：732个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性(ii)分子类型：其它核酸(ix)特征：

(A)名字/关键：CDS

(B)位置：16..720(xi)序列描述：SEQ ID NO：57：GAATTCGCCG CCACC ATG GAT TTT CAA GTG CAG ATT TTC AGC TTC CTG CTA 51

Met Asp Phe Gln Val Gln Ile Phe Ser Phe Leu Leu

1 5 10ATC AGT GCT TCA GTC ATA ATG TCC AGA GGA CAA ACT GTT CTC TCC CAG 99Ile Ser Ala Ser Val Ile Met Ser Arg Gly Gln Thr Val Leu Ser Gln

15 20 25TCT CCA GCA ATC CTG TCT GCA TCT CCA GGG GAG AAG GTC ACA ATG ACT 147Ser Pro Ala Ile Leu Ser Ala Ser Pro Gly Glu Lys Val Thr Met Thr

30 35 40TGC AGG GCC AGC TCA AGT GTA ACT TAC ATT CAC TGG TAC CAG CAG AAG 195Cys Arg Ala Ser Ser Ser Val Thr Tyr Ile His Trp Tyr Gln Gln Lys45 50 55 60CCA GGT TCC TCC CCC AAA TCC TGG ATT TAT GCC ACA TCC AAC CTG GCT 243Pro Gly Ser Ser Pro Lys Ser Trp Ile Tyr Ala Thr Ser Asn Leu Ala

65 70 75TCT GGA GTC CCT GCT CGC TTC AGT GGC AGT GGG TCT GGG ACC TCT TAC 291Ser Gly Val Pro Ala Arg Phe Ser Gly Ser Gly Ser Gly Thr Ser Tyr

80 85 90TCT CTC ACA ATC AGC AGA GTG GAG GCT GAA GAT GCT GCC ACT TAT TAC 339Ser Leu Thr Ile Ser Arg Val Glu Ala Glu Asp Ala Ala Thr Tyr Tyr

95 100 105TGC CAA CAT TGG AGT AGT AAA CCA CCG ACG TTC GGT GGA GGC ACC AAG 387Cys Gln His Trp Ser Ser Lys Pro Pro Thr Phe Gly Gly Gly Thr Lys

110 115 120CTG GAA ATC AAA CGG GCT GAT GCT GCA CCA ACT GTA TCC ATC TTC CCA 435Leu Glu Ile Lys Arg Ala Asp Ala Ala Pro Thr Val Ser Ile Phe Pro125 130 135 140CCA TCC AGT GAG CAG TTA ACA TCT GGA GGT GCC TCA GTC GTG TGC TTC 483Pro Ser Ser Glu Gln Leu Thr Ser Gly Gly Ala Ser Val Val Cys Phe

145 150 155TTG AAC AAC TTC TAC CCC AAA GAC ATC AAT GTC AAG TGG AAG ATT GAT 531Leu Asn Asn Phe Tyr Pro Lys Asp Ile Asn Val Lys Trp Lys Ile Asp

160 165 170GGC AGT GAA CGA CAA AAT GGC GTC CTG AAC AGT TGG ACT GAT CAG GAC 579Gly Ser Glu Arg Gln Asn Gly Val Leu Asn Ser Trp Thr Asp Gln Asp

175 180 185AGC AAA GAC AGC ACC TAC AGC ATG AGC AGC ACC CTC ACG TTG ACC AAG 627Ser Lys Asp Ser Thr Tyr Ser Met Ser Ser Thr Leu Thr Leu Thr Lys

190 195 200GAC GAG TAT GAA CGA CAT AAC AGC TAT ACC TGT GAG GCC ACT CAC AAG 675Asp Glu Tyr Glu Arg His Asn Ser Tyr Thr Cys Glu Ala Thr His Lys205 210 215 220ACA TCA ACT TCA CCC ATT GTC AAG AGC TTC AAC AGG AAT GAG TGT 720Thr Ser Thr Ser Pro Ile Val Lys Ser Phe Asn Arg Asn Glu Cys

225 230 235TAATAAGAAT TC 732(2)SEQ ID NO：58信息：(i)序列特征：

(A)长度：23个氨基酸

(B)类型：氨基酸

(D)拓扑学：线性(ii)分子类型：蛋白质(xi)序列描述：SEQ ID NO：58：Met Asp Phe Gln Val Gln Ile Phe Ser Phe Leu Leu Ile Ser Ala Ser1 5 10 15Val Ile Met Ser Arg Gly Gln Thr Val Leu Ser Gln Ser Pro Ala Ile

20 25 30Leu Ser Ala Ser Pro Gly Glu Lys Val Thr Met Thr Cys Arg Ala Ser

35 40 45Ser Ser Val Thr Tyr Ile His Trp Tyr Gln Gln Lys Pro Gly Ser Ser

85 90 95Ser Arg Val Glu Ala Glu Asp Ala Ala Thr Tyr Tyr Cys Gln His Trp

100 105 110Ser Ser Lys Pro Pro Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile Lys

115 120 125Arg Ala Asp Ala Ala Pro Thr Val Ser Ile Phe Pro Pro Ser Ser Glu

130 135 140Gln Leu Thr Ser Gly Gly Ala Ser Val Val Cys Phe Leu Asn Asn Phe145 150 155 160Tyr Pro Lys Asp Ile Asn Val Lys Trp Lys Ile Asp Gly Ser Glu Arg

165 170 175Gln Asn Gly Val Leu Asn Ser Trp Thr Asp Gln Asp Ser Lys Asp Ser

180 185 190Thr Tyr Ser Met Ser Ser Thr Leu Thr Leu Thr Lys Asp Glu Tyr Glu

195 200 205Arg His Asn Ser Tyr Thr Cys Glu Ala Thr His Lys Thr Ser Thr Ser

210 215 220Pro Ile Val Lys Ser Phe Asn Arg Asn Glu Cys225 230 235(2)SEQ ID NO：59信息：(i)序列特征：

(A)长度：1974个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑学：线性(ii)分子类型：其它核酸(ix)特征：

(A)名字/关键：CDS

(B)位置：16..1956(xi)序列描述：SEQ ID NO：59：AAGCTTGCCG CCACC ATG AAG TTG TGG CTG AAC TGG ATT TTC CTT GTA ACA 51

Met Lys Leu Trp Leu Asn Trp Ile Phe Leu Val Thr

1 5 10CTT TTA AAT GGT ATC CAG TGT GAG GTG AAG CTG GTG GAG TCT GGA GGA 99Leu Leu Asn Gly Ile Gln Cys Glu Val Lys Leu Val Glu Ser Gly Gly

15 20 25GGC TTG GTA CAG CCT GGG GGT TCT CTG AGA CTC TCC TGT GCA ACT TCT 147Gly Leu Val Gln Pro Gly Gly Ser Leu Arg Leu Ser Cys Ala Thr Ser

30 35 40GGG TTC ACC TTC ACT GAT TAC TAC ATG AAC TGG GTC CGC CAG CCT CCA 195Gly Phe Thr Phe Thr Asp Tyr Tyr Met Asn Trp Val Arg Gln Pro Pro45 50 55 60GGA AAG GCA CTT GAG TGG TTG GGT TTT ATT GGA AAC AAA GCT AAT GGT 243Gly Lys Ala Leu Glu Trp Leu Gly Phe Ile Gly Asn Lys Ala Asn Gly

65 70 75TAC ACA ACA GAG TAC AGT GCA TCT GTG AAG GGT CGG TTC ACC ATC TCC 291Tyr Thr Thr Glu Tyr Ser Ala Ser Val Lys Gly Arg Phe Thr Ile Ser

80 85 90AGA GAT AAA TCC CAA AGC ATC CTC TAT CTT CAA ATG AAC ACC CTG AGA 339Arg Asp Lys Ser Gln Ser Ile Leu Tyr Leu Gln Met Asn Thr Leu Arg

95 100 105GCT GAG GAC AGT GCC ACT TAT TAC TGT ACA AGA GAT AGG GGG CTA CGG 387Ala Glu Asp Ser Ala Thr Tyr Tyr Cys Thr Arg Asp Arg Gly Leu Arg

110 115 120TTC TAC TTT GAC TAC TGG GGC CAA GGC ACC ACT CTC ACA GTC TCC TCA 435Phe Tyr Phe Asp Tyr Trp Gly Gln Gly Thr Thr Leu Thr Val Ser Ser125 130 135 140GCC AAA ACG ACA CCC CCA TCT GTC TAT CCA CTG GCC CCT GGA TCT GCT 483Ala Lys Thr Thr Pro Pro Ser Val Tyr Pro Leu Ala Pro Gly Ser Ala

145 150 155GCC CAA ACT AAC TCC ATG GTG ACC CTG GGA TGC CTG GTC AAG GGC TAT 531Ala Gln Thr Asn Ser Met Val Thr Leu Gly Cys Leu Val Lys Gly Tyr

160 165 170TTC CCT GAG CCA GTG ACA GTG ACC TGG AAC TCT GGA TCT CTG TCC AGC 579Phe Pro Glu Pro Val Thr Val Thr Trp Asn Ser Gly Ser Leu Ser Ser

175 180 185GGT GTG CAC ACC TTC CCA GCT GTC CTG CAG TCT GAC CTC TAC ACT CTG 627Gly Val His Thr Phe Pro Ala Val Leu Gln Ser Asp Leu Tyr Thr Leu

190 195 200AGC AGC TCA GTG ACT GTC CCC TCC AGC ACC TGG CCC AGC GAG ACC GTC 675Ser Ser Ser Val Thr Val Pro Ser Ser Thr Trp Pro Ser Glu Thr Val205 210 215 220ACC TGC AAC GTT GCC CAC CCG GCC AGC AGC ACC AAG GTG GAC AAG AAA 723Thr Cys Asn Val Ala His Pro Ala Ser Ser Thr Lys Val Asp Lys Lys

225 230 235ATT GTG CCC AGG GAT TGT GGC GGT GGT GGC TCC GGA GGT GGC GGT AGC 771Ile Val Pro Arg Asp Cys Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser

240 245 250GGT GGC GGG GGT TCC CAG AAG CGC GAC AAC GTG CTG TTC CAG GCA GCT 819Gly Gly Gly Gly Ser Gln Lys Arg Asp Asn Val Leu Phe Gln Ala Ala

255 260 265ACC GAC GAG CAG CCG GCC GTG ATC AAG ACG CTG GAG AAG CTG GTC AAC 867Thr Asp Glu Gln Pro Ala Val Ile Lys Thr Leu Glu Lys Leu Val Asn

270 275 280ATC GAG ACC GGC ACC GGT GAC GCC GAG GGC ATC GCC GCT GCG GGC AAC 915Ile Glu Thr Gly Thr Gly Asp Ala Glu Gly Ile Ala Ala Ala Gly Asn285 290 295 300TTC CTC GAG GCC GAG CTC AAG AAC CTC GGC TTC ACG GTC ACG CGA AGC 963Phe Leu Glu Ala Glu Leu Lys Asn Leu Gly Phe Thr Val Thr Arg Ser

305 310 315AAG TCG GCC GGC CTG GTG GTG GGC GAC AAC ATC GTG GGC AAG ATC AAG 1011Lys Ser Ala Gly Leu Val Val Gly Asp Asn Ile Val Gly Lys Ile Lys

320 325 330GGC CGC GGC GGC AAG AAC CTG CTG CTG ATG TCG CAC ATG GAC ACC GTC 1059Gly Arg Gly Gly Lys Asn Leu Leu Leu Met Ser His Met Asp Thr Val

335 340 345TAC CTC AAG GGC ATT CTC GCG AAG GCC CCG TTC CGC GTC GAA GGC GAC 1107Tyr Leu Lys Gly Ile Leu Ala Lys Ala Pro Phe Arg Val Glu Gly Asp

350 355 360AAG GCC TAC GGC CCG GGC ATC GCC GAC GAC AAG GGC GGC AAC GCG GTC 1155Lys Ala Tyr Gly Pro Gly Ile Ala Asp Asp Lys Gly Gly Asn Ala Val365 370 375 380ATC CTG CAC ACG CTC AAG CTG CTG AAG GAA TAC GGC GTG CGC GAC TAC 1203Ile Leu His Thr Leu Lys Leu Leu Lys Glu Tyr Gly Val Arg Asp Tyr

385 390 395GGC ACC ATC ACC GTG CTG TTC AAC ACC GAC GAG GAA AAG GGT TCC TTC 1251Gly Thr Ile Thr Val Leu Phe Asn Thr Asp Glu Glu Lys Gly Ser Phe

400 405 410GGC TCG CGC GAC CTG ATC CAG GAA GAA GCC AAG CTG GCC GAC TAC GTG 1299Gly Ser Arg Asp Leu Ile Gln Glu Glu Ala Lys Leu Ala Asp Tyr Val

415 420 425CTC TCC TTC GAG CCC ACC AGC GCA GGC GAC GAA AAA CTC TCG CTG GGC 1347Leu Ser Phe Glu Pro Thr Ser Ala Gly Asp Glu Lys Leu Ser Leu Gly

430 435 440ACC TCG GGC ATC GCC TAC GTG CAG GTC AAC ATC ACC GGC AAG GCC TCG 1395Thr Ser Gly Ile Ala Tyr Val Gln Val Asn Ile Thr Gly Lys Ala Ser445 450 455 460CAT GCC GGC GCC GCG CCC GAG CTG GGC GTG AAC GCG CTG GTC GAG GCT 1443His Ala Gly Ala Ala Pro Glu Leu Gly Val Asn Ala Leu Val Glu Ala

465 470 475TCC GAC CTC GTG CTG CGC ACG ATG AAC ATC GAC GAC AAG GCG AAG AAC 1491Ser Asp Leu Val Leu Arg Thr Met Asn Ile Asp Asp Lys Ala Lys Asn

480 485 490CTG CGC TTC AAC TGG ACC ATC GCC AAG GCC GGC AAC GTC TCG AAC ATC 1539Leu Arg Phe Asn Trp Thr Ile Ala Lys Ala Gly Asn Val Ser Asn Ile

495 500 505ATC CCC GCC AGC GCC ACG CTG AAC GCC GAC GTG CGC TAC GCG CGC AAC 1587Ile Pro Ala Ser Ala Thr Leu Asn Ala Asp Val Arg Tyr Ala Arg Asn

510 515 520GAG GAC TTC GAC GCC GCC ATG AAG ACG CTG GAA GAG CGC GCG CAG CAG 1635Glu Asp Phe Asp Ala Ala Met Lys Thr Leu Glu Glu Arg Ala Gln Gln525 530 535 540AAG AAG CTG CCC GAG GCC GAC GTG AAG GTG ATC GTC ACG CGC GGC CGC 1683Lys Lys Leu Pro Glu Ala Asp Val Lys Val Ile Val Thr Arg Gly Arg

545 550 555CCG GCC TTC AAT GCC GGC GAA GGC GGC AAG AAG CTG GTC GAC AAG GCG 1731Pro Ala Phe Asn Ala Gly Glu Gly Gly Lys Lys Leu Val Asp Lys Ala

560 565 570GTG GCC TAC TAC AAG GAA GCC GGC GGC ACG CTG GGC GTG GAA GAG CGC 1779Val Ala Tyr Tyr Lys Glu Ala Gly Gly Thr Leu Gly Val Glu Glu Arg

575 580 585ACC GGC GGC GGC ACC GAC GCG GCC TAC GCC GCG CTC TCA GGC AAG CCA 1827Thr Gly Gly Gly Thr Asp Ala Ala Tyr Ala Ala Leu Ser Gly Lys Pro

590 595 600GTG ATC GAG AGC CTG GGC CTG CCG GGC TTC GGC TAC CAC AGC GAC AAG 1875Val Ile Glu Ser Leu Gly Leu Pro Gly Phe Gly Tyr His Ser Asp Lys605 610 615 620GCC GAG TAC GTG GAC ATC AGC GCG ATT CCG CGC CGC CTG TAC ATG GCT 1923Ala Glu Tyr Val Asp Ile Ser Ala Ile Pro Arg Arg Leu Tyr Met Ala

625 630 635GCG CGC CTG ATC ATG GAT CTG GGC GCC GGC AAG TGATAAGAAT TCCTCGAG 1974Ala Arg Leu Ile Met Asp Leu Gly Ala Gly Lys

640 645(2)SEQ ID NO：60信息：(i)序列特征：

(A)长度：647个氨基酸

(B)类型：氨基酸

(D)拓扑学：线性(ii)分子类型：蛋白质(xi)序列描述：SEQ ID NO：60：Met Lys Leu Trp Leu Asn Trp Ile Phe Leu Val Thr Leu Leu Asn Gly1 5 10 15Ile Gln Cys Glu Val Lys Leu Val Glu Ser Gly Gly Gly Leu Val Gln

20 25 30Pro Gly Gly Ser Leu Arg Leu Ser Cys Ala Thr Ser Gly Phe Thr Phe

35 40 45Thr Asp Tyr Tyr Met Asn Trp Val Arg Gln Pro Pro Gly Lys Ala Leu

85 90 95Gln Ser Ile Leu Tyr Leu Gln Met Asn Thr Leu Arg Ala Glu Asp Ser

100 105 110Ala Thr Tyr Tyr Cys Thr Arg Asp Arg Gly Leu Arg Phe Tyr Phe Asp

115 120 125Tyr Trp Gly Gln Gly Thr Thr Leu Thr Val Ser Ser Ala Lys Thr Thr

130 135 140Pro Pro Ser Val Tyr Pro Leu Ala Pro Gly Ser Ala Ala Gln Thr Asn145 150 155 160Ser Met Val Thr Leu Gly Cys Leu Val Lys Gly Tyr Phe Pro Glu Pro

165 170 175Val Thr Val Thr Trp Asn Ser Gly Ser Leu Ser Ser Gly Val His Thr

180 185 190Phe Pro Ala Val Leu Gln Ser Asp Leu Tyr Thr Leu Ser Ser Ser Val

195 200 205Thr Val Pro Ser Ser Thr Trp Pro Ser Glu Thr Val Thr Cys Asn Val

210 215 220Ala His Pro Ala Ser Ser Thr Lys Val Asp Lys Lys Ile Val Pro Arg225 230 235 240Asp Cys Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly

245 250 255Ser Gln Lys Arg Asp Asn Val Leu Phe Gln Ala Ala Thr Asp Glu Gln

260 265 270Pro Ala Val Ile Lys Thr Leu Glu Lys Leu Val Asn Ile Glu Thr Gly

275 280 285Thr Gly Asp Ala Glu Gly Ile Ala Ala Ala Gly Asn Phe Leu Glu Ala

290 295 300Glu Leu Lys Asn Leu Gly Phe Thr Val Thr Arg Ser Lys Ser Ala Gly305 310 315 320Leu Val Val Gly Asp Asn Ile Val Gly Lys Ile Lys Gly Arg Gly Gly

325 330 335Lys Asn Leu Leu Leu Met Ser His Met Asp Thr Val Tyr Leu Lys Gly

340 345 350Ile Leu Ala Lys Ala Pro Phe Arg Val Glu Gly Asp Lys Ala Tyr Gly

355 360 365Pro Gly Ile Ala Asp Asp Lys Gly Gly Asn Ala Val Ile Leu His Thr

370 375 380Leu Lys Leu Leu Lys Glu Tyr Gly Val Arg Asp Tyr Gly Thr Ile Thr385 390 395 400Val Leu Phe Asn Thr Asp Glu Glu Lys Gly Ser Phe Gly Ser Arg Asp

405 410 415Leu Ile Gln Glu Glu Ala Lys Leu Ala Asp Tyr Val Leu Ser Phe Glu

420 425 430Pro Thr Ser Ala Gly Asp Glu Lys Leu Ser Leu Gly Thr Ser Gly Ile

435 440 445Ala Tyr Val Gln Val Asn Ile Thr Gly Lys Ala Ser His Ala Gly Ala

450 455 460Ala Pro Glu Leu Gly Val Asn Ala Leu Val Glu Ala Ser Asp Leu Val465 470 475 480Leu Arg Thr Met Asn Ile Asp Asp Lys Ala Lys Asn Leu Arg Phe Asn

485 490 495Trp Thr Ile Ala Lys Ala Gly Asn Val Ser Asn Ile Ile Pro Ala Ser

500 505 510Ala Thr Leu Asn Ala Asp Val Arg Tyr Ala Arg Asn Glu Asp Phe Asp

515 520 525Ala Ala Met Lys Thr Leu Glu Glu Arg Ala Gln Gln Lys Lys Leu Pro

530 535 540Glu Ala Asp Val Lys Val Ile Val Thr Arg Gly Arg Pro Ala Phe Asn545 550 555 560Ala Gly Glu Gly Gly Lys Lys Leu Val Asp Lys Ala Val Ala Tyr Tyr

565 570 575Lys Glu Ala Gly Gly Thr Leu Gly Val Glu Glu Arg Thr Gly Gly Gly

580 585 590Thr Asp Ala Ala Tyr Ala Ala Leu Ser Gly Lys Pro Va1 Ile Glu Ser

595 600 605Leu Gly Leu Pro Gly Phe Gly Tyr His Ser Asp Lys Ala Glu Tyr Val

610 615 620Asp Ile Ser Ala Ile Pro Arg Arg Leu Tyr Met Ala Ala Arg Leu Ile625 630 635 640Met Asp Leu Gly Ala Gly Lys

645

Claims

1.编码细胞靶向部分和异源前体药物活化酶用作哺乳动物宿主中药物的基因构建体，其中的基因构建体能够表达细胞靶向部分和异源前体药物活化酶作为哺乳动物宿主细胞中的缀合物并且其中的缀合物被导向离开此细胞，之后选择性定位于由细胞靶向部分所识别的细胞表面抗原上。

2.根据权利要求1的用作药物的基因构建体，其中的细胞靶向部分为抗体。

3.根据权利要求2的用作药物的基因构建体，其中的抗体为选自抗体A5B7或806.077抗体的抗CEA抗体。

4.根据前面任一权利要求的用作药物的基因构建体，其中的异源前体药物活化酶为羧肽酶。

5.根据权利要求4的用作药物的基因构建体，其中的羧肽酶为CPG2。

6.根据权利要求5的用作药物的基因构建体，其中的CPG2具有突变的多肽糖基化位点从而阻止或减少在哺乳动物细胞中表达时的糖基化。

7.根据权利要求5-6中任意一个权利要求的用作药物的基因构建体，其中的抗体-酶CPG2缀合物为融合蛋白，其中的酶通过抗体重链或轻链融合至该抗体的C-末端，由此该编码缀合物表达时的二聚化可通过CPG2上的二聚化区域发生。

8.根据权利要求7用作药物的基因构建体，其中的融合蛋白通过将抗体Fab重链的C-末端连接至CPG2分子的N-末端以形成Fab-CPG2而形成，由此两个Fab-CPG2分子表达时经过CPG2二聚化以形成(Fab-CPG2)₂缀合物。

9.根据权利要求4的用作药物的基因构建体，其中的羧肽酶选自[D253K]HCPB，[G251T，D253K]HCPB或[A248S，G251T，D253K]HCPB。

10.根据前面任一权利要求的用作药物的基因构建体，其包括含有启动子与控制元件的转录调节序列，此调节序列包括遗传开关以控制该基因构建体的表达。

11.根据权利要求10的用作药物的基因构建体，其中的转录调节序列包括受四环素或蜕皮素存在而调节的遗传开关控制元件。

12.根据权利要求10或11的用作药物的基因构建体，其中的启动子依赖于细胞类型并且选自下面的启动子：癌胚抗原(CEA)；α-胚胎蛋白(AFP)；酪氨酸羟化酶；乙酰胆碱转移酶；神经元特异性烯醇化酶；胰岛素；胶质细胞原纤维酸性蛋白；HER-2/neu；c-erbB2；和N-myc。

13.根据前面任一权利要求的用作药物的基因构建体，其被包裹于腺病毒中用于转移至哺乳动物宿主中。

14.权利要求1-12中任一权利要求中定义的基因构建体在制备用于哺乳动物宿主中癌症治疗的药物中的用途。

15.用于哺乳动物宿主中匹配的二组分系统，其中的组分包括：

(i)包括权利要求1-13中任一权利要求中定义基因构建体的第一种组分和；

(ii)包括可由第一种组分编码的异源酶转换成细胞毒性药物前体药物的第二种组分。

16.根据权利要求15的匹配的二组分系统，其中：

第一种组分包括编码异源酶CPG2的基因；并且第二种组分前体药物选自N-(4-[N，N-双(2-碘乙基)氨基]苯氧羰基)-L-谷氨酸，N-(4-[N，N-双(2-氯乙基)氨基]-苯氧羰基)-L-谷氨酸-γ-(3，5-二羧基)酰基苯胺或N-(4-[N，N-双(2-氯乙基)氨基]-苯氧羰基)-L-谷氨酸或其药物上可接受的盐。

17.用于将细胞毒性药物转移至一定位点的方法，包括施用含有权利要求1-13中任一权利要求中定义的基因构建体的第一种组分至宿主；然后施用第二种组分至宿主中，该组分包括可由第一种组分编码的异源酶转换成细胞毒性药物的前体药物。

18.根据权利要求17的方法，其中的第一种组分包括编码异源酶CPG2的基因；并且第二种组分前体药物选自N-(4-[N，N-双(2-碘乙基)氨基]苯氧羰基)-L-谷氨酸，N-(4-[N，N-双(2-氯乙基)氨基]-苯氧羰基)-L-谷氨酸-γ-(3，5-二羧基)酰基苯胺或N-(4-[N，N-双(2-氯乙基)氨基]-苯氧羰基)-L-谷氨酸或其药物上可接受的盐。