CN1255163A - 化合物 - Google Patents

化合物 Download PDF

Info

Publication number
CN1255163A
CN1255163A CN98804929A CN98804929A CN1255163A CN 1255163 A CN1255163 A CN 1255163A CN 98804929 A CN98804929 A CN 98804929A CN 98804929 A CN98804929 A CN 98804929A CN 1255163 A CN1255163 A CN 1255163A
Authority
CN
China
Prior art keywords
gly
ala
leu
ser
thr
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN98804929A
Other languages
English (en)
Other versions
CN1268743C (zh
Inventor
S·C·埃默里
D·C·布拉凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AstraZeneca UK Ltd
Syngenta Ltd
Original Assignee
Zeneca Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zeneca Ltd filed Critical Zeneca Ltd
Publication of CN1255163A publication Critical patent/CN1255163A/zh
Application granted granted Critical
Publication of CN1268743C publication Critical patent/CN1268743C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B82NANOTECHNOLOGY
    • B82YSPECIFIC USES OR APPLICATIONS OF NANOSTRUCTURES; MEASUREMENT OR ANALYSIS OF NANOSTRUCTURES; MANUFACTURE OR TREATMENT OF NANOSTRUCTURES
    • B82Y5/00Nanobiotechnology or nanomedicine, e.g. protein engineering or drug delivery
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K47/00Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient
    • A61K47/50Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates
    • A61K47/51Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent
    • A61K47/68Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent the modifying agent being an antibody, an immunoglobulin or a fragment thereof, e.g. an Fc-fragment
    • A61K47/6891Pre-targeting systems involving an antibody for targeting specific cells
    • A61K47/6899Antibody-Directed Enzyme Prodrug Therapy [ADEPT]
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P43/00Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/18Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans
    • C07K16/28Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants
    • C07K16/30Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants from tumour cells
    • C07K16/3007Carcino-embryonic Antigens
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/48Hydrolases (3) acting on peptide bonds (3.4)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2799/00Uses of viruses
    • C12N2799/02Uses of viruses as vector
    • C12N2799/021Uses of viruses as vector for the expression of a heterologous nucleic acid
    • C12N2799/022Uses of viruses as vector for the expression of a heterologous nucleic acid where the vector is derived from an adenovirus
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S977/00Nanotechnology
    • Y10S977/70Nanostructure
    • Y10S977/788Of specified organic or carbon-based composition
    • Y10S977/802Virus-based particle
    • Y10S977/803Containing biological material in its interior
    • Y10S977/804Containing nucleic acid

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Organic Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Immunology (AREA)
  • Molecular Biology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Public Health (AREA)
  • Animal Behavior & Ethology (AREA)
  • Nanotechnology (AREA)
  • Veterinary Medicine (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Cell Biology (AREA)
  • Oncology (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Epidemiology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Medical Informatics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Organic Low-Molecular-Weight Compounds And Preparation Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明提供一种基因构建体,该构建体编码细胞靶向部分和异源性前体药物活化酶而用作哺乳动物中的药物,其中的基因构建体能够表达细胞靶向部分和酶而作为哺乳动物宿主靶细胞中的缀合物并且其中的缀合物注定要离开此细胞然后选择性定位于由该细胞靶向部分所识别的细胞表面抗原上。

Description

化合物
本发明特别涉及用原位抗体产生以提供增强选择性特别是用于癌症治疗的基因定向的酶前体药物疗法(GDEPT)。
已知基于基因治疗的前体药物治疗方法包括病毒定向的酶前体药物疗法(VDEPT)和基因定向的酶前体药物疗法(GDEPT),后一个术语同时包括VDEPT和非病毒载体系统。VDEPT包括用带有编码能够活化前体药物酶基因的病毒载体靶向肿瘤细胞。病毒载体进入肿瘤细胞并且由细胞中的该酶基因表达酶,在GDEPT中,其它的方法如显微注射-脂质体运送和受体介导的DNA摄入以及病毒可用于转运编码此酶的基因。
在VDEPT和GDEPT中,该酶基因都受能够在哺乳动物细胞如肿瘤细胞中选择性活化的DNA序列的转录调节(EP 415 731(Wellcome);Huber等,美国国家科学院院报,88,8039-8043,1991)。尽管达到一定程度的选择性,基因表达也可在非靶细胞中发生且当此方法用于活化前体药物成为潜在细胞毒剂时此效应显然不理想。此外,与用病毒启动子相比,这些调节序列一般将导致该酶表达下降且此将导致在靶组织中转化前体药物能力的下降。
前体药物活化酶在细胞内部的表达与定位具有缺点。前体药物设计受到以下事实的严重限制,即前体药物必须能够穿过细胞膜并且在细胞内由活化酶转成成药之前是无毒的。大多数前体药物利用亲水基团以阻止进入细胞且因此减少细胞毒性。活化酶对前体药物的转移产生可进入细胞的较少亲水性的药物从而产生抗癌效应。当活化酶在细胞内部表达时不可用此方法。另一个缺点是缺乏胞内活化酶的靶细胞将难以攻击因为它们不能够产生活性药物。为了达到此理想的“旁观者活性”(或“邻近细胞杀伤”),该活性药物将必须能够扩散出含有活化酶的细胞以达到缺乏酶表达的靶细胞。当在细胞内部产生时许多活性药物将不能够逃离该细胞而完成此旁观者效应。
已提出对GDEPT的一些改进从而克服上述的一些问题。首先描述了这样的载体,据称它们通过附着信号肽与跨膜区域到活化酶上而在靶细胞(WO 96/03515)表面上表达活化酶。如果可行,该方法将克服大细胞内部具有活化酶的问题但仍将不得不依赖于能够选择性表达于靶细胞中的转录调节序列从而限制细胞表达。如上述用这些序列也有缺点。其次,描述了导致该酶从靶细胞分泌的载体(WO 96/16179)。在此方法中该酶将能够从其产生位点扩散出去因为其为细胞外的且没有附着到细胞表面上。从靶位点扩散出来的酶将能够在非靶位点活化前体药物从而导致不必要的毒性。为了达到一定的选择性,建议可使用这样的酶前体,即通过病理学相关的蛋白酶将其切割以形成活性酶。通过此方法可能达到一定的选择性但活化仅在靶位点发生是不可能的。此外一旦活化,该酶将仍然自靶位点扩散出去且因此遭受与上述相同的弊端。
对于GDEPT方法,可观察到三个水平的选择性。首先,在细胞感染时期具有选择性从而仅靶向特异性的细胞类型。例如,可通过基因运载系统本身提供细胞选择性。在国际专利申请WO 95/26412(UAB研究基金)中提出了这种选择性的实例,其中描述了掺入细胞持异性配体的修饰腺病毒纤维蛋白的使用。细胞特异性靶向的其它实例包括体外转移基因至特异细胞类群如淋巴细胞中和直接注射DNA至肌肉组织中。
第二档次水平的选择性是在细胞感染后例如通过使用细胞或组织特异性启动子控制基因表达。如果该基因以选择性的方式导入细胞类型中那么选择与该细胞类型中活性相容的启动子是重要的。
第三水平的选择性可认为是表达的基因构建体的选择性。此水平的选择性到目前为止受到很少注意。在国际专利申请WO 96/16179(Wellcome Foundation)中,建议使用这样的酶前体,即通过以病理学相关的蛋白酶切割此前体以形成活性酶。通过此方法可能达到一定的选择性但活化将仅在此靶位点发生是不可能的。此外,一旦活化,该酶将仍然自由从靶位点扩散出来且因此在非靶位点遭受活化前体药物相同的弊端而导致不必要的毒性。
还存在更为选择性GDEPT系统的必要以减少由于错误的前体药物活化而导致正常组织中不必要的效应。
本发明是基于这样的发现,即抗体-异源性酶基因构建体可在胞内表达并用于GDEPT系统(或其它系统如AMIRACS-见下文)中从而由于抗体的特异性进行细胞靶向因而以选择性方式运载可得到的细胞表面上的酶。此方法可任选与任何其它适当的特异性增强技术如靶细胞感染和/或组织特异性表达联合使用。
根据本发明的一个方面,提供了编码细胞靶向抗体和异源性酶的基因构建体从而用作哺乳动物宿主中的药物,其中的基因构建体能够表达抗体和酶作为哺乳动物宿主靶细胞中的缀合物且其中的缀合物可离开细胞然后选择性定位于由该抗体所识别的细胞表面抗原。
根据本发明的另一方面,提供了编码细胞靶向部分和异源前体药物活化酶的基因构建体从而用作哺乳动物宿主中的药物,其中的基因构建体能够表达细胞靶向部分和异源前体药物活化酶作为哺乳动物宿主细胞内的缀合物并且其中的缀合物定向离开此细胞然后选择性定位于由该细胞靶向部分所识别的细胞表面抗原。
“细胞靶向部分”定义为通过识别细胞表面抗原而选择性结合到宿主中特定细胞类型上的任何多肽或其片段。优选此细胞靶向部分为抗体。除抗体以外的细胞靶向部分包括配体如在国际专利申请WO97/26918(癌症研究运动技术有限公司)中所述的用于配体介导的酶前体药物治疗中的那些配体,例如表皮生长因子、heregulin、c-erdB2和血管内皮生长因子,其中以后者为优选的。
“细胞靶向抗体”定义为通过识别细胞表面抗原而选择性结合到宿主中特定细胞类型上的抗体或其片段。优选的细胞靶向抗体为实体瘤特异性抗体,更为优选为直肠结肠癌特异性抗体,更为优选为抗-CEA抗体,更为优选为抗体A5B7或806.077抗体,其中以806.077抗体为尤其优选的抗体。杂交瘤806.077抗体根据布达佩斯条约以许可号96022936于1996年2月29日保藏于欧洲动物细胞保藏中心(ECACC),PHLS应用微生物及研究中心,Porton Down,Salisbury,Wiltshire  SP4 OJG,英国。
抗体A5B7结合人癌胚抗原(CEA)并特别适用于靶向直肠结肠癌。A5B7可获自DAKO有限公司,16 Manor Courtyard,HughendenAvenue,High Wycombe,Bucks  HP13 5RE,英国。一般地,该抗体(或抗体片段)-酶缀合物应该至少为二价的,那即是说能够结合至少2种肿瘤相关抗原(可相同或不同)。可通过已知的方法将抗体分子人源化如通过EP239400中公开的“CDR嫁接”或通过US 4816567中所述将例如来自鼠抗体的完整可变区嫁接到人恒定区上(“嵌合抗体”)。人源化抗体对于减少抗体(或抗体片段)的免疫原性可能是有用的。抗体A5B7的人源化版本已公开于国际专利申请WO 92/01059(Celltech)中。
产生单克隆抗体A5B7的杂交瘤保藏于欧洲动物细胞保藏中心,生物部,PHLS应用微生物及研究中心,Porton Down,Salisbury,Wiltshire SP4 OJG,英国。保藏日期为1993年7月14日且许可号为No.93071411。用本领域已知的标准技术如Fenge C,Fraune E &Schuegerl K在“来自培养动物细胞生物制品的制备”(Spier RE,Griffiths JR & Meignier B,编)Butterworth-Heinemann,1991,262-265中所述的技术及Anderson BL & Gruenberg ML在“商业制备单克隆抗体”(Seaver S.编)中所述技术可从保藏的杂交瘤中获取抗体A5B7。
为了维持高水平抗体的产生,这些细胞可能需要通过有限稀释不时地重新克隆。
“异源酶”定义为用于转换已施用至宿主中底物的酶并且该酶天然不存在于宿主中的有关区域。该酶对于哺乳动物宿主也许是外源性的(如,细菌酶如CPG2)或者其可能天然不出现于有关的宿主部分中(例如,用溶菌酶作为ADEPT酶(为了解释ADEPT,见下面)是可能的因为溶菌酶天然不出现于循环中,见US 5433955,Akzo NK)。有关的宿主部分指其中分布有底物的哺乳动物宿主的部分。优选的酶为适于ADEPT或AMIRACS(在癌症病灶中通过失活营救剂的抗代谢物;见Bagshawe(1994),细胞生物物理24/25,83-91)的酶组ADEPT酶为优选的。抗体导向的酶前体药物治疗(ADEPT)为已知的癌症治疗方法。ADEPT使用交联至酶上的肿瘤选择性抗体。将该缀合物施用至病人(通常静脉内施用),让其它位于肿瘤病灶并从血液和其它正常组织中清除掉。然后将该前体药物施用至病人,在此其通过(位于肿瘤病灶中的)酶而转换成杀死肿瘤细胞-细胞毒药物。
在96年7月14日公开的国际专利申请WO 96/20011中,我们提出了基于突变人酶的“反极性”ADEPT系统,与例如细菌酶相比,这些酶具有低免疫原性的优点。特定的宿主酶为人胰CPB(见例如,实施例15[D253K]人CPB &16[D253R]人CPB)及其前体药物(见其中的实施例18及19)。将宿主酶突变从而得到与天然宿主酶相比就底物识别而言酶与前体药物间相互作用方式的改变。在我们随后的国际专利申请No PCT/GB 96/01975(97年3月6日公开为WO 97/07796)中描述了用于ADEPT的突变CPB酶/前体药物组合的进一步工件。适于ADEPT的优选酶为任何一种CPG2或反极性的CPB酶,例如任一种[D253K]HCPB,[G251T,D253K]HCPB或[A248S,G251T,D253K]HCPB。优选的CPG2形式为其中的多肽糖基化位点受到突变从而在哺乳动物细胞中表达时防止或减少糖基化的多肽(见,WO 96/03515,癌症研究运动技术中心);这得到改良的酶活性。进一步的考虑来自这样的酶如需要原区域(Pre-domain)促进正确折叠的CPB;这里原区域或者可单独(反式)表达或者作为融合蛋白的一部分而表达且然后去除。
Sherwood等(1985)在欧洲生化杂志.,148,447-453中描述了从假单胞菌RS-16中大规模纯化CPG2。CPG2可获自应用微生物学及研究中心,Rorton Down,Salisbury,Wiltshire SP4 OJG,英国。CPG2也可通过重组技术获得。CPG2的核苷酸序列编码已由Minton.,N.P等.,在基因,31(1984),31-38中公开。已报导在大肠杆菌(Chambers,S.P.等.,应用微生物学,生物技术.(1988),29,572-578)和酵母(Clarke,L.E.等.,J Gen Microbiol,(1985)131,897-904)中此编码序列的表达。全基因合成已由M.Edwards在动物生物技术实验室(1987),5,38-44中描述过。异源蛋白在大肠杆菌中的表达已由F.A.O.Marston在DNA克隆第III卷,实践方法系列,(IRL出版社(编者D M Glover),1987,59-88)中综述过。酵母中蛋白的表达已由C.Guthrie和G R Fink编的酶学方法194卷,(学术出版社,1991)中综述过。
只要靶抗原可被筛选并且适当的酶/前体药物组合可以制备、当进行癌症治疗方法时本发明也可应用于其它治疗领域。例如,炎症疾病如类风湿性关节炎可通过例如用对滑液细胞选择性的并融合至能够将前体药物形式的抗炎症药物转换为抗炎症药物酶上的抗体加以治疗,用抗体靶向类风湿性关节炎疾病已由Blakey等,1988,Scand在类风湿病学杂志、增刊、76,279-287中描述过。
抗体与酶之间的“缀合物”可为融合蛋白(共价键)或者此缀合物可通过抗体与原位形成的酶之间的非共价结合而形成、优选该缀合物为融合蛋白的形式,更为优选融合的抗体部分至少为二价的(用于与一价抗体相比改进的结合活性)。缺乏Fc部分的抗体构建体。尤其是Fab或F(ab′)2片段是优选的。对于CPG2融合(或与任何非单体酶的融合),特定的考虑适用因为CPG2为二聚体酶并且该抗体优选为二价的因此存在2种分子间不必要竟争二聚化的可能。因此,优选的CPG2融合为这样的融合,即其中的融合蛋白通过连接抗体Fab重链的C末端(即缺乏铰链区)至CPG2分子的N-末端而形成;然后这些Fab-CPG2分子中的2个通过CPG2二聚化区域而二聚化从而形成(Fab-CPG)2缀合物。对于具有单体酶的抗体构建体,F(ab′)2片段,尤其是具有人IgG3铰链区的F(ab′)2片段是优选的。抗体与酶之间的融合可任选通过短肽接头例如(G4S)3来完成。优选的融合构建体为其中的酶经其重链或轻链融合到此抗体C-末端的那些酶,其中以经抗体重链的融合为优选的。因此,优选的基因构建体为用作这里所述药物的基因构建体,其中的抗体-酶CPG2缀合物为其中的酶经其重链或轻链融合至抗体C-末端的融合蛋白,由此为表达时,编码缀合物的二聚化通过CPG2上的二聚化区域发生。更为优选的基因构建体为用作药物的这样的基因构建体,其中的融合蛋白经过连接抗体Fab重链的C-末端至CPG2分子的N-末端上以形成Fab-CPG2而形成,由此,当表达时2个Fab-CPG2分子经CPG2而二聚化从而形成(Fab-CPG2)2缀合物。在本发明的另一实施方案中,用作药物的优选基因构建体为这样的构建体,其中的羧肽酶选自[D253K]HCPB,[G251T,D253K]HCPB或[A248S,G251T,D253K]HCPB。
应当注意到如果获得单体形成的天然多聚体酶而同时基本上维持酶活性是可能的,那么单体形式的酶可用于形成本发明的缀合物。类似地,应当注意到如果获得多聚体形式的天然单体酶而同时基本上维持酶活性是可能的,那么多聚体形式的酶可用于形成本发明缀合物。
此缀合物在此表达后注定要通过用分泌引导序列而离开此细胞,当该缀合物穿过细胞膜时被切割掉。优选此分泌引导区为抗体天然存在的分泌引导区。
根据本发明的另一方面,提供了用编码细胞靶向抗体和异源酶的基因构建体制备用于哺乳动物宿主中癌症治疗的药物,其中的基因构建体能够表达抗体和酶作为哺乳动物宿主靶细胞中的缀合物,并且其中的缀合物可离开细胞然后选择性定位于由该抗体所识别的细胞表面抗原。
任何适当的运载系统可应用于运载本发明的基因构建体,包括病毒和非病毒系统,病毒系统包括反转录病毒载体、腺病毒载体、腺伴随病毒、牛痘、单纯疱疹病毒、HIV、小鼠微小病毒、乙型肝炎病毒和流感病毒。非病毒系统包括非复合DNA、DNA-脂质体复合体、DNA-蛋白复合体和DNA-包被的金颗粒。
反转录病毒载体缺乏免疫原性蛋白并且没有预先存在的宿主免疫性但限于感染正在分裂的细胞。反转录病毒已用于临床试验(Rosenberg等.,N.Engl.J.Med.,1990,323:570-578)。反转录病毒由包裹于源自宿主细胞膜包括中的RNA基因组和病毒蛋白所组成。为了基因表达,其必需首先反转录其正链RNA基因组成双链DNA,然后用反转录病毒颗粒中包含的反转录酶和整合酶蛋白将其整合入宿主细胞的DNA中。整合的原病毒能够用宿主细胞装置进行基因表达。
鼠的血病病毒受到广泛使用(Miller等.,酶学方法.,1993,217:581-599)。通过去除gag、pol和env基因从而为有关的有效负载腾出空间并排除该病毒的复制功能而构建反转录病毒载体。去除毒性编码的mRNAs并且此去除了对转导细胞的任何潜在的免疫应答。常包括编码抗生素抗性的基因作为筛选的手段。例如也可包括启动子和增强子功能以在体内施用后提供组织特异性表达。在长末端重复中含有的启动子与增强子功能也可使用。
这些病毒仅可在病毒包装细胞系中产生。包装细胞系可通过以下方式加以构建,即稳定插入缺失的病毒基因(gag、pol和env)至细胞中从而他们位于不同的染色体上以防止重组。包装细胞系用于通过插入重组原病毒DNA构建发生细胞系,这将产生含有有关有效负荷基因的复制缺陷的逆转录病毒。用标准的用于DNA转移和摄入的技术(电穿孔、钙沉淀等)将含有壳体化序列和目的基因的在小部分gag基因两侧含有长末端重复序列的质粒DNA转染入包装细胞系。已经利用该方法的变异体降低产生复制活性病毒的可能性(Jolly,D.,癌症基因治疗,1994,1,51-64)。此病毒的宿主细胞范围通过包被基因(env)加以测定并且具有不同细胞特异性的env基因的替代可以利用。掺入适当的配体至包被蛋白中也可用于靶向。
施用可通过任何适当的技术完成,如通过直接注射病毒至组织中而体外转导患者细胞和通过施用反转录病毒生产者细胞。
体外方法的缺点在于其要求在患者细胞的组织培养物中分离和维持,但其具有这样的优势,即基因转换的程度可容易地定量并且可靶向特定的细胞类群。此外,可达到高比例的病毒颗粒对靶细胞的比例且因此提高转导效率(Anderson等.,人类基因治疗.,1990,1:331-341;Rosenberg等.,N.Engl.J.Med.,1990,323:570-578;Culver等.,人类基因治疗.,1991,2:107-109,Nienhuis等.,癌症,1991,67:2700-2704,Anderson等.,人类基因治疗.,1990,1:331-341,Grossman等.,Nat.Genet.,1994,6:335-341,Lotze等.,人类基因治疗,1992,3:167-177;Lotze,M.T.,细胞移植,1993,2:33-41;Lotze等,人类基因治疗.,1994,5:41-55和美国专利5399346(Anderson)。在有些情况下直接在体内导入病毒是必需的。反转录病毒已用于治疗脑瘤,其中的反转录病毒仅感染正在分裂的细胞(肿瘤细胞)的能力可能是优别优越的。
为了增加效率,Oldfield等在人类基因治疗1993,4:39-69中提出将反转录病毒生产者细胞系直接施用至患者脑瘤中。鼠生产者细胞将在脑瘤中存活一些天,并将分泌能够转录周围脑瘤的反转录病毒。带有疱疹病毒胸苷激酶基因的病毒使细胞对丙氧鸟苷的杀伤易感,该化合物被胸苷激酶代谢成细胞毒性化合物。反转录病毒的专利参考为:EP334301,WO 91/02805及WO 92/05266(Viagene)和;US 4650764(威斯康星大学)。
人腺病毒感染已被描述过(见Horwitz,M.S.,病毒学,第2版.Raven出版社,纽约,1990,pp.1723-1740)。大多数成年人以前曾暴露于腺病毒并且具有抗腺病毒抗体。这些病毒具有双链DNA基因组,并且不随宿主细胞分裂而复制。
腺病毒载体具有优越的特性。它们能够转导广泛的人组织并且可在正在分裂与非正在分裂细胞中获得高水平的基因表达。多种施用途径可以使用,包括静脉内、胆管内、腹膜内、囊泡内(intravesicular)、颅内和椎管内注射,和直接进行靶器官注射。因此,基于解剖边界的靶向是易行的。
腺病毒基因组编码大约15种蛋白并且感染包括纤维蛋白结合至细胞表面受体。病毒衣壳的五邻体基涉及细胞表面上的整合素受体区域(α3β3,或β3β5)从而导致此病毒的内化。病毒DNA进入细胞核并开始转录而无细胞分裂。表达与复制在E1A和E1B基因控制之下(见Horwitz,M.S.,病毒学,第2版,1990,pp.1723-1740)。去除E1基因使病毒复制失活。腺病毒蛋白的表达同时导致可能限制效应特别是对重复施用的限制效应的免疫应答。然而,最近的方法(其中的其它腺病毒基因如E2a基因(其控制纤维柄及许多其它病毒蛋白的表达)也从病毒基因组中去除)可去除或大大降低许多种这些病毒蛋白在靶细胞中的表达。
腺病毒血清型2和5已广泛用于载体构建。Bett等.,美国自然科学院院报,1994,91:8802-8806使用了缺乏E1和E3腺病毒基因的腺病毒血清型5载体系统。293人胚肾细胞系已被加工成表达E1蛋白并可因此反式互补E1-缺陷性的病毒基因组。此病毒可从293细胞培养基中分离并通过有限稀释噬斑分析加以纯化(Graham,F.L.和Prevek,L.分子生物学方法:基因转移和表达方法,Humana出版社,1991,pp.109-128)。重组病毒可在293细胞系培养物中培养并通过裂解感染细胞和氯化铯密度梯度离心纯化而分离。293细胞制备重组病毒的一个困难是由于E1基因额外的侧翼区,它们在病毒颗粒产生过程中可能产生复制感受态的腺病毒(RCA)。尽管此材料仅为野生型腺病毒并且为非复制活性、但其对所需腺病毒材料终产量具有明显影响并导致制备成本增加、制备过程中的质量控制问题及为了临床使用的批量接受问题。已开发出别的细胞系如PER.C6,其较293细胞系具有更为有限的E1基因(即含有不位于病毒序列两侧的序列),这将不允许有产生RCA的重组事件且因此具有克服上述病毒产生问题的可能。
由于免疫系统清除和靶细胞分裂过程中的稀释丧失,腺病毒载体具有相对较短时间转基因表达的缺点但载体设计的改进又是所预期的。腺病毒的专利参考有:WO 96/03517(Boehringer),WO 96/13596(Rhone Poulenc Rorer);WO 95/29993(密西根大学)和;WO96/24969(Canji)。Bilbao等在Exp.Opin.Ther.Patents,1997,7(12):1427-1446中综述了腺病毒载体用于癌症基因治疗的最新进展,包括开发降低免疫原性的策略。嵌合腺病毒/反转录病毒载体和有条件(或限制的)复制重组腺病毒系统。
腺伴随病毒(AAV)(Kotin,R.M.,人类基因治疗.,1994,5:793-801)为能够整合入很宽宿主范围的非分裂细胞基因组中的单链DNA非自主复制的细小病毒。AAV没有显示出与人类疾病相关并不诱发免疫应答。
AAV具有2种不同的生活周期时相。野生型病毒将感染宿主细胞,整合并保持潜伏状态。在腺病毒存在下,病毒的裂解相受到诱导,其依赖于早期腺病毒基因的表达,并导致活性病毒的复制。AAV基因组由2个开放阅读框(称为rep和cap)所组成,此阅读框两侧为末端反向重复(ITR)序列。rep区域编码四种蛋白,其介导AAV复制、病毒DNA转录和用于宿主基因组整合的核酸内切酶功能。rep基因为病毒复制所需的唯一AAV序列。cap序列编码形成病毒衣壳的结构蛋白。ITRs含有病毒复制起点、提供衣壳化信号、和参与病毒DNA整合。已开发用于基因治疗的重组、复制缺陷型病毒缺乏rep和cap序列。复制缺陷的AAV可通过将AAV复制必需的分离的元件共转染入许可的293细胞系而加以制备。有关AAV的专利参考包括:WO 94/13788(匹兹堡大学)和US 4797368(美国卫生部)。
来自痘病毒的基因治疗载体已经描述过(Moss,B.和Flexner,C.,免疫学年鉴.,1987,5:305-324;Moss,B.,病毒学,1990,pp.2079-2111)。牛痘为大型的在感染细胞的胞浆中复制的包被的DNA病毒。感染来自许多不同组织的非正在分裂和正在分裂细胞,并观察未整合基因组的基因表达。重组病毒可通过将转基因插入来源于牛痘的质粒中并且将此DNA转染入牛痘感染的细胞中而制备,其中的同源重组导致病毒产生。明显的缺点是其诱发对150到200种病毒编码的蛋白的宿主免疫应答,导致重复施用困难。
单纯疱疹病毒为适于基因转移的在感染细胞的细胞核中复制的大型双链DNA病毒(见Kennedy,P.G.E和Steiner,I.,Q.J.Med.,1993,86:697-702)。代替包括广泛的宿主细胞范围,感染正在分裂和非正在分裂的细胞,并且大的外源DNA序列可通过同源重组插入病毒基因组中。缺点是难以去除病毒制品中复制活性的病毒和潜在的免疫应答。病毒胸苷激酶基因的缺失使病毒在具有低水平胸苷激酶的细胞中复制缺失。正在进行活性细胞分裂的细胞(如,肿瘤细胞)具有足够的胸苷激酶活从而产生复制。Cantab药丁有一项有关疱疹病毒的公开的专利申请(WO 92/05263)。
许多种其它病毒,包括HIV、小鼠细小病毒、乙型肝炎病毒和流感病毒被认为是用于基因转移的可能载体(见Jolly,D.,癌症基因治疗,1994,1:51-64)。
也已提出用特异性靶向和复制于低氧环境(如肿瘤坏死中心中所见的环境)中的减毒伤害沙门氏菌作为基于前体药物酶治疗(称为TAPETTM的肿瘤扩增的前体药物酶治疗)的基因转换载体并正由Vion药丁开发之中。此系统为下述的病毒和非病毒转移方法提供了进一步的基因转移方案。
非病毒DNA转移策略也是可用的。这些DNA转移系统包括未复合的质粒DNA、DNA-脂质体复合体、DNA-蛋白复合体,和DNA包被的金颗粒。
纯化的核酸可直接注射入组织并导致例如肌肉组织中暂时的基因表达,这对再生肌肉尤为有效(Wolff等,科学1990,247:1465-1468)。Davis等.,在人类基因治疗.,(1993,4:733-740)中公开了直接将DNA注射入成熟肌肉中。骨骼肌和心肌一般是优选的。专利参考有:WO 90/11092,US 5589466(Vical)和WO 97/05185(用于注射的生物可降解DNA浸渗的水凝胶,Focal)。
金颗粒上的质粒DNA可用基因枪“打”入细胞(如.,表皮或黑素瘤)。将DNA共沉淀于金颗粒上且然后用电火花或高压气体作为推力打入(Fynen等.,美国自然科学院院报,1993,90:11478-11482)。通过用利用多-针排列的电穿孔探针和脉冲旋转电场,电穿孔也用于使DNA能够转移入实体瘤中(Nishi等,癌症研究.,1996,56:1050-1055)。已要求保护向皮下肿瘤的高效基因转换,其与肿瘤内注射方法相比具有显著的细胞转染增强功能和更好的分布特征。
脂质体通过用疏水分子环绕亲水分子以利于细胞进入而发挥作用。脂质体是由脂类所构成的单层或多层球体。脂类的组成和制备方法影响脂质体结构。其它分子可掺入脂膜。脂质体可为阴离子或阴离型。Nicolau等.,美国自然科学院院报.,1983,80:1068-1072公开了由注射入大鼠中的阴离子脂质体进行胰岛素的表达。除非另有靶向,否则阴离子脂质体主要靶向肝脏的网状内皮细胞。分子可掺入脂质体的表面以改变其行为,例如细胞选择性转换(Wu G.Y.和Wu,C.H.生物化学杂志.,1987,262:4429-4432)。
Felgner等.,美国自然科学院院报,1987,84:7413-7417公开了阳离子脂质体、证明其通过静电相互作用而结合核酸并显示出细胞进入当注射于至器官的流入血流中时,静脉内注射阳离子脂质体导致大多数器官的转基因表达。可通过气溶胶施用阳离子脂质体以靶向肺上皮(Brigham等.,美国医学杂志.,1989,289:278-281)。脂质体的专利参考为:WO 90/11092、WO 91/17424、WO 91/16024、WO 93/14788(Vical)和;WO 90/01543(Intracel)。
用阳离子脂质体转基因转移的体内研究已在下面文献中发表:包括Nabel等.,人类基因治疗综述.,1994,5:79-92;Hyde等.,自然,1993,362:250-255和;Conary等.,临床研究杂志.,1994,93:1834-1840)。
正在研究微粒作为转移DNA至吞噬细胞的系统,这种方法已由Pangaea药丁在其ENDOSHERETM微囊化转移系统中应用过,该系统已用于更为有效地转录吞噬细胞如摄入微球体的巨噬细胞。微球体将编码强免疫原性肽的质粒DNA,这些肽表达时通过细胞表面上的MHC分子导致肽显示,这可刺激抗这些肽和含有相同表位蛋白序列的免疫应答。该方法目前旨在抗肿瘤和病原体疫苗开发中的潜在作用但可能具有其它可能的基因治疗应用。
用与合成聚合物相同的方式包装DNA,该方法用于包装能够均一自我装配成病毒样颗粒(VLPs)的DNA天然病毒外壳蛋白。人多形瘤病毒的主要结构外壳蛋白的VP1可作为重组蛋白表达并且能够在自我装配过程中将质粒DNA包装进入VLP。得到的颗粒可随后用于转导各种细胞系,而预先研究显示对此基于VP1的VLPs很少有免疫原性应答。这些系统可提供合成聚合物非病毒载体和别的病毒转移系统之间的具有重要意义的中间体因为它们可提供组合优势如制备的简单性和高水平的转导效率。
为了提高基因转移的特异性和治疗基因的表达,已经单独和与许多先前描述的转移系统一起研究将靶元件包括进转移载体和调节表达元件的使用。
也已经制备了DNA载体中的一些改进并且有可能适用于所有的非病毒转移系统。这些包括由RPR Gencell报导的超螺旋小环(既无细菌的复制起点又无抗生素抗性基因且因此尽管其表现出高水平的生物污染物但相当安全)、由Copernicus Gene Systems Inc开发的附加型表达载体(复制附加型表达系统,其中的质粒在细胞核内染色体外扩增并因此避免了整合事件)和由Progenitor开发的T7系统(严格的细胞质表达载体,其中的载体本身用第一启动子产生的聚合酶表达噬菌体T7 RNA聚合酶且治疗基因由第二个T7启动子所驱动)。对DNA载体技术的其它更为一般的改进包括用顺式作用元件达到高水平的表达(Vical)、源自alphoid重复DNA的序列提供每细胞周期一次的复制和核靶向序列(来自EBNA-1基因(Calos于Stanford,用Megabios);SV40早期启动子/增强子或附着于DNA上的肽序列)。
基于通过连接到DNA上配体的细胞受体识别的靶向系统已由Michacl,S.I.和Curiel,D.T.,在基因治疗,1994,1:223-232中描述过。用该受体识别的配体,此DNA变得选择性结合并内在入靶细胞中(Wu G.Y.和Wu,C.H.生物化学杂志.,1987,262:4429-4432)。聚L-赖氨酸(PLL),一种聚阳离子,已用于通过化学交联方法偶联多种蛋白配体至DNA。靶向系统已由下列文献中发表,包括Zenke等.,美国自然科学院院报.,1990,87,3655-3659,使用转铁蛋白受体;Wu G.Y.和Wu,C.H.生物化学杂志.,1987,262:4429-4432,使用脱唾液酸血清类粘蛋白的受体和Batra等.,基因治疗,1994,1:255-260,用细胞表面碳水化合物。试剂如氯奎或共同定位的腺病毒可用于减少溶酶体中DNA的降解(见Fisher,K.J.和Wilson,J.M.,生化杂志.,1994,299,49-58)。Cristiano等(美国自然科学院院报.,1993,90:11548-11552)构建了腺病毒-DNA-配体复合体。有关受体介导的内容作用的专利参考为:WO 92/05250(脱噬液酸糖蛋白,康涅狄格大学)和US 5354844(转铁蛋白受体,Boehringer)。
DNA和配体可包被于腺病毒的表面以创建包被的腺病毒(Fisher,K.J.和Wilson,J.M.,生化杂志.,1994,299,49-58)。然而,用于DNA进入的2种受体途径(配体受体和腺病毒受体)的存在降低了此转移系统的特异性,但腺病毒受体途径可用抗腺病毒纤维蛋白的抗体作为连接至DNA上的手段而排除(Michael,S.I.和Curiel,D.T.,在基因治疗,1994,1:223-232)。用纯化的内体裂解(endosomalytic)蛋白而不是完整的腺病毒颗粒是另一种选择(Seth,P.,病毒学杂志.,1994,68:1204-1206)。
本发明基因构建体在其靶位点的表达优选在转录调节序列(TRS)的控制下。TRS为任选与增强子和/或控制元件组合的启动子如下述的遗传开关。
TRS的一个实例为这样的“遗传开关”,其一旦被转移入靶细胞中可用于控制本发明基因构建体的表达。用原核调节元件控制更高等真核细胞中的基因表达(为本发明优选的)已由Gossen等在TIBS,1993年12月18日,471-475中综述过。适当的系统包括大肠杆菌lac操纵子且特别优选为大肠杆菌四环素抗性启动子。四环素系统的文献包括Gossen等(1995)科学268,1766;Damke等(1995),酶学方法257,学术出版社;Yin等(1996)生化年鉴235,195和;专利US5464758、US 558 9362、WO 96/01313和WO 94/29442(Bujard)。基于蜕皮激素的开关(国际专利申请No.PCT/GB 96/01195,公开号WO 96/37609,Zeneca)为别一种选择。其它选择方案如下。ConnaughtLaboratories(WO-93/20218)描述了一种合成可诱导的真核启动子,其包括至少2种不同类的可诱导元件。Rhone-Poulenc Rorer(WO96/30512)描述了有关四环素应用于有条件的基因表达系统。Ariad(WO 94/18317)描述了一种已显示其体内活性的基于蛋白二聚化的系统。Baylor医学院的Bert O′Melley(WO 93/2343、US 5364791、WO 97/10337)描述了基于用修饰的类固醇受体的分子开关。白头研究所具有NF-κB可诱导的基因表达系统(WO 88/05083)。BatelleMemorial描述了应激可诱导的启动子(欧洲专利EP 263908)。
不依赖于细胞类型的TRS实例包括如下内容:巨细胞病毒启动子/增强子、SV40启动子/增强子和反转录病毒长末端重复启动子/增强子。依赖于细胞类型(以达到额外靶向程度)的TRS的实例包括以下启动子:用于靶向直肠结肠、肺和乳腺的癌胚抗原(CEA);用于靶向转化肝细胞的α-甲胎蛋白(AFP);用于靶向成神经细胞瘤的酪氨酸羟化酶、乙酰胆碱转移酶或神经元特异性的烯醇化酶;用于靶向胰脏的胰岛素和;用于靶向胶质母细胞瘤的胶质纤维酸性蛋白。也可使用一些在有些肿瘤中选择性表达的癌基因,如乳腺中的HER-2(neu或c-erbB2和神经母细胞瘤中的N-myc。
因此,用作药物的优选基因构建体为包括转录调节序列的构建体,此调节序列包括为控制此基因构建体表达遗传开关的启动子和控制元件。优选的遗传开关控制元件受四环素或蜕皮素存在的调节。优选的启动子依赖于细胞类型并且选自下面的启动子:癌胚抗原(CEA);α-甲胎蛋白(AFP);酪氨酸羟化酶;乙酰胆碱转移酶;神经元特异性烯醇化酶;胰岛素;胶质纤维酸性蛋白;HER-2/neu;c-erbB2;和N-myc。优选用作这里所述药物的基因构建体包装于腺病毒中从而转移至哺乳动物宿主中。靶向基因治疗的一般综述列于Douglas等.,肿瘤靶向,1995,1:67-84。
由本发明基因构建体编码的抗体可为任何形式的抗体构建体如F(ab′)2;F(ab′)、Fab、Fv、单链FV及V-min。应考虑任何适当的抗体构建体,例如新近描述的抗体片段为“L-F(ab)2”由Zapata(1995)在蛋白质工程,8,1057-1062中所述。也应考虑二硫链结合的Fvs。对于基于CPG2酶的构建体,经过酶二聚化而二聚化的Fab片段构建体是优选的。非-人抗体可人化而用于人类以降低宿主免疫反应。人化抗体、相关片段或抗体结合结构为主要由来源于人免疫球蛋白序列的结构框架所组成,其中的免疫球蛋白序列支持抗原结合位点(互补决定区或CDRs)内或周围的非来源于人的氨基酸序列。例如,在WO 91/09967、EP 0328404和Queen等.,美国自然科学院院报86,10029,Mountain和Adair(1989)生物技术与遗传工程综述10,1(1992)中已详述过适当的方法学,尽管也可考虑其它的人化方法如抗体表面残基的镶嵌(veneering)(EP 519596,Merck/NIH,Padlan等)。
根据本发明的另一方面,提供了设计用于哺乳动物宿主中匹配的2种组分系统,其中的组分包括:(i)包括编码细胞靶向抗体和异源前体药物活化酶基因构建体的第一种成分,其中的基因构建体能够表达抗体和酶作为哺乳动物宿主靶细胞中的缀合物并且其中的缀合物可离开此细胞然后选择性定位于由该抗体所识别的细胞表面抗原和;(ii)包括可由酶转换成活性药物的前体药物的第2种成分。
抗体导向的酶前体药物疗法(ADEPT)为已知的癌症治疗方法。ADEPT使用交联至酶上的肿瘤选择性抗体。将此缀合物施用至患者(通常静脉内施用),使其定位于肿瘤病灶并从血液和其它正常组织下清除。然后将前体药物施用至患者,由此酶(位于肿瘤病灶)将其转换成杀死肿瘤细胞的细胞毒性药物。
本发明可应用至任何的ADEPT系统。ADEPT系统适当的实例包括基于任何下面的酶的那些系统:羧肽酶G2;羧肽酶A;氨肽酶;碱性磷酸酶;糖苷酶;β-葡萄醛酸酶;青霉素酰胺酶;β-内酰胺酶;半胱氨酸脱氨酶;硝基还原酶;或突变的宿主酶包括羰肽酶A、羧肽酶B和核糖核酸酶。关于ADEPT系统的适当文献包括MeltonRG(1996),国立癌症研究院院报88,1;Niculescu-Duvaz I(1995),当今药物化学2,687;Knox RJ(1995)临床免疫治疗,3,136;WO 88/07378(RCT);Blackey等.,癌症研究,56,3287-92,1996;US 5587161(CRCT和Zeneca);WO 97/07769(Zeneca);和WO95/13095(Wellcome)。此异源酶可以为催化抗体的形式;参见例如EP 745673(Zeneca)。有关ADEPT系统的综述文章包括Hay &Denny(1996),未来药物,21(9),917-931和Blakey(1997),Exp.Opin.Ther.Patents,7(9),965-977。
优选匹配的2种组分系统为这样的系统:其中的第一种组分包括编码异源酶CPG2的基因;且第二种组分的前体药物选自N-(4-[N,N-双(2-碘乙基)氨基]苯氧羰基)-L-谷氨酸,N-(4-[N,N-双(2-氯乙基)氨基]-苯氧羰基)-L-谷氨酸-γ-(3,5-二羧基)酰基苯胺或N-(4-[N,N-双(2-氯乙基)氨基]-苯氧羰基)-L-谷氨酸或其药物上可接受的盐。使用CPG2的优选前体药物描述于下面的来自Zeneca有限公司和癌症研究运动技术有限公司的美国专利:US 5714148,US 5405990、5587161 & 5660829。
在本发明的另一方面中,提供了用于转移细胞毒性药物至病灶的方法,包括将包括这里所述的基因构建体的第一种组分施用至宿主;然后给宿主施用第二种组分,该组分包括可由第一种组分编码的异源酶转换成细胞毒性药物的前体药物的第二种组分。转移细胞毒性药物至病灶的优选方法为这样的方法、其中的第一种组分包括编码异源酶CPG2的基因;并且第二种组分前体药物选自N-(4-[N,N-双(2-碘乙基)氨基]苯氧羰基)-L-谷氨酸,N-(4-[N,N-双(2-氯乙基)氨基]-苯氧羰基)-L-谷氨酸-γ-(3,5-二羧基)酰基苯胺或N-(4-[N,N-双(2-氯乙基)氨基]-苯氧羰基)-L-谷氨酸或其药物上可接受的盐。
在此使用的简称包括:AAV         腺伴随病毒ADEPT       抗体导向的酶前体药物疗法AFP         α-甲胎蛋白AMIRACS     在癌症病灶具有挽救剂失活的抗代谢物APS         过硫酸铵b.p.        碱基对BPB         溴酚蓝CDRs        互补决定区CEA         癌胚抗原CL          抗体轻链恒定区CPB         羧肽酶BCPG2        羧肽酶G2CPG2R6      被突变以防止在真核细胞中表达时糖基化的羧肽酶
        G2,见实施例1dDAB         底物3,3′-2氨基联苯胺四盐酸DEPC        焦碳酸二乙酯DMEM        Dulbecco改进的Eagle培养基ECACC       欧洲动物细胞保藏中心EIA         酶免疫分析ELISA       酶联免疫吸附分析FAS         补充的甲酰四氢叶酸FCS         胎牛血清Fd          任选含有铰链区的Fab、Fab′或F(ab′)2的重链GDEPT       基因导向的酶前体药物疗法HAMA        人抗小鼠抗体HCPB        人羧肽酶B,优选为胰脏(来源)(IgG)铰链   含有连接2条重链半胶氨酸的富含脯氨酸的短肽HRPO或HRP   辣根过氧化物酶IRES        内部核糖体进入位点MTX         氨甲喋呤MCA         非特异性交联反应抗原NCIMB       国家工业及海洋微生物保藏有限公司OPD            邻苯二胺PBS            磷酸缓冲盐溶液PCR            聚合酶链式反应PGP            N-(4-[N,N-双(2-氯乙基)氨基]-苯氧羰基)
           -L-谷氨酸preproCPB      具有N-末端前导序列的原CPBproCPB         具有其N-末端原区的CPBscFV           单链FvSDS-PAGE       十二烷基磺酸钠-聚丙烯酰胺凝胶电泳SSC            柠檬酸钠盐TBS            Tris-缓冲盐Temed          N,N,N′,N′-四甲基乙二胺TFA            三氟乙酸TRS            转录调节序列VDEPT          病毒导向的酶前体药物疗法VH             抗体重链的可变区VK             抗体轻链的可变区。
在本说明书中,应当考虑特异氨基酸序列的保守氨基酸类似物,其维持本发明组分的相关生物学特性但在序列中有一个或更多个保守氨基酸替代、缺失或添加的差异。然而,特异性列出的氨基酸序列是优选的。典型的保守氨基酸替代列表如下。原始的氨基酸          典型的取代            优选的取代Ala(A)                Val;Leu;Ile           ValArg(R)                Lys;Gln;Asn           LysAsn(N)                Gln;His;Lys;Arg      GlnAsp(D)                Glu                     GluCys(C)                Ser                     SerGln(Q)                Asn                     AsnGlu(E)                Asp                     AspGly(G)         Pro                          ProHis(H)         Asn;Gln;Lys;Arg           ArgIle(I)         Leu;Val;Met;Ala;Phe;    Leu
           正亮氨酸Leu(L)         正亮氨酸;Ile;Val;         Ile
           Met;Ala;PheLys(K)         Arg;Gln;Asn                ArgMet(M)         Leu;Phe;Ile                LeuPhe(F)         Leu;Val;Ile;Ala           LeuPro(P)         Gly                          GlySer(S)         Thr                          ThrThr(T)         Ser                          SerTrp(W)         Tyr                          TyrTyr(Y)         Trp;Phe;Thr;Ser           PheVal(V)         Ile;Leu;Met;Phe;         Leu
           Ala;正亮氨酸氨基酸命名如下。丙氨酸       Ala      A精氨酸       Arg      R天冬酰胺     Asn      N天冬氨酸     Asp      D半胱氨酸     Cys      C谷氨酸       Glu      E谷氨酰胺     Gln      Q甘氨酸       Gly      G组氨酸       His      H异亮氨酸     Ile      I亮氨酸       Leu      L赖氨酸       Lys      K甲硫氨酸     Met      M苯丙氨酸      Phe      F脯氨酸        Pro      P丝氨酸        Ser      S苏氨酸        Thr      T色氨酸        Trp      W酪氨酸        Tyr      Y缬氨酸        Val      V任何氨基酸    Xaa      X
在此说明书中,应该考虑具体核酸序列的核酸变异(缺失、替代和添加),这些变异的核酸在严格的条件下维持与这里提及特异性序列杂交的能力。严格的条件定义为6×SSC,0.1%SDS于60℃5分钟。然而,具体列出的核酸序列是优选的。应当考虑天然核酸结构的化学类似物如“肽核酸”(PNA)可能为可接受的等价物,特别是为了无需翻译蛋白的目的(Wittung(1994)自然368,561)。
本发明现将参照下面的非限定实施例加以说。温度为摄氏度。图1显示融合基因构建体的图解,该融合基因构建体包括A5B7抗体重链Fd片段,其C-末端通过弹性的(G4S)3肽接头连接至CPG2多肽的N-末端上。SS代表信号序列。L代表接头序列。CPG2/R6代表其糖基化位点经突变而失活的CPG2如文中所述。图2a显示(Fab-CPG2)2融合蛋白的图解,其中的二聚化通过2个CPG2分子间的非共价键而发生。图2b显示F(ab′)2抗体片段的图解。图3显示分泌的融合蛋白材料基于细胞的ELISA分析。仅仅CEA阳性线与增加量的加入融合蛋白具有增加的结合水平,而CEA阴性细胞线整个过程中仅具有恒定的背景结合。纵轴代表在490nm处测得的光密度读数且横轴代表以ng蛋白计量的加入融合蛋白的量。该图显示获自实验的数据,其中众多的细胞系和阴性对照(无细胞)用实施例6中所述的细胞分析方法与增加量的融合蛋白孵育。结果显示仅仅LoVo(CEA阳性)细胞系显示出相应于增加量加入融合蛋白的增加的OD490读数。所有其它的细胞系(CEA阴性)和对照(无细胞)仅仅显示出不随融合蛋白加入而增加的背景OD490nm读数。这些结果提供这样的证据,即该融合蛋白材料特异性地以剂量依赖性的方式结合CEA阳性细胞系并且不结合CEA阴性细胞系。图4显示分泌至重组LoVo肿瘤细胞融合蛋白的保留。纵轴代表在490nm处测得的光密度读数并且横轴代表以ng/ml蛋白测得的加入抗-CEA抗体(IIE6)的量。实验用不同的细胞系按实施例7中所述进行,包括重组LoVo和Colo 320DM细胞系(其自身分泌融合蛋白)和对照不分泌融合蛋白的母本LoVo细胞系。首先,将细胞系固定,并且清洗以去除存在的上清和未结合物质,然后加入逐渐增加浓度的抗-CEA抗体(IIE6)至固定细胞中。按文中所述开发此方法以测定任何分泌材料的保留水平和是否进一步加入的抗体将增加此信号。结果显示不加入抗-CEA抗体,对照母本Lovo线仅仅显示出背景OD490nm读数(如预期的)而重组的LoVo线得到很强的OD490nm读数表明此融合蛋白物质保留于CEA阳性的LoVO细胞中。CEA阴性重组Colo 320DM较LoVo细胞得到更为微弱的读数而此信号高于背景(可能由于在早期分析方法中分泌抗体没有固定)。加入至固定细胞中的逐渐增加浓度的抗-CEA抗体(IIE6)在母本LoVo细胞的情况中显示出剂量相关的应答。因此表明它们为CEA阳性且可结合CEA结合物质(如如果存在或添加的融合蛋白)。重组的Colo320DM和Lovo细胞用逐渐增加量的抗体时在总的OD490信号中几乎没有表现出增加,除了在最高抗体剂量时表现出略微应答之外。由于重组Colo320DM为CEA阴性,故由于抗-CEA抗体没有信号增加,这些细胞的结果将是所预期的。在重组LoVo细胞的情况,由于加入此分析中抗体的量的增加信号除了最高剂量时以外由于原初信号的相对强度可能会下降。图5显示分泌至重组LoVo肿瘤细胞中融合蛋白的保留。纵轴代表适中的肿瘤体积(cm3)并且横轴代表施以前体药物后以天为单位的时间。实验用60mg/kg剂量的前体药物按实施例12中所述进行。结果显示对照GAD(c)(无前体药物处理)的肿瘤在收获肿瘤时的11天(施以剂量后的天数)长至其起始大小的6倍,前体药物处理的肿瘤GAD(d)显示出显著更慢的生长速率并且至16天(施以剂量后天数)仅达到其起始大小的3倍。此数据表明至少有11天的肿瘤生长延缓。
在下面的实施例中,除非另有说明,否则应用下面的方法学和材料。
用GENECLEANTM II试剂盒(Stratech科学有限公司或Bio 101有限公司)回收和纯化DNA。此试剂盒含有:1)6M的碘化钠;2)氯化钠的浓缩液,用于制备氯化钠/乙醇/水洗液的Tris和EDTA;3)玻璃乳(Glassmilk)。含有1.25ml在水中特异性制备硅基质的悬液。这是基于美国科学院院报(1979)76卷615页中发表的Vogelstein和Gillesole方法的DNA纯化技术。简言之,此试剂盒方法如下。向1体积的凝胶切片中加入3体积来自该试剂盒的碘化钠溶液。通过于55℃加热混和物10分钟而熔化琼脂糖且然后加入玻璃乳(5-10ml),充分混合并置于环境温度中静置10分钟,离心玻璃乳并用试剂盒的NEWWASHTM(0.5ml)清洗3次。从玻璃乳中去除清洗缓冲液并通过将玻璃乳水(5-10ml)在55℃孵育5-10分钟而洗脱DNA。离心回收含有洗脱DNA的水溶性上清。洗脱步骤可从重复并且上清可以合并。
感受态大肠杆菌DH5α获自生活技术有限公司(MAXTM效率DH5α感受态细胞)。
用Bio 101有限公司(目录号2070-400)的RPMTM DNA制备试剂盒或类似的产品小量制备双链质粒DNA-该试剂盒含有碱性裂解液从而从细菌细胞中释放质粒DNA并在旋转滤器(spinfilter)中含有玻璃乳以吸收释放的DNA,然后从pH 7.5的无菌水或10mM Tris-HCl,1mM EDTA将其洗脱。
标准的PCR反应含有100ng质粒DNA(除了特别说明的之外),5μl dNTPs(2.5mM)、5μl 10×酶缓冲液(500mM KCl,100mMTris pH 8.3)、15mM MgCl2和0.1%明胶)、1μl 25pM/μl每条引物的贮备液,0.5μl热稳定的DNA聚合酶和水以得到50μl的体积。标准的PCR条件为:94℃ 90秒;55℃ 60秒;72℃ 120秒15个PCR循环,最后一个循环以进一步72℃孵育10分钟而结束。
可从Perkin-Elmer Cetus得到的AMPLITAQTM用作热稳定的DNA聚合酶的来源。
一般的分子生物学方法可遵循“分子克隆-实验指南”第二版,Sambrook,Fritsch和Maniatis(冷却泉实验室,1989)中所述的任何方法。
无血清培养基为OPTIMEMTM I减少的血清培养基,Gibco BRL目录号31985。这是改进的以Hepes和碳酸氢钠缓冲的Eagle基本必需培养基,并补充以次黄嘌呤核苷、胸腺嘧啶脱氧核苷、丙酮酸钠、L-谷氨酰胺、痕量元素和生长因子。
LIPOFECTINTM试剂(GibcoBRL目录号18292-011)为1∶1(w/w)的滤膜过滤的水中的阳离子脂N-[1-(2,3-二油酰氧基(dioleyloxy))丙基]-n,n,n-三甲铵氯化物(DOTMA)和二油酰基磷脂酰乙醇胺(DOPE)的脂质体制剂。其自发与DNA结合以形成脂-DNA复合体-见Felgner等美国自然科学院院报(1987)84,7431。
G418(磷酸盐)为GENETICINTM,GibcoBRL目录号11811,一种用作分子遗传实验中筛选剂的与为他霉素有关的氨基糖苷类抗生素;
对于CEA ELISA,将96孔免疫板(NUNC MAXISORBTM)的每只孔以50mM pH 9.6的碳酸盐/碳酸氢盐包被缓冲液(缓冲胶囊-Sigma C3041)中的50ng CEA包被并于4℃孵育过夜。将平板以PBS-TWEENTM(PBS+0.05%TWEENTM20)洗三次然后以150μl每孔的位于PBS-TWEENTM中的1%BSA于室温封闭1小时。将平板用PBS-TWEENTM洗三次,每孔加入100μl测试样品并于室温孵育2小时。将平板从PBS-TWEENTM洗三次,将100μl每孔的HRPO-标记的羊抗人卡巴抗体(Sigma A 7164)的1/500稀释液加入PBS-TWEENTM中的1%BSA中并于室温在摇床上孵育至少1小时。将平板以PBS-TWEENTM洗三次,且然后再以PBS洗一次。为了检测结合,每孔加入100μl显影液(溶于100ml H2O中的一胶囊磷酸柠檬酸盐缓冲液-Sigma P4922,向其中加入一粒30mg的邻苯二胺二盐酸片剂-Sigma P8412)并孵育达15分钟。通过加入75μl 2M H2SO4而终止反应并于490nm处读数吸收值。
用抗CPG2报告抗体的CEA ELISA基本上与上述相同但不是用HRPO-标记的羊抗人卡巴抗体,而是加入位于PBS-TWEENTM中1%PBS中的1/1000稀释的兔抗-CPG2多克隆血清并于室温在摇床上孵育至少2小时。将平板以PBS-TWEENTM洗三次。然后加入羊-抗兔HRPO标记抗体(Sigma A-6154)的1/2000稀释液并于室温在摇床上孵育1小时,将平板以PBS-TWEENTM洗三次并以PBS洗一次。为了检测结合,每孔加入100μl显影液(溶于100ml H2O中的一胶囊磷酸盐-柠檬酸缓冲液-Sigma P4922,其中加入一个30mg邻苯二胺二盐酸片剂-Sigma P8412)并孵育达15分钟。通过加入75μl 2MH2SO4而终止反应并于490nm处读数吸收值。
按如下进行转染上清的Western印迹分析。用适当的微凝胶系统(HOEFER MIGHTY SMALLTM)制备用于分析融合蛋白转染的10%微型凝胶。10%电泳凝胶为:20ml丙烯酰胺、6ml 10×电泳凝胶缓冲液;34ml H2O;300ml 20%SDS;600μl APS;30μlTemed。电泳凝胶10x缓冲液为3.75M  pH 8.6的Tris。6%积层胶为:9ml丙烯酰胺;4.5ml 10×积层胶缓冲液;31.5ml H2O;225μl 20%的SDS;45μl 10%的APS;24μl Temed)。10x积层胶缓冲液为1.25M pH 6.8的Tris。SDS/PAGE的5×电泳缓冲液为249mMTris、799mM甘氨酸、0.6%w/v SDS(pH未调节)。
样品的制备2×Laemmli缓冲液为0.125M Tris,4% SDS;30%甘油;4M尿素;任选含有5%β-巯基乙醇的0.002% BPB。上清:25μl样品+25μl 2×Laemmli缓冲液;上样40μl。标准的F(ab′)2和CPG2:2μl 10mg/ml标准品;8μl H2O;10μl 2×Laemmli缓冲液(-巯基乙醇);上样20μl。分子量标记(AmershamRAINBOWTM):8μl样品;8μl 2×Laemmli缓冲液(+巯基乙醇):上样10μl电泳条件:30毫安直到染料前沿至凝胶底部(大约1小时)。印迹:用半干印迹仪(LKB)印迹至硝酸纤维素膜上。毫安=0.7×cm2,45分钟。封闭:用PBS-TWEENTM中5%干燥脱脂牛奶40分钟。
F(ab′)2的检测:用PBS-TWEENTM中0.5%干燥的脱脂牛奶1/2500稀释的羊抗人卡巴轻链HRPO标记的抗体。
CPG2的检测:用小鼠抗CPG2单克隆(与PBS-TWEENTM中0.5%干燥脱脂牛奶中的1/2000稀释液)孵育过夜;用羊抗小鼠卡巴轻链HRPO标记的抗体Sigma 674301-(于PBS-TWEENTM中0.5%干燥脱脂牛奶中的1/10000稀释液)孵育至少2小时。
印迹的显色:使用增强剂存在下根据鲁米诺底物(PierceSUPERSIGNALTM底物)对HRPO进行化学发光检测。按如下制备底物工作液:建议的体积:0.125ml/cm2的印迹表面。混合等体积的鲁米诺/增强剂溶液和稳定的过氧化物溶液,将印迹与工作液孵育5-10分钟,去除溶液并将印迹置于膜保护器中并对放射自显影胶片曝光(通常30秒到5分钟)。
微生物保藏:质粒pNG3-Vkss-HuCk根据布达佩斯条约以保藏号NCIMB 40798于1996年4月11日保藏于国立工业和海洋微生物保藏有限公司(NCIMB),α3 St Machar Drive,Aberdeen ABZ 1RY,Scotland,英国。质粒pNG4-VHss-HuIgG2CH1根据布达佩斯条约以保藏号NCIMB 40797于1996年4月11日保藏于国立工业和海洋微生物保藏有限公司(NCIMB),23 St Machar Drive,Aberdeen AB21RY,Scotland,英国。质粒pNG3-Vkss-HuGk-NEO根据布达佩斯条约以保藏号NCIMB 40799于1996年4月11日保藏于国立工业和海洋微生物保藏有限公司(NCIMB),23 St Machar Drive,AberdeenAB2 1RY,Scotland,英国。质料pICI266根据布达佩斯条约以许可号NCIMB 40589于1993年10月11日保藏于国立工业和海洋微生物保藏有限公司(NCIMB),St Machar Drive,Aberdeen AB2 1RY,Scotland英国。
胰蛋白酶作用(Typsinisation):将胰蛋白酶EDTA(Gibco BRL453000-019)和Hanks平衡的盐溶液(HBSS;Gibco BRL 14170-088)于37℃水浴中预温。存在的培养基从培养物中去除并以一定体积的HBSS(以前培养基体积的一半)代替并通过细心振荡平板或培养瓶从而去除含有培养基的任何残余血清而清洗细胞层。去除HBSS并加入一定体积的胰蛋白酶溶液(为原初培养基体积的四分之一),轻轻振荡培养瓶以确保细胞层被完全覆盖并静置5分钟。通过加入适当的正常培养基(2×体积的胰蛋白酶液)而失活胰蛋白酶。然后将此细胞悬液或者计数或者进一步稀释用于根据待进行的方法而继续培养。
胎牛血清(FCS)的加热灭活:将FCS(Viralex A15-651认可的批号-Non European)贮存于-20℃。为了使用,将血清于4℃完全融化4℃第二天,将此血清于37℃水浴中孵育15分钟且然后转移至56℃水浴中孵育15分钟。取出血清并在其分成50ml等份之前冷却至室温并贮存于-20℃。
常规的DMEM培养基(用Gibco BRL成分):向500ml DMEM(41966-086)中加入12.5ml Hepes(15630-056);5ml NEAA(11140-035);5ml pen/strep(10378-016);和50ml热灭活的FCS。
FAS培养基(除非另有说明,否则用Gibco BRL成分):490mlDMEM(41966-086);12.5ml Hepes(15630-056);5ml非必需氨基酸(11140-035);5ml pen/strep(10378-016);5ml维他命(11120-037);5ml基本氨基酸(51051-019);甲酰四氢叶酸(Sigma F8259)至10μg/ml的终培养基浓度;50ml加热灭活的FCS;5ml dNTP混合物;和50mg/ml的G41850贮备液(以制备适当的筛选浓度)。
dNTP混合物:将35mg G(Sigma G6264),35mg C(SigmaC4654),35mg A(Sigma A4036),35mg U (SigmaU3003),125mg T(Sigma T2895)溶解于100ml水中,过滤除菌并贮存于-20℃。
G418筛选:对于LoVo细胞(ATCC CCL 209),筛选在1.25mg/ml进行,对于HCT 116(ATCC CCL 247)细胞和Colo 320 DM(ATCCCCL 220)细胞,除非另有说明,否则筛选在1.5mg/ml进行。
BLUESCRIPTTM载体获自Stratagene克隆系统。
Tet-On基因表达载体获自Clontech(Palo Alto,加利福尼亚)目录号K1621-1。
除非另有说明或从上下文中显而易见,否则在实施例中所称的抗体-CPG2融合构建体使用突变的CPG2以防止糖基化。实施例1(A5B7 Fab-CPG2)2融合蛋白的构建
为了获得同时表现CPG2酶活性的二价人癌胚抗原(CEA)结合分子的目的而安排(A5B7 Fab-CPG2)2酶融合的构建。向其末端设计起始的构建体从而含有A5B7抗体重链Fd片段,该片段通过弹性的(G4S)3肽接头连接至CPG2多肽的N-末端(图1)。
抗体A5B7结合人癌胚抗原(CEA)并特别适用于靶向结肠癌或其它具有CEA抗原的细胞(CEA作为癌症相关抗原的重要性由Shively,J.E.和Beatty,J.D.在“癌症学/血液学中的CRC关键性综述”第2卷,p 355-399,1994中进行了综述)。CPG2酶在自然界中为天然二聚化形式,由2种连接的相同多肽亚单位所组成。此分子二聚体的每种亚单位由较大的催化结构域和形成二聚体界面的第二个较小结构域所组成。
一般地,抗体(或抗体片段)-酶缀合物或融合蛋白应该至少为二价的,即是说能够结合至少2种(可为相同或不同的)肿瘤相关抗原。在(A5B7 Fab-CPG2)2融合蛋白的情况,酶组分的二聚化与天然酶一样在表达后发生,因而形成含有2个Fab抗体片段(且因此相对于抗体结合位点而言对二价的)和2分子CPG2的酶促分子(图2a)。a)A5B7抗体基因的克隆
重组鼠A5B7 F(ab′)2抗体的制备、纯化和特征分析方法已经发表(国际专利申请,Zeneca有限公司,WO 96/2001,见这里的参考实施例5)。在参考实施例5中f部分,将A5B7抗体基因克隆入GS-SYSTEMTM(Celltech)载体中,见国际专利申请WO 87/04462,WO 89/01036,WO 86/05807和WO 89/10404,其中的A5B7 Fd克隆入pEE6并将轻链克隆入pEE12。这些载体为构建A5B7 Fab-CPG2融合蛋白的A5B7抗体基因的来源。b)嵌合A5B7载体构建体
用适当的PCR引物通过PCR从pEE6和pEE12质粒载体中扩增A5B7鼠抗体可变区,其中的PCR引物包括必需的限制位点用于以正确的框架分别将重链和轻链可变区克隆入载体pNG4-VHss-HuIgG2CHI′(NCIMB保藏号40797)和pNG3-Vkss-HuCk-NEO(NCIMB保藏号407997)中。将得到的载体命名为pNG4/A5B7VH-IgG2CHI′(A5B7嵌合重链Fd′)和pNG3/A5B7VK-HuCk-NEO(A5B7嵌合轻链)。c)CPG2基因的克隆
CPG2编码基因可获自应用微生物和研究中心,Porton Down,Salisbury,Wiltshire SP4 OJG,英国。CPG2也可通过重组技术获得。CPG2的核苷酸编码序列已由Minton,MP等在基因,(1984)31,31-38中发表。此编码序列在大肠杆菌中的表达(Chambers,S.P.等.,应用微生物,生物技术(1988),29,572-578)和在酿酒酵母中的表达(Clarke,L.E.等.,普通微生物学杂志(1985),31,897-904)已有报导。此外,CPG2基因可通过多种方法而制备成合成DNA构建体并用作进一步实验的来源。全基因合成已描述于M.Edwards美国生物技术实验室(1987),5,38-44,Jayarman等.,(1991)美国自然科学院院报88,4084-4088,Foguet和Lubbert(1992)生物技术13,674-675和Pierce(1994)生物技术16,708。
在准备克隆CPG2基因过程中,构建载体pNG3-Vkss,其为pNG3-Vkss-HuCk-NEO(NCIMB保藏号40799)的一种简单衍生物。通过以下方法构建此载体,首先用限制酶XbaI消化而去除新霉素基因(因为其含有EcoRI限制酶位点),然后分离载体片段且然后再连接以形成质粒pNG3/Vkss-HuCk。用SacII和EcoRI消化此中间载体,从而切下HuCk基因片段。然后将消化产物上样于1%的琼脂糖凝胶中并从剩余的载体中分离切下的片段,然后从凝胶中切下载体DNA并加以纯化。设计和合成2条寡核苷酸CME 00261和CME 00262(SEQ IDNO:1和2)。通过加入200pmoles每种寡核苷酸至总共30μl H2O中,加热至95℃并让此溶液缓慢冷却至30℃而将这2种寡核苷酸进行杂交。然后将100pmoles退火的DNA产品直接连接入前面制备的载体中并将连接混合物转化入大肠杆菌中。在得到的克隆中,导入此DNA“弹夹”产生一种新的多接头序列而备用于随后的CPG2基因克隆以制备载体pNG3-Vkss。
用适当的DNA寡核苷酸引物和标准的PCR反应条件通过PCR扩增编码包括氨基酸残基Q26-K415的CPG2结构基因。反应产物用1%琼脂糖凝胶进行分析,将预期大小的(大约12000bp)条带切下,纯化并于20μl H2O中进行洗脱。然后用限制酶SacII消化此物质,然后将反应液上样于1%琼脂糖凝胶中并切下预期大小(大约250bp)的条带且随后进行纯化。将此片段连接至预先以限制酶SacII消化的去磷酸化的质粒载体pNG3Vkss中,于1%的琼脂糖凝胶中电泳,将线性化的载体切下纯化并将连接混合物转化入大肠杆菌。通过用BglII和FseI进行DNA限制性分析而分析得到克隆的CPG2 SacII片段的存在与方向。通过DNA测序确证似乎具有正确大小与方向片段的克隆。此中间质粒称为pNG3-Vkss-SacIICPGfrag。将此质粒用限制酶AgeI和EcoRI消化、去磷酸化并将载体片段分离。将最初的CPG2基因PCR产物也以AgeI和EcoRI消化,分离到大约1000bp的片段,连接并转化入大肠杆菌中。通过用限制酶HindIII和EcoRI消化而分析得到克隆的全长CPG2基因(大约1200bp);对具有正确大小的插入子的克隆进行测序以确证一致性。最后,将此质粒(pNG3/Vkss-CPG2)以XbaI消化,去磷酸,分离载体片段并将XbaI新霉素基因片段(也在早期分离的大约1000bp)重新连接入质粒中并转化入大肠杆菌中。通过以XbaI和EcoRI分别消化而检查得到克隆中新霉素基因的存在与方向。将此载体命名为pNG2-Vkss-CPG2-NEO。d)CPG2 R6变异体的构建
质粒pNG3-Vkss/CPG2-NEO用作对CPG2基因进行PCR诱变的模板从而突变在天然细菌酶序列中鉴定到的3个潜在的糖基化位点。用Minton,N.P.等在基因(1984)31,31-38中发表定位计数方法在位置222(N-I-T)、264(N-W-T)和272(N-V-S)观察到推断的氨基酸糖基化位点(N-X-T/S)。3个糖基化位点的天冬酰胺残基(N)被突变成谷氨酰胺(Q)因此使此糖基化位点无效以避免完成CPG2表达或酶活性的任何糖基化位点。
其中的所有3个位点在单一反应系列中被突变的PCR诱变技术用于建立CPG2 R6基因变异体。载体pNG3/Vkss/CPG2-NEO用作三个起始PCR反应的模板。反应R1使用合成寡核苷酸序列引物CME00395并且CME 00397(SEQ ID NOS:3和4),反应2使用合成寡核苷酸序列引物CME 00395和CME 00399(SEQ ID NOS:3和5)并且反应R3使用合成寡核苷酸序列引物CME 00396和CME00400(SEQ ID NOS:6和7)。PCR反应R1与R2的产物分别含有突变的222和264+272糖基化位点,其中的R3产物为CPG2基因C-末端片段的拷贝。琼脂糖凝胶分离和纯化后,将R2和R3产物(R大约750bp;R3大约360bp)加入进一步的PCR反应中。制备不同量的产物R2和R3的混合物并用合成寡核苷酸CME 00395和CME00396(SEQ ID NOS:3和6)进行PCR反应。得到的产物R4(大约1200bps)再次用寡核苷酸CME 00398和CME 00396(SEQ IDNOS:8和6)扩增。将得到产物R5(大约600bp)加入终PCR反应中的产物P1(大约620bp)中,此PCR反应用寡核苷酸CME 00395和CME 00396(SEQ ID NOS:3和6)进行。可将现含有所有三个突变糖基化位点的得到的PCR产物R6(大约1200bp)(在用限制酶AgeI和BsrGI消化和分离得到的片段后)克隆入(预先以限制酶AgeI和BsrGI和随后分离的)载体pNG3/Vkss-CPG-2-Neo中。这在表达载体pNG3/Kvss-CPG2 R6-NEO内建立了所需的编码CPG2/R6蛋白序列(SEQ ID NO:10)的DNA。e)A5B7重链Fd-CPG2融合蛋白基因的构建
重链抗体片段和CPG2酶基因均通过PCR扩增质粒模板而获得。用引物CME 0096(SEQ ID NO:11)和CME 00969(SEQ IDNO:12)扩增质粒pNG4/A5B7VH-IgGCH′获得A5B7 Fd组分(大约300bp)并且用引物CME 00967(SEQ ID NO:13)和CME 00968(SEQ ID NO:14)扩增质粒pNG3/Vkss/CPG2 R6-NED以获得酶组分(大约1350bp)。在每种情况下上样反应产物并于1%琼脂糖凝胶上分离,切下正确产物大小的条带,随后纯化并于20μl H2O中洗脱。
进行进一步的PCR反应从而将2种纯化的PCR反应产物连接(或剪接)到一起。使用标准的PCR反应条件但每种产物量有变化(在0.5~2μl之间)且用25个循环(代替正常的15个循环)。反应产物用1%琼脂糖凝胶分析并切下预期大小(大约1650bp)的条带、纯化并于20μlH2O中洗脱。然后用限制酶NheI和BamHI消化此物质,然后回收预期大小的(大约1600bp)条带。通过以限制酶NheI和BamHI消化后将DNA去磷酸化并分离较小的NheI和BamHI片段与较大的载体带。回收载体带、纯化并随后将类似限制性消化的PCR产物连接入制备的载体中并将连接混合物转化入大肠杆菌。从得到的克隆中制备DNA且随后测序以确证此融合基因序列。发现许多克隆为正确的并将这些克隆中的一个克隆(命名为R2.8)重新命名为pNG4/A5B7VH-IgG2CH1/CPG2R6(SEQ ID NO:15和SEQ ID NO:16)。f)共转染,暂时表达
用下述的基于LIPOFECTINTM的方法将(编码抗体嵌合Fd-CPG2融合蛋白)的质粒pNG4/A5B7VH-IgGCH1/CPG2R6和(编码抗体嵌合轻链;SEQ ID NO:17和SEQ ID NO:18)的pNG3/A5B7VK-HuCk-NEO共转染入COS-7细胞。将来自亚汇合培养的COS7细胞以2×105细胞/2ml/孔种植于6孔平板中并于37℃5%CO2中培养过夜。LIPOFECTINTM无血清培养基混合物组成如下:12ml LIPOFECTINTM加上200ml无血清培养基并于室温孵育30分钟。DNA/无血清培养基混合物组成如下:4mg DNA(每种构建体2mg)加上200ml无血清培养基。然后将200ml LIPOFECTINTM/无血清培养基混合物加入到DNA混合物中并于室温孵育15分钟。然后将60ml无血清培养基加入每种样品中。用2ml无血清培养基冲洗细胞一次然后将1ml LIPOFECTINTM/DNA混合物加入细胞中并于37℃5%CO2中孵育5小时。从细胞中去除LIPOFECTINTM/DNA混合物并加入标准的培养基,然后于37℃ 5%CO2中将细胞孵育72小时。收获细胞上清。g)抗体-酶融合蛋白的分析
通过以下方法分析上清物质中抗体融合蛋白的存在,包括用抗人卡巴轻链受体抗体通过结合-CEA ELISA(测定抗体的存在),用抗-CPG2受体抗体通过结合-CEA ELISA(测定结合CEA的CPG2融合蛋白的存在),基于HPLC的CPG2酶活性分析(以测定特异的CPG2的活性)和SDS/PAGE及(用抗人卡巴轻链受体或抗CPG2报告抗体)的Western印迹以测定表面的物质。
基于HPLC的酶活性分析清晰地显示CPG2酶活性存在于细胞上清中且两种抗CEA ELISA分析表现出蛋白以相当的水平与二价A5B7抗体分子结合。用抗-CPG2报告抗体检测的抗CEA ELISA也表现出清晰的CEA结合的事实表明不仅抗体而且抗体-CPG2融合蛋结合CEA。
同时用2种报告抗体分析的Western印迹分析显示出预期的大约90kDa大小而无降解的融合蛋白亚单位或可观察到的较小产物(如Fab或酶)。
由于已知CPG2仅在其为二聚化状态时表现出酶活性并且因为仅仅抗体酶融合蛋白存在,故此表明90kDa的融合蛋白(在SDS-PAGE条件下所见到的)通过天然的CPG2二聚化机制二聚化以在“天然”缓冲液条件中形成180kDa二聚化抗体-酶融合蛋白分子(图2a)。此外,该分子同时显示出CPG2酶活性和CEA抗原结合特性,这与仅仅酶或抗体相比在融合蛋白中似乎没有明显不同。h)在体外细胞毒性分析中表达的融合蛋白与CPG2前体药物的使用
进行体外细胞杀伤分析,将其中的(A5B7-CPG2R6)2融合蛋白与“常规的”通过用化学异双功能试剂将A5B7 F(ab′)2连接至CPG2而形成的A5B7 F(ab′)2-CPG2缀合物进行比较。在每种情况下,将表现出等量CPG2酶活性或等量抗体-CPG2蛋白的物质与带有CEA的LoVo肿瘤细胞孵育。然后冲洗细胞以去除未结合的蛋白材料且随后重悬于含有CPG2酶前体药物的培养基(PGP,见下面实施例2)中1小时,然后冲洗细胞并重悬于新鲜培养基中并让其增殖4天。最后将细胞用SRB染色处理并测定其数目。
得到的结果清楚地显示与等量水平的(与前体药物)的A5B7F(ab)2-CPG2缀合物相比,(与相同前体药物)的(A5B7-CPG2R6)2融合蛋白导致至少相当的细胞杀伤并在分析结束时得到更少数目的细胞。(高于基准对照水平)的细胞杀伤仅在前体药物由CPG2酶转化为活性药时可能发生(并且由于细胞被冲洗以去除未结合蛋白,所以仅仅结合细胞的酶将在加入前体药物时保留)。因此,此实验显示与作为更大程度细胞杀伤的常规A5B7F(ab′)2-CPG2缀合物相比,至少相同水平的A5B7-CPG2R6融合蛋白保持结合(可能是由于更多的前体药物至药物转换)发生。i)用于在短暂和稳定细胞系中表达的其表达融合蛋白载体的构建
为了更为简单的转染方法和直接将2种表达弹夹偶联至单一筛选标记上,用(编码抗体Fd-CPG2融合蛋白)的现存载体pNG4/A5B7VH-IgG2CH1/CPG2R6和(编码抗体轻链)的pNG3/A5B7VK-HuCk-NEO构建用于融合蛋白表达的其-表达载体。将pNG4/A5B7VH-IgG2CH1/CPG2 R6质粒首先用限制酶SacI消化,将反应液上样于1%琼脂糖凝胶中并从凝胶中切下线性载体并纯化。此载体DNA然后用限制酶BglII和BamHI消化,反应液上样于1%琼脂糖凝胶中,回收所需的带(大约2700bp)并加以纯化。用限制酶BamHI消化质粒pNG3/A5B7VK-HuCk-NEO,然后将此DNA去磷酸且然后上样于1%琼脂糖凝中并从凝胶中切下载体条带并加以纯化。将重链表达弹夹片段连接入制备的载体中并将连接混合物转化入大肠杆菌中。通过多种限制性消化检查此方向并筛选具有与轻链相同方向重链弹夹的克隆。将这些质粒命名为pNG3-A5B7-CPG2/R6-coexp.-NEO。j)用于蛋白表达的基因开关
已预见CPG2和CPG2融合蛋白在哺乳动物细胞中的体外表达可能降解培养基叶酸从而导致缓慢的细胞生长或细胞死亡。高活性的CPG2酶有可能使此叶酸缺陷难以通过培养基补充来克服。然而,认为在CPG2或CPG2融合蛋白表达在哺乳动物体内细胞中表达的情况,有可能这些问题将会发生,因为这些细胞将通过正常的循环和细胞机制而不断地补充所有生长需求。
已考虑过许多避免可能的体外叶酸耗竭问题的方案。其中的一种解决方法包括使用紧密控制但可诱导的基因开关系统如“TET开”或“TET关”(Grossen,M.等(1995)科学268:1766-1769)或蜕皮素/muristerone A开关(No,D等(1996)PNAS 93:3346-3351)。这些系统使准确控制目的基因的表达成为可能并可从以编码毒性或潜在有害表达产物的基因稳定转化哺乳动物细胞。基因开关将允许掺入CPG2融合基因的重组稳定细胞系可能更容易建立、维持和扩增而用于蛋白表达和种子培养而用于体内肿瘤生长研究。实施例2表达抗体-酶融合蛋白的HCT116肿瘤细胞在体外受到前体药物的选择性杀伤
用实施例1的抗体-CPG2融合蛋白基因转染的HCT116结肠癌细胞(ATCC CCL247)可由前体药物选择性杀伤,此前体药物由该酶转换为活性药物。
为了测定此杀伤,将对照未转染的HCT116细胞或以抗体-CPG2融合蛋白基因转染的HCT116细胞与前体药物,4-[N,N-双(2-氯乙基)氨基]-苯氧羰基-L-谷氨酸(PGP;Blakey等,英国癌症杂志72,1083,1995)或由CPG2释放的相应药物,4-[N,N-双(2-氯乙基)氨基]酚孵育。将高于5×10-4到5×10-8M浓度范围的药物加入含有1000-2,500个HCT116细胞/孔的96孔微滴定板中于37℃1小时。然后冲洗细胞并于37℃进一步孵育3天。冲洗去除死细胞后,加入TCA并按Skehan等所述(国立癌症研究院院报,82,1107,1990)通过加入SRB染料而分析附着到此平板上的细胞蛋白的量。通过抑制50%生长抑制(IC50)所需的浓度分析此前体药物或药物的效价。
用该药物处理未转染或转染的HCT116细胞导致大约1μm的IC50。相反,PGP前体药物对未转染的细胞导致大约200μm的IC50并且对转染的细胞导致大约1μm的IC50。这些结果证明表达抗体-CPG2融合蛋白的转染细胞可将PGP前体药物转换成更为有效的活性药物而未转染的HCT116细胞不能够转换此前体药物。因此,就细胞杀伤而言与未转染的HCT116细胞相比,转染的HCT116细胞对PGP前体药物敏感100多倍。(见实施例1j)中关于包括细胞中可能的叶酸耗竭问题。
这些研究证明用抗体-酶融合蛋白基因转染肿瘤细胞可导致前体药物选择性肿瘤细胞杀伤。实施例3表达抗体-CPG2融合蛋白的HCT116肿瘤中PGP前体药物的抗肿瘤活性
可按如下证明在表达抗体-CPG2融合蛋白的HCT116肿瘤中PGP前体药物的体内抗-肿瘤活性。将以抗体-CPG2融合蛋白基因转染的HCT116肿瘤细胞或对照未转染的HCT116肿瘤细胞皮下注射至无胸腺裸鼠(107个肿瘤细胞/只子鼠)中。当肿瘤为5-7mm直径时,将PGP前体药物腹膜内注射至小鼠(以5-25mg kg-1的剂量范围每小时间隔经2小时3次剂量)。通过以2个方向测定肿瘤长度并用下面公式计算肿瘤体积而判断抗-肿瘤效应:
体积=π/6×D2×d其中D为肿瘤较大的直径且d为肿瘤较小的直径。
肿瘤体积以相对于施用PGP前体药的时的肿瘤体积表示。抗肿瘤活性与对照组进行比较,对照组接受转染或未转染的肿瘤细胞和PBS(170mM NaCl,3.4mM KCl,12mM Na2HPO4和1.8mM KH2PO4,pH 7.2)而不是PGP前体药物。通过与PBS处理的肿瘤相比PGP处理肿瘤体积的减小以及与PBS处理肿瘤相比PGP处理的肿瘤明显需要更长时间以达到其最初肿瘤体积的4倍来判定。施用PGP至从转染HCT116细胞而建立的HCT116肿瘤细胞得到显著的抗肿瘤效应。相反,施用PGP至从未转染细胞建立的HCT116肿瘤细胞没有导致明显的抗肿瘤活性。
类似的研究可用于证明当与PGP前体药物联合使用时,在适当的载体中运载从而从未转染HCT116细胞建立的HCT116肿瘤的抗体-酶基因可导致明显的抗肿瘤活性。因此,将未转染的HCT116细胞注射入无胸腺裸鼠(每只鼠1×107肿瘤细胞)且一旦肿瘤达到5-7mm的直径,将含有抗体酶融合蛋白基因的载体注射入肿瘤内。使抗体-酶融合蛋白由HCT116肿瘤细胞表达并与其结合1-3天后,按上述施用PGP前体药物。与接受PBS而非PGP前体药物的对照小鼠相比,这导致了明显的抗肿瘤活性。实施例4
用补充FAS的培养基和/或V-79滋养细胞改进对附着细胞系的转染
已经预见CPG2和CPG2融合蛋白在哺乳动物细胞中的体外表达可能降解培养基叶酸,从而导致缓慢的细胞生长或细胞死亡。开发这里所述的用于表达CPG2和CPG2融合蛋白细胞系的FAS(补充叶酸)的培养基从而更好地支持这些细胞系的生长。
在准备转染过程中,将附着细胞系在常规DMEM培养基中培养并在转染之前至少传代三次。将V-79(获自MPC放射学公司,(Harwell,Oxford.,英国)的仓鼠肺成纤维细胞)饲料细胞培养于常规的DMEM培养基中并在用前传代三次。为了转染,进行粘附细胞进行存活计数(用血细胞计数器/苔酚蓝染色)并以2×105个细胞/孔将细胞铺于6孔平板(Costar 3516)并放置18-24小时而让细胞再次粘附。
对于每次单独的转染,将20μl LIPOFECTINTM加入80μl无血清培养基中并置室温30分钟。将目的质粒DNA(2μg)加入100μl无血清培养基中且随后加入LIPOFECTINTM混合物中并进一步放置15分钟。将每个6孔平板用每孔2ml无血清培养基冲洗以去除任何血清并代之以800μl新鲜无血清培养基。将预先制备的200μl DNA/LIPOFECTINTM/无血清培养基混合物加入每个细胞孔中。将平板于37℃孵育5小时,其除培养基并加入2ml新鲜的常规培养基且进一步孵育48小时。刮干净6孔板中转染的细胞,取出细胞悬液并离心。去除所有的上清并将细胞沉淀重悬于20ml含有适当用于转染DNA(如G418)筛选剂的适当新鲜培养基(如.FAS DMEM培养基)中。从每孔(200μl)等份铺板于96孔平板中(1.25×104个细胞每孔)。
为了增强克隆扩增,可将成纤维细胞饲料细胞加入转染的细胞中。用胰蛋白酶消化半汇合的V-79滋养细胞并进行存活计数。将细胞以1×106细胞/ml重悬于无菌玻璃容器中,用暴露至5000拉德的铯源12分钟进行辐射。然后将细胞贮存于4℃ 24-48小时(辐射过的细胞代谢上有活性但将不分裂,且因此可作其它细胞的“滋养”而不污染培养物)。滋养细胞应以4×104个细胞每孔铺板于96孔平板中以制备用于出现重组克隆。滋养细胞最初附着于平板上但随着时间推移而又脱离(平板)并漂浮入培养基中,使任何重组克隆仍附着于孔中。每周更换培养基(每次200μl)2次以去除漂浮的细胞并补充培养基。让克隆形成10-14天,然后通过标准的ELISA分析筛选上清中的融合蛋白分泌。
为了测定(A5B7-CPG)2融合基因构建体的表达速率,将重组细胞从10ml新鲜常规培养基1×106个细胞接种恰好24小时。然后取出上清离心以去除细胞废物并通过上述的ELISA和HPLC方法分析融合蛋白和酶活性。多种重组(A5B7-CPG)2融合蛋白细胞系的结果如下。
细胞系       克隆     ng/106个细胞/24小时
HCT116        F7            6550
              C12           3210
HCT116        F6            15560
              C1            6151
              B3            4502
              A8            4650
              D5            630
              H9            610
              G11           2081
              H4            2380
              A4            1634
LoVo          B9            8370
              C1            7350
              F12           2983
              C7            10770
              G10           41
Colo 320DM      B3        10540
                G4        4720
                B9        885
                B10       3090
                F12       35660实施例5
稳定可诱导的表达(A5B7-CPG2)2融合蛋白肿瘤细胞系的构建a)可诱导的融合蛋白表达载体的构建
为了利于从单个可诱导哺乳动物细胞启动子的表达、构建了基于IRES(内部核糖体进入位点;见Y.Sugimoto等.,生物技术(1994),12,694-8)的(A5B7-CPG2)2融合蛋白版本。构建体pNG3 pNG3/A5B7VK-HuCk-NEO(A5B7嵌合轻链;描述于上面实施例16中)用作扩增轻链基因的模板。用寡核苷酸CME 3153和CME 3231(SEQ IDNOS 19和20)扩增此基因。纯化预期大小(大约700bp)的PCR产物。此产物然后用限制酶EcoRI和BamHI消化并随后进行纯化。将此片段克隆入BluescriptTM KS+载体(通过用相同的限制酶EcoRI和BamHI消化而制备成接受此片段)中,然后将此DNA去磷酸并纯化较大的载体带。将类似限制性消化的PCR片段连接入此制备的载体中并将连接混合物转化入大肠杆菌中。从这些获得的克隆中制备DNA并通过限制性消化分析之以检查PCR片段的插入。对适当的克隆进行测序以确证此基因序列。获得多个具有正确序列的克隆并将其中的一个克隆给以质粒命名A5B7 BluescriptTM
以类似的方式,用寡核苷酸CME 3151和CME 3152(SEQ IDNOS 21和22)通过PCR从质粒pNG4/A5B7VH-IgG2CH1/CPG2R6(在上面的实施例1e中描述过)中扩增嵌合A5B7重链。纯化预期大小(大约1800bp)的PCR反应产物。然后用限制酶BamHI和XbaI消化此产物后纯化此片段条带。也将此片段克隆入已用相同的限制酶BamHI和XbaI消化而制备成接受上述片段的BluescriptTM KS+载体中,其中的限制酶消化过的载体DNA被去磷酸并纯化较大的载体片段。将类似限制性消化的PCR片段连接入制备的载体中并将连接混合物转化入大肠杆菌中。从得到的克隆中制备DNA并通过限制性消化加以分析以检查PCR片段的插入,对适当的克隆进行测序以确证该基因序列。获得多个具有正确序列的克隆并将其中的一个克隆给以质粒命名BluescriptTMFd-CPG2 R6。
IRES序列源自载体pSXLC(Y.Sugimoto等.,生物技术(1994),12,694-8)中描述过并获自这些作者)。通过限制酶BamHI和NcoI消化而切下IRES序列。纯化预期大小的(大约500bp条带并将其连接入(预先以相同酶限制性消化而制备的)BluescriptTM Fd-CPG2 R6质粒中。将此连接混合物转化入大肠杆菌中并以得到的克隆中制备DNA。通过限制性消化分析此DNA以检查此片段的插入并对适当的克隆进行测序以确证此基因序列。获得多个具有正确序列的克隆并将其中一个给以质粒命名BluescriptTM IRES Fd-CPG2 R6。
为了利于以后的克隆步骤,缺失IRES片段中带有的XbaI位点是必需的。这通过用寡核苷酸引物CME 3322和CME 3306(SEQ IDNOS:23和24)和BluescriptTM IRES Fd-CPG2 R6作为模板DNA通过PCR诱变进行。纯化预期大小(大约500bp)的PCR反应产物,用限制酶BamHI和NcoI消化并连接入(预先用相同的限制酶限制性消化而制备的)BluescriptTM IRES Fd-CPG2 R6质粒中。将连接混合物转化入大肠杆菌中并以得到的克隆中制备DNA。通过限制性消化分析此DNA以检查此片段的插入并对适当的克隆随后进行测序以确证此基因序列。得到多个具有正确序列的克隆并将其中一个给以质粒命名BluescriptTM IRES Fd-CPG2 R6-Xba del。
通过限制酶EcoRI和BamHI消化而从质粒A5B7 BluescriptTM质粒中切下A5B7嵌合轻链片段。纯化预期大小的(大约700bp)的条带,将其连接入适当制备的BluescriptTM IRES Fd-CPG2 R6-Xba del质粒中并将连接混合物转化入大肠杆菌中。从得到的克隆中制备DNA并通过限制性消化分析之以检查该片段的插入。对适当的克隆随后进行测序以确证该基因序列。得到多个具有正确序列的克隆并将其中一个给以质粒命名BluescriptTM A5B7 IRES Fd-CPG2 R6-Xba del。完整的基于IRES的A5B7嵌合蛋白基因序列示于SEQ ID NO:52中。
然后将基于IRES的A5B7嵌合融合蛋白基因转入四环素调节的表达载体中,用于Ter On基因表达系统的载体获自Clontech。通过用限制酶EcoRI和Xba I消化、去磷酸化并纯化较大的载体条带制备四环素可开关的表达载体pTRE(又称为pHUD10-3,见Gossen等,(1992),PNAS,89,5547-51)以接受基于IRES的融合蛋白弹夹。用相同的限制酶从BluescriptTM A5B7 IRES Fd-CPG2 R6-Xba del质粒中切下IRES基因弹夹。将获得的大约3000bp的片段连接入制备的载体中并将连接混合物转化入大肠杆菌中。从得到的克隆中制备DNA并通过限制性消化分析之以检查PCR片段的插入。对适当的克隆随后进行测序以确证此基因序列。得到多个具有正确序列的克隆并将其中的一个克隆给以质粒命名pHUD10-3/A5B7 IRES Fd-CPG2 R6。b)稳定可诱导的表达融合蛋白的细胞系的构建。
用标准的脂质转染法(如前面所述但不使用滋养细胞)制备重组的HCT116肿瘤细胞系。用1μg pHUD10-3/A5B7 IRES Fd-CPG2 R6质料和1μg pTet-On反式激活表达质粒(来自Clontech试剂盒)进行共转染并用含有750μg G418/ml的FAS培养基筛选阳性克隆。c)重组HCT116可诱导细胞系的诱导研究
将得到的克隆培养物分配至2个48孔平板,每孔含1×106个细胞。将细胞培养48小时,其中的一只平板用2μg/ml强力霉素加以诱导并且另一只平板用作未诱导的对照。用实施例1g中所述的ELISA/Western印迹分析测试细胞上清中(A5B7-CPG2)2融合蛋白的表达。这些结果可清楚地证明用强力霉素对可诱导细胞系融合蛋白的诱导,例如,得到的一个克隆(F11)中,诱导的细胞在上清中产生120ng/ml融合蛋白而未诱导细胞仅产生背景水平的融合蛋白(低于1ng/ml)。实施例6分泌的融合蛋白物质基于细胞的ELISA分析
将细胞以每孔100μl常规培养基1×104个细胞的浓度接种于96孔平板(Becton Dickinson BiocoatTM poly-D-Lysine,35-6461)中并于37℃放置约40小时。将100μl 6%的甲醛稀释于DMEM中并于4℃放置1小时。离心平板并通过浸泡于含有0.05%TweenTM的PBS中冲洗3次(头2次洗2分钟且最后一次5分钟)。
将100μl含有融合蛋白或嵌合A5B7抗-CEA的细胞培养上清2倍稀释液适当地加入每孔中并将平板于4℃孵育过夜。按上述冲洗平板并且在嵌合融合蛋白的情况,加入100μl HRP标记的抗人卡巴抗体(Sigma A-7164)的1∶1000稀释液并于室温孵育2小时(抗-CPG2检测方法可用于鼠scFv融合蛋白的情况中)。按上述冲洗平板并用OPD底物(Sigma P-8412)检测HRP。使显色大约5分钟,用每孔75μl 2MH2SO4终止显色并于490nm处计数OD值。
在(A5B7-CPG2)2融合蛋白的情况,物质从重组Colo 320DM肿瘤细胞(CEA-ve)的上清中产生。通过用上述的CEA  ELISAs测定融合蛋白的含量。加入逐渐增加量的融合蛋白至许多CEA阴性细胞系和CEA阳性LoVo亲本细胞系。示于图3中的结果清楚地显示仅仅CEA阳性细胞系随着加入融合蛋白量的增加而结合水平增加而CEA阴性细胞系整个过程仅仅显示出恒定的背景结合水平。这清楚地证明该融合蛋白特异性结合并维持于CEA阳性Lovo细胞中。实施例7表达抗体-酶融合蛋白的重组Lovo肿瘤细胞表现融合蛋白在细胞表面上的滞留
从(A5B7-CPG2)2融合蛋白基因转染的LoVo结肠癌细胞已表现出又分泌同时在其细胞表面上又维持有融合蛋白,这可能过在对分泌的融合蛋白进行基于细胞的ELISA中分析提出的条件下比较母本和表达重组融合蛋白的LoVo细胞而加以证明(图4)。在显色反应中可以重组LoVo细胞通过显示出高水平的颜色而维持有表达的融合蛋白。在对照实验中,用表达Colo320DM融合蛋白的细胞,该分析显示有些融合蛋白的保留(可能是非特异性的)和母本LoVo细胞仅仅显示出背景活性。其中加入CEA结合抗体至表达测试重组融合蛋白的肿瘤细胞以及加入到母本LoVo对照中的阳性对照得到了从母本LoVo获得的信号(因此证明CEA存在于母本细胞上)但来自Colo320DM(CEA阴性)的信号没有增加。此重组的LoVo细胞仍然得到如此强裂的起始信号从而加入的抗体对获得的总的信号几乎没有影响,该信号比任何对照实验要高得多。因此,似乎从CEA阳性肿瘤细胞系分泌的抗-CEA抗体酶-CPG2融合蛋白通过CEA结合到细胞表面而CEA阴性肿瘤表达的相同蛋白没有表现出这种结合。实施例8表达抗体-酶融合蛋白的LoVo肿瘤细胞受前体药物的选择性杀伤
用(A5B7-CPG2)2融合蛋白基因转染的LoVo结肠癌肿瘤细胞可受前体药物的选择性杀伤,该前体药物由CPG2酶转化成活性的药物。
为了证明此对照未转染的LoVo细胞或者将以抗体-CPG2融合蛋白基因转染的LoVo细胞与前体药物,4-[N,N-双(2-氯乙基)氨基]-苯氧羰基-L-谷氨酸(PGP;Blakey等,(1995)英国癌症杂志72,p1083)或由CPG2,4-[N,N-双(2-氯乙基)氨基]酚所释放的相应药物一起孵育,如实施例2中所述的HCT116细胞一样。
表达抗体-CPG2融合蛋白的转染细胞可将PGP前体药物转化成更为有活性的药物而未转染的LoVo细胞不能够转换此前体药物。
这些研究证明以抗体-酶融合蛋白基因转染肿瘤细胞可导致用前体药物对肿瘤细胞的选择性杀伤。实施例9表达融合蛋白的LoVo肿瘤异体移植在无胸腺小鼠中的建立
将重组的表达融合蛋白(A5B7-CPG2)2的LoVo肿瘤细胞或将重组及母本LoVo细胞混合物皮下注射至无胸腺裸鼠(每只小鼠107个肿瘤细胞)。同时将100%重组LoVo细胞及重组:母体LoVo细胞10%:80%的混合物的肿瘤生长速率与仅仅母本细胞肿瘤的生长速率相比较。在观察到的生长曲线中没有见到明显的差异,显示在细胞系间的比较过程中无需校正。观察到的肿瘤生长速率显示在每种异体移植肿瘤的情况中,达到10×10mm的大小大约需要12天。实施例10肿瘤异体移植样品中酶活性的测定
为了用作测定的标准,在20%的正常肿瘤(母本细胞肿瘤)的匀浆物中制备CPG2酶标准曲线。随后与正常肿瘤20%的匀浆物相同而制备样品稀释液。
从-80℃保藏(预先快速冷冻干液氮中)取出切下的肿瘤组织并使其融化。将肿瘤用手术刀切成小片段之前去除残余的皮肤组织。将肿瘤组织转入预先称量好的试管中并称取该肿瘤组织的重量。将含有0.2mMZnCl2溶液的PBS加入每种肿瘤样品中以达到20%(w/v)混合物,匀浆并置于冰上。制备例如,干净的1/10、1/20和1/40的(于20%正常肿瘤匀浆物中)样品肿瘤的稀释液。
为了标准曲线,将CPG2酶稀释液制成400μl终体积中下面的浓度。类似地,也制备400μl每种重组肿瘤样品稀释液。平衡至30℃后,加入4μl的10mM氨甲喋呤(MTX)溶液。精确地在10分钟后通过加入600μl冰冷的甲醇+0.2%TFA而终止反应,离心并收集上清。然后通过HPLC(用阳离子交换柱,HICROMTM S5SCX-100A,移动相260%甲醇,40%60mM的甲酸铵/0.1%TFA,300nm处检测)分离上清中的底物与产物。为了计算肿瘤组织中的酶活性,将标准曲线绘成氨甲喋呤代谢物面积的单位(此标准的这样,即仅仅20-30%的底物被代谢从而确保此为非速度限制性的)。通过比较代谢物单位面积与标准曲线且然后乘以稀释因子而分析测试样品。最后,制作1ml=1g的工作假设,将结果乘以5(因为样品最初被稀释至20%的匀浆物)。
用表达(A5B7Fab-CPG2)2融合蛋白的20%重组:80%母本LoVo细胞得到的结果显示下面的结果:于第5天取出的肿瘤具有平均酶活性=0.26U/g(在0.18-0.36U/g之间的范围)且在第12天具有平均酶活性=0.65U/g(在0.19-1.1U/g的范围)。实施例11血浆样品中酶活性的测定
为了用作测定的标准,在20%正常血浆中制备至下面浓度的CPG2酶标准曲线:0.2、0.4、0.6、0.8和1.0U/ml。类似地也将所有的测试血浆样品稀释至20%的正常血浆。同时用20%的正常血清制备这些样品的进一步稀释液,如干净的1/10、1/20和1/50稀释液。将200ml等份的每种CPG2标准和测试样品稀释液平衡至30℃。加入2μl 10mM的MTX至每只试管中并充分混合至30℃。准确地在10分钟后通过加入500μl冰冷的甲醇+0.2%TFA而终止反应(以增加测定的敏感性并可将孵育时间增加至30分钟)并按上面实施例10中所述用HPLC检测分析产物。
当肿瘤中酶活性水平超过2.0U/g时除了在少数情况外在血浆中没有见到活性,这些少数情况中的血浆酶水平测定为0.013至0.045U/ml的范围。实施例12CPG前体药物在表达抗体-CPG2融合蛋白的LoVo肿瘤中的抗肿瘤活性。
按实施例9中所述将表达(A5B5-CPG2)2融合蛋白的重组LoVo肿瘤细胞或重组与母本LoVo细胞的混合物皮下注射至无胸腺裸晶中。
当肿瘤达到5.7mm直径时将PGP前体药物经腹膜内施用至小鼠(于DMSO/0.15M碳酸氢钠缓冲液以小时为间隔经2个小时3个剂量,剂量为40-80mg kg-1)。
通过在2个方向测定肿瘤的长度并用下面的公式计算肿瘤体积而判定抗癌效应
体积=π/×D2×d其中的D为肿瘤的较大直径且d为肿瘤的较小直径。肿瘤体积可以相对于施用PGP前体药物时的肿瘤体积来表示或者作为选择可计算平均的肿瘤体积。将该抗肿瘤活性与接受转染肿瘤细胞或未转染肿瘤细胞与无PGP前体药物的缓冲液的对照组相比较。
与对照相比PGP处理的肿瘤体积的减小并且与对照相比其需要明显更长的时间使PGP处理的肿瘤达到其起始肿瘤体积的4倍(图5),由此所示施用PGP至从重组LoVo细胞或重组LoVo/母体LoVo细胞混合物建立的LoVo肿瘤导致了明显的抗肿瘤效应。施用PGP至从未转染细胞建立的LoVo肿瘤没有导致明显的抗肿瘤活性。
类似的研究可用于证明用适当的基因转移载体转移至从非转染母本LoVo细胞建立的LoVo肿瘤中的抗体-酶基因当与PGP前体药物联合使用时可导致显著的抗肿瘤活性。因此,将未转染的LoVo细胞注射至无胸腺裸鼠(每只小鼠1×107个肿瘤细胞)并且一旦肿瘤达到5-7mm的直径,将含有抗体-酶融合蛋白基因的载体注射至肿瘤内。使LoVo肿瘤细胞表达抗体-酶融合蛋白1-3天后并结合至其上,按上述施用PGP前体药物。与对照相比这导致了显著的抗肿瘤活性。实施例13(806.077 Fab-CPG2)融合蛋白的构建
为了获得也表现出CPG2酶活性的二价人癌胚抗原(CEA)结合分子,计划构建(806.077 Fab-CPG2)2酶融合。设计此最初构建体的末端含有806.077抗体重链Fd片段,该片段通过弹性的(G4S)3肽接头将其C-末端连接至CPG2多肽的N-末端(如图1中所示但从806.077代替A5B7)。
抗体806.077(在Zeneca有限公司的国际专利申请WO 97/42329中描述过)以很高程度的特异性与人CEA结合。因此,806.077抗体特别适用于靶向结肠癌或其它带有CEA抗原的细胞。
一般地,抗体(或抗体片段)-酶缀合物或融合蛋白应该至少为二价的,即是说能够结合至少2种肿瘤相关抗原(可为相同的或不同的)。在(806.077 Fab-CPG2)2融合蛋白的情况,酶成分的二聚化(在表达后,与天然酶一样)发生,因而形成含有2个Fab抗体片段(且因此就抗体结合位点来说是二价的)和2个CPG2分子的酶促分子(图2a)。a)806.077抗体基因的克隆
重组鼠806.077 F(ab′)2抗体的克隆及特征分析的方法已经公开(国际专利申请WO 97/42329,实施例7),参考实施例7.5描述了将806.077抗体可变区基因克隆入BluescriptTM KS+载体中。这些载体然后用作806.077可变区基因的来源而用于构建806.077嵌合轻链和重链Fd基因。b)嵌合806.077抗体载体构建体
国际专利申请WO 97/42329,实施例8公开描述了将806.077嵌合轻链和重链Fd基因克隆入载体pNG3-Vkss-HuCk-NEO(NCIMB保藏号40799)和pNG4-VHss-HuIgG2CH1′(NCIMB保藏号40797)中将得到的载体命名为pNG4/VHss 806.077VH-IgG2CH1′(806.077)嵌合重链Fd′和pNG3/Vkss806.077VK-HuCk-NEO(806.077嵌合轻链)。这些载体为用于构建806.077 Fab-CPG2融合蛋白的806.077抗体基因的来源。c)806.077重链Fd-CPG2融合蛋白基因的构建
所用的CPG2基因的克隆与构建描述于实施例1c和d部分中。类似地,用于构建806.077重链Fd-CPG2构建的pNG4/A5B7VH-IgGCH1/CPG2R6载体的构建描述于实施例1的e部分中,通过用限制酶HindIII和NheI消化而从pNG4/VHss 806.077VH-IgG2CH1′载体中切下806.077可变区重链基因并纯化含有此可变区基因的预期大小的(难300bp)的条带。为了准备将用806.077可变区代替A5B7抗体的可变区,用相同的限制酶(HindIII/NheI)消化载体pNG4/A5B7VH-IgG2CH1/CPG2R6。消化后,将DNA去磷酸然后分离和纯化较大的载体带。然后将类似限制性消化的可变区基因连接入此制备的载体中并将连接混合物转化入大肠杆菌中。从得到的克隆中制备DNA并通过限制性消化分析加以分析并且随后进行测序以确证融合基因序列。发现许多克隆为正确的并挑选其中一个克隆,pNG4/VHss806VH-IgG2CH1/CPG2R6用于进一步工作。构建的806.077重链Fd-CPG2融合蛋白的基因的序列示于SEQ ID NOS:25与26。d)共转染、融合蛋白的暂时表达与分析
用上面实施例1f中描述的基于LIPOFECTINTM的方法将(编码抗体嵌合Fd-CPG2融合蛋白的)质粒pNG4/VHss806.077VH-IgG2CH1/CPG2R6和(编码抗体嵌合轻链的)质粒pNG3/VHss806.077VK-HuCk-NEO共转染入COS-7细胞中。按实施例18中所述对融合蛋白进行分析。基于HPLC的酶活性测定清楚地显示CPG2酶活性存在于细胞上清中并且两种抗-CEA ELISA分析显示出以与二价的806.077抗体分子相当的水平的蛋白结合,用抗-CPG2报告抗体的抗-CEA ELISA测定也显示出清晰的CEA结合的事实表明不仅抗体而且抗体-CPG2融合蛋白结合CEA。同时用两种报告抗体的Western印迹分析清楚地显示出预期的大约90kDa大小的(806.077 Fab-CPG2)2融合蛋白亚单位,其中仅可观察到小量的降解或更小的产物(如Fab或酶)。由于仅知道CPG2仅在其为二聚化状态时显示出酶活性并且由于仅仅抗体酶融合蛋白存在,这表明90kDa的融合蛋白(在SDS/PAGE条件下所见到的)在“自然”缓冲液条件下通过天然CPG2二聚化机制二聚化从而形成180kDa的二聚化抗体-酶融合蛋白分子孔(图2a)。此外,该分子同时显示出CPG2酶促活性和CEA抗原结合活性,似乎与仅仅酶或抗体相比此融合蛋白有显著不同。e)用于暂时及稳定细胞系表达的(806.077 Fab-CPG2)2融合蛋白共表达载体的构建
为了更为简单的转染方法和直接偶联2种表达弹夹与单一筛选标记,用(编码抗体Fd-CPG2融合蛋白)的现存载体pNG4/VHss806.077VH-IgG2CH1/CPG2和(编码抗体轻链的)现存载体pNG3/VHss806.077VK-HuCk-NEO构建融合蛋白表达的共-表达载体。首先用限制酶ScaI消化pNG4/VHss806.077VH-IgG2CH1/CPG2质粒,纯化纯性载体带,用限制酶BglII和BamHI消化并纯化所需的条带(大约2700bp)。用限制酶BamHI消化质粒pNG3/VHss806.077VK-HuCk-NEO,将DNA去磷酸并纯化载体带。将重链表达弹夹片段连接入制备的载体中并将连接混合物转化入大肠杆菌中,通过多种限制性消化检查方向并筛选具有与轻链方向相同的重链弹夹的克隆。该质粒命名为pNG3-806.077-CPG2/R6-coexp.-NEO。实施例14(55.1 scFv-CPG2)2融合蛋白的构建
美国专利5,665,357中所述的55.1抗体识别CA55.1肿瘤相关抗原,该抗原表达于大多数结肠癌并具在正常结肠组织中仅仅微弱表达或不表达。55.1重轻链cDNA序列的测定描述于前述的美国专利的实施例3中。允许用单一pelB前导序列(pICI266)将抗体片段分泌至大肠杆菌周质中的质粒表达载体已于1993年10月11日根据布达佩期条约以许可号NCIMB 40589保藏于国立工业及海洋微生物保藏有限公司(NCIMB)23St Machar Drive,Aberdeen,AB2 1RY,苏格兰,英国,按美国专利5,665,357的实施例3.3a中所述修饰此载体以构建pICI1646;按在实例3的进一步子部分中所述用此质粒克隆各种55.1抗体片段,包括命名为pICI1657的55.1 scFv构建体的制备。
用(又称为pICI-55.1 scFV)的pICI 1657作为构建(55.1ScFv-CPG2)2融合蛋白的起点。用寡核苷酸CME 3270和CME 3272(分别为SEQ ID NOS:27与28)以及用质粒pICI1657作为模板DNA而扩增55.1 scFv基因。纯化大约790bp的得到的PCR产物带。类似地,按上面实施例1e中所述将pNG4/A5B7VH-IgG2CH1/CPG2 R6质粒用作标准PCR反应中的模板DNA用寡核苷酸引物CME 3274和CME 3275(分别为SEQ ID NOS:29和30)扩增CPG2基因。纯化大约1200bp的预期PCR产物条带。
进行进一步的PCR反应从而将2种纯化的PCR反应产物连接(或剪接)起来。使用标准的PCR反应条件,用不同量(0.5到2μl之间)的每种PCR产物但使用25轮循环(而不是通常的15轮循环),用寡核苷酸CME 3270和CME 3275(SEQ ID NOS:27与30)。切下预期大小的(大约2000bp)反应产物,纯化并于20μl H2O中洗脱,用限制酶RcoRI消化并加以纯化。通过以限制酶EcoRI消化、支磷酸、分离出较大载体带与较小片段并纯化而制备载体pNG4/VHss806.077VH-IgG2CH1/CPG2以接受上面的PCR产物。将类似限制性消化的PCR产物连接入制备的载体中并将连接混合物转化入大肠杆菌中。从得到的克隆中制备DNA并通过HindIII/NotI限制性消化分析以检查正确的方向且随后对适当的克隆测序以确证此融合基因序列。得到多个具有正确序列的克隆并将其中的一个给以质粒命称pNG4/55.1scFv/CPG2R6。此DNA及融合蛋白的氨基酸序列示于SEQID NOS:31与32中。实施例15修饰质粒pNG4/55.1 scFv/CPG2 R6以促进scFv基因交换
在构建pNG4/55.1 scFv/CPG2 R6过程中,将独特的BspEI(AccIII的同裂酶)导入位于抗体与CPG2基因之间的弹性(G4S)3接头编码序列中。为了利于克隆其它的scFv构建体,将pNG4/55.1 scFv/CPG2 R6中的CPG2基因3′端的EcoRI位点缺失从而能够通过EcoRI/BspEI片段克隆在该质粉信号序列后和CPG2基因的5′端在框内插入其它的scFv抗体基因。此修饰通过PCR诱变完成,诱变过程中首先将pNG4/55.1scFv/CPG2 R6用寡核苷酸CME 3903和CME 3906(分别为SEQ IDNOS:33和34)加以扩增。其次,用寡核苷酸CME 4040和CME 3905(分别为SEQ ID NOS:35和36)再次扩增pNG4/55.1 scFv/CPG2R6。纯化大约420bp的第一条预期的PCR产物条带。类似处理第二个PCR反应并纯化大约450bp的预期的PCR产物条带。
进行进一步的PCR反应以将两上纯化的PCR反应产物连接(或剪接)到一起。使用标准的PCR反应条件,使用不同量的(在0.5到2μl)每种PCR产物但用寡核苷酸CME 3905和CME 3906(SEQ IDNOS:36及34)进行15到20个循环。预期大小的(大约840bp)的反应产物进行纯化,用限制酶NotI和XbaI进行消化并纯化大约460bp的预期片段条带。
通过以限制酶NotI和XbaI消化、去磷酸并分离较大载体带与较小片段而将最初的pNG4/55.1 scFv/CPG2 R6制备成接受上面的PCR产物。纯化载体知带并且随后将类似限制性消化的PCR产物连接入此制备的载体中并将连接混合物转化入大肠杆菌中。从得到的克隆中制备DNA普通过EcoRI限制性消化分析以检查此修饰片段的插入并且随后对适当的克隆测序以证实此序列变化。获得多个具有正确序列的克隆并将其中的一个克隆给以质粒命名pNG4/55.1scFv/CPG2 R6/delEcoRI。此突变去除了CPG2基因3′的EcoRI位点并同时导入了额外的终止密码子。达到并包括2个终止密码子的此融合蛋白基因DNA序列示于SEQ ID NO:37中。实施例16806.077 scFv抗体基因的构建
用为806.077 VH和VK可变压基因来源的载体pNG4/VHss806.077VH-IgG2CH1′和pNG3/VKss806.077VK-HuCk-NEO构建806.077 scFv。用寡核苷酸CME3260和CME 3266(分别为SEQ ID NOS:39和40)用标准的PCR条件从pNG4/VHss806.077VH-IgG2CH1′质粒中扩增806.077VH基因。用寡核苷酸CME 3262和CME 3267(分别为SEQ ID NOS:41与42)从pNG3/VKss806.077VK-HuCk-NEO质粒中扩增806.077VK。纯化VH和VK PCR反应产物。
进行进一步的PCR反应从而将这2个纯化的PCR反应产物连接(剪接)起来。使用标准的PCR反应条件,使用不同量的(0.5到2μl)每种PCR产物但用两侧寡核苷酸CME 3260和CME 3262(SEQ IDNOS:39和41)进行15到25个循环。纯化预期大小(大约730bp)的反应产物,用限制酶NcoI和XhoI消化并纯化大约720bp的预期片段条带。
通过标准的克隆技术在存在的XhoI和EcoRI限制性位点之间插入从2个寡核苷酸CME 3143和CME 3145(SEQ ID NOS:45和46)制备的双链DNA弹夹而进一步修饰pICI1657质粒(又称为pICI 55.1scFv)从而构建载体pICI 266-55.1 scFvtag/his(得到的55.1 scFvtag/his基因的DNA序列示于SEQ ID NO:47中)。通过以限制酶NcoI和XhoI消化、去磷酸并分离较大的载体带与较小的片段而接受上面的PCR产物。纯化此载体带并且随后将类似限制性消化的PCR产物连接入制备的载体中并将连接混合物转化入大肠杆菌中。从获得的克隆中制备DNA并通过EcoRI限制性消化分析检查此修饰片段的插入并且随后对适当的克隆进行测序以证实此序列变化。得到多个具有正确序列的克隆并将其中一个给以质粒命名pICI266/806IscFvtag/his(又称为pICI266.806VH/VLssFvtag/his)。806I scFvtag/his基因的DNA与蛋白序列示于(SEQ ID NOS:25与26中)。实施例17(806.077 scFv-CPG2)2融合蛋白的构建
将pICI266/806 IscFvtag/his质粒用作806scFv的来源。用寡核苷酸CME 3907和CME 3908(SEQ ID NOS:48和49)扩增此基因并纯化预期大小的条带。然后用限制酶EcoRI和BspEI消化此片段后纯化大约760bp的预期片段条带。
通过用限制酶EcoRI和BspEI消化上述片段,去磷酸并分离较大载体与较小片段而制备pNG4/55.1 scFv/CPG2 R6/del EcoRI质粒。纯化载体带并随后将类似地限制性消化的片段连接入制备的载体中并将连接混合物转化入大肠杆菌中。从得到的克隆中制备DNA并通过EcoRI限制性消化分析以检查修饰片段的插入。随后将适当的克隆测序以确证此基因序列。得到多个具有正确序列的克隆并将其中一个给以质粒命名pNG4/806 IscFv/CPG2 R6/del EcoRI。此融合蛋白基因806 IscFv/CPG2R6的DNA和蛋白序列示于(SEQ ID NOS:50与51中)。实施例18共转染,抗体-CPG2融合蛋白的暂时表达
如实施例1f中所述,可用给定的标准条件转染编码其它融合蛋白变异体的质粒以获得其编码的融合蛋白在COS7细胞中的暂时表达。,在(Fab-CPG2)2融合蛋白的情况,可同时共转染适当的质粒或转染共表达蛋白。类似地,也可通过相同的方法轨染(scFv-CPG2)2融合蛋白的单一表面质粒。在每种情况下,在每次转染中使用最多共4mgDNA。实施例19蛋白表达的基因开关
如实施例1j中所述,紧密控制但可诱导的基因开关系统如“TET开”或“TET关”(Grossen,M.等(1995)科学268:1766-1769)或蜕皮素/muristerone A(No.D.等(1996)PNAS 93:3346-3351)可用于表达融合蛋白。可用实施例5中所述的适当方法与克隆策略进行需要IRES序列的抗体Fab-酶融合表达。如果此融合蛋白产物为单一多肽链如scFv-酶构建体可以使用将适当的基因弹夹插入到可开关的表达载体中。实施例20分泌抗体酶融合蛋白的COS7细胞特性的测定
可按实施例1g中所述分析COS7细胞上清物质中抗体融合蛋白的存在。类似地可按前面实施例1h中所述用表达的融合蛋白与CPG2前体药物与体外细胞毒性分析中。基于HPLC的酶活性分析可显示CPG2酶活性存在于细胞上清中并可用抗CPG2报告抗体进行抗-CEAELISA检测以证实与二价A5B7抗体分子以相同的水平结合蛋白并且同时证明抗体-CPG2融合蛋白(不仅仅为抗体成分)结合CEA。
同时用2种报告抗体分析的Western印迹分析清楚地显示预期大小的融合蛋白亚单位。由于CPG2仅已知在二聚化状态的显示出酶活性并且因为仅仅抗体酶融合蛋白的存在,故表明该融合蛋白(在SDS/PAGE条件下所见到的)在“天然”缓冲条件中通过天然CPG2二聚化机制二聚化以形成二聚化的抗体酶融合蛋白分子。此外,此分子同时显示出CPG2酶促活性和CEA抗原结合特性,这与单独的酶或抗体比较在融合蛋白方面中没有显著不同。从细胞毒性分析中获得的结果可证明抗体-酶融合蛋白(与前体药物一起)与相当水平的A5B7 F(ab′)2-CPG2缀合物(与相同二前体药物)相比导致至少相同二细胞杀伤并在分析结束时得到更少数目的细胞。由于细胞杀伤(高于基本对照水平)仅可在此前体药物被CPG2酶转移成活性药物时发生(并且由于冲洗这些细胞以去除未结合的蛋白,当加入前体药物时仅仅结合细胞的酶将会保持)。因此,该实验可证明与常规的A5B7 F(ab)2-CPG2缀合物相比至少有更大程度的细胞杀伤数量的(A5B7-CPG2 R6)2融合蛋白保持结合(可能由于更多的前体药物至药物的转换)发生。实施例21重组肿瘤细胞表达的抗体酶融合蛋白特性体外及体内的测定
可按实施例4中所述构建表达融合蛋白的肿瘤细胞系。
可用实施例7中所述的技术显示融合蛋白质在表达抗体酶融合蛋白的重组LoVo肿瘤细胞表面上的滞留。可按实施例8中所述证明前体药物(由CPG2转换成活性药物)通过抗体CPG2融合蛋白基因对转杂的培养LoVo肿瘤细胞的选择性杀伤。可按实施例9中所述在无胸腺小鼠中建立表达抗体酶融合蛋白的LoVo肿瘤的异体移植。也可按实施例10中所述测定肿瘤导体移植样品中的酶活性。
按实施例11中所述测定血浆样品中的酶活性。可用实施例12中所述的方法评估PGP前体药物在表达抗体CPG2融合蛋白LoVo肿瘤中的抗肿瘤活性。
这些实验结果可用于显示CEA阳性肿瘤细胞系分泌的抗体-CPG2融合蛋白(通过CEA)结合到细胞表面上而由CEA阴性肿瘤表达的相同蛋白没有显示出这种结合。
这些结果可证明表达抗体-CPG2融合蛋白的转染细胞可将PGP前体药物转换成更为活性的药物而未转染的LoVo细胞不能够转换前体药物。因此,与未转染的LoVo细胞相比,就细胞杀伤而言转染的LoVo细胞对PGP前体药物的敏感性要高100倍,因此证明用抗体-酶融合蛋白基因转染肿瘤细胞可导致前体药物对肿瘤:选择性细胞杀伤。
通过与仅仅用制备缓冲液处理的情况相比PGP处理的肿瘤体积减小并且与制备缓冲液处理的肿瘤相比,PGP处理的肿瘤要花费显著更长的时间达到其最初体积的4倍来判断,施用PGP至从重组LoVo细胞或重组LoVo/母本LoVo细胞混合物建立的LoVo肿瘤可导致明显的抗肿瘤效应。相反,施用PGP至从未转染细胞建立的LoVo肿瘤中没有导致明显的抗肿瘤活性。
类似的研究可用于证明于适当的基因转换载体中转移至从未转染的母本LoVo细胞制备的LoVo肿瘤中的抗体酶基因当与PGP前体药物联合使用时可导致显著的抗肿瘤活性。因此,将未转染的LoVo细胞注射至无胸腺裸鼠(每只小鼠1×107个肿瘤细胞)中且一旦肿瘤为5-7mm的直径,将含有抗体-酶融合蛋白基因的载体注射至肿瘤内。使抗体-酶融合蛋白表达并结合至LoVo肿瘤细胞上1-7天后,按前述施用PGP前体药物。这与接受制备缓冲液而不是PGP前体药物的对照小鼠相比得到了显著的抗肿瘤活性。实施例22(鼠A5B7 Fab-CPG2)2融合蛋白的制备
基本上按国际专利申请WO 97/42329(Zeneca有限公司,1997年11月13日公开)的实施例48(d)部分中所述通过将在其C-端通过弹性的(G4S)3肽接头连接至CPG2上的A5B7轻链及A5B7 Fd基因克隆至pee14共表达载体中而由COS-7和CHO细胞表达(鼠A5B7 fab-CPG2)2
从(国际专利申请WO 96/20011(Zeneca有限公司)的参考实施例5的g部分中所述的)pAF8中分离鼠A5B7轻链。用EcoRI切割质粒pAF8并通过于1%琼脂糖凝胶上的电泳分离得到的732bp的片段。将此片段克隆入用EcoRI类似切割的pEE14(由Bebbington在方法:酶学方法指南(1991)2,136-145中所述)中并用得到的质粒转化大肠杆菌菌株DH5α。将转化的细胞铺板于含氨苄青霉素(100μg/ml)的L-琼脂上。通过DNA序列分析(SEQ ID NO:57)证实含有具有正确序列与方向质粒的克隆并将该质粒命名为pEE14/A5B7muVkmnCk。编码的信号序列(氨基酸残基1到22)和鼠轻链(氨基酸残基23到235)的氨基酸序列示于SEQ ID NO:58中。
从CPG2基因的R6变异体(实施例1d)和pAF1中的鼠A5B7 Fd序列(描述于国际专利申请WO 96/20011(Zeneca有限公司)参考实施例5中d部分中所述)中制备鼠Fd-CPG2基因。用寡核苷酸SEQ IDNOS:53和54对pAF1进行PCR反应得到247bp的片段。此片段用HindIII和BamHI切割并克隆入类似的pUC19中。得到的质粒用于转化大肠杆菌DH5α菌株。将转化的细胞铺盘于含氨苄青霉素(100μg/ml)的L琼脂上。将含有具有正确序列质粒的克隆命名为pUC19/muCH1/NcoI-AccIII(Fd)。用寡核苷酸SEQ ID NOS:55和56对pNG/VKss/CPG2/R6-neo(实施例1)的第二次PCR得到265bp的片段,用HindIII与EcoRI切割并克隆入类似上述切割的pUC19中以得到质粒pUC19/muCH1-接头-CPG2/AccIII-SacII。用HindIII和AccIII切割质粒pUC19/muCH1/NcoI-AccIII(Fd)并通过于1%琼脂糖凝胶上电泳而分离出258bp的片段。将此片段克隆入HindIII与AccIII切割的pUC19/muCH1-接头-CPG2/AccIII-SacII中以得到质粒pUC19/muCH1-接头-CPG2/AccIII-SacI。通过用SacII和EcoRI切割之而以pNG/VKss/CPG2/R6-neo中分离956bp的片段。将该片段克隆入SacII和EcoRI切割的pUC19/muCH1-接头-RC/CPG2(R6)。通过从pAF1中分离HindIII到NcoI片段的498bp的片段并将之克隆入HindIII与NcoI切割的pUC19/muCH1-接头-RC/CPG2(R6)中而制备完整的基因构建体。将得到的质粒用于转化大肠杆菌DH5α菌株。将转化的细胞铺盘于含有氨苄青霉素(100μg/ml)的L-琼脂上。含有具有正确序列与方向质粒的克隆通过DNA序列分析(SEQ ID NO:59)加以证实将将此质粒命名为pUC19/muA5B7-RC/CPG2(R6)。编码的信号序列(氨基酸残基1到19)与鼠Fd-接头-CPG2(氨基酸残基20到647)的氨基酸序列示于SEQ ID NO:60中作为选择,可通过全基因合成获取实施例1中所述的CPG2基因序列并按实施例1d中所转变为R6变异体。在该情况中,SEQ ID NO:59中位置933的碱基C变为G、SEQ ID NO:60的氨基酸序列保持不变。
为了在pEE14载体中的表达,将该基因首先克隆入pEE6(此为pee6.hCMV的衍生物stephems和Cockett,1989,核酸研究17,7110,其中的hCMV启动子上游的HindIII位点已转换成BglII位点)。质粒pUC19/muA5B7-RC/CPG2(R6)用HindIII和EcoRI切割并通过在1%的琼脂糖凝胶上电泳而分离1974bp的片段。将此克隆入大肠杆菌DH5α中HinDIII和EcoRI切割的pEE6中以得到质粒pEE6/muA5B7-RC/CPG2(R6)。通过首先以Bgl值和BamHI切割pEE6/muA5B7-RC/CPG2(R6)。并于1%琼脂糖凝胶上分离4300bp的片段而制备pEE114共表达载体。将此片段克隆入BglII和BamHI切割的pEE14/A5B7muCK中。将得到的质粒用于转化大胸杆菌DH5α菌株,将转化的细胞铺盘于含氨基卡青霉素(100μg/ml)的L琼脂上。通过DNA序列分析证实含有具有正确序列与方向质粒的克隆并将此质粒命名为pEE14/muA5B7-RC/CPG2(R6)。
为了(鼠A5B7 Fab-CPG2)2的表达,用质粒pEE14/muA5B7-RC/CPG2(R6)转染COS-7或XHO细胞,此操作按1997年11月13日公开的Zenoca有限公司的国际专利申请WO 97/42329的实施例48中所述进行。按实施例1中所述分析COS细胞上清和CHO克隆上清中的活性并且显示具有CEA结合和CPG2酶活性。实施例23药物组合物
下面说明含有可与适当的前体药物联合用于治疗的本发明基因构建体的代表性药物剂量形式。
用于肠道外或直接注射入肿瘤组织中的无菌水溶液,含有107-1011个包括实施例1中所述基因构建体的腺病毒颗粒。3-7天后,将3个1g剂量的前体药物以小时为间隔作为无菌液而施用。前体药物选自N-(4-[N,N-双(2-碘乙基)氨基]苯氧羰基)-L-谷氨酸,N-(4-[N,N-双(2-氯乙基)氨基]-苯氧羰基)-L-谷氨酸-γ-(3,5-二羧基)酰基苯胺或N-(4-[N,N-双(2-氯乙基)氨基]-苯氧羰基)-L-谷氨酸或其药物上可接受的盐。
                        序列表(1)一般信息:(i)申请人:
  (A)名称:Zeneca有限公司
  (B)街道:15 Stanhope Gate
  (C)城市:伦敦
  (D)联邦:英格兰
  (E)国家:英国
  (F)邮编(ZIP):W1Y 6LN
  (G)电话:0171 304 5000
  (H)电传:0171 304 5151
  (I)电报:0171 304 2042(ii)发明题目:化合物(iii)序列数目:60(iv)计算机可读形式:
  (A)介质类型:软盘
  (B)计算机:IBM PC兼容机
  (C)操作系统:PC-DOS/MS-DOS
  (D)软件:专利发布#1.0,#1.30版本(EPO)(iv)优先申请数据:
  (A)申请号:GB 9709421.3
  (B)提交日期:1997年5月10日(2)SEQ ID NO:1信息:(i)序列特征:
  (A)长度:21个碱基对
  (B)类型:核酸
  (C)链型:单链
  (D)拓扑学:线性(ii)分子类型:其它核酸(xi)序列描述:SEQ ID NO:1:GGGAATTCCT CGAGGAGCTC C                           21(2)SEQ ID NO:2信息:(i)序列特征:
  (A)长度:27个碱基对
  (B)类型:核酸
  (C)链型:单链
  (D)拓扑学:线性(ii)分子类型:其它核酸(xi)序列描述:SEQ ID NO:2:CCGGGGAGCT CCTCGAGGAA TTCCCGC                                       27(2)SEQ ID NO:3信息:(i)序列特征:
  (A)长度:18个碱基对
  (B)类型:核酸
  (C)链型:单链
  (D)拓扑学:线性(ii)分子类型:其它核酸(xi)序列描述:SEQ ID NO:3:CAGAAGCGCG ACAACGTG                                                 18(2)SEQ ID NO:4信息:(i)序列特征:
  (A)长度:39个碱基对
  (B)类型:核酸
  (C)链型:单链
  (D)拓扑学:线性(ii)分子类型:其它核酸(xi)序列描述:SEQ ID NO:4:CGAGGCCTTG CCGGTGATCT GGACCTGCAC GTAGGCGAT                          39(2)SEQ ID NO:5信息:(i)序列特征:
  (A)长度:63个碱基对
  (B)类型:核酸
  (C)链型:单链
  (D)拓扑学:线性(ii)分子类型:其它核酸(xi)序列描述:SEQ ID NO:5:GGGGATGATG TTCGAGACCT GGCCGGCCTT GGCGATGGTC CACTGGAAGC GCAGGTTCTT      60CGC                                                                    63(2)SEQ ID NO:6信息:(i)序列特征:
  (A)长度:18个碱基对
  (B)类型:核酸
  (C)链型:单链
  (D)拓扑学:线性(ii)分子类型:其它核酸(xi)序列描述:SEQ ID NO:6:CTTGCCGGCG CCCAGATC                                                    18(2)SEQ ID NO:7信息:(i)序列特征:
  (A)长度:18个碱基对
  (B)类型:核酸
  (C)链型:单链
  (D)拓扑学:线性(ii)分子类型:其它核酸(xi)序列描述:SEQ ID NO:7:GTCTCGAACA TCATCCCC                                                    18(2)SEQ ID NO:8信息:(i)序列特征:
  (A)长度:18个碱基对
  (B)类型:核酸
  (C)链型:单链
  (D)拓扑学:线性(ii)分子类型:其它核酸(xi)序列描述:SEQ ID NO:8:ATCACCGGCA AGGCCTCG                                                18(2)SEQ ID NO:9信息:(i)序列特征:
  (A)长度:1236个碱基对
  (B)类型:核酸
  (C)链型:单链
  (D)拓扑学:线性(ii)分子类型:其它核酸(xi)序列描述:SEQ ID NO:9:ATGGATTTTC AAGTGCAGAT TTTCAGCTTC CTGCTAATCA GTGCTTCAGT CATAATGTCC       60CGCGGGCAGA AGCGCGACAA CGTGCTGTTC CAGGCAGCTA CCGACGAGCA GCCGGCCGTG      120ATCAAGACGC TGGAGAAGCT GGTCAACATC GAGACCGGCA CCGGTGACGC CGAGGGCATC      180GCCGCTGCGG GCAACTTCCT CGAGGCCGAG CTCAAGAACC TCGGCTTCAC GGTCACGCGA      240AGCAAGTCGG CCGGCCTGGT GGTGGGCGAC AACATCGTGG GCAAGATCAA GGGCCGCGGC      300GGCAAGAACC TGCTGCTGAT GTCGCACATG GACACCGTCT ACCTCAAGGG CATTCTCGCG      360AAGGCCCCGT TCCGCGTCGA AGGCGACAAG GCCTACGGCC CGGGCATCGC CGACGACAAG      420GGCGGCAACG CGGTCATCCT GCACACGCTC AAGCTGCTGA AGGAATACGG CGTGCGCGAC      480TACGGCACCA TCACCGTGCT GTTCAACACC GACGAGGAAA AGGGTTCCTT CGGCTCGCGC      540GACCTGATCC AGGAAGAAGC CAAGCTGGCC GACTACGTGC TCTCCTTCGA GCCCACCAGC      600GCAGGCGACG AAAAACTCTC GCTGGGCACC TCGGGCATCG CCTACGTGCA GGTCCAGATC      660ACCGGCAAGG CCTCGCATGC CGGCGCCGCG CCCGAGCTGG GCGTGAACGC GCTGGTCGAG      720GCTTCCGACC TCGTGCTGCG CACGATGAAC ATCGACGACA AGGCGAAGAA CCTGCGCTTC      780CAGTGGACCA TCGCCAAGGC CGGCCAGGTC TCGAACATCA TCCCCGCCAG CGCCACGCTG      840AACGCCGACG TGCGCTACGC GCGCAACGAG GACTTCGACG CCGCCATGAA GACGCTGGAA      900GAGCGCGCGC AGCAGAAGAA GCTGCCCGAG GCCGACGTGA AGGTGATCGT CACGCGCGGC      960CGCCCGGCCT TCAATGCCGG CGAAGGCGGC AAGAAGCTGG TCGACAAGGC GGTGGCCTAC     1020TACAAGGAAG CCGGCGGCAC GCTGGGCGTG GAAGAGCGCA CCGGCGGCGG CACCGACGCG     1080GCCTACGCCG CGCTCTCAGG CAAGCCAGTG ATCGAGAGCC TGGGCCTGCC GGGCTTCGGC     1140TACCACAGCG ACAAGGCCGA GTACGTGGAC ATCAGCGCGA TTCCGCGCCG CCTGTACATG     1200GCTGCGCGCC TGATCATGGA TCTGGGCGCC GGCAAG                               1236(2)SEQ ID NO:10信息:(i)序列特征:
  (A)长度:412个氨基酸
  (B)类型:氨基酸
  (C)链型:单链
  (D)拓扑学:线性(ii)分子类型:蛋白质(xi)序列描述:SEQ ID NO:10:Met Asp Phe Gln Val Gln Ile Phe Ser Phe Leu Leu Ile Ser Ala Ser1               5                   10                  15Val Ile Met Ser Arg Gly Gln Lys Arg Asp Asn Val Leu Phe Gln Ala
        20                  25                  30Ala Thr Asp Glu Gln Pro Ala Val Ile Lys Thr Leu Glu Lys Leu Val
    35                  40                  45Asn Ile Glu Thr Gly Thr Gly Asp Ala Glu Gly Ile Ala Ala Ala Gly
50                  55                  60Asn Phe Leu Glu Ala Glu Leu Lys Asn Leu Gly Phe Thr Val Thr Arg65                  70                  75                  80Ser Lys Ser Ala Gly Leu Val Val Gly Asp Asn Ile Val Gly Lys Ile
            85                  90                  95Lys Gly Arg Gly Gly Lys Asn Leu Leu Leu Met Ser His Met Asp Thr
        100                 105                 110Val Tyr Leu Lys Gly Ile Leu Ala Lys Ala Pro Phe Arg Val Glu Gly
    115                 120                 125Asp Lys Ala Tyr Gly Pro Gly Ile Ala Asp Asp Lys Gly Gly Asn Ala
130                 135                 140Val Ile Leu His Thr Leu Lys Leu Leu Lys Glu Tyr Gly Val Arg Asp145                 150                 155                 160Tyr Gly Thr Ile Thr Val Leu Phe Asn Thr Asp Glu Glu Lys Gly Ser
            165                 170                 175Phe Gly Ser Arg Asp Leu Ile Gln Glu Glu Ala Lys Leu Ala Asp Tyr
        180                 185                 190Val Leu Ser Phe Glu Pro Thr Ser Ala Gly Asp Glu Lys Leu Ser Leu
    195                 200                 205Gly Thr Ser Gly Ile Ala Tyr Val Gln Val Gln Ile Thr Gly Lys Ala
210                 215                 220Ser His Ala Gly Ala Ala Pro Glu Leu Gly Val Asn Ala Leu Val Glu225                 230                 235                 240Ala Ser Asp Leu Val Leu Arg Thr Met Asn Ile Asp Asp Lys Ala Lys
            245                 250                 255Asn Leu Arg Phe Gln Trp Thr Ile Ala Lys Ala Gly Gln Val Ser Asn
        260                 265                 270Ile Ile Pro Ala Ser Ala Thr Leu Asn Ala Asp Val Arg Tyr Ala Arg
    275                 280                 285Asn Glu Asp Phe Asp Ala Ala Met Lys Thr Leu Glu Glu Arg Ala Gln
290                 295                 300Gln Lys Lys Leu Pro Glu Ala Asp Val Lys Val Ile Val Thr Arg Gly305                 310                 315                 320Arg Pro Ala Phe Asn Ala Gly Glu Gly Gly Lys Lys Leu Val Asp Lys
            325                 330                 335Ala Val Ala Tyr Tyr Lys Glu Ala Gly Gly Thr Leu Gly Val Glu Glu
        340                 345                 350Arg Thr Gly Gly Gly Thr Asp Ala Ala Tyr Ala Ala Leu Ser Gly Lys
    355                 360                 365Pro Val Ile Glu Ser Leu Gly Leu Pro Gly Phe Gly Tyr His Ser Asp
370                 375                 380Lys Ala Glu Tyr Val Asp Ile Ser Ala Ile Pro Arg Arg Leu Tyr Met385                 390                 395                 400Ala Ala Arg Leu Ile Met Asp Leu Gly Ala Gly Lys
            405                 410(2)SEQ ID NO:11信息:(i)序列特征:
  (A)长度:21个碱基对
  (B)类型:核酸
  (C)链型:单链
  (D)拓扑学:线性(ii)分子类型:其它核酸(xi)序列描述:SEQ ID NO:11:CCACTCTCAC AGTGAGCTCG G                                            21(2)SEQ ID NO:12信息:(i)序列特征:
  (A)长度:55个碱基对
  (B)类型:核酸
  (C)链型:单链
  (D)拓扑学:线性(ii)分子类型:其它核酸(xi)序列描述:SEQ ID NO:12:ACCGCTACCG CCACCACCAG AGCCACCACC GCCAACTGTC TTGTCCACCT TGGTG         55(2)SEQ ID NO:13信息:(i)序列特征:
  (A)长度:18个碱基对
  (B)类型:核酸
  (C)链型:单链
  (D)拓扑学:线性(ii)分子类型:其它核酸(xi)序列描述:SEQ ID NO:13:ACCCCCTCTA GAGTCGAC                                                  18(2)SEQ ID NO:14信息:(i)序列特征:
  (A)长度:54个碱基对
  (B)类型:核酸
  (C)链型:单链
  (D)拓扑学:线性(ii)分子类型:其它核酸(xi)序列描述:SEQ ID NO:14:TCTGGTGGTG GCGGTAGCGG TGGCGGGGGT TCCCAGAAGC GCGACAACGT GCTG          54(2)SEQ ID NO:15信息:(i)序列特征:
  (A)长度:1929个碱基对
  (B)类型:核酸
  (C)链型:单链
  (D)拓扑学:线性(ii)分子类型:其它核酸(xi)序列描述:SEQ ID NO:15:ATGGAGTTGT GGCTGAACTG GATTTTCCTT GTAACACTTT TAAATGGTAT CCAGTGTGAG      60GTGAAGCTGG TGGAGTCTGG AGGAGGCTTG GTACAGCCTG GGGGTTCTCT GAGACTCTCC     120TGTGCAACTT CTGGGTTCAC CTTCACTGAT TACTACATGA ACTGGGTCCG CCAGCCTCCA     180GGAAAGGCAC TTGAGTGGTT GGGTTTTATT GGAAACAAAG CTAATGGTTA CACAACAGAG     240TACAGTGCAT CTGTGAAGGG TCGGTTCACC ATCTCCAGAG ATAAATCCCA AAGCATCCTC     300TATCTTCAAA TGAACACCCT GAGAGCTGAG GACAGTGCCA CTTATTACTG TACAAGAGAT     360AGGGGGCTAC GGTTCTACTT TGACTACTGG GGCCAAGGCA CCACTCTCAC AGTGAGCTCG     420GCTAGCACCA AGGGACCATC GGTCTTCCCC CTGGCCCCCT GCTCCAGGAG CACCTCCGAG     480AGCACAGCCG CCCTGGGCTG CCTGGTCAAG GACTACTTCC CCGAACCGGT GACGGTGTCG     540TGGAACTCAG GCGCTCTGAC CAGCGGCGTG CACACCTTCC CGGCTGTCCT ACAGTCCTCA     600GGACTCTACT CCCTCAGCAG CGTCGTGACG GTGCCCTCCA GCAACTTCGG CACCCAGACC     660TACACCTGCA ACGTAGATCA CAAGCCCAGC AACACCAAGG TGGACAAGAC AGTTGGCGGT     720GGTGGCTCTG GTGGTGGCGG TAGCGGTGGC GGGGGTTCCC AGAAGCGCGA CAACGTGCTG     780TTCCAGGCAG CTACCGACGA GCAGCCGGCC GTGATCAAGA CGCTGGAGAA GCTGGTCAAC     840ATCGAGACCG GCACCGGTGA CGCCGAGGGC ATCGCCGCTG CGGGCAACTT CCTCGAGGCC     900GAGCTCAAGA ACCTCGGCTT CACGGTCACG CGAAGCAAGT CGGCCGGCCT GGTGGTGGGC     960GACAACATCG TGGGCAAGAT CAAGGGCCGC GGCGGCAAGA ACCTGCTGCT GATGTCGCAC    1020ATGGACACCG TCTACCTCAA GGGCATTCTC GCGAAGGCCC CGTTCCGCGT CGAAGGCGAC    1080AAGGCCTACG GCCCGGGCAT CGCCGACGAC AAGGGCGGCA ACGCGGTCAT CCTGCACACG    1140CTCAAGCTGC TGAAGGAATA CGGCGTGCGC GACTACGGCA CCATCACCGT GCTGTTCAAC    1200ACCGACGAGG AAAAGGGTTC CTTCGGCTCG CGCGACCTGA TCCAGGAAGA AGCCAAGCTG    1260GCCGACTACG TGCTCTCCTT CGAGCCCACC AGCGCAGGCG ACGAAAAACT CTCGCTGGGC    1320ACCTCGGGCA TCGCCTACGT GCAGGTCCAG ATCACCGGCA AGGCCTCGCA TGCCGGCGCC    1380GCGCCCGAGC TGGGCGTGAA CGCGCTGGTC GAGGCTTCCG ACCTCGTGCT GCGCACGATG    1440AACATCGACG ACAAGGCGAA GAACCTGCGC TTCCAGTGGA CCATCGCCAA GGCCGGCCAG    1500GTCTCGAACA TCATCCCCGC CAGCGCCACG CTGAACGCCG ACGTGCGCTA CGCGCGCAAC    1560GAGGACTTCG ACGCCGCCAT GAAGACGCTG GAAGAGCGCG CGCAGCAGAA GAAGCTGCCC    1620GAGGCCGACG TGAAGGTGAT CGTCACGCGC GGCCGCCCGG CCTTCAATGC CGGCGAAGGC    1680GGCAAGAAGC TGGTCGACAA GGCGGTGGCC TACTACAAGG AAGCCGGCGG CACGCTGGGC    1740GTGGAAGAGC GCACCGGCGG CGGCACCGAC GCGGCCTACG CCGCGCTCTC AGGCAAGCCA    1800GTGATCGAGA GCCTGGGCCT GCCGGGCTTC GGCTACCACA GCGACAAGGC CGAGTACGTG    1860GACATCAGCG CGATTCCGCG CCGCCTGTAC ATGGCTGCGC GCCTGATCAT GGATCTGGGC    1920GCCGGCAAG                                                            1929(2)SEQ ID NO:16信息:(i)序列特征:
  (A)长度:643个氨基酸
  (B)类型:氨基酸
  (C)链型:单链
  (D)拓扑学:线性(ii)分子类型:蛋白质(xi)序列描述:SEQ ID NO:16:Met Glu Leu Trp Leu Asn Trp Ile Phe Leu Val Thr Leu Leu Asn Gly1               5                   10                  15Ile Gln Cys Glu Val Lys Leu Val Glu Ser Gly Gly Gly Leu Val Gln
        20                  25                  30Pro Gly Gly Ser Leu Arg Leu Ser Cys Ala Thr Ser Gly Phe Thr Phe
    35                  40                  45Thr Asp Tyr Tyr Met Asn Trp Val Arg Gln Pro Pro Gly Lys Ala Leu
50                  55                  60Glu Trp Leu Gly Phe Ile Gly Asn Lys Ala Asn Gly Tyr Thr Thr Glu65                  70                  75                  80Tyr Ser Ala Ser Val Lys Gly Arg Phe Thr Ile Ser Arg Asp Lys Ser
            85                  90                  95Gln Ser Ile Leu Tyr Leu Gln Met Asn Thr Leu Arg Ala Glu Asp Ser
        100                 105                 110Ala Thr Tyr Tyr Cys Thr Arg Asp Arg Gly Leu Arg Phe Tyr Phe Asp
    115                 120                 125Tyr Trp Gly Gln Gly Thr Thr Leu Thr Val Ser Ser Ala Ser Thr Lys
130                 135                 140Gly Pro Ser Val Phe Pro Leu Ala Pro Cys Ser Arg Ser Thr Ser Glu145                 150                 155                 160Ser Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro
            165                 170                 175Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr
        180                 185                 190Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val
    195                 200                 205Val Thr Val Pro Ser Ser Asn Phe Gly Thr Gln Thr Tyr Thr Cys Asn
210                 215                 220Val Asp His Lys Pro Ser Asn Thr Lys Val Asp Lys Thr Val Gly Gly225                 230                 235                 240Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gln Lys Arg
            245                 250                 255Asp Asn Val Leu Phe Gln Ala Ala Thr Asp Glu Gln Pro Ala Val Ile
        260                 265                 270Lys Thr Leu Glu Lys Leu Val Asn Ile Glu Thr Gly Thr Gly Asp Ala
    275                 280                 285Glu Gly Ile Ala Ala Ala Gly Asn Phe Leu Glu Ala Glu Leu Lys Asn
290                 295                 300Leu Gly Phe Thr Val Thr Arg Ser Lys Ser Ala Gly Leu Val Val Gly305                 310                 315                 320Asp Asn Ile Val Gly Lys Ile Lys Gly Arg Gly Gly Lys Asn Leu Leu
            325                 330                 335Leu Met Ser His Met Asp Thr Val Tyr Leu Lys Gly Ile Leu Ala Lys
        340                 345                 350Ala Pro Phe Arg Val Glu Gly Asp Lys Ala Tyr Gly Pro Gly Ile Ala
    355                 360                 365Asp Asp Lys Gly Gly Asn Ala Val Ile Leu His Thr Leu Lys Leu Leu
370                 375                 380Lys Glu Tyr Gly Val Arg Asp Tyr Gly Thr Ile Thr Val Leu Phe Asn385                 390                 395                 400Thr Asp Glu Glu Lys Gly Ser Phe Gly Ser Arg Asp Leu Ile Gln Glu
            405                 410                 415Glu Ala Lys Leu Ala Asp Tyr Val Leu Ser Phe Glu Pro Thr Ser Ala
        420                 425                 430Gly Asp Glu Lys Leu Ser Leu Gly Thr Ser Gly Ile Ala Tyr Val Gln
    435                 440                 445Val Gln Ile Thr Gly Lys Ala Ser His Ala Gly Ala Ala Pro Glu Leu
450                 455                 460Gly Val Asn Ala Leu Val Glu Ala Ser Asp Leu Val Leu Arg Thr Met465                 470                 475                 480Asn Ile Asp Asp Lys Ala Lys Asn Leu Arg Phe Gln Trp Thr Ile Ala
            485                 490                 495Lys Ala Gly Gln Val Ser Asn Ile Ile Pro Ala Ser Ala Thr Leu Asn
        500                 505                 510Ala Asp Val Arg Tyr Ala Arg Asn Glu Asp Phe Asp Ala Ala Met Lys
    515                 520                 525Thr Leu Glu Glu Arg Ala Gln Gln Lys Lys Leu Pro Glu Ala Asp Val
530                 535                 540Lys Val Ile Val Thr Arg Gly Arg Pro Ala Phe Asn Ala Gly Glu Gly545                 550                 555                 560Gly Lys Lys Leu Val Asp Lys Ala Val Ala Tyr Tyr Lys Glu Ala Gly
            565                 570                 575Gly Thr Leu Gly Val Glu Glu Arg Thr Gly Gly Gly Thr Asp Ala Ala
        580                 585                 590Tyr Ala Ala Leu Ser Gly Lys Pro Val Ile Glu Ser Leu Gly Leu Pro
    595                 600                 605Gly Phe Gly Tyr His Ser Asp Lys Ala Glu Tyr Val Asp Ile Ser Ala
610                 615                 620Ile Pro Arg Arg Leu Tyr Met Ala Ala Arg Leu Ile Met Asp Leu Gly625                 630                 635                 640Ala Gly Lys(2)SEQ ID NO:17信息:(i)序列特征:
  (A)长度:705个碱基对
  (B)类型:核酸
  (C)链型:单链
  (D)拓扑学:线性(ii)分子类型:其它核酸(xi)序列描述:SEQ ID NO:17:ATGGATTTTC AAGTGCAGAT TTTCAGCTTC CTGCTAATCA GTGCTTCAGT CATAATGTCC       60AGAGGACAAA CTGTTCTCTC CCAGTCTCCA GCAATCCTGT CTGCATCTCC AGGGGAGAAG      120GTCACAATGA CTTGCAGGGC CAGCTCAAGT GTAACTTACA TTCACTGGTA CCAGCAGAAG      180CCAGGTTCCT CCCCCAAATC CTGGATTTAT GCCACATCCA ACCTGGCTTC TGGAGTCCCT      240GCTCGCTTCA GTGGCAGTGG GTCTGGGACC TCTTACTCTC TCACAATCAG CAGAGTGGAG      300GCTGAAGATG CTGCCACTTA TTACTGCCAA CATTGGAGTA GTAAACCACC GACGTTCGGT      360GGAGGCACCA AGCTCGAGAT CAAACGGACT GTGGCTGCAC CATCTGTCTT CATCTTCCCG      420CCATCTGATG AGCAGTTGAA ATCTGGAACT GCCTCTGTTG TGTGCCTGCT GAATAACTTC      480TATCCCAGAG AGGCCAAAGT ACAGTGGAAG GTGGATAACG CCCTCCAATC GGGTAACTCC      540CAGGAGAGTG TCACAGAGCA GGACAGCAAG GACAGCACCT ACAGCCTCAG CAGCACCCTG      600ACGCTGAGCA AAGCAGACTA CGAGAAACAC AAAGTCTACG CCTGCGAAGT CACCCATCAG      660GGCCTGAGTT CGCCCGTCAC AAAGAGCTTC AACAGGGGAG AGTGT                      705(2)SEQ ID NO:18信息:(i)序列特征:
  (A)长度:235个氨基酸
  (B)类型:氨基酸
  (C)链型:单链
  (D)拓扑学:线性(ii)分子类型:蛋白质(xi)序列描述:SEQ ID NO:18:Met Asp Phe Gln Val Gln Ile Phe Ser Phe Leu Leu Ile Ser Ala Ser1               5                   10                  15Val Ile Met Ser Arg Gly Gln Thr Val Leu Ser Gln Ser Pro Ala Ile
        20                  25                  30Leu Ser Ala Ser Pro Gly Glu Lys Val Thr Met Thr Cys Arg Ala Ser
    35                  40                  45Ser Ser Val Thr Tyr Ile His Trp Tyr Gln Gln Lys Pro Gly Ser Ser
50                  55                  60Pro Lys Ser Trp Ile Tyr Ala Thr Ser Asn Leu Ala Ser Gly Val Pro65                  70                  75                  80Ala Arg Phe Ser Gly Ser Gly Ser Gly Thr Ser Tyr Ser Leu Thr Ile
            85                  90                  95Ser Arg Val Glu Ala Glu Asp Ala Ala Thr Tyr Tyr Cys Gln His Trp
        100                 105                 110Ser Ser Lys Pro Pro Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile Lys
    115                 120                 125Arg Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu
130                 135                 140Gln Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe145                 150                 155                 160Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln
            165                 170                 175Ser Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser
        180                 185                 190Thr Tyr Ser Leu Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu
    195                 200                 205Lys His Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser
210                 215                 220Pro Val Thr Lys Ser Phe Asn Arg Gly Glu Cys225                 230                 235(2)SEQ ID NO:19信息:(i)序列特征:
  (A)长度:39个碱基对
  (B)类型:核酸
  (C)链型:单链
  (D)拓扑学:线性(ii)分子类型:其它核酸(xi)序列描述:SEQ ID NO:9:AAGCTTGAAT TCGCCGCCAC TATGGATTTT CAAGTGCAG                             39(2)SEQ ID NO:20信息:(i)序列特征:
  (A)长度:44个碱基对
  (B)类型:核酸
  (C)链型:单链
  (D)拓扑学:线性(ii)分子类型:其它核酸(xi)序列描述:SEQ ID NO:20:TTAATTGGAT CCGAGCTCCT ATTAACACTC TCCCCTGTTG AAGC                       44(2)SEQ ID NO:21信息:(i)序列特征:
  (A)长度:50个碱基对
  (B)类型:核酸
  (C)链型:单链
  (D)拓扑学:线性(ii)分子类型:其它核酸(xi)序列描述:SEQ ID NO:21:AAGCTTCCGG ATCCCTGCAG CCATGGAGTT GTGGCTGAAC TGGATTTTCC                 50(2)SEQ ID NO:22信息:(i)序列特征:
  (A)长度:38个碱基对
  (B)类型:核酸
  (C)链型:单链
  (D)拓扑学:线性(ii)分子类型:其它核酸(xi)序列描述:SEQ ID NO:22:AAGCTTAGTC TAGATTATCA CTTGCCGGCG CCCAGATC                              38(2)SEQ ID NO:23信息:(i)序列特征:
  (A)长度:46个碱基对
  (B)类型:核酸
  (C)链型:单链
  (D)拓扑学:线性(ii)分子类型:其它核酸(xi)序列描述:SEQ ID NO:23:CGGGGGATCC AGATCTGAGC TCCTGTAGAC GTCGACATTA ATTCCG                     46(2)SEQ ID NO:24信息:(i)序列特征:
  (A)长度:30个碱基对
  (B)类型:核酸
  (C)链型:单链
  (D)拓扑学:线性(ii)分子类型:其它核酸(xi)序列描述:SEQ ID NO:24:GGAAAATCCA GTTCAGCCAC AACTCCATGG                                       30(2)SEQ ID NO:25信息:(i)序列特征:
  (A)长度:1926个碱基对
  (B)类型:核酸
  (C)链型:单链
  (D)拓扑学:线性(ii)分子类型:其它核酸(xi)序列描述:SEQ ID NO:25:ATGAAGTTGT GGCTGAACTG GATTTTCCTT GTAACACTTT TAAATGGAAT TCAGTGTGAG        60GTGCAGCTGC AGCAGTCTGG GGCAGAGCTT GTGAGGTCAG GGGCCTCAGT CAAGTTGTCC       120TGCACAGCTT CTGGCTTCAA CATTAAAGAC AACTATATGC ACTGGGTGAA GCAGAGGCCT       180GAACAGGGCC TGGAGTGGAT TGCATGGATT GATCCTGAGA ATGGTGATAC TGAATATGCC       240CCGAAGTTCC GGGGCAAGGC CACTTTGACT GCAGACTCAT CCTCCAACAC AGCCTACCTG       300CACCTCAGCA GCCTGACATC TGAGGACACT GCCGTCTATT ACTGTCATGT CCTGATCTAT       360GCTGGTTATT TGGCTATGGA CTACTGGGGT CAAGGAACCT CAGTCGCCGT GAGCTCGGCT       420AGCACCAAGG GACCATCGGT CTTCCCCCTG GCCCCCTGCT CCAGGAGCAC CTCCGAGAGC       480ACAGCCGCCC TGGGCTGCCT GGTCAAGGAC TACTTCCCCG AACCGGTGAC GGTGTCGTGG       540AACTCAGGCG CTCTGACCAG CGGCGTGCAC ACCTTCCCGG CTGTCCTACA GTCCTCAGGA       600CTCTACTCCC TCAGCAGCGT CGTGACGGTG CCCTCCAGCA ACTTCGGCAC CCAGACCTAC       660ACCTGCAACG TAGATCACAA GCCCAGCAAC ACCAAGGTGG ACAAGACAGT TGGCGGTGGT       720GGCTCTGGTG GTGGCGGTAG CGGTGGCGGG GGTTCCCAGA AGCGCGACAA CGTGCTGTTC       760CAGGCAGCTA CCGACGAGCA GCCGGCCGTG ATCAAGACGC TGGAGAAGCT GGTCAACATC       840GAGACCGGCA CCGGTGACGC CGAGGGCATC GCCGCTGCGG GCAACTTCCT CGAGGCCGAG       900CTCAAGAACC TCGGCTTCAC GGTCACGCGA AGCAAGTCGG CCGGCCTGGT GGTGGGCGAC       960AACATCGTGG GCAAGATCAA GGGCCGCGGC GGCAAGAACC TGCTGCTGAT GTCGCACATG     1020GACACCGTCT ACCTCAAGGG CATTCTCGCG AAGGCCCCGT TCCGCGTCGA AGGCGACAAG     1080GCCTACGGCC CGGGCATCGC CGACGACAAG GGCGGCAACG CGGTCATCCT GCACACGCTC     1140AAGCTGCTGA AGGAATACGG CGTGCGCGAC TACGGCACCA TCACCGTGCT GTTCAACACC     1200GACGAGGAAA AGGGTTCCTT CGGCTCGCGC GACCTGATCC AGGAAGAAGC CAAGCTGGCC     1260GACTACGTGC TCTCCTTCGA GCCCACCAGC GCAGGCGACG AAAAACTCTC GCTGGGCACC     1320TCGGGCATCG CCTACGTGCA GGTCCAGATC ACCGGCAAGG CCTCGCATGC CGGCGCCGCG     1380CCCGAGCTGG GCGTGAACGC GCTGGTCGAG GCTTCCGACC TCGTGCTGCG CACGATGAAC     1440ATCGACGACA AGGCGAAGAA CCTGCGCTTC CAGTGGACCA TCGCCAAGGC CGGCCAGGTC     1500TCGAACATCA TCCCCGCCAG CGCCACGCTG AACGCCGACG TGCGCTACGC GCGCAACGAG     1560GACTTCGACG CCGCCATGAA GACGCTGGAA GAGCGCGCGC AGCAGAAGAA GCTGCCCGAG     1620GCCGACGTGA AGGTGATCGT CACGCGCGGC CGCCCGGCCT TCAATGCCGG CGAAGGCGGC     1680AAGAAGCTGG TCGACAAGGC GGTCGCCTAC TACAAGGAAG CCGGCGGCAC GCTGGGCGTG     1740GAAGAGCGCA CCGGCGGCGG CACCGACGCG GCCTACGCCG CGCTCTCAGG CAAGCCAGTG     1800ATCGAGAGCC TGGGCCTGCC GGGCTTCGGC TACCACAGCG ACAAGGCCGA GTACGTGGAC     1860ATCAGCGCGA TTCCGCGCCG CCTGTACATG GCTGCGCGCC TGATCATGGA TCTGGGCGCC     1920GGCAAG                                                                1926(2)SEQ ID NO:26信息:(i)序列特征:
  (A)长度:642个氨基酸
  (B)类型:氨基酸
  (C)链型:单链
  (D)拓扑学:线性(ii)分子类型:蛋白质(xi)序列描述:SEQ ID NO:26:Met Lys Leu Trp Leu Asn Trp Ile Phe Leu Val Thr Leu Leu Asn Gly1               5                   10                  15Ile Gln Cys Glu Val Gln Leu Gln Gln Ser Gly Ala Glu Leu Val Arg
        20                  25                  30Ser Gly Ala Ser Val Lys Leu Ser Cys Thr Ala Ser Gly Phe Asn Ile
    35                  40                  45Lys Asp Asn Tyr Met His Trp Val Lys Gln Arg Pro Glu Gln Gly Leu
50                  55                  60Glu Trp Ile Ala Trp Ile Asp Pro Glu Asn Gly Asp Thr Glu Tyr Ala65                  70                  75                  80Pro Lys Phe Arg Gly Lys Ala Thr Leu Thr Ala Asp Ser Ser Ser Asn
            85                  90                  95Thr Ala Tyr Leu His Leu Ser Ser Leu Thr Ser Glu Asp Thr Ala Val
        100                 105                 110Tyr Tyr Cys His Val Leu Ile Tyr Ala Gly Tyr Leu Ala Met Asp Tyr
    115                 120                 125Trp Gly Gln Gly Thr Ser Val Ala Val Ser Ser Ala Ser Thr Lys Gly
130                 135                 140Pro Ser Val Phe Pro Leu Ala Pro Cys Ser Arg Ser Thr Ser Glu Ser145                 150                 155                 160Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro Val
            165                 170                 175Thr Val Ser Trp Asn Sar Gly Ala Leu Thr Ser Gly Val His Thr Phe
        180                 185                 190Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val
    195                 200                 205Thr Val Pro Ser Ser Asn Phe Gly Thr Gln Thr Tyr Thr Cys Asn Val
210                 215                 220Asp His Lys Pro Ser Asn Thr Lys Val Asp Lys Thr Val Gly Gly Gly225                 230                 235                 240Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gln Lys Arg Asp
            245                 250                 255Asn Val Leu Phe Gln Ala Ala Thr Asp Glu Gln Pro Ala Val Ile Lys
        260                 265                 270Thr Leu Glu Lys Leu Val Asn Ile Glu Thr Gly Thr Gly Asp Ala Glu
    275                 280                 285Gly Ile Ala Ala Ala Gly Asn Phe Leu Glu Ala Glu Leu Lys Asn Leu
290                 295                 300Gly Phe Thr Val Thr Arg Ser Lys Ser Ala Gly Leu Val Val Gly Asp305                 310                 315                 320Asn Ile Val Gly Lys Ile Lys Gly Arg Gly Gly Lys Asn Leu Leu Leu
            325                 330                 335Met Ser His Met Asp Thr Val Tyr Leu Lys Gly Ile Leu Ala Lys Ala
        340                 345                 350Pro Phe Arg Val Glu Gly Asp Lys Ala Tyr Gly Pro Gly Ile Ala Asp
    355                 360                 365Asp Lys Gly Gly Asn Ala Val Ile Leu His Thr Leu Lys Leu Leu Lys
370                 375                 380Glu Tyr Gly Val Arg Asp Tyr Gly Thr Ile Thr Val Leu Phe Asn Thr385                 390                 395                 400Asp Glu Glu Lys Gly Ser Phe Gly Ser Arg Asp Leu Ile Gln Glu Glu
            405                 410                 415Ala Lys Leu Ala Asp Tyr Val Leu Ser Phe Glu Pro Thr Ser Ala Gly
        420                 425                 430Asp Glu Lys Leu Ser Leu Gly Thr Ser Gly Ile Ala Tyr Val Gln Val
    435                 440                 445Gln Ile Thr Gly Lys Ala Ser His Ala Gly Ala Ala Pro Glu Leu Gly
450                 455                 460Val Asn Ala Leu Val Glu Ala Ser Asp Leu Val Leu Arg Thr Met Asn465                 470                 475                 480Ile Asp Asp Lys Ala Lys Asn Leu Arg Phe Gln Trp Thr Ile Ala Lys
            485                 490                 495Ala Gly Gln Val Ser Asn Ile Ile Pro Ala Ser Ala Thr Leu Asn Ala
        500                 505                 510Asp Val Arg Tyr Ala Arg Asn Glu Asp Phe Asp Ala Ala Met Lys Thr
    515                 520                 525Leu Glu Glu Arg Ala Gln Gln Lys Lys Leu Pro Glu Ala Asp Val Lys
530                 535                 540Val Ile Val Thr Arg Gly Arg Pro Ala Phe Asn Ala Gly Glu Gly Gly545                 550                 555                 560Lys Lys Leu Val Asp Lys Ala Val Ala Tyr Tyr Lys Glu Ala Gly Gly
            565                 570                 575Thr Leu Gly Val Glu Glu Arg Thr Gly Gly Gly Thr Asp Ala Ala Tyr
        580                 585                 590Ala Ala Leu Ser Gly Lys Pro Val Ile Glu Ser Leu Gly Leu Pro Gly
    595                 600                 605Phe Gly Tyr His Ser Asp Lys Ala Glu Tyr Val Asp Ile Ser Ala Ile
610                  615                620Pro Arg Arg Leu Tyr Met Ala Ala Arg Leu Ile Met Asp Leu Gly Ala625                 630                 635                 640Gly Lys(2)SEQ ID NO:27信息:(i)序列特征:
  (A)长度:39个碱基对
  (B)类型:核酸
  (C)链型:单链
  (D)拓扑学:线性(ii)分子类型:其它核酸(xi)序列描述:SEQ ID NO:27:AAGCTTGGAA TTCAGTGTCA GGTCCAACTG CAGCAGCCT                             39(2)SEQ ID NO:28信息:(i)序列特征:
  (A)长度:54个碱基对
  (B)类型:核酸
  (C)链型:单链
  (D)拓扑学:线性(ii)分子类型:其它核酸(xi)序列描述:SEQ  ID  NO:28:GCTACCGCCA CCTCCGGAGC CACCACCGCC CCGTTTGATC TCGAGCTTGG TGCC            54(2)SEQ ID NO:29信息:(i)序列特征:
  (A)长度:58个碱基对
  (B)类型:核酸
  (C)链型:单链
  (D)拓扑学:线性(ii)分子类型:其它核酸(xi)序列描述:SEQ ID NO:29:TCCGGAGGTG GCGGTAGCGG TGGCGGGGGT TCCCAGAAGC GCGACAACGT GCTGTTCC        58(2)SEQ ID NO:30信息:(i)序列特征:
  (A)长度:24个碱基对
  (B)类型:核酸
  (C)链型:单链
  (D)拓扑学:线性(ii)分子类型:其它核酸(xi)序列描述:SEQ ID NO:30:CCTCGAGGAA TTCTTTCACT TGCC                                             24(2)SEQ ID NO:31信息:(i)序列特征:
  (A)长度:2019个碱基对
  (B)类型:核酸
  (C)链型:单链
  (D)拓扑学:线性(ii)分子类型:其它核酸(xi)序列描述:SEQ ID NO:31:ATGAAGTTGT GGCTGAACTG GATTTTCCTT GTAACACTTT TAAATGGAAT TCAGTGTCAG       60GTCCAACTGC AGCAGCCTGG GGCTGAACTG GTGAAGCCTG GGGCTTCAGT GCAGCTGTCC      120TGCAAGGCTT CTGGCTACAC CTTCACCGGC TACTGGATAC ACTGGGTGAA GCAGAGGCCT      180GGACAAGGCC TTGAGTGGAT TGGAGAGGTT AATCCTAGTA CCGGTCGTTC TGACTACAAT      240GAGAAGTTCA AGAACAAGGC CACACTGACT GTAGACAAAT CCTCCACCAC AGCCTACATG      300CAACTCAGCA GCCTGACATC TGAGGACTCT GCGGTCTATT ACTGTGCAAG AGAGAGGGCC      360TATGGTTACG ACGATGCTAT GGACTACTGG GGCCAAGGGA CCACGGTCAC CGTCTCCTCA      420GGTGGCGGTG GCTCGGGCGG TGGTGGGTCG GGTGGCGGCG GATCTGACAT TGAGCTCTCA      480CAGTCTCCAT CCTCCCTGGC TGTGTCAGCA GGAGAGAAGG TCACCATGAG CTGCAAATCC      540AGTCAGAGTC TCCTCAACAG TAGAACCCGA AAGAACTACT TGGCTTGGTA CCAGCAGAGA      600CCAGGGCAGT CTCCTAAACT GCTGATCTAT TGGGCATCCA CTAGGACATC TGGGGTCCCT      660GATCGCTTCA CAGGCAGTGG ATCTGGGACA GATTTCACTC TCACCATCAG CAGTGTGCAG      720GCTGAAGACC TGGCAATTTA TTACTGCAAG CAATCTTATA CTCTTCGGAC GTTCGGTGGA      780GGCACCAAGC TCGAGATCAA ACGGGGCGGT GGTGGCTCCG GAGGTGGCGG TAGCGGTGGC      840GGGGGTTCCC AGAAGCGCGA CAACGTGCTG TTCCAGGCAG CTACCGACGA GCAGCCGGCC      900GTGATCAAGA CGCTGGAGAA GCTGGTCAAC ATCGAGACCG GCACCGGTGA CGCCGAGGGC      960ATCGCCGCTG CGGGCAACTT CCTCGAGGCC GAGCTCAAGA ACCTCGGCTT CACGGTCACG     1020CGAAGCAAGT CGGCCGGCCT GGTGGTGGGC GACAACATCG TGGGCAAGAT CAAGGGCCGC     1080GGCGGCAAGA ACCTGCTGCT GATGTCGCAC ATGGACACCG TCTACCTCAA GGGCATTCTC     1140GCGAAGGCCC CGTTCCGCGT CGAAGGCGAC AAGGCCTACG GCCCGGGCAT CGCCGACGAC     1200AAGGGCGGCA ACGCGGTCAT CCTGCACACG CTCAAGCTGC TGAAGGAATA CGGCGTGCGC     1260GACTACGGCA CCATCACCGT GCTGTTCAAC ACCGACGAGG AAAAGGGTTC CTTCGGCTCG     1320CGCGACCTGA TCCAGGAAGA AGCCAAGCTG GCCGACTACG TGCTCTCCTT CGAGCCCACC     1380AGCGCAGGCG ACGAAAAACT CTCGCTGGGC ACCTCGGGCA TCGCCTACGT GCAGGTCCAG     1440ATCACCGGCA AGGCCTCGCA TGCCGGCGCC GCGCCCGAGC TGGGCGTGAA CGCGCTGGTC     1500GAGGCTTCCG ACCTCGTGCT GCGCACGATG AACATCGACG ACAAGGCGAA GAACCTGCGC     1560TTCCAGTGGA CCATCGCCAA GGCCGGCCAG GTCTCGAACA TCATCCCCGC CAGCGCCACG     1620CTGAACGCCG ACGTGCGCTA CGCGCGCAAC GAGGACTTCG ACGCCGCCAT GAAGACGCTG     1680GAAGAGCGCG CGCAGCAGAA GAAGCTGCCC GAGGCCGACG TGAAGGTGAT CGTCACGCGC     1740GGCCGCCCGG CCTTCAATGC CGGCGAAGGC GGCAAGAAGC TGGTCGACAA GGCGGTGGCC     1800TACTACAAGG AAGCCGGCGG CACGCTGGGC GTGGAAGAGC GCACCGGCGG CGGCACCGAC     1860GCGGCCTACG CCGCGCTCTC AGGCAAGCCA GTGATCGAGA GCCTGGGCCT GCCGGGCTTC     1920GGCTACCACA GCGACAAGGC CGAGTACGTG GACATCAGCG CGATTCCGCG CCGCCTGTAC     1980ATGGCTGCGC GCCTGATCAT GGATCTGGGC GCCGGCAAG                            2019(2)SEQ ID NO:32信息:(i)序列特征:
  (A)长度:673个氨基酸
  (B)类型:氨基酸
  (C)链型:单链
  (D)拓扑学:线性(ii)分子类型:蛋白质(xi)序列描述:SEQ ID NO:32:Met Lys Leu Trp Leu Asn Trp Ile Phe Leu Val Thr Leu Leu Asn Gly1               5                   10                  15Ile Gln Cys Gln Val Gln Leu Gln Gln Pro Gly Ala Glu Leu Val Lys
        20                  25                  30Pro Gly Ala Ser Val Gln Leu Ser Cys Lys Ala Ser Gly Tyr Thr Phe
    35                  40                  45Thr Gly Tyr Trp Ile His Trp Val Lys Gln Arg Pro Gly Gln Gly Leu
50                  55                  60Glu Trp Ile Gly Glu Val Asn Pro Ser Thr Gly Arg Ser Asp Tyr Asn65                  70                  75                  80Glu Lys Phe Lys Asn Lys Ala Thr Leu Thr Val Asp Lys Ser Ser Thr
            85                  90                  95Thr Ala Tyr Met Gln Leu Ser Ser Leu Thr Ser Glu Asp Ser Ala Val
        100                 105                 110Tyr Tyr Cys Ala Arg Glu Arg Ala Tyr Gly Tyr Asp Asp Ala Met Asp
    115                 120                 125Tyr Trp Gly Gln Gly Thr Thr Val Thr Val Ser Ser Gly Gly Gly Gly
130                 135                 140Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Asp Ile Glu Leu Ser145                 150                 155                 160Gln Ser Pro Ser Ser Leu Ala Val Ser Ala Gly Glu Lys Val Thr Met
            165                 170                 175Ser Cys Lys Ser Ser Gln Ser Leu Leu Asn Ser Arg Thr Arg Lys Asn
        180                 185                 190Tyr Leu Ala Trp Tyr Gln Gln Arg Pro Gly Gln Ser Pro Lys Leu Leu
    195                 200                 205Ile Tyr Trp Ala Ser Thr Arg Thr Ser Gly Val Pro Asp Arg Phe Thr
210                 215                 220Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Val Gln225                 230                 235                 240Ala Glu Asp Leu Ala Ile Tyr Tyr Cys Lys Gln Ser Tyr Thr Leu Arg
            245                 250                 255Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile Lys Arg Gly Gly Gly Gly
        260                 265                 270Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gln Lys Arg Asp Asn
    275                 280                 285Val Leu Phe Gln Ala Ala Thr Asp Glu Gln Pro Ala Val Ile Lys Thr
290                 295                 300Leu Glu Lys Leu Val Asn Ile Glu Thr Gly Thr Gly Asp Ala Glu Gly305                 310                 315                 320Ile Ala Ala Ala Gly Asn Phe Leu Glu Ala Glu Leu Lys Asn Leu Gly
            325                 330                 335Phe Thr Val Thr Arg Ser Lys Ser Ala Gly Leu Val Val Gly Asp Asn
        340                 345                 350Ile Val Gly Lys Ile Lys Gly Arg Gly Gly Lys Asn Leu Leu Leu Met
    355                 360                 365Ser His Met Asp Thr Val Tyr Leu Lys Gly Ile Leu Ala Lys Ala Pro
370                 375                 380Phe Arg Val Glu Gly Asp Lys Ala Tyr Gly Pro Gly Ile Ala Asp Asp385                 390                 395                 400Lys Gly Gly Asn Ala Val Ile Leu His Thr Leu Lys Leu Leu Lys Glu
            405                 410                 415Tyr Gly Val Arg Asp Tyr Gly Thr Ile Thr Val Leu Phe Asn Thr Asp
        420                 425                 430Glu Glu Lys Gly Ser Phe Gly Ser Arg Asp Leu Ile Gln Glu Glu Ala
    435                 440                 445Lys Leu Ala Asp Tyr Val Leu Ser Phe Glu Pro Thr Ser Ala Gly Asp
450                 455                 460Glu Lys Leu Ser Leu Gly Thr Ser Gly Ile Ala Tyr Val Gln Val Gln465                 470                 475                 480Ile Thr Gly Lys Ala Ser His Ala Gly Ala Ala Pro Glu Leu Gly Val
            485                 490                 495Asn Ala Leu Val Glu Ala Ser Asp Leu Val Leu Arg Thr Met Asn Ile
        500                 505                 510Asp Asp Lys Ala Lys Asn Leu Arg Phe Gln Trp Thr Ile Ala Lys Ala
    515                 520                 525Gly Gln Val Ser Asn Ile Ile Pro Ala Ser Ala Thr Leu Asn Ala Asp
530                 535                 540Val Arg Tyr Ala Arg Asn Glu Asp Phe Asp Ala Ala Met Lys Thr Leu545                 550                 555                 560Glu Glu Arg Ala Gln Gln Lys Lys Leu Pro Glu Ala Asp Val Lys Val
            565                 570                 575Ile Val Thr Arg Gly Arg Pro Ala Phe Asn Ala Gly Glu Gly Gly Lys
        580                 585                 590Lys Leu Val Asp Lys Ala Val Ala Tyr Tyr Lys Glu Ala Gly Gly Thr
    595                 600                 605Leu Gly Val Glu Glu Arg Thr Gly Gly Gly Thr Asp Ala Ala Tyr Ala
610                 615                620Ala Leu Ser Gly Lys Pro Val Ile Glu Ser Leu Gly Leu Pro Gly Phe625                 630                 635                 640Gly Tyr His Ser Asp Lys Ala Glu Tyr Val Asp Ile Ser Ala Ile Pro
            645                 650                 655Arg Arg Leu Tyr Met Ala Ala Arg Leu Ile Met Asp Leu Gly Ala Gly
        660                 665                 670Lys(2)SEQ ID NO:33信息:(i)序列特征:
  (A)长度:37个碱基对
  (B)类型:核酸
  (C)链型:单链
  (D)拓扑学:线性(ii)分子类型:其它核酸(xi)序列描述:SEQ ID NO:33:GGGCGCCGGC AAGTGATAAA ATTCCTCGAG GAGCTCC                               37(2)SEQ ID NO:34信息:(i)序列特征:
  (A)长度:19个碱基对
  (B)类型:核酸
  (C)链型:单链
  (D)拓扑学:线性(ii)分子类型:其它核酸(xi)序列描述:SEQ ID NO:34:CGCCACCTCT GACTTGAGC                                                   19(2)SEQ ID NO:35信息:(i)序列特征:
  (A)长度:37个碱基对
  (B)类型:核酸
  (C)链型:单链
  (D)拓扑学:线性(ii)分子类型:其它核酸(xi)序列描述:SEQ ID NO:35:GGAGCTCCTC GAGGAATTTT ATCACTTGCC GGCGCCC                               37(2)SEQ ID NO:36信息:(i)序列特征:
  (A)长度:19个碱基对
  (B)类型:核酸
  (C)链型:单链
  (D)拓扑学:线性(ii)分子类型:其它核酸(xi)序列描述:SEQ ID NO:36:GCTGAACGCC GACGTGCGC                                                   19(2)SEQ ID NO:37信息:(i)序列特征:
  (A)长度:2025个碱基对
  (B)类型:核酸
  (C)链型:单链
  (D)拓扑学:线性(ii)分子类型:其它核酸(xi)序列描述:SEQ ID NO:37:ATGAAGTTGT GGCTGAACTG GATTTTCCTT GTAACACTTT TAAATGGAAT TCAGTGTCAG       60GTCCAACTGC AGCAGCCTGG GGCTGAACTG GTGAAGCCTG GGGCTTCAGT GCAGCTGTCC      120TGCAAGGCTT CTGGCTACAC CTTCACCGGC TACTGGATAC ACTGGGTGAA GCAGAGGCCT      180GGACAAGGCC TTGAGTGGAT TGGAGAGGTT AATCCTAGTA CCGGTCGTTC TGACTACAAT      240GAGAAGTTCA AGAACAAGGC CACACTGACT GTAGACAAAT CCTCCACCAC AGCCTACATG      300CAACTCAGCA GCCTGACATC TGAGGACTCT GCGGTCTATT ACTGTGCAAG AGAGAGGGCC      360TATGGTTACG ACGATGCTAT GGACTACTGG GGCCAAGGGA CCACGGTCAC CGTCTCCTCA      420GGTGGCGGTG GCTCGGGCGG TGGTGGGTCG GGTGGCGGCG GATCTGACAT TGAGCTCTCA      480CAGTCTCCAT CCTCCCTGGC TGTGTCAGCA GGAGAGAAGG TCACCATGAG CTGCAAATCC      540AGTCAGAGTC TCCTCAACAG TAGAACCCGA AAGAACTACT TGGCTTGGTA CCAGCAGAGA      600CCAGGGCAGT CTCCTAAACT GCTGATCTAT TGGGCATCCA CTAGGACATC TGGGGTCCCT      660GATCGCTTCA CAGGCAGTGG ATCTGGGACA GATTTCACTC TCACCATCAG CAGTGTGCAG      720GCTGAAGACC TGGCAATTTA TTACTGCAAG CAATCTTATA CTCTTCGGAC GTTCGGTGGA      780GGCACCAAGC TCGAGATCAA ACGGGGCGGT GGTGGCTCCG GAGGTGGCGG TAGCGGTGGC      840GGGGGTTCCC AGAAGCGCGA CAACGTGCTG TTCCAGGCAG CTACCGACGA GCAGCCGGCC       900GTGATCAAGA CGCTGGAGAA GCTGGTCAAC ATCGAGACCG GCACCGGTGA CGCCGAGGGC       960ATCGCCGCTG CGGGCAACTT CCTCGAGGCC GAGCTCAAGA ACCTCGGCTT CACGGTCACG      1020CGAAGCAAGT CGGCCGGCCT GGTGGTGGGC GACAACATCG TGGGCAAGAT CAAGGGCCGC      1080GGCGGCAAGA ACCTGCTGCT GATGTCGCAC ATGGACACCG TCTACCTCAA GGGCATTCTC      1140GCGAAGGCCC CGTTCCGCGT CGAAGGCGAC AAGGCCTACG GCCCGGGCAT CGCCGACGAC      1200AAGGGCGGCA ACGCGGTCAT CCTGCACACG CTCAAGCTGC TGAAGGAATA CGGCGTGCGC      1260GACTACGGCA CCATCACCGT GCTGTTCAAC ACCGACGAGG AAAAGGGTTC CTTCGGCTCG      1320CGCGACCTGA TCCAGGAAGA AGCCAAGCTG GCCGACTACG TGCTCTCCTT CGAGCCCACC      1380AGCGCAGGCG ACGAAAAACT CTCGCTGGGC ACCTCGGGCA TCGCCTACGT GCAGGTCCAG      1440ATCACCGGCA AGGCCTCGCA TGCCGGCGCC GCGCCCGAGC TGGGCGTGAA CGCGCTGGTC      1500GAGGCTTCCG ACCTCGTGCT GCGCACGATG AACATCGACG ACAAGGCGAA GAACCTGCGC      1560TTCCAGTGGA CCATCGCCAA GGCCGGCCAG GTCTCGAACA TCATCCCCGC CAGCGCCACG      1620CTGAACGCCG ACGTGCGCTA CGCGCGCAAC GAGGACTTCG ACGCCGCCAT GAAGACGCTG      1680GAAGAGCGCG CGCAGCAGAA GAAGCTGCCC GAGGCCGACG TGAAGGTGAT CGTCACGCGC      1740GGCCGCCCGG CCTTCAATGC CGGCGAAGGC GGCAAGAAGC TGGTCGACAA GGCGGTGGCC      1800TACTACAAGG AAGCCGGCGG CACGCTGGGC GTGGAAGAGC GCACCGGCGG CGGCACCGAC      1860GCGGCCTACG CCGCGCTCTC AGGCAAGCCA GTGATCGAGA GCCTGGGCCT GCCGGGCTTC      1920GGCTACCACA GCGACAAGGC CGAGTACGTG GACATCAGCG CGATTCCGCG CCGCCTGTAC      1980ATGGCTGCGC GCCTGATCAT GGATCTGGGC GCCGGCAAGT GATAA                      2025(2)SEQ ID NO:38信息:(i)序列特征:
  (A)长度:288个氨基酸
  (B)类型:氨基酸
  (C)链型:单链
  (D)拓扑学:线性(ii)分子类型:蛋白质(xi)序列描述:SEQ ID NO:38:Met Lys Tyr Leu Leu Pro Thr Ala Ala Ala Gly Leu Leu Leu Leu Ala1               5                   10                  15Ala Gln Pro Ala Met Ala Gln Val Gln Leu Gln Gln Pro Gly Ala Glu
        20                  25                  30Leu Val Lys Pro Gly Ala Ser Val Gln Leu Ser Cys Lys Ala Ser Gly
    35                  40                  45Tyr Thr Phe Thr Gly Tyr Trp Ile His Trp Val Lys Gln Arg Pro Gly
50                  55                  60Gln Gly Leu Glu Trp Ile Gly Glu Val Asn Pro Ser Thr Gly Arg Ser65                  70                  75                  80Asp Tyr Asn Glu Lys Phe Lys Asn Lys Ala Thr Leu Thr Val Asp Lys
            85                  90                  95Ser Ser Thr Thr Ala Tyr Met Gln Leu Ser Ser Leu Thr Ser Glu Asp
        100                 105                 110Ser Ala Val Tyr Tyr Cys Ala Arg Glu Arg Ala Tyr Gly Tyr Asp Asp
    115                 120                 125Ala Met Asp Tyr Trp Gly Gln Gly Thr Thr Val Thr Val Ser Ser Gly
130                 135                 140Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Asp Ile145                 150                 155                 160Glu Leu Ser Gln Ser Pro Ser Ser Leu Ala Val Ser Ala Gly Glu Lys
            165                 170                 175Val Thr Met Ser Cys Lys Ser Ser Gln Ser Leu Leu Asn Ser Arg Thr
        180                 185                 190Arg Lys Asn Tyr Leu Ala Trp Tyr Gln Gln Arg Pro Gly Gln Ser Pro
    195                 200                 205Lys Leu Leu Ile Tyr Trp Ala Ser Thr Arg Thr Ser Gly Val Pro Asp
210                 215                 220Arg Phe Thr Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser225                 230                 235                 240Ser Val Gln Ala Glu Asp Leu Ala Ile Tyr Tyr Cys Lys Gln Ser Tyr
            245                 250                 255Thr Leu Arg Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile Lys Arg Glu
        260                 265                 270Gln Lys Leu Ile Ser Glu Glu Asp Leu Asn His His His His His His
    275                 280                 285(2)SEQ ID NO:39信息:(i)序列特征:
  (A)长度:36个碱基对
  (B)类型:核酸
  (C)链型:单链
  (D)拓扑学:线性(ii)分子类型:其它核酸(xi)序列描述:SEQ ID NO:39:GCCCAACCAG CCATGGCCGA GGTGCAGCTG CAGCAG                             36(2)SEQ ID NO:40信息:(i)序列特征:
  (A)长度:54个碱基对
  (B)类型:核酸
  (C)链型:单链
  (D)拓扑学:线性(ii)分子类型:其它核酸(xi)序列描述:SEQ ID NO:40:CGACCCACCA CCGCCCGAGC CACCGCCACC CGAGCTCACG GCGACTGAGG TTCC            54(2)SEQ ID NO:41信息:(i)序列特征:
  (A)长度:54个碱基对
  (B)类型:核酸
  (C)链型:单链
  (D)拓扑学:线性(ii)分子类型:其它核酸(xi)序列描述:SEQ ID NO:41:TCGGGCGGTG GTGGGTCGGG TGGCGGCGGA TCTCAGATTG TGCTCACCCA GTCT            54(2)SEQ ID NO:42信息:(i)序列特征:
  (A)长度:24个碱基对
  (B)类型:核酸
  (C)链型:单链
  (D)拓扑学:线性(ii)分子类型:其它核酸(xi)序列描述:SEQ ID NO:42:CCGTTTGATC TCGAGCTTGG TCCC                                             24(2)SEQ ID NO:43信息:(i)序列特征:
  (A)长度:843个碱基对
  (B)类型:核酸
  (C)链型:单链
  (D)拓扑学:线性(ii)分子类型:其它核酸(xi)序列描述:SEQ ID NO:43:ATGAAATACC TATTGCCTAC GGCAGCCGCT GGATTGTTAT TACTCGCTGC CCAACCAGCC       60ATGGCCGAGG TGCAGCTGCA GCAGTCTGGG GCAGAGCTTG TGAGGTCAGG GGCCTCAGTC      120AAGTTGTCCT GCACAGCTTC TGGCTTCAAC ATTAAAGACA ACTATATGCA CTGGGTGAAG      180CAGAGGCCTG AACAGGGCCT GGAGTGGATT GCATGGATTG ATCCTGAGAA TGGTGATACT      240GAATATGCCC CGAAGTTCCG GGGCAAGGCC ACTTTGACTG CAGACTCATC CTCCAACACA      300GCCTACCTGC ACCTCAGCAG CCTGACATCT GAGGACACTG CCGTCTATTA CTGTCATGTC      360CTGATCTATG CTGGTTATTT GGCTATGGAC TACTGGGGTC AAGGAACCTC AGTCGCCGTG      420AGCTCGGGTG GCGGTGGCTC GGGCGGTGGT GGGTCGGGTG GCGGCGGATC TCAGATTGTG      480CTCACCCAGT CTCCAGCAAT CATGTCTGCA TCTCCAGGGG AGAAGGTCAC CATAACCTGC      540AGTGCCAGCT CAAGTGTAAC TTACATGCAC TGGTTCCAGC AGAAGCCAGG CACTTCTCCC      600AAACTCTGGA TTTATAGCAC ATCCAACCTG GCTTCTGGAG TCCCTGCTCG CTTCAGTGGC      660AGTGGATCTG GGACCTCTTA CTCTCTCACA ATCAGCCGAA TGGAGGCTGA AGATGCTGCC      720ACTTATTACT GCCAGCAAAG GAGTACTTAC CCGCTCACGT TCGGTGGTGG GACCAAGCTC      780GAGATCAAAC GGGAACAAAA ACTCATCTCA GAAGAAGATC TGAATCACCA CCATCACCAC      840CAT                                                                    843(2)SEQ ID NO:44信息:(i)序列特征:
  (A)长度:28个氨基酸
  (B)类型:氨基酸
  (C)链型:单链
  (D)拓扑学:线性(ii)分子类型:蛋白质(xi)序列描述:SEQ ID NO:44:Met Lys Tyr Leu Leu Pro Thr Ala Ala Ala Gly Leu Leu Leu Leu Ala1               5                   10                  15Ala Gln Pro Ala Met Ala Glu Val Gln Leu Gln Gln Ser Gly Ala Glu
        20                  25                  30Leu Val Arg Ser Gly Ala Ser Val Lys Leu Ser Cys Thr Ala Ser Gly
    35                  40                  45Phe Asn Ile Lys Asp Asn Tyr Met His Trp Val Lys Gln Arg Pro Glu
50                  55                  60Gln Gly Leu Glu Trp Ile Ala Trp Ile Asp Pro Glu Asn Gly Asp Thr65                  70                  75                  80Glu Tyr Ala Pro Lys Phe Arg Gly Lys Ala Thr Leu Thr Ala Asp Ser
            85                  90                  95Ser Ser Asn Thr Ala Tyr Leu His Leu Ser Ser Leu Thr Ser Glu Asp
        100                 105                 110Thr Ala Val Tyr Tyr Cys His Val Leu Ile Tyr Ala Gly Tyr Leu Ala
    115                 120                 125Met Asp Tyr Trp Gly Gln Gly Thr Ser Val Ala Val Ser Ser Gly Gly
130                 135                 140Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gln Ile Val145                 150                 155                 160Leu Thr Gln Ser Pro Ala Ile Met Ser Ala Ser Pro Gly Glu Lys Val
            165                 170                 175Thr Ile Thr Cys Ser Ala Ser Ser Ser Val Thr Tyr Met His Trp Phe
        180                 185                 190Gln Gln Lys Pro Gly Thr Ser Pro Lys Leu Trp Ile Tyr Ser Thr Ser
    195                 200                 205Asn Leu Ala Ser Gly Val Pro Ala Arg Phe Ser Gly Ser Gly Ser Gly
210                 215                 220Thr Ser Tyr Ser Leu Thr Ile Ser Arg Met Glu Ala Glu Asp Ala Ala225                 230                 235                 240Thr Tyr Tyr Cys Gln Gln Arg Ser Thr Tyr Pro Leu Thr Phe Gly Ala
            245                 250                 255Gly Thr Lys Leu Glu Ile Lys Arg Glu Gln Lys Leu Ile Ser Glu Glu
        260                 265                 270Asp Leu Asn His His His His His His
    275                 280(2)SEQ ID NO:45信息:(i)序列特征:
  (A)长度:72个碱基对
  (B)类型:核酸
  (C)链型:单链
  (D)拓扑学:线性(ii)分子类型:其它核酸(xi)序列描述:SEQ ID NO:45:TCGAGATCAA ACGGGAACAA AAACTCATCT CAGAAGAAGA TCTGAATCAC CACCATCACC      60ACCATTAATG AG                                                          72(2)SEQ ID NO:46信息:(i)序列特征:
  (A)长度:72个碱基对
  (B)类型:核酸
  (C)链型:单链
  (D)拓扑学:线性(ii)分子类型:其它核酸(xi)序列描述:SEQ ID NO:46:AATTCTCATT AATGGTGGTG ATGGTGGTGA TTCAGATCTT CTTCTGAGAT GAGTTTTTGT      60TCCCGTTTGA TC                                                          72(2)SEQ ID NO:47信息:(i)序列特征:
  (A)长度:864个碱基对
  (B)类型:核酸
  (C)链型:单链
  (D)拓扑学:线性(ii)分子类型:其它核酸(xi)序列描述:SEQ ID NO:47:ATGAAATACC TATTGCCTAC GGCAGCCGCT GGATTGTTAT TACTCGCTGC CCAACCAGCC       60ATGGCCCAGG TCCAACTGCA GCAGCCTGGG GCTGAACTGG TGAAGCCTGG GGCTTCAGTG      120CAGCTGTCCT GCAAGGCTTC TGGCTACACC TTCACCGGCT ACTGGATACA CTGGGTGAAG      180CAGAGGCCTG GACAAGGCCT TGAGTGGATT GGAGAGGTTA ATCCTAGTAC CGGTCGTTCT      240GACTACAATG AGAAGTTCAA GAACAAGGCC ACACTGACTG TAGACAAATC CTCCACCACA      300GCCTACATGC AACTCAGCAG CCTGACATCT GAGGACTCTG CGGTCTATTA CTGTGCAAGA      360GAGAGGGCCT ATGGTTACGA CGATGCTATG GACTACTGGG GCCAAGGGAC CACGGTCACC      420GTCTCCTCAG GTGGCGGTGG CTCGGGCGGT GGTGGGTCGG GTGGCGGCGG ATCTGACATT      480GAGCTCTCAC AGTCTCCATC CTCCCTGGCT GTGTCAGCAG GAGAGAAGGT CACCATGAGC      540TGCAAATCCA GTCAGAGTCT CCTCAACAGT AGAACCCGAA AGAACTACTT GGCTTGGTAC      600CAGCAGAGAC CAGGGCAGTC TCCTAAACTG CTGATCTATT GGGCATCCAC TAGGACATCT      660GGGGTCCCTG ATCGCTTCAC AGGCAGTGGA TCTGGGACAG ATTTCACTCT CACCATCAGC      720AGTGTGCAGG CTGAAGACCT GGCAATTTAT TACTGCAAGC AATCTTATAC TCTTCGGACG      780TTCGGTGGAG GCACCAAGCT CGAGATCAAA CGGGAACAAA AACTCATCTC AGAAGAAGAT      840CTGAATCACC ACCATCACCA CCAT                                             864(2)SEQ ID NO:48信息:(i)序列特征:
  (A)长度:34个碱基对
  (B)类型:核酸
  (C)链型:单链
  (D)拓扑学:线性(ii)分子类型:其它核酸(xi)序列描述:SEQ ID NO:48:AAGCTTGGAA TTCAGTGTGA GGTGCAGCTG CAGC                                  34(2)SEQ ID NO:49信息:(i)序列特征:
  (A)长度:45个碱基对
  (B)类型:核酸
  (C)链型:单链
  (D)拓扑学:线性(ii)分子类型:其它核酸(xi)序列描述:SEQ ID NO:49:CGCCACCTCC GGAGCCACCA CCGCCCCGTT TGATCTCGAG CTTGG                      45(2)SEQ ID NO:50信息:(i)序列特征:
  (A)长度:1998个碱基对
  (B)类型:核酸
  (C)链型:单链
  (D)拓扑学:线性(ii)分子类型:其它核酸(xi)序列描述:SEQ ID NO:50:ATGAAGTTGT GGCTGAACTG GATTTTCCTT GTAACACTTT TAAATGGAAT TCAGTGTGAG        60GTGCAGCTGC AGCAGTCTGG GGCAGAGCTT GTGAGGTCAG GGGCCTCAGT CAAGTTGTCC       120TGCACAGCTT CTGGCTTCAA CATTAAAGAC AACTATATGC ACTGGGTGAA GCAGAGGCCT       180GAACAGGGCC TGGAGTGGAT TGCATGGATT GATCCTGAGA ATGGTGATAC TGAATATGCC       240CCGAAGTTCC GGGGCAAGGC CACTTTGACT GCAGACTCAT CCTCCAACAC AGCCTACCTG       300CACCTCAGCA GCCTGACATC TGAGGACACT GCCGTCTATT ACTGTCATGT CCTGATCTAT       360GCTGGTTATT TGGCTATGGA CTACTGGGGT CAAGGAACCT CAGTCGCCGT GAGCTCGGGT       420GGCGGTGGCT CGGGCGGTGG TGGGTCGGGT GGCGGCGGAT CTCAGATTGT GCTCACCCAG       480TCTCCAGCAA TCATGTCTGC ATCTCCAGGG GAGAAGGTCA CCATAACCTG CAGTGCCAGC       540TCAAGTGTAA CTTACATGCA CTGGTTCCAG CAGAAGCCAG GCACTTCTCC CAAACTCTGG       600ATTTATAGCA CATCCAACCT GGCTTCTGGA GTCCCTGCTC GCTTCAGTGG CAGTGGATCT       660GGGACCTCTT ACTCTCTCAC AATCAGCCGA ATGGAGGCTG AAGATGCTGC CACTTATTAC       720TGCCAGCAAA GGAGTACTTA CCCGCTCACG TTCGGTGCTG GGACCAAGCT CGAGATCAAA       780CGGGGCGGTG GTGGCTCCGG AGGTGGCGGT AGCGGTGGCG GGGGTTCCCA GAAGCGCGAC       840AACGTGCTGT TCCAGGCAGC TACCGACGAG CAGCCGGCCG TGATCAAGAC GCTGGAGAAG       900CTGGTCAACA TCGAGACCGG CACCGGTGAC GCCGAGGGCA TCGCCGCTGC GGGCAACTTC       960CTCGAGGCCG AGCTCAAGAA CCTCGGCTTC ACGGTCACGC GAAGCAAGTC GGCCGGCCTG      1020GTGGTGGGCG ACAACATCGT GGGCAAGATC AAGGGCCGCG GCGGCAAGAA CCTGCTGCTG      1080ATGTCGCACA TGGACACCGT CTACCTCAAG GGCATTCTCG CGAAGGCCCC GTTCCGCGTC      1140GAAGGCGACA AGGCCTACGG CCCGGGCATC GCCGACGACA AGGGCGGCAA CGCGGTCATC      1200CTGCACACGC TCAAGCTGCT GAAGGAATAC GGCGTGCGCG ACTACGGCAC CATCACCGTG      1260CTGTTCAACA CCGACGAGGA AAAGGGTTCC TTCGGCTCGC GCGACCTGAT CCAGGAAGAA      1320GCCAAGCTGG CCGACTACGT GCTCTCCTTC GAGCCCACCA GCGCAGGCGA CGAAAAACTC      1380TCGCTGGGCA CCTCGGGCAT CGCCTACGTG CAGGTCCAGA TCACCGGCAA GGCCTCGCAT      1440GCCGGCGCCG CGCCCGAGCT GGGCGTGAAC GCGCTGGTCG AGGCTTCCGA CCTCGTGCTG      1500CGCACGATGA ACATCGACGA CAAGGCGAAG AACCTGCGCT TCCAGTGGAC CATCGCCAAG      1560GCCGGCCAGG TCTCGAACAT CATCCCCGCC AGCGCCACGC TGAACGCCGA CGTGCGCTAC      1620GCGCGCAACG AGGACTTCGA CGCCGCCATG AAGACGCTGG AAGAGCGCGC GCAGCAGAAG      1680AAGCTGCCCG AGGCCGACGT GAAGGTGATC GTCACGCGCG GCCGCCCGGC CTTCAATGCC      1740GGCGAAGGCG GCAAGAAGCT GGTCGACAAG GCGGTGGCCT ACTACAAGGA AGCCGGCGGC      1800ACGCTGGGCG TGGAAGAGCG CACCGGCGGC GGCACCGACG CGGCCTACGC CGCGCTCTCA      1860GGCAAGCCAG TGATCGAGAG CCTGGGCCTG CCGGGCTTCG GCTACCACAG CGACAAGGCC      1920GAGTACGTGG ACATCAGCGC GATTCCGCGC CGCCTGTACA TGGCTGCGCG CCTGATCATG      1980GATCTGGGCG CCGGCAAG                                                    1998(2)SEQ ID NO:51信息:(i)序列特征:
  (A)长度:666个氨基酸
  (B)类型:氨基酸
  (C)链型:单链
  (D)拓扑学:线性(ii)分子类型:蛋白质(xi)序列描述:SEQ ID NO:51:Met Lys Leu Trp Leu Asn Trp Ile Phe Leu Val Thr Leu Leu Asn Gly1               5                   10                  15Ile Gln Cys Glu Val Gln Leu Gln Gln Ser Gly Ala Glu Leu Val Arg
        20                  25                  30Ser Gly Ala Ser Val Lys Leu Ser Cys Thr Ala Ser Gly Phe Asn Ile
    35                  40                  45Lys Asp Asn Tyr Met His Trp Val Lys Gln Arg Pro Glu Gln Gly Leu
50                  55                  60Glu Trp Ile Ala Trp Ile Asp Pro Glu Asn Gly Asp Thr Glu Tyr Ala65                  70                  75                  80Pro Lys Phe Arg Gly Lys Ala Thr Leu Thr Ala Asp Ser Ser Ser Asn
            85                  90                  95Thr Ala Tyr Leu His Leu Ser Ser Leu Thr Ser Glu Asp Thr Ala Val
        100                 105                 110Tyr Tyr Cys His Val Leu Ile Tyr Ala Gly Tyr Leu Ala Met Asp Tyr
    115                 120                 125Trp Gly GAn Gly Thr Ser Val Ala Val Ser Ser Gly Gly Gly Gly Ser
130                 135                 140Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gln Ile Val Leu Thr Gln145                 150                 155                 160Ser Pro Ala Ile Met Ser Ala Ser Pro Gly Glu Lys Val Thr Ile Thr
            165                 170                 175Cys Ser Ala Ser Ser Ser Val Thr Tyr Met His Trp Phe Gln Gln Lys
        180                 185                 190Pro Gly Thr Ser Pro Lys Leu Trp Ile Tyr Ser Thr Ser Asn Leu Ala
    195                 200                 205Ser Gly Val Pro Ala Arg Phe Ser Gly Ser Gly Ser Gly Thr Ser Tyr
210                 215                 220Ser Leu Thr Ile Ser Arg Met Glu Ala Glu Asp Ala Ala Thr Tyr Tyr225                 230                 235                 240Cys Gln Gln Arg Ser Thr Tyr Pro Leu Thr Phe Gly Ala Gly Thr Lys
            245                 250                 255Leu Glu Ile Lys Arg Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
        260                 265                 270Gly Gly Gly Ser Gln Lys Arg Asp Asn Val Leu Phe Gln Ala Ala Thr
    275                 280                 285Asp Glu Gln Pro Ala Val Ile Lys Thr Leu Glu Lys Leu Val Asn Ile
290                 295                 300Glu Thr Gly Thr Gly Asp Ala Glu Gly Ile Ala Ala Ala Gly Asn Phe305                 310                 315                 320Leu Glu Ala Glu Leu Lys Asn Leu Gly Phe Thr Val Thr Arg Ser Lys
            325                 330                 335Ser Ala Gly Leu Val Val Gly Asp Asn Ile Val Gly Lys Ile Lys Gly
        340                 345                 350Arg Gly Gly Lys Asn Leu Leu Leu Met Ser His Met Asp Thr Val Tyr
    355                 360                 365Leu Lys Gly Ile Leu Ala Lys Ala Pro Phe Arg Val Glu Gly Asp Lys
370                 375                 380Ala Tyr Gly Pro Gly Ile Ala Asp Asp Lys Gly Gly Asn Ala Val Ile385                 390                 395                 400Leu His Thr Leu Lys Leu Leu Lys Glu Tyr Gly Val Arg Asp Tyr Gly
            405                 410                 415Thr Ile Thr Val Leu Phe Asn Thr Asp Glu Glu Lys Gly Ser Phe Gly
        420                 425                 430Ser Arg Asp Leu Ile Gln Glu Glu Ala Lys Leu Ala Asp Tyr Val Leu
    435                 440                 445Ser Phe Glu Pro Thr Ser Ala Gly Asp Glu Lys Leu Ser Leu Gly Thr
450                 455                 460Ser Gly Ile Ala Tyr Val Gln Val Gln Ile Thr Gly Lys Ala Ser His465                 470                 475                 480Ala Gly Ala Ala Pro Glu Leu Gly Val Asn Ala Leu Val Glu Ala Ser
            485                 490                 495Asp Leu Val Leu Arg Thr Met Asn Ile Asp Asp Lys Ala Lys Asn Leu
        500                 505                 510Arg Phe Gln Trp Thr Ile Ala Lys Ala Gly Gln Val Ser Asn Ile Ile
    515                 520                 525Pro Ala Ser Ala Thr Leu Asn Ala Asp Val Arg Tyr Ala Arg Asn Glu
530                 535                 540Asp Phe Asp Ala Ala Met Lys Thr Leu Glu Glu Arg Ala Gln Gln Lys545                 550                 555                 560Lys Leu Pro Glu Ala Asp Val Lys Val Ile Val Thr Arg Gly Arg Pro
            565                 570                 575Ala Phe Asn Ala Gly Glu Gly Gly Lys Lys Leu Val Asp Lys Ala Val
        580                 585                 590Ala Tyr Tyr Lys Glu Ala Gly Gly Thr Leu Gly Val Glu Glu Arg Thr
    595                 600                 605Gly Gly Gly Thr Asp Ala Ala Tyr Ala Ala Leu Ser Gly Lys Pro Val
610                 615                 620Ile Glu Ser Leu Gly Leu Pro Gly Phe Gly Tyr His Ser Asp Lys Ala625                 630                 635                 640Glu Tyr Val Asp Ile Ser Ala Ile Pro Arg Arg Leu Tyr Met Ala Ala
            645                 650                 655Arg Leu Ile Met Asp Leu Gly Ala Gly Lys
        660                 665(2)SEQ ID NO:52信息:(i)序列特征:
  (A)长度:3217个碱基对
  (B)类型:核酸
  (C)链型:单链
  (D)拓扑学:线性(ii)分子类型:其它核酸(xi)序列描述:SEQ ID NO:52:GAATTCGCCG CCACTATGGA TTTTCAAGTG CAGATTTTCA GCTTCCTGCT AATCAGTGCT       60TCAGTCATAA TGTCCAGAGG ACAAACTGTT CTCTCCCAGT CTCCAGCAAT CCTGTCTGCA      120TCTCCAGGGG AGAAGGTCAC AATGACTTGC AGGGCCAGCT CAAGTGTAAC TTACATTCAC      180TGGTACCAGC AGAAGCCAGG TTCCTCCCCC AAATCCTGGA TTTATGCCAC ATCCAACCTG      240GCTTCTGGAG TCCCTGCTCG CTTCAGTGGC AGTGGGTCTG GGACCTCTTA CTCTCTCACA      300ATCAGCAGAG TGGAGGCTGA AGATGCTGCC ACTTATTACT GCCAACATTG GAGTAGTAAA      360CCACCGACGT TCGGTGGAGG CACCAAGCTC GAGATCAAAC GGACTGTGGC TGCACCATCT      420GTCTTCATCT TCCCGCCATC TGATGAGCAG TTGAAATCTG GAACTGCCTC TGTTGTGTGC      480CTGCTGAATA ACTTCTATCC CAGAGAGGCC AAAGTACAGT GGAAGGTGGA TAACGCCCTC      540CAATCGGGTA ACTCCCAGGA GAGTGTCACA GAGCAGGACA GCAAGGACAG CACCTACAGC      600CTCAGCAGCA CCCTGACGCT GAGCAAAGCA GACTACGAGA AACACAAAGT CTACGCCTGC      660GAAGTCACCC ATCAGGGCCT GAGTTCGCCC GTCACAAAGA GCTTCAACAG GGGAGAGTGT      720TAATAGGAGC TCGGATCCAG ATCTGAGCTC CTGTAGACGT CGACATTAAT TCCGGTTATT      780TTCCACCATA TTGCCGTCTT TTGGCAATGT GAGGGCCCGG AAACCTGGCC CTGTCTTCTT      840GACGAGCATT CCTAGGGGTC TTTCCCCTCT CGCCAAAGGA ATGCAAGGTC TGTTGAATGT      900CGTGAAGGAA GCAGTTCCTC TGGAAGCTTC TTGAAGACAA ACAACGTCTG TAGCGACCCT      960TTGCAGGCAG CGGAACCCCC CACCTGGCGA CAGGTGCCTC TGCGGCCAAA AGCCACGTGT     1020ATAAGATACA CCTGCAAAGG CGGCACAACC CCAGTGCCAC GTTGTGAGTT GGATAGTTGT     1080GGAAAGAGTC AAATGGCTCT CCTCAAGCGT ATTCAACAAG GGGCTGAAGG ATGCCCAGAA     1140GGTACCCCAT TGTATGGGAT CTGATCTGGG GCCTCGGTGC ACATGCTTTA CATGTGTTTA     1200GTCGAGGTTA AAAAACGTCT AGGCCCCCCG AACCACGGGG ACGTGGTTTT CCTTTGAAAA     1260ACACGATGAT AATACCATGG AGTTGTGGCT GAACTGGATT TTCCTTGTAA CACTTTTAAA     1320TGGTATCCAG TGTGAGGTGA AGCTGGTGGA GTCTGGAGGA GGCTTGGTAC AGCCTGGGGG     1380TTCTCTGAGA CTCTCCTGTG CAACTTCTGG GTTCACCTTC ACTGATTACT ACATGAACTG     1440GGTCCGCCAG CCTCCAGGAA AGGCACTTGA GTGGTTGGGT TTTATTGGAA ACAAAGCTAA     1500TGGTTACACA ACAGAGTACA GTGCATCTGT GAAGGGTCGG TTCACCATCT CCAGAGATAA     1560ATCCCAAAGC ATCCTCTATC TTCAAATGAA CACCCTGAGA GCTGAGGACA GTGCCACTTA     1620TTACTGTACA AGAGATAGGG GGCTACGGTT CTACTTTGAC TACTGGGGCC AAGGCACCAC     1680TCTCACAGTG AGCTCGGCTA GCACCAAGGG ACCATCGGTC TTCCCCCTGG CCCCCTGCTC     1740CAGGAGCACC TCCGAGAGCA CAGCCGCCCT GGGCTGCCTG GTCAAGGACT ACTTCCCCGA     1800ACCGGTGACG GTGTCGTGGA ACTCAGGCGC TCTGACCAGC GGCGTGCACA CCTTCCCGGC     1860TGTCCTACAG TCCTCAGGAC TCTACTCCCT CAGCAGCGTC GTGACGGTGC CCTCCAGCAA     1920CTTCGGCACC CAGACCTACA CCTGCAACGT AGATCACAAG CCCAGCAACA CCAAGGTGGA     1980CAAGACAGTT GGCGGTGGTG GCTCTGGTGG TGGCGGTAGC GGTGGCGGGG GTTCCCAGAA     2040GCGCGACAAC GTGCTGTTCC AGGCAGCTAC CGACGAGCAG CCGGCCGTGA TCAAGACGCT     2100GGAGAAGCTG GTCAACATCG AGACCGGCAC CGGTGACGCC GAGGGCATCG CCGCTGCGGG     2160CAACTTCCTC GAGGCCGAGC TCAAGAACCT CGGCTTCACG GTCACGCGAA GCAAGTCGGC     2220CGGCCTGGTG GTGGGCGACA ACATCGTGGG CAAGATCAAG GGCCGCGGCG GCAAGAACCT     2280GCTGCTGATG TCGCACATGG ACACCGTCTA CCTCAAGGGC ATTCTCGCGA AGGCCCCGTT     2340CCGCGTCGAA GGCGACAAGG CCTACGGCCC GGGCATCGCC GACGACAAGG GCGGCAACGC     2400GGTCATCCTG CACACGCTCA AGCTGCTGAA GGAATACGGC GTGCGCGACT ACGGCACCAT     2460CACCGTGCTG TTCAACACCG ACGAGGAAAA GGGTTCCTTC GGCTCGCGCG ACCTGATCCA     2520GGAAGAAGCC AAGCTGGCCG ACTACGTGCT CTCCTTCGAG CCCACCAGCG CAGGCGACGA    2580AAAACTCTCG CTGGGCACCT CGGGCATCGC CTACGTGCAG GTCCAGATCA CCGGCAAGGC    2640CTCGCATGCC GGCGCCGCGC CCGAGCTGGG CGTGAACGCG CTGGTCGAGG CTTCCGACCT    2700CGTGCTGCGC ACGATGAACA TCGACGACAA GGCGAAGAAC CTGCGCTTCC AGTGGACCAT    2760CGCCAAGGCC GGCCAGGTCT CGAACATCAT CCCCGCCAGC GCCACGCTGA ACGCCGACGT    2820GCGCTACGCG CGCAACGAGG ACTTCGACGC CGCCATGAAG ACGCTGGAAG AGCGCGCGCA    2880GCAGAAGAAG CTGCCCGAGG CCGACGTGAA GGTGATCGTC ACGCGCGGCC GCCCGGCCTT    2940CAATGCCGGC GAAGGCGGCA AGAAGCTGGT CGACAAGGCG GTGGCCTACT ACAAGGAAGC    3000CGGCGGCACG CTGGGCGTGG AAGAGCGCAC CGGCGGCGGC ACCGACGCGG CCTACGCCGC    3060GCTCTCAGGC AAGCCAGTGA TCGAGAGCCT GGGCCTGCCG GGCTTCGGCT ACCACAGCGA    3120CAAGGCCGAG TACGTGGACA TCAGCGCGAT TCCGCGCCGC CTGTACATGG CTGCGCGCCT    3180GATCATGGAT CTGGGCGCCG GCAAGTGATA ATCTAGA                             3217(2)SEQ ID NO:53信息:(i)序列特征:
  (A)长度:35个碱基对
  (B)类型:核酸
  (C)链型:单链
  (D)拓扑学:线性(ii)分子类型:其它核酸(xi)序列描述:SEQ ID NO:53:TGGATCTGAA GCTTAAACTA ACTCCATGGT GACCC                                 35(2)SEQ ID NO:54信息:(i)序列特征:
  (A)长度:61个碱基对
  (B)类型:核酸
  (C)链型:单链
  (D)拓扑学:线性(ii)分子类型:其它核酸(xi)序列描述:SEQ ID NO:54:GCCACGGATC CCGCCACCTC CGGAGCCACC ACCGCCACAA TCCCTGGGCA CAATTTTCTT      60G                                                                      61(2)SEQ ID NO:55信息:(i)序列特征:
  (A)长度:94个碱基对
  (B)类型:核酸
  (C)链型:单链
  (D)拓扑学:线性(ii)分子类型:其它核酸(xi)序列描述:SEQ ID NO:55:GCCCAGGAAG CTTGGCGGTG GTGGCTCCGG AGGTGGCGGT AGCGGTGGCG GGGGTTCCCA      60GAAGCGCGAC AACGTGCTGT TCCAGGCAGC TACC                                  94(2)SEQ ID NO:56信息:(i)序列特征:
  (A)长度:51个碱基对
  (B)类型:核酸
  (C)链型:单链
  (D)拓扑学:线性(ii)分子类型:其它核酸(xi)序列描述:SEQ ID NO:56:ATGTGCGAAT TCAGCAGCAG GTTCTTGCCG CCGCGGCCCT TGATCTTGCC C               51(2)SEQ ID NO:57信息:(i)序列特征:
  (A)长度:732个碱基对
  (B)类型:核酸
  (C)链型:单链
  (D)拓扑学:线性(ii)分子类型:其它核酸(ix)特征:
  (A)名字/关键:CDS
  (B)位置:16..720(xi)序列描述:SEQ ID NO:57:GAATTCGCCG CCACC ATG GAT TTT CAA GTG CAG ATT TTC AGC TTC CTG CTA        51
             Met Asp Phe Gln Val Gln Ile Phe Ser Phe Leu Leu
               1               5                  10ATC AGT GCT TCA GTC ATA ATG TCC AGA GGA CAA ACT GTT CTC TCC CAG         99Ile Ser Ala Ser Val Ile Met Ser Arg Gly Gln Thr Val Leu Ser Gln
     15                  20                  25TCT CCA GCA ATC CTG TCT GCA TCT CCA GGG GAG AAG GTC ACA ATG ACT        147Ser Pro Ala Ile Leu Ser Ala Ser Pro Gly Glu Lys Val Thr Met Thr
 30                  35                  40TGC AGG GCC AGC TCA AGT GTA ACT TAC ATT CAC TGG TAC CAG CAG AAG        195Cys Arg Ala Ser Ser Ser Val Thr Tyr Ile His Trp Tyr Gln Gln Lys45                  50                  55                  60CCA GGT TCC TCC CCC AAA TCC TGG ATT TAT GCC ACA TCC AAC CTG GCT        243Pro Gly Ser Ser Pro Lys Ser Trp Ile Tyr Ala Thr Ser Asn Leu Ala
             65                  70                  75TCT GGA GTC CCT GCT CGC TTC AGT GGC AGT GGG TCT GGG ACC TCT TAC        291Ser Gly Val Pro Ala Arg Phe Ser Gly Ser Gly Ser Gly Thr Ser Tyr
         80                  85                  90TCT CTC ACA ATC AGC AGA GTG GAG GCT GAA GAT GCT GCC ACT TAT TAC        339Ser Leu Thr Ile Ser Arg Val Glu Ala Glu Asp Ala Ala Thr Tyr Tyr
     95                 100                 105TGC CAA CAT TGG AGT AGT AAA CCA CCG ACG TTC GGT GGA GGC ACC AAG        387Cys Gln His Trp Ser Ser Lys Pro Pro Thr Phe Gly Gly Gly Thr Lys
110                 115                 120CTG GAA ATC AAA CGG GCT GAT GCT GCA CCA ACT GTA TCC ATC TTC CCA        435Leu Glu Ile Lys Arg Ala Asp Ala Ala Pro Thr Val Ser Ile Phe Pro125                 130                 135                 140CCA TCC AGT GAG CAG TTA ACA TCT GGA GGT GCC TCA GTC GTG TGC TTC        483Pro Ser Ser Glu Gln Leu Thr Ser Gly Gly Ala Ser Val Val Cys Phe
            145                 150                 155TTG AAC AAC TTC TAC CCC AAA GAC ATC AAT GTC AAG TGG AAG ATT GAT        531Leu Asn Asn Phe Tyr Pro Lys Asp Ile Asn Val Lys Trp Lys Ile Asp
        160                 165                 170GGC AGT GAA CGA CAA AAT GGC GTC CTG AAC AGT TGG ACT GAT CAG GAC        579Gly Ser Glu Arg Gln Asn Gly Val Leu Asn Ser Trp Thr Asp Gln Asp
    175                 180                 185AGC AAA GAC AGC ACC TAC AGC ATG AGC AGC ACC CTC ACG TTG ACC AAG        627Ser Lys Asp Ser Thr Tyr Ser Met Ser Ser Thr Leu Thr Leu Thr Lys
190                 195                 200GAC GAG TAT GAA CGA CAT AAC AGC TAT ACC TGT GAG GCC ACT CAC AAG        675Asp Glu Tyr Glu Arg His Asn Ser Tyr Thr Cys Glu Ala Thr His Lys205                 210                 215                 220ACA TCA ACT TCA CCC ATT GTC AAG AGC TTC AAC AGG AAT GAG TGT            720Thr Ser Thr Ser Pro Ile Val Lys Ser Phe Asn Arg Asn Glu Cys
            225                 230                 235TAATAAGAAT TC                                                          732(2)SEQ ID NO:58信息:(i)序列特征:
  (A)长度:23个氨基酸
  (B)类型:氨基酸
  (D)拓扑学:线性(ii)分子类型:蛋白质(xi)序列描述:SEQ ID NO:58:Met Asp Phe Gln Val Gln Ile Phe Ser Phe Leu Leu Ile Ser Ala Ser1               5                  10                  15Val Ile Met Ser Arg Gly Gln Thr Val Leu Ser Gln Ser Pro Ala Ile
         20                  25                  30Leu Ser Ala Ser Pro Gly Glu Lys Val Thr Met Thr Cys Arg Ala Ser
     35                  40                  45Ser Ser Val Thr Tyr Ile His Trp Tyr Gln Gln Lys Pro Gly Ser Ser
 50                  55                  60Pro Lys Ser Trp Ile Tyr Ala Thr Ser Asn Leu Ala Ser Gly Val Pro65                  70                  75                  80Ala Arg Phe Ser Gly Ser Gly Ser Gly Thr Ser Tyr Ser Leu Thr Ile
             85                  90                  95Ser Arg Val Glu Ala Glu Asp Ala Ala Thr Tyr Tyr Cys Gln His Trp
        100                 105                 110Ser Ser Lys Pro Pro Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile Lys
    115                 120                 125Arg Ala Asp Ala Ala Pro Thr Val Ser Ile Phe Pro Pro Ser Ser Glu
130                 135                 140Gln Leu Thr Ser Gly Gly Ala Ser Val Val Cys Phe Leu Asn Asn Phe145                 150                 155                 160Tyr Pro Lys Asp Ile Asn Val Lys Trp Lys Ile Asp Gly Ser Glu Arg
            165                 170                 175Gln Asn Gly Val Leu Asn Ser Trp Thr Asp Gln Asp Ser Lys Asp Ser
        180                 185                 190Thr Tyr Ser Met Ser Ser Thr Leu Thr Leu Thr Lys Asp Glu Tyr Glu
    195                 200                 205Arg His Asn Ser Tyr Thr Cys Glu Ala Thr His Lys Thr Ser Thr Ser
210                 215                 220Pro Ile Val Lys Ser Phe Asn Arg Asn Glu Cys225                 230                 235(2)SEQ ID NO:59信息:(i)序列特征:
  (A)长度:1974个碱基对
  (B)类型:核酸
  (C)链型:单链
  (D)拓扑学:线性(ii)分子类型:其它核酸(ix)特征:
  (A)名字/关键:CDS
  (B)位置:16..1956(xi)序列描述:SEQ ID NO:59:AAGCTTGCCG CCACC ATG AAG TTG TGG CTG AAC TGG ATT TTC CTT GTA ACA       51
             Met Lys Leu Trp Leu Asn Trp Ile Phe Leu Val Thr
               1               5                  10CTT TTA AAT GGT ATC CAG TGT GAG GTG AAG CTG GTG GAG TCT GGA GGA        99Leu Leu Asn Gly Ile Gln Cys Glu Val Lys Leu Val Glu Ser Gly Gly
     15                  20                  25GGC TTG GTA CAG CCT GGG GGT TCT CTG AGA CTC TCC TGT GCA ACT TCT       147Gly Leu Val Gln Pro Gly Gly Ser Leu Arg Leu Ser Cys Ala Thr Ser
 30                  35                  40GGG TTC ACC TTC ACT GAT TAC TAC ATG AAC TGG GTC CGC CAG CCT CCA       195Gly Phe Thr Phe Thr Asp Tyr Tyr Met Asn Trp Val Arg Gln Pro Pro45                  50                  55                  60GGA AAG GCA CTT GAG TGG TTG GGT TTT ATT GGA AAC AAA GCT AAT GGT       243Gly Lys Ala Leu Glu Trp Leu Gly Phe Ile Gly Asn Lys Ala Asn Gly
             65                  70                  75TAC ACA ACA GAG TAC AGT GCA TCT GTG AAG GGT CGG TTC ACC ATC TCC       291Tyr Thr Thr Glu Tyr Ser Ala Ser Val Lys Gly Arg Phe Thr Ile Ser
         80                  85                  90AGA GAT AAA TCC CAA AGC ATC CTC TAT CTT CAA ATG AAC ACC CTG AGA       339Arg Asp Lys Ser Gln Ser Ile Leu Tyr Leu Gln Met Asn Thr Leu Arg
     95                 100                 105GCT GAG GAC AGT GCC ACT TAT TAC TGT ACA AGA GAT AGG GGG CTA CGG       387Ala Glu Asp Ser Ala Thr Tyr Tyr Cys Thr Arg Asp Arg Gly Leu Arg
110                 115                 120TTC TAC TTT GAC TAC TGG GGC CAA GGC ACC ACT CTC ACA GTC TCC TCA       435Phe Tyr Phe Asp Tyr Trp Gly Gln Gly Thr Thr Leu Thr Val Ser Ser125                 130                 135                 140GCC AAA ACG ACA CCC CCA TCT GTC TAT CCA CTG GCC CCT GGA TCT GCT       483Ala Lys Thr Thr Pro Pro Ser Val Tyr Pro Leu Ala Pro Gly Ser Ala
            145                 150                 155GCC CAA ACT AAC TCC ATG GTG ACC CTG GGA TGC CTG GTC AAG GGC TAT       531Ala Gln Thr Asn Ser Met Val Thr Leu Gly Cys Leu Val Lys Gly Tyr
        160                 165                 170TTC CCT GAG CCA GTG ACA GTG ACC TGG AAC TCT GGA TCT CTG TCC AGC       579Phe Pro Glu Pro Val Thr Val Thr Trp Asn Ser Gly Ser Leu Ser Ser
    175                 180                 185GGT GTG CAC ACC TTC CCA GCT GTC CTG CAG TCT GAC CTC TAC ACT CTG        627Gly Val His Thr Phe Pro Ala Val Leu Gln Ser Asp Leu Tyr Thr Leu
190                 195                 200AGC AGC TCA GTG ACT GTC CCC TCC AGC ACC TGG CCC AGC GAG ACC GTC        675Ser Ser Ser Val Thr Val Pro Ser Ser Thr Trp Pro Ser Glu Thr Val205                 210                 215                 220ACC TGC AAC GTT GCC CAC CCG GCC AGC AGC ACC AAG GTG GAC AAG AAA        723Thr Cys Asn Val Ala His Pro Ala Ser Ser Thr Lys Val Asp Lys Lys
            225                230                  235ATT GTG CCC AGG GAT TGT GGC GGT GGT GGC TCC GGA GGT GGC GGT AGC        771Ile Val Pro Arg Asp Cys Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
        240                 245                 250GGT GGC GGG GGT TCC CAG AAG CGC GAC AAC GTG CTG TTC CAG GCA GCT        819Gly Gly Gly Gly Ser Gln Lys Arg Asp Asn Val Leu Phe Gln Ala Ala
    255                 260                 265ACC GAC GAG CAG CCG GCC GTG ATC AAG ACG CTG GAG AAG CTG GTC AAC        867Thr Asp Glu Gln Pro Ala Val Ile Lys Thr Leu Glu Lys Leu Val Asn
270                 275                 280ATC GAG ACC GGC ACC GGT GAC GCC GAG GGC ATC GCC GCT GCG GGC AAC        915Ile Glu Thr Gly Thr Gly Asp Ala Glu Gly Ile Ala Ala Ala Gly Asn285                 290                 295                 300TTC CTC GAG GCC GAG CTC AAG AAC CTC GGC TTC ACG GTC ACG CGA AGC        963Phe Leu Glu Ala Glu Leu Lys Asn Leu Gly Phe Thr Val Thr Arg Ser
            305                 310                 315AAG TCG GCC GGC CTG GTG GTG GGC GAC AAC ATC GTG GGC AAG ATC AAG       1011Lys Ser Ala Gly Leu Val Val Gly Asp Asn Ile Val Gly Lys Ile Lys
        320                 325                 330GGC CGC GGC GGC AAG AAC CTG CTG CTG ATG TCG CAC ATG GAC ACC GTC       1059Gly Arg Gly Gly Lys Asn Leu Leu Leu Met Ser His Met Asp Thr Val
    335                 340                 345TAC CTC AAG GGC ATT CTC GCG AAG GCC CCG TTC CGC GTC GAA GGC GAC       1107Tyr Leu Lys Gly Ile Leu Ala Lys Ala Pro Phe Arg Val Glu Gly Asp
350                 355                 360AAG GCC TAC GGC CCG GGC ATC GCC GAC GAC AAG GGC GGC AAC GCG GTC       1155Lys Ala Tyr Gly Pro Gly Ile Ala Asp Asp Lys Gly Gly Asn Ala Val365                 370                 375                 380ATC CTG CAC ACG CTC AAG CTG CTG AAG GAA TAC GGC GTG CGC GAC TAC       1203Ile Leu His Thr Leu Lys Leu Leu Lys Glu Tyr Gly Val Arg Asp Tyr
            385                 390                 395GGC ACC ATC ACC GTG CTG TTC AAC ACC GAC GAG GAA AAG GGT TCC TTC       1251Gly Thr Ile Thr Val Leu Phe Asn Thr Asp Glu Glu Lys Gly Ser Phe
        400                 405                 410GGC TCG CGC GAC CTG ATC CAG GAA GAA GCC AAG CTG GCC GAC TAC GTG       1299Gly Ser Arg Asp Leu Ile Gln Glu Glu Ala Lys Leu Ala Asp Tyr Val
    415                 420                 425CTC TCC TTC GAG CCC ACC AGC GCA GGC GAC GAA AAA CTC TCG CTG GGC       1347Leu Ser Phe Glu Pro Thr Ser Ala Gly Asp Glu Lys Leu Ser Leu Gly
430                 435                 440ACC TCG GGC ATC GCC TAC GTG CAG GTC AAC ATC ACC GGC AAG GCC TCG       1395Thr Ser Gly Ile Ala Tyr Val Gln Val Asn Ile Thr Gly Lys Ala Ser445                 450                 455                 460CAT GCC GGC GCC GCG CCC GAG CTG GGC GTG AAC GCG CTG GTC GAG GCT       1443His Ala Gly Ala Ala Pro Glu Leu Gly Val Asn Ala Leu Val Glu Ala
            465                 470                 475TCC GAC CTC GTG CTG CGC ACG ATG AAC ATC GAC GAC AAG GCG AAG AAC       1491Ser Asp Leu Val Leu Arg Thr Met Asn Ile Asp Asp Lys Ala Lys Asn
        480                 485                 490CTG CGC TTC AAC TGG ACC ATC GCC AAG GCC GGC AAC GTC TCG AAC ATC       1539Leu Arg Phe Asn Trp Thr Ile Ala Lys Ala Gly Asn Val Ser Asn Ile
    495                 500                 505ATC CCC GCC AGC GCC ACG CTG AAC GCC GAC GTG CGC TAC GCG CGC AAC       1587Ile Pro Ala Ser Ala Thr Leu Asn Ala Asp Val Arg Tyr Ala Arg Asn
510                 515                 520GAG GAC TTC GAC GCC GCC ATG AAG ACG CTG GAA GAG CGC GCG CAG CAG       1635Glu Asp Phe Asp Ala Ala Met Lys Thr Leu Glu Glu Arg Ala Gln Gln525                 530                 535                 540AAG AAG CTG CCC GAG GCC GAC GTG AAG GTG ATC GTC ACG CGC GGC CGC       1683Lys Lys Leu Pro Glu Ala Asp Val Lys Val Ile Val Thr Arg Gly Arg
            545                 550                 555CCG GCC TTC AAT GCC GGC GAA GGC GGC AAG AAG CTG GTC GAC AAG GCG       1731Pro Ala Phe Asn Ala Gly Glu Gly Gly Lys Lys Leu Val Asp Lys Ala
        560                 565                 570GTG GCC TAC TAC AAG GAA GCC GGC GGC ACG CTG GGC GTG GAA GAG CGC       1779Val Ala Tyr Tyr Lys Glu Ala Gly Gly Thr Leu Gly Val Glu Glu Arg
    575                 580                 585ACC GGC GGC GGC ACC GAC GCG GCC TAC GCC GCG CTC TCA GGC AAG CCA       1827Thr Gly Gly Gly Thr Asp Ala Ala Tyr Ala Ala Leu Ser Gly Lys Pro
590                 595                 600GTG ATC GAG AGC CTG GGC CTG CCG GGC TTC GGC TAC CAC AGC GAC AAG       1875Val Ile Glu Ser Leu Gly Leu Pro Gly Phe Gly Tyr His Ser Asp Lys605                 610                 615                 620GCC GAG TAC GTG GAC ATC AGC GCG ATT CCG CGC CGC CTG TAC ATG GCT       1923Ala Glu Tyr Val Asp Ile Ser Ala Ile Pro Arg Arg Leu Tyr Met Ala
            625                 630                 635GCG CGC CTG ATC ATG GAT CTG GGC GCC GGC AAG TGATAAGAAT TCCTCGAG       1974Ala Arg Leu Ile Met Asp Leu Gly Ala Gly Lys
        640                 645(2)SEQ ID NO:60信息:(i)序列特征:
  (A)长度:647个氨基酸
  (B)类型:氨基酸
  (D)拓扑学:线性(ii)分子类型:蛋白质(xi)序列描述:SEQ ID NO:60:Met Lys Leu Trp Leu Asn Trp Ile Phe Leu Val Thr Leu Leu Asn Gly1               5                  10                  15Ile Gln Cys Glu Val Lys Leu Val Glu Ser Gly Gly Gly Leu Val Gln
         20                  25                  30Pro Gly Gly Ser Leu Arg Leu Ser Cys Ala Thr Ser Gly Phe Thr Phe
     35                  40                  45Thr Asp Tyr Tyr Met Asn Trp Val Arg Gln Pro Pro Gly Lys Ala Leu
 50                  55                  60Glu Trp Leu Gly Phe Ile Gly Asn Lys Ala Asn Gly Tyr Thr Thr Glu65                  70                  75                  80Tyr Ser Ala Ser Val Lys Gly Arg Phe Thr Ile Ser Arg Asp Lys Ser
             85                  90                  95Gln Ser Ile Leu Tyr Leu Gln Met Asn Thr Leu Arg Ala Glu Asp Ser
        100                 105                 110Ala Thr Tyr Tyr Cys Thr Arg Asp Arg Gly Leu Arg Phe Tyr Phe Asp
    115                 120                 125Tyr Trp Gly Gln Gly Thr Thr Leu Thr Val Ser Ser Ala Lys Thr Thr
130                 135                 140Pro Pro Ser Val Tyr Pro Leu Ala Pro Gly Ser Ala Ala Gln Thr Asn145                 150                 155                 160Ser Met Val Thr Leu Gly Cys Leu Val Lys Gly Tyr Phe Pro Glu Pro
            165                 170                 175Val Thr Val Thr Trp Asn Ser Gly Ser Leu Ser Ser Gly Val His Thr
        180                 185                 190Phe Pro Ala Val Leu Gln Ser Asp Leu Tyr Thr Leu Ser Ser Ser Val
    195                 200                 205Thr Val Pro Ser Ser Thr Trp Pro Ser Glu Thr Val Thr Cys Asn Val
210                 215                 220Ala His Pro Ala Ser Ser Thr Lys Val Asp Lys Lys Ile Val Pro Arg225                 230                 235                 240Asp Cys Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly
            245                 250                 255Ser Gln Lys Arg Asp Asn Val Leu Phe Gln Ala Ala Thr Asp Glu Gln
        260                 265                 270Pro Ala Val Ile Lys Thr Leu Glu Lys Leu Val Asn Ile Glu Thr Gly
    275                 280                 285Thr Gly Asp Ala Glu Gly Ile Ala Ala Ala Gly Asn Phe Leu Glu Ala
290                 295                 300Glu Leu Lys Asn Leu Gly Phe Thr Val Thr Arg Ser Lys Ser Ala Gly305                 310                 315                 320Leu Val Val Gly Asp Asn Ile Val Gly Lys Ile Lys Gly Arg Gly Gly
            325                 330                 335Lys Asn Leu Leu Leu Met Ser His Met Asp Thr Val Tyr Leu Lys Gly
        340                 345                 350Ile Leu Ala Lys Ala Pro Phe Arg Val Glu Gly Asp Lys Ala Tyr Gly
    355                 360                 365Pro Gly Ile Ala Asp Asp Lys Gly Gly Asn Ala Val Ile Leu His Thr
370                 375                 380Leu Lys Leu Leu Lys Glu Tyr Gly Val Arg Asp Tyr Gly Thr Ile Thr385                 390                 395                 400Val Leu Phe Asn Thr Asp Glu Glu Lys Gly Ser Phe Gly Ser Arg Asp
            405                 410                 415Leu Ile Gln Glu Glu Ala Lys Leu Ala Asp Tyr Val Leu Ser Phe Glu
        420                 425                 430Pro Thr Ser Ala Gly Asp Glu Lys Leu Ser Leu Gly Thr Ser Gly Ile
    435                 440                 445Ala Tyr Val Gln Val Asn Ile Thr Gly Lys Ala Ser His Ala Gly Ala
450                 455                 460Ala Pro Glu Leu Gly Val Asn Ala Leu Val Glu Ala Ser Asp Leu Val465                 470                 475                 480Leu Arg Thr Met Asn Ile Asp Asp Lys Ala Lys Asn Leu Arg Phe Asn
            485                 490                 495Trp Thr Ile Ala Lys Ala Gly Asn Val Ser Asn Ile Ile Pro Ala Ser
        500                 505                 510Ala Thr Leu Asn Ala Asp Val Arg Tyr Ala Arg Asn Glu Asp Phe Asp
    515                 520                 525Ala Ala Met Lys Thr Leu Glu Glu Arg Ala Gln Gln Lys Lys Leu Pro
530                 535                 540Glu Ala Asp Val Lys Val Ile Val Thr Arg Gly Arg Pro Ala Phe Asn545                 550                 555                 560Ala Gly Glu Gly Gly Lys Lys Leu Val Asp Lys Ala Val Ala Tyr Tyr
            565                 570                 575Lys Glu Ala Gly Gly Thr Leu Gly Val Glu Glu Arg Thr Gly Gly Gly
        580                 585                 590Thr Asp Ala Ala Tyr Ala Ala Leu Ser Gly Lys Pro Va1 Ile Glu Ser
    595                 600                 605Leu Gly Leu Pro Gly Phe Gly Tyr His Ser Asp Lys Ala Glu Tyr Val
610                 615                 620Asp Ile Ser Ala Ile Pro Arg Arg Leu Tyr Met Ala Ala Arg Leu Ile625                 630                 635                 640Met Asp Leu Gly Ala Gly Lys
            645

Claims (18)

1.编码细胞靶向部分和异源前体药物活化酶用作哺乳动物宿主中药物的基因构建体,其中的基因构建体能够表达细胞靶向部分和异源前体药物活化酶作为哺乳动物宿主细胞中的缀合物并且其中的缀合物被导向离开此细胞,之后选择性定位于由细胞靶向部分所识别的细胞表面抗原上。
2.根据权利要求1的用作药物的基因构建体,其中的细胞靶向部分为抗体。
3.根据权利要求2的用作药物的基因构建体,其中的抗体为选自抗体A5B7或806.077抗体的抗CEA抗体。
4.根据前面任一权利要求的用作药物的基因构建体,其中的异源前体药物活化酶为羧肽酶。
5.根据权利要求4的用作药物的基因构建体,其中的羧肽酶为CPG2。
6.根据权利要求5的用作药物的基因构建体,其中的CPG2具有突变的多肽糖基化位点从而阻止或减少在哺乳动物细胞中表达时的糖基化。
7.根据权利要求5-6中任意一个权利要求的用作药物的基因构建体,其中的抗体-酶CPG2缀合物为融合蛋白,其中的酶通过抗体重链或轻链融合至该抗体的C-末端,由此该编码缀合物表达时的二聚化可通过CPG2上的二聚化区域发生。
8.根据权利要求7用作药物的基因构建体,其中的融合蛋白通过将抗体Fab重链的C-末端连接至CPG2分子的N-末端以形成Fab-CPG2而形成,由此两个Fab-CPG2分子表达时经过CPG2二聚化以形成(Fab-CPG2)2缀合物。
9.根据权利要求4的用作药物的基因构建体,其中的羧肽酶选自[D253K]HCPB,[G251T,D253K]HCPB或[A248S,G251T,D253K]HCPB。
10.根据前面任一权利要求的用作药物的基因构建体,其包括含有启动子与控制元件的转录调节序列,此调节序列包括遗传开关以控制该基因构建体的表达。
11.根据权利要求10的用作药物的基因构建体,其中的转录调节序列包括受四环素或蜕皮素存在而调节的遗传开关控制元件。
12.根据权利要求10或11的用作药物的基因构建体,其中的启动子依赖于细胞类型并且选自下面的启动子:癌胚抗原(CEA);α-胚胎蛋白(AFP);酪氨酸羟化酶;乙酰胆碱转移酶;神经元特异性烯醇化酶;胰岛素;胶质细胞原纤维酸性蛋白;HER-2/neu;c-erbB2;和N-myc。
13.根据前面任一权利要求的用作药物的基因构建体,其被包裹于腺病毒中用于转移至哺乳动物宿主中。
14.权利要求1-12中任一权利要求中定义的基因构建体在制备用于哺乳动物宿主中癌症治疗的药物中的用途。
15.用于哺乳动物宿主中匹配的二组分系统,其中的组分包括:
(i)包括权利要求1-13中任一权利要求中定义基因构建体的第一种组分和;
(ii)包括可由第一种组分编码的异源酶转换成细胞毒性药物前体药物的第二种组分。
16.根据权利要求15的匹配的二组分系统,其中:
第一种组分包括编码异源酶CPG2的基因;并且第二种组分前体药物选自N-(4-[N,N-双(2-碘乙基)氨基]苯氧羰基)-L-谷氨酸,N-(4-[N,N-双(2-氯乙基)氨基]-苯氧羰基)-L-谷氨酸-γ-(3,5-二羧基)酰基苯胺或N-(4-[N,N-双(2-氯乙基)氨基]-苯氧羰基)-L-谷氨酸或其药物上可接受的盐。
17.用于将细胞毒性药物转移至一定位点的方法,包括施用含有权利要求1-13中任一权利要求中定义的基因构建体的第一种组分至宿主;然后施用第二种组分至宿主中,该组分包括可由第一种组分编码的异源酶转换成细胞毒性药物的前体药物。
18.根据权利要求17的方法,其中的第一种组分包括编码异源酶CPG2的基因;并且第二种组分前体药物选自N-(4-[N,N-双(2-碘乙基)氨基]苯氧羰基)-L-谷氨酸,N-(4-[N,N-双(2-氯乙基)氨基]-苯氧羰基)-L-谷氨酸-γ-(3,5-二羧基)酰基苯胺或N-(4-[N,N-双(2-氯乙基)氨基]-苯氧羰基)-L-谷氨酸或其药物上可接受的盐。
CNB988049295A 1997-05-10 1998-05-05 编码细胞靶向部分和异源前体药物活化酶的基因构建体及其应用 Expired - Fee Related CN1268743C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
GBGB9709421.3A GB9709421D0 (en) 1997-05-10 1997-05-10 Chemical compounds
GB9709421.3 1997-05-10

Publications (2)

Publication Number Publication Date
CN1255163A true CN1255163A (zh) 2000-05-31
CN1268743C CN1268743C (zh) 2006-08-09

Family

ID=10812048

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB988049295A Expired - Fee Related CN1268743C (zh) 1997-05-10 1998-05-05 编码细胞靶向部分和异源前体药物活化酶的基因构建体及其应用

Country Status (23)

Country Link
US (1) US6339070B1 (zh)
EP (1) EP0979292B1 (zh)
JP (1) JP2001526539A (zh)
KR (1) KR100508136B1 (zh)
CN (1) CN1268743C (zh)
AT (1) ATE412755T1 (zh)
AU (1) AU734915B2 (zh)
BR (1) BR9808769A (zh)
CA (1) CA2286875A1 (zh)
DE (1) DE69840165D1 (zh)
ES (1) ES2314990T3 (zh)
GB (2) GB9709421D0 (zh)
HU (1) HUP0001931A3 (zh)
IL (1) IL132348A0 (zh)
MY (1) MY140975A (zh)
NO (1) NO995475L (zh)
NZ (1) NZ500014A (zh)
PL (1) PL337007A1 (zh)
RU (1) RU2218404C2 (zh)
SK (1) SK153599A3 (zh)
TR (1) TR199902731T2 (zh)
WO (1) WO1998051787A2 (zh)
ZA (1) ZA983931B (zh)

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9910077D0 (en) * 1999-05-01 1999-06-30 Univ Manchester Chemical compounds
DE19946142A1 (de) 1999-09-27 2001-03-29 Bundesrepublik Deutschland Let Gentransfer in humane Lymphocyten mittels retroviraler scFv-Zelltargeting Vektoren
GB0001653D0 (en) * 2000-01-26 2000-03-15 Astrazeneca Uk Ltd Chemical compound
GB0102239D0 (en) 2001-01-29 2001-03-14 Cancer Res Ventures Ltd Methods of chemical synthisis
WO2002094318A1 (en) * 2001-05-18 2002-11-28 University Of Southern California Vector for targeted delivery to cells
US7244592B2 (en) * 2002-03-07 2007-07-17 Dyax Corp. Ligand screening and discovery
WO2003104425A2 (en) * 2002-06-07 2003-12-18 The Government Of The United States Of America, As Represented By The Secretary Of The Department Of Health And Human Services Novel stable anti-cd22 antibodies
WO2004069269A1 (en) * 2003-01-30 2004-08-19 Neurologix, Inc. Method for making a cell more susceptible for a compound by expressing the protein, on which said compound acts, in said cell
ES2639301T3 (es) 2003-04-30 2017-10-26 Universität Zürich Procedimientos de tratamiento de cáncer usando una inmunotoxina
WO2005058236A2 (en) * 2003-12-12 2005-06-30 Genencor International, Inc. Cab molecules
AU2005230994A1 (en) 2004-04-09 2005-10-20 Chugai Seiyaku Kabushiki Kaisha Novel water-soluble prodrug
US20060105941A1 (en) * 2004-11-12 2006-05-18 Allergan, Inc. Mixed antibiotic codrugs
TW200744603A (en) 2005-08-22 2007-12-16 Chugai Pharmaceutical Co Ltd Novel anticancer concomitant drug
CA2633756C (en) * 2005-12-21 2015-11-24 Micromet Ag Pharmaceutical antibody compositions with resistance to soluble cea
WO2008128330A1 (en) * 2007-04-19 2008-10-30 Viventia Biotech Inc. Optimized nucleotide sequences of vb6-845 for expression of recombinant proteins
WO2009039630A1 (en) * 2007-09-27 2009-04-02 Viventia Biotech Inc. Optimized nucleic acid sequences for the expression of vb4-845
US8771679B2 (en) * 2008-08-13 2014-07-08 The John Hopkins University Prodrug activation in cancer cells using molecular switches
WO2010085665A2 (en) 2009-01-23 2010-07-29 Cedars-Sinai Medical Center Targeted delivery system
EA034989B1 (ru) * 2011-10-28 2020-04-15 Тева Фармасьютикал Австралия Пти Лтд Полипептидная конструкция для применения при лечении рака, включающая аттенуированный альфа-интерферон
MX366347B (es) 2012-08-03 2019-07-05 Cedars Sinai Medical Center Aislamiento de mutantes mejoradores del trafico de la proteina de administracion de farmaco.
US11117975B2 (en) 2013-04-29 2021-09-14 Teva Pharmaceuticals Australia Pty Ltd Anti-CD38 antibodies and fusions to attenuated interferon alpha-2B
CN105764925A (zh) 2013-10-02 2016-07-13 维文蒂亚生物公司 抗EpCAM抗体和使用方法
UA119352C2 (uk) 2014-05-01 2019-06-10 Тева Фармасьютикалз Острейліа Пті Лтд Комбінація леналідоміду або помалідоміду і конструкції анти-cd38 антитіло-атенуйований інтерферон альфа-2b та спосіб лікування суб'єкта, який має cd38-експресуючу пухлину
UA125637C2 (uk) 2014-10-29 2022-05-11 Тева Фармасьютікалз Острейліа Пті Лтд ЗЛИТИЙ ПОЛІПЕПТИД ІНТЕРФЕРОНУ <font face="Symbol">a2</font>b
AU2016228755B2 (en) 2015-03-12 2020-09-10 Viventia Bio Inc. Methods of treatment for EPCAM positive bladder cancer
CN107580501A (zh) 2015-03-12 2018-01-12 维文蒂亚生物公司 用于靶向epcam阳性膀胱癌的给药策略
EP4127187A1 (en) 2020-03-24 2023-02-08 Generation Bio Co. Non-viral dna vectors and uses thereof for expressing factor ix therapeutics
CA3172591A1 (en) 2020-03-24 2021-09-30 Douglas Anthony KERR Non-viral dna vectors and uses thereof for expressing gaucher therapeutics
WO2024040222A1 (en) 2022-08-19 2024-02-22 Generation Bio Co. Cleavable closed-ended dna (cedna) and methods of use thereof

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5632990A (en) * 1988-04-22 1997-05-27 Cancer Research Campaign Tech. Ltd. Treatment for tumors comprising conjugated antibody A5B7 and a prodrug
US5703055A (en) 1989-03-21 1997-12-30 Wisconsin Alumni Research Foundation Generation of antibodies through lipid mediated DNA delivery
EP0487587A1 (en) 1989-08-18 1992-06-03 Chiron Corporation Recombinant retroviruses delivering vector constructs to target cells
US6337209B1 (en) 1992-02-26 2002-01-08 Glaxo Wellcome Inc. Molecular constructs containing a carcinoembryonic antigen regulatory sequence
GB8919607D0 (en) 1989-08-30 1989-10-11 Wellcome Found Novel entities for cancer therapy
DE4106389A1 (de) * 1991-02-28 1992-09-03 Behringwerke Ag Fusionsproteine zur prodrug-aktivierung, ihre herstellung und verwendung
US5314995A (en) * 1990-01-22 1994-05-24 Oncogen Therapeutic interleukin-2-antibody based fusion proteins
DE4110409C2 (de) 1991-03-29 1999-05-27 Boehringer Ingelheim Int Neue Protein-Polykation-Konjugate
WO1993019163A1 (en) 1992-03-18 1993-09-30 Yeda Research And Development Co, Ltd. Chimeric receptor genes and cells transformed therewith
GB9314960D0 (en) * 1992-07-23 1993-09-01 Zeneca Ltd Chemical compounds
DE69333115D1 (de) 1992-09-22 2003-08-28 Biofocus Discovery Ltd Rekombinante viren, die an ihrer äusseren oberfläche ein nichtvirales polypeptid präsentieren
GB9223084D0 (en) 1992-11-04 1992-12-16 Imp Cancer Res Tech Compounds to target cells
US5464758A (en) * 1993-06-14 1995-11-07 Gossen; Manfred Tight control of gene expression in eucaryotic cells by tetracycline-responsive promoters
GB9323008D0 (en) 1993-11-05 1994-01-05 Connors Thomas Improvements relating to cancer therapy
GB9324807D0 (en) * 1993-12-03 1994-01-19 Cancer Res Campaign Tech Tumour antibody
GB9415167D0 (en) 1994-07-27 1994-09-14 Springer Caroline J Improvements relating to cancer therapy
GB9423367D0 (en) 1994-11-18 1995-01-11 Wellcome Found Enzyme prodrug therapy
KR100270650B1 (ko) * 1994-12-23 2000-11-01 돈 리사 로얄 돌연변이된 숙주효소를 이용한 항체-지시된 효소 전구약제 치료
NZ315713A (en) * 1995-08-16 1999-08-30 Zeneca Ltd A conjugate comprising an antibody as targeting moiety linked to a carboxypeptidase b (cpb)
GB9523703D0 (en) 1995-11-20 1996-01-24 Wellcome Found Enzyme prodrug thearapy
GB9601640D0 (en) 1996-01-26 1996-03-27 Cancer Res Campaign Tech Ligand directed enzyme prodrug therapy
PL329871A1 (en) * 1996-05-04 1999-04-12 Zeneca Ltd Monoclonal antibody agains cea, coniugates incorporating that antibody and their therapeutic application in the adept system
IL132596A0 (en) 1997-06-04 2001-03-19 Oxford Biomedica Ltd Vector

Also Published As

Publication number Publication date
EP0979292A2 (en) 2000-02-16
CA2286875A1 (en) 1998-11-19
GB2338484A (en) 1999-12-22
TR199902731T2 (xx) 2000-06-21
MY140975A (en) 2010-02-12
BR9808769A (pt) 2000-08-01
KR100508136B1 (ko) 2005-08-10
AU7225498A (en) 1998-12-08
RU2218404C2 (ru) 2003-12-10
PL337007A1 (en) 2000-07-31
KR20010012441A (ko) 2001-02-15
WO1998051787A2 (en) 1998-11-19
DE69840165D1 (de) 2008-12-11
ATE412755T1 (de) 2008-11-15
US6339070B1 (en) 2002-01-15
IL132348A0 (en) 2001-03-19
HUP0001931A2 (hu) 2000-09-28
CN1268743C (zh) 2006-08-09
ZA983931B (en) 1998-11-10
GB9922815D0 (en) 1999-11-24
WO1998051787A3 (en) 1999-04-01
NZ500014A (en) 2001-08-31
HUP0001931A3 (en) 2003-10-28
JP2001526539A (ja) 2001-12-18
EP0979292B1 (en) 2008-10-29
SK153599A3 (en) 2000-06-12
NO995475D0 (no) 1999-11-09
GB2338484B (en) 2001-11-07
GB9709421D0 (en) 1997-07-02
NO995475L (no) 2000-01-07
ES2314990T3 (es) 2009-03-16
AU734915B2 (en) 2001-06-28

Similar Documents

Publication Publication Date Title
CN1268743C (zh) 编码细胞靶向部分和异源前体药物活化酶的基因构建体及其应用
CN1271205C (zh) 重新构建的人抗hm1.24抗体
CN1217956C (zh) 可溶性单链t细胞受体蛋白
CN1317303C (zh) 抗人腱生蛋白单克隆抗体
CN1604966A (zh) 直接靶定的结合蛋白
CN1423660A (zh) 抗体
CN1234806A (zh) G蛋白偶连受体拮抗剂
CN1326467A (zh) 表达以及分泌制管张素和endostatin的免疫融合物
CN1552855A (zh) 人血管内皮生长因子2
CN1229436A (zh) 特异性检测癌细胞的抗原结合片段、编码所述片段的dna、以及它们在预防和检测癌症上的用途
CN1308451C (zh) 肿瘤坏死因子相关配基
CN1341124A (zh) 抗cd3免疫毒素及其治疗用途
CN1275085A (zh) 靶细胞的定向细胞溶解、引起细胞溶解的试剂和组合物以及可用于制备这些试剂的化合物
CN1606453A (zh) Cripto阻断抗体及其用途
CN1756768A (zh) 诱导持久t细胞应答的三聚体多肽构建体
CN1547590A (zh) 人源化抗-LT-β-R抗体
CN1384840A (zh) 涉及α6β4整联蛋白的人胃肠上皮肿瘤抗原的抗体
CN1378595A (zh) 作为zalpha受体之配体的人细胞因子及其用途
CN1095677C (zh) 化合物
CN1262689A (zh) 分离树突状细胞膜蛋白基因
CN1151377C (zh) 诊断及治疗鳞状细胞癌的方法
CN1428352A (zh) 抗免疫球蛋白等模式标本的重整形单克隆抗体
CN1193278A (zh) 化合物
CN1310758A (zh) 基因克隆的新方法
CN1737011A (zh) 抗hla-dr10的淋巴瘤特异性嵌合单抗

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: ASTRAZENECA (UK) LIMITED

Free format text: FORMER OWNER: SIGENTIS CO., LTD.

Effective date: 20070202

C41 Transfer of patent application or patent right or utility model
C56 Change in the name or address of the patentee

Owner name: SIGENTIS CO., LTD.

Free format text: FORMER NAME OR ADDRESS: ZENECA LTD

CP03 Change of name, title or address

Address after: surrey

Patentee after: SYNGENTA LTD.

Address before: England

Patentee before: ZENECA Ltd.

TR01 Transfer of patent right

Effective date of registration: 20070202

Address after: London, England

Patentee after: ASTRAZENECA UK LTD.

Address before: surrey

Patentee before: SYNGENTA LTD.

C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20060809

Termination date: 20100505