CN111770933A - 融合蛋白 - Google Patents

融合蛋白 Download PDF

Info

Publication number
CN111770933A
CN111770933A CN201880089964.4A CN201880089964A CN111770933A CN 111770933 A CN111770933 A CN 111770933A CN 201880089964 A CN201880089964 A CN 201880089964A CN 111770933 A CN111770933 A CN 111770933A
Authority
CN
China
Prior art keywords
leu
ser
gly
domain
thr
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201880089964.4A
Other languages
English (en)
Inventor
弗朗西斯·杰伊·穆萨伊
卡梅拉·德桑托
S·李
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Cancer Research Technology Ltd
Original Assignee
Cancer Research Technology Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Cancer Research Technology Ltd filed Critical Cancer Research Technology Ltd
Publication of CN111770933A publication Critical patent/CN111770933A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/18Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans
    • C07K16/28Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants
    • C07K16/30Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants from tumour cells
    • C07K16/3076Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants from tumour cells against structure-related tumour-associated moieties
    • C07K16/3084Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants from tumour cells against structure-related tumour-associated moieties against tumour-associated gangliosides
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K35/00Medicinal preparations containing materials or reaction products thereof with undetermined constitution
    • A61K35/12Materials from mammals; Compositions comprising non-specified tissues or cells; Compositions comprising non-embryonic stem cells; Genetically modified cells
    • A61K35/14Blood; Artificial blood
    • A61K35/17Lymphocytes; B-cells; T-cells; Natural killer cells; Interferon-activated or cytokine-activated lymphocytes
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • A61K38/16Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • A61K38/43Enzymes; Proenzymes; Derivatives thereof
    • A61K38/45Transferases (2)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • A61K38/16Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • A61K38/43Enzymes; Proenzymes; Derivatives thereof
    • A61K38/53Ligases (6)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/12Antivirals
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/18Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans
    • C07K16/28Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants
    • C07K16/2803Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants against the immunoglobulin superfamily
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/18Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans
    • C07K16/28Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants
    • C07K16/2863Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants against receptors for growth factors, growth regulators
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/06Animal cells or tissues; Human cells or tissues
    • C12N5/0602Vertebrate cells
    • C12N5/0634Cells from the blood or the immune system
    • C12N5/0636T lymphocytes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1003Transferases (2.) transferring one-carbon groups (2.1)
    • C12N9/1018Carboxy- and carbamoyl transferases (2.1.3)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/88Lyases (4.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/93Ligases (6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/94Pancreatin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y201/00Transferases transferring one-carbon groups (2.1)
    • C12Y201/03Carboxy- and carbamoyltransferases (2.1.3)
    • C12Y201/03003Ornithine carbamoyltransferase (2.1.3.3)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y603/00Ligases forming carbon-nitrogen bonds (6.3)
    • C12Y603/04Other carbon-nitrogen ligases (6.3.4)
    • C12Y603/04005Argininosuccinate synthase (6.3.4.5)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/60Immunoglobulins specific features characterized by non-natural combinations of immunoglobulin fragments
    • C07K2317/62Immunoglobulins specific features characterized by non-natural combinations of immunoglobulin fragments comprising only variable region components
    • C07K2317/622Single chain antibody (scFv)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/02Fusion polypeptide containing a localisation/targetting motif containing a signal sequence
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2510/00Genetically modified cells

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medicinal Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Immunology (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Animal Behavior & Ethology (AREA)
  • Veterinary Medicine (AREA)
  • Public Health (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Microbiology (AREA)
  • Epidemiology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Biophysics (AREA)
  • Cell Biology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Virology (AREA)
  • Toxicology (AREA)
  • Hematology (AREA)
  • Oncology (AREA)
  • Communicable Diseases (AREA)
  • Developmental Biology & Embryology (AREA)
  • Peptides Or Proteins (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)

Abstract

提供了融合靶结合蛋白,该融合靶结合蛋白包含靶结合部分、细胞内信号传导区域和促进精氨酸或精氨酸前体的合成的结构域。该结构域可以是酶结构域,诸如精氨基琥珀酸合酶(ASS‑1)酶结构域或鸟氨酸转氨甲酰酶(OTC)酶结构域。还提供了包含这样的融合靶结合蛋白的细胞(例如表达该融合靶结合蛋白的细胞)以及编码这样的融合靶结合蛋白的核酸。本发明还提供了融合靶结合蛋白,该融合靶结合蛋白包含靶结合部分、细胞内信号传导区域和促进色氨酸或色氨酸前体的合成的结构域。公开了药物组合物、医学用途和治疗方法,这些全都使用融合靶结合蛋白、细胞或核酸。这些蛋白、细胞、核酸和药物组合物可以用于预防和/或治疗癌症,诸如神经母细胞瘤或急性髓性白血病。

Description

融合蛋白
发明领域
本发明涉及融合靶结合蛋白以及包含这样的蛋白的细胞。本发明还涉及编码融合靶结合蛋白的核酸。本发明涉及药物组合物、医学用途和治疗方法,这些全都使用所公开的融合靶结合蛋白、细胞或核酸。
背景
具有靶结合能力的融合蛋白已经被用于许多治疗应用中。最值得注意的是,被工程化以表达嵌合抗原受体(CAR)的T细胞已经被用于癌症治疗。然而,如以下进一步讨论的,尽管显示出相当大的临床前景,但这种治疗并不普遍有效。
临床前研究和临床研究中的CAR-T失败
尽管在成人癌症和儿童癌症的细胞毒性化学疗法方面的进展,但清楚的是,许多主要癌症亚型仍然具有极差的预后。免疫疗法提供了一种直接靶向恶性癌细胞的替代方法,并且避免了标准方法对正常细胞的毒性副作用。
嵌合抗原受体(CAR)-T细胞(CAR-T)是患者自身来源的T细胞,通常用抗体片段(scFv)工程化,以特异性地识别肿瘤细胞上的表面抗原。已经在化学疗法耐药性、复发性儿童B型急性淋巴母细胞白血病患者中建立了使用CAR-T细胞成功治疗儿童癌症的原理论证(proof-of-principle),所述患者使用抗CD19 CAR T细胞经历快速且持续的缓解。在实体肿瘤中,最常见的儿童期实体癌神经母细胞瘤已经是首选模型,并且被证实在实体肿瘤对CAR-T细胞疗法的响应方面提供了大量信息。临床前研究表明,识别二唾液酸神经节苷脂2(GD2)抗原的CAR T细胞可能代表了一种杀伤神经母细胞瘤细胞的强有力的新方法。尽管神经母细胞瘤已经成为针对实体肿瘤开发CAR-T细胞的范例,但在临床前模型和早期试验中,仅观察到有限的抗肿瘤功效。第一代抗GD2 CAR T细胞不能在体内持续存在并且具有最小的抗肿瘤作用。第二代抗GD2-CAR T细胞(具有CD28或4-1BB共刺激结构域)具有改进的体内持续性,导致中度肿瘤消退,但在神经母细胞瘤存在时变得功能耗尽。在人类中,一项抗GD2CAR T细胞的研究进行了关键的观察,尽管输注了大量的这些细胞,但是CAR T细胞的数目在几周内变低或无法检测到,并且大多数患有活动性疾病的患者未实现完全缓解。重要的是,具有低水平持续存在的CAR T细胞的患者具有较长的存活期。这些发现表明,尽管残余神经母细胞瘤肿瘤上存在大的靶抗原负载,但局部和全身肿瘤微环境损害了CAR-T细胞的持续性。
还在体外、体内和人体内针对有限数目的其他实体肿瘤测试了CAR-T细胞疗法。在每一种病例中,针对这些恶性肿瘤的结果都未能复制出在ALL中发现的抗CD19 CAR-T细胞的令人兴奋的数据。
急性髓性白血病
急性髓性白血病是最常见的成人急性白血病并且是第二常见的儿童白血病。发病率随年龄增加而增加,并且对于高风险或复发疾病的患者,尽管进行造血干细胞移植,但预后极差,在成人中存活期<12个月。对于老年患者或患有并存疾病的患者,标准化学疗法方案耐受性差,导致次优治疗并且无法实现治愈。很少有针对AML的有效新药物被开发出来,因为免疫治疗剂提供了一种不同方法的潜力。CD33在AML母细胞(blast)上几乎普遍表达,并且已被证明是基于免疫毒素的治疗剂(吉妥单抗奥佐米星)的有效靶。抗CD33 CAR-T细胞在体外对AML母细胞具有细胞毒性并且在体内消除白血病负担。在此基础上,已经在中国启动抗CD33 CAR T细胞的I期临床试验(NCT01864902和NCT02958397)。来自1名化学疗法难治性AML患者的报告显示了骨髓AML母细胞的减少。这些结果提供了抗CD33 CAR T细胞可能有效的原理论证。然而,尽管在血液和骨髓两者中维持可测量的CAR-T细胞,但在CAR输注后9周疾病复发。该发现表明,CAR-T细胞因白血病微环境而变得失活(没有证据表明AML母细胞上的CD33丧失是一种逃避机制)。
间皮瘤、卵巢癌和胰腺癌
间皮瘤是一种石棉相关肿瘤,在成人中几乎普遍预后差,表达细胞表面糖蛋白间皮素。间皮素也在上皮癌诸如卵巢癌、肺腺癌和胰腺癌上表达。已经证明间皮素是用免疫毒素诸如SS1P的被动免疫疗法的有效和选择性的靶,这导致了其被选择用于CAR T技术中的开发。在鼠模型中,抗间皮素CAR-T细胞显示出清楚且持续的抗肿瘤活性。抗间皮素CAR-T细胞也被施用至患有这些肿瘤的患者,并且尽管检测到有限的响应(PR,SD),但在每个病例中肿瘤仍有进展。CAR-T细胞持续性极差,在最初施用或重复施用仅数天内细胞就变得检测不到。即使当CAR-T细胞被放置在肿瘤内并且因此与靶抗原密切接近时,响应仍然是微弱的,表明强烈的免疫抑制微环境减少了T细胞的功能。
胶质母细胞瘤
胶质母细胞瘤是成人和儿童中破坏性最大的脑肿瘤之一,尽管采用加强的基于化学疗法和放射疗法的方案,但患者往往经历快速的疾病进展和治疗失败。胶质母细胞瘤表达表皮生长因子受体EGFRvIII的变体,提供了一种可以通过免疫疗法靶向的肿瘤特异性抗原。EGFRvIII可能也在约三分之一的晚期结肠直肠癌中表达。抗EGFRvIII CAR-T细胞显示出对鼠原位异种移植物(orthotopic murine xenografts)中胶质母细胞瘤的疾病控制。然而,在所有情况中,尽管在所有器官包括脑中都有可检测水平的CAR-T细胞,但肿瘤继续生长,导致鼠死亡。这一数据再次表明,CAR-T细胞因肿瘤微环境而失活。基于这一原理的I期试验目前正在进行(NCT02844062、NCT02664363)。
精氨酸与免疫抑制微环境
精氨酸是一种半必需氨基酸,是健康组织进行许多细胞过程包括细胞生活力(cell viability)、增殖和蛋白合成所需要的。全身精氨酸水平主要通过饮食摄入来维持,并且在较小程度上通过在“肠-肾轴”中从前体合成来维持。在细胞水平上,精氨酸经由阳离子氨基酸转运蛋白家族(CAT;SLC7A)从细胞外流体输入并且进入尿素循环。在高需求条件诸如炎症、妊娠和癌症下,精氨酸水平在局部组织微环境和全身中可能变得有限。一些组织和细胞可以通过精氨基琥珀酸合酶(ASS1)和鸟氨酸转氨甲酰酶(OTC)的表达从前体重新合成精氨酸来保护其自身。缺乏这些酶中的至少一种的表达的细胞依赖于细胞外精氨酸的输入,这种状态被称为精氨酸营养缺陷型。
先前的研究表明,抑制肿瘤部位处的精氨酸酶可能有益于解决体内CAR T细胞活性差的问题。
发明概述
在第一方面中,本发明提供了包含靶结合部分、细胞内信号传导区域和促进精氨酸或精氨酸前体的合成的结构域的融合靶结合蛋白。为了简洁起见,根据本发明的多种方面和实施方案的融合靶结合蛋白在本文中将被称为“本发明的蛋白”。
在第二方面中,本发明提供了包含融合靶结合蛋白的细胞,该融合靶结合蛋白包含靶结合部分、细胞内信号传导区域和促进精氨酸或精氨酸前体的合成的结构域。该细胞可以表达该融合靶结合蛋白。
在第三方面中,本发明提供了编码融合靶结合蛋白的核酸,该融合靶结合蛋白包含靶结合部分、细胞内信号传导区域和促进精氨酸或精氨酸前体的合成的结构域。应当理解,根据本发明的第三方面的核酸可以被表达以产生根据本发明的第一方面的融合靶结合蛋白或根据本发明的第二方面的细胞。
在第四方面中,本发明提供了包含靶结合部分、细胞内信号传导区域和促进色氨酸或色氨酸前体的合成的结构域的融合靶结合蛋白。
在第五方面中,本发明提供了包含融合靶结合蛋白的细胞,该融合靶结合蛋白包含靶结合部分、细胞内信号传导区域和促进色氨酸或色氨酸前体的合成的结构域。该细胞可以表达该融合靶结合蛋白。
在第六方面中,本发明提供了编码融合靶结合蛋白的核酸,该融合靶结合蛋白包含靶结合部分、细胞内信号传导区域和促进色氨酸或色氨酸前体的合成的结构域。应当理解,根据本发明的第六方面的核酸可以被表达以产生根据本发明的第四方面的融合靶结合蛋白或根据本发明的第五方面的细胞。
在第七方面中,本发明提供了包含根据本发明的第一、第二、第四或第五方面的融合靶结合蛋白或细胞或者根据本发明的第三或第六方面的核酸的药物组合物。
在第八方面中,本发明提供了根据本发明的第一或第四方面的融合靶结合蛋白,用于作为药物使用。
在第九方面中,本发明提供了根据本发明的第二或第五方面的细胞,用于作为药物使用。
在第十方面中,本发明提供了根据本发明的第三或第六方面的核酸,用于作为药物使用。
在第十一方面中,本发明提供了根据本发明的第七方面的药物组合物,用于作为药物使用。
在第十二方面中,本发明提供了预防和/或治疗需要这样的预防和/或治疗的受试者的疾病的方法,该方法包括向受试者提供本发明的融合靶结合蛋白。融合靶结合蛋白可以根据本发明的第一、第四或第十一方面。本发明的蛋白可以作为本发明的细胞诸如本发明的第二或第五方面的细胞的一部分来提供。
如在本说明书中其他处进一步讨论的,本发明的融合靶结合蛋白、细胞、核酸和药物组合物可以用于预防和/或治疗一种或更多种选自由以下组成的组的紊乱:癌症;感染诸如病毒感染;和自身免疫性疾病。
附图简述
图1.说明了对含有融合靶结合蛋白的病毒的滴度的优化。图A示出了在72小时内,AMPHO Phoenix细胞的上清液中逆转录病毒颗粒的浓度增加。图B示出了通过流式细胞术检测tCD34来评估融合靶结合蛋白T细胞转导效率。使用AMPHO细胞系上清液未观察到PBMC的转导效率的差异。
图2.示出了,精氨酸途径酶在经转导的Jurkat细胞中显示出活性。图A示出了可以产生高纯度的蛋白-酶构建体,通过使用流式细胞术测量tCD34的表达来评估。图B说明了在经转导的细胞中ASS-1和OTC的表达增加。图C说明了促进经转导的细胞中精氨酸或精氨酸前体的合成的结构域执行其功能的能力。图D示出了鸟氨酸向瓜氨酸的细胞分解代谢(通过OTC)研究的结果。评估了由表达包含OTC酶结构域的融合靶结合蛋白(“GD2-OTC”)或包含ASS-1酶结构域和OTC酶结构域两者的融合靶结合蛋白(“GD2-ASS-OTC”)的细胞产生的瓜氨酸的量,并且与表达不含OTC酶结构域的对照构建体(“GD2”)或包含ASS-1酶结构域的融合靶结合蛋白(“GD2-ASS”)的细胞进行比较。图E示出了用包含促进精氨酸前体精氨基琥珀酸合成的结构域(ASS-1)的构建体转导的融合靶结合蛋白T细胞在小鼠的肿瘤微环境中的持续性。图F示出了,包含OTC结构域的融合靶结合蛋白T细胞(GD2-OTC)与不具有包含OTC结构域的融合靶结合蛋白的T细胞(仅GD2)相比显示出显著增强的持续性。
图3.说明了,可以将精氨酸途径酶转导到来自人类供体细胞的PBMC中。图A示出了,在PBMC中可以产生高纯度的融合靶结合蛋白-酶构建体,通过使用流式细胞术测量tCD34的表达。图B示出了在经转导的细胞中ASS-1和OTC的表达增加。图C示出了,在也含有包含促进精氨酸或精氨酸前体的合成的酶结构域的构建体的融合靶结合蛋白T细胞中,共抑制性受体LAG-3、TIM-3和PD-1的表达没有差异。图D示出了,如通过流式细胞术检测tCD34在7天扩增期间测量的,用包含促进精氨酸或精氨酸前体的合成的结构域的构建体转导的PBMC的持续性。
图4.示出了在低精氨酸肿瘤条件下ASS-1酶结构域和OTC酶结构域赋予了显著的代谢优势和增殖优势。图A示出了当在正常精氨酸和75%精氨酸耗尽的培养基条件(75%arginine depleted media conditions)下培养时,包含ASS-1酶结构域(GD2-ASS)和OTC酶结构域(GD2-OTC)的融合靶结合蛋白T细胞增强瓜氨酸代谢,通过培养物上清液的ELISA检测。图B说明了由表达本发明的融合靶结合蛋白(包含ASS-1结构域(“GD2-ASS”)或OTC结构域(“GD2-OTC”))的T细胞对神经母细胞瘤和骨髓性白血病细胞系的特异性细胞裂解,如对比由表达对照蛋白(“GD2-BB”,不含ASS-1或OTC)的T细胞的裂解来评估的。图C示出了在低精氨酸条件下包含ASS-1酶结构域或OTC酶结构域的融合靶结合蛋白T细胞与对照(无酶的GD2)相比显示出显著的增殖挽救。图上示出的条件为正常精氨酸(RPMI+10%FCS)、神经母细胞瘤来源的低精氨酸上清液(Lan-1 TCM)或75%精氨酸耗尽的培养基。
图5.示出了经修饰的融合靶结合蛋白T细胞在体内具有增强的抗肿瘤活性,并且可以应用于非GD2融合靶结合蛋白T细胞。图A示出了植入了GD2+肿瘤细胞并且施用了包含ASS-1结构域(GD2-ASS)和不含ASS-1结构域(仅GD2)的融合靶结合蛋白T细胞的NOG-SCID小鼠的相对肿瘤体积。测量随时间推移的相对肿瘤生长。图B示出了施用GD2-ASS-1融合靶结合蛋白T细胞和仅GD2融合靶结合蛋白T细胞后小鼠的存活百分比。图C说明了CD33融合靶结合蛋白T细胞和CD33-ASS-1融合靶结合蛋白T细胞在50%-75%AML细胞系条件培养基(低精氨酸)或75%精氨酸耗尽的培养基中的生活力。
图6.示出了本发明的细胞在体内精氨酸耗尽条件下的增加的持续性。在移植了5x106个抗GD2 CAR-T Jurkat细胞(对照细胞)、或表达本发明的包含GD2靶向部分和ASS-1结构域的蛋白的Jurkat细胞(GD2-ASS)、或表达本发明的包含GD2靶向部分和OTC结构域的蛋白的细胞(GD2-OTC)的NOG-SCID小鼠中显示,静脉内施用。GD2-ASS-1 CAR-T细胞和GD2-OTC CAR-T细胞与包含未修饰的GD2 CAR-T构建体的对照细胞相比显示出显著增强的持续性。
图7.示出了可以将包含不同靶结合部分的精氨酸途径酶转导到来自人类供体的PBMC中。蛋白印迹示出了,用本发明的蛋白转导的PBMC细胞中ASS-1和OTC的表达与对照的ASS-1和OTC的表达相比增加(图A)。图B示出了通过流式细胞术评估的LAG-3、TIM-3和PD-1的表达。
图8.示出了表达CD33靶向结构域与ASS-1结构域、OTC结构域或ASS-1结构域和OTC结构域的组合的CAR T细胞的杀细胞活性,所述CAR T细胞在K562白血病细胞的存在下以不同的效应物与靶的比率培养4小时。包含本发明的蛋白的细胞保持了杀细胞活性。
图9.示出了在低精氨酸肿瘤条件下表达本发明的包含抗GD2、抗CD33、抗间皮素或抗EGFRvIII靶向部分与ASS-1结构域、OTC结构域或ASS-1结构域和OTC结构域的蛋白的组合的CAR T细胞与对照细胞相比赋予了显著的代谢优势和增殖优势。使用共有相同结合结构域(即抗GD2、抗CD33、抗间皮素或抗EGFRvIII)但缺少酶结构域的未修饰的CAR-T细胞作为表达本发明的蛋白的CAR T细胞的对照。
图10.示出了在肿瘤条件培养基(TCM)中培养的表达本发明的蛋白的细胞赋予了显著的代谢优势和增殖优势(图A),所述本发明的蛋白包含GD2结合部分以及以下任一种:ASS-1结构域、OTC结构域或ASS-1结构域和OTC结构域。图B示出了,在肿瘤条件培养基(TCM)中培养的表达本发明的蛋白的细胞也赋予了显著的代谢优势和增殖优势,所述本发明的蛋白包含CD33结合部分以及以下任一种:ASS-1结构域、OTC结构域或ASS-1结构域和OTC结构域。
图11.示出了表达本发明的包含ASS-1结构域的蛋白的CAR-T细胞(抗CD33-ASS-1CAR-T细胞)显著增强了从带有白血病的小鼠骨髓的AML清除。该数据涉及植入NOG-SCID小鼠中的HL-60急性髓性白血病(AML)细胞的清除。
图12.图A说明了在用表达本发明的包含GD2结合部分和ASS-1结构域的蛋白的细胞处理的神经母细胞瘤异种移植小鼠的脾内,本发明的细胞的增加的持续性。在图B中显示了本发明的细胞响应于抗原刺激而增殖的能力提高。
图13.图A说明了在用表达本发明的蛋白的细胞处理的AML异种移植小鼠的脾内,本发明的细胞的增加的持续性,所述本发明的蛋白包含CD33结合部分和以下之一:ASS-1结构域、OTC结构域;或ASS-1结构域和OTC结构域。在图B中显示了本发明的细胞响应于抗原刺激而增殖的能力提高。
图14.列出了包含本发明的核酸的构建体的细节,所述构建体已用于本发明的细胞的成功的慢病毒产生。
发明详述
本发明基于本发明人的认识,即表达掺入了促进精氨酸或精氨酸前体的合成的结构域(和/或促进色氨酸或色氨酸前体的合成的结构域)的融合靶结合蛋白的细胞在体内表现出显著的优点。特别地,本发明人发现,表达这样的蛋白的细胞能够克服与肿瘤微环境相关的免疫抑制作用,本发明人认为所述免疫抑制作用导致了许多现有技术的基于CAR的疗法失败。
表达本发明的蛋白的细胞表现出的特别的优点之一是它们在肿瘤微环境中的持续性和增殖增加。已知,该微环境本来可能显著地减少现有技术的CAR T细胞的有效性。
此外,表达本发明的蛋白的细胞在免疫抑制性肿瘤微环境的条件下表现出改进的增殖能力。表达CAR的细胞的增殖通常被精氨酸耗尽的条件显著抑制。
这两个优点都允许改进的治疗,其中表达本发明的蛋白的细胞的数目增加,并且这些细胞在肿瘤部位处具有延长的驻留,因此允许改进对癌细胞的杀伤。在这方面中,重要的是注意到,对本发明的蛋白和细胞进行的修饰不会显著降低它们杀伤癌细胞(无论是通过细胞毒性作用还是特异性细胞裂解)的能力。
因此,应当认识到,本发明的蛋白和细胞提供了与现有技术的基于CAR的疗法相比改进的治疗剂。本文描述的本发明的多种方面和实施方案源于或有助于这些改进。
为了理解本发明的目的,现在将参考以下定义进一步描述。为了简洁起见,以下段落可能仅在本发明的蛋白的上下文中涉及特定的实施方案,但应当理解,除非上下文另有要求,否则结合本发明的蛋白述及的实施方案可以用于本文公开的本发明的任何其他方面。
融合靶结合蛋白
融合靶结合蛋白是使得能够将期望的特异性赋予表达本发明的蛋白的细胞的期望的生物学特性的人工融合蛋白。为了简洁起见,在本公开内容中,它们也将被称为“蛋白”或“本发明的蛋白”。在本发明的上下文中,不同类型的细胞以及它们分别能够提供的期望的生物特性在本说明书中其他地方进一步讨论。通常,在融合靶结合蛋白和表达这样的蛋白的细胞的医学用途的背景下,靶向针对与疾病相关的细胞(诸如癌细胞或感染的细胞)的杀细胞活性赋予了所需的治疗效用。
本发明的蛋白至少包含靶结合部分、细胞内信号传导区域和促进精氨酸或精氨酸前体的合成的结构域和/或促进色氨酸或色氨酸前体的合成的结构域。这些术语在本说明书中其他地方定义。本领域技术人员将理解,这样的蛋白中也可以掺入多种其他任选的结构域或区域。
融合靶结合蛋白的不同部分(靶结合部分、细胞内信号传导区域和促进精氨酸或精氨酸前体的合成的结构域和/或促进色氨酸或色氨酸前体的合成的结构域)可以源自两种或更多种不同的“来源”。因此,不同的部分可以源自两种或更多种天然存在的分子,诸如蛋白。另外,就不同的起源界或物种而言,不同的部分可以源自不同的来源。
在本发明的上下文中特别感兴趣的一类融合靶结合蛋白是嵌合抗原受体(CAR)蛋白。CAR利用抗体或其片段来赋予结合的特异性,并且利用细胞内信号传导区域来确定所需的特定生物活性。多种不同代的CAR是已知的,并且这些不同代中的每一代代表本发明的融合靶结合蛋白的合适实例,除非本公开内容的上下文另有要求。
为了避免疑问,本发明的蛋白也可以被认为包含经修饰以包含促进精氨酸或精氨酸前体的合成的结构域和/或促进色氨酸或色氨酸前体的合成的结构域的T细胞受体(TCR)。在这样的实施方案中,靶结合部分可以由受体的TCRα链和TCRβ链提供。为了本发明的目的,由于靶结合部分和促进精氨酸或精氨酸前体的合成的结构域和/或促进色氨酸或色氨酸前体的合成的结构域来自不同的来源,因此如此修饰的TCR是嵌合性的。
本发明的蛋白通常还包含另外的部分,所述另外的部分包括来自由以下组成的组的一个或更多个:跨膜部分、CH2CH3间隔部分、CD8铰链部分和CD8a信号传导部分。
本发明的示例性蛋白的氨基酸序列在SEQ ID NO:12至SEQ ID NO:23中列出。应当理解,包含这些序列中的任何序列或由这些序列中的任何序列组成的分子代表根据本发明的第一方面的蛋白。在SEQ ID NO:12至SEQ ID NO:23中列出的任何蛋白可以用于本发明的医学用途、治疗方法或药物组合物。
本发明的示例性蛋白的序列的片段或变体
本说明书包含许多示例性的蛋白和核酸序列。这些既包括融合靶结合蛋白的序列和编码它们的核酸的序列,也包括靶结合部分的序列、细胞内信号传导区域的序列和酶结构域的序列。
应当理解,除非上下文另有要求,否则本发明的范围不应受限于本文列出的特定的示例性序列。特别地,技术人员将认识到,示例性序列的片段或变体可能仍然能够提供由示例性序列赋予的所需活性。示例性序列的此类合适的片段或变体可以用于本发明的多种方面和实施方案。
因此,除非上下文另有要求,否则本说明书中述及示例性氨基酸或核酸序列应被认为也包括示例性序列的功能性片段或变体。例如,合适的片段可以包含相关的示例性序列的全长的至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%。事实上,合适的变体可以包含示例性序列的全长的至少96%、至少97%、至少98%或至少99%。
合适的变体可以与相关的示例性序列共有至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%的同一性。事实上,合适的变体可以与相关的示例性序列共有至少96%、至少97%、至少98%或至少99%的同一性。
可以参考本领域技术人员已知的测定,包括实施例中描述的那些测定,通过实验评估片段或变体是“功能性”的。
精氨酸或精氨酸前体
本发明涉及包含促进精氨酸或精氨酸前体的合成的结构域的融合靶结合蛋白。
精氨酸(往往缩写为“Arg”或“R”)是一种半必需氨基酸。它具有174.2g/mol-1的分子量,并且也可以被称为2-氨基-5-胍基戊酸。
在本公开内容的上下文中,述及精氨酸前体应当在精氨酸途径(代谢的精氨酸藉以被输入、分解代谢或再循环的一系列化学反应)的上下文中解释。因此,为了本发明的目的,精氨酸的前体可以被认为包括直接或间接转化为精氨酸的任何化合物。
促进精氨酸或精氨酸前体的合成的结构域
本发明的蛋白包含促进精氨酸或精氨酸前体的合成的结构域。结构域履行该功能也就是说促进精氨酸或精氨酸前体的合成的能力,可以通过任何合适的手段或测定来研究。
本领域技术人员将理解,合适的手段或测定可以参考其合成将被促进的化合物例如精氨酸或精氨酸前体来选择。仅通过实例的方式,结构域促进必需合成的能力的合适测定在实施例中结合本发明的示例性细胞的特征进一步描述。
合适地,促进精氨酸或精氨酸前体的合成的结构域可以是能够促进精氨酸或精氨酸前体的合成的酶结构域。在这样的实施方案中,酶结构域可以包含全长酶结构域或这样的结构域的片段或变体,条件为该结构域表现出必需的活性。
在合适的实施方案中,其合成被促进的精氨酸前体是精氨基琥珀酸。在这样的实施方案中,促进这样的合成的结构域可以选自:精氨基琥珀酸合酶(ASS-1)酶结构域和精氨基琥珀酸合成酶(ArgG)结构域。合适地,促进这样的合成的结构域是精氨基琥珀酸合酶(ASS-1)酶结构域。
在合适的实施方案中,其合成被促进的精氨酸前体是精氨基琥珀酸。对精氨基琥珀酸的催化诸如通过精氨基琥珀酸裂合酶产生精氨酸。在这样的实施方案中,促进这样的合成的结构域可以选自:精氨基琥珀酸裂合酶(ASL)酶结构域和精氨基琥珀酸裂合酶(ArgH)酶结构域。
在合适的实施方案中,其合成被促进的精氨酸前体是瓜氨酸。在这样的实施方案中,促进这样的合成的结构域可以选自:鸟氨酸转氨甲酰酶(OTC)酶结构域;鸟氨酸脱羧酶(ODC1);和鸟氨酸转氨甲酰酶(ArgF)酶结构域。合适地,促进这样的合成的结构域是鸟氨酸转氨甲酰酶(OTC)酶结构域。
因此,在合适的实施方案中,促进精氨酸或精氨酸前体的合成的结构域包括选自由以下组成的组的酶结构域:ASS-1结构域;OTC结构域;ASL结构域;OCD1结构域;ArgG结构域;ArgH结构域和ArgF结构域。结构域可以选自ASS-1结构域和/或OTC结构域。
合适地,根据本发明的蛋白可以包含多于一个促进精氨酸或精氨酸前体的合成的结构域。合适地,这样的多于一个可以包含多于一个酶结构域。所述多于一个可以包含单独的酶结构域的多于一个拷贝和/或多个酶结构域的组合。例如,根据本发明的蛋白可以包含选自由以下组成的组的酶结构域的组合:ASS-1结构域;OTC结构域;ASL结构域;OCD1结构域;ArgG结构域;ArgH结构域和ArgF结构域。仅通过实例的方式,本发明的蛋白可以包含ASS-1结构域和OTC结构域两者。
促进精氨酸或精氨酸前体的合成的合适的酶结构域可以是人类酶结构域。在这样的实施方案中,这可以是ASS-1、OTC、ASL或ODC1。
促进精氨酸或精氨酸前体的合成的合适的酶结构域可以是天然存在的酶结构域。可选地,促进精氨酸或精氨酸前体的合成的合适的酶结构域可以是能够重演天然存在的结构域的合成活性的天然存在的酶结构域的片段或衍生物。这样的片段或衍生物可以具有天然存在的结构域的合成活性的50%或更多的合成活性;天然存在的结构域的合成活性的60%或更多的合成活性;天然存在的结构域的合成活性的70%或更多的合成活性;天然存在的结构域的合成活性的80%或更多的合成活性;天然存在的结构域的合成活性的90%或更多的合成活性或天然存在的结构域的合成活性的95%或更多的合成活性。事实上,合适的片段或衍生物可以具有比它所源自的天然存在的结构域更大的合成活性,也就是说,它可以具有天然存在的结构域的合成活性的100%或更多。
为了本公开内容的目的,促进精氨酸前体的合成的合适的酶结构域的另外的细节在以下阐述。
ASS-1酶结构域
适于掺入本发明的蛋白中的ASS-1酶结构域的一种实例在SEQ ID NO:1中列出。
可选地,在SEQ ID NO:1中列出的序列的片段或衍生物可以用作用于掺入本发明的蛋白中的合适的ASS-1酶结构域。
将ASS-1活性赋予本发明的蛋白的任何酶结构域都可以用于这样的实施方案。ASS-1活性可以通过本公开内容的实施例部分中描述的测定来评估。
合适水平的ASS-1活性可以相当于由SEQ ID NO:1赋予的ASS-1活性。可选地,赋予较低或较高水平的ASS-1活性的酶结构域可以仍然是有益的。
在SEQ ID NO:1中列出的ASS-1酶结构域的合适的片段可以包含SEQ ID NO:1中列出的除1个氨基酸残基以外的所有氨基酸残基、SEQ ID NO:1中列出的除2个氨基酸残基以外的所有氨基酸残基、SEQ ID NO:1中列出的除3个氨基酸残基以外的所有氨基酸残基、SEQID NO:1中列出的除4个氨基酸残基以外的所有氨基酸残基、SEQ ID NO:1中列出的除5个氨基酸残基以外的所有氨基酸残基、SEQ ID NO:1中列出的除6个氨基酸残基以外的所有氨基酸残基、SEQ ID NO:1中列出的除7个氨基酸残基以外的所有氨基酸残基、SEQ ID NO:1中列出的除8个氨基酸残基以外的所有氨基酸残基、SEQ ID NO:1中列出的除9个氨基酸残基以外的所有氨基酸残基或SEQ ID NO:1中列出的除10个氨基酸残基以外的所有氨基酸残基。
仅通过实例的方式,在SEQ ID NO:1中列出的序列的合适的变体可以与SEQ IDNO:1或与如以上定义的SEQ ID NO:1的片段共有至少75%的同一性。合适的变体可以与SEQID NO:1或其片段共有至少80%的同一性;与SEQ ID NO:1或其片段共有至少85%的同一性;与SEQ ID NO:1或其片段共有至少90%的同一性;与SEQ ID NO:1或其片段共有至少95%的同一性;与SEQ ID NO:1或其片段共有至少96%的同一性;与SEQ ID NO:1或其片段共有至少97%的同一性;与SEQ ID NO:1或其片段共有至少98%的同一性或与SEQ ID NO:1或其片段共有至少99%的同一性。为了适于掺入本发明的CAR中,这样的变体应当保留如以上述及的ASS-1的合成活性。
合适的ASS-1酶结构域可以提供的活性为由SEQ ID NO:1的结构域提供的活性的至少50%。合适地,它可以提供的活性为由SEQ ID NO:1的结构域提供的活性的至少60%、至少70%、至少80%、至少90%。合适地,它可以提供的活性甚至为由SEQ ID NO:1的结构域提供的活性的至少100%。
事实上,合适的ASS-1结构域可以提供的活性为由SEQ ID NO:1的结构域提供的活性的至少110%。合适地,它可以提供的活性为由SEQ ID NO:1的结构域提供的活性的至少120%、至少130%、至少140%、至少150%、至少160%、至少170%、至少180%、至少190%。合适地,它可以提供的活性甚至为由SEQ ID NO:1的结构域提供的活性的至少200%。
OTC酶结构域
适于掺入本发明的蛋白中的OTC酶结构域的一种实例在SEQ ID NO:2中列出。
可选地,在SEQ ID NO:2中列出的序列的片段或衍生物可以用作用于掺入本发明的蛋白中的合适的OTC酶结构域。
将OTC活性赋予本发明的蛋白的任何酶结构域都可以用于这样的实施方案。OTC活性可以通过本公开内容的实施例部分中描述的测定来评估。
合适水平的OTC活性可以相当于由SEQ ID NO:2赋予的OTC活性。可选地,赋予较低或较高水平的OTC活性的酶结构域可以仍然是有益的。
在SEQ ID NO:2中列出的OTC酶结构域的合适的片段可以包含SEQ ID NO:2中列出的除1个氨基酸残基以外的所有氨基酸残基、SEQ ID NO:2中列出的除2个氨基酸残基以外的所有氨基酸残基、SEQ ID NO:2中列出的除3个氨基酸残基以外的所有氨基酸残基、SEQID NO:2中列出的除4个氨基酸残基以外的所有氨基酸残基、SEQ ID NO:2中列出的除5个氨基酸残基以外的所有氨基酸残基、SEQ ID NO:2中列出的除6个氨基酸残基以外的所有氨基酸残基、SEQ ID NO:2中列出的除7个氨基酸残基以外的所有氨基酸残基、SEQ ID NO:2中列出的除8个氨基酸残基以外的所有氨基酸残基、SEQ ID NO:2中列出的除9个氨基酸残基以外的所有氨基酸残基或SEQ ID NO:2中列出的除10个氨基酸残基以外的所有氨基酸残基。
仅通过实例的方式,在SEQ ID NO:2中列出的序列的合适的变体可以与SEQ IDNO:2或与如以上定义的SEQ ID NO:2的片段共有至少75%的同一性。合适的变体可以与SEQID NO:2或其片段共有至少80%的同一性;与SEQ ID NO:2或其片段共有至少85%的同一性;与SEQ ID NO:2或其片段共有至少90%的同一性;与SEQ ID NO:2或其片段共有至少95%的同一性;与SEQ ID NO:2或其片段共有至少96%的同一性;与SEQ ID NO:2或其片段共有至少97%的同一性;与SEQ ID NO:2或其片段共有至少98%的同一性或与SEQ ID NO:2或其片段共有至少99%的同一性。为了适于掺入本发明的CAR中,这样的变体应当保留如以上述及的OTC的合成活性。
合适的OTC酶结构域可以提供的活性为由SEQ ID NO:2的结构域提供的活性的至少50%。合适地,它可以提供的活性为由SEQ ID NO:2的结构域提供的活性的至少60%、至少70%、至少80%、至少90%。合适地,它可以提供的活性甚至为由SEQ ID NO:2的结构域提供的活性的至少100%。
事实上,合适的OTC结构域可以提供的活性为由SEQ ID NO:2的结构域提供的活性的至少110%。合适地,它可以提供的活性为由SEQ ID NO:2的结构域提供的活性的至少120%、至少130%、至少140%、至少150%、至少160%、至少170%、至少180%、至少190%。合适地,它可以提供的活性甚至为由SEQ ID NO:2的结构域提供的活性的至少200%。
精氨基琥珀酸裂合酶(ASL)酶结构域
适于掺入本发明的蛋白中的ASL酶结构域的一种实例由SEQ ID NO:30中列出的核酸序列编码。
可选地,在SEQ ID NO:30中列出的序列的片段或衍生物可以用于编码用于掺入本发明的蛋白中的合适的ASL酶结构域。
将ASL活性赋予本发明的蛋白的任何酶结构域都可以用于这样的实施方案。
合适水平的ASL活性可以相当于由SEQ ID NO:30编码的蛋白赋予的ASL活性。可选地,赋予较低或较高水平的ASL活性的酶结构域可以仍然是有益的。
鸟氨酸脱羧酶(ODC1)酶结构域
适于掺入本发明的蛋白中的ODC1酶结构域的一种实例由SEQ ID NO:31中列出的核酸序列编码。
可选地,在SEQ ID NO:31中列出的序列的片段或衍生物可以用于编码用于掺入本发明的蛋白中的合适的ODC1酶结构域。
将ODC1活性赋予本发明的蛋白的任何酶结构域都可以用于这样的实施方案。
合适水平的ODC1活性可以相当于由SEQ ID NO:31编码的蛋白赋予的ODC1活性。可选地,赋予较低或较高水平的ODC1活性的酶结构域可以仍然是有益的。
精氨基琥珀酸合成酶(ArgG)酶结构域
适于掺入本发明的CAR中的ArgG酶结构域的一种实例由SEQ ID NO:32中列出的核酸序列编码。
可选地,在SEQ ID NO:32中列出的序列的片段或衍生物可以用于编码用于掺入本发明的蛋白中的合适的ArgG酶结构域。
将ArgG活性赋予本发明的蛋白的任何酶结构域都可以用于这样的实施方案。
合适水平的ArgG活性可以相当于由SEQ ID NO:32编码的蛋白赋予的ArgG活性。可选地,赋予较低或较高水平的ArgG活性的酶结构域可以仍然是有益的。
精氨基琥珀酸裂合酶(ArgH)酶结构域
适于掺入本发明的蛋白中的ArgH酶结构域的一种实例由SEQ ID NO:33中列出的核酸序列编码。
可选地,在SEQ ID NO:33中列出的序列的片段或衍生物可以用于编码用于掺入本发明的蛋白中的合适的ArgH酶结构域。
将ArgH活性赋予本发明的蛋白的任何酶结构域都可以用于这样的实施方案。
合适水平的ArgH活性可以相当于由SEQ ID NO:33编码的蛋白赋予的ArgH活性。可选地,赋予较低或较高水平的ArgH活性的酶结构域可以仍然是有益的。
鸟氨酸转氨甲酰酶(ArgF)酶结构域
适于掺入本发明的蛋白中的ArgF酶结构域的一种实例由SEQ ID NO:34中列出的核酸序列编码。
可选地,在SEQ ID NO:34中列出的序列的片段或衍生物可以用于编码用于掺入本发明的蛋白中的合适的ArgF酶结构域。
将ArgF活性赋予本发明的蛋白的任何酶结构域都可以用于这样的实施方案。
合适水平的ArgF活性可以相当于由SEQ ID NO:34编码的蛋白赋予的ArgF活性。可选地,赋予较低或较高水平的ArgF活性的酶结构域可以仍然是有益的。
色氨酸或色氨酸前体
本发明涉及包含促进色氨酸或色氨酸前体的合成的结构域的蛋白。
色氨酸(往往缩写为“Trp”或“W”)是一种非极性氨基酸。它具有204.2g/mol-1的分子量,并且也可以被称为2-氨基-3-(1H-吲哚-3-基)丙酸。
为了本发明的目的,“色氨酸前体”可以被认为是色氨酸产生级联反应中色氨酸之前的任何化合物。
促进色氨酸或色氨酸前体的合成的结构域
本发明的蛋白包含促进色氨酸或色氨酸前体的合成的结构域。结构域履行该功能也就是说促进色氨酸或色氨酸前体的合成的能力,可以通过任何合适的手段或测定来研究。
本领域技术人员将理解,合适的手段或测定可以参考其合成将被促进的化合物例如色氨酸或色氨酸前体来选择。仅通过实例的方式,结构域促进必需合成的能力的合适的测定在实施例中结合本发明的示例性细胞的特征进一步描述。
合适地,促进色氨酸或色氨酸前体的合成的结构域可以是能够促进色氨酸或色氨酸前体的合成的酶结构域。在这样的实施方案中,酶结构域可以包含全长酶结构域或这样的结构域的片段或变体,条件为该结构域表现出必需的活性。
在合适的实施方案中,其合成被促进的色氨酸前体是吲哚甘油磷酸。在这样的实施方案中,促进这样的合成的结构域可以是色氨酸合酶(TRP5)酶结构域。
在合适的实施方案中,促进了色氨酸的合成。在这样的实施方案中,促进这样的合成的结构域可以是吲哚胺2,3-双加氧酶(IDO)酶结构域。
色氨酸合酶(TRP5)酶结构域
适于掺入本发明的蛋白中的TRP5酶结构域的一种实例由SEQ ID NO:35中列出的核酸序列编码。
可选地,在SEQ ID NO:35中列出的序列的片段或衍生物可以用于编码用于掺入本发明的蛋白中的合适的TRP5酶结构域。
将TRP5活性赋予本发明的蛋白的任何酶结构域都可以用于这样的实施方案。
合适水平的TRP5活性可以相当于由SEQ ID NO:35编码的蛋白赋予的TRP5活性。可选地,赋予较低或较高水平的TRP5活性的酶结构域可以仍然是有益的。
吲哚胺2,3-双加氧酶(IDO)酶结构域
适于掺入本发明的蛋白中的IDO酶结构域的一种实例由SEQ ID NO:36中列出的核酸序列编码。
可选地,在SEQ ID NO:36中列出的序列的片段或衍生物可以用于编码用于掺入本发明的蛋白中的合适的IDO酶结构域。
将IDO活性赋予本发明的蛋白的任何酶结构域都可以用于这样的实施方案。
合适水平的IDO活性可以相当于由SEQ ID NO:36编码的蛋白赋予的IDO活性。可选地,赋予较低或较高水平的IDO活性的酶结构域可以仍然是有益的。
靶结合部分
本发明的蛋白包含靶结合部分。靶结合部分赋予蛋白结合特异性,并因此赋予表达本发明的蛋白的细胞对靶结构诸如细胞的杀细胞活性,在所述靶结构上存在被靶结合部分识别的靶分子。
特别地,靶结合部分赋予了本发明的细胞的生物活性的特异性(例如,杀细胞活性,或响应于活化的细胞增殖),这是其治疗效用的基础。除非上下文另有要求,否则在本公开内容中述及特异性结合可以被解释为是指靶结合部分在将要发生结合的环境中区分可能的配偶体的能力。当存在其他潜在靶时,与一个特定靶分子相互作用的靶结合部分被称为“特异性地结合”与其相互作用的靶分子。在一些实施方案中,特异性结合通过检测或确定靶结合部分与其靶分子之间的结合程度来评估;在一些实施方案中,特异性结合通过检测或确定结合部分-靶分子复合物的解离程度来评估;在一些实施方案中,特异性结合通过检测或确定靶结合部分竞争其靶分子和另一实体之间的替代性相互作用的能力来评估。在一些实施方案中,特异性结合通过跨一定浓度范围进行这样的检测或确定来评估。在合适的实施方案中,特异性结合通过确定关联靶和非关联靶之间结合亲和力的差异来评估。例如,特异性的靶结合部分对关联靶分子具有的结合亲和力可以是对非关联靶的结合亲和力的约3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍或更多。
在本公开内容的上下文中,“特异性”是特定靶结合部分区分其靶分子结合配偶体与其他潜在结合配偶体的能力的量度。
合适的靶结合部分可以针对任何期望的靶分子。靶结合部分可以针对由靶单独表达或广泛表达的靶分子,期望针对所述靶来引导表达本发明的蛋白的细胞的杀细胞活性。例如,靶结合部分可以针对与疾病相关的靶分子。合适地,靶结合部分可以针对与癌症或与感染相关的靶分子。
在合适的实施方案中,靶结合部分选自由以下组成的组:GD2靶结合部分;CD33靶结合部分;间皮素靶结合部分和EGFRvIII靶结合部分。
这样的靶结合部分的实例在SEQ ID NO:3至SEQ ID NO:6中列出。应当理解,片段或变体(例如,与示例性序列相差1个、2个、3个、4个、5个或更多个氨基酸残基)可以用作替代性靶结合部分,条件为片段或变体保持结合靶分子的能力。
非限制性地,合适的靶结合部分可以选自由以下组成的组:抗体或其片段(诸如scFv)或衍生物;TCR诸如TCRα链或TCRβ链;以及适体。
GD2靶结合部分
GD2靶结合部分是能够结合二唾液酸神经节苷脂2(GD2)(其也可以被称为神经节苷脂GD2)的部分。本发明的包含GD2靶结合部分的蛋白适用于其中期望发挥表达本发明的蛋白的细胞针对包含GD2分子的靶(例如表达GD2的细胞)的杀细胞活性的情况。
GD2由神经外胚层来源的癌症包括神经母细胞瘤、骨肉瘤和黑素瘤表达。因此,应当理解,本发明的包含GD2靶结合部分的蛋白(诸如CAR)适用于其中期望将本发明的蛋白用于预防和/或治疗任何此类癌症并且特别是神经母细胞瘤的医学用途的情况。
适于掺入根据本发明的蛋白中的GD2靶结合部分可以是抗GD2抗体,诸如抗GD2单克隆抗体或其抗原结合片段或衍生物。例如,GD2靶结合部分可以是抗GD2 scFv抗体片段。仅通过实例的方式,包含scFv抗体片段的合适的GD2靶向结构域在SEQ ID NO:3中列出。
在SEQ ID NO:3中列出的scFv抗体片段也被称为14g2a scFv,如US 9,493,740 B2描述的。它源自US 9,777,068 B2中公开的ch14.18抗体,并且应当理解,其他ch14.18抗体片段或变体可以用作本发明的蛋白中的GD2靶结合部分。
可选地,合适的GD2靶结合部分可以选自由以下组成的组:抗GD2适体或其片段或衍生物。
合适地,GD2靶结合部分能够特异性地结合GD2。
CD33靶结合部分
CD33靶结合部分是能够结合CD33(也称为Siglec-3)的部分。CD33是跨膜蛋白。本发明的包含CD33靶结合部分的蛋白适用于其中期望发挥表达本发明的蛋白的细胞针对包含CD33分子的靶(例如表达CD33的细胞)的生物活性的情况。
CD33由急性髓性白血病(AML)细胞表达。因此,应当理解,本发明的包含CD33靶结合部分的蛋白适用于其中期望将本发明的蛋白用于预防和/或治疗AML的医学用途的情况。
适于掺入根据本发明的蛋白中的CD33靶结合部分可以是抗CD33抗体,诸如抗CD33单克隆抗体或其抗原结合片段或衍生物。例如,CD33靶结合部分可以是抗CD33 scFv抗体片段。仅通过实例的方式,包含scFv抗体片段的合适的CD33靶向结构域在SEQ ID NO:4中列出。
在SEQ ID NO:4中列出的scFv抗体片段源自人源化my96克隆单克隆抗体。my96抗体的细节在Leukemia.2015Aug;29(8):1637-47中阐述,并且SEQ ID NO:4的scFv片段的细节在US20160096892A1中阐述(其中该scFv作为SEQ ID NO:147被公开)。应当理解,其他my96抗体片段或变体可以用作本发明的蛋白中的CD33靶结合部分。
可选地,合适的CD33靶结合部分可以选自由以下组成的组:抗CD33适体或其片段或衍生物。
合适地,CD33靶结合部分能够特异性地结合CD33。
间皮素靶结合部分
间皮素靶结合部分是能够结合间皮素的部分。间皮素是一种40kDa蛋白,是MSLN的产物。本发明的包含间皮素靶结合部分的蛋白适用于其中期望发挥表达本发明的蛋白的细胞针对包含间皮素分子的靶(例如表达间皮素的细胞)的生物活性的情况。
间皮素由许多不同类型的癌症细胞表达。表达间皮素的癌症包括,例如,上皮癌,诸如卵巢癌、肺腺癌和胰腺癌。因此,应当理解,本发明的包含间皮素靶结合部分的蛋白适用于其中期望将本发明的蛋白用于预防和/或治疗任何表达间皮素的癌症的医学用途的情况。
适于掺入根据本发明的蛋白中的间皮素靶结合部分可以是抗间皮素抗体,诸如抗间皮素单克隆抗体或其抗原结合片段或衍生物。例如,间皮素靶结合部分可以是抗间皮素scFv抗体片段。仅通过实例的方式,包含scFv抗体片段的合适的间皮素靶向结构域在SEQID NO:5中列出。
在SEQ ID NO:5中列出的scFv抗体片段源自SS1抗体。该抗体及源自其的scFv的细节在WO 2015/090230A中列出(其中鼠SS1 scFv的氨基酸序列在SEQ ID NO:279中提供)。应当理解,其他SS1抗体片段或变体可以用作本发明的蛋白中的间皮素靶结合部分。
可选地,合适的间皮素靶结合部分可以选自由以下组成的组:抗间皮素适体或其片段或衍生物。
合适地,GD2靶结合部分能够特异性地结合GD2。
EGFRvIII靶结合部分
EGFRvIII靶结合部分是能够结合表皮生长因子受体变体III(EGFRvIII)的部分。本发明的包含EGFRvIII靶结合部分的蛋白适用于其中期望发挥表达本发明的蛋白的细胞针对包含EGFRvIII分子的靶(例如表达EGFRvIII的细胞)的生物活性的情况。
EGFRvIII由一系列上皮来源的癌症表达。因此,应当理解,本发明的包含EGFRvIII靶结合部分的蛋白适用于其中期望将本发明的蛋白用于预防和/或治疗表达EGFR的癌症诸如胶质母细胞瘤和结肠直肠癌的医学用途的情况。特别地,本发明的包含EGFRvIII靶结合部分的蛋白适用于预防和/或治疗胶质母细胞瘤。
适于掺入根据本发明的蛋白中的EGFRvIII靶结合部分可以是抗EGFRvIII抗体(诸如抗EGFRvIII单克隆抗体)或其抗原结合片段或衍生物。例如,EGFRvIII靶结合部分可以是抗EGFRvIII scFv抗体片段。仅通过实例的方式,包含scFv抗体片段的合适的EGFRvIII靶向结构域在SEQ ID NO:6中列出。
在SEQ ID NO:6中列出的scFv抗体片段源自WO 2012/138475A1中公开的139抗体(其中139抗体的人类scFv作为SEQ ID NO:5列出,并且掺入该scFv的CAR构建体作为SEQ IDNO:11列出)。应当理解,其他139抗体片段或变体可以用作本发明的蛋白中的间皮素靶结合部分。
可选的EGFRvIII靶结合部分可以源自MR1抗EGFRvIII抗体。这样的EGFRvIII靶结合部分的一种实例是由SEQ ID NO:41的DNA序列编码的scFv(源自MR1)。该可选的EGFRvIII靶结合部分被掺入SEQ ID NO:42、SEQ ID NO:43和SEQ ID NO:44中列出的本发明的示例性蛋白中。本发明的这些示例性蛋白用于实施例中描述的研究中。
可选地,合适的EGFRvIII靶结合部分可以选自由以下组成的组:抗EGFRvIII适体或其片段或衍生物。
合适地,EGFRvIII靶结合部分能够特异性地结合EGFRvIII。
细胞内信号传导区域
本发明的蛋白包含至少一个细胞内信号传导区域。细胞内信号传导区域用于将靶结合部分与靶分子的结合与表达该蛋白的细胞的其他生物活性偶联。特别地,合适的细胞内信号传导区域可以将靶结合部分与其靶分子的结合与细胞的杀细胞活性的活化和/或细胞响应于活化而增殖的能力偶联。
如在实施例中阐述的,合适的细胞内信号传导区域可以响应靶分子与靶结合部分的结合而活化细胞毒性或特异性细胞溶解活性。可选地或另外地,合适的细胞内信号传导区域可以响应于靶分子与靶结合部分的结合而促进活化诱导的细胞增殖。
在一种合适的实施方案中,细胞内信号传导区域包括选自由以下组成的组的区域:4-1BB信号传导区域;OX-40信号传导区域;CD28信号传导区域;ICOS信号传导区域和CD3ζ信号传导区域。
应当理解,根据本发明的蛋白可以包含多于一个细胞内信号传导区域。合适地,该多于一个可以包含单独的细胞内信号传导区域的多于一个拷贝。例如,本发明的蛋白可以包含以下中的一个或更多个的多个拷贝:4-1BB信号传导区域;OX-40信号传导区域;CD28信号传导区域;ICOS信号传导区域和CD3ζ信号传导区域。
另外地或可选地,本发明的蛋白可以包含多个细胞内信号传导区域的组合。例如,根据本发明的蛋白可以包含选自由以下组成的组的细胞内信号传导区域的组合:4-1BB信号传导区域;OX-40信号传导区域;CD28信号传导区域;ICOS信号传导区域和CD3ζ信号传导区域。仅通过实例的方式,本发明的蛋白可以包含4-1BB信号传导区域和CD3ζ信号传导区域两者。
合适的4-1BB信号传导区域是能够向表达包含这样的信号传导区域的蛋白的细胞提供足够的共刺激信号传导以促进以下至少一种的4-1BB信号传导区域:活化细胞和/或细胞的功能,诸如细胞释放细胞因子和/或细胞的细胞毒性;和/或细胞的增殖和/或持续性。持续性可以是在体内或体外的持续性。持续性特别地可以是细胞在免疫抑制肿瘤微环境或复制该微环境的条件下的持续性。例如,细胞因子释放可以包括一种或更多种选自由以下组成的组的细胞因子:IFN-γ和/或TNFα和/或IL2。
合适地,4-1BB信号传导区域可以包括4-1BB的全长序列。可选地,4-1BB信号传导区域可以包括全长序列的截短和/或修饰的形式。仅通过实例的方式,合适的4-1BB信号传导区域可以包括SEQ ID NO:7中列出的氨基酸序列或该序列的一部分。合适地,用于掺入本发明的蛋白中的4-1BB信号传导区域可以由SEQ ID NO:7中列出的氨基酸序列组成。
在一种合适的实施方案中,OX-40信号传导区域是能够向表达包含这样的信号传导区域的蛋白的细胞提供足够的共刺激信号传导以促进以下至少一种的OX-40信号传导区域:活化细胞和/或细胞的功能和/或细胞的持续性。持续性可以是在体内或体外的持续性。持续性特别地可以是细胞在免疫抑制肿瘤微环境或复制该微环境的条件下的持续性。
合适地,OX-40信号传导区域可以包括OX-40的全长序列。可选地,OX-40信号传导区域可以包括全长序列的截短和/或修饰的形式。仅通过实例的方式,合适的OX-40信号传导区域可以包括SEQ ID NO:8中列出的氨基酸序列或该序列的一部分。合适地,用于掺入本发明的蛋白中的OX-40信号传导区域可以由SEQ ID NO:8中列出的氨基酸序列组成。
合适的CD28信号传导区域是能够向表达包含这样的信号传导区域的蛋白的细胞提供足够的共刺激信号传导以促进以下至少一种的CD28信号传导区域:活化细胞和/或细胞的功能和/或细胞的持续性。持续性可以是在体内或体外的持续性。持续性特别地可以是细胞在免疫抑制肿瘤微环境或复制该微环境的条件下的持续性。
合适地,CD28信号传导区域可以包括CD28的全长序列。可选地,CD28信号传导区域可以包括全长序列的截短和/或修饰的形式。仅通过实例的方式,合适的CD28信号传导区域可以包括SEQ ID NO:9中列出的氨基酸序列或该序列的一部分。合适地,用于掺入本发明的蛋白中的CD28信号传导区域可以由SEQ ID NO:9中列出的氨基酸序列组成。
合适的ICOS信号传导区域是能够向表达包含这样的信号传导区域的蛋白的细胞提供足够的共刺激信号传导以促进以下至少一种的ICOS信号传导区域:活化细胞和/或细胞的功能,诸如细胞释放细胞因子和/或细胞的细胞毒性;和/或细胞的增殖和/或持续性。持续性可以是在体内或体外的持续性。持续性特别地可以是细胞在免疫抑制肿瘤微环境或复制该微环境的条件下的持续性。
合适地,ICOS信号传导区域可以包括ICOS(也被称为CD278)的全长序列。可选地,ICOS信号传导区域可以包括全长序列的截短和/或修饰的形式。仅通过实例的方式,合适的ICOS信号传导区域可以包括SEQ ID NO:10中列出的氨基酸序列或该序列的一部分。合适地,用于掺入本发明的蛋白中的ICOS信号传导区域可以由SEQ ID NO:10中列出的氨基酸序列组成。ICOS的截短或修饰的形式可以至少包括在全长ICOS蛋白的残基180-183处存在的YMFM基序。
合适的CD3ζ信号传导区域是能够活化T细胞内的功能性应答(例如细胞因子释放(例如干扰素γ、TNFα和/或IL2)、细胞毒性和/或增殖)的CD3ζ信号传导区域。
合适地,CD3ζ信号传导区域可以包含CD3ζ的全长序列。可选地,CD3ζ信号传导区域可以包括全长序列的截短和/或修饰的形式。仅通过实例的方式,合适的CD3ζ信号传导区域可以包括SEQ ID NO:11或SEQ ID NO:40中列出的氨基酸序列或这些序列的一部分。合适地,用于掺入本发明的蛋白中的CD3ζ信号传导区域可以由SEQ ID NO:11或SEQ ID NO:40中列出的氨基酸序列组成。
本发明的靶向GD2的蛋白
本发明的靶向GD2的蛋白可以包含GD2靶向部分以及合适的细胞内信号传导区域(诸如4-1BB细胞内信号传导区域和CD3ζ细胞内信号传导区域)。该蛋白还可以包含ASS-1结构域;和/或OTC结构域;和/或ASL结构域;和/或OCD1结构域;和/或ArgG结构域;和/或ArgH结构域;和/或ArgF结构域。合适地,该蛋白可以包含ASS-1结构域和/或OTC结构域。
本发明人发现,本发明的包含GD2靶向部分以及ASS-1结构域和/或OTC结构域的蛋白在表现出其治疗效用的许多特性方面特别有用。
例如,本发明人发现,与现有技术中已知的GD2 CAR-T细胞相比,表达本发明的包含GD2靶向部分以及ASS-1结构域和/或OTC结构域的蛋白的细胞表现出相当的或改进的生活力。
有利地,本发明人发现,与可比较的对照CAR-T细胞相比,表达本发明的包含GD2靶向部分以及ASS-1结构域和/或OTC结构域的蛋白的细胞能够表现出增加的持续性。与对照细胞相比,表达本发明的包含GD2靶向部分以及ASS-1结构域的蛋白的细胞表现出特别有利的增加的持续性。
本发明人还发现,在代表肿瘤微环境的条件(诸如通过实验耗尽精氨酸的条件(experimentally arginine-depleted conditions))下,与对照CAR-T细胞相比,表达本发明的包含GD2靶向部分以及ASS-1结构域和/或OTC结构域的蛋白的细胞能够表现出增加的增殖。
特别地,在代表肿瘤微环境的条件下,诸如精氨酸耗尽的条件下,表达本发明的包含GD2靶向部分以及OTC结构域的蛋白的细胞与对照细胞相比能够表现出增加的增殖。令人惊讶地,在代表肿瘤微环境的条件下,诸如精氨酸耗尽的条件下,表达本发明的包含GD2靶向部分以及ASS-1结构域和OTC结构域的蛋白的细胞与对照细胞相比能够表现出甚至更大的增殖增加。
如在实施例中示出的,在肿瘤微环境的条件下,诸如精氨酸耗尽的条件下,表达本发明的包含GD2靶向部分以及OTC结构域的蛋白的细胞与对照细胞相比能够表现出5倍的增殖增加。
甚至更令人惊讶地,在肿瘤微环境的条件下,诸如精氨酸耗尽的条件下,表达本发明的包含GD2靶向部分以及ASS-1结构域和OTC结构域的蛋白的细胞与对照细胞相比能够表现出10倍的增殖增加。
本发明人发现,表达本发明的包含GD2靶向部分以及ASS-1结构域和/或OTC结构域的蛋白的细胞显示出对癌细胞的杀细胞活性。仅通过实例的方式,本发明人证明,表达本发明的包含GD2靶向部分以及ASS-1结构域或OTC结构域的蛋白的细胞能够表现出与现有技术中已知的GD2CAR-T细胞相当的特异性杀细胞活性。
有利地,表达本发明的包含GD2靶向部分以及ASS-1结构域或OTC结构域的蛋白的细胞除了增加的持续性和增殖之外还能够表现出杀细胞活性,这提高了体内癌症模型中接受者的存活。
这些优点在本说明书的实施例部分中进一步讨论。
本发明的靶向GD2的示例性蛋白的氨基酸序列在SEQ ID NO:12至SEQ ID NO:14中列出。本发明应当被认为不仅包括这些特定的蛋白,而且还包括这些蛋白的变体,所述变体共有这些示例性蛋白的生物活性(特别是杀细胞活性和响应于蛋白结合促进增殖的能力)。这样的变体可以与SEQ ID NO:12至SEQ ID NO:14的任何蛋白共有至少80%的序列同一性。合适地,这样的变体可以与SEQ ID NO:12至SEQ ID NO:14的任何蛋白共有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性。
本发明的靶向间皮素的蛋白
本发明的靶向间皮素的蛋白可以包含源自抗间皮素SS1抗体的间皮素靶向部分以及合适的细胞内信号传导区域(诸如4-1BB细胞内信号传导区域和CD3ζ细胞内信号传导区域)。该蛋白还可以包含ASS-1结构域;和/或OTC结构域;和/或ASL结构域;和/或OCD1结构域;和/或ArgG结构域;和/或ArgH结构域;和/或ArgF结构域。合适地,该蛋白可以包含ASS-1结构域和/或OTC结构域。
本发明人发现,本发明的包含间皮素靶向部分以及ASS-1结构域和/或OTC结构域的蛋白在表现出其治疗效用的许多特性方面特别有用。
例如,本发明人发现,与现有技术中已知的间皮素CAR-T细胞相比,表达本发明的包含间皮素靶向部分以及ASS-1结构域和/或OTC结构域的蛋白的细胞表现出相当的或改进的生活力。
有利地,本发明人发现,在代表肿瘤微环境的条件(诸如通过实验耗尽精氨酸的条件)下,与对照CAR-T细胞相比,表达本发明的包含间皮素靶向部分以及ASS-1结构域和/或OTC结构域的蛋白的细胞能够表现出增加的增殖。
在代表肿瘤微环境的条件下,诸如精氨酸耗尽的条件下,表达本发明的包含间皮素靶向部分以及OTC结构域的蛋白的细胞表现出特定增加的增殖。如在实施例中说明的,本发明的包含OTC结构域本身或OTC结构域与ASS-1结构域的蛋白表现出这种特定增加的增殖。可以观察到,在复制肿瘤微环境中存在的条件的条件下,表达本发明的包含间皮素靶向部分以及OTC结构域的蛋白的细胞与对照细胞相比表现出约4倍的增殖增加。
在实施例中还示出了,在肿瘤微环境的条件下,诸如精氨酸耗尽的条件下,表达本发明的包含间皮素靶向部分以及ASS-1结构域和OTC结构域的蛋白的细胞与对照细胞相比能够表现出多于3倍的增殖增加。
这些优点在本说明书的实施例部分中进一步讨论。
本发明的靶向间皮素的示例性蛋白的氨基酸序列在SEQ ID NO:15至SEQ ID NO:17中列出。本发明应当被认为不仅包括这些特定的蛋白,而且还包括这些蛋白的变体,所述变体共有这些示例性蛋白的生物活性(特别是杀细胞活性和响应于蛋白结合促进增殖的能力)。这样的变体可以与SEQ ID NO:15至SEQ ID NO:17的任何蛋白共有至少80%的序列同一性。合适地,这样的变体可以与SEQ ID NO:15至SEQ ID NO:17的任何蛋白共有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性。
本发明的靶向CD33的蛋白
本发明的靶向CD33的蛋白可以包含源自抗CD33 my96抗体的CD33靶向部分以及合适的细胞内信号传导区域(诸如4-1BB细胞内信号传导区域和CD3ζ细胞内信号传导区域)。该蛋白还可以包含ASS-1结构域;和/或OTC结构域ASS-1结构域;和/或OTC结构域;和/或ASL结构域;和/或OCD1结构域;和/或ArgG结构域;和/或ArgH结构域;和/或ArgF结构域。合适地,该蛋白可以包含ASS-1结构域和/或OTC结构域。
本发明的包含CD33靶向部分以及ASS-1结构域和/或OTC结构域的蛋白在表现出其治疗效用的许多特性方面特别有用。
例如,本发明人发现,与现有技术中已知的CD33 CAR-T细胞相比,表达本发明的包含CD33靶向部分以及ASS-1结构域和/或OTC结构域的蛋白的细胞表现出相当的或改进的存活力。
有利地,本发明人发现,与可比较的对照CAR-T细胞相比,表达本发明的包含CD33靶向部分以及ASS-1结构域和/或OTC结构域的蛋白的细胞能够表现出增加的持续性。与对照细胞相比,表达本发明的包含CD33靶向部分以及ASS-1结构域的蛋白的细胞表现出特别有利的增加的持续性。
本发明人还发现,在代表肿瘤微环境的条件(诸如通过实验耗尽精氨酸的条件)下,与对照CAR-T细胞相比,表达本发明的包含CD33靶向部分以及ASS-1结构域和/或OTC结构域的蛋白的细胞能够表现出增加的增殖。
在代表肿瘤微环境的条件下,诸如精氨酸耗尽的条件下,表达本发明的包含CD33靶向部分以及OTC结构域的蛋白的细胞表现出显著增加的增殖。本发明人还发现,在代表肿瘤微环境的条件下,表达本发明的包含CD33靶向部分以及ASS-1结构域和OTC结构域的蛋白的细胞与对照细胞相比表现出甚至更大的增殖增加。
如在实施例中示出的,在代表肿瘤微环境的条件下,表达本发明的包含CD33靶向部分以及OTC结构域的蛋白的细胞与对照细胞相比表现出多于5倍的增殖增加。甚至更有益地,在相同条件下,表达本发明的包含CD33靶向部分以及ASS-1结构域和OTC结构域两者的蛋白的细胞与对照细胞相比显示出约6倍的增殖增加。
本发明人发现,表达本发明的包含CD33靶向部分以及ASS-1结构域和/或OTC结构域的蛋白的细胞表现出的对癌细胞的杀细胞活性与现有技术中已知的CD33 CAR-T细胞的杀细胞活性相当。
有利地,表达本发明的包含CD33靶向部分以及ASS-1结构域和/或OTC结构域的蛋白的细胞除了增加持续性和增殖之外还能够表现出杀细胞活性,这提高了体内癌症模型中接受者的存活。
这些优点在本说明书的实施例部分中进一步讨论。
本发明的靶向CD33的示例性蛋白的氨基酸序列在SEQ ID NO:18至SEQ ID NO:20中列出。本发明应当被认为不仅包括这些特定的蛋白,而且还包括这些蛋白的变体,所述变体共有这些示例性蛋白的生物活性(特别是杀细胞活性和响应于蛋白结合促进增殖的能力)。这样的变体可以与SEQ ID NO:18至SEQ ID NO:20的任何蛋白共有至少80%的序列同一性。合适地,这样的变体可以与SEQ ID NO:18至SEQ ID NO:20的任何蛋白共有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性。
本发明的靶向EGFRvIII的蛋白
本发明的靶向EGFRvIII的蛋白可以包含源自抗EGFRvIII 139抗体的EGFRvIII靶向部分以及合适的细胞内信号传导区域(诸如4-1BB细胞内信号传导区域和CD3ζ细胞内信号传导区域)。该蛋白还可以包含ASS-1结构域和/或OTC结构域;和/或ASL结构域;和/或OCD1结构域;和/或ArgG结构域;和/或ArgH结构域;和/或ArgF结构域。特别地,该蛋白可以包含ASS-1结构域和/或OTC结构域。
本发明人的结果证明,与现有技术中已知的EGFRvIII CAR-T细胞相比,表达本发明的包含EGFRvIII靶向部分以及ASS-1结构域和/或OTC结构域的蛋白的细胞表现出相当的或改进的存活力。
本发明人发现,在代表肿瘤微环境的条件(诸如通过实验耗尽精氨酸的条件)下,与对照CAR-T细胞相比,表达本发明的包含EGFRvIII靶向部分以及ASS-1结构域的蛋白的细胞表现出增加的增殖。在这样的条件下,表达本发明的包含EGFRvIII靶向部分以及ASS-1结构域的蛋白的这样的细胞与对照细胞相比表现出多于2倍的增殖增加。
这些优点在本说明书的实施例部分中进一步讨论。
本发明的靶向EGFRvIII的示例性蛋白的氨基酸序列在SEQ ID NO:21至SEQ IDNO:23中列出。本发明应当被认为不仅包括这些特定的蛋白,而且还包括这些蛋白的变体,所述变体共有这些示例性蛋白的生物活性(特别是杀细胞活性和响应于蛋白结合促进增殖的能力)。这样的变体可以与SEQ ID NO:21至SEQ ID NO:23的任何蛋白共有至少80%的序列同一性。合适地,这样的变体可以与SEQ ID NO:21至SEQ ID NO:23的任何蛋白共有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性。
编码本发明的蛋白的核酸
本发明的第三方面提供了编码本发明的蛋白的核酸。蛋白可以根据本文描述的本发明的任一方面或实施方案。
合适地,根据本发明的核酸包括DNA。在合适的实施方案中,本发明的核酸包括RNA。应当理解,合适的核酸可以基本上由DNA组成,可以基本上由RNA组成,或者可以包括DNA和RNA的组合。
编码本发明的蛋白的核酸的实例在SEQ ID NO:37至SEQ ID NO:39中列出。这些核酸序列是编码示例性蛋白的DNA分子,在说明书中如下列出:
Figure BDA0002643121210000331
应当理解,密码子简并性意味着编码本发明的单个特定蛋白的本发明的核酸的序列中可以存在明显的差异。
仅通过实例的方式,本发明的合适核酸可以与SEQ ID NO:37至SEQ ID NO:39中列出的本发明的示例性核酸之一共有至少70%的序列同一性。本发明的合适核酸可以与SEQID NO:37至SEQ ID NO:39中列出的本发明的示例性核酸之一共有至少75%的序列同一性;至少80%的序列同一性;至少85%的序列同一性;至少90%的序列同一性;至少95%的序列同一性;至少96%的序列同一性;至少97%的序列同一性;至少98%的序列同一性或甚至99%或更多的序列同一性。
编码本发明的靶向间皮素的蛋白的核酸序列,除了编码靶结合部分的那些核酸序列的部分被SEQ ID NO:28的核酸序列替换之外,可以与SEQ ID NO:37、SEQ ID NO:38或SEQID NO:39中任一种的核酸序列相同。
编码本发明的靶向CD33的蛋白的核酸序列,除了编码靶结合部分的那些核酸序列的部分被SEQ ID NO:27的核酸序列替换之外,可以与SEQ ID NO:37、SEQ ID NO:38或SEQID NO:39中任一种的核酸序列相同。
编码本发明的靶向EGFRvIII的蛋白的核酸序列,除了编码靶结合部分的那些核酸序列的部分被SEQ ID NO:29的核酸序列替换之外,可以与SEQ ID NO:37、SEQ ID NO:38或SEQ ID NO:39中任一种的核酸序列相同。
编码本发明的蛋白的核酸可以以载体的形式提供。合适地,载体可以是病毒载体,诸如逆转录病毒载体或慢病毒载体或转座子。逆转录病毒方法和慢病毒方法两者都成功地用于产生本发明的细胞。
在图14中列出了成功地用于慢病毒产生本发明的细胞的构建体的细节。这些构建体提供了本发明的核酸的另外的实例。
本发明的细胞
本发明的第二方面提供了包含根据本发明的第一方面的蛋白的细胞。该细胞可以表达该蛋白。该蛋白可以根据本文描述的本发明的第一方面的任何实施方案。
合适地,根据本发明的第二方面的细胞可以是能够发挥细胞介导的免疫应答的细胞。合适的细胞可以能够例如通过细胞毒性作用或通过诱导特异性细胞裂解而发挥杀细胞活性。另外,合适的细胞可以能够响应于蛋白与其对应靶分子的结合而增殖。合适地,根据本发明的第二方面的细胞可以选自由以下组成的组:T细胞和自然杀伤(NK)细胞。
合适地,T细胞可以选自由以下组成的组:恒定自然杀伤T细胞(invariantnatural killer T cell,iNKT)、自然杀伤T细胞(NKT);γδT细胞(gd T细胞);αβT细胞(abT细胞);效应T细胞和记忆T细胞。
合适地,T细胞可以选自由以下组成的组:CD4+淋巴细胞和CD8+淋巴细胞。
细胞可以来自需要预防和/或治疗疾病的受试者。细胞可以取自来自这样的受试者的样品。
可选地,所述细胞可以来自健康供体受试者(为了本公开内容的目的,认为是未罹患待用本发明的蛋白或细胞治疗的疾病的受试者)。
应当理解,合适的细胞也可以包括细胞系的细胞。
用于收集人类细胞和用蛋白诸如本发明的蛋白转化它们的标准技术是本领域技术人员熟知的。在实施例中进一步描述了用于人类T细胞的逆转录病毒转导、转导效率的确定以及通过磁性活化的细胞分选来分选转导的T细胞的优选技术。
本发明的细胞的生物活性
包含本发明的蛋白的本发明的细胞表现出许多有益于应用诸如预防和/或治疗疾病的活性。
这些生物活性还可以对于杀细胞活性(杀细胞活性代表本发明的细胞能够发挥其治疗作用的手段)和活性诸如增殖(例如响应于活化)和体内持续性来考虑,这使得本发明的细胞能够发挥其治疗作用的时间比现有技术的表达CAR的细胞发挥其治疗作用的时间更长。
这些各自的生物活性在以下进一步描述。应当理解,本发明的蛋白和细胞提供的优点主要是这些生物活性的组合的结果。
本发明的细胞的生物活性可以参考合适的比较细胞来确定。合适的比较细胞的实例包括未用蛋白转导的与本发明的细胞相同类型的细胞,或用不包含促进精氨酸或精氨酸前体的合成的结构域的蛋白转导的与本发明的细胞相同类型的细胞。
本发明的细胞的杀细胞活性
为了本发明的目的,杀细胞活性应当被认为包括本发明的细胞(例如表达本发明的蛋白的细胞)藉以杀伤其他细胞的任何活性。例如,杀伤其他细胞可以通过本发明的细胞的细胞毒性作用的手段或通过本发明的细胞介导的特异性细胞裂解来实现。
本发明的细胞对于包含本发明的蛋白的靶结合部分结合的靶分子的靶结构发挥其杀细胞活性。
优选地,被本发明的细胞的杀细胞活性杀伤的细胞是与疾病相关的细胞。合适地,与疾病相关的细胞可以是癌细胞或感染的细胞。
如在实施例中阐述的,本发明人证明,本发明的细胞(包含本发明的蛋白)表现出特异性地针对表达被本发明的蛋白的靶结合部分结合的靶分子的细胞的杀细胞活性。对于本发明的细胞观察到的杀细胞活性的程度与现有技术中描述的蛋白表达细胞的程度大致一致。然而,本发明的细胞所表现出的这种维持的杀细胞活性与改进的增殖和/或持续性的组合赋予了对于现有技术的细胞所没有注意到的益处。
技术人员将意识到许多合适的测定,通过这些测定可以评估本发明的细胞或合适的比较细胞的杀细胞活性,无论是细胞毒性活性还是特异性细胞裂解。仅通过实例的方式,在实施例中描述了合适的测定,其中它们用于表征本发明的示例性细胞。
技术人员在考虑实施例中阐述的信息后,将认识到本发明的细胞表现出杀细胞活性,这使得它们非常适于以本说明书中描述的方式用于预防和/或治疗疾病的治疗用途。
本发明的细胞的持续性
发挥治疗作用的细胞在体内并且特别是在受试者体内的持续性对于有效预防和/或治疗疾病是重要的。如先前提及的,肿瘤诸如神经母细胞瘤附近的微环境对治疗细胞诸如CAR T细胞特别有害。认为这种微环境的影响以及治疗细胞不能在其中持续存在是对于许多现有技术治疗观察到的失败的重要原因。
包含本发明的蛋白的本发明的细胞在肿瘤微环境中显示出增加的持续性。在实施例中证明的这种增加的体内持续性代表了一种机制,通过该机制,本发明的细胞的治疗作用可以延长,并且因此它们与现有技术的细胞相比治疗效用增加。
本发明的细胞或合适的比较细胞的持续性可以以许多不同的方式来实验评估。仅通过实例的方式,细胞持续性可以参考最初施用的细胞在特定时间段后在接受者中保持存活的百分比来定义。应当理解,在两个或更多个细胞群体(诸如本发明的细胞群体与合适的比较细胞群体)之间的有用的比较可以在任何特定的时间段之后进行,条件为所经过的时间对于每个细胞群体大致相同。也就是说,本发明人发现,在施用细胞后17天进行的比较非常适于这样的计算,例如在移植有5x106个本发明的细胞的NOG-SCID小鼠的情况下,如在实施例中示出的。应当理解,可以对感兴趣的特定实验模型利用其他时间点,并且测量细胞的持续性的其他方法将是本领域技术人员已知的。
本发明的细胞在设置的时间段后持续存在的比例可以比合适的比较细胞的比例高至少5%。事实上,本发明的细胞持续存在的比例可以比合适的比较细胞的比例高至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%。本发明的细胞在设置的时间段后持续存在的比例可以比合适的比较细胞的比例高至少100%或更高。
本发明的细胞在设置的时间段后持续存在的比例可以是最初施用的本发明的细胞总数的高达10%、高达15%、高达20%、高达25%、高达30%、高达35%、高达40%、高达45%、高达50%、高达55%、高达60%、高达65%、高达70%、高达75%、高达80%、高达85%、高达90%、高达95%或甚至高达100%。
本发明的细胞可以在接受者中持续存在的时间段比合适的比较细胞更长。本发明的细胞可以在接受者中持续存在的时间比合适的比较细胞长高达5%。本发明的细胞可以在接受者中持续存在的时间比合适的比较细胞长高达10%、高达15%、高达20%、高达25%、高达30%、高达35%、高达40%、高达45%、高达50%、高达55%、高达60%、高达65%、高达70%、高达75%、高达80%、高达85%、高达90%、高达95%或甚至高达100%。
可以评估细胞诸如本发明的细胞的持续性的另一种方法是参考细胞在接受者中保持存活的时间长度。合适地,包含本发明的蛋白的本发明的细胞可以在接受者中保持存活至少5天、至少10天、至少15天、至少20天、至少25天、至少30天、至少35天、至少40天、至少45天、至少50天、至少55天、至少60天、至少65天、至少70天、至少75天、至少80天、至少85天、至少90天、至少95天或至少100天或更长。合适地,包含本发明的蛋白的本发明的细胞可以在接受者中保持存活至少150天、至少200天、至少250天、至少300天、或至少350天或更长。合适地,包含本发明的蛋白的本发明的细胞可以在接受者中保持存活至少6个月、至少9个月、至少12个月、至少15个月、至少18个月、至少21个月、至少24个月或更长。合适地,包含本发明的蛋白的本发明的细胞可以在接受者中保持存活至少1年、至少2年、至少3年、至少4年、至少5年、至少6年、至少7年、至少8年、至少9年或至少10年或更长。合适地,包含本发明的蛋白的本发明的细胞可以在接受者中保持存活至少10年、至少15年、至少20年、至少25年、至少30年、至少35年、至少40年、至少45年、至少50年或更长。
本发明的细胞的增殖
经由蛋白与对应靶分子结合,本发明的细胞活化,诱导细胞增殖。这允许产生增加的数目的能够发挥治疗活性的细胞。然而,在肿瘤微环境中这样的细胞增殖通常受到抑制,而这导致了现有技术中公开的CAR T细胞治疗的失败。
在精氨酸耗尽的肿瘤微环境中,本发明的细胞表现出的增殖能力与对于现有技术的CAR T细胞中观察到的增殖能力相比显著提高。由于细胞增殖导致本发明的细胞群体扩增,然后能够在肿瘤微环境中发挥其治疗性杀细胞活性,这是高度有利的。
细胞诸如本发明的细胞的增殖可以以许多方式来实验评估。仅通过实例的方式,细胞增殖可以在复制肿瘤微环境的条件下评估。这样的条件可以包括使用精氨酸已经耗尽(例如通过用肿瘤细胞调节)的培养基。在这样的条件下,本发明的细胞可以表现出的增殖率比合适的比较细胞的增殖率高至少5%、比合适的比较细胞的增殖率高至少10%、比合适的比较细胞的增殖率高至少15%、比合适的比较细胞的增殖率高至少20%、比合适的比较细胞的增殖率高至少25%、比合适的比较细胞的增殖率高至少30%、比合适的比较细胞的增殖率高至少35%、比合适的比较细胞的增殖率高至少40%、比合适的比较细胞的增殖率高至少45%、比合适的比较细胞的增殖率高至少50%、比合适的比较细胞的增殖率高至少55%、比合适的比较细胞的增殖率高至少60%、比合适的比较细胞的增殖率高至少65%、比合适的比较细胞的增殖率高至少70%、比合适的比较细胞的增殖率高至少75%、比合适的比较细胞的增殖率高至少80%、比合适的比较细胞的增殖率高至少85%、比合适的比较细胞的增殖率高至少90%或比合适的比较细胞的增殖率高至少95%。事实上,在相同的实验条件下,本发明的细胞可以表现出的增殖率比合适的比较细胞的增殖率高至少100%或更多。
可选地,细胞的增殖可以根据在施用后设置的时间段后与在相同条件下存在的比较细胞的数目相比接受者中存在的细胞数目来评估。如果本发明的细胞和比较细胞两者以大致相等的量施用,则在特定时间后,接受者中存在的本发明的细胞的数目可以比合适的比较细胞的数目高至少5%、比合适的比较细胞的数目高至少10%、比合适的比较细胞的数目高至少15%、比合适的比较细胞的数目高至少20%、比合适的比较细胞的数目高至少25%、比合适的比较细胞的数目高至少30%、比合适的比较细胞的数目高至少35%、比合适的比较细胞的数目高至少40%、比合适的比较细胞的数目高至少45%、比合适的比较细胞的数目高至少50%、比合适的比较细胞的数目高至少55%、比合适的比较细胞的数目高至少60%、比合适的比较细胞的数目高至少65%、比合适的比较细胞的数目高至少70%、比合适的比较细胞的数目高至少75%、比合适的比较细胞的数目高至少80%、比合适的比较细胞的数目高至少85%、比合适的比较细胞的数目高至少90%或比合适的比较细胞的数目高至少95%。
医学用途和治疗方法
本发明的蛋白,特别是以本发明的第二方面的表达这样的蛋白的细胞的形式,非常适于医学用途,也就是说用作预防和/或治疗疾病的药物。这样的医学用途是本发明的第五、第六和第七方面的主题。
当受试者尚未发展疾病,但已经被鉴定为处于将要发展疾病的风险时,可能需要预防疾病。合适地,这样的鉴定可以基于细节,诸如受试者或其家庭的临床病史、受试者或其家庭的遗传测试结果或暴露于已知致病原的风险。在癌症的情况下,在受试者表现出癌前疾病的症状或特征的情况下,可能期望预防。
在将受试者鉴定为已经发展疾病后,可能需要治疗疾病。在鉴定时疾病的发展阶段可能是有症状的或无症状的。这样的鉴定可以基于受试者的临床评估、受试者呈现的症状或受试者提供的样品的分析(诸如活组织检查、血液样品等,允许鉴定恶性肿瘤、感染原或其他病理学指标的存在)。
本发明的第八方面涉及预防和/或治疗需要这样的预防和/或治疗的受试者的疾病的方法,该方法包括向受试者提供本发明的蛋白。本发明的蛋白以治疗有效量提供。这样的治疗有效量可以通过提供本发明的蛋白的单次事件实现,或通过提供本发明的蛋白的多次事件累积实现。
本发明的蛋白可以合适地直接或间接提供至受试者。直接提供是指向受试者施用蛋白,特别是以表达蛋白的细胞的形式。间接提供是指诱导受试者表达本发明的蛋白。应当理解,本发明的蛋白可以经由施用本发明的第三方面的核酸间接提供至受试者,所述核酸编码根据本发明的第一方面的蛋白。
应当理解,表达蛋白的细胞可以用于预防或治疗广泛范围的疾病,包括癌症、自身免疫性疾病和由感染诸如病毒感染引起的疾病。合适地,这样的疾病可以通过利用本发明的蛋白、细胞、核酸或药物组合物的治疗方法的医学用途来预防和/或治疗。
预防和/或治疗癌症
特别地,本发明的蛋白、细胞、核酸或药物组合物可以用于预防和/或治疗癌症。在这些应用中,本发明的细胞在精氨酸耗尽的肿瘤微环境中发挥功能、持续存在和增殖的能力是特别有利的。
可以通过利用本发明的蛋白、细胞、核酸或药物组合物的治疗方法的医学用途来预防和/或治疗的癌症的合适实例包括选自由以下组成的组的癌症:神经母细胞瘤;间皮瘤;卵巢癌;乳腺癌;结肠癌;髓母细胞瘤;胰腺癌;前列腺癌;睾丸癌;急性髓性白血病;胶质母细胞瘤;骨肉瘤和黑素瘤。
药物组合物和制剂
本发明还提供了包含本发明的蛋白、细胞或核酸的组合物。特别地,本发明提供了用于以特定剂量或其部分施用的药物组合物和制剂,诸如包括本发明的蛋白、细胞或核酸的单位剂型组合物。药物组合物和制剂通常包含一种或更多种任选的药学上可接受的载体或赋形剂。在一些实施方案中,组合物包含至少一种另外的治疗剂。
术语“药物制剂”是指呈允许其中包含的活性成分的生物活性有效的这样的形式,并且不包含对将被施用该制剂的受试者具有不可接受的毒性的另外的组分的制品。
“药学上可接受的载体”是指药物制剂中除活性成分之外的对受试者无毒性的成分。药学上可接受的载体包括但不限于缓冲剂、赋形剂、稳定剂或防腐剂。
在一些实施方案中,载体的选择部分地由本发明的特定的蛋白、细胞或核酸和/或由施用方法确定。相应地,存在多种合适的制剂。例如,药物组合物可以包含防腐剂。合适的防腐剂可以包括,例如对羟基苯甲酸甲酯、对羟基苯甲酸丙酯、苯甲酸钠和苯扎氯铵。在一些方面中,使用两种或更多种防腐剂的混合物。防腐剂或其混合物通常以按总组合物的重量计约0.0001%至约2%的量存在。载体例如由Remington's Pharmaceutical Sciences第16版,Osol,A.Ed.(1980)描述的。药学上可接受的载体通常在所采用的剂量和浓度对接受者是无毒的,并且包括但不限于:缓冲剂,诸如磷酸盐、柠檬酸盐和其他有机酸;抗氧化剂,包括抗坏血酸和甲硫氨酸;防腐剂(诸如十八烷基二甲基苄基氯化铵;氯化六甲双铵;苯扎氯铵;苄索氯铵;苯酚、丁醇或苄醇;对羟基苯甲酸烷基酯,诸如对羟基苯甲酸甲酯或对羟基苯甲酸丙酯;儿茶酚;间苯二酚;环己醇;3-戊醇;和间甲酚);低分子量(少于约10个残基)多肽;蛋白,诸如血清白蛋白、明胶或免疫球蛋白;亲水性聚合物,诸如聚乙烯基吡咯烷酮;氨基酸,诸如甘氨酸、谷氨酰胺、天冬酰胺、组氨酸、精氨酸或赖氨酸;单糖、二糖和其他碳水化合物,包括葡萄糖、甘露糖或糊精;螯合剂,诸如EDTA;糖,诸如蔗糖、甘露糖醇、海藻糖或山梨糖醇;盐形成抗衡离子,诸如钠;金属络合物(例如Zn-蛋白络合物);和/或非离子表面活性剂,诸如聚乙二醇(PEG)。
在本发明的组合物的一些实施方案中包括缓冲剂。合适的缓冲剂包括,例如,柠檬酸、柠檬酸钠、磷酸、磷酸钾和多种其他酸和盐。在一些方面中,使用两种或更多种缓冲剂的混合物。缓冲剂或其混合物通常以按总组合物的重量计约0.001%至约4%的量存在。用于制备可施用的药物组合物的方法是已知的。示例性方法在例如Remington:The Scienceand Practice of Pharmacy,Lippincott Williams&Wilkins;第21版(2005年5月1日)中有更详细的描述。
制剂可以包括水性溶液。制剂或组合物还可以包含多于一种可用于用本发明的蛋白、细胞或核酸治疗的特定适应症、疾病或状况的活性成分,优选地是具有与本发明的蛋白、细胞或核酸互补的活性的活性成分,其中各自的活性不会不利地彼此影响。这样的活性成分合适地以对预期目的有效的量组合地存在。因此,在一些实施方案中,药物组合物还包含其他药物活性剂或药物,诸如化学治疗剂,例如,天冬酰胺酶、白消安、卡铂、顺铂、柔红霉素、多柔比星、氟尿嘧啶、吉西他滨、羟基脲、氨甲蝶呤、紫杉醇、利妥昔单抗、长春花碱和/或长春花新碱。
在一些实施方案中,药物组合物包含有效治疗或预防疾病或状况的量诸如治疗有效量或预防有效量的本发明的CAR、细胞或核酸。在一些实施方案中,治疗功效或预防功效通过对被治疗的受试者的定期评估来监测。期望的剂量可以通过本发明的蛋白、细胞或核酸的单次团注施用,通过蛋白、细胞或核酸的多次团注施用或通过蛋白、细胞或核酸的连续输注施用来递送。
组合物可以使用标准施用技术、制剂和/或装置来施用。细胞的施用可以是自体的或异源的。例如,免疫应答细胞或祖细胞可以从一个受试者获得,并且被施用至同一受试者或不同的相容的受试者。外周血来源的免疫应答细胞或其后代(例如,体内、离体或体外来源的)可以经由局部注射来施用,包括导管施用、全身注射、局部注射、静脉内注射或肠胃外施用。当施用治疗性组合物(例如,含有遗传修饰的免疫应答细胞的药物组合物)时,通常将其配制成单位剂量的可注射形式(溶液、悬浮液、乳液)。
制剂包括用于口服、静脉内、腹膜内、皮下、肺部、经皮、肌肉内、鼻内、含服、舌下或栓剂施用的制剂。在一些实施方案中,细胞群体经肠胃外施用。如本文使用的,术语“肠胃外”包括静脉内、肌肉内、皮下、直肠、阴道和腹膜内施用。在一些实施方案中,使用通过静脉内、腹膜内或皮下注射的外周系统递送将细胞施用至受试者。
在一些实施方案中,组合物被提供为在一些方面中可以被缓冲至选择的pH的无菌液体制剂,例如,等渗水性溶液、悬浮液、乳液、分散体或粘性组合物。液体制剂通常比凝胶、其他粘性组合物和固体组合物更容易制备。另外,液体组合物在某种程度上更便于施用,尤其是通过注射施用。在另一方面,粘性组合物可以在适当的粘度范围内配制以提供与特定组织的更长的接触时间段。液体组合物或粘性组合物可以包含载体,载体可以是溶剂或分散介质,包括例如水、盐水、磷酸盐缓冲盐水、多元醇(例如,甘油、丙二醇、液体聚乙二醇)及其合适的混合物。
无菌可注射溶液可以通过将本发明的蛋白、细胞或核酸掺入溶剂中,诸如与合适的载体、稀释剂或赋形剂诸如无菌水、生理盐水、葡萄糖、右旋糖等混合来制备。取决于期望的施用途径和制品,组合物可以包含辅助物质,诸如润湿剂、分散剂或乳化剂(例如,甲基纤维素)、pH缓冲剂、胶凝添加剂或粘度增强添加剂、防腐剂、调味剂和/或着色剂。在一些方面中,可以参考标准教科书来制备合适的制品。
可以添加多种增强组合物的稳定性和无菌性的添加剂,包括抗微生物防腐剂、抗氧化剂、螯合剂和缓冲剂。防止微生物的作用可以通过多种抗细菌剂和抗真菌剂,例如,对羟基苯甲酸酯、氯丁醇、苯酚和山梨酸来确保。可注射药物形式的延长吸收可以通过使用延迟吸收的剂例如单硬脂酸铝和明胶来实现。
待被用于体内施用的制剂通常是无菌的。无菌性可以通过例如过滤通过无菌滤膜来容易地实现。
剂量和剂量方案
剂量的大小或量
本发明的蛋白、细胞或核酸可以在第一剂量中提供,并且任选地在后续剂量中提供。在一些实施方案中,第一剂量或后续剂量包含一定数目的本发明的蛋白、细胞或核酸,范围为每千克受试者体重从约105个至约106个这样的细胞,和/或每千克受试者体重不多于约105个或约106个这样的细胞的数目。例如,在一些实施方案中,第一剂量或后续剂量包含每千克受试者体重小于或不多于1x 105个或约1x 105个、2x 105个或约2x 105个、5x 105个或约5x 105个或者1x 106个或约1x 106个这样的细胞。在一些实施方案中,第一剂量包含每千克受试者体重1x 105个或约1x 105个、2x 105个或约2x 105个、5x 105个或约5x 105个或者1x 106个或约1x 106个这样的细胞,或者在前述任何两个值之间的范围内的值。
在一些实施方案中,例如,当受试者是人类时,第一剂量或后续剂量包含总计少于约1x 10个本发明的蛋白、细胞或核酸,例如,范围为约1x 106至1x 108个这样的细胞,诸如总计2x 106个、5x 106个、1x 107个、5x 107个或1x 108个这样的细胞或前述任何两个值之间的范围。
在一些实施方案中,第一剂量或后续剂量包含每m2受试者总计少于约1x 108个本发明的蛋白、细胞或核酸,例如,范围为每m2受试者约1x 106个至1x 108个这样的细胞,诸如每m2受试者2x 106个、5x 106个、1x 107个、5x 107个或1x 108个这样的细胞或前述任何两个值之间的范围。
在某些实施方案中,在第一剂量或后续剂量中,本发明的蛋白、细胞或核酸的数目为每千克受试者体重大于约1x 106个这样的本发明的蛋白、细胞或核酸,例如,每千克体重2x 106个、3x 106个、5x 106个、1x 107个、5x 107个、1x 108个、1x 109个或1x 1010个这样的细胞和/或每m2受试者或总计1x 108个或1x 109个、1x 1010个这样的细胞或前述任何两个值之间的范围。
在一些实施方案中,在后续剂量中施用的本发明的蛋白、细胞或核酸的数目与本文任一实施方案中在第一剂量中施用的本发明的蛋白、细胞或核酸的数目相同或相似,诸如每千克受试者体重小于或不多于1x 105个或约1x 105个、2x 105个或约2x 105个、5x 105个或约5x 105个或者1x 106个或约1x 106个这样的细胞。在一些实施方案中,后续剂量包含每千克受试者体重1x 105个或约1x 105个、2x 105个或约2x 105个、5x 105个或约5x 105个或者1x 106个或约1x 106个这样的细胞,或者在前述任何两个值之间的范围内的值。在一些实施方案中,这些值是指本发明的蛋白、细胞或核酸的数目。在一些方面中,后续剂量大于第一剂量。例如,在一些实施方案中,后续剂量包含每千克受试者体重多于约1x 106个本发明的蛋白、细胞或核酸,诸如每千克受试者体重约3x 106个、5x 106个、1x 107个、1x 108个或1x 109个这样的细胞。在一些实施方案中,后续剂量的量或大小足以减少疾病负担或其指标和/或疾病或状况的一种或更多种症状。在一些实施方案中,第二(或其他后续)剂量的大小有效提高受试者的存活期,例如,诱导受试者存活、无复发存活或无事件存活至少6个月或至少1年、2年、3年、4年或5年。在一些实施方案中,在后续剂量中施用的本发明的蛋白、细胞或核酸的数目和/或按受试者体重的施用的这样的细胞的数目比在第一剂量中施用的数目多至少2倍、5倍、10倍、50倍或100倍或更多。在一些实施方案中,在后续剂量之后,疾病负担、肿瘤尺寸、肿瘤体积、肿瘤质量和/或肿瘤负荷或体积与临施用第一剂量或第二(或其他后续)剂量之前相比减少至少50%、60%、70%、80%、90%或更多或者约50%、60%、70%、80%、90%或更多。
在其他实施方案中,在后续剂量中施用的本发明的蛋白、细胞或核酸的数目低于在第一剂量中施用的本发明的蛋白、细胞或核酸的数目。
在一些实施方案中,在第一剂量后施用多个后续剂量,使得在施用第二(或其他后续)剂量后施用另外的一个或更多个剂量。在一些方面中,在另外的一个或更多个后续剂量(即,第三、第四、第五等)中向受试者施用的细胞数目与第一剂量、第二剂量和/或其他后续剂量相同或相似。在一些实施方案中,另外的一个或更多个剂量大于先前剂量。
在一些方面中,第一剂量和/或后续剂量的大小基于一个或更多个标准来确定,所述标准诸如受试者对先前治疗例如化学疗法的响应,受试者的疾病负担诸如肿瘤负荷、体积、尺寸或转移的程度、范围或类型,阶段,和/或受试者发展毒性结果例如CRS、巨噬细胞活化综合征、肿瘤溶解综合征、神经毒性的可能性或发病率,和/或宿主针对所施用的细胞和/或重组受体的免疫应答。
在一些方面中,第一剂量和/或后续剂量的大小通过受试者的疾病或状况的负担来确定。例如,在一些方面中,在第一剂量中施用的本发明的蛋白、细胞或核酸的数目基于在临施用第一剂量之前受试者中存在的肿瘤负担来确定。在一些实施方案中,第一剂量和/或后续剂量的大小与疾病负担负相关。在一些方面中,如在大的疾病负担的情况下,向受试者施用少量本发明的蛋白、细胞或核酸,例如每千克受试者体重少于约1x 106个本发明的蛋白、细胞或核酸。在其他实施方案中,如在低的疾病负担的情况下,向受试者施用大量本发明的蛋白、细胞或核酸,诸如每千克受试者体重多于约1x 106个本发明的蛋白、细胞或核酸。
在一些方面中,在后续剂量中施用的本发明的蛋白、细胞或核酸的数目基于在施用第一剂量后受试者中存在的肿瘤负担来确定。在一些实施方案中,例如,当第一剂量已经使疾病负担降低或已经使疾病负担降低至低于特定的阈值量或水平时,例如,高于该阈值量或水平则存在增加的毒性结果的风险,后续剂量较大,例如每千克体重多于1x 106个本发明的蛋白、细胞或核酸和/或大于第一剂量。在其他方面中,在后续剂量中施用的本发明的蛋白、细胞或核酸的数目低,例如少于约1x 106个,例如与第一剂量相同或低于第一剂量,其中第一剂量已经使肿瘤负担减少到小的程度或者其中第一剂量尚未导致肿瘤负担的可检测到的减少。
在一些实施方案中,在第一剂量中施用的本发明的蛋白、细胞或核酸的数目低于以其他方法施用的本发明的蛋白、细胞或核酸的数目,所述其他方法诸如其中施用大的单次剂量的细胞的方法,诸如在免疫应答发展之前施用本发明的蛋白、细胞或核酸。因此,在一些实施方案中,与涉及施用较大剂量的其他方法相比,本方法减少了毒性或毒性结果。
在一些实施方案中,第一剂量包含不引起毒性或毒性结果或减少毒性或毒性结果的可能性的量的本发明的蛋白、细胞或核酸,所述毒性或毒性结果诸如细胞因子释放综合征(CRS)、严重CRS(sCRS)、巨噬细胞活化综合征、肿瘤溶解综合征、至少处于或约38摄氏度三天或更多天的发热以及至少处于或约20mg/dL的血浆CRP水平和/或神经毒性。在一些方面中,在第一剂量中施用的细胞数目基于受试者在施用细胞后将表现出毒性或毒性结果诸如CRS、sCRS和/或CRS相关结果的可能性来确定。例如,在一些实施方案中,受试者发展毒性结果的可能性基于肿瘤负担来预测。在一些实施方案中,方法包括在施用剂量之前检测或评估毒性结果和/或疾病负担。
在一些实施方案中,第二(或其他后续)剂量在这样的时间点施用,在所述时间点,发展细胞因子释放综合征(CRS)、巨噬细胞活化综合征或肿瘤溶解综合征或神经毒性的临床风险在第一次施用后不存在或已经过去或已经消退,诸如在这样的事件通常在例如在60%、70%、80%、90%或95%的患有特定疾病或状况的受试者中已经消退和/或不太可能发生的临界窗口之后。
剂量的时间安排(Timing)
在一些方面中,第二剂量或后续剂量的时间安排从第一剂量的开始到后续剂量的开始测量。在其他实施方案中,后续剂量的时间安排从第一剂量完成时测量,或者从施用第一剂量的中值天数测量,例如在本文描述的分次给药的情况下,其中一个剂量施用经过多于一天,例如经过2天或经过3天。
在一些实施方案中,是否施用不同于第一剂量的本发明的蛋白、细胞或核酸的后续剂量的本发明的蛋白、细胞或核酸,基于受试者对第一剂量的本发明的蛋白、细胞或核酸的免疫应答或可检测到的免疫应答的存在或程度来确定。在一些方面中,包含表达不同于第一剂量的细胞的受体的细胞的后续剂量将被施用至具有可检测到的宿主适应性免疫应答或免疫应答已经变得建立或达到一定水平、阶段或程度的受试者。
在一些实施方案中,在第二次施用的本发明的蛋白、细胞或核酸可能或预计将被宿主免疫系统消除的时间点施用第二(或其他后续)剂量。如本文描述的,发展免疫应答的可能性可以通过在施用第一剂量后测量受试者中的受体特异性免疫应答来确定。
例如,在一些实施方案中,可以在第一(或其他先前)剂量之后和在第二(或其他后续)剂量之前测试受试者,以确定在第一剂量之后受试者中是否可检测到免疫应答。在一些这样的实施方案中,对第一剂量的免疫应答的检测可以触发对施用第二剂量的需要。
在一些方面中,可以测试来自受试者的样品,以确定在第一剂量或先前剂量之后,受试者中是否存在暴露下降或低于期望的暴露,例如,低于如本文描述的一定数目或浓度的细胞。在一些这样的方面中,检测到受试者对细胞的暴露下降可以触发对施用第二剂量的需要。
在一些实施方案中,在疾病负担响应于第一剂量或先前剂量减少之后受试者的疾病或状况尚未复发的时间点施用后续剂量。在一些实施方案中,疾病负担的减少通过一个或更多个因素的减少来指示,诸如受试者或其流体或器官或组织中疾病细胞的负荷或数目、肿瘤的质量或体积或转移的程度或范围。如果在因素响应于最初治疗或施用减少之后,因素随后增加,则认为该因素复发。
在一些实施方案中,在疾病复发的时间点施用第二剂量。在一些实施方案中,复发通常是在一个或更多个因素或疾病负担方面。在一些方面中,在这样的时间点施用后续剂量,在所述时间点,与第一次或先前施用之后测量或达到的最低点相比,受试者疾病负担或其因素已经复发,但与临第一剂量前的时间(the time immediately prior to the firstdose)相比仍然是较低的。在一些实施方案中,在疾病负担或指示其的因素尚未变化的时间点,例如在已经阻止疾病负担增加的时间点,向受试者施用后续剂量。
在一些实施方案中,在宿主适应性免疫应答被检测到、已经建立或已经达到一定水平、程度或阶段时施用后续剂量。在一些方面中,在受试者中发生记忆免疫应答后施用后续剂量。
在一些方面中,第一剂量的施用与后续剂量的施用之间的时间为约28天至约35天、约29天至约35天或多于约35天。在一些实施方案中,第二剂量的施用是在第一剂量施用后多于约28天的时间点。在一些方面中,第一剂量与后续剂量之间的时间为约28天。
在一些实施方案中,在施用第二剂量后施用另外的一个或更多个剂量,例如后续剂量。在一些方面中,在施用先前剂量后至少约28天,施用另外的一个或更多个剂量。在一些实施方案中,在先前剂量后少于约28天内不施用剂量。
在一些实施方案中,例如在向受试者施用一个或更多个连续剂量的情况下,连续剂量可以间隔约7天、约14天、约15天、约21天、约27天或约28天。在一些方面中,在先前剂量后21天施用连续剂量。在一些实施方案中,在施用先前剂量后14天和28天之间施用连续剂量。
在任何实施方案中,方法在一些情况下包括施用第一剂量或先前剂量和后续剂量,并且在其他情况下包括向先前已经接受第一剂量或先前剂量的受试者施用后续剂量但不包括第一剂量或先前剂量的施用本身。因此,在一些情况下,方法包括施用巩固治疗,诸如通过向先前已经接受本发明的蛋白、细胞或核酸的剂量的受试者施用巩固性后续剂量。
在一些实施方案中,在后续剂量之后,疾病负担、肿瘤尺寸、肿瘤体积、肿瘤质量和/或肿瘤负荷或体积与在临施用第一剂量或先前剂量或第二剂量或后续剂量之前相比减少至少50%、60%、70%、80%、90%或更多或者约50%、60%、70%、80%、90%或更多。
产生表达本发明的蛋白的细胞
技术人员将意识到核酸诸如本发明的核酸可以藉以用于产生表达蛋白的经转导的细胞的合适方法。这样的方法可以用于产生表达本发明的蛋白的本发明的细胞。
仅通过实例的方式,可以用于产生本发明的细胞的合适方案在以下实施例中进一步描述。
用于产生表达本发明的蛋白的细胞的方法的其他实例对本领域技术人员将是明显的。不受限制地,这些包括本发明的核酸藉以通过手段(诸如病毒或纳米颗粒)导入细胞的方法。
实施例
如以下进一步讨论的,参考示例性CAR研究本发明的蛋白。
1含CAR病毒滴度的优化。
本发明人示出了,在AMPHO Phoenix细胞的上清液中,逆转录病毒颗粒的浓度在72小时内增加,在图1a中示出。
通过流式细胞术检测tCD34来评估CAR-T细胞转导效率。在图1b中示出,使用在24小时或72小时收集的AMPHO细胞系上清液观察到PBMC的转导效率没有差异。
2精氨酸途径酶在转导的Jurkat细胞中显示出活性。
本发明人研究了精氨酸途径酶在永生化的人类T淋巴细胞(Jurkat细胞)中的作用。在图2中列出了该研究的结果。
用包含精氨酸途径酶的融合靶结合蛋白构建体或对照CAR-T构建体转导Jurkat细胞。为了实验目的,本发明的细胞和对照细胞两者都被转导以表达包含GD2结合部分的蛋白。通过使用流式细胞术测量tCD34的表达来评估所产生的蛋白-酶构建体的纯度。结果表明,在Jurkat细胞中可以产生高纯度的蛋白-酶构建体,在图2a中示出。
在经转导的细胞中存在ASS-1和OTC的表达增加(注意到与原代PBMC相比,Jurkat具有较高的背景ASS-1表达),在图2b中示出。
本发明人研究了促进经转导的细胞中精氨酸的合成的结构域执行其功能的能力。
评估了瓜氨酸通过ASS-1向精氨基琥珀酸的分解代谢,并且与对照构建体(不含ASS-1结构域,GD2-CAR)、包含OTC结构域的融合靶结合蛋白(GD2-OTC)以及包含ASS-1结构域和OTC结构域两者的融合靶结合蛋白(GD2-ASS-OTC)进行了比较。以比色法测定对经GD2-ASS转导的Jurkat细胞的裂解物测试了ASS-1酶使瓜氨酸直接分解代谢为精氨基琥珀酸的活性。含有促进精氨酸合成的ASS-1结构域的融合靶结合蛋白显示,GD2-ASS-1融合靶结合蛋白比含有对照融合靶结合蛋白构建体的细胞具有显著更高的ASS-1活性。在图2c中示出。
评估了鸟氨酸通过OTC向瓜氨酸的分解代谢,并且与没有OTC结构域的对照构建体(仅GD2)、含有ASS-1结构域的融合靶结合蛋白(GD2-ASS)以及含有ASS-1结构域和OTC结构域两者的融合靶结合蛋白(GD2-ASS-OTC)进行了比较。以比色法测定对经GD2-OTC转导的Jurkat细胞的裂解物测试了OTC酶使鸟氨酸直接分解代谢为瓜氨酸的活性。含有OTC结构域的融合靶结合蛋白(GD2-OTC)构建体以及含有ASS-1结构域和OTC结构域的融合靶结合蛋白(GD2-ASS-OTC)构建体比含有对照CAR构建体的细胞具有显著更高的OTC活性,在图2d中示出。
本发明人研究了用包含促进精氨酸合成的结构域的构建体转导的融合靶结合蛋白T细胞在肿瘤微环境中的持续性。
向NOG-SCID小鼠植入5x106个融合靶结合蛋白T细胞。每周两次施用重组PEG精氨酸酶,以产生可重复的低精氨酸微环境(以精氨酸ELISA证实)。处死小鼠,并且通过流式细胞术测量血液中融合靶结合蛋白T细胞的百分比。包含ASS-1结构域的融合靶结合蛋白T细胞(GD2-ASS)与没有ASS-1结构域的融合靶结合蛋白(GD2-CAR T细胞)相比显示出显著增强的持续性,在图2e中示出。
包含OTC结构域的融合靶结合蛋白T细胞(GD2-OTC)与不具有包含OTC结构域的融合靶结合蛋白的T细胞(GD2-CAR T细胞)相比显示出显著增强的持续性,在图2f中示出。
3可以将精氨酸途径酶转导到来自人类供体的PBMC中。
本发明人研究了精氨酸途径酶在来自人类供体细胞的PBMC中的作用。在图3中列出了该研究的结果。
用包含精氨酸途径酶的融合靶结合蛋白构建体转导PBMC。通过使用流式细胞术测量tCD34的表达来评估所产生的CAR酶构建体的纯度。结果显示,可以在PBMC中产生高纯度的融合靶结合蛋白-酶构建体,在图3a中示出。
在经转导的细胞中,ASS-1的表达增加并且OTC增加,在图3b中示出。
本发明人发现,共抑制性受体LAG-3、TIM-3和PD-1在也含有包含促进精氨酸合成的结构域的构建体的CAR-T细胞中的表达没有差异。
用包含促进精氨酸合成的结构域的构建体转导的PBMC的持续性在7天扩增期间被测量,如通过对tCD34的流式细胞术检测的。GD2-ASS-1构建体表现出与单独的GD2构建体相似的持续性。GD2-OTC构建体和GD2-ASS-OTC构建体未随时间推移而维持,如在图3d中示出的。这些实验是在没有抗原存在的正常精氨酸条件下进行的。本发明人假设,在低精氨酸条件和抗原存在下可以观察到存活优势。体内发生的任何细胞损失可以通过向患者重复施用本发明的细胞来克服,施用的间隔反映了细胞在体内存活的时间。
4在低精氨酸肿瘤条件下ASS-1和OTC赋予了显著的代谢优势和增殖优势
通过对培养物上清液的ELISA检测包含促进精氨酸合成的结构域(GD2-ASS和GD2-OTC)的融合靶结合蛋白T细胞在以下培养基条件培养时增强瓜氨酸代谢的能力:正常精氨酸(RPMI+10%FCS)、LAN-1神经母细胞瘤条件上清液(LAN-1neuroblastoma conditionedsupernatant)和75%精氨酸耗尽。在肿瘤来源的低精氨酸条件下,GD2-ASS-1融合靶结合蛋白和GD2-OTC融合靶结合蛋白与对照(不具有促进精氨酸合成的结构域,仅GD2)相比显著上调了瓜氨酸代谢,与酶表达和活化一致,在图4a中示出。
对比对照(仅GD2:“GD2-BB”)评估了包含ASS-1结构域(“GD2-ASS-BB”)和OTC结构域(“GD2-OTC-BB”)的融合靶结合蛋白的融合靶结合蛋白T细胞对神经母细胞瘤细胞系和骨髓性白血病细胞系的特异性的细胞裂解。在铬标记的GD2+LAN-1神经母细胞瘤细胞的存在下以不同的效应物与靶的比率培养融合靶结合蛋白T细胞4小时。与本发明人先前的数据一致,所有的CAR-T细胞构建体都特异性地有效杀伤神经母细胞瘤细胞(35%-45%)。未见到ASS-1或OTC的添加对细胞毒性的减损。这种杀细胞活性的特异性通过以下事实得到证实:GD2-CAR T细胞(无论是对照还是本发明的)对骨髓性白血病细胞系(GD2-K562)具有最小程度的杀伤(特异性裂解<5%)。在图4b中示出。
包含促进精氨酸合成的结构域(ASS-1或OTC)的CAR T细胞在低精氨酸条件下显示出显著的增殖挽救。在正常精氨酸(RPMI+10%FCS)、神经母细胞瘤来源的低精氨酸上清液或75%精氨酸耗尽的培养基中培养CAR-T细胞。96小时后通过氚化胸苷掺入来测量T细胞增殖。与我们先前的发现一致,CAR-T细胞在低精氨酸条件下显示出T细胞增殖减少。如在图4c中示出的,在这些条件下,用包含ASS-1结构域(GD2-ASS)和OTC结构域(GD2-OTC)的构建体转染的细胞与对照(GD2-CAR)相比显示出显著的增殖挽救。
5经修饰的CAR-T细胞具有增强的体内抗肿瘤活性并且可以应用于非GD2 CAR-T细胞
将GD2+肿瘤细胞植入NOG-SCID小鼠。经由尾静脉注射施用包含ASS-1结构域(GD2-ASS)和不含ASS-1结构域(GD2-CAR)的CAR-T细胞。测量随时间推移的相对肿瘤生长。如在图5a中示出的,施用GD2-ASS-1 CAR T细胞与GD2-CAR T细胞相比导致肿瘤生长减少。
如在图5b中示出的,施用GD2-ASS-1 CAR T细胞还导致鼠存活提高。该图中示出的结果不仅说明了本发明的细胞在体内的杀细胞活性(并因此说明了治疗活性),而且说明了它们在体内的持续性的提高,因为在比对照细胞更长的时间段中观察到该治疗活性。
评估了CD33 CAR T细胞和CD33-ASS-1 CAR T细胞的存活力。在AML细胞系条件培养基(低精氨酸)或50%-75%精氨酸耗尽的培养基中培养CD33-ASS-1 CAR。在低精氨酸条件下,与CD33 CAR相比,CD33-ASS-1 CAR显示出显著增强的存活力。说明了这点的结果在图5c中示出。
6本发明的细胞在体内精氨酸耗尽条件下的增加的持续性。
在植入有5x106个抗GD2 CAR-T Jurkat细胞(对照细胞)或表达本发明的包含GD2靶向部分和ASS-1结构域的蛋白的Jurkat细胞(GD2-ASS)或表达本发明的包含GD2靶向部分和OTC结构域的蛋白的细胞(GD2-OTC)的NOG-SCID小鼠中证实了本发明的细胞的提高的持续性。向小鼠每周两次施用重组PEG精氨酸酶,以产生可再生的低精氨酸微环境(以复制肿瘤微环境)。低精氨酸条件通过ELISA得到证实(数据未示出)。17天后,处死小鼠,通过流式细胞术测量血液中CAR-T细胞的百分比(无论是对照还是本发明)。与包含未修饰的GD2CAR-T构建体的对照细胞相比,GD2-ASS-1 CAR-T细胞和GD2-OTC CAR-T细胞显示出显著增强的持续性。在图6中示出了这些结果。
7可以将包含不同靶结合部分的精氨酸途径酶转导到来自人类供体的PBMC中。
用本发明的蛋白转导来自人类供体的PBMC(特别是T细胞),所述蛋白包含ASS-1结构域和/或OTC结构域与选自由以下组成的列表的靶结合部分的组合:GD2、CD33、间皮素或EGFRvIII。蛋白印迹显示,与对照细胞(每个蛋白印迹的左侧纵列)相比,用本发明的蛋白转导的细胞中的ASS-1和OTC的表达增加。这在图7a中示出。
还通过流式细胞术在表达本发明的蛋白的经转导的CAR-T细胞中评估了LAG-3、TIM-3和PD-1(在癌症治疗中具有潜在重要性的共抑制性受体)的表达,所述蛋白包含:ASS-1结构域;OTC结构域;或ASS-1结构域和OTC结构域。抗GD2、抗CD33、抗MESO和抗EGFRvIIICAR-T细胞的示例在图7的图B中示出。
8表达CD33靶向结构域的细胞的杀细胞活性
本发明的CAR-T细胞通过表达本发明的包含CD33靶向结构域与ASS-1结构域、OTC结构域或ASS-1结构域和OTC结构域的组合的蛋白来产生。在K562白血病细胞的存在下,以不同的效应物与靶的比率培养CAR T细胞4小时。所有CAR-T细胞构建体都特异性地有效杀伤白血病细胞(70%-90%)。在图8中示出,用本发明的蛋白转导CD33 CAR T细胞不会减损性地影响CAR T细胞的细胞毒性。包含本发明的蛋白的细胞保持杀细胞活性同时还显示出增加的持续性和增殖(如在实施例的其余部分中示出的),说明了它们的治疗效用。
9在低精氨酸肿瘤条件下酶修饰赋予了显著的代谢优势和增殖优势。
细胞被转导以表达以下本发明的蛋白之一:
·包含GD2结合结构域和ASS-1结构域的蛋白
·包含GD2结合结构域和OTC结构域的蛋白
·包含GD2结合结构域以及ASS-1结构域和OTC结构域两者的蛋白
·包含CD33结合结构域和ASS-1结构域的蛋白
·包含CD33结合结构域和OTC结构域的蛋白
·包含CD33结合结构域以及ASS-1结构域和OTC结构域两者的蛋白
·包含间皮素结合结构域和ASS-1结构域的蛋白
·包含间皮素结合结构域和OTC结构域的蛋白
·包含间皮素结合结构域以及ASS-1结构域和OTC结构域两者的蛋白
·包含EGFRvIII结合结构域和ASS-1结构域的蛋白
·包含EGFRvIII结合结构域和OTC结构域的蛋白
·包含EGFRvIII结合结构域以及ASS-1结构域和OTC结构域两者的蛋白
将它们培养在低精氨酸条件下(75%精氨酸耗尽的完全培养基)。使用共有相同结合结构域(即抗GD2、抗CD33、抗间皮素或抗EGFRvIII)但缺少酶结构域的未修饰的CAR-T细胞作为对照。96小时后,通过流式细胞术测量所有细胞的增殖。
在抗GD2细胞的情况下,与未修饰的对照CAR-T细胞相比,ASS-1结构域、OTC结构域或ASS-1结构域和OTC结构域的添加显著增强了CAR-T细胞增殖。事实上,与仅GD2的对照细胞相比,GD2-OTC CAR T细胞显示出增殖增加5倍。另外,与仅GD2的CAR-T细胞对照相比,GD2-ASS/OTC CAR T细胞显示出增殖增加10倍。在图9的图A中示出。
在抗CD33 CAR-T细胞的情况下,与未修饰的对照CAR-T细胞相比,ASS-1结构域、OTC结构域或ASS-1结构域和OTC结构域的添加显著增强了CAR-T细胞的增殖。与仅CD33的对照细胞相比,CD33-OTC CAR T细胞显示出增殖增加约5倍。另外,与仅GD2的CAR-T细胞对照相比,CD33-ASS/OTC CAR T细胞显示出增殖增加6倍。在图9的图B中示出。
对于抗间皮素CAR-T细胞,与未修饰的对照CAR-T细胞相比,ASS-1结构域、OTC结构域或ASS-1结构域和OTC结构域的添加显著增强了CAR-T细胞的增殖。与仅CD33的对照细胞相比,间皮素-OTC CAR T细胞显示出增殖增加约4倍。另外,与仅间皮素的CAR-T细胞对照相比,间皮素-ASS/OTC CAR T细胞显示出增殖增加约3.5倍。在图9的图C中示出。
在抗EGFRvIII CAR-T细胞中,与未修饰的对照CAR-T细胞相比,ASS-1结构域的添加使增殖显著增加约2.5倍。在图9的图D中示出。
10在肿瘤条件培养基(TCM)中酶修饰赋予了显著的代谢优势和增殖优势。
在神经母细胞瘤肿瘤条件培养基中培养表达本发明的蛋白的细胞,所述蛋白包含GD2结合部分与以下任一种的组合:ASS-1结构域、OTC结构域或ASS-1结构域和OTC结构域。由于肿瘤细胞的作用,这种培养基具有低精氨酸条件。使用没有酶结构域的抗GD2 CAR-T细胞作为对照细胞。
96小时后,通过流式细胞术测量所培养的细胞的增殖。如在图10的图A中示出的,与未修饰的对照CAR-T细胞相比,本发明的包含ASS-1结构域的蛋白的添加显著增强了CAR-T细胞增殖。
在白血病肿瘤条件培养基(其也含有低水平的精氨酸)中培养表达本发明的蛋白的细胞,所述蛋白包含CD33结合部分与以下任一种的组合:ASS-1结构域、OTC结构域或ASS-1结构域和OTC结构域。在这种情况下,使用没有酶结构域的抗CD33 CAR-T细胞作为对照细胞,并且(同样)在96小时后通过流式细胞术测量细胞增殖。
与未修饰的对照CAR-T细胞相比,本发明的包含ASS-1结构域、OTC结构域或ASS-1结构域和OTC结构域的蛋白的添加显著增强了CAR-T细胞增殖。包含OTC结构域的CD33 CART细胞显示出增殖增加约4倍。与未修饰的对照CAR T细胞相比,包含ASS-1结构域和OTC结构域的CD33 CAR T细胞显示出增殖增加约3.5倍。这些结果在图10的图B中示出。
11酶修饰显著增强了体内抗肿瘤活性
将HL-60急性髓性白血病(AML)细胞植入NOG-SCID小鼠中。用表达本发明的蛋白的细胞处理患有白血病的小鼠,所述蛋白包含CD33-结合部分和以下任一种:ASS-1结构域、OTC结构域或ASS-1结构域和OTC结构域。使用缺少酶结构域的抗CD33 CAR-T细胞(未修饰的CAR-T细胞)作为对照。以5x106个细胞的剂量静脉内施用本发明的细胞或对照细胞。
如在图11中示出的,与对照CAR-T细胞相比,表达本发明的包含ASS-1结构域的蛋白的CAR-T细胞(抗CD33-ASS-1 CAR-T细胞)显著增强了AML从骨髓中的清除。
12 GD2 CART T细胞的酶修饰显著增强了体内抗肿瘤活性
用表达本发明的包含GD2结合部分和ASS-1结构域的蛋白的细胞处理神经母细胞瘤异种移植小鼠。对照动物接受了GD2 CAR-T细胞(不具有ASS-1结构域)处理或未接受CAR-T细胞处理。收集所有动物的脾,并且通过流式细胞术表征了所提取的白细胞。在图12的图A中示出了结果,并且说明了与对照细胞的细胞数目相比,本发明的细胞显著增加。这表明,与对照相比,在经处理的小鼠的脾中本发明的细胞(表达包含ASS-1结构域的本发明的蛋白)具有提高的持续性。
还将提取的白细胞与神经母细胞瘤靶细胞(IMR32细胞系或肿瘤细胞)离体共培养,以研究在接受者中持续存在的本发明的细胞响应于抗原刺激而经历扩增的能力。结果在图12的图B中示出。可以观察到,本发明的细胞的数目显著高于对照的细胞的数目。这表明,与对照细胞相比,本发明的持续性细胞保持了更强的响应于抗原刺激而增殖的能力。
13 CD33 CART T细胞的酶修饰显著增强了体内抗肿瘤活性
用表达本发明的蛋白的细胞处理AML异种移植小鼠,所述蛋白包含CD33结合部分和以下之一:ASS-1结构域;OTC结构域;或ASS-1结构域和OTC结构域。对照组接受CD33 CAR-T细胞(不具有酶结构域—显示为“-酶”)处理或未接受CAR-T处理。收集所有动物的脾,并且通过流式细胞术表征了所提取的白细胞。在图13的图A中示出的结果说明了,与对照细胞相比,本发明的细胞的细胞数目显著增加。这表明,在AML的情况下,本发明的细胞在经处理的小鼠的脾中也具有提高的持续性(与对照组相比)。
还将所提取的白细胞与AML靶细胞离体共培养,以研究在接受者中持续存在的本发明的细胞响应于抗原刺激而经历扩增的能力。结果在图13的图B中示出。本发明的细胞的数目显著高于对照的数目,特别是在表达本发明的具有ASS-1结构域的蛋白的细胞的情况下。这些结果表明,在接受者中持续存在的本发明的细胞保持了比对照细胞更强的响应于抗原刺激而增殖的能力。
用于产生本发明的细胞的方案
通过逆转录病毒以及通过慢病毒转导方法成功产生了本发明的细胞。以下阐述了用于本发明的细胞的逆转录病毒产生的示例性方案的细节。
人类T细胞的逆转录病毒转导
以下提供了用于通过用本发明的核酸转染来产生本发明的细胞的方案。
第-2天:解冻Phoenix Ampho细胞
较晚的下午,将Phoenix Ampho细胞(用于转导人类细胞的逆转录病毒包装细胞系)从-80℃取出并且放置在培养物中。使Phoenix Ampho细胞在含有10%的FCS、1%的L-谷氨酰胺的DMEM(无抗生素)中生长。应当使Phoenix Ampho细胞永远不会达到汇合。通常将在每个T150瓶中的30ml培养基中放置2x106-3x106个Phoenix Ampho细胞。在第0天,你应当具有约30x106-40x106个Phoenix Ampho细胞。
第1天:放置Phoenix Ampho细胞
使用TryLE胰蛋白酶消化Phoenix Ampho细胞,并将Phoenix Ampho细胞以8x 106个细胞/瓶放置在30ml含有10%FCS和1%L-谷氨酰胺的DMEM(无抗生素)中(对于T150瓶的体积,按需适当缩放)。孵育细胞过夜(37℃/5%CO2)。
第2天:Phoenix Ampho细胞的转染
Phoenix Ampho细胞在转染当天应当为50%-80%的汇合。然后应当通过以下方法转染细胞(对于T150瓶,如果使用不同的瓶,则按需适当缩放)。
1.对于每个T150瓶的Phoenix细胞,将12μg质粒DNA(即CAR质粒)+12μg pCl ampho质粒放置在15ml falcon管中,并且用OptiMEM(Gibco)补足至1800μl,用移液器轻柔混合。向另一个15ml falcon管中添加1680μl OptiMEM,并且添加120μl Fugene 6转染试剂(可从商店获得),确保Fugene直接进入OptiMEM中,而不是粘在管的侧面;用移液器轻柔混合。然后将1800μl的OptiMEM/fugene混合物添加到含有质粒DNA的管,并且用移液器轻柔混合。在室温孵育45min。这允许fugene与DNA形成带有中性电荷的复合物,从而允许DNA被转运跨过带负电荷的Phoenix Ampho细胞膜。
2.非常轻柔地用9ml新鲜的含有10%的FCS和谷氨酰胺的DMEM替换Phoenix Ampho细胞上的培养基,然后立即将DNA/fugene复合物或OptiMEM(用于模拟对照)覆盖到细胞上。通过将板的南北和东西移动来轻柔混合。
3.孵育细胞24小时(37℃/5%CO2)。
第2天:T细胞的活化
T细胞在活化后的前48小时内不会扩增,因此通常活化根据你的转导需要的量的T细胞(或更多,在细胞死亡的情况下)。
使用抗CD3/CD28抗体的方法:
1.淋巴制备(lymphoprep)新鲜的白细胞锥(leukocyte cone)。
2.计数细胞,并且以1×106个/ml培养于T细胞培养基(1%人类血清、10%FCS、P/S、L-谷氨酰胺RPMI)中。通常每个T150瓶200ml。
3.添加300U/ml的IL-2,添加30ng/ml的OKT3(抗CD3),添加30ng/ml的抗CD28 mAB(#MAB342-SP,R&D)。
4.在37℃/5%CO2孵育48小时。
使用抗CD3/CD28 dynabead的方法:
1.淋巴制备新鲜的锥。计数细胞,并且假设50%的PBMC是CD3+ T细胞。
2.将细胞以每ml 5%人类血清、PBS 10x106个CD3+T细胞重悬于15ml falcon管中。
3.每个CD3+细胞添加两个
Figure BDA0002643121210000601
Human T-Activator CD3/CD28。洗涤dynabead:将珠的小瓶涡旋30s。取出所需体积的珠,并且放置在15ml falcon管中。添加1ml无菌PBS,并且用移液器充分混合。将falcon管放置在dynabead磁体上—dynabeads将粘在falcon管的边缘。小心去除上清液,不要扰动珠。将falcon管从磁体上取下,并且重复洗涤步骤。将dynabead添加至小体积的PBS中的你的T细胞。
4.在室温在旋转混合振荡器(tumbler)上孵育T细胞至少1小时。在此步骤期间,T细胞将结合dynabead,允许选择并且同时活化CD3+ T细胞。
5.将细胞放置在dynabead磁体上,以去除未结合的细胞。计数细胞,并且以1×106个/ml培养于含有IL-2 300U/ml的T细胞培养基(1%人类血清、10%FCS、P/S、L-谷氨酰胺RPMI)中。
6.在37℃/5%CO2孵育48小时。
第3天:更换Phoenix Ampho培养基
Phoenix ampho细胞现在将产生含有你的质粒DNA的逆转录病毒,所以在处理细胞/上清液时要考虑到这一点。将高压灭菌袋放置在你的TC柜内,并且将任何污染有逆转录病毒(细胞/上清液)的塑料制品放置在其中。当你完成后,密封高压灭菌袋并且放置在高压灭菌罐中。将任何液体废物放置在废物罐中并且密封。尽快将被逆转录病毒污染的废物进行处理(wash-up)。
用新鲜的21ml/瓶(对于T150瓶的体积,按需适当缩放)的DMEM+10%FCS+2mM L-谷氨酰胺(无抗生素)轻柔替换Phoenix Ampho细胞上的培养基。另外孵育细胞24小时。
第4天:人类T细胞的转导
1.将2ml retronectin(30μg/ml)(#T100B-Takara Retro
Figure BDA0002643121210000611
重组人类纤连蛋白片段)添加至6孔板(非组织培养处理的)的所需数目的孔中的每一个中,并且在室温孵育3小时(也可以在前一天设置,并且在冰箱中包被过夜)。记住在实验中包括用于模拟转染对照的孔。将培养板包被在retronectin中,以使T细胞和病毒颗粒共定位,以允许有效转导细胞。
2.去除retronectin(其可以重复使用直到用完),并且用2.5ml无菌PBS/2%BSA/孔封闭孔30min。去除封闭溶液,并且用2.5ml无菌PBS洗涤孔两次(将最后一次洗涤的PBS保留在孔上直到准备添加病毒)。
3.预热一些T细胞培养基。
4.通过将空桶在32℃以3160rpm/2000g旋转60min来预热离心机以进行旋转感染(spinfection)。当准备进行旋转感染时,这可以被中断。
5.从Phoenix Ampho细胞收集含有逆转录病毒的培养物上清液并且离心(1500rpm持续5分钟)。将逆转录病毒上清液转移至新鲜的管。一些人使用0.45μm过滤器过滤他们的逆转录病毒,以去除污染的Phoenix Ampho细胞,但这可能会降低逆转录病毒的滴度。如有必要,可以将病毒在干冰/乙醇浆液上速冻并且保存在-80℃,但是每次冻融滴度减半。
6.旋转感染:将2ml/孔的病毒上清液(或模拟上清液)添加至retronectin包被的孔,并且在32℃以3160rpm/2000g旋转2小时。
7.在该旋转结束前45min,准备待转导的T细胞。收集T细胞并且计数。将T细胞以1x106个重悬于T细胞培养基+IL2(100U/ml)中,并且孵育(37℃/5%CO2)15-20min,以允许细胞从离心恢复。
8.当病毒完成旋转后,去除上清液并且用PBS洗涤孔一次(2.5ml/孔)。
9.从病毒/retronectin包被的板去除PBS,并且添加待转导的T细胞(2ml/孔)。通过北:南和东:西摇动确保细胞在板上均匀分布。将板以1300rpm旋转5min。
10.将板放置在培养箱中(37℃/5%CO2)。
第5天:饲育经转导的T细胞
向每个孔的T细胞添加另外6ml的T细胞培养基+IL2(100IU/ml)并且放回培养箱(37℃/5%CO2)。
确定CAR转导效率
用于转导细胞以产生本发明的细胞的方法的效率可以使用以下程序来确定。
在旋转感染后4天确定CAR T细胞转导效率。从模拟和CAR T细胞孔取样并且如下染色:
1.用FACS缓冲液(10%FCS、PBS)洗涤x1
2.用50μl FACS缓冲液中的CD34-APC(1μl/样品)、CD4-FITC(2μl/样品)和CD8-PE(1μl/样品)染色
3.在冰上孵育20min
4.用FACS缓冲液洗涤x1
5.将细胞重悬于200μl FACS缓冲液中,并且通过流式细胞术(LSRII)分析。
通过CD34磁性活化的细胞分选来分选本发明的细胞(诸如CAR T细胞)
经CAR转导的细胞(诸如T细胞)如下分选:
1.将T细胞以1500rpm离心5min并且倒掉上清液。
2.将细胞重悬于10ml冷MACS缓冲液中,并且以1500rpm旋转5min并且倒掉上清液。
3.将细胞重悬于300μl冷MACS缓冲液中,添加100μl FcR封闭剂和100μl CD34微珠(Miltenyi Biotech 130-046-702)。这些量适用于至多108个细胞—如果多于108个,则相应扩大规模。
4.充分混合并且在冰箱(2-8℃)中孵育30min。
5.在50ml冷MACS缓冲液中洗涤,并且以1500rpm旋转5min,并且倒掉上清液。
6.将细胞重悬于500μl冷MACS缓冲液中,并且将细胞悬浮液加载到已经用500μl冷MACS缓冲液预冲洗过的MS柱上。
7.允许细胞通过重力流动下滴通过(drip through by gravity flow),并且用500μl冷MACS缓冲液洗涤柱3次。
8.从磁体上取下柱,并且用1ml冷MACS缓冲液冲洗通过,将细胞收集在无菌管中。
9.离心所分选的CAR T细胞,并且以每ml 1x106个CAR T细胞的浓度重悬于正常T细胞培养基(1%人类血清、10%FBS、P/S、L-谷氨酰胺、100U/ml IL-2、RPMI 1640)中。
10.在次日通过CD34表面抗体染色来检查CAR T细胞的纯度。
确定精氨基琥珀酸合酶(ASS-1)或精氨基琥珀酸合成酶(ArgG)酶活性的测定—L-瓜氨酸消耗
1.每个样品沉淀5x106个细胞(如果你有足够的细胞,则沉淀另外的5x106个细胞用于无底物对照)。
2.重悬于20μl的0.1%Triton-X+蛋白酶抑制剂中(在分子实验室中在4℃将0.1%Triton-X储存于50ml管中),并且在冰上孵育20分钟,偶尔涡旋。
3.在4℃以13,000rpm离心样品20分钟,以沉淀细胞碎片。
4.取20μl细胞裂解物至新鲜的eppendorf管中并且保持在冰上。
5.为每个样品取一个新鲜的eppendorf管,并且添加10μl L-瓜氨酸(4mM、pH7.5)、10μl L-天冬氨酸(4mM、pH 7.5)、10μL MgCl2(6mM)、10μL ATP(4mM、pH 7.5)、40μlTris-HCl(20mM)和20μl细胞裂解物。
6.对于无酶对照,添加20μl的0.1%Triton-X+蛋白酶抑制剂代替细胞裂解物。
7.如果进行无底物对照,则不添加ASS-1底物或ArgG底物,即L-瓜氨酸和L-天冬氨酸。替代地,用Tris-HCl(20mM)补足至100μl的终体积。
8.将样品在37℃孵育1.5hr。ASS-1酶反应或ArgG酶反应将发生。
9.通过对4mM L-瓜氨酸溶液进行1:4稀释来制备1mM L-瓜氨酸溶液,从而制备L-瓜氨酸标准品。向eppendorf管添加10μl、20μl、30μl、50μl、80μl和100μl的L-瓜氨酸(1mM),并且用无菌蒸馏水将每个标准品补足至100μl。这使得L-瓜氨酸的浓度为0nM、10nM、20nM、30nM、50nM、80nM和100nM。包括空白对照。
10.向每个标准品中添加10μl L-天冬氨酸(4mM、pH 7.5)、10μl MgCl2(6mM)、10μlATP(4mM、pH 7.5)和20μL的0.1%Triton-X+蛋白酶抑制剂。将ASS-1酶试剂或ArgG酶试剂添加到标准品中,以更准确地确定ASS-1酶或ArgG酶活性样品中的L-瓜氨酸浓度。
11.在37℃1.5hr后,向每个样品和标准品中添加80μl的终止溶液(磷酸和硫酸分别为3:1的混合物)和20μl的3%2,3-丁二酮单肟(当天用无菌蒸馏水新鲜制备,并且因为气味难闻在通风橱中制备)。
12.将管通过涡旋和脉冲离心来混合。将所有样品和标准品在95℃孵育30分钟。当2,3-丁二酮单肟在95℃在酸性条件下与L-瓜氨酸反应时,将出现黄色/橙色颜色。
13.将管以13000rpm离心1分钟,以沉淀任何碎片。以一式两份,将50μl上清液添加至96孔平底板的孔中。
14.使用微孔板吸光度读取器(microplate absorbance reader)读取490nm处的吸光度。
确定鸟氨酸转氨甲酰酶(OTC)或鸟氨酸转氨甲酰酶(ArgF)酶活性的测定—L-瓜氨酸产生
1.每个样品沉淀5x106个细胞(如果你有足够的细胞,则沉淀另外的5x106个细胞用于无底物对照)。
2.重悬于20μl的0.1%Triton-X+蛋白酶抑制剂中(在分子实验室中在4℃将0.1%Triton-X储存于50ml管中),并且在冰上孵育20分钟,偶尔涡旋。
3.在4℃以13,000rpm离心样品20分钟,以沉淀细胞碎片。
4.取20μl细胞裂解物至新鲜的eppendorf管中并且保持在冰上。
5.为每个样品取一个新鲜的eppendorf管,并且添加25μL L-鸟氨酸(50mM、pH8.0)、25μl三乙醇胺(直接从瓶中吸出,溶液非常粘稠,所以缓慢吸出)、25μl新制备的氨甲酰磷酸(150mM、pH 8.0)和10μl SDW。
6.然后向每个管中添加20μl细胞裂解物。对于无酶对照,添加20μl的0.1%Triton-X+蛋白酶抑制剂代替细胞裂解物。
7.如果进行无底物对照,则不添加OTC底物或ArgF底物,即L-鸟氨酸和氨甲酰磷酸。替代地,用SDW补足至100μl的终体积。
8.将样品在37℃孵育1.5hr。OTC酶反应或ArgF酶反应将发生。
9.通过对4mM L-瓜氨酸溶液进行1:4稀释来制备1mM L-瓜氨酸溶液,从而制备L-瓜氨酸标准品(储存在-20℃,用于ASS-1酶活性测定)。向eppendorf管添加10μl、20μl、30μl、50μl、80μl和100μl的L-瓜氨酸(1mM),并且用无菌蒸馏水将每个标准品补足至100μl。这使得L-瓜氨酸的浓度为0nM、10nM、20nM、30nM、50nM、80nM和100nM。包括空白对照。
10.向每个标准品中添加25μL L-鸟氨酸(50mM)、25μl三乙醇胺、25μL新制备的氨甲酰磷酸(150mM)和20μl的0.1%Triton-X+蛋白酶抑制剂。将OTC酶试剂添加到标准品中,以更准确地确定OTC酶或ArgF酶活性样品中的L-瓜氨酸浓度。
11.在37℃1.5hr后,向每个样品和标准品中添加80μl的终止溶液(磷酸和硫酸分别为3:1的混合物)和20μl的3%2,3-丁二酮单肟(当天用无菌蒸馏水新鲜制备,并且因为气味难闻在通风橱中制备)。
12.将管通过涡旋和脉冲离心来混合。将所有样品和标准品在95℃孵育30分钟。当2,3-丁二酮单肟在95℃在酸性条件下与L-瓜氨酸反应时,将出现黄色/橙色颜色。
13.将管以13000rpm离心1分钟,以沉淀任何碎片。以一式两份,将50μl上清液添加至96孔平底板的孔中。
14.使用微孔板吸光度读取器读取490nm处的吸光度。
确定精氨基琥珀酸裂合酶(ASL)或精氨基琥珀酸裂合酶(ArgH)酶活性的测定—L-延胡索酸产生或精氨酸产生
1.每个样品沉淀5x106个细胞(如果你有足够的细胞,则沉淀另外的5x106个细胞用于无底物对照)。
2.重悬于20μl的0.1%Triton-X+蛋白酶抑制剂中(在分子实验室中在4℃将0.1%Triton-X储存于50ml管中),并且在冰上孵育20分钟,偶尔涡旋。
3.在4℃以13,000rpm离心样品20分钟,以沉淀细胞碎片。
4.取20μl细胞裂解物至新鲜的eppendorf管中并且保持在冰上。
5.为每个样品取一个新鲜的eppendorf管,并且添加25μL L-精氨基琥珀酸(11.7mM)和55μl PBS。
6.然后向每个管中添加20μl细胞裂解物。对于无酶对照,添加20μl的0.1%Triton-X+蛋白酶抑制剂代替细胞裂解物。
7.如果进行无底物对照,则不添加ASL底物或ArgH底物,即L-精氨基琥珀酸。替代地,用SDW补足至100μl的终体积。
8.将样品在37℃孵育1.5hr。ASL酶反应或ArgH酶反应将发生。
9.通过对4mM L-延胡索酸溶液进行1:4稀释来制备1mM L-延胡索酸溶液,从而制备L-延胡索酸标准品。向eppendorf管添加10μl、20μl、30μl、50μl、80μl和100μl的L-延胡索酸(1mM),并且用无菌蒸馏水将每个标准品补足至100μl。这使得L-延胡索酸的浓度为0nM、10nM、20nM、30nM、50nM、80nM和100nM。包括空白对照。
10.向每个标准品中添加25μL L-精氨基琥珀酸(11.7mM)和20μl 0.1%Triton-X+蛋白酶抑制剂。将ASL酶试剂添加到标准品中,以更准确地确定ASL酶或ArgH酶活性样品中的L-延胡索酸浓度。
11.在37℃1.5hr后,将管以13000rpm离心1分钟,以沉淀任何碎片。以一式两份,将50μl上清液添加至96孔平底板的孔中。
12.使用微孔板吸光度读取器读取2400nm处的吸光度。
13.也可以在以上步骤11根据生产商的说明书使用HPLC或精氨酸ELISA测量精氨酸的产生。为了测量细胞上清液浓度,可以相应地修改以上方案,使用100μl细胞上清液代替细胞裂解物。
确定色氨酸合酶(Trp5)酶活性的测定—吲哚消耗或色氨酸产生
1.每个样品沉淀5x106个细胞(如果你有足够的细胞,则沉淀另外的5x106个细胞用于无底物对照)。
2.重悬于20μl的0.1%Triton-X+蛋白酶抑制剂中(在分子实验室中在4℃将0.1%Triton-X储存于50ml管中),并且在冰上孵育20分钟,偶尔涡旋。
3.在4℃以13,000rpm离心样品20分钟,以沉淀细胞碎片。
4.取20μl细胞裂解物至新鲜的eppendorf管中并且保持在冰上。
5.为每个样品取一个新鲜的eppendorf管,并且添加80μl吲哚溶液(0.005M)、400μl DL-丝氨酸溶液(0.2M)、100μl磷酸吡哆醛溶液、20μl谷胱甘肽(0.05M)和120μl磷酸盐缓冲液(0.5M、pH 7.8)、260μl水。
6.然后向每个管中添加20μl细胞裂解物。对于无酶对照,添加20μl的0.1%Triton-X+蛋白酶抑制剂代替细胞裂解物。
7.如果进行无底物对照,则不添加Trp5底物,即吲哚溶液和丝氨酸溶液。替代地,用SDW补足至1000μl的终体积。
8.将样品在37℃孵育1.5hr。Trp5酶反应将发生。
9.通过对4mM L-延胡索酸溶液进行1:4稀释制备1mM吲哚溶液来制备吲哚标准品。向eppendorf管中添加10μl、20μl、30μl、50μl、80μl和100μl吲哚(1mM),并且用无菌蒸馏水将每个标准品补足至1000μl。这使得吲哚的浓度为0nM、10nM、20nM、30nM、50nM、80nM和100nM。包括空白对照。向每个标准品中添加20μl 0.1%Triton-X+蛋白酶抑制剂。
10.在37℃1.5hr后,添加200μl的5%NaOH。向每个管中添加4ml甲苯并且离心以使溶液分成2层。
11.用移液器将至多1ml的甲苯层移入单独的测试管中。添加4ml乙醇和2ml对二甲氨基苯甲醛溶液(制备如下:36g溶于500ml乙醇中。添加180ml浓HCl。在冷却时用乙醇将体积补足至1L)。允许颜色变化发生持续60分钟。
12.使用微孔板吸光度读取器读取550nm处的吸光度。
13.也可以在以上步骤10根据生产商的说明书使用HPLC或色氨酸ELISA测量色氨酸的产生。为了测量细胞上清液浓度,可以相应地修改以上方案,使用100μl细胞上清液代替细胞裂解物。
确定吲哚胺2,3-双加氧酶(IDO)酶活性的测定—犬尿氨酸产生
1.每个样品沉淀5x106个细胞(如果你有足够的细胞,则沉淀另外的5x106个细胞用于无底物对照)。
2.重悬于20μl的0.1%Triton-X+蛋白酶抑制剂中(在分子实验室中在4℃将0.1%Triton-X储存于50ml管中),并且在冰上孵育20分钟,偶尔涡旋。
3.在4℃以13,000rpm离心样品20分钟,以沉淀细胞碎片。
4.取20μl细胞裂解物至新鲜的eppendorf管中并且保持在冰上。
5.为每个样品取一个新鲜的eppendorf管,并且将50μl三氯乙酸(30%)添加到细胞裂解物中。涡旋并且以10,000rpm离心5分钟。
6.收集上清液并且添加到等体积的Ehrlich试剂(100mg对二甲基苯甲醛,5ml乙酸)中。
7.通过对4mM犬尿氨酸溶液进行1:4稀释制备1mM犬尿氨酸溶液来制备犬尿氨酸标准品。向eppendorf管中添加10μl、20μl、30μl、50μl、80μl和100μl犬尿氨酸(1mM),并且用无菌蒸馏水将每个标准品补足至1000μl。这使得犬尿氨酸的浓度为0nM、10nM、20nM、30nM、50nM、80nM和100nM。包括空白对照。向每个标准品中添加20μl 0.1%Triton-X+蛋白酶抑制剂。
8.使用微孔板吸光度读取器读取492nm处的吸光度。
9.也可以在以上步骤4根据生产商的说明书使用HPLC或犬尿氨酸ELISA测量犬尿氨酸的产生。为了测量细胞上清液浓度,可以相应地修改以上方案,使用100μl细胞上清液代替细胞裂解物。
确定鸟氨酸脱羧酶(ODC1)酶活性的测定—多胺产生
1.每个样品沉淀5x106个细胞(如果你有足够的细胞,则沉淀另外的5x106个细胞用于无底物对照)。
2.重悬于20μl的0.1%Triton-X+蛋白酶抑制剂中(在分子实验室中在4℃将0.1%Triton-X储存于50ml管中),并且在冰上孵育20分钟,偶尔涡旋。
3.在4℃以13,000rpm离心样品20分钟,以沉淀细胞碎片。
4.取20μl细胞裂解物至新鲜的eppendorf管中并且保持在冰上。
5.根据制造商的说明书,使用HPLC或多胺ELISA测量多胺的产生。为了测量细胞上清液浓度,可以相应地修改以上方案,使用100μl细胞上清液代替细胞裂解物。
序列信息
SEQ ID NO:1(Sequence ID NO:1)-示例性ASS-1酶结构域的氨基酸序列
Figure BDA0002643121210000691
SEQ ID NO:2-示例性OTC酶结构域的氨基酸序列
Figure BDA0002643121210000692
SEQ ID NO:3-示例性GD2靶结合部分的氨基酸序列
Figure BDA0002643121210000701
SEQ ID NO:4-示例性CD33靶结合部分的氨基酸序列
Figure BDA0002643121210000702
SEQ ID NO:5-示例性间皮素靶结合部分的氨基酸序列
Figure BDA0002643121210000703
SEQ ID NO:6-示例性EGFRVIII靶结合部分的氨基酸序列
Figure BDA0002643121210000704
SEQ ID NO:7-示例性4-1BB细胞内信号传导区域的氨基酸序列
Figure BDA0002643121210000705
SEQ ID NO:8-示例性OX-40细胞内信号传导区域的氨基酸序列
Figure BDA0002643121210000706
SEQ ID NO:9-示例性CD28细胞内信号传导区域及跨膜结构域的氨基酸序列
Figure BDA0002643121210000707
SEQ ID NO:10-示例性ICOS细胞内信号传导区域的氨基酸序列
Figure BDA0002643121210000708
(ICOS的细胞质部分,包含全长蛋白的残基162-199。
基序YMFM(全长蛋白的残基180-183)特别重要并且应当保留在适用于本发明的蛋白的ICOS细胞内信号传导区域中)
SEQ ID NO:11-示例性CD3ζ细胞内信号传导区域的氨基酸序列
Figure BDA0002643121210000711
SEQ ID NO:12-本发明的示例性蛋白GD2 ASS+OTC的氨基酸序列
Figure BDA0002643121210000712
SEQ ID NO:13-本发明的示例性蛋白GD2 ASS1的氨基酸序列
Figure BDA0002643121210000721
SEQ ID NO:14-本发明的示例性蛋白GD2 OTC的氨基酸序列
Figure BDA0002643121210000722
Figure BDA0002643121210000731
SEQ ID NO:15-本发明的示例性蛋白间皮素ASS1+OTC的氨基酸序列
Figure BDA0002643121210000732
SEQ ID NO:16-本发明的示例性蛋白间皮素ASS的氨基酸序列
Figure BDA0002643121210000733
Figure BDA0002643121210000741
SEQ ID NO:17-本发明的示例性蛋白间皮素OTC的氨基酸序列
Figure BDA0002643121210000742
SEQ ID NO:18-本发明的示例性蛋白CD33 ASS+OTC的氨基酸序列
Figure BDA0002643121210000751
SEQ ID NO:19-本发明的示例性蛋白CD33 ASS1的氨基酸序列
Figure BDA0002643121210000761
SEQ ID NO:20-本发明的示例性蛋白CD33 OTC的氨基酸序列
Figure BDA0002643121210000762
SEQ ID NO:21-本发明的示例性蛋白EGFR ASS1+OTC的氨基酸序列
Figure BDA0002643121210000771
SEQ ID NO:22-本发明的示例性蛋白EGFR ASS1的氨基酸序列
Figure BDA0002643121210000781
SEQ ID NO:23-本发明的示例性蛋白EGFR OTC的氨基酸序列
Figure BDA0002643121210000782
SEQ ID NO:24-编码ASS1的DNA序列
Figure BDA0002643121210000791
SEQ ID NO:25-编码OTC的DNA序列
Figure BDA0002643121210000792
SEQ ID NO:26-编码GD2 scFv的DNA序列
Figure BDA0002643121210000793
SEQ ID NO:27-编码CD33 scFv的DNA序列
Figure BDA0002643121210000801
SEQ ID NO:28-编码间皮素scFv的DNA序列
Figure BDA0002643121210000802
SEQ ID NO:29-编码EGFRvIII scFv的DNA序列
Figure BDA0002643121210000803
SEQ ID NO:30-编码ASL的DNA序列
Figure BDA0002643121210000811
Figure BDA0002643121210000821
Figure BDA0002643121210000831
Figure BDA0002643121210000841
Figure BDA0002643121210000851
Figure BDA0002643121210000861
Figure BDA0002643121210000871
SEQ ID NO:31-编码ODC1的DNA序列
Figure BDA0002643121210000872
Figure BDA0002643121210000881
Figure BDA0002643121210000891
Figure BDA0002643121210000901
SEQ ID NO:32-编码ArgG的DNA序列
>NC_000913.3:3318637-3319980大肠杆菌(Escherichia coli)K-12株MG1655亚株,完整基因组
Figure BDA0002643121210000902
Figure BDA0002643121210000911
SEQ ID NO:33-编码ArgH的DNA序列
>Nc_000913.3:4156850-4158223大肠杆菌K-12株MG1655亚株,完整基因组
Figure BDA0002643121210000912
SEQ ID NO:34-编码ArgF的DNA序列
>Nc_000913.3:c290305-289301大肠杆菌K-12株MG1655亚株,完整基因组
Figure BDA0002643121210000913
Figure BDA0002643121210000921
SEQ ID NO:35-编码Trp5的DNA序列
>Nc_001139.9:c448535-446412酿酒酵母(Saccharomyces cerevisiae)S288c染色体VII,完整序列
Figure BDA0002643121210000922
Figure BDA0002643121210000931
SEQ ID NO:36-编码IDO的DNA序列
>NC_001139.9:c448535-446412酿酒酵母S288c染色体VII,完整序列
>NC_001139.9:c448535-446412酿酒酵母S288c染色体VII,完整序列
Figure BDA0002643121210000932
Figure BDA0002643121210000941
SEQ ID NO:37-编码示例性CAR GD2 ASS1+OTC的DNA序列,不含MP71载体
Figure BDA0002643121210000942
Figure BDA0002643121210000951
Figure BDA0002643121210000961
SEQ ID NO:38-编码GD2 ASS1的示例性CAR的DNA序列,不含MP71载体
Figure BDA0002643121210000962
Figure BDA0002643121210000971
Figure BDA0002643121210000981
SEQ ID NO:39-编码GD2 OTC的示例性CAR的DNA序列,不含MP71载体
Figure BDA0002643121210000982
Figure BDA0002643121210000991
SEQ ID NO:40-可选的CD3z
Figure BDA0002643121210001001
SEQ ID NO:41-编码可选的EGFRvIII靶结合部分的DNA(源自MR1抗体的EGFRvIIIscFv序列)
Figure BDA0002643121210001002
SEQ ID NO:42-包含ASS-1结构域的EGFRvIII(采用可选的由SEQ ID NO:41编码的EGFRvIII靶结合部分)的示例性CAR的氨基酸序列
Figure BDA0002643121210001003
Figure BDA0002643121210001011
SEQ ID NO:43-包含OTC结构域的EGFRvIII(采用可选的由SEQ ID NO:41编码的EGFRvIII靶结合部分)的示例性CAR的氨基酸序列
Figure BDA0002643121210001012
SEQ ID NO:44-包含ASS-1结构域和OTC结构域的EGFRvIII(采用可选的由SEQ IDNO:41编码的EGFRvIII靶结合部分)的示例性CAR的氨基酸序列
Figure BDA0002643121210001013
Figure BDA0002643121210001021
序列表
<110> 癌症研究科技有限公司
<120> 融合蛋白
<130> P246716WO
<140> PCT/GB2018/053771
<141> 2018-12-24
<150> GB 1721833.0
<151> 2017-12-22
<160> 44
<170> PatentIn version 3.5
<210> 1
<211> 412
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 示例性ASS-1酶结构域
<400> 1
Met Ser Ser Lys Gly Ser Val Val Leu Ala Tyr Ser Gly Gly Leu Asp
1 5 10 15
Thr Ser Cys Ile Leu Val Trp Leu Lys Glu Gln Gly Tyr Asp Val Ile
20 25 30
Ala Tyr Leu Ala Asn Ile Gly Gln Lys Glu Asp Phe Glu Glu Ala Arg
35 40 45
Lys Lys Ala Leu Lys Leu Gly Ala Lys Lys Val Phe Ile Glu Asp Val
50 55 60
Ser Arg Glu Phe Val Glu Glu Phe Ile Trp Pro Ala Ile Gln Ser Ser
65 70 75 80
Ala Leu Tyr Glu Asp Arg Tyr Leu Leu Gly Thr Ser Leu Ala Arg Pro
85 90 95
Cys Ile Ala Arg Lys Gln Val Glu Ile Ala Gln Arg Glu Gly Ala Lys
100 105 110
Tyr Val Ser His Gly Ala Thr Gly Lys Gly Asn Asp Gln Val Arg Phe
115 120 125
Glu Leu Ser Cys Tyr Ser Leu Ala Pro Gln Ile Lys Val Ile Ala Pro
130 135 140
Trp Arg Met Pro Glu Phe Tyr Asn Arg Phe Lys Gly Arg Asn Asp Leu
145 150 155 160
Met Glu Tyr Ala Lys Gln His Gly Ile Pro Ile Pro Val Thr Pro Lys
165 170 175
Asn Pro Trp Ser Met Asp Glu Asn Leu Met His Ile Ser Tyr Glu Ala
180 185 190
Gly Ile Leu Glu Asn Pro Lys Asn Gln Ala Pro Pro Gly Leu Tyr Thr
195 200 205
Lys Thr Gln Asp Pro Ala Lys Ala Pro Asn Thr Pro Asp Ile Leu Glu
210 215 220
Ile Glu Phe Lys Lys Gly Val Pro Val Lys Val Thr Asn Val Lys Asp
225 230 235 240
Gly Thr Thr His Gln Thr Ser Leu Glu Leu Phe Met Tyr Leu Asn Glu
245 250 255
Val Ala Gly Lys His Gly Val Gly Arg Ile Asp Ile Val Glu Asn Arg
260 265 270
Phe Ile Gly Met Lys Ser Arg Gly Ile Tyr Glu Thr Pro Ala Gly Thr
275 280 285
Ile Leu Tyr His Ala His Leu Asp Ile Glu Ala Phe Thr Met Asp Arg
290 295 300
Glu Val Arg Lys Ile Lys Gln Gly Leu Gly Leu Lys Phe Ala Glu Leu
305 310 315 320
Val Tyr Thr Gly Phe Trp His Ser Pro Glu Cys Glu Phe Val Arg His
325 330 335
Cys Ile Ala Lys Ser Gln Glu Arg Val Glu Gly Lys Val Gln Val Ser
340 345 350
Val Leu Lys Gly Gln Val Tyr Ile Leu Gly Arg Glu Ser Pro Leu Ser
355 360 365
Leu Tyr Asn Glu Glu Leu Val Ser Met Asn Val Gln Gly Asp Tyr Glu
370 375 380
Pro Thr Asp Ala Thr Gly Phe Ile Asn Ile Asn Ser Leu Arg Leu Lys
385 390 395 400
Glu Tyr His Arg Leu Gln Ser Lys Val Thr Ala Lys
405 410
<210> 2
<211> 354
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 示例性OTC酶结构域
<400> 2
Met Leu Phe Asn Leu Arg Ile Leu Leu Asn Asn Ala Ala Phe Arg Asn
1 5 10 15
Gly His Asn Phe Met Val Arg Asn Phe Arg Cys Gly Gln Pro Leu Gln
20 25 30
Asn Lys Val Gln Leu Lys Gly Arg Asp Leu Leu Thr Leu Lys Asn Phe
35 40 45
Thr Gly Glu Glu Ile Lys Tyr Met Leu Trp Leu Ser Ala Asp Leu Lys
50 55 60
Phe Arg Ile Lys Gln Lys Gly Glu Tyr Leu Pro Leu Leu Gln Gly Lys
65 70 75 80
Ser Leu Gly Met Ile Phe Glu Lys Arg Ser Thr Arg Thr Arg Leu Ser
85 90 95
Thr Glu Thr Gly Leu Ala Leu Leu Gly Gly His Pro Cys Phe Leu Thr
100 105 110
Thr Gln Asp Ile His Leu Gly Val Asn Glu Ser Leu Thr Asp Thr Ala
115 120 125
Arg Val Leu Ser Ser Met Ala Asp Ala Val Leu Ala Arg Val Tyr Lys
130 135 140
Gln Ser Asp Leu Asp Thr Leu Ala Lys Glu Ala Ser Ile Pro Ile Ile
145 150 155 160
Asn Gly Leu Ser Asp Leu Tyr His Pro Ile Gln Ile Leu Ala Asp Tyr
165 170 175
Leu Thr Leu Gln Glu His Tyr Ser Ser Leu Lys Gly Leu Thr Leu Ser
180 185 190
Trp Ile Gly Asp Gly Asn Asn Ile Leu His Ser Ile Met Met Ser Ala
195 200 205
Ala Lys Phe Gly Met His Leu Gln Ala Ala Thr Pro Lys Gly Tyr Glu
210 215 220
Pro Asp Ala Ser Val Thr Lys Leu Ala Glu Gln Tyr Ala Lys Glu Asn
225 230 235 240
Gly Thr Lys Leu Leu Leu Thr Asn Asp Pro Leu Glu Ala Ala His Gly
245 250 255
Gly Asn Val Leu Ile Thr Asp Thr Trp Ile Ser Met Gly Gln Glu Glu
260 265 270
Glu Lys Lys Lys Arg Leu Gln Ala Phe Gln Gly Tyr Gln Val Thr Met
275 280 285
Lys Thr Ala Lys Val Ala Ala Ser Asp Trp Thr Phe Leu His Cys Leu
290 295 300
Pro Arg Lys Pro Glu Glu Val Asp Asp Glu Val Phe Tyr Ser Pro Arg
305 310 315 320
Ser Leu Val Phe Pro Glu Ala Glu Asn Arg Lys Trp Thr Ile Met Ala
325 330 335
Val Met Val Ser Leu Leu Thr Asp Tyr Ser Pro Gln Leu Gln Lys Pro
340 345 350
Lys Phe
<210> 3
<211> 263
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 示例性GD2靶结合部分
<400> 3
Asp Ile Leu Leu Thr Gln Thr Pro Leu Ser Leu Pro Val Ser Leu Gly
1 5 10 15
Asp Gln Ala Ser Ile Ser Cys Arg Ser Ser Gln Ser Leu Val His Arg
20 25 30
Asn Gly Asn Thr Tyr Leu His Trp Tyr Leu Gln Lys Pro Gly Gln Ser
35 40 45
Pro Lys Leu Leu Ile His Lys Val Ser Asn Arg Phe Ser Gly Val Pro
50 55 60
Asp Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Lys Ile
65 70 75 80
Ser Arg Val Glu Ala Glu Asp Leu Gly Val Tyr Phe Cys Ser Gln Ser
85 90 95
Thr His Val Pro Pro Leu Thr Phe Gly Ala Gly Thr Lys Leu Glu Leu
100 105 110
Lys Arg Ala Asp Ala Ala Pro Thr Val Ser Ile Phe Pro Gly Ser Gly
115 120 125
Gly Gly Gly Ser Gly Gly Glu Val Lys Leu Gln Gln Ser Gly Pro Ser
130 135 140
Leu Val Glu Pro Gly Ala Ser Val Met Ile Ser Cys Lys Ala Ser Gly
145 150 155 160
Ser Ser Phe Thr Gly Tyr Asn Met Asn Trp Val Arg Gln Asn Ile Gly
165 170 175
Lys Ser Leu Glu Trp Ile Gly Ala Ile Asp Pro Tyr Tyr Gly Gly Thr
180 185 190
Ser Tyr Asn Gln Lys Phe Lys Gly Arg Ala Thr Leu Thr Val Asp Lys
195 200 205
Ser Ser Ser Thr Ala Tyr Met His Leu Lys Ser Leu Thr Ser Glu Asp
210 215 220
Ser Ala Val Tyr Tyr Cys Val Ser Gly Met Glu Tyr Trp Gly Gln Gly
225 230 235 240
Thr Ser Val Thr Val Ser Ser Ala Lys Thr Thr Pro Pro Ser Val Tyr
245 250 255
Gly Arg Val Thr Val Ser Ser
260
<210> 4
<211> 248
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 示例性CD33靶结合部分
<400> 4
Gly Ser Asn Ile Met Leu Thr Gln Ser Pro Ser Ser Leu Ala Val Ser
1 5 10 15
Ala Gly Glu Lys Val Thr Met Ser Cys Lys Ser Ser Gln Ser Val Phe
20 25 30
Phe Ser Ser Ser Gln Lys Asn Tyr Leu Ala Trp Tyr Gln Gln Ile Pro
35 40 45
Gly Gln Ser Pro Lys Leu Leu Ile Tyr Trp Ala Ser Thr Arg Glu Ser
50 55 60
Gly Val Pro Asp Arg Phe Thr Gly Ser Gly Ser Gly Thr Asp Phe Thr
65 70 75 80
Leu Thr Ile Ser Ser Val Gln Ser Glu Asp Leu Ala Ile Tyr Tyr Cys
85 90 95
His Gln Tyr Leu Ser Ser Arg Thr Phe Gly Gly Gly Thr Lys Leu Glu
100 105 110
Ile Lys Arg Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Ser Gly Gly
115 120 125
Gly Ser Gln Val Gln Leu Gln Gln Pro Gly Ala Glu Val Val Lys Pro
130 135 140
Gly Ala Ser Val Lys Met Ser Cys Lys Ala Ser Gly Tyr Thr Phe Thr
145 150 155 160
Ser Tyr Tyr Ile His Trp Ile Lys Gln Thr Pro Gly Gln Gly Leu Glu
165 170 175
Trp Val Gly Val Ile Tyr Pro Gly Asn Asp Asp Ile Ser Tyr Asn Gln
180 185 190
Lys Phe Lys Gly Lys Ala Thr Leu Thr Ala Asp Lys Ser Ser Thr Thr
195 200 205
Ala Tyr Met Gln Leu Ser Ser Leu Thr Ser Glu Asp Ser Ala Val Tyr
210 215 220
Tyr Cys Ala Arg Glu Val Arg Leu Arg Tyr Phe Asp Val Trp Gly Ala
225 230 235 240
Gly Thr Thr Val Thr Val Ser Ser
245
<210> 5
<211> 241
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 示例性间皮素靶结合部分
<400> 5
Met Gln Val Gln Leu Gln Gln Ser Gly Pro Glu Leu Glu Lys Pro Gly
1 5 10 15
Ala Ser Val Lys Ile Ser Cys Lys Ala Ser Gly Tyr Ser Phe Thr Gly
20 25 30
Tyr Thr Met Asn Trp Val Lys Gln Ser His Gly Lys Ser Leu Glu Trp
35 40 45
Ile Gly Leu Ile Thr Pro Tyr Asn Gly Ala Ser Ser Tyr Asn Gln Lys
50 55 60
Phe Arg Gly Lys Ala Thr Leu Thr Val Asp Lys Ser Ser Ser Thr Ala
65 70 75 80
Tyr Met Asp Leu Leu Ser Leu Thr Ser Glu Asp Ser Ala Val Tyr Phe
85 90 95
Cys Ala Arg Gly Gly Tyr Asp Gly Arg Gly Phe Asp Tyr Trp Gly Gln
100 105 110
Gly Thr Thr Val Thr Val Ser Ser Gly Val Gly Gly Ser Gly Gly Gly
115 120 125
Gly Ser Gly Gly Gly Gly Ser Asp Ile Glu Leu Thr Gln Ser Pro Ala
130 135 140
Ile Met Ser Ala Ser Pro Gly Glu Lys Val Thr Met Thr Cys Ser Ala
145 150 155 160
Ser Ser Ser Val Ser Tyr Met His Trp Tyr Gln Gln Lys Ser Gly Thr
165 170 175
Ser Pro Lys Arg Trp Ile Tyr Asp Thr Ser Lys Leu Ala Ser Gly Val
180 185 190
Pro Gly Arg Phe Ser Gly Ser Gly Ser Gly Asn Ser Tyr Ser Leu Thr
195 200 205
Ile Ser Ser Val Glu Ala Glu Asp Asp Ala Thr Tyr Tyr Cys Gln Gln
210 215 220
Trp Ser Gly Tyr Pro Leu Thr Phe Gly Ala Gly Thr Lys Leu Glu Ile
225 230 235 240
Lys
<210> 6
<211> 221
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 示例性EGFRVIII靶结合部分
<400> 6
Gln Val Gln Leu Gln Gln Ser Gly Gly Gly Leu Val Lys Pro Gly Ala
1 5 10 15
Ser Leu Lys Leu Ser Cys Val Thr Ser Gly Phe Thr Phe Arg Lys Phe
20 25 30
Gly Met Ser Trp Val Arg Gln Thr Ser Asp Lys Arg Leu Glu Trp Val
35 40 45
Ala Ser Ile Ser Thr Gly Gly Tyr Asn Thr Tyr Tyr Ser Asp Asn Val
50 55 60
Lys Gly Arg Phe Thr Ile Ser Arg Glu Asn Ala Lys Asn Thr Leu Tyr
65 70 75 80
Leu Gln Met Ser Ser Leu Lys Ser Glu Asp Thr Ala Leu Tyr Tyr Cys
85 90 95
Thr Arg Gly Tyr Ser Ser Thr Ser Tyr Ala Met Asp Tyr Trp Gly Gln
100 105 110
Gly Thr Thr Val Thr Val Ser Ser Ser Gly Gly Gly Ser Gly Gly Gly
115 120 125
Gly Ser Gly Gly Gly Gly Ser Asp Ile Glu Leu Thr Gln Ser Pro Ala
130 135 140
Ser Leu Ser Val Ala Thr Gly Glu Lys Val Thr Ile Arg Cys Met Thr
145 150 155 160
Ser Thr Asp Ile Asp Asp Asp Met Asn Trp Tyr Gln Gln Lys Pro Gly
165 170 175
Glu Pro Pro Lys Phe Leu Ile Ser Glu Gly Asn Thr Leu Arg Pro Gly
180 185 190
Val Pro Ser Arg Phe Ser Ser Ser Gly Thr Gly Thr Asp Phe Val Phe
195 200 205
Thr Ile Glu Asn Thr Leu Ser Glu Asp Val Gly Asp Tyr
210 215 220
<210> 7
<211> 42
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 示例性4-1BB细胞内信号传导区域
<400> 7
Lys Arg Gly Arg Lys Lys Leu Leu Tyr Ile Phe Lys Gln Pro Phe Met
1 5 10 15
Arg Pro Val Gln Thr Thr Gln Glu Glu Asp Gly Cys Ser Cys Arg Phe
20 25 30
Pro Glu Glu Glu Glu Gly Gly Cys Glu Leu
35 40
<210> 8
<211> 36
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 示例性OX-40细胞内信号传导区域
<400> 8
Arg Asp Gln Arg Leu Pro Pro Asp Ala His Lys Pro Pro Gly Gly Gly
1 5 10 15
Ser Phe Arg Thr Pro Ile Gln Glu Glu Gln Ala Asp Ala His Ser Thr
20 25 30
Leu Ala Lys Ile
35
<210> 9
<211> 107
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 示例性的CD28细胞内信号传导区域及跨膜结构域
<400> 9
Ile Glu Val Met Tyr Pro Pro Pro Tyr Leu Asp Asn Glu Lys Ser Asn
1 5 10 15
Gly Thr Ile Ile His Val Lys Gly Lys His Leu Cys Pro Ser Pro Leu
20 25 30
Phe Pro Gly Pro Ser Lys Pro Phe Trp Val Leu Val Val Val Gly Gly
35 40 45
Val Leu Ala Cys Tyr Ser Leu Leu Val Thr Val Ala Phe Ile Ile Phe
50 55 60
Trp Val Arg Ser Lys Arg Ser Arg Leu Leu His Ser Asp Tyr Met Asn
65 70 75 80
Met Thr Pro Arg Arg Pro Gly Pro Thr Arg Lys His Tyr Gln Pro Tyr
85 90 95
Ala Pro Pro Arg Asp Phe Ala Ala Tyr Arg Ser
100 105
<210> 10
<211> 38
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 示例性ICOS细胞内信号传导区域
<400> 10
Cys Trp Leu Thr Lys Lys Lys Tyr Ser Ser Ser Val His Asp Pro Asn
1 5 10 15
Gly Glu Tyr Met Phe Met Arg Ala Val Asn Thr Ala Lys Lys Ser Arg
20 25 30
Leu Thr Asp Val Thr Leu
35
<210> 11
<211> 112
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 示例性CD3 ζ细胞内信号传导区域
<400> 11
Arg Val Lys Phe Ser Arg Ser Ala Asp Ala Pro Ala Tyr Lys Gln Gly
1 5 10 15
Gln Asn Gln Leu Tyr Asn Glu Leu Asn Leu Gly Arg Arg Glu Glu Tyr
20 25 30
Asp Val Leu Asp Lys Arg Arg Gly Arg Asp Pro Glu Met Gly Gly Lys
35 40 45
Pro Arg Arg Lys Asn Pro Gln Glu Gly Leu Tyr Asn Glu Leu Gln Lys
50 55 60
Asp Lys Met Ala Glu Ala Tyr Ser Glu Ile Gly Met Lys Gly Glu Arg
65 70 75 80
Arg Arg Gly Lys Gly His Asp Gly Leu Tyr Gln Gly Leu Ser Thr Ala
85 90 95
Thr Lys Asp Thr Tyr Asp Ala Leu His Met Gln Ala Leu Pro Pro Arg
100 105 110
<210> 12
<211> 1896
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 本发明的示例性蛋白GD2 ASS+OTC
<400> 12
Met Pro Arg Gly Trp Thr Ala Leu Cys Leu Leu Ser Leu Leu Pro Ser
1 5 10 15
Gly Phe Met Ser Leu Asp Asn Asn Gly Thr Ala Thr Pro Glu Leu Pro
20 25 30
Thr Gln Gly Thr Phe Ser Asn Val Ser Thr Asn Val Ser Tyr Gln Glu
35 40 45
Thr Thr Thr Pro Ser Thr Leu Gly Ser Thr Ser Leu His Pro Val Ser
50 55 60
Gln His Gly Asn Glu Ala Thr Thr Asn Ile Thr Glu Thr Thr Val Lys
65 70 75 80
Phe Thr Ser Thr Ser Val Ile Thr Ser Val Tyr Gly Asn Thr Asn Ser
85 90 95
Ser Val Gln Ser Gln Thr Ser Val Ile Ser Thr Val Phe Thr Thr Pro
100 105 110
Ala Asn Val Ser Thr Pro Glu Thr Thr Leu Lys Pro Ser Leu Ser Pro
115 120 125
Gly Asn Val Ser Asp Leu Ser Thr Thr Ser Thr Ser Leu Ala Thr Ser
130 135 140
Pro Thr Lys Pro Tyr Thr Ser Ser Ser Pro Ile Leu Ser Asp Ile Lys
145 150 155 160
Ala Glu Ile Lys Cys Ser Gly Ile Arg Glu Val Lys Leu Thr Gln Gly
165 170 175
Ile Cys Leu Glu Gln Asn Lys Thr Ser Ser Cys Ala Glu Phe Lys Lys
180 185 190
Asp Arg Gly Glu Gly Leu Ala Arg Val Leu Cys Gly Glu Glu Gln Ala
195 200 205
Asp Ala Asp Ala Gly Ala Gln Val Cys Ser Leu Leu Leu Ala Gln Ser
210 215 220
Glu Val Arg Pro Gln Cys Leu Leu Leu Val Leu Ala Asn Arg Thr Glu
225 230 235 240
Ile Ser Ser Lys Leu Gln Leu Met Lys Lys His Gln Ser Asp Leu Lys
245 250 255
Lys Leu Gly Ile Leu Asp Phe Thr Glu Gln Asp Val Ala Ser His Gln
260 265 270
Ser Tyr Ser Gln Lys Thr Leu Ile Ala Leu Val Thr Ser Gly Ala Leu
275 280 285
Leu Ala Val Leu Gly Ile Thr Gly Tyr Phe Leu Met Asn Arg Arg Ser
290 295 300
Trp Ser Pro Thr Gly Glu Arg Leu Glu Leu Glu Pro Val Asp Arg Val
305 310 315 320
Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu
325 330 335
Ser Asn Pro Gly Pro Gly Asn Met Ala Leu Pro Val Thr Ala Leu Leu
340 345 350
Leu Pro Leu Ala Leu Leu Leu His Ala Ala Arg Pro Asp Ile Leu Leu
355 360 365
Thr Gln Thr Pro Leu Ser Leu Pro Val Ser Leu Gly Asp Gln Ala Ser
370 375 380
Ile Ser Cys Arg Ser Ser Gln Ser Leu Val His Arg Asn Gly Asn Thr
385 390 395 400
Tyr Leu His Trp Tyr Leu Gln Lys Pro Gly Gln Ser Pro Lys Leu Leu
405 410 415
Ile His Lys Val Ser Asn Arg Phe Ser Gly Val Pro Asp Arg Phe Ser
420 425 430
Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Lys Ile Ser Arg Val Glu
435 440 445
Ala Glu Asp Leu Gly Val Tyr Phe Cys Ser Gln Ser Thr His Val Pro
450 455 460
Pro Leu Thr Phe Gly Ala Gly Thr Lys Leu Glu Leu Lys Arg Ala Asp
465 470 475 480
Ala Ala Pro Thr Val Ser Ile Phe Pro Gly Ser Gly Gly Gly Gly Ser
485 490 495
Gly Gly Glu Val Lys Leu Gln Gln Ser Gly Pro Ser Leu Val Glu Pro
500 505 510
Gly Ala Ser Val Met Ile Ser Cys Lys Ala Ser Gly Ser Ser Phe Thr
515 520 525
Gly Tyr Asn Met Asn Trp Val Arg Gln Asn Ile Gly Lys Ser Leu Glu
530 535 540
Trp Ile Gly Ala Ile Asp Pro Tyr Tyr Gly Gly Thr Ser Tyr Asn Gln
545 550 555 560
Lys Phe Lys Gly Arg Ala Thr Leu Thr Val Asp Lys Ser Ser Ser Thr
565 570 575
Ala Tyr Met His Leu Lys Ser Leu Thr Ser Glu Asp Ser Ala Val Tyr
580 585 590
Tyr Cys Val Ser Gly Met Glu Tyr Trp Gly Gln Gly Thr Ser Val Thr
595 600 605
Val Ser Ser Ala Lys Thr Thr Pro Pro Ser Val Tyr Gly Arg Val Thr
610 615 620
Val Ser Ser Ala Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro
625 630 635 640
Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe
645 650 655
Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val
660 665 670
Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe
675 680 685
Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro
690 695 700
Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr
705 710 715 720
Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val
725 730 735
Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala
740 745 750
Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg
755 760 765
Asp Glu Leu Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly
770 775 780
Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro
785 790 795 800
Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser
805 810 815
Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln
820 825 830
Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His
835 840 845
Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys Lys Asp Pro Lys
850 855 860
Thr Thr Thr Pro Ala Pro Arg Pro Pro Thr Pro Ala Pro Thr Ile Ala
865 870 875 880
Ser Gln Pro Leu Ser Leu Arg Pro Glu Ala Cys Arg Pro Ala Ala Gly
885 890 895
Gly Ala Val His Thr Arg Gly Leu Asp Phe Ala Cys Asp Ile Tyr Ile
900 905 910
Trp Ala Pro Leu Ala Gly Thr Cys Gly Val Leu Leu Leu Ser Leu Val
915 920 925
Ile Thr Leu Tyr Cys Lys Arg Gly Arg Lys Lys Leu Leu Tyr Ile Phe
930 935 940
Lys Gln Pro Phe Met Arg Pro Val Gln Thr Thr Gln Glu Glu Asp Gly
945 950 955 960
Cys Ser Cys Arg Phe Pro Glu Glu Glu Glu Gly Gly Cys Glu Leu Arg
965 970 975
Val Lys Phe Ser Arg Ser Ala Asp Ala Pro Ala Tyr Lys Gln Gly Gln
980 985 990
Asn Gln Leu Tyr Asn Glu Leu Asn Leu Gly Arg Arg Glu Glu Tyr Asp
995 1000 1005
Val Leu Asp Lys Arg Arg Gly Arg Asp Pro Glu Met Gly Gly Lys
1010 1015 1020
Pro Arg Arg Lys Asn Pro Gln Glu Gly Leu Tyr Asn Glu Leu Gln
1025 1030 1035
Lys Asp Lys Met Ala Glu Ala Tyr Ser Glu Ile Gly Met Lys Gly
1040 1045 1050
Glu Arg Arg Arg Gly Lys Gly His Asp Gly Leu Tyr Gln Gly Leu
1055 1060 1065
Ser Thr Ala Thr Lys Asp Thr Tyr Asp Ala Leu His Met Gln Ala
1070 1075 1080
Leu Pro Pro Arg Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys
1085 1090 1095
Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Met Ser Ser Lys
1100 1105 1110
Gly Ser Val Val Leu Ala Tyr Ser Gly Gly Leu Asp Thr Ser Cys
1115 1120 1125
Ile Leu Val Trp Leu Lys Glu Gln Gly Tyr Asp Val Ile Ala Tyr
1130 1135 1140
Leu Ala Asn Ile Gly Gln Lys Glu Asp Phe Glu Glu Ala Arg Lys
1145 1150 1155
Lys Ala Leu Lys Leu Gly Ala Lys Lys Val Phe Ile Glu Asp Val
1160 1165 1170
Ser Arg Glu Phe Val Glu Glu Phe Ile Trp Pro Ala Ile Gln Ser
1175 1180 1185
Ser Ala Leu Tyr Glu Asp Arg Tyr Leu Leu Gly Thr Ser Leu Ala
1190 1195 1200
Arg Pro Cys Ile Ala Arg Lys Gln Val Glu Ile Ala Gln Arg Glu
1205 1210 1215
Gly Ala Lys Tyr Val Ser His Gly Ala Thr Gly Lys Gly Asn Asp
1220 1225 1230
Gln Val Arg Phe Glu Leu Ser Cys Tyr Ser Leu Ala Pro Gln Ile
1235 1240 1245
Lys Val Ile Ala Pro Trp Arg Met Pro Glu Phe Tyr Asn Arg Phe
1250 1255 1260
Lys Gly Arg Asn Asp Leu Met Glu Tyr Ala Lys Gln His Gly Ile
1265 1270 1275
Pro Ile Pro Val Thr Pro Lys Asn Pro Trp Ser Met Asp Glu Asn
1280 1285 1290
Leu Met His Ile Ser Tyr Glu Ala Gly Ile Leu Glu Asn Pro Lys
1295 1300 1305
Asn Gln Ala Pro Pro Gly Leu Tyr Thr Lys Thr Gln Asp Pro Ala
1310 1315 1320
Lys Ala Pro Asn Thr Pro Asp Ile Leu Glu Ile Glu Phe Lys Lys
1325 1330 1335
Gly Val Pro Val Lys Val Thr Asn Val Lys Asp Gly Thr Thr His
1340 1345 1350
Gln Thr Ser Leu Glu Leu Phe Met Tyr Leu Asn Glu Val Ala Gly
1355 1360 1365
Lys His Gly Val Gly Arg Ile Asp Ile Val Glu Asn Arg Phe Ile
1370 1375 1380
Gly Met Lys Ser Arg Gly Ile Tyr Glu Thr Pro Ala Gly Thr Ile
1385 1390 1395
Leu Tyr His Ala His Leu Asp Ile Glu Ala Phe Thr Met Asp Arg
1400 1405 1410
Glu Val Arg Lys Ile Lys Gln Gly Leu Gly Leu Lys Phe Ala Glu
1415 1420 1425
Leu Val Tyr Thr Gly Phe Trp His Ser Pro Glu Cys Glu Phe Val
1430 1435 1440
Arg His Cys Ile Ala Lys Ser Gln Glu Arg Val Glu Gly Lys Val
1445 1450 1455
Gln Val Ser Val Leu Lys Gly Gln Val Tyr Ile Leu Gly Arg Glu
1460 1465 1470
Ser Pro Leu Ser Leu Tyr Asn Glu Glu Leu Val Ser Met Asn Val
1475 1480 1485
Gln Gly Asp Tyr Glu Pro Thr Asp Ala Thr Gly Phe Ile Asn Ile
1490 1495 1500
Asn Ser Leu Arg Leu Lys Glu Tyr His Arg Leu Gln Ser Lys Val
1505 1510 1515
Thr Ala Lys Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys
1520 1525 1530
Gly Asp Val Glu Glu Asn Pro Gly Pro Met Leu Phe Asn Leu Arg
1535 1540 1545
Ile Leu Leu Asn Asn Ala Ala Phe Arg Asn Gly His Asn Phe Met
1550 1555 1560
Val Arg Asn Phe Arg Cys Gly Gln Pro Leu Gln Asn Lys Val Gln
1565 1570 1575
Leu Lys Gly Arg Asp Leu Leu Thr Leu Lys Asn Phe Thr Gly Glu
1580 1585 1590
Glu Ile Lys Tyr Met Leu Trp Leu Ser Ala Asp Leu Lys Phe Arg
1595 1600 1605
Ile Lys Gln Lys Gly Glu Tyr Leu Pro Leu Leu Gln Gly Lys Ser
1610 1615 1620
Leu Gly Met Ile Phe Glu Lys Arg Ser Thr Arg Thr Arg Leu Ser
1625 1630 1635
Thr Glu Thr Gly Leu Ala Leu Leu Gly Gly His Pro Cys Phe Leu
1640 1645 1650
Thr Thr Gln Asp Ile His Leu Gly Val Asn Glu Ser Leu Thr Asp
1655 1660 1665
Thr Ala Arg Val Leu Ser Ser Met Ala Asp Ala Val Leu Ala Arg
1670 1675 1680
Val Tyr Lys Gln Ser Asp Leu Asp Thr Leu Ala Lys Glu Ala Ser
1685 1690 1695
Ile Pro Ile Ile Asn Gly Leu Ser Asp Leu Tyr His Pro Ile Gln
1700 1705 1710
Ile Leu Ala Asp Tyr Leu Thr Leu Gln Glu His Tyr Ser Ser Leu
1715 1720 1725
Lys Gly Leu Thr Leu Ser Trp Ile Gly Asp Gly Asn Asn Ile Leu
1730 1735 1740
His Ser Ile Met Met Ser Ala Ala Lys Phe Gly Met His Leu Gln
1745 1750 1755
Ala Ala Thr Pro Lys Gly Tyr Glu Pro Asp Ala Ser Val Thr Lys
1760 1765 1770
Leu Ala Glu Gln Tyr Ala Lys Glu Asn Gly Thr Lys Leu Leu Leu
1775 1780 1785
Thr Asn Asp Pro Leu Glu Ala Ala His Gly Gly Asn Val Leu Ile
1790 1795 1800
Thr Asp Thr Trp Ile Ser Met Gly Gln Glu Glu Glu Lys Lys Lys
1805 1810 1815
Arg Leu Gln Ala Phe Gln Gly Tyr Gln Val Thr Met Lys Thr Ala
1820 1825 1830
Lys Val Ala Ala Ser Asp Trp Thr Phe Leu His Cys Leu Pro Arg
1835 1840 1845
Lys Pro Glu Glu Val Asp Asp Glu Val Phe Tyr Ser Pro Arg Ser
1850 1855 1860
Leu Val Phe Pro Glu Ala Glu Asn Arg Lys Trp Thr Ile Met Ala
1865 1870 1875
Val Met Val Ser Leu Leu Thr Asp Tyr Ser Pro Gln Leu Gln Lys
1880 1885 1890
Pro Lys Phe
1895
<210> 13
<211> 1521
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 本发明的示例性蛋白GD2 ASS1
<400> 13
Met Pro Arg Gly Trp Thr Ala Leu Cys Leu Leu Ser Leu Leu Pro Ser
1 5 10 15
Gly Phe Met Ser Leu Asp Asn Asn Gly Thr Ala Thr Pro Glu Leu Pro
20 25 30
Thr Gln Gly Thr Phe Ser Asn Val Ser Thr Asn Val Ser Tyr Gln Glu
35 40 45
Thr Thr Thr Pro Ser Thr Leu Gly Ser Thr Ser Leu His Pro Val Ser
50 55 60
Gln His Gly Asn Glu Ala Thr Thr Asn Ile Thr Glu Thr Thr Val Lys
65 70 75 80
Phe Thr Ser Thr Ser Val Ile Thr Ser Val Tyr Gly Asn Thr Asn Ser
85 90 95
Ser Val Gln Ser Gln Thr Ser Val Ile Ser Thr Val Phe Thr Thr Pro
100 105 110
Ala Asn Val Ser Thr Pro Glu Thr Thr Leu Lys Pro Ser Leu Ser Pro
115 120 125
Gly Asn Val Ser Asp Leu Ser Thr Thr Ser Thr Ser Leu Ala Thr Ser
130 135 140
Pro Thr Lys Pro Tyr Thr Ser Ser Ser Pro Ile Leu Ser Asp Ile Lys
145 150 155 160
Ala Glu Ile Lys Cys Ser Gly Ile Arg Glu Val Lys Leu Thr Gln Gly
165 170 175
Ile Cys Leu Glu Gln Asn Lys Thr Ser Ser Cys Ala Glu Phe Lys Lys
180 185 190
Asp Arg Gly Glu Gly Leu Ala Arg Val Leu Cys Gly Glu Glu Gln Ala
195 200 205
Asp Ala Asp Ala Gly Ala Gln Val Cys Ser Leu Leu Leu Ala Gln Ser
210 215 220
Glu Val Arg Pro Gln Cys Leu Leu Leu Val Leu Ala Asn Arg Thr Glu
225 230 235 240
Ile Ser Ser Lys Leu Gln Leu Met Lys Lys His Gln Ser Asp Leu Lys
245 250 255
Lys Leu Gly Ile Leu Asp Phe Thr Glu Gln Asp Val Ala Ser His Gln
260 265 270
Ser Tyr Ser Gln Lys Thr Leu Ile Ala Leu Val Thr Ser Gly Ala Leu
275 280 285
Leu Ala Val Leu Gly Ile Thr Gly Tyr Phe Leu Met Asn Arg Arg Ser
290 295 300
Trp Ser Pro Thr Gly Glu Arg Leu Glu Leu Glu Pro Val Asp Arg Val
305 310 315 320
Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu
325 330 335
Ser Asn Pro Gly Pro Gly Asn Met Ala Leu Pro Val Thr Ala Leu Leu
340 345 350
Leu Pro Leu Ala Leu Leu Leu His Ala Ala Arg Pro Asp Ile Leu Leu
355 360 365
Thr Gln Thr Pro Leu Ser Leu Pro Val Ser Leu Gly Asp Gln Ala Ser
370 375 380
Ile Ser Cys Arg Ser Ser Gln Ser Leu Val His Arg Asn Gly Asn Thr
385 390 395 400
Tyr Leu His Trp Tyr Leu Gln Lys Pro Gly Gln Ser Pro Lys Leu Leu
405 410 415
Ile His Lys Val Ser Asn Arg Phe Ser Gly Val Pro Asp Arg Phe Ser
420 425 430
Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Lys Ile Ser Arg Val Glu
435 440 445
Ala Glu Asp Leu Gly Val Tyr Phe Cys Ser Gln Ser Thr His Val Pro
450 455 460
Pro Leu Thr Phe Gly Ala Gly Thr Lys Leu Glu Leu Lys Arg Ala Asp
465 470 475 480
Ala Ala Pro Thr Val Ser Ile Phe Pro Gly Ser Gly Gly Gly Gly Ser
485 490 495
Gly Gly Glu Val Lys Leu Gln Gln Ser Gly Pro Ser Leu Val Glu Pro
500 505 510
Gly Ala Ser Val Met Ile Ser Cys Lys Ala Ser Gly Ser Ser Phe Thr
515 520 525
Gly Tyr Asn Met Asn Trp Val Arg Gln Asn Ile Gly Lys Ser Leu Glu
530 535 540
Trp Ile Gly Ala Ile Asp Pro Tyr Tyr Gly Gly Thr Ser Tyr Asn Gln
545 550 555 560
Lys Phe Lys Gly Arg Ala Thr Leu Thr Val Asp Lys Ser Ser Ser Thr
565 570 575
Ala Tyr Met His Leu Lys Ser Leu Thr Ser Glu Asp Ser Ala Val Tyr
580 585 590
Tyr Cys Val Ser Gly Met Glu Tyr Trp Gly Gln Gly Thr Ser Val Thr
595 600 605
Val Ser Ser Ala Lys Thr Thr Pro Pro Ser Val Tyr Gly Arg Val Thr
610 615 620
Val Ser Ser Ala Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro
625 630 635 640
Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe
645 650 655
Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val
660 665 670
Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe
675 680 685
Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro
690 695 700
Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr
705 710 715 720
Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val
725 730 735
Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala
740 745 750
Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg
755 760 765
Asp Glu Leu Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly
770 775 780
Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro
785 790 795 800
Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser
805 810 815
Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln
820 825 830
Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His
835 840 845
Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys Lys Asp Pro Lys
850 855 860
Thr Thr Thr Pro Ala Pro Arg Pro Pro Thr Pro Ala Pro Thr Ile Ala
865 870 875 880
Ser Gln Pro Leu Ser Leu Arg Pro Glu Ala Cys Arg Pro Ala Ala Gly
885 890 895
Gly Ala Val His Thr Arg Gly Leu Asp Phe Ala Cys Asp Ile Tyr Ile
900 905 910
Trp Ala Pro Leu Ala Gly Thr Cys Gly Val Leu Leu Leu Ser Leu Val
915 920 925
Ile Thr Leu Tyr Cys Lys Arg Gly Arg Lys Lys Leu Leu Tyr Ile Phe
930 935 940
Lys Gln Pro Phe Met Arg Pro Val Gln Thr Thr Gln Glu Glu Asp Gly
945 950 955 960
Cys Ser Cys Arg Phe Pro Glu Glu Glu Glu Gly Gly Cys Glu Leu Arg
965 970 975
Val Lys Phe Ser Arg Ser Ala Asp Ala Pro Ala Tyr Lys Gln Gly Gln
980 985 990
Asn Gln Leu Tyr Asn Glu Leu Asn Leu Gly Arg Arg Glu Glu Tyr Asp
995 1000 1005
Val Leu Asp Lys Arg Arg Gly Arg Asp Pro Glu Met Gly Gly Lys
1010 1015 1020
Pro Arg Arg Lys Asn Pro Gln Glu Gly Leu Tyr Asn Glu Leu Gln
1025 1030 1035
Lys Asp Lys Met Ala Glu Ala Tyr Ser Glu Ile Gly Met Lys Gly
1040 1045 1050
Glu Arg Arg Arg Gly Lys Gly His Asp Gly Leu Tyr Gln Gly Leu
1055 1060 1065
Ser Thr Ala Thr Lys Asp Thr Tyr Asp Ala Leu His Met Gln Ala
1070 1075 1080
Leu Pro Pro Arg Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys
1085 1090 1095
Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Met Ser Ser Lys
1100 1105 1110
Gly Ser Val Val Leu Ala Tyr Ser Gly Gly Leu Asp Thr Ser Cys
1115 1120 1125
Ile Leu Val Trp Leu Lys Glu Gln Gly Tyr Asp Val Ile Ala Tyr
1130 1135 1140
Leu Ala Asn Ile Gly Gln Lys Glu Asp Phe Glu Glu Ala Arg Lys
1145 1150 1155
Lys Ala Leu Lys Leu Gly Ala Lys Lys Val Phe Ile Glu Asp Val
1160 1165 1170
Ser Arg Glu Phe Val Glu Glu Phe Ile Trp Pro Ala Ile Gln Ser
1175 1180 1185
Ser Ala Leu Tyr Glu Asp Arg Tyr Leu Leu Gly Thr Ser Leu Ala
1190 1195 1200
Arg Pro Cys Ile Ala Arg Lys Gln Val Glu Ile Ala Gln Arg Glu
1205 1210 1215
Gly Ala Lys Tyr Val Ser His Gly Ala Thr Gly Lys Gly Asn Asp
1220 1225 1230
Gln Val Arg Phe Glu Leu Ser Cys Tyr Ser Leu Ala Pro Gln Ile
1235 1240 1245
Lys Val Ile Ala Pro Trp Arg Met Pro Glu Phe Tyr Asn Arg Phe
1250 1255 1260
Lys Gly Arg Asn Asp Leu Met Glu Tyr Ala Lys Gln His Gly Ile
1265 1270 1275
Pro Ile Pro Val Thr Pro Lys Asn Pro Trp Ser Met Asp Glu Asn
1280 1285 1290
Leu Met His Ile Ser Tyr Glu Ala Gly Ile Leu Glu Asn Pro Lys
1295 1300 1305
Asn Gln Ala Pro Pro Gly Leu Tyr Thr Lys Thr Gln Asp Pro Ala
1310 1315 1320
Lys Ala Pro Asn Thr Pro Asp Ile Leu Glu Ile Glu Phe Lys Lys
1325 1330 1335
Gly Val Pro Val Lys Val Thr Asn Val Lys Asp Gly Thr Thr His
1340 1345 1350
Gln Thr Ser Leu Glu Leu Phe Met Tyr Leu Asn Glu Val Ala Gly
1355 1360 1365
Lys His Gly Val Gly Arg Ile Asp Ile Val Glu Asn Arg Phe Ile
1370 1375 1380
Gly Met Lys Ser Arg Gly Ile Tyr Glu Thr Pro Ala Gly Thr Ile
1385 1390 1395
Leu Tyr His Ala His Leu Asp Ile Glu Ala Phe Thr Met Asp Arg
1400 1405 1410
Glu Val Arg Lys Ile Lys Gln Gly Leu Gly Leu Lys Phe Ala Glu
1415 1420 1425
Leu Val Tyr Thr Gly Phe Trp His Ser Pro Glu Cys Glu Phe Val
1430 1435 1440
Arg His Cys Ile Ala Lys Ser Gln Glu Arg Val Glu Gly Lys Val
1445 1450 1455
Gln Val Ser Val Leu Lys Gly Gln Val Tyr Ile Leu Gly Arg Glu
1460 1465 1470
Ser Pro Leu Ser Leu Tyr Asn Glu Glu Leu Val Ser Met Asn Val
1475 1480 1485
Gln Gly Asp Tyr Glu Pro Thr Asp Ala Thr Gly Phe Ile Asn Ile
1490 1495 1500
Asn Ser Leu Arg Leu Lys Glu Tyr His Arg Leu Gln Ser Lys Val
1505 1510 1515
Thr Ala Lys
1520
<210> 14
<211> 1463
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 本发明的示例性蛋白GD2 OTC
<400> 14
Met Pro Arg Gly Trp Thr Ala Leu Cys Leu Leu Ser Leu Leu Pro Ser
1 5 10 15
Gly Phe Met Ser Leu Asp Asn Asn Gly Thr Ala Thr Pro Glu Leu Pro
20 25 30
Thr Gln Gly Thr Phe Ser Asn Val Ser Thr Asn Val Ser Tyr Gln Glu
35 40 45
Thr Thr Thr Pro Ser Thr Leu Gly Ser Thr Ser Leu His Pro Val Ser
50 55 60
Gln His Gly Asn Glu Ala Thr Thr Asn Ile Thr Glu Thr Thr Val Lys
65 70 75 80
Phe Thr Ser Thr Ser Val Ile Thr Ser Val Tyr Gly Asn Thr Asn Ser
85 90 95
Ser Val Gln Ser Gln Thr Ser Val Ile Ser Thr Val Phe Thr Thr Pro
100 105 110
Ala Asn Val Ser Thr Pro Glu Thr Thr Leu Lys Pro Ser Leu Ser Pro
115 120 125
Gly Asn Val Ser Asp Leu Ser Thr Thr Ser Thr Ser Leu Ala Thr Ser
130 135 140
Pro Thr Lys Pro Tyr Thr Ser Ser Ser Pro Ile Leu Ser Asp Ile Lys
145 150 155 160
Ala Glu Ile Lys Cys Ser Gly Ile Arg Glu Val Lys Leu Thr Gln Gly
165 170 175
Ile Cys Leu Glu Gln Asn Lys Thr Ser Ser Cys Ala Glu Phe Lys Lys
180 185 190
Asp Arg Gly Glu Gly Leu Ala Arg Val Leu Cys Gly Glu Glu Gln Ala
195 200 205
Asp Ala Asp Ala Gly Ala Gln Val Cys Ser Leu Leu Leu Ala Gln Ser
210 215 220
Glu Val Arg Pro Gln Cys Leu Leu Leu Val Leu Ala Asn Arg Thr Glu
225 230 235 240
Ile Ser Ser Lys Leu Gln Leu Met Lys Lys His Gln Ser Asp Leu Lys
245 250 255
Lys Leu Gly Ile Leu Asp Phe Thr Glu Gln Asp Val Ala Ser His Gln
260 265 270
Ser Tyr Ser Gln Lys Thr Leu Ile Ala Leu Val Thr Ser Gly Ala Leu
275 280 285
Leu Ala Val Leu Gly Ile Thr Gly Tyr Phe Leu Met Asn Arg Arg Ser
290 295 300
Trp Ser Pro Thr Gly Glu Arg Leu Glu Leu Glu Pro Val Asp Arg Val
305 310 315 320
Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu
325 330 335
Ser Asn Pro Gly Pro Gly Asn Met Ala Leu Pro Val Thr Ala Leu Leu
340 345 350
Leu Pro Leu Ala Leu Leu Leu His Ala Ala Arg Pro Asp Ile Leu Leu
355 360 365
Thr Gln Thr Pro Leu Ser Leu Pro Val Ser Leu Gly Asp Gln Ala Ser
370 375 380
Ile Ser Cys Arg Ser Ser Gln Ser Leu Val His Arg Asn Gly Asn Thr
385 390 395 400
Tyr Leu His Trp Tyr Leu Gln Lys Pro Gly Gln Ser Pro Lys Leu Leu
405 410 415
Ile His Lys Val Ser Asn Arg Phe Ser Gly Val Pro Asp Arg Phe Ser
420 425 430
Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Lys Ile Ser Arg Val Glu
435 440 445
Ala Glu Asp Leu Gly Val Tyr Phe Cys Ser Gln Ser Thr His Val Pro
450 455 460
Pro Leu Thr Phe Gly Ala Gly Thr Lys Leu Glu Leu Lys Arg Ala Asp
465 470 475 480
Ala Ala Pro Thr Val Ser Ile Phe Pro Gly Ser Gly Gly Gly Gly Ser
485 490 495
Gly Gly Glu Val Lys Leu Gln Gln Ser Gly Pro Ser Leu Val Glu Pro
500 505 510
Gly Ala Ser Val Met Ile Ser Cys Lys Ala Ser Gly Ser Ser Phe Thr
515 520 525
Gly Tyr Asn Met Asn Trp Val Arg Gln Asn Ile Gly Lys Ser Leu Glu
530 535 540
Trp Ile Gly Ala Ile Asp Pro Tyr Tyr Gly Gly Thr Ser Tyr Asn Gln
545 550 555 560
Lys Phe Lys Gly Arg Ala Thr Leu Thr Val Asp Lys Ser Ser Ser Thr
565 570 575
Ala Tyr Met His Leu Lys Ser Leu Thr Ser Glu Asp Ser Ala Val Tyr
580 585 590
Tyr Cys Val Ser Gly Met Glu Tyr Trp Gly Gln Gly Thr Ser Val Thr
595 600 605
Val Ser Ser Ala Lys Thr Thr Pro Pro Ser Val Tyr Gly Arg Val Thr
610 615 620
Val Ser Ser Ala Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro
625 630 635 640
Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe
645 650 655
Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val
660 665 670
Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe
675 680 685
Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro
690 695 700
Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr
705 710 715 720
Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val
725 730 735
Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala
740 745 750
Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg
755 760 765
Asp Glu Leu Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly
770 775 780
Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro
785 790 795 800
Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser
805 810 815
Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln
820 825 830
Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His
835 840 845
Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys Lys Asp Pro Lys
850 855 860
Thr Thr Thr Pro Ala Pro Arg Pro Pro Thr Pro Ala Pro Thr Ile Ala
865 870 875 880
Ser Gln Pro Leu Ser Leu Arg Pro Glu Ala Cys Arg Pro Ala Ala Gly
885 890 895
Gly Ala Val His Thr Arg Gly Leu Asp Phe Ala Cys Asp Ile Tyr Ile
900 905 910
Trp Ala Pro Leu Ala Gly Thr Cys Gly Val Leu Leu Leu Ser Leu Val
915 920 925
Ile Thr Leu Tyr Cys Lys Arg Gly Arg Lys Lys Leu Leu Tyr Ile Phe
930 935 940
Lys Gln Pro Phe Met Arg Pro Val Gln Thr Thr Gln Glu Glu Asp Gly
945 950 955 960
Cys Ser Cys Arg Phe Pro Glu Glu Glu Glu Gly Gly Cys Glu Leu Arg
965 970 975
Val Lys Phe Ser Arg Ser Ala Asp Ala Pro Ala Tyr Lys Gln Gly Gln
980 985 990
Asn Gln Leu Tyr Asn Glu Leu Asn Leu Gly Arg Arg Glu Glu Tyr Asp
995 1000 1005
Val Leu Asp Lys Arg Arg Gly Arg Asp Pro Glu Met Gly Gly Lys
1010 1015 1020
Pro Arg Arg Lys Asn Pro Gln Glu Gly Leu Tyr Asn Glu Leu Gln
1025 1030 1035
Lys Asp Lys Met Ala Glu Ala Tyr Ser Glu Ile Gly Met Lys Gly
1040 1045 1050
Glu Arg Arg Arg Gly Lys Gly His Asp Gly Leu Tyr Gln Gly Leu
1055 1060 1065
Ser Thr Ala Thr Lys Asp Thr Tyr Asp Ala Leu His Met Gln Ala
1070 1075 1080
Leu Pro Pro Arg Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys
1085 1090 1095
Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Met Leu Phe Asn
1100 1105 1110
Leu Arg Ile Leu Leu Asn Asn Ala Ala Phe Arg Asn Gly His Asn
1115 1120 1125
Phe Met Val Arg Asn Phe Arg Cys Gly Gln Pro Leu Gln Asn Lys
1130 1135 1140
Val Gln Leu Lys Gly Arg Asp Leu Leu Thr Leu Lys Asn Phe Thr
1145 1150 1155
Gly Glu Glu Ile Lys Tyr Met Leu Trp Leu Ser Ala Asp Leu Lys
1160 1165 1170
Phe Arg Ile Lys Gln Lys Gly Glu Tyr Leu Pro Leu Leu Gln Gly
1175 1180 1185
Lys Ser Leu Gly Met Ile Phe Glu Lys Arg Ser Thr Arg Thr Arg
1190 1195 1200
Leu Ser Thr Glu Thr Gly Leu Ala Leu Leu Gly Gly His Pro Cys
1205 1210 1215
Phe Leu Thr Thr Gln Asp Ile His Leu Gly Val Asn Glu Ser Leu
1220 1225 1230
Thr Asp Thr Ala Arg Val Leu Ser Ser Met Ala Asp Ala Val Leu
1235 1240 1245
Ala Arg Val Tyr Lys Gln Ser Asp Leu Asp Thr Leu Ala Lys Glu
1250 1255 1260
Ala Ser Ile Pro Ile Ile Asn Gly Leu Ser Asp Leu Tyr His Pro
1265 1270 1275
Ile Gln Ile Leu Ala Asp Tyr Leu Thr Leu Gln Glu His Tyr Ser
1280 1285 1290
Ser Leu Lys Gly Leu Thr Leu Ser Trp Ile Gly Asp Gly Asn Asn
1295 1300 1305
Ile Leu His Ser Ile Met Met Ser Ala Ala Lys Phe Gly Met His
1310 1315 1320
Leu Gln Ala Ala Thr Pro Lys Gly Tyr Glu Pro Asp Ala Ser Val
1325 1330 1335
Thr Lys Leu Ala Glu Gln Tyr Ala Lys Glu Asn Gly Thr Lys Leu
1340 1345 1350
Leu Leu Thr Asn Asp Pro Leu Glu Ala Ala His Gly Gly Asn Val
1355 1360 1365
Leu Ile Thr Asp Thr Trp Ile Ser Met Gly Gln Glu Glu Glu Lys
1370 1375 1380
Lys Lys Arg Leu Gln Ala Phe Gln Gly Tyr Gln Val Thr Met Lys
1385 1390 1395
Thr Ala Lys Val Ala Ala Ser Asp Trp Thr Phe Leu His Cys Leu
1400 1405 1410
Pro Arg Lys Pro Glu Glu Val Asp Asp Glu Val Phe Tyr Ser Pro
1415 1420 1425
Arg Ser Leu Val Phe Pro Glu Ala Glu Asn Arg Lys Trp Thr Ile
1430 1435 1440
Met Ala Val Met Val Ser Leu Leu Thr Asp Tyr Ser Pro Gln Leu
1445 1450 1455
Gln Lys Pro Lys Phe
1460
<210> 15
<211> 1637
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 本发明的示例性蛋白间皮素ASS1+OTC
<400> 15
Met Pro Arg Gly Trp Thr Ala Leu Cys Leu Leu Ser Leu Leu Pro Ser
1 5 10 15
Gly Phe Met Ser Leu Asp Asn Asn Gly Thr Ala Thr Pro Glu Leu Pro
20 25 30
Thr Gln Gly Thr Phe Ser Asn Val Ser Thr Asn Val Ser Tyr Gln Glu
35 40 45
Thr Thr Thr Pro Ser Thr Leu Gly Ser Thr Ser Leu His Pro Val Ser
50 55 60
Gln His Gly Asn Glu Ala Thr Thr Asn Ile Thr Glu Thr Thr Val Lys
65 70 75 80
Phe Thr Ser Thr Ser Val Ile Thr Ser Val Tyr Gly Asn Thr Asn Ser
85 90 95
Ser Val Gln Ser Gln Thr Ser Val Ile Ser Thr Val Phe Thr Thr Pro
100 105 110
Ala Asn Val Ser Thr Pro Glu Thr Thr Leu Lys Pro Ser Leu Ser Pro
115 120 125
Gly Asn Val Ser Asp Leu Ser Thr Thr Ser Thr Ser Leu Ala Thr Ser
130 135 140
Pro Thr Lys Pro Tyr Thr Ser Ser Ser Pro Ile Leu Ser Asp Ile Lys
145 150 155 160
Ala Glu Ile Lys Cys Ser Gly Ile Arg Glu Val Lys Leu Thr Gln Gly
165 170 175
Ile Cys Leu Glu Gln Asn Lys Thr Ser Ser Cys Ala Glu Phe Lys Lys
180 185 190
Asp Arg Gly Glu Gly Leu Ala Arg Val Leu Cys Gly Glu Glu Gln Ala
195 200 205
Asp Ala Asp Ala Gly Ala Gln Val Cys Ser Leu Leu Leu Ala Gln Ser
210 215 220
Glu Val Arg Pro Gln Cys Leu Leu Leu Val Leu Ala Asn Arg Thr Glu
225 230 235 240
Ile Ser Ser Lys Leu Gln Leu Met Lys Lys His Gln Ser Asp Leu Lys
245 250 255
Lys Leu Gly Ile Leu Asp Phe Thr Glu Gln Asp Val Ala Ser His Gln
260 265 270
Ser Tyr Ser Gln Lys Thr Leu Ile Ala Leu Val Thr Ser Gly Ala Leu
275 280 285
Leu Ala Val Leu Gly Ile Thr Gly Tyr Phe Leu Met Asn Arg Arg Ser
290 295 300
Trp Ser Pro Thr Gly Glu Arg Leu Glu Leu Glu Pro Val Asp Arg Val
305 310 315 320
Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu
325 330 335
Ser Asn Pro Gly Pro Gly Asn Met Ala Leu Pro Val Thr Ala Leu Leu
340 345 350
Leu Pro Leu Ala Leu Leu Leu His Ala Ala Arg Pro Met Gln Val Gln
355 360 365
Leu Gln Gln Ser Gly Pro Glu Leu Glu Lys Pro Gly Ala Ser Val Lys
370 375 380
Ile Ser Cys Lys Ala Ser Gly Tyr Ser Phe Thr Gly Tyr Thr Met Asn
385 390 395 400
Trp Val Lys Gln Ser His Gly Lys Ser Leu Glu Trp Ile Gly Leu Ile
405 410 415
Thr Pro Tyr Asn Gly Ala Ser Ser Tyr Asn Gln Lys Phe Arg Gly Lys
420 425 430
Ala Thr Leu Thr Val Asp Lys Ser Ser Ser Thr Ala Tyr Met Asp Leu
435 440 445
Leu Ser Leu Thr Ser Glu Asp Ser Ala Val Tyr Phe Cys Ala Arg Gly
450 455 460
Gly Tyr Asp Gly Arg Gly Phe Asp Tyr Trp Gly Gln Gly Thr Thr Val
465 470 475 480
Thr Val Ser Ser Gly Val Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
485 490 495
Gly Gly Ser Asp Ile Glu Leu Thr Gln Ser Pro Ala Ile Met Ser Ala
500 505 510
Ser Pro Gly Glu Lys Val Thr Met Thr Cys Ser Ala Ser Ser Ser Val
515 520 525
Ser Tyr Met His Trp Tyr Gln Gln Lys Ser Gly Thr Ser Pro Lys Arg
530 535 540
Trp Ile Tyr Asp Thr Ser Lys Leu Ala Ser Gly Val Pro Gly Arg Phe
545 550 555 560
Ser Gly Ser Gly Ser Gly Asn Ser Tyr Ser Leu Thr Ile Ser Ser Val
565 570 575
Glu Ala Glu Asp Asp Ala Thr Tyr Tyr Cys Gln Gln Trp Ser Gly Tyr
580 585 590
Pro Leu Thr Phe Gly Ala Gly Thr Lys Leu Glu Ile Lys Thr Thr Thr
595 600 605
Pro Ala Pro Arg Pro Pro Thr Pro Ala Pro Thr Ile Ala Ser Gln Pro
610 615 620
Leu Ser Leu Arg Pro Glu Ala Cys Arg Pro Ala Ala Gly Gly Ala Val
625 630 635 640
His Thr Arg Gly Leu Asp Phe Ala Cys Asp Ile Tyr Ile Trp Ala Pro
645 650 655
Leu Ala Gly Thr Cys Gly Val Leu Leu Leu Ser Leu Val Ile Thr Leu
660 665 670
Tyr Cys Lys Arg Gly Arg Lys Lys Leu Leu Tyr Ile Phe Lys Gln Pro
675 680 685
Phe Met Arg Pro Val Gln Thr Thr Gln Glu Glu Asp Gly Cys Ser Cys
690 695 700
Arg Phe Pro Glu Glu Glu Glu Gly Gly Cys Glu Leu Arg Val Lys Phe
705 710 715 720
Ser Arg Ser Ala Asp Ala Pro Ala Tyr Lys Gln Gly Gln Asn Gln Leu
725 730 735
Tyr Asn Glu Leu Asn Leu Gly Arg Arg Glu Glu Tyr Asp Val Leu Asp
740 745 750
Lys Arg Arg Gly Arg Asp Pro Glu Met Gly Gly Lys Pro Arg Arg Lys
755 760 765
Asn Pro Gln Glu Gly Leu Tyr Asn Glu Leu Gln Lys Asp Lys Met Ala
770 775 780
Glu Ala Tyr Ser Glu Ile Gly Met Lys Gly Glu Arg Arg Arg Gly Lys
785 790 795 800
Gly His Asp Gly Leu Tyr Gln Gly Leu Ser Thr Ala Thr Lys Asp Thr
805 810 815
Tyr Asp Ala Leu His Met Gln Ala Leu Pro Pro Arg Gly Ser Gly Ala
820 825 830
Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn Pro
835 840 845
Gly Pro Met Ser Ser Lys Gly Ser Val Val Leu Ala Tyr Ser Gly Gly
850 855 860
Leu Asp Thr Ser Cys Ile Leu Val Trp Leu Lys Glu Gln Gly Tyr Asp
865 870 875 880
Val Ile Ala Tyr Leu Ala Asn Ile Gly Gln Lys Glu Asp Phe Glu Glu
885 890 895
Ala Arg Lys Lys Ala Leu Lys Leu Gly Ala Lys Lys Val Phe Ile Glu
900 905 910
Asp Val Ser Arg Glu Phe Val Glu Glu Phe Ile Trp Pro Ala Ile Gln
915 920 925
Ser Ser Ala Leu Tyr Glu Asp Arg Tyr Leu Leu Gly Thr Ser Leu Ala
930 935 940
Arg Pro Cys Ile Ala Arg Lys Gln Val Glu Ile Ala Gln Arg Glu Gly
945 950 955 960
Ala Lys Tyr Val Ser His Gly Ala Thr Gly Lys Gly Asn Asp Gln Val
965 970 975
Arg Phe Glu Leu Ser Cys Tyr Ser Leu Ala Pro Gln Ile Lys Val Ile
980 985 990
Ala Pro Trp Arg Met Pro Glu Phe Tyr Asn Arg Phe Lys Gly Arg Asn
995 1000 1005
Asp Leu Met Glu Tyr Ala Lys Gln His Gly Ile Pro Ile Pro Val
1010 1015 1020
Thr Pro Lys Asn Pro Trp Ser Met Asp Glu Asn Leu Met His Ile
1025 1030 1035
Ser Tyr Glu Ala Gly Ile Leu Glu Asn Pro Lys Asn Gln Ala Pro
1040 1045 1050
Pro Gly Leu Tyr Thr Lys Thr Gln Asp Pro Ala Lys Ala Pro Asn
1055 1060 1065
Thr Pro Asp Ile Leu Glu Ile Glu Phe Lys Lys Gly Val Pro Val
1070 1075 1080
Lys Val Thr Asn Val Lys Asp Gly Thr Thr His Gln Thr Ser Leu
1085 1090 1095
Glu Leu Phe Met Tyr Leu Asn Glu Val Ala Gly Lys His Gly Val
1100 1105 1110
Gly Arg Ile Asp Ile Val Glu Asn Arg Phe Ile Gly Met Lys Ser
1115 1120 1125
Arg Gly Ile Tyr Glu Thr Pro Ala Gly Thr Ile Leu Tyr His Ala
1130 1135 1140
His Leu Asp Ile Glu Ala Phe Thr Met Asp Arg Glu Val Arg Lys
1145 1150 1155
Ile Lys Gln Gly Leu Gly Leu Lys Phe Ala Glu Leu Val Tyr Thr
1160 1165 1170
Gly Phe Trp His Ser Pro Glu Cys Glu Phe Val Arg His Cys Ile
1175 1180 1185
Ala Lys Ser Gln Glu Arg Val Glu Gly Lys Val Gln Val Ser Val
1190 1195 1200
Leu Lys Gly Gln Val Tyr Ile Leu Gly Arg Glu Ser Pro Leu Ser
1205 1210 1215
Leu Tyr Asn Glu Glu Leu Val Ser Met Asn Val Gln Gly Asp Tyr
1220 1225 1230
Glu Pro Thr Asp Ala Thr Gly Phe Ile Asn Ile Asn Ser Leu Arg
1235 1240 1245
Leu Lys Glu Tyr His Arg Leu Gln Ser Lys Val Thr Ala Lys Gly
1250 1255 1260
Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu
1265 1270 1275
Glu Asn Pro Gly Pro Met Leu Phe Asn Leu Arg Ile Leu Leu Asn
1280 1285 1290
Asn Ala Ala Phe Arg Asn Gly His Asn Phe Met Val Arg Asn Phe
1295 1300 1305
Arg Cys Gly Gln Pro Leu Gln Asn Lys Val Gln Leu Lys Gly Arg
1310 1315 1320
Asp Leu Leu Thr Leu Lys Asn Phe Thr Gly Glu Glu Ile Lys Tyr
1325 1330 1335
Met Leu Trp Leu Ser Ala Asp Leu Lys Phe Arg Ile Lys Gln Lys
1340 1345 1350
Gly Glu Tyr Leu Pro Leu Leu Gln Gly Lys Ser Leu Gly Met Ile
1355 1360 1365
Phe Glu Lys Arg Ser Thr Arg Thr Arg Leu Ser Thr Glu Thr Gly
1370 1375 1380
Leu Ala Leu Leu Gly Gly His Pro Cys Phe Leu Thr Thr Gln Asp
1385 1390 1395
Ile His Leu Gly Val Asn Glu Ser Leu Thr Asp Thr Ala Arg Val
1400 1405 1410
Leu Ser Ser Met Ala Asp Ala Val Leu Ala Arg Val Tyr Lys Gln
1415 1420 1425
Ser Asp Leu Asp Thr Leu Ala Lys Glu Ala Ser Ile Pro Ile Ile
1430 1435 1440
Asn Gly Leu Ser Asp Leu Tyr His Pro Ile Gln Ile Leu Ala Asp
1445 1450 1455
Tyr Leu Thr Leu Gln Glu His Tyr Ser Ser Leu Lys Gly Leu Thr
1460 1465 1470
Leu Ser Trp Ile Gly Asp Gly Asn Asn Ile Leu His Ser Ile Met
1475 1480 1485
Met Ser Ala Ala Lys Phe Gly Met His Leu Gln Ala Ala Thr Pro
1490 1495 1500
Lys Gly Tyr Glu Pro Asp Ala Ser Val Thr Lys Leu Ala Glu Gln
1505 1510 1515
Tyr Ala Lys Glu Asn Gly Thr Lys Leu Leu Leu Thr Asn Asp Pro
1520 1525 1530
Leu Glu Ala Ala His Gly Gly Asn Val Leu Ile Thr Asp Thr Trp
1535 1540 1545
Ile Ser Met Gly Gln Glu Glu Glu Lys Lys Lys Arg Leu Gln Ala
1550 1555 1560
Phe Gln Gly Tyr Gln Val Thr Met Lys Thr Ala Lys Val Ala Ala
1565 1570 1575
Ser Asp Trp Thr Phe Leu His Cys Leu Pro Arg Lys Pro Glu Glu
1580 1585 1590
Val Asp Asp Glu Val Phe Tyr Ser Pro Arg Ser Leu Val Phe Pro
1595 1600 1605
Glu Ala Glu Asn Arg Lys Trp Thr Ile Met Ala Val Met Val Ser
1610 1615 1620
Leu Leu Thr Asp Tyr Ser Pro Gln Leu Gln Lys Pro Lys Phe
1625 1630 1635
<210> 16
<211> 1262
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 本发明的示例性蛋白间皮素ASS
<400> 16
Met Pro Arg Gly Trp Thr Ala Leu Cys Leu Leu Ser Leu Leu Pro Ser
1 5 10 15
Gly Phe Met Ser Leu Asp Asn Asn Gly Thr Ala Thr Pro Glu Leu Pro
20 25 30
Thr Gln Gly Thr Phe Ser Asn Val Ser Thr Asn Val Ser Tyr Gln Glu
35 40 45
Thr Thr Thr Pro Ser Thr Leu Gly Ser Thr Ser Leu His Pro Val Ser
50 55 60
Gln His Gly Asn Glu Ala Thr Thr Asn Ile Thr Glu Thr Thr Val Lys
65 70 75 80
Phe Thr Ser Thr Ser Val Ile Thr Ser Val Tyr Gly Asn Thr Asn Ser
85 90 95
Ser Val Gln Ser Gln Thr Ser Val Ile Ser Thr Val Phe Thr Thr Pro
100 105 110
Ala Asn Val Ser Thr Pro Glu Thr Thr Leu Lys Pro Ser Leu Ser Pro
115 120 125
Gly Asn Val Ser Asp Leu Ser Thr Thr Ser Thr Ser Leu Ala Thr Ser
130 135 140
Pro Thr Lys Pro Tyr Thr Ser Ser Ser Pro Ile Leu Ser Asp Ile Lys
145 150 155 160
Ala Glu Ile Lys Cys Ser Gly Ile Arg Glu Val Lys Leu Thr Gln Gly
165 170 175
Ile Cys Leu Glu Gln Asn Lys Thr Ser Ser Cys Ala Glu Phe Lys Lys
180 185 190
Asp Arg Gly Glu Gly Leu Ala Arg Val Leu Cys Gly Glu Glu Gln Ala
195 200 205
Asp Ala Asp Ala Gly Ala Gln Val Cys Ser Leu Leu Leu Ala Gln Ser
210 215 220
Glu Val Arg Pro Gln Cys Leu Leu Leu Val Leu Ala Asn Arg Thr Glu
225 230 235 240
Ile Ser Ser Lys Leu Gln Leu Met Lys Lys His Gln Ser Asp Leu Lys
245 250 255
Lys Leu Gly Ile Leu Asp Phe Thr Glu Gln Asp Val Ala Ser His Gln
260 265 270
Ser Tyr Ser Gln Lys Thr Leu Ile Ala Leu Val Thr Ser Gly Ala Leu
275 280 285
Leu Ala Val Leu Gly Ile Thr Gly Tyr Phe Leu Met Asn Arg Arg Ser
290 295 300
Trp Ser Pro Thr Gly Glu Arg Leu Glu Leu Glu Pro Val Asp Arg Val
305 310 315 320
Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu
325 330 335
Ser Asn Pro Gly Pro Gly Asn Met Ala Leu Pro Val Thr Ala Leu Leu
340 345 350
Leu Pro Leu Ala Leu Leu Leu His Ala Ala Arg Pro Met Gln Val Gln
355 360 365
Leu Gln Gln Ser Gly Pro Glu Leu Glu Lys Pro Gly Ala Ser Val Lys
370 375 380
Ile Ser Cys Lys Ala Ser Gly Tyr Ser Phe Thr Gly Tyr Thr Met Asn
385 390 395 400
Trp Val Lys Gln Ser His Gly Lys Ser Leu Glu Trp Ile Gly Leu Ile
405 410 415
Thr Pro Tyr Asn Gly Ala Ser Ser Tyr Asn Gln Lys Phe Arg Gly Lys
420 425 430
Ala Thr Leu Thr Val Asp Lys Ser Ser Ser Thr Ala Tyr Met Asp Leu
435 440 445
Leu Ser Leu Thr Ser Glu Asp Ser Ala Val Tyr Phe Cys Ala Arg Gly
450 455 460
Gly Tyr Asp Gly Arg Gly Phe Asp Tyr Trp Gly Gln Gly Thr Thr Val
465 470 475 480
Thr Val Ser Ser Gly Val Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
485 490 495
Gly Gly Ser Asp Ile Glu Leu Thr Gln Ser Pro Ala Ile Met Ser Ala
500 505 510
Ser Pro Gly Glu Lys Val Thr Met Thr Cys Ser Ala Ser Ser Ser Val
515 520 525
Ser Tyr Met His Trp Tyr Gln Gln Lys Ser Gly Thr Ser Pro Lys Arg
530 535 540
Trp Ile Tyr Asp Thr Ser Lys Leu Ala Ser Gly Val Pro Gly Arg Phe
545 550 555 560
Ser Gly Ser Gly Ser Gly Asn Ser Tyr Ser Leu Thr Ile Ser Ser Val
565 570 575
Glu Ala Glu Asp Asp Ala Thr Tyr Tyr Cys Gln Gln Trp Ser Gly Tyr
580 585 590
Pro Leu Thr Phe Gly Ala Gly Thr Lys Leu Glu Ile Lys Thr Thr Thr
595 600 605
Pro Ala Pro Arg Pro Pro Thr Pro Ala Pro Thr Ile Ala Ser Gln Pro
610 615 620
Leu Ser Leu Arg Pro Glu Ala Cys Arg Pro Ala Ala Gly Gly Ala Val
625 630 635 640
His Thr Arg Gly Leu Asp Phe Ala Cys Asp Ile Tyr Ile Trp Ala Pro
645 650 655
Leu Ala Gly Thr Cys Gly Val Leu Leu Leu Ser Leu Val Ile Thr Leu
660 665 670
Tyr Cys Lys Arg Gly Arg Lys Lys Leu Leu Tyr Ile Phe Lys Gln Pro
675 680 685
Phe Met Arg Pro Val Gln Thr Thr Gln Glu Glu Asp Gly Cys Ser Cys
690 695 700
Arg Phe Pro Glu Glu Glu Glu Gly Gly Cys Glu Leu Arg Val Lys Phe
705 710 715 720
Ser Arg Ser Ala Asp Ala Pro Ala Tyr Lys Gln Gly Gln Asn Gln Leu
725 730 735
Tyr Asn Glu Leu Asn Leu Gly Arg Arg Glu Glu Tyr Asp Val Leu Asp
740 745 750
Lys Arg Arg Gly Arg Asp Pro Glu Met Gly Gly Lys Pro Arg Arg Lys
755 760 765
Asn Pro Gln Glu Gly Leu Tyr Asn Glu Leu Gln Lys Asp Lys Met Ala
770 775 780
Glu Ala Tyr Ser Glu Ile Gly Met Lys Gly Glu Arg Arg Arg Gly Lys
785 790 795 800
Gly His Asp Gly Leu Tyr Gln Gly Leu Ser Thr Ala Thr Lys Asp Thr
805 810 815
Tyr Asp Ala Leu His Met Gln Ala Leu Pro Pro Arg Gly Ser Gly Ala
820 825 830
Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn Pro
835 840 845
Gly Pro Met Ser Ser Lys Gly Ser Val Val Leu Ala Tyr Ser Gly Gly
850 855 860
Leu Asp Thr Ser Cys Ile Leu Val Trp Leu Lys Glu Gln Gly Tyr Asp
865 870 875 880
Val Ile Ala Tyr Leu Ala Asn Ile Gly Gln Lys Glu Asp Phe Glu Glu
885 890 895
Ala Arg Lys Lys Ala Leu Lys Leu Gly Ala Lys Lys Val Phe Ile Glu
900 905 910
Asp Val Ser Arg Glu Phe Val Glu Glu Phe Ile Trp Pro Ala Ile Gln
915 920 925
Ser Ser Ala Leu Tyr Glu Asp Arg Tyr Leu Leu Gly Thr Ser Leu Ala
930 935 940
Arg Pro Cys Ile Ala Arg Lys Gln Val Glu Ile Ala Gln Arg Glu Gly
945 950 955 960
Ala Lys Tyr Val Ser His Gly Ala Thr Gly Lys Gly Asn Asp Gln Val
965 970 975
Arg Phe Glu Leu Ser Cys Tyr Ser Leu Ala Pro Gln Ile Lys Val Ile
980 985 990
Ala Pro Trp Arg Met Pro Glu Phe Tyr Asn Arg Phe Lys Gly Arg Asn
995 1000 1005
Asp Leu Met Glu Tyr Ala Lys Gln His Gly Ile Pro Ile Pro Val
1010 1015 1020
Thr Pro Lys Asn Pro Trp Ser Met Asp Glu Asn Leu Met His Ile
1025 1030 1035
Ser Tyr Glu Ala Gly Ile Leu Glu Asn Pro Lys Asn Gln Ala Pro
1040 1045 1050
Pro Gly Leu Tyr Thr Lys Thr Gln Asp Pro Ala Lys Ala Pro Asn
1055 1060 1065
Thr Pro Asp Ile Leu Glu Ile Glu Phe Lys Lys Gly Val Pro Val
1070 1075 1080
Lys Val Thr Asn Val Lys Asp Gly Thr Thr His Gln Thr Ser Leu
1085 1090 1095
Glu Leu Phe Met Tyr Leu Asn Glu Val Ala Gly Lys His Gly Val
1100 1105 1110
Gly Arg Ile Asp Ile Val Glu Asn Arg Phe Ile Gly Met Lys Ser
1115 1120 1125
Arg Gly Ile Tyr Glu Thr Pro Ala Gly Thr Ile Leu Tyr His Ala
1130 1135 1140
His Leu Asp Ile Glu Ala Phe Thr Met Asp Arg Glu Val Arg Lys
1145 1150 1155
Ile Lys Gln Gly Leu Gly Leu Lys Phe Ala Glu Leu Val Tyr Thr
1160 1165 1170
Gly Phe Trp His Ser Pro Glu Cys Glu Phe Val Arg His Cys Ile
1175 1180 1185
Ala Lys Ser Gln Glu Arg Val Glu Gly Lys Val Gln Val Ser Val
1190 1195 1200
Leu Lys Gly Gln Val Tyr Ile Leu Gly Arg Glu Ser Pro Leu Ser
1205 1210 1215
Leu Tyr Asn Glu Glu Leu Val Ser Met Asn Val Gln Gly Asp Tyr
1220 1225 1230
Glu Pro Thr Asp Ala Thr Gly Phe Ile Asn Ile Asn Ser Leu Arg
1235 1240 1245
Leu Lys Glu Tyr His Arg Leu Gln Ser Lys Val Thr Ala Lys
1250 1255 1260
<210> 17
<211> 1204
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 本发明的示例性蛋白间皮素OTC
<400> 17
Met Pro Arg Gly Trp Thr Ala Leu Cys Leu Leu Ser Leu Leu Pro Ser
1 5 10 15
Gly Phe Met Ser Leu Asp Asn Asn Gly Thr Ala Thr Pro Glu Leu Pro
20 25 30
Thr Gln Gly Thr Phe Ser Asn Val Ser Thr Asn Val Ser Tyr Gln Glu
35 40 45
Thr Thr Thr Pro Ser Thr Leu Gly Ser Thr Ser Leu His Pro Val Ser
50 55 60
Gln His Gly Asn Glu Ala Thr Thr Asn Ile Thr Glu Thr Thr Val Lys
65 70 75 80
Phe Thr Ser Thr Ser Val Ile Thr Ser Val Tyr Gly Asn Thr Asn Ser
85 90 95
Ser Val Gln Ser Gln Thr Ser Val Ile Ser Thr Val Phe Thr Thr Pro
100 105 110
Ala Asn Val Ser Thr Pro Glu Thr Thr Leu Lys Pro Ser Leu Ser Pro
115 120 125
Gly Asn Val Ser Asp Leu Ser Thr Thr Ser Thr Ser Leu Ala Thr Ser
130 135 140
Pro Thr Lys Pro Tyr Thr Ser Ser Ser Pro Ile Leu Ser Asp Ile Lys
145 150 155 160
Ala Glu Ile Lys Cys Ser Gly Ile Arg Glu Val Lys Leu Thr Gln Gly
165 170 175
Ile Cys Leu Glu Gln Asn Lys Thr Ser Ser Cys Ala Glu Phe Lys Lys
180 185 190
Asp Arg Gly Glu Gly Leu Ala Arg Val Leu Cys Gly Glu Glu Gln Ala
195 200 205
Asp Ala Asp Ala Gly Ala Gln Val Cys Ser Leu Leu Leu Ala Gln Ser
210 215 220
Glu Val Arg Pro Gln Cys Leu Leu Leu Val Leu Ala Asn Arg Thr Glu
225 230 235 240
Ile Ser Ser Lys Leu Gln Leu Met Lys Lys His Gln Ser Asp Leu Lys
245 250 255
Lys Leu Gly Ile Leu Asp Phe Thr Glu Gln Asp Val Ala Ser His Gln
260 265 270
Ser Tyr Ser Gln Lys Thr Leu Ile Ala Leu Val Thr Ser Gly Ala Leu
275 280 285
Leu Ala Val Leu Gly Ile Thr Gly Tyr Phe Leu Met Asn Arg Arg Ser
290 295 300
Trp Ser Pro Thr Gly Glu Arg Leu Glu Leu Glu Pro Val Asp Arg Val
305 310 315 320
Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu
325 330 335
Ser Asn Pro Gly Pro Gly Asn Met Ala Leu Pro Val Thr Ala Leu Leu
340 345 350
Leu Pro Leu Ala Leu Leu Leu His Ala Ala Arg Pro Met Gln Val Gln
355 360 365
Leu Gln Gln Ser Gly Pro Glu Leu Glu Lys Pro Gly Ala Ser Val Lys
370 375 380
Ile Ser Cys Lys Ala Ser Gly Tyr Ser Phe Thr Gly Tyr Thr Met Asn
385 390 395 400
Trp Val Lys Gln Ser His Gly Lys Ser Leu Glu Trp Ile Gly Leu Ile
405 410 415
Thr Pro Tyr Asn Gly Ala Ser Ser Tyr Asn Gln Lys Phe Arg Gly Lys
420 425 430
Ala Thr Leu Thr Val Asp Lys Ser Ser Ser Thr Ala Tyr Met Asp Leu
435 440 445
Leu Ser Leu Thr Ser Glu Asp Ser Ala Val Tyr Phe Cys Ala Arg Gly
450 455 460
Gly Tyr Asp Gly Arg Gly Phe Asp Tyr Trp Gly Gln Gly Thr Thr Val
465 470 475 480
Thr Val Ser Ser Gly Val Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
485 490 495
Gly Gly Ser Asp Ile Glu Leu Thr Gln Ser Pro Ala Ile Met Ser Ala
500 505 510
Ser Pro Gly Glu Lys Val Thr Met Thr Cys Ser Ala Ser Ser Ser Val
515 520 525
Ser Tyr Met His Trp Tyr Gln Gln Lys Ser Gly Thr Ser Pro Lys Arg
530 535 540
Trp Ile Tyr Asp Thr Ser Lys Leu Ala Ser Gly Val Pro Gly Arg Phe
545 550 555 560
Ser Gly Ser Gly Ser Gly Asn Ser Tyr Ser Leu Thr Ile Ser Ser Val
565 570 575
Glu Ala Glu Asp Asp Ala Thr Tyr Tyr Cys Gln Gln Trp Ser Gly Tyr
580 585 590
Pro Leu Thr Phe Gly Ala Gly Thr Lys Leu Glu Ile Lys Thr Thr Thr
595 600 605
Pro Ala Pro Arg Pro Pro Thr Pro Ala Pro Thr Ile Ala Ser Gln Pro
610 615 620
Leu Ser Leu Arg Pro Glu Ala Cys Arg Pro Ala Ala Gly Gly Ala Val
625 630 635 640
His Thr Arg Gly Leu Asp Phe Ala Cys Asp Ile Tyr Ile Trp Ala Pro
645 650 655
Leu Ala Gly Thr Cys Gly Val Leu Leu Leu Ser Leu Val Ile Thr Leu
660 665 670
Tyr Cys Lys Arg Gly Arg Lys Lys Leu Leu Tyr Ile Phe Lys Gln Pro
675 680 685
Phe Met Arg Pro Val Gln Thr Thr Gln Glu Glu Asp Gly Cys Ser Cys
690 695 700
Arg Phe Pro Glu Glu Glu Glu Gly Gly Cys Glu Leu Arg Val Lys Phe
705 710 715 720
Ser Arg Ser Ala Asp Ala Pro Ala Tyr Lys Gln Gly Gln Asn Gln Leu
725 730 735
Tyr Asn Glu Leu Asn Leu Gly Arg Arg Glu Glu Tyr Asp Val Leu Asp
740 745 750
Lys Arg Arg Gly Arg Asp Pro Glu Met Gly Gly Lys Pro Arg Arg Lys
755 760 765
Asn Pro Gln Glu Gly Leu Tyr Asn Glu Leu Gln Lys Asp Lys Met Ala
770 775 780
Glu Ala Tyr Ser Glu Ile Gly Met Lys Gly Glu Arg Arg Arg Gly Lys
785 790 795 800
Gly His Asp Gly Leu Tyr Gln Gly Leu Ser Thr Ala Thr Lys Asp Thr
805 810 815
Tyr Asp Ala Leu His Met Gln Ala Leu Pro Pro Arg Gly Ser Gly Ala
820 825 830
Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn Pro
835 840 845
Gly Pro Met Leu Phe Asn Leu Arg Ile Leu Leu Asn Asn Ala Ala Phe
850 855 860
Arg Asn Gly His Asn Phe Met Val Arg Asn Phe Arg Cys Gly Gln Pro
865 870 875 880
Leu Gln Asn Lys Val Gln Leu Lys Gly Arg Asp Leu Leu Thr Leu Lys
885 890 895
Asn Phe Thr Gly Glu Glu Ile Lys Tyr Met Leu Trp Leu Ser Ala Asp
900 905 910
Leu Lys Phe Arg Ile Lys Gln Lys Gly Glu Tyr Leu Pro Leu Leu Gln
915 920 925
Gly Lys Ser Leu Gly Met Ile Phe Glu Lys Arg Ser Thr Arg Thr Arg
930 935 940
Leu Ser Thr Glu Thr Gly Leu Ala Leu Leu Gly Gly His Pro Cys Phe
945 950 955 960
Leu Thr Thr Gln Asp Ile His Leu Gly Val Asn Glu Ser Leu Thr Asp
965 970 975
Thr Ala Arg Val Leu Ser Ser Met Ala Asp Ala Val Leu Ala Arg Val
980 985 990
Tyr Lys Gln Ser Asp Leu Asp Thr Leu Ala Lys Glu Ala Ser Ile Pro
995 1000 1005
Ile Ile Asn Gly Leu Ser Asp Leu Tyr His Pro Ile Gln Ile Leu
1010 1015 1020
Ala Asp Tyr Leu Thr Leu Gln Glu His Tyr Ser Ser Leu Lys Gly
1025 1030 1035
Leu Thr Leu Ser Trp Ile Gly Asp Gly Asn Asn Ile Leu His Ser
1040 1045 1050
Ile Met Met Ser Ala Ala Lys Phe Gly Met His Leu Gln Ala Ala
1055 1060 1065
Thr Pro Lys Gly Tyr Glu Pro Asp Ala Ser Val Thr Lys Leu Ala
1070 1075 1080
Glu Gln Tyr Ala Lys Glu Asn Gly Thr Lys Leu Leu Leu Thr Asn
1085 1090 1095
Asp Pro Leu Glu Ala Ala His Gly Gly Asn Val Leu Ile Thr Asp
1100 1105 1110
Thr Trp Ile Ser Met Gly Gln Glu Glu Glu Lys Lys Lys Arg Leu
1115 1120 1125
Gln Ala Phe Gln Gly Tyr Gln Val Thr Met Lys Thr Ala Lys Val
1130 1135 1140
Ala Ala Ser Asp Trp Thr Phe Leu His Cys Leu Pro Arg Lys Pro
1145 1150 1155
Glu Glu Val Asp Asp Glu Val Phe Tyr Ser Pro Arg Ser Leu Val
1160 1165 1170
Phe Pro Glu Ala Glu Asn Arg Lys Trp Thr Ile Met Ala Val Met
1175 1180 1185
Val Ser Leu Leu Thr Asp Tyr Ser Pro Gln Leu Gln Lys Pro Lys
1190 1195 1200
Phe
<210> 18
<211> 1644
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 本发明的示例性蛋白CD33 ASS+OTC
<400> 18
Met Pro Arg Gly Trp Thr Ala Leu Cys Leu Leu Ser Leu Leu Pro Ser
1 5 10 15
Gly Phe Met Ser Leu Asp Asn Asn Gly Thr Ala Thr Pro Glu Leu Pro
20 25 30
Thr Gln Gly Thr Phe Ser Asn Val Ser Thr Asn Val Ser Tyr Gln Glu
35 40 45
Thr Thr Thr Pro Ser Thr Leu Gly Ser Thr Ser Leu His Pro Val Ser
50 55 60
Gln His Gly Asn Glu Ala Thr Thr Asn Ile Thr Glu Thr Thr Val Lys
65 70 75 80
Phe Thr Ser Thr Ser Val Ile Thr Ser Val Tyr Gly Asn Thr Asn Ser
85 90 95
Ser Val Gln Ser Gln Thr Ser Val Ile Ser Thr Val Phe Thr Thr Pro
100 105 110
Ala Asn Val Ser Thr Pro Glu Thr Thr Leu Lys Pro Ser Leu Ser Pro
115 120 125
Gly Asn Val Ser Asp Leu Ser Thr Thr Ser Thr Ser Leu Ala Thr Ser
130 135 140
Pro Thr Lys Pro Tyr Thr Ser Ser Ser Pro Ile Leu Ser Asp Ile Lys
145 150 155 160
Ala Glu Ile Lys Cys Ser Gly Ile Arg Glu Val Lys Leu Thr Gln Gly
165 170 175
Ile Cys Leu Glu Gln Asn Lys Thr Ser Ser Cys Ala Glu Phe Lys Lys
180 185 190
Asp Arg Gly Glu Gly Leu Ala Arg Val Leu Cys Gly Glu Glu Gln Ala
195 200 205
Asp Ala Asp Ala Gly Ala Gln Val Cys Ser Leu Leu Leu Ala Gln Ser
210 215 220
Glu Val Arg Pro Gln Cys Leu Leu Leu Val Leu Ala Asn Arg Thr Glu
225 230 235 240
Ile Ser Ser Lys Leu Gln Leu Met Lys Lys His Gln Ser Asp Leu Lys
245 250 255
Lys Leu Gly Ile Leu Asp Phe Thr Glu Gln Asp Val Ala Ser His Gln
260 265 270
Ser Tyr Ser Gln Lys Thr Leu Ile Ala Leu Val Thr Ser Gly Ala Leu
275 280 285
Leu Ala Val Leu Gly Ile Thr Gly Tyr Phe Leu Met Asn Arg Arg Ser
290 295 300
Trp Ser Pro Thr Gly Glu Arg Leu Glu Leu Glu Pro Val Asp Arg Val
305 310 315 320
Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu
325 330 335
Ser Asn Pro Gly Pro Gly Asn Met Ala Leu Pro Val Thr Ala Leu Leu
340 345 350
Leu Pro Leu Ala Leu Leu Leu His Ala Ala Arg Pro Gly Ser Asn Ile
355 360 365
Met Leu Thr Gln Ser Pro Ser Ser Leu Ala Val Ser Ala Gly Glu Lys
370 375 380
Val Thr Met Ser Cys Lys Ser Ser Gln Ser Val Phe Phe Ser Ser Ser
385 390 395 400
Gln Lys Asn Tyr Leu Ala Trp Tyr Gln Gln Ile Pro Gly Gln Ser Pro
405 410 415
Lys Leu Leu Ile Tyr Trp Ala Ser Thr Arg Glu Ser Gly Val Pro Asp
420 425 430
Arg Phe Thr Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser
435 440 445
Ser Val Gln Ser Glu Asp Leu Ala Ile Tyr Tyr Cys His Gln Tyr Leu
450 455 460
Ser Ser Arg Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile Lys Arg Gly
465 470 475 480
Gly Gly Gly Ser Gly Gly Gly Gly Ser Ser Gly Gly Gly Ser Gln Val
485 490 495
Gln Leu Gln Gln Pro Gly Ala Glu Val Val Lys Pro Gly Ala Ser Val
500 505 510
Lys Met Ser Cys Lys Ala Ser Gly Tyr Thr Phe Thr Ser Tyr Tyr Ile
515 520 525
His Trp Ile Lys Gln Thr Pro Gly Gln Gly Leu Glu Trp Val Gly Val
530 535 540
Ile Tyr Pro Gly Asn Asp Asp Ile Ser Tyr Asn Gln Lys Phe Lys Gly
545 550 555 560
Lys Ala Thr Leu Thr Ala Asp Lys Ser Ser Thr Thr Ala Tyr Met Gln
565 570 575
Leu Ser Ser Leu Thr Ser Glu Asp Ser Ala Val Tyr Tyr Cys Ala Arg
580 585 590
Glu Val Arg Leu Arg Tyr Phe Asp Val Trp Gly Ala Gly Thr Thr Val
595 600 605
Thr Val Ser Ser Thr Thr Thr Pro Ala Pro Arg Pro Pro Thr Pro Ala
610 615 620
Pro Thr Ile Ala Ser Gln Pro Leu Ser Leu Arg Pro Glu Ala Cys Arg
625 630 635 640
Pro Ala Ala Gly Gly Ala Val His Thr Arg Gly Leu Asp Phe Ala Cys
645 650 655
Asp Ile Tyr Ile Trp Ala Pro Leu Ala Gly Thr Cys Gly Val Leu Leu
660 665 670
Leu Ser Leu Val Ile Thr Leu Tyr Cys Lys Arg Gly Arg Lys Lys Leu
675 680 685
Leu Tyr Ile Phe Lys Gln Pro Phe Met Arg Pro Val Gln Thr Thr Gln
690 695 700
Glu Glu Asp Gly Cys Ser Cys Arg Phe Pro Glu Glu Glu Glu Gly Gly
705 710 715 720
Cys Glu Leu Arg Val Lys Phe Ser Arg Ser Ala Asp Ala Pro Ala Tyr
725 730 735
Lys Gln Gly Gln Asn Gln Leu Tyr Asn Glu Leu Asn Leu Gly Arg Arg
740 745 750
Glu Glu Tyr Asp Val Leu Asp Lys Arg Arg Gly Arg Asp Pro Glu Met
755 760 765
Gly Gly Lys Pro Arg Arg Lys Asn Pro Gln Glu Gly Leu Tyr Asn Glu
770 775 780
Leu Gln Lys Asp Lys Met Ala Glu Ala Tyr Ser Glu Ile Gly Met Lys
785 790 795 800
Gly Glu Arg Arg Arg Gly Lys Gly His Asp Gly Leu Tyr Gln Gly Leu
805 810 815
Ser Thr Ala Thr Lys Asp Thr Tyr Asp Ala Leu His Met Gln Ala Leu
820 825 830
Pro Pro Arg Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala
835 840 845
Gly Asp Val Glu Glu Asn Pro Gly Pro Met Ser Ser Lys Gly Ser Val
850 855 860
Val Leu Ala Tyr Ser Gly Gly Leu Asp Thr Ser Cys Ile Leu Val Trp
865 870 875 880
Leu Lys Glu Gln Gly Tyr Asp Val Ile Ala Tyr Leu Ala Asn Ile Gly
885 890 895
Gln Lys Glu Asp Phe Glu Glu Ala Arg Lys Lys Ala Leu Lys Leu Gly
900 905 910
Ala Lys Lys Val Phe Ile Glu Asp Val Ser Arg Glu Phe Val Glu Glu
915 920 925
Phe Ile Trp Pro Ala Ile Gln Ser Ser Ala Leu Tyr Glu Asp Arg Tyr
930 935 940
Leu Leu Gly Thr Ser Leu Ala Arg Pro Cys Ile Ala Arg Lys Gln Val
945 950 955 960
Glu Ile Ala Gln Arg Glu Gly Ala Lys Tyr Val Ser His Gly Ala Thr
965 970 975
Gly Lys Gly Asn Asp Gln Val Arg Phe Glu Leu Ser Cys Tyr Ser Leu
980 985 990
Ala Pro Gln Ile Lys Val Ile Ala Pro Trp Arg Met Pro Glu Phe Tyr
995 1000 1005
Asn Arg Phe Lys Gly Arg Asn Asp Leu Met Glu Tyr Ala Lys Gln
1010 1015 1020
His Gly Ile Pro Ile Pro Val Thr Pro Lys Asn Pro Trp Ser Met
1025 1030 1035
Asp Glu Asn Leu Met His Ile Ser Tyr Glu Ala Gly Ile Leu Glu
1040 1045 1050
Asn Pro Lys Asn Gln Ala Pro Pro Gly Leu Tyr Thr Lys Thr Gln
1055 1060 1065
Asp Pro Ala Lys Ala Pro Asn Thr Pro Asp Ile Leu Glu Ile Glu
1070 1075 1080
Phe Lys Lys Gly Val Pro Val Lys Val Thr Asn Val Lys Asp Gly
1085 1090 1095
Thr Thr His Gln Thr Ser Leu Glu Leu Phe Met Tyr Leu Asn Glu
1100 1105 1110
Val Ala Gly Lys His Gly Val Gly Arg Ile Asp Ile Val Glu Asn
1115 1120 1125
Arg Phe Ile Gly Met Lys Ser Arg Gly Ile Tyr Glu Thr Pro Ala
1130 1135 1140
Gly Thr Ile Leu Tyr His Ala His Leu Asp Ile Glu Ala Phe Thr
1145 1150 1155
Met Asp Arg Glu Val Arg Lys Ile Lys Gln Gly Leu Gly Leu Lys
1160 1165 1170
Phe Ala Glu Leu Val Tyr Thr Gly Phe Trp His Ser Pro Glu Cys
1175 1180 1185
Glu Phe Val Arg His Cys Ile Ala Lys Ser Gln Glu Arg Val Glu
1190 1195 1200
Gly Lys Val Gln Val Ser Val Leu Lys Gly Gln Val Tyr Ile Leu
1205 1210 1215
Gly Arg Glu Ser Pro Leu Ser Leu Tyr Asn Glu Glu Leu Val Ser
1220 1225 1230
Met Asn Val Gln Gly Asp Tyr Glu Pro Thr Asp Ala Thr Gly Phe
1235 1240 1245
Ile Asn Ile Asn Ser Leu Arg Leu Lys Glu Tyr His Arg Leu Gln
1250 1255 1260
Ser Lys Val Thr Ala Lys Gly Ser Gly Glu Gly Arg Gly Ser Leu
1265 1270 1275
Leu Thr Cys Gly Asp Val Glu Glu Asn Pro Gly Pro Met Leu Phe
1280 1285 1290
Asn Leu Arg Ile Leu Leu Asn Asn Ala Ala Phe Arg Asn Gly His
1295 1300 1305
Asn Phe Met Val Arg Asn Phe Arg Cys Gly Gln Pro Leu Gln Asn
1310 1315 1320
Lys Val Gln Leu Lys Gly Arg Asp Leu Leu Thr Leu Lys Asn Phe
1325 1330 1335
Thr Gly Glu Glu Ile Lys Tyr Met Leu Trp Leu Ser Ala Asp Leu
1340 1345 1350
Lys Phe Arg Ile Lys Gln Lys Gly Glu Tyr Leu Pro Leu Leu Gln
1355 1360 1365
Gly Lys Ser Leu Gly Met Ile Phe Glu Lys Arg Ser Thr Arg Thr
1370 1375 1380
Arg Leu Ser Thr Glu Thr Gly Leu Ala Leu Leu Gly Gly His Pro
1385 1390 1395
Cys Phe Leu Thr Thr Gln Asp Ile His Leu Gly Val Asn Glu Ser
1400 1405 1410
Leu Thr Asp Thr Ala Arg Val Leu Ser Ser Met Ala Asp Ala Val
1415 1420 1425
Leu Ala Arg Val Tyr Lys Gln Ser Asp Leu Asp Thr Leu Ala Lys
1430 1435 1440
Glu Ala Ser Ile Pro Ile Ile Asn Gly Leu Ser Asp Leu Tyr His
1445 1450 1455
Pro Ile Gln Ile Leu Ala Asp Tyr Leu Thr Leu Gln Glu His Tyr
1460 1465 1470
Ser Ser Leu Lys Gly Leu Thr Leu Ser Trp Ile Gly Asp Gly Asn
1475 1480 1485
Asn Ile Leu His Ser Ile Met Met Ser Ala Ala Lys Phe Gly Met
1490 1495 1500
His Leu Gln Ala Ala Thr Pro Lys Gly Tyr Glu Pro Asp Ala Ser
1505 1510 1515
Val Thr Lys Leu Ala Glu Gln Tyr Ala Lys Glu Asn Gly Thr Lys
1520 1525 1530
Leu Leu Leu Thr Asn Asp Pro Leu Glu Ala Ala His Gly Gly Asn
1535 1540 1545
Val Leu Ile Thr Asp Thr Trp Ile Ser Met Gly Gln Glu Glu Glu
1550 1555 1560
Lys Lys Lys Arg Leu Gln Ala Phe Gln Gly Tyr Gln Val Thr Met
1565 1570 1575
Lys Thr Ala Lys Val Ala Ala Ser Asp Trp Thr Phe Leu His Cys
1580 1585 1590
Leu Pro Arg Lys Pro Glu Glu Val Asp Asp Glu Val Phe Tyr Ser
1595 1600 1605
Pro Arg Ser Leu Val Phe Pro Glu Ala Glu Asn Arg Lys Trp Thr
1610 1615 1620
Ile Met Ala Val Met Val Ser Leu Leu Thr Asp Tyr Ser Pro Gln
1625 1630 1635
Leu Gln Lys Pro Lys Phe
1640
<210> 19
<211> 1269
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 本发明的示例性蛋白CD33 ASS1
<400> 19
Met Pro Arg Gly Trp Thr Ala Leu Cys Leu Leu Ser Leu Leu Pro Ser
1 5 10 15
Gly Phe Met Ser Leu Asp Asn Asn Gly Thr Ala Thr Pro Glu Leu Pro
20 25 30
Thr Gln Gly Thr Phe Ser Asn Val Ser Thr Asn Val Ser Tyr Gln Glu
35 40 45
Thr Thr Thr Pro Ser Thr Leu Gly Ser Thr Ser Leu His Pro Val Ser
50 55 60
Gln His Gly Asn Glu Ala Thr Thr Asn Ile Thr Glu Thr Thr Val Lys
65 70 75 80
Phe Thr Ser Thr Ser Val Ile Thr Ser Val Tyr Gly Asn Thr Asn Ser
85 90 95
Ser Val Gln Ser Gln Thr Ser Val Ile Ser Thr Val Phe Thr Thr Pro
100 105 110
Ala Asn Val Ser Thr Pro Glu Thr Thr Leu Lys Pro Ser Leu Ser Pro
115 120 125
Gly Asn Val Ser Asp Leu Ser Thr Thr Ser Thr Ser Leu Ala Thr Ser
130 135 140
Pro Thr Lys Pro Tyr Thr Ser Ser Ser Pro Ile Leu Ser Asp Ile Lys
145 150 155 160
Ala Glu Ile Lys Cys Ser Gly Ile Arg Glu Val Lys Leu Thr Gln Gly
165 170 175
Ile Cys Leu Glu Gln Asn Lys Thr Ser Ser Cys Ala Glu Phe Lys Lys
180 185 190
Asp Arg Gly Glu Gly Leu Ala Arg Val Leu Cys Gly Glu Glu Gln Ala
195 200 205
Asp Ala Asp Ala Gly Ala Gln Val Cys Ser Leu Leu Leu Ala Gln Ser
210 215 220
Glu Val Arg Pro Gln Cys Leu Leu Leu Val Leu Ala Asn Arg Thr Glu
225 230 235 240
Ile Ser Ser Lys Leu Gln Leu Met Lys Lys His Gln Ser Asp Leu Lys
245 250 255
Lys Leu Gly Ile Leu Asp Phe Thr Glu Gln Asp Val Ala Ser His Gln
260 265 270
Ser Tyr Ser Gln Lys Thr Leu Ile Ala Leu Val Thr Ser Gly Ala Leu
275 280 285
Leu Ala Val Leu Gly Ile Thr Gly Tyr Phe Leu Met Asn Arg Arg Ser
290 295 300
Trp Ser Pro Thr Gly Glu Arg Leu Glu Leu Glu Pro Val Asp Arg Val
305 310 315 320
Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu
325 330 335
Ser Asn Pro Gly Pro Gly Asn Met Ala Leu Pro Val Thr Ala Leu Leu
340 345 350
Leu Pro Leu Ala Leu Leu Leu His Ala Ala Arg Pro Gly Ser Asn Ile
355 360 365
Met Leu Thr Gln Ser Pro Ser Ser Leu Ala Val Ser Ala Gly Glu Lys
370 375 380
Val Thr Met Ser Cys Lys Ser Ser Gln Ser Val Phe Phe Ser Ser Ser
385 390 395 400
Gln Lys Asn Tyr Leu Ala Trp Tyr Gln Gln Ile Pro Gly Gln Ser Pro
405 410 415
Lys Leu Leu Ile Tyr Trp Ala Ser Thr Arg Glu Ser Gly Val Pro Asp
420 425 430
Arg Phe Thr Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser
435 440 445
Ser Val Gln Ser Glu Asp Leu Ala Ile Tyr Tyr Cys His Gln Tyr Leu
450 455 460
Ser Ser Arg Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile Lys Arg Gly
465 470 475 480
Gly Gly Gly Ser Gly Gly Gly Gly Ser Ser Gly Gly Gly Ser Gln Val
485 490 495
Gln Leu Gln Gln Pro Gly Ala Glu Val Val Lys Pro Gly Ala Ser Val
500 505 510
Lys Met Ser Cys Lys Ala Ser Gly Tyr Thr Phe Thr Ser Tyr Tyr Ile
515 520 525
His Trp Ile Lys Gln Thr Pro Gly Gln Gly Leu Glu Trp Val Gly Val
530 535 540
Ile Tyr Pro Gly Asn Asp Asp Ile Ser Tyr Asn Gln Lys Phe Lys Gly
545 550 555 560
Lys Ala Thr Leu Thr Ala Asp Lys Ser Ser Thr Thr Ala Tyr Met Gln
565 570 575
Leu Ser Ser Leu Thr Ser Glu Asp Ser Ala Val Tyr Tyr Cys Ala Arg
580 585 590
Glu Val Arg Leu Arg Tyr Phe Asp Val Trp Gly Ala Gly Thr Thr Val
595 600 605
Thr Val Ser Ser Thr Thr Thr Pro Ala Pro Arg Pro Pro Thr Pro Ala
610 615 620
Pro Thr Ile Ala Ser Gln Pro Leu Ser Leu Arg Pro Glu Ala Cys Arg
625 630 635 640
Pro Ala Ala Gly Gly Ala Val His Thr Arg Gly Leu Asp Phe Ala Cys
645 650 655
Asp Ile Tyr Ile Trp Ala Pro Leu Ala Gly Thr Cys Gly Val Leu Leu
660 665 670
Leu Ser Leu Val Ile Thr Leu Tyr Cys Lys Arg Gly Arg Lys Lys Leu
675 680 685
Leu Tyr Ile Phe Lys Gln Pro Phe Met Arg Pro Val Gln Thr Thr Gln
690 695 700
Glu Glu Asp Gly Cys Ser Cys Arg Phe Pro Glu Glu Glu Glu Gly Gly
705 710 715 720
Cys Glu Leu Arg Val Lys Phe Ser Arg Ser Ala Asp Ala Pro Ala Tyr
725 730 735
Lys Gln Gly Gln Asn Gln Leu Tyr Asn Glu Leu Asn Leu Gly Arg Arg
740 745 750
Glu Glu Tyr Asp Val Leu Asp Lys Arg Arg Gly Arg Asp Pro Glu Met
755 760 765
Gly Gly Lys Pro Arg Arg Lys Asn Pro Gln Glu Gly Leu Tyr Asn Glu
770 775 780
Leu Gln Lys Asp Lys Met Ala Glu Ala Tyr Ser Glu Ile Gly Met Lys
785 790 795 800
Gly Glu Arg Arg Arg Gly Lys Gly His Asp Gly Leu Tyr Gln Gly Leu
805 810 815
Ser Thr Ala Thr Lys Asp Thr Tyr Asp Ala Leu His Met Gln Ala Leu
820 825 830
Pro Pro Arg Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala
835 840 845
Gly Asp Val Glu Glu Asn Pro Gly Pro Met Ser Ser Lys Gly Ser Val
850 855 860
Val Leu Ala Tyr Ser Gly Gly Leu Asp Thr Ser Cys Ile Leu Val Trp
865 870 875 880
Leu Lys Glu Gln Gly Tyr Asp Val Ile Ala Tyr Leu Ala Asn Ile Gly
885 890 895
Gln Lys Glu Asp Phe Glu Glu Ala Arg Lys Lys Ala Leu Lys Leu Gly
900 905 910
Ala Lys Lys Val Phe Ile Glu Asp Val Ser Arg Glu Phe Val Glu Glu
915 920 925
Phe Ile Trp Pro Ala Ile Gln Ser Ser Ala Leu Tyr Glu Asp Arg Tyr
930 935 940
Leu Leu Gly Thr Ser Leu Ala Arg Pro Cys Ile Ala Arg Lys Gln Val
945 950 955 960
Glu Ile Ala Gln Arg Glu Gly Ala Lys Tyr Val Ser His Gly Ala Thr
965 970 975
Gly Lys Gly Asn Asp Gln Val Arg Phe Glu Leu Ser Cys Tyr Ser Leu
980 985 990
Ala Pro Gln Ile Lys Val Ile Ala Pro Trp Arg Met Pro Glu Phe Tyr
995 1000 1005
Asn Arg Phe Lys Gly Arg Asn Asp Leu Met Glu Tyr Ala Lys Gln
1010 1015 1020
His Gly Ile Pro Ile Pro Val Thr Pro Lys Asn Pro Trp Ser Met
1025 1030 1035
Asp Glu Asn Leu Met His Ile Ser Tyr Glu Ala Gly Ile Leu Glu
1040 1045 1050
Asn Pro Lys Asn Gln Ala Pro Pro Gly Leu Tyr Thr Lys Thr Gln
1055 1060 1065
Asp Pro Ala Lys Ala Pro Asn Thr Pro Asp Ile Leu Glu Ile Glu
1070 1075 1080
Phe Lys Lys Gly Val Pro Val Lys Val Thr Asn Val Lys Asp Gly
1085 1090 1095
Thr Thr His Gln Thr Ser Leu Glu Leu Phe Met Tyr Leu Asn Glu
1100 1105 1110
Val Ala Gly Lys His Gly Val Gly Arg Ile Asp Ile Val Glu Asn
1115 1120 1125
Arg Phe Ile Gly Met Lys Ser Arg Gly Ile Tyr Glu Thr Pro Ala
1130 1135 1140
Gly Thr Ile Leu Tyr His Ala His Leu Asp Ile Glu Ala Phe Thr
1145 1150 1155
Met Asp Arg Glu Val Arg Lys Ile Lys Gln Gly Leu Gly Leu Lys
1160 1165 1170
Phe Ala Glu Leu Val Tyr Thr Gly Phe Trp His Ser Pro Glu Cys
1175 1180 1185
Glu Phe Val Arg His Cys Ile Ala Lys Ser Gln Glu Arg Val Glu
1190 1195 1200
Gly Lys Val Gln Val Ser Val Leu Lys Gly Gln Val Tyr Ile Leu
1205 1210 1215
Gly Arg Glu Ser Pro Leu Ser Leu Tyr Asn Glu Glu Leu Val Ser
1220 1225 1230
Met Asn Val Gln Gly Asp Tyr Glu Pro Thr Asp Ala Thr Gly Phe
1235 1240 1245
Ile Asn Ile Asn Ser Leu Arg Leu Lys Glu Tyr His Arg Leu Gln
1250 1255 1260
Ser Lys Val Thr Ala Lys
1265
<210> 20
<211> 1211
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 本发明的示例性蛋白CD33 OTC
<400> 20
Met Pro Arg Gly Trp Thr Ala Leu Cys Leu Leu Ser Leu Leu Pro Ser
1 5 10 15
Gly Phe Met Ser Leu Asp Asn Asn Gly Thr Ala Thr Pro Glu Leu Pro
20 25 30
Thr Gln Gly Thr Phe Ser Asn Val Ser Thr Asn Val Ser Tyr Gln Glu
35 40 45
Thr Thr Thr Pro Ser Thr Leu Gly Ser Thr Ser Leu His Pro Val Ser
50 55 60
Gln His Gly Asn Glu Ala Thr Thr Asn Ile Thr Glu Thr Thr Val Lys
65 70 75 80
Phe Thr Ser Thr Ser Val Ile Thr Ser Val Tyr Gly Asn Thr Asn Ser
85 90 95
Ser Val Gln Ser Gln Thr Ser Val Ile Ser Thr Val Phe Thr Thr Pro
100 105 110
Ala Asn Val Ser Thr Pro Glu Thr Thr Leu Lys Pro Ser Leu Ser Pro
115 120 125
Gly Asn Val Ser Asp Leu Ser Thr Thr Ser Thr Ser Leu Ala Thr Ser
130 135 140
Pro Thr Lys Pro Tyr Thr Ser Ser Ser Pro Ile Leu Ser Asp Ile Lys
145 150 155 160
Ala Glu Ile Lys Cys Ser Gly Ile Arg Glu Val Lys Leu Thr Gln Gly
165 170 175
Ile Cys Leu Glu Gln Asn Lys Thr Ser Ser Cys Ala Glu Phe Lys Lys
180 185 190
Asp Arg Gly Glu Gly Leu Ala Arg Val Leu Cys Gly Glu Glu Gln Ala
195 200 205
Asp Ala Asp Ala Gly Ala Gln Val Cys Ser Leu Leu Leu Ala Gln Ser
210 215 220
Glu Val Arg Pro Gln Cys Leu Leu Leu Val Leu Ala Asn Arg Thr Glu
225 230 235 240
Ile Ser Ser Lys Leu Gln Leu Met Lys Lys His Gln Ser Asp Leu Lys
245 250 255
Lys Leu Gly Ile Leu Asp Phe Thr Glu Gln Asp Val Ala Ser His Gln
260 265 270
Ser Tyr Ser Gln Lys Thr Leu Ile Ala Leu Val Thr Ser Gly Ala Leu
275 280 285
Leu Ala Val Leu Gly Ile Thr Gly Tyr Phe Leu Met Asn Arg Arg Ser
290 295 300
Trp Ser Pro Thr Gly Glu Arg Leu Glu Leu Glu Pro Val Asp Arg Val
305 310 315 320
Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu
325 330 335
Ser Asn Pro Gly Pro Gly Asn Met Ala Leu Pro Val Thr Ala Leu Leu
340 345 350
Leu Pro Leu Ala Leu Leu Leu His Ala Ala Arg Pro Gly Ser Asn Ile
355 360 365
Met Leu Thr Gln Ser Pro Ser Ser Leu Ala Val Ser Ala Gly Glu Lys
370 375 380
Val Thr Met Ser Cys Lys Ser Ser Gln Ser Val Phe Phe Ser Ser Ser
385 390 395 400
Gln Lys Asn Tyr Leu Ala Trp Tyr Gln Gln Ile Pro Gly Gln Ser Pro
405 410 415
Lys Leu Leu Ile Tyr Trp Ala Ser Thr Arg Glu Ser Gly Val Pro Asp
420 425 430
Arg Phe Thr Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser
435 440 445
Ser Val Gln Ser Glu Asp Leu Ala Ile Tyr Tyr Cys His Gln Tyr Leu
450 455 460
Ser Ser Arg Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile Lys Arg Gly
465 470 475 480
Gly Gly Gly Ser Gly Gly Gly Gly Ser Ser Gly Gly Gly Ser Gln Val
485 490 495
Gln Leu Gln Gln Pro Gly Ala Glu Val Val Lys Pro Gly Ala Ser Val
500 505 510
Lys Met Ser Cys Lys Ala Ser Gly Tyr Thr Phe Thr Ser Tyr Tyr Ile
515 520 525
His Trp Ile Lys Gln Thr Pro Gly Gln Gly Leu Glu Trp Val Gly Val
530 535 540
Ile Tyr Pro Gly Asn Asp Asp Ile Ser Tyr Asn Gln Lys Phe Lys Gly
545 550 555 560
Lys Ala Thr Leu Thr Ala Asp Lys Ser Ser Thr Thr Ala Tyr Met Gln
565 570 575
Leu Ser Ser Leu Thr Ser Glu Asp Ser Ala Val Tyr Tyr Cys Ala Arg
580 585 590
Glu Val Arg Leu Arg Tyr Phe Asp Val Trp Gly Ala Gly Thr Thr Val
595 600 605
Thr Val Ser Ser Thr Thr Thr Pro Ala Pro Arg Pro Pro Thr Pro Ala
610 615 620
Pro Thr Ile Ala Ser Gln Pro Leu Ser Leu Arg Pro Glu Ala Cys Arg
625 630 635 640
Pro Ala Ala Gly Gly Ala Val His Thr Arg Gly Leu Asp Phe Ala Cys
645 650 655
Asp Ile Tyr Ile Trp Ala Pro Leu Ala Gly Thr Cys Gly Val Leu Leu
660 665 670
Leu Ser Leu Val Ile Thr Leu Tyr Cys Lys Arg Gly Arg Lys Lys Leu
675 680 685
Leu Tyr Ile Phe Lys Gln Pro Phe Met Arg Pro Val Gln Thr Thr Gln
690 695 700
Glu Glu Asp Gly Cys Ser Cys Arg Phe Pro Glu Glu Glu Glu Gly Gly
705 710 715 720
Cys Glu Leu Arg Val Lys Phe Ser Arg Ser Ala Asp Ala Pro Ala Tyr
725 730 735
Lys Gln Gly Gln Asn Gln Leu Tyr Asn Glu Leu Asn Leu Gly Arg Arg
740 745 750
Glu Glu Tyr Asp Val Leu Asp Lys Arg Arg Gly Arg Asp Pro Glu Met
755 760 765
Gly Gly Lys Pro Arg Arg Lys Asn Pro Gln Glu Gly Leu Tyr Asn Glu
770 775 780
Leu Gln Lys Asp Lys Met Ala Glu Ala Tyr Ser Glu Ile Gly Met Lys
785 790 795 800
Gly Glu Arg Arg Arg Gly Lys Gly His Asp Gly Leu Tyr Gln Gly Leu
805 810 815
Ser Thr Ala Thr Lys Asp Thr Tyr Asp Ala Leu His Met Gln Ala Leu
820 825 830
Pro Pro Arg Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala
835 840 845
Gly Asp Val Glu Glu Asn Pro Gly Pro Met Leu Phe Asn Leu Arg Ile
850 855 860
Leu Leu Asn Asn Ala Ala Phe Arg Asn Gly His Asn Phe Met Val Arg
865 870 875 880
Asn Phe Arg Cys Gly Gln Pro Leu Gln Asn Lys Val Gln Leu Lys Gly
885 890 895
Arg Asp Leu Leu Thr Leu Lys Asn Phe Thr Gly Glu Glu Ile Lys Tyr
900 905 910
Met Leu Trp Leu Ser Ala Asp Leu Lys Phe Arg Ile Lys Gln Lys Gly
915 920 925
Glu Tyr Leu Pro Leu Leu Gln Gly Lys Ser Leu Gly Met Ile Phe Glu
930 935 940
Lys Arg Ser Thr Arg Thr Arg Leu Ser Thr Glu Thr Gly Leu Ala Leu
945 950 955 960
Leu Gly Gly His Pro Cys Phe Leu Thr Thr Gln Asp Ile His Leu Gly
965 970 975
Val Asn Glu Ser Leu Thr Asp Thr Ala Arg Val Leu Ser Ser Met Ala
980 985 990
Asp Ala Val Leu Ala Arg Val Tyr Lys Gln Ser Asp Leu Asp Thr Leu
995 1000 1005
Ala Lys Glu Ala Ser Ile Pro Ile Ile Asn Gly Leu Ser Asp Leu
1010 1015 1020
Tyr His Pro Ile Gln Ile Leu Ala Asp Tyr Leu Thr Leu Gln Glu
1025 1030 1035
His Tyr Ser Ser Leu Lys Gly Leu Thr Leu Ser Trp Ile Gly Asp
1040 1045 1050
Gly Asn Asn Ile Leu His Ser Ile Met Met Ser Ala Ala Lys Phe
1055 1060 1065
Gly Met His Leu Gln Ala Ala Thr Pro Lys Gly Tyr Glu Pro Asp
1070 1075 1080
Ala Ser Val Thr Lys Leu Ala Glu Gln Tyr Ala Lys Glu Asn Gly
1085 1090 1095
Thr Lys Leu Leu Leu Thr Asn Asp Pro Leu Glu Ala Ala His Gly
1100 1105 1110
Gly Asn Val Leu Ile Thr Asp Thr Trp Ile Ser Met Gly Gln Glu
1115 1120 1125
Glu Glu Lys Lys Lys Arg Leu Gln Ala Phe Gln Gly Tyr Gln Val
1130 1135 1140
Thr Met Lys Thr Ala Lys Val Ala Ala Ser Asp Trp Thr Phe Leu
1145 1150 1155
His Cys Leu Pro Arg Lys Pro Glu Glu Val Asp Asp Glu Val Phe
1160 1165 1170
Tyr Ser Pro Arg Ser Leu Val Phe Pro Glu Ala Glu Asn Arg Lys
1175 1180 1185
Trp Thr Ile Met Ala Val Met Val Ser Leu Leu Thr Asp Tyr Ser
1190 1195 1200
Pro Gln Leu Gln Lys Pro Lys Phe
1205 1210
<210> 21
<211> 1651
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 本发明的示例性蛋白EGFR ASS1+OTC
<400> 21
Met Pro Arg Gly Trp Thr Ala Leu Cys Leu Leu Ser Leu Leu Pro Ser
1 5 10 15
Gly Phe Met Ser Leu Asp Asn Asn Gly Thr Ala Thr Pro Glu Leu Pro
20 25 30
Thr Gln Gly Thr Phe Ser Asn Val Ser Thr Asn Val Ser Tyr Gln Glu
35 40 45
Thr Thr Thr Pro Ser Thr Leu Gly Ser Thr Ser Leu His Pro Val Ser
50 55 60
Gln His Gly Asn Glu Ala Thr Thr Asn Ile Thr Glu Thr Thr Val Lys
65 70 75 80
Phe Thr Ser Thr Ser Val Ile Thr Ser Val Tyr Gly Asn Thr Asn Ser
85 90 95
Ser Val Gln Ser Gln Thr Ser Val Ile Ser Thr Val Phe Thr Thr Pro
100 105 110
Ala Asn Val Ser Thr Pro Glu Thr Thr Leu Lys Pro Ser Leu Ser Pro
115 120 125
Gly Asn Val Ser Asp Leu Ser Thr Thr Ser Thr Ser Leu Ala Thr Ser
130 135 140
Pro Thr Lys Pro Tyr Thr Ser Ser Ser Pro Ile Leu Ser Asp Ile Lys
145 150 155 160
Ala Glu Ile Lys Cys Ser Gly Ile Arg Glu Val Lys Leu Thr Gln Gly
165 170 175
Ile Cys Leu Glu Gln Asn Lys Thr Ser Ser Cys Ala Glu Phe Lys Lys
180 185 190
Asp Arg Gly Glu Gly Leu Ala Arg Val Leu Cys Gly Glu Glu Gln Ala
195 200 205
Asp Ala Asp Ala Gly Ala Gln Val Cys Ser Leu Leu Leu Ala Gln Ser
210 215 220
Glu Val Arg Pro Gln Cys Leu Leu Leu Val Leu Ala Asn Arg Thr Glu
225 230 235 240
Ile Ser Ser Lys Leu Gln Leu Met Lys Lys His Gln Ser Asp Leu Lys
245 250 255
Lys Leu Gly Ile Leu Asp Phe Thr Glu Gln Asp Val Ala Ser His Gln
260 265 270
Ser Tyr Ser Gln Lys Thr Leu Ile Ala Leu Val Thr Ser Gly Ala Leu
275 280 285
Leu Ala Val Leu Gly Ile Thr Gly Tyr Phe Leu Met Asn Arg Arg Ser
290 295 300
Trp Ser Pro Thr Gly Glu Arg Leu Glu Leu Glu Pro Val Asp Arg Val
305 310 315 320
Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu
325 330 335
Ser Asn Pro Gly Pro Gly Asn Met Ala Leu Pro Val Thr Ala Leu Leu
340 345 350
Leu Pro Leu Ala Leu Leu Leu His Ala Ala Arg Pro Gln Val Gln Leu
355 360 365
Gln Gln Ser Gly Gly Gly Leu Val Lys Pro Gly Ala Ser Leu Lys Leu
370 375 380
Ser Cys Val Thr Ser Gly Phe Thr Phe Arg Lys Phe Gly Met Ser Trp
385 390 395 400
Val Arg Gln Thr Ser Asp Lys Arg Leu Glu Trp Val Ala Ser Ile Ser
405 410 415
Thr Gly Gly Tyr Asn Thr Tyr Tyr Ser Asp Asn Val Lys Gly Arg Phe
420 425 430
Thr Ile Ser Arg Glu Asn Ala Lys Asn Thr Leu Tyr Leu Gln Met Ser
435 440 445
Ser Leu Lys Ser Glu Asp Thr Ala Leu Tyr Tyr Cys Thr Arg Gly Tyr
450 455 460
Ser Ser Thr Ser Tyr Ala Met Asp Tyr Trp Gly Gln Gly Thr Thr Val
465 470 475 480
Thr Val Ser Ser Ser Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
485 490 495
Gly Gly Ser Asp Ile Glu Leu Thr Gln Ser Pro Ala Ser Leu Ser Val
500 505 510
Ala Thr Gly Glu Lys Val Thr Ile Arg Cys Met Thr Ser Thr Asp Ile
515 520 525
Asp Asp Asp Met Asn Trp Tyr Gln Gln Lys Pro Gly Glu Pro Pro Lys
530 535 540
Phe Leu Ile Ser Glu Gly Asn Thr Leu Arg Gly Val Pro Ser Arg Phe
545 550 555 560
Ser Ser Ser Gly Thr Gly Thr Asp Phe Val Phe Thr Ile Glu Asn Thr
565 570 575
Leu Ser Glu Asp Val Gly Asp Tyr Tyr Cys Leu Gln Ser Phe Asn Val
580 585 590
Pro Leu Thr Phe Gly Asp Gly Thr Lys Leu Glu Lys Ala Leu Glu Gln
595 600 605
Lys Leu Ile Ser Glu Glu Asp Leu Ala Lys Pro Thr Thr Thr Pro Ala
610 615 620
Pro Arg Pro Pro Thr Pro Ala Pro Thr Ile Ala Ser Gln Pro Leu Ser
625 630 635 640
Leu Arg Pro Glu Ala Cys Arg Pro Ala Ala Gly Gly Ala Val His Thr
645 650 655
Arg Gly Leu Asp Phe Ala Cys Asp Ile Tyr Ile Trp Ala Pro Leu Ala
660 665 670
Gly Thr Cys Gly Val Leu Leu Leu Ser Leu Val Ile Thr Leu Tyr Cys
675 680 685
Lys Arg Gly Arg Lys Lys Leu Leu Tyr Ile Phe Lys Gln Pro Phe Met
690 695 700
Arg Pro Val Gln Thr Thr Gln Glu Glu Asp Gly Cys Ser Cys Arg Phe
705 710 715 720
Pro Glu Glu Glu Glu Gly Gly Cys Glu Leu Arg Val Lys Phe Ser Arg
725 730 735
Ser Ala Asp Ala Pro Ala Tyr Lys Gln Gly Gln Asn Gln Leu Tyr Asn
740 745 750
Glu Leu Asn Leu Gly Arg Arg Glu Glu Tyr Asp Val Leu Asp Lys Arg
755 760 765
Arg Gly Arg Asp Pro Glu Met Gly Gly Lys Pro Arg Arg Lys Asn Pro
770 775 780
Gln Glu Gly Leu Tyr Asn Glu Leu Gln Lys Asp Lys Met Ala Glu Ala
785 790 795 800
Tyr Ser Glu Ile Gly Met Lys Gly Glu Arg Arg Arg Gly Lys Gly His
805 810 815
Asp Gly Leu Tyr Gln Gly Leu Ser Thr Ala Thr Lys Asp Thr Tyr Asp
820 825 830
Ala Leu His Met Gln Ala Leu Pro Pro Arg Gly Ser Gly Ala Thr Asn
835 840 845
Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro
850 855 860
Met Ser Ser Lys Gly Ser Val Val Leu Ala Tyr Ser Gly Gly Leu Asp
865 870 875 880
Thr Ser Cys Ile Leu Val Trp Leu Lys Glu Gln Gly Tyr Asp Val Ile
885 890 895
Ala Tyr Leu Ala Asn Ile Gly Gln Lys Glu Asp Phe Glu Glu Ala Arg
900 905 910
Lys Lys Ala Leu Lys Leu Gly Ala Lys Lys Val Phe Ile Glu Asp Val
915 920 925
Ser Arg Glu Phe Val Glu Glu Phe Ile Trp Pro Ala Ile Gln Ser Ser
930 935 940
Ala Leu Tyr Glu Asp Arg Tyr Leu Leu Gly Thr Ser Leu Ala Arg Pro
945 950 955 960
Cys Ile Ala Arg Lys Gln Val Glu Ile Ala Gln Arg Glu Gly Ala Lys
965 970 975
Tyr Val Ser His Gly Ala Thr Gly Lys Gly Asn Asp Gln Val Arg Phe
980 985 990
Glu Leu Ser Cys Tyr Ser Leu Ala Pro Gln Ile Lys Val Ile Ala Pro
995 1000 1005
Trp Arg Met Pro Glu Phe Tyr Asn Arg Phe Lys Gly Arg Asn Asp
1010 1015 1020
Leu Met Glu Tyr Ala Lys Gln His Gly Ile Pro Ile Pro Val Thr
1025 1030 1035
Pro Lys Asn Pro Trp Ser Met Asp Glu Asn Leu Met His Ile Ser
1040 1045 1050
Tyr Glu Ala Gly Ile Leu Glu Asn Pro Lys Asn Gln Ala Pro Pro
1055 1060 1065
Gly Leu Tyr Thr Lys Thr Gln Asp Pro Ala Lys Ala Pro Asn Thr
1070 1075 1080
Pro Asp Ile Leu Glu Ile Glu Phe Lys Lys Gly Val Pro Val Lys
1085 1090 1095
Val Thr Asn Val Lys Asp Gly Thr Thr His Gln Thr Ser Leu Glu
1100 1105 1110
Leu Phe Met Tyr Leu Asn Glu Val Ala Gly Lys His Gly Val Gly
1115 1120 1125
Arg Ile Asp Ile Val Glu Asn Arg Phe Ile Gly Met Lys Ser Arg
1130 1135 1140
Gly Ile Tyr Glu Thr Pro Ala Gly Thr Ile Leu Tyr His Ala His
1145 1150 1155
Leu Asp Ile Glu Ala Phe Thr Met Asp Arg Glu Val Arg Lys Ile
1160 1165 1170
Lys Gln Gly Leu Gly Leu Lys Phe Ala Glu Leu Val Tyr Thr Gly
1175 1180 1185
Phe Trp His Ser Pro Glu Cys Glu Phe Val Arg His Cys Ile Ala
1190 1195 1200
Lys Ser Gln Glu Arg Val Glu Gly Lys Val Gln Val Ser Val Leu
1205 1210 1215
Lys Gly Gln Val Tyr Ile Leu Gly Arg Glu Ser Pro Leu Ser Leu
1220 1225 1230
Tyr Asn Glu Glu Leu Val Ser Met Asn Val Gln Gly Asp Tyr Glu
1235 1240 1245
Pro Thr Asp Ala Thr Gly Phe Ile Asn Ile Asn Ser Leu Arg Leu
1250 1255 1260
Lys Glu Tyr His Arg Leu Gln Ser Lys Val Thr Ala Lys Gly Ser
1265 1270 1275
Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu
1280 1285 1290
Asn Pro Gly Pro Met Leu Phe Asn Leu Arg Ile Leu Leu Asn Asn
1295 1300 1305
Ala Ala Phe Arg Asn Gly His Asn Phe Met Val Arg Asn Phe Arg
1310 1315 1320
Cys Gly Gln Pro Leu Gln Asn Lys Val Gln Leu Lys Gly Arg Asp
1325 1330 1335
Leu Leu Thr Leu Lys Asn Phe Thr Gly Glu Glu Ile Lys Tyr Met
1340 1345 1350
Leu Trp Leu Ser Ala Asp Leu Lys Phe Arg Ile Lys Gln Lys Gly
1355 1360 1365
Glu Tyr Leu Pro Leu Leu Gln Gly Lys Ser Leu Gly Met Ile Phe
1370 1375 1380
Glu Lys Arg Ser Thr Arg Thr Arg Leu Ser Thr Glu Thr Gly Leu
1385 1390 1395
Ala Leu Leu Gly Gly His Pro Cys Phe Leu Thr Thr Gln Asp Ile
1400 1405 1410
His Leu Gly Val Asn Glu Ser Leu Thr Asp Thr Ala Arg Val Leu
1415 1420 1425
Ser Ser Met Ala Asp Ala Val Leu Ala Arg Val Tyr Lys Gln Ser
1430 1435 1440
Asp Leu Asp Thr Leu Ala Lys Glu Ala Ser Ile Pro Ile Ile Asn
1445 1450 1455
Gly Leu Ser Asp Leu Tyr His Pro Ile Gln Ile Leu Ala Asp Tyr
1460 1465 1470
Leu Thr Leu Gln Glu His Tyr Ser Ser Leu Lys Gly Leu Thr Leu
1475 1480 1485
Ser Trp Ile Gly Asp Gly Asn Asn Ile Leu His Ser Ile Met Met
1490 1495 1500
Ser Ala Ala Lys Phe Gly Met His Leu Gln Ala Ala Thr Pro Lys
1505 1510 1515
Gly Tyr Glu Pro Asp Ala Ser Val Thr Lys Leu Ala Glu Gln Tyr
1520 1525 1530
Ala Lys Glu Asn Gly Thr Lys Leu Leu Leu Thr Asn Asp Pro Leu
1535 1540 1545
Glu Ala Ala His Gly Gly Asn Val Leu Ile Thr Asp Thr Trp Ile
1550 1555 1560
Ser Met Gly Gln Glu Glu Glu Lys Lys Lys Arg Leu Gln Ala Phe
1565 1570 1575
Gln Gly Tyr Gln Val Thr Met Lys Thr Ala Lys Val Ala Ala Ser
1580 1585 1590
Asp Trp Thr Phe Leu His Cys Leu Pro Arg Lys Pro Glu Glu Val
1595 1600 1605
Asp Asp Glu Val Phe Tyr Ser Pro Arg Ser Leu Val Phe Pro Glu
1610 1615 1620
Ala Glu Asn Arg Lys Trp Thr Ile Met Ala Val Met Val Ser Leu
1625 1630 1635
Leu Thr Asp Tyr Ser Pro Gln Leu Gln Lys Pro Lys Phe
1640 1645 1650
<210> 22
<211> 1276
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 本发明的示例性蛋白EGFR ASS1
<400> 22
Met Pro Arg Gly Trp Thr Ala Leu Cys Leu Leu Ser Leu Leu Pro Ser
1 5 10 15
Gly Phe Met Ser Leu Asp Asn Asn Gly Thr Ala Thr Pro Glu Leu Pro
20 25 30
Thr Gln Gly Thr Phe Ser Asn Val Ser Thr Asn Val Ser Tyr Gln Glu
35 40 45
Thr Thr Thr Pro Ser Thr Leu Gly Ser Thr Ser Leu His Pro Val Ser
50 55 60
Gln His Gly Asn Glu Ala Thr Thr Asn Ile Thr Glu Thr Thr Val Lys
65 70 75 80
Phe Thr Ser Thr Ser Val Ile Thr Ser Val Tyr Gly Asn Thr Asn Ser
85 90 95
Ser Val Gln Ser Gln Thr Ser Val Ile Ser Thr Val Phe Thr Thr Pro
100 105 110
Ala Asn Val Ser Thr Pro Glu Thr Thr Leu Lys Pro Ser Leu Ser Pro
115 120 125
Gly Asn Val Ser Asp Leu Ser Thr Thr Ser Thr Ser Leu Ala Thr Ser
130 135 140
Pro Thr Lys Pro Tyr Thr Ser Ser Ser Pro Ile Leu Ser Asp Ile Lys
145 150 155 160
Ala Glu Ile Lys Cys Ser Gly Ile Arg Glu Val Lys Leu Thr Gln Gly
165 170 175
Ile Cys Leu Glu Gln Asn Lys Thr Ser Ser Cys Ala Glu Phe Lys Lys
180 185 190
Asp Arg Gly Glu Gly Leu Ala Arg Val Leu Cys Gly Glu Glu Gln Ala
195 200 205
Asp Ala Asp Ala Gly Ala Gln Val Cys Ser Leu Leu Leu Ala Gln Ser
210 215 220
Glu Val Arg Pro Gln Cys Leu Leu Leu Val Leu Ala Asn Arg Thr Glu
225 230 235 240
Ile Ser Ser Lys Leu Gln Leu Met Lys Lys His Gln Ser Asp Leu Lys
245 250 255
Lys Leu Gly Ile Leu Asp Phe Thr Glu Gln Asp Val Ala Ser His Gln
260 265 270
Ser Tyr Ser Gln Lys Thr Leu Ile Ala Leu Val Thr Ser Gly Ala Leu
275 280 285
Leu Ala Val Leu Gly Ile Thr Gly Tyr Phe Leu Met Asn Arg Arg Ser
290 295 300
Trp Ser Pro Thr Gly Glu Arg Leu Glu Leu Glu Pro Val Asp Arg Val
305 310 315 320
Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu
325 330 335
Ser Asn Pro Gly Pro Gly Asn Met Ala Leu Pro Val Thr Ala Leu Leu
340 345 350
Leu Pro Leu Ala Leu Leu Leu His Ala Ala Arg Pro Gln Val Gln Leu
355 360 365
Gln Gln Ser Gly Gly Gly Leu Val Lys Pro Gly Ala Ser Leu Lys Leu
370 375 380
Ser Cys Val Thr Ser Gly Phe Thr Phe Arg Lys Phe Gly Met Ser Trp
385 390 395 400
Val Arg Gln Thr Ser Asp Lys Arg Leu Glu Trp Val Ala Ser Ile Ser
405 410 415
Thr Gly Gly Tyr Asn Thr Tyr Tyr Ser Asp Asn Val Lys Gly Arg Phe
420 425 430
Thr Ile Ser Arg Glu Asn Ala Lys Asn Thr Leu Tyr Leu Gln Met Ser
435 440 445
Ser Leu Lys Ser Glu Asp Thr Ala Leu Tyr Tyr Cys Thr Arg Gly Tyr
450 455 460
Ser Ser Thr Ser Tyr Ala Met Asp Tyr Trp Gly Gln Gly Thr Thr Val
465 470 475 480
Thr Val Ser Ser Ser Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
485 490 495
Gly Gly Ser Asp Ile Glu Leu Thr Gln Ser Pro Ala Ser Leu Ser Val
500 505 510
Ala Thr Gly Glu Lys Val Thr Ile Arg Cys Met Thr Ser Thr Asp Ile
515 520 525
Asp Asp Asp Met Asn Trp Tyr Gln Gln Lys Pro Gly Glu Pro Pro Lys
530 535 540
Phe Leu Ile Ser Glu Gly Asn Thr Leu Arg Gly Val Pro Ser Arg Phe
545 550 555 560
Ser Ser Ser Gly Thr Gly Thr Asp Phe Val Phe Thr Ile Glu Asn Thr
565 570 575
Leu Ser Glu Asp Val Gly Asp Tyr Tyr Cys Leu Gln Ser Phe Asn Val
580 585 590
Pro Leu Thr Phe Gly Asp Gly Thr Lys Leu Glu Lys Ala Leu Glu Gln
595 600 605
Lys Leu Ile Ser Glu Glu Asp Leu Ala Lys Pro Thr Thr Thr Pro Ala
610 615 620
Pro Arg Pro Pro Thr Pro Ala Pro Thr Ile Ala Ser Gln Pro Leu Ser
625 630 635 640
Leu Arg Pro Glu Ala Cys Arg Pro Ala Ala Gly Gly Ala Val His Thr
645 650 655
Arg Gly Leu Asp Phe Ala Cys Asp Ile Tyr Ile Trp Ala Pro Leu Ala
660 665 670
Gly Thr Cys Gly Val Leu Leu Leu Ser Leu Val Ile Thr Leu Tyr Cys
675 680 685
Lys Arg Gly Arg Lys Lys Leu Leu Tyr Ile Phe Lys Gln Pro Phe Met
690 695 700
Arg Pro Val Gln Thr Thr Gln Glu Glu Asp Gly Cys Ser Cys Arg Phe
705 710 715 720
Pro Glu Glu Glu Glu Gly Gly Cys Glu Leu Arg Val Lys Phe Ser Arg
725 730 735
Ser Ala Asp Ala Pro Ala Tyr Lys Gln Gly Gln Asn Gln Leu Tyr Asn
740 745 750
Glu Leu Asn Leu Gly Arg Arg Glu Glu Tyr Asp Val Leu Asp Lys Arg
755 760 765
Arg Gly Arg Asp Pro Glu Met Gly Gly Lys Pro Arg Arg Lys Asn Pro
770 775 780
Gln Glu Gly Leu Tyr Asn Glu Leu Gln Lys Asp Lys Met Ala Glu Ala
785 790 795 800
Tyr Ser Glu Ile Gly Met Lys Gly Glu Arg Arg Arg Gly Lys Gly His
805 810 815
Asp Gly Leu Tyr Gln Gly Leu Ser Thr Ala Thr Lys Asp Thr Tyr Asp
820 825 830
Ala Leu His Met Gln Ala Leu Pro Pro Arg Gly Ser Gly Ala Thr Asn
835 840 845
Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro
850 855 860
Met Ser Ser Lys Gly Ser Val Val Leu Ala Tyr Ser Gly Gly Leu Asp
865 870 875 880
Thr Ser Cys Ile Leu Val Trp Leu Lys Glu Gln Gly Tyr Asp Val Ile
885 890 895
Ala Tyr Leu Ala Asn Ile Gly Gln Lys Glu Asp Phe Glu Glu Ala Arg
900 905 910
Lys Lys Ala Leu Lys Leu Gly Ala Lys Lys Val Phe Ile Glu Asp Val
915 920 925
Ser Arg Glu Phe Val Glu Glu Phe Ile Trp Pro Ala Ile Gln Ser Ser
930 935 940
Ala Leu Tyr Glu Asp Arg Tyr Leu Leu Gly Thr Ser Leu Ala Arg Pro
945 950 955 960
Cys Ile Ala Arg Lys Gln Val Glu Ile Ala Gln Arg Glu Gly Ala Lys
965 970 975
Tyr Val Ser His Gly Ala Thr Gly Lys Gly Asn Asp Gln Val Arg Phe
980 985 990
Glu Leu Ser Cys Tyr Ser Leu Ala Pro Gln Ile Lys Val Ile Ala Pro
995 1000 1005
Trp Arg Met Pro Glu Phe Tyr Asn Arg Phe Lys Gly Arg Asn Asp
1010 1015 1020
Leu Met Glu Tyr Ala Lys Gln His Gly Ile Pro Ile Pro Val Thr
1025 1030 1035
Pro Lys Asn Pro Trp Ser Met Asp Glu Asn Leu Met His Ile Ser
1040 1045 1050
Tyr Glu Ala Gly Ile Leu Glu Asn Pro Lys Asn Gln Ala Pro Pro
1055 1060 1065
Gly Leu Tyr Thr Lys Thr Gln Asp Pro Ala Lys Ala Pro Asn Thr
1070 1075 1080
Pro Asp Ile Leu Glu Ile Glu Phe Lys Lys Gly Val Pro Val Lys
1085 1090 1095
Val Thr Asn Val Lys Asp Gly Thr Thr His Gln Thr Ser Leu Glu
1100 1105 1110
Leu Phe Met Tyr Leu Asn Glu Val Ala Gly Lys His Gly Val Gly
1115 1120 1125
Arg Ile Asp Ile Val Glu Asn Arg Phe Ile Gly Met Lys Ser Arg
1130 1135 1140
Gly Ile Tyr Glu Thr Pro Ala Gly Thr Ile Leu Tyr His Ala His
1145 1150 1155
Leu Asp Ile Glu Ala Phe Thr Met Asp Arg Glu Val Arg Lys Ile
1160 1165 1170
Lys Gln Gly Leu Gly Leu Lys Phe Ala Glu Leu Val Tyr Thr Gly
1175 1180 1185
Phe Trp His Ser Pro Glu Cys Glu Phe Val Arg His Cys Ile Ala
1190 1195 1200
Lys Ser Gln Glu Arg Val Glu Gly Lys Val Gln Val Ser Val Leu
1205 1210 1215
Lys Gly Gln Val Tyr Ile Leu Gly Arg Glu Ser Pro Leu Ser Leu
1220 1225 1230
Tyr Asn Glu Glu Leu Val Ser Met Asn Val Gln Gly Asp Tyr Glu
1235 1240 1245
Pro Thr Asp Ala Thr Gly Phe Ile Asn Ile Asn Ser Leu Arg Leu
1250 1255 1260
Lys Glu Tyr His Arg Leu Gln Ser Lys Val Thr Ala Lys
1265 1270 1275
<210> 23
<211> 1218
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 本发明的示例性蛋白EGFR OTC
<400> 23
Met Pro Arg Gly Trp Thr Ala Leu Cys Leu Leu Ser Leu Leu Pro Ser
1 5 10 15
Gly Phe Met Ser Leu Asp Asn Asn Gly Thr Ala Thr Pro Glu Leu Pro
20 25 30
Thr Gln Gly Thr Phe Ser Asn Val Ser Thr Asn Val Ser Tyr Gln Glu
35 40 45
Thr Thr Thr Pro Ser Thr Leu Gly Ser Thr Ser Leu His Pro Val Ser
50 55 60
Gln His Gly Asn Glu Ala Thr Thr Asn Ile Thr Glu Thr Thr Val Lys
65 70 75 80
Phe Thr Ser Thr Ser Val Ile Thr Ser Val Tyr Gly Asn Thr Asn Ser
85 90 95
Ser Val Gln Ser Gln Thr Ser Val Ile Ser Thr Val Phe Thr Thr Pro
100 105 110
Ala Asn Val Ser Thr Pro Glu Thr Thr Leu Lys Pro Ser Leu Ser Pro
115 120 125
Gly Asn Val Ser Asp Leu Ser Thr Thr Ser Thr Ser Leu Ala Thr Ser
130 135 140
Pro Thr Lys Pro Tyr Thr Ser Ser Ser Pro Ile Leu Ser Asp Ile Lys
145 150 155 160
Ala Glu Ile Lys Cys Ser Gly Ile Arg Glu Val Lys Leu Thr Gln Gly
165 170 175
Ile Cys Leu Glu Gln Asn Lys Thr Ser Ser Cys Ala Glu Phe Lys Lys
180 185 190
Asp Arg Gly Glu Gly Leu Ala Arg Val Leu Cys Gly Glu Glu Gln Ala
195 200 205
Asp Ala Asp Ala Gly Ala Gln Val Cys Ser Leu Leu Leu Ala Gln Ser
210 215 220
Glu Val Arg Pro Gln Cys Leu Leu Leu Val Leu Ala Asn Arg Thr Glu
225 230 235 240
Ile Ser Ser Lys Leu Gln Leu Met Lys Lys His Gln Ser Asp Leu Lys
245 250 255
Lys Leu Gly Ile Leu Asp Phe Thr Glu Gln Asp Val Ala Ser His Gln
260 265 270
Ser Tyr Ser Gln Lys Thr Leu Ile Ala Leu Val Thr Ser Gly Ala Leu
275 280 285
Leu Ala Val Leu Gly Ile Thr Gly Tyr Phe Leu Met Asn Arg Arg Ser
290 295 300
Trp Ser Pro Thr Gly Glu Arg Leu Glu Leu Glu Pro Val Asp Arg Val
305 310 315 320
Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu
325 330 335
Ser Asn Pro Gly Pro Gly Asn Met Ala Leu Pro Val Thr Ala Leu Leu
340 345 350
Leu Pro Leu Ala Leu Leu Leu His Ala Ala Arg Pro Gln Val Gln Leu
355 360 365
Gln Gln Ser Gly Gly Gly Leu Val Lys Pro Gly Ala Ser Leu Lys Leu
370 375 380
Ser Cys Val Thr Ser Gly Phe Thr Phe Arg Lys Phe Gly Met Ser Trp
385 390 395 400
Val Arg Gln Thr Ser Asp Lys Arg Leu Glu Trp Val Ala Ser Ile Ser
405 410 415
Thr Gly Gly Tyr Asn Thr Tyr Tyr Ser Asp Asn Val Lys Gly Arg Phe
420 425 430
Thr Ile Ser Arg Glu Asn Ala Lys Asn Thr Leu Tyr Leu Gln Met Ser
435 440 445
Ser Leu Lys Ser Glu Asp Thr Ala Leu Tyr Tyr Cys Thr Arg Gly Tyr
450 455 460
Ser Ser Thr Ser Tyr Ala Met Asp Tyr Trp Gly Gln Gly Thr Thr Val
465 470 475 480
Thr Val Ser Ser Ser Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
485 490 495
Gly Gly Ser Asp Ile Glu Leu Thr Gln Ser Pro Ala Ser Leu Ser Val
500 505 510
Ala Thr Gly Glu Lys Val Thr Ile Arg Cys Met Thr Ser Thr Asp Ile
515 520 525
Asp Asp Asp Met Asn Trp Tyr Gln Gln Lys Pro Gly Glu Pro Pro Lys
530 535 540
Phe Leu Ile Ser Glu Gly Asn Thr Leu Arg Gly Val Pro Ser Arg Phe
545 550 555 560
Ser Ser Ser Gly Thr Gly Thr Asp Phe Val Phe Thr Ile Glu Asn Thr
565 570 575
Leu Ser Glu Asp Val Gly Asp Tyr Tyr Cys Leu Gln Ser Phe Asn Val
580 585 590
Pro Leu Thr Phe Gly Asp Gly Thr Lys Leu Glu Lys Ala Leu Glu Gln
595 600 605
Lys Leu Ile Ser Glu Glu Asp Leu Ala Lys Pro Thr Thr Thr Pro Ala
610 615 620
Pro Arg Pro Pro Thr Pro Ala Pro Thr Ile Ala Ser Gln Pro Leu Ser
625 630 635 640
Leu Arg Pro Glu Ala Cys Arg Pro Ala Ala Gly Gly Ala Val His Thr
645 650 655
Arg Gly Leu Asp Phe Ala Cys Asp Ile Tyr Ile Trp Ala Pro Leu Ala
660 665 670
Gly Thr Cys Gly Val Leu Leu Leu Ser Leu Val Ile Thr Leu Tyr Cys
675 680 685
Lys Arg Gly Arg Lys Lys Leu Leu Tyr Ile Phe Lys Gln Pro Phe Met
690 695 700
Arg Pro Val Gln Thr Thr Gln Glu Glu Asp Gly Cys Ser Cys Arg Phe
705 710 715 720
Pro Glu Glu Glu Glu Gly Gly Cys Glu Leu Arg Val Lys Phe Ser Arg
725 730 735
Ser Ala Asp Ala Pro Ala Tyr Lys Gln Gly Gln Asn Gln Leu Tyr Asn
740 745 750
Glu Leu Asn Leu Gly Arg Arg Glu Glu Tyr Asp Val Leu Asp Lys Arg
755 760 765
Arg Gly Arg Asp Pro Glu Met Gly Gly Lys Pro Arg Arg Lys Asn Pro
770 775 780
Gln Glu Gly Leu Tyr Asn Glu Leu Gln Lys Asp Lys Met Ala Glu Ala
785 790 795 800
Tyr Ser Glu Ile Gly Met Lys Gly Glu Arg Arg Arg Gly Lys Gly His
805 810 815
Asp Gly Leu Tyr Gln Gly Leu Ser Thr Ala Thr Lys Asp Thr Tyr Asp
820 825 830
Ala Leu His Met Gln Ala Leu Pro Pro Arg Gly Ser Gly Ala Thr Asn
835 840 845
Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro
850 855 860
Met Leu Phe Asn Leu Arg Ile Leu Leu Asn Asn Ala Ala Phe Arg Asn
865 870 875 880
Gly His Asn Phe Met Val Arg Asn Phe Arg Cys Gly Gln Pro Leu Gln
885 890 895
Asn Lys Val Gln Leu Lys Gly Arg Asp Leu Leu Thr Leu Lys Asn Phe
900 905 910
Thr Gly Glu Glu Ile Lys Tyr Met Leu Trp Leu Ser Ala Asp Leu Lys
915 920 925
Phe Arg Ile Lys Gln Lys Gly Glu Tyr Leu Pro Leu Leu Gln Gly Lys
930 935 940
Ser Leu Gly Met Ile Phe Glu Lys Arg Ser Thr Arg Thr Arg Leu Ser
945 950 955 960
Thr Glu Thr Gly Leu Ala Leu Leu Gly Gly His Pro Cys Phe Leu Thr
965 970 975
Thr Gln Asp Ile His Leu Gly Val Asn Glu Ser Leu Thr Asp Thr Ala
980 985 990
Arg Val Leu Ser Ser Met Ala Asp Ala Val Leu Ala Arg Val Tyr Lys
995 1000 1005
Gln Ser Asp Leu Asp Thr Leu Ala Lys Glu Ala Ser Ile Pro Ile
1010 1015 1020
Ile Asn Gly Leu Ser Asp Leu Tyr His Pro Ile Gln Ile Leu Ala
1025 1030 1035
Asp Tyr Leu Thr Leu Gln Glu His Tyr Ser Ser Leu Lys Gly Leu
1040 1045 1050
Thr Leu Ser Trp Ile Gly Asp Gly Asn Asn Ile Leu His Ser Ile
1055 1060 1065
Met Met Ser Ala Ala Lys Phe Gly Met His Leu Gln Ala Ala Thr
1070 1075 1080
Pro Lys Gly Tyr Glu Pro Asp Ala Ser Val Thr Lys Leu Ala Glu
1085 1090 1095
Gln Tyr Ala Lys Glu Asn Gly Thr Lys Leu Leu Leu Thr Asn Asp
1100 1105 1110
Pro Leu Glu Ala Ala His Gly Gly Asn Val Leu Ile Thr Asp Thr
1115 1120 1125
Trp Ile Ser Met Gly Gln Glu Glu Glu Lys Lys Lys Arg Leu Gln
1130 1135 1140
Ala Phe Gln Gly Tyr Gln Val Thr Met Lys Thr Ala Lys Val Ala
1145 1150 1155
Ala Ser Asp Trp Thr Phe Leu His Cys Leu Pro Arg Lys Pro Glu
1160 1165 1170
Glu Val Asp Asp Glu Val Phe Tyr Ser Pro Arg Ser Leu Val Phe
1175 1180 1185
Pro Glu Ala Glu Asn Arg Lys Trp Thr Ile Met Ala Val Met Val
1190 1195 1200
Ser Leu Leu Thr Asp Tyr Ser Pro Gln Leu Gln Lys Pro Lys Phe
1205 1210 1215
<210> 24
<211> 1236
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 编码ASS1的序列
<400> 24
atgtccagca aaggctccgt ggttctggcc tacagtggcg gcctggacac ctcgtgcatc 60
ctcgtgtggc tgaaggaaca aggctatgac gtcattgcct atctggccaa cattggccag 120
aaggaagact tcgaggaagc caggaagaag gcactgaaac ttggggccaa aaaggtgttc 180
attgaggatg tcagcaggga gtttgtggag gagttcatct ggccggccat ccagtccagc 240
gcactgtatg aggaccgcta cctcctgggc acctctcttg ccaggccctg catcgcccgc 300
aaacaagtgg aaatcgccca gcgggagggg gccaagtatg tgtcccacgg cgccacagga 360
aaggggaacg atcaggtccg gtttgagctc agctgctact cactggcccc ccagataaag 420
gtcattgctc cctggaggat gcctgaattc tacaaccggt tcaagggccg caatgacctg 480
atggagtacg caaagcaaca cgggattccc atcccggtca ctcccaagaa cccgtggagc 540
atggatgaga acctcatgca catcagctac gaggctggaa tcctggagaa ccccaagaac 600
caagcgcctc caggtctcta cacgaagacc caggacccag ccaaagcccc caacacccct 660
gacattctcg agatcgagtt caaaaaaggg gtccctgtga aggtgaccaa cgtcaaggat 720
ggcaccaccc accagacctc cttggagctc ttcatgtacc tgaacgaagt cgcgggcaag 780
catggcgtgg gccgtattga catcgtggag aaccgcttca ttggaatgaa gtcccgaggt 840
atctacgaga ccccagcagg caccatcctt taccatgctc atttagacat cgaggccttc 900
accatggacc gggaagtgcg caaaatcaaa caaggcctgg gcttgaaatt tgctgagctg 960
gtgtataccg gtttctggca cagccctgag tgtgaatttg tccgccactg catcgccaag 1020
tcccaggagc gagtggaagg gaaagtgcag gtgtccgtcc tcaagggcca ggtgtacatc 1080
ctcggccggg agtccccact gtctctctac aatgaggagc tggtgagcat gaacgtgcag 1140
ggtgattatg agccaactga tgccaccggg ttcatcaaca tcaattccct caggctgaag 1200
gaatatcatc gtctccagag caaggtcact gccaaa 1236
<210> 25
<211> 1062
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 编码OTC的序列
<400> 25
atgctgttta atctgaggat cctgttaaac aatgcagctt ttagaaatgg tcacaacttc 60
atggttcgaa attttcggtg tggacaacca ctacaaaata aagtgcagct gaagggccgt 120
gaccttctca ctctaaaaaa ctttaccgga gaagaaatta aatatatgct atggctatca 180
gcagatctga aatttaggat aaaacagaaa ggagagtatt tgcctttatt gcaagggaag 240
tccttaggca tgatttttga gaaaagaagt actcgaacaa gattgtctac agaaacaggc 300
ttagcacttc tgggaggaca tccttgtttt cttaccacac aagatattca tttgggtgtg 360
aatgaaagtc tcacggacac ggcccgtgta ttgtctagca tggcagatgc agtattggct 420
cgagtgtata aacaatcaga tttggacacc ctggctaaag aagcatccat cccaattatc 480
aatgggctgt cagatttgta ccatcctatc cagatcctgg ctgattacct cacgctccag 540
gaacactata gctctctgaa aggtcttacc ctcagctgga tcggggatgg gaacaatatc 600
ctgcactcca tcatgatgag cgcagcgaaa ttcggaatgc accttcaggc agctactcca 660
aagggttatg agccggatgc tagtgtaacc aagttggcag agcagtatgc caaagagaat 720
ggtaccaagc tgttgctgac aaatgatcca ttggaagcag cgcatggagg caatgtatta 780
attacagaca cttggataag catgggacaa gaagaggaga agaaaaagcg gctccaggct 840
ttccaaggtt accaggttac aatgaagact gctaaagttg ctgcctctga ctggacattt 900
ttacactgct tgcccagaaa gccagaagaa gtggatgatg aagtctttta ttctcctcga 960
tcactagtgt tcccagaggc agaaaacaga aagtggacaa tcatggctgt catggtgtcc 1020
ctgctgacag attactcacc tcagctccag aagcctaaat tt 1062
<210> 26
<211> 789
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 编码GD2 scFv的序列
<400> 26
gatattctgc tcacacagac cccactctcc ctgcccgtgt cactcgggga tcaggctagc 60
atttcttgcc gctcatctca gtctctggtc caccggaatg ggaacacata cctccattgg 120
tacctccaga aacctggaca gagccctaaa ctgctcatcc acaaagtctc aaatcggttc 180
tccggcgtgc ccgatcgctt tagcggatcc ggatctggga ccgacttcac actgaaaatc 240
tcacgagtgg aggctgagga tctcggcgtc tacttctgta gtcagagtac ccacgtccca 300
cccctcacct ttggcgctgg aacaaaactg gagctgaaac gagccgatgc tgctcctacc 360
gtgtccatct ttcctggctc cgggggaggc gggagcggag gcgaagtgaa actccagcag 420
tctggccctt ctctcgtgga acctggcgct tctgtgatga tctcctgtaa ggcctctgga 480
tcttccttta ccggctacaa catgaactgg gtccggcaga acattggcaa atccctggaa 540
tggattggcg ccatcgatcc ttactacggc ggcacatcat acaatcagaa attcaagggg 600
cgagcaacac tcactgtcga caaatcttca tccaccgcct acatgcacct gaaatctctc 660
acatccgagg atagtgctgt ctactactgt gtctctggca tggaatactg gggacaggga 720
acttctgtca ccgtgtctag tgccaaaacc acacctccct ccgtgtacgg acgagtcact 780
gtctcatct 789
<210> 27
<211> 744
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 编码CD33 scFv的序列
<400> 27
ggatccaaca tcatgctgac ccagagccct agcagcctgg ccgtgtctgc cggcgagaaa 60
gtgaccatga gctgcaagag cagccagagc gtgttcttca gcagctccca gaagaactac 120
ctagcctggt atcagcagat cccaggccag agccctaagc tgctgatcta ctgggccagc 180
accagagaaa gcggcgtgcc cgatagattc accggaagcg gttctggcac cgacttcacc 240
ctgacaatca gcagcgtgca gagcgaggac ctggccatct actactgcca ccagtacctg 300
agcagccgga cctttggcgg aggcaccaag ctggaaatca agagaggcgg cggaggctca 360
ggcggaggcg gatctagtgg cggaggatct caggtgcagc tgcagcagcc aggcgccgag 420
gtcgtgaaac ctggcgcctc tgtgaagatg tcctgcaagg ccagcggcta caccttcacc 480
agctactaca tccactggat caagcagacc cctggacagg gcctggaatg ggtgggagtg 540
atctaccccg gcaacgacga catcagctac aaccagaagt tcaagggcaa ggccaccctg 600
accgccgaca agtctagcac caccgcctac atgcagctgt ccagcctgac cagcgaggac 660
agcgccgtgt actactgcgc cagagaagtg cggctgcggt acttcgatgt gtggggagcc 720
ggcaccaccg tgaccgtgtc atct 744
<210> 28
<211> 723
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 编码间皮素scFv的序列
<400> 28
atgcaggtac aactgcagca gtctgggcct gagctggaga agcctggcgc ttcagtgaag 60
atatcctgca aggcttctgg ttactcattc actggctaca ccatgaactg ggtgaagcag 120
agccatggaa agagccttga gtggattgga cttattactc cttacaatgg tgcttctagc 180
tacaaccaga agttcagggg caaggccaca ttaactgtag acaagtcatc cagcacagcc 240
tacatggacc tcctcagtct gacatctgaa gactctgcag tctatttctg tgcaaggggg 300
ggttacgacg ggaggggttt tgactactgg ggccaaggga ccacggtcac cgtctcctca 360
ggtgtaggcg gttcaggcgg cggtggctct ggcggtggcg gatcggacat cgagctcact 420
cagtctccag caatcatgtc tgcatctcca ggggagaagg tcaccatgac ctgcagtgcc 480
agctcaagtg taagttacat gcactggtac cagcagaagt caggcacctc ccccaaaaga 540
tggatttatg acacatccaa actggcttct ggagtcccag gtcgcttcag tggcagtggg 600
tctggaaact cttactctct cacaatcagc agcgtggagg ctgaagatga tgcaacttat 660
tactgccagc agtggagtgg ttaccctctc acgttcggtg ctgggacaaa gttggaaata 720
aaa 723
<210> 29
<211> 768
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 编码EGFRvIII scFv的序列
<400> 29
caggtacaac tccagcagtc tgggggaggc ttagtgaagc ctggagcgtc tctgaaactc 60
tcctgtgtaa cctctggatt cactttcaga aaatttggca tgtcttgggt tcgccagact 120
agtgacaaga ggctggaatg ggtcgcatcc attagtactg gcggttataa cacgtactat 180
tcagacaatg taaagggccg attcaccatc tccagagaga atgccaagaa caccctgtac 240
ctgcaaatga gtagtctgaa gtctgaggac acggccttgt attactgtac aagaggctat 300
tctagtacct cttatgctat ggactactgg ggccaaggga ccacggtcac cgtctcctca 360
agtggaggcg gttcaggcgg aggtggctct ggcggtggcg gatcggacat cgagctcact 420
cagtctccag catccctgtc cgtggctaca ggagaaaaag tcactatcag atgcatgacc 480
agcactgata ttgatgatga tatgaactgg taccagcaga agccagggga accccctaag 540
ttccttattt cagaaggcaa tactcttcgg ccgggagtcc catcccgatt ttccagcagt 600
ggcactggca cagattttgt ttttacaatt gaaaacacac tctcggaaga tgttggagat 660
tactactgtt tgcaaagctt taacgtgcct cttacattcg gtgatggcac caagcttgaa 720
aaagctctag agcagaaact gatctcggaa gaagatctgg cgaagccc 768
<210> 30
<211> 17555
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 编码ASL的序列
<400> 30
gacgccatcc cggccagaaa agccctggcc agtggcgggc gcgacactat ccgtgcggcc 60
aggcggaggt gagtgcgcgg cggccggatg ggcgggacgg gcgtggagga cgccgagcac 120
cgtggcgcgc gctcacgtcc gcgtccccaa gggctgcgct ccctcaagcg cagtgcccag 180
aactcggagc cagcccggcc cgggggaccc tgctggccaa ggaggtcgtc agtccggtct 240
tgtcttccag acccggagga ccgaagcttc cggacgacga ggaaccgccc aacatggcct 300
cggaggtgag tgggacctcg gggactccgg tcctcctagc ctccaaagga gagagtgggg 360
gcgccagacc tgcctcgggc caccctgctg ggaatcgccc tccaggaagc aattttgaaa 420
attacctagg aagcctgcac ccccagccct cccgggcgca tcatctggag cccagcagtc 480
acctttacca ggactcacca gtatccgcag gcagcccttg tggcaaaccc accaacccac 540
actactaggg gtagagtggc tctgccctca cctcacagtg atgcctgcct ggccaggaaa 600
agtggctccc aagccttcag ccttccaact cttccttcct tcttaccacg tgtcctcctg 660
tcaggtccca ccccacacca catcccttct cctgctagag caattgtccc tgtttataga 720
ataaagctca gcccctaagt gttcttgtcc ttgactgtgg catgtggaaa gagccaggaa 780
aaaggggacg tcgcctcgtg gctccagcaa ccctggtgcc tggtcccttc ctgtctcact 840
ggaccctgcc tcttagggtc agtggctcct ggcctctcct cctgaccact gagatgctgg 900
attcccaggc agaggttttc cttccttggg ccatagttga tttatctggc aatgggggta 960
ataatagctg tcggcctcac tctgtaaggc actagattat gaggccattg ctttggaccc 1020
ttcaggtgag aggggctgtt cgcctgatgc ttgatgaagg gaactccggg aagcaggagg 1080
tctgggttcc aggccctttt ggccttcatt agctagcaat tcacttcctc tttctcaatg 1140
ccctgcaagc tcagtgccct gcaagcttct gggtcatggc aggggggtag ggcctggact 1200
ttggagccaa acagacttgg tttctgtacc agtcacttga gccctttaaa cctctttcct 1260
catttgtgaa ataggggtaa tattgcccac ctcataaaag gccgtaataa catatgtgaa 1320
atccctagca cagggctgag caacagtagg tgctcaataa atggtggcta accacaacaa 1380
tactgatatt tctactttgg gaggccgagg cgggaggact gctgaagccc aggaattcca 1440
gaccagccag ggcaatgtaa tgagaccctg tctctacaaa aagattttga aaattaccca 1500
ggtgtggtgg cgtacacctg tagtctcaca ggaggcggag gcatgaggat tgcttgagcc 1560
caggagtttg agactgcagt gagcatgatc tcaccactgc actccagccc aggcaacaga 1620
gtgagatcca gtttcaaaaa aataaaaata aaaaaacctg gcaggcatgg tggctcacac 1680
ctgtaatccc agcactttgg gaggtcgagg tgggcagatc acctgaggtc aggagtttga 1740
gaccagcctg gccaacatgg tgaaaccccg tctctactaa aaatgcaaaa attagctggg 1800
tgtagtggtg ggtgcctgta gtcccagcta ttcgggaggc tgaggcagga gaatcgcttg 1860
aactcgggag gcggaggttg cagtgagctg agatcgcacc actgcactcc agcctgggcg 1920
acaaagcaag actccacctc aaaaaaagaa aaaaaaccca caagtcccaa aaccaaaact 1980
ggtatttccc atgtacattc gaccttaact gttgctcatt caacccagcc caactcagtg 2040
ccccatcccc tggccctgaa gagaccattc tggcccagat gtgtcctggc ttggagtagc 2100
accttctgct accacactag gcctccactc tcctcagtgc ccaaggggag gcacctcact 2160
ctgatctccc tgtggggtcc tcttatgcct gccagtaagg ataggagttt ggttctagag 2220
cagagtggtc tggcttccaa caagcccagt gttctaggtg acctcaggtt gccccaggcc 2280
ttcctgtagg ttggcactaa ttggtttggc tgcagctcca cttattaagt agttattttt 2340
attactaaca acctaggcag ggtggcccag gagcccgctg ggggaggcgg tgccaggctc 2400
ctggctgagg ggcaggctgg ccccaattct gactggctgg ctccagtgat caggaccagg 2460
gccccacgtg gtgctttgct ggagatctag gcttggtggg gcagctgtgg ggtaaggggc 2520
aggaccagct caaagatggg gtgggggcgg aggctgcctc tgcagggcag agtcctttgg 2580
cagtcgggac tgttgggcat agaggagtca gctcacagct cagggccaga gcactggaga 2640
ggtctctggg gtgcatacag gaaccaggag tggagctgaa gcatgtccta tcccctgcca 2700
gccctccctt agtaacagct ggcatttctc gagtccttcc tgagcaccag gcaccgtgtt 2760
atgtatgcaa tttgcaaata ttatctgatt aaatgctcac aataaggcta tcagagaggt 2820
actattatta tccttatctt attattatta ttattattat ttttaagaag gagtcttgct 2880
ctgtcgccca agctggagta caatggcgcc atctctgctc accgcaacct ctacctccag 2940
gattcaagtg attctcctgc ttcagactcc caagtggctg ggactacagc ttcctgccac 3000
cgcgcctggc taatgtttat atttttagta cagatgaggt ttcaccatgt tggccaggct 3060
gatctcgaac tcctgacctc aagcgatcca cctgcctggg cctcccaacc ctgagggttt 3120
ttgtttttgt ttttgttttg agacagagtc ttgctctgtc gcccaggctg gagtgcagtg 3180
gcacgatctc agctcactgc aagctccgcc tcccgggttc acgccattct cctgcctcag 3240
cctcccaagt agctgggact acaggcgccc aacaccccca tgcctggcta atttttttgt 3300
gtgtgttttc agtagagacg gagtttcacc atgttagcca ggatggtctc catctcctga 3360
cctcgtgatc tgcccacctc agcctcccaa agtgctagga ttataggtgt gagccaccac 3420
gcccagcccc tgaggtttaa taataggtgc caggccaggt ggttaataga agtctggggc 3480
attgtagggg gacagaggag gatatatgtc cccattggcc attgtagact cccttccaca 3540
aaaaggacgt cagtgaagtg acatgcccac ctctacccca ccctcctccc agtcctgggc 3600
actagggctg ctccccaggt gttctgtacc ccctccccac tctgtcccat gccctggcct 3660
ctgccctctt tcaaaacata gatgtggctg gcgcctaggc tcatgcctat aatctcagca 3720
ctttgggaag ctgaggctgg aggacagctt gagcccagga attcaagacc agcctgggca 3780
acatagtgag accctgtctc taccaattat tttattttat tttattttgt tcatttattt 3840
atttattttg agacagagtt ttgctctgtc acctaggctg gagtgcagtg gcgtgatctt 3900
ggctcactgc aacctccgcc tcccgggttc aagcgattct cctgcctcag cctcctaagt 3960
agctggaact acaggcgagt gccaccacgc ctggctaatt tttgtatttt tagtagagac 4020
caggtttcac catgttgacc aggatggtct ctgtctcctg acctcatgat ccacccacct 4080
tagccttcca aaatgctggg attacaggca tgagccacca ctcccagtcc tataaaattt 4140
taaaaaaatg tctgggtgtg gtggcgcatg cttgtagtcc caactattgg ggaggctgag 4200
gcaagaggat tggttgagac caggagtttg aggctgcagt gagctatgat ggtgccaccg 4260
cactccaacc tgggtaacaa agtgagaccc tgtgtctaaa aaagaattta aaggccgggt 4320
gtggtggctc acacccgtaa tcccaggact ttgggaggcc gaggtgggca gatcacgagg 4380
tcagattaag accatcctgg ctaacaaggt gaaaccacgt ctctactgaa aaaaaaaaat 4440
acaaaaaatt agccaggcat ggtggtgggc acctgtagtc ccagctactc aggaggctga 4500
ggcaggagaa tggcgtgaat ctgggaggtg gagcttgcag tgagccaaga tcctgccact 4560
gcactccagc ctgggtgaca aagagagact ccatctcaaa aaaaaaaaaa aaaaaaaaga 4620
attaaaaaag atttttttaa tgaacaaaac aggctcggca cagtggctca tgcctgtaat 4680
cccaagcact tcgggatgcc aaggtcaggg gatcacctga gatcaggagt tcgagaccag 4740
cctgaccaac atggtgaaac cccgtctcta ctaaaaatat aaaactcagc caggtgtggt 4800
ggcacacgcc tgaaattcca gctactcggg aggctgaggc aggaaaattg gcttgaagcc 4860
gggaggtgga ggttgcagtg agccgagatc acgccactgc actccagcct aggcaacaga 4920
gtgagactct atctcaaaga aaacgaacaa aacatagatg cctacatacc attcctctgc 4980
ccttggctcc tggggagtaa gggatcaccc agtgacctcc tagaaggcca gtgacaatgg 5040
ggggtgtcag ggtgcttttc agagccaagg gagtggtagg aattgggatc ttagtccagc 5100
tccaagctgt gagggagaga gttgcagggc acttaagctt ggtggagacc ctcaaggcct 5160
ctttgcctgt ccctgcagca aaggttctgg acaccagagc caagtccaga agccctggtg 5220
gaacaggggt gaaaagcata ggttctgact tcagactgct gggccgcagc cctggctatc 5280
ccaccccagg tgagagcagg ctgctctgtg cctcagtttc cccatcttca tagtggaatt 5340
gtattggtgc ctacccagag ggttgtgtca acaattagga tggcacctag caccttggtc 5400
agtggtggga aaggttccag aagttctgct gtggtcccag gggtgtctca ggccctgcca 5460
tcatctcctt ggaggggtgc catgtggtgg gaaagaaccc caacttcaag gccacacaca 5520
gtggctcatg cctgtaatcc tagcactttc agaggccaag atgggaggat cacctgaggt 5580
caggagttca agaccagcct ggccaacatg gtgaaacccc atctctacta atgatacaaa 5640
aattagctgg gtgtggtggc acgtgcctgt aatcccagct acttgggagt ctgaggcagg 5700
agaatctctt gaacctggga ggcagagttt gcagtgagct gagatggcac cactgtactc 5760
cagcctggcc gacaaagtga gactctgtct caaaaaaaaa aaaaaagaac ccaaactttt 5820
ggtgttcagc catgttccca tgctcactcc cagggtggtg actctgggaa ggtctcagcc 5880
tccttgtctg cccagttaga atgatctgat gcccctgcta ccatcagact tgataagttt 5940
cccaaagact ctttgcaaga agcactgttc tggagggtgg aggagagact aattgttctt 6000
gctctcctgg ccagagtggg aagctttggg gtggccggtt tgtgggtgca gtggacccca 6060
tcatggagaa gttcaacgcg tccattgcct acgaccggca cctttgggag gtggatgttc 6120
aaggcagcaa agcctacagc aggggcctgg agaaggcagg gctcctcacc aaggccgaga 6180
tggaccagat actccatggc ctagacaagg tacttgccgt ggcccaagcc ccacccaagg 6240
ccccttccct gtggccccag gctcccacca aatccctgag caaacagtgc agtgttgccc 6300
atctgtggtt tcacattgaa ctaattatat actcaagtgc tgtttaactg tgtgccttga 6360
tgactgcctc tctccatcct ttaatgaccc ctgtggccca catggctcat gggtaaaggt 6420
gtgctgggcc tgagatgccc cctcccaggg tgcgcttcca ggactcagct cctgggcagg 6480
gacagtcagt caccagggat agggtgggac caaggcaggg gctctcttgg ctgctgatgc 6540
ctgctcacct gaccccggca ttgctgctac ccactacagg tggctgagga gtgggcccag 6600
ggcaccttca aactgaactc caatgatgag gacatccaca cagccaatga gcgccgcctg 6660
aaggtacgac ccctggagcc ccaccgcttt ccttgcctcc cctctccacc ttgcccaggg 6720
ccactttgag cattagcacc attctgttta cttcgccatt ggcagacagc atgtgagacc 6780
tcaggacatg agccaggcac cctggctcat gcctataatc ctagcacttt gggaggctga 6840
ggtgggagga ttgcttgaga ccaggagttc gagaccagcc tgggcaacat aatgaggtcc 6900
cacagctaca aaaattaaaa aaagaaaaga aaaaaagaac aggcctcagc agaaatggcg 6960
agagatttgg ggaggacccg gagccctggg gtatggaggt aggttggcag ggctgatgag 7020
gaaaactgcc ctgcctgggt tgactcctct gggggtatag accgtgaccc tgggtctccc 7080
ttcacctcca ggagctcatt ggtgcaacgg cagggaagct gcacacggga cggagccgga 7140
atgaccaggt gctttagccc ctccaccccc tgctccgtgt tgtcccaacc ttgaggagcc 7200
cagggggcag ttagagttct gcagcggtcc tggctcctca gggaagcaac acatcggcct 7260
ccctgagcac catctcctcc ttgcacaggt ggtcacagac ctcaggctgt ggatgcggca 7320
gacctgctcc acgctctcgg gcctcctctg ggagctcatt aggaccatgg tggatcgggc 7380
agaggcgtga gtcctacagg gacacccagg gggcagacag aggtgtgatg gaagcctgaa 7440
caggagacct agggggcagg ggtgaacagc gtgggggtgc caggccctgg gggacagggg 7500
catcccagaa ctccaggatc gaggcagagc agccaggagt gggccatttc ctgcaggccc 7560
caatactccc atgccagtct agctcagcag gcagagaaga ctaacccttc gtggggctgg 7620
gtgcggtggc tcacgcctgt aatctcagca ctttgggagg ccgaggtggg tggatcacct 7680
gaggtcagga gttcgagacc agcctggcca acatgggaaa actctgtctc tactaaaaat 7740
acaaaaatta ggcaatgtgg tggtgtgcgc ctgtaatccc agctactcgg gagcctgagg 7800
cagaagaact gcttgaaccc gggaggagga ggttgcaatg agccgagatc gcgccattgc 7860
actccagcct gggctacaga gcgagactcc tgtctcaaaa aaaaagaaaa aaaaaaaaga 7920
aaactcacca tttgcagatt tgaaggcagg aagctaagcc aagcacagct agcttggctg 7980
tgcctggagc agccagagtc actccccaca ctgcctgtcc cccagatccc ccatcctaag 8040
cttcgcctcc ccatccagcc catctggcaa aagacagagc caaaggctgc ctcctgctgg 8100
cctcatttca ggctttggct tctgggacct ggtgtctttg ggactggatt tgttccttgc 8160
agacctggac gaagagctgc tgagaagtct ccatgtgttg tcagagaccc ctcctcttcc 8220
tcaactccct gtgacccctg ttgtgcagac ttgggggaaa acaagggcac aagaattgtc 8280
acccagcagg tggtgtgggg ctgctaggag gaacagggag tgtctgctac tgagttcagg 8340
gtttctttaa ttttttgttg ttgttgtttg ttgttgtttt tttttttttg agacagggtt 8400
ttgctctgtc acctagtctg gagtgtagtg gcgctatctg agctaactgc aaactctgcc 8460
tcctgggttc aagtgattct agtgcctcag cctcccaagt agctgagatt acaggtgtgc 8520
accaccatgt ccagctaatt tttgtatttt tttcagtaga gatgggtttt gccatgttga 8580
ccaggctggt cttgaactcc tgagctcagg tgatctgccc gcgtcggcct gccaaagtgc 8640
taggattaca cccataagcc actgcgctca gcttaatttt taaattttta actttttaaa 8700
ttgtctttag agatgagatc ctgctctgtc acctaggctg gagtgcaatg gcttggtaat 8760
agctcactgc agtctcaaac tcctggactc aaatgatcct cccacctcag ctttctgagt 8820
agctaggacc acaggtgtgc accacctgtg agacagagtc ttgctctgtt gcccaggctg 8880
gagtgcagtg gcgtgatctc cactcactgc aacctctgcc tcccaggttc acgccattct 8940
cctgcctcag cctcccgagt agctgggagt acaggtgccc accaccacgc ccggctaatt 9000
ttttgtattt ttagtagaga cggggtttca ccatgttagc caggatggtc tcaatctccc 9060
gacctcatga tccacccacc tcggactctc aaagtgctgg gattacaggt gtgagccacc 9120
gtgcccagcc gcgaattctt taaatttttt gtagaaacag ggtctcacta tgtggctcag 9180
gctggtctca aactcccggc cttaagtgat ccttccctct tggcctccca aagtgctggg 9240
attaaagact tgagccaccg tgcctggcct tgagtacaga atttcttcat ggggtgatga 9300
aaatgttcta aaattggttg tggtgatggt tgtacagtaa agtgtaaact ttaaatgagt 9360
aaattgtgaa tgatatctca gtaaagctgg tttatttaaa acaacaggcc aggtgctgtg 9420
gctcacgcct gtaatcccag cactttggaa ggctgaggcg ggtgaatcac ctgaggtcaa 9480
gagttcgaga ccagcctggc caacatggtg aaaccccatc tctactaaaa atacacaaaa 9540
ttagctgggt gtgatggtgg gcacctgtag tcccagctac ttgggaggca ggagaatctc 9600
ttggacctgg gaggtggagg ttgtagtgag ccgagatcac gccactgcat tccagcctgg 9660
gcaacaagag cgaaactctt tctcaaaaac aacaacaaca aaaaaacagg ccaggtatgg 9720
tggctcatat ctgtaatccc agccctttgg gaggccaagg caggaggact gcctgaaacc 9780
aggagtttca gaccactctg ggcaacatag caagacccca tctttttttt tttttttgag 9840
acggagtctc gctctgtcgc ccaggctgaa gtgcaatggt gcaatctcaa ctcactgcaa 9900
gctctgcctc ctgggttcat gccattctcc tgcctcagcc ctcctgagta gctggaacta 9960
caggcgccca ccactacgcc cggctaattt tttgtatttt tagtatagat ggggtttcac 10020
cgtgttagcc aggatggtct cgatctcctg accttgtgat ctgcccgcct cggcctccca 10080
aagtgctggg attacaggcg tgagttaccg cgcctggcca caagacccca tctttacaaa 10140
aaactaaaaa ttagctgggc atggtggcat gtccctttag tcccagctac tcaggaggct 10200
gagacaggag gatcgcttga gcccaggaga tcgaggcagc agtgagctat gatcatgcca 10260
ctgcactcca gtctgggcaa cagaacgaga ccttgtctct aaaaataaaa acaaaacaaa 10320
acaacaagaa aacaggacca tcactcacag cacctctgcc tctgccctgc ctacttgaat 10380
gaggtgcagg gcatctcacc tgctcagagc agcccttgaa tgagccccag ctatttctag 10440
ggtcctcaaa cgaaacctcc cacggccaag tcatacccaa catgggcctc ctcccctatt 10500
ctggcccctg ctcggagatg ctgagtgaca gaggctggac ttggggtgtt tctggcaaag 10560
cctcactgca ggaagcccca cagctcaggc ccagtccttg gttcacacgg tcccacttcc 10620
agcttctttt gcccttaaga ctgatttgtc cctgggagat caccagatcc ctcattcagg 10680
tggagtgctg cagcgtgaca ctttttccag gggtgaccca ggcctgcagg gttccagtgt 10740
cacaggcagg ccttgcatga gcctccaccc gagcttctgc tcctcctctc ccacagggaa 10800
cgtgatgttc tcttcccggg gtacacccat ttgcagaggg cccagcccat ccgctggagc 10860
cactggattc tgaggtgagc caggtgaggt gcaggggctg tgctagaggg gaggaccccg 10920
gctgccctga ccctcctgcc cctggcttcc cacagccacg ccgtggcact gacccgagac 10980
tctgagcggc tgctggaggt gcggaagcgg atcaatgtcc tgcccctggg gaggtgggtg 11040
aggctccagt gccccgaggg cctggtgggg gtggctgctg catagcctta gggattgaca 11100
gagctgggaa gtgcagagtg ggacagaaaa ccgccttatc tgctcagcgg gggactctgc 11160
atggagcccc agctctcgct aaggtgacga ccaagccatt gaatgtgtct gagcagggcc 11220
agagccctcc agcaaggctc ctggcaagcc cagcctgctg ccctcagcct gacatgtggg 11280
aacatgtgtc aggagacaag tgtcctgcac ccagggtgac ttagtgcttg gggacaagtg 11340
ttttgtggac acttggggac aagtattctg tacccaagga gactgggcca gggaagaggc 11400
taagcgccag gtggttgccc tggcaaccag gacttggttc tctgtgtgtg cgttcgtgtg 11460
tgtgtgtgtg tgtgtgtgtg tgtgtgtgtg tgtgtcaggg ctgcctgcca ggagccctgg 11520
tcaccatgaa tccctgtccc tgcagtgggg ccattgcagg caatcccctg ggtgtggacc 11580
gagagctgct ccgagcaggt gagacgtcct gcccctcctc cccagggaga atcaccctca 11640
gcacccgcca agacctgcag acacacctga aaccagaggg caggggcctg tggctcctgg 11700
tgaaaccttc attcattgcc tatgggcact gaggtcatca agttcagggg tcactcatgg 11760
cagggatgcc tggtactgag agactcaggg ctcctgcctc cctcctggga ctgtgcaaaa 11820
gatccctccc cccagctgtt gccccaccct gatcagggga gggggctggg caacctagtt 11880
gggggagagg gggccactcc ctgtcctcca gcttagccct gcttcctccc acccccccag 11940
aactcaactt tggggccatc actctcaaca gcatggatgc cactagtgag cgggactttg 12000
tgggtgagtc ctggggagcc agtcccctgc cctgtgcctc actttagtcc ttcagcccag 12060
cttctctcca gtttcctccc acacctccac ggacaggctg gttgtggtga tattgtacac 12120
tgaagtataa accttaaatg ggtaaagtgg gtggggcatg gtggttcacc atgcccagca 12180
ctggccaaca tggtgaaacc ccatctctac taagaataca aaatttagct gggtgtgtgg 12240
tggcaggtgc ctgtaatccc agctactcag gagttctgag gccagagaat cacttgaacc 12300
caggaggcgg aggctgcagt gagccaagat cacgccagtg cactccagcc tgggcaacaa 12360
gagcgaaact ccatctcaaa aaataaaata aaataaaata aaaataaata ggccaggcat 12420
ggtggctcac gcccgtaatc ctagcacttt gggagtccga ggcaggtgga tcacatgagg 12480
tcaggagttt aagaccagcc tggccaacat ggtgaaaccc catctctact aaaagcacaa 12540
aaattagctg ggcatggtgg tgcatgcctg taatcccagc tactcgggag gctaaggaag 12600
gagattcgct ggaacctggg aggtagaggt tgcagtgagc caagattgtg ccactgtact 12660
ccagcctgtg cattgggagc gagactccat ctcaataaat aaataaataa ataaatggat 12720
aaattgtatg tgagtgataa ctcagtaaag ctggtttatt taaaacaaca acaataacaa 12780
aaaacacgct aggtgcaatg gcttacgttt gtaatcctag cactttggga ggccaaagca 12840
gaaggattgc ttgagcccac aagtttcaga acagcttggg cgacatagca cgaccccatc 12900
tttgcgaaaa atgaaaattt agccgggtcc ccccaccgcc taacctcctc ctgccccctg 12960
tatggtcagg ctgggtgggg atgggagagg cctggtgact gggaaccttt tctcccagcc 13020
gagttcctgt tctgggcttc gctgtgcatg acccatctca gcaggatggc cgaggacctc 13080
atcctctact gcaccaagga attcagcttc gtgcagctct cagatgccta caggtaagcc 13140
ctgaactgcc acctccatct gccgctgccg gcctctgtat cccccgccgc ccgcggacgt 13200
ggctgccttc ctccccgtcc cacccctccg ccagacctgg ccattgcggc gctggaccag 13260
ccaagggtcc agccccttca gcgccagcac ctctgtcccc agcacgggaa gcagcctgat 13320
gccccagaag aaaaaccccg acagtttgga gctgatccgg agcaaggctg ggcgtgtgtt 13380
tgggcgggtg agcaaggcag ggggaggggc ggggcctctg ggctgatggt gggtggccag 13440
gggggcagga tcccgggtcc agcccctgtg cctccctctt cccgcagtgt gccgggctcc 13500
tgatgaccct caagggactt cccagcacct acaacaaaga cttacaggtg cgaggccggg 13560
ggaggcctgg ctagtacgtg ccagttctca gggctctggc acactcaggc agggccccac 13620
cccgggattg ccatacatcc tcccatcctg tgcacacagc tccatccgtg gctgcccttg 13680
aactctctgc ccttcctttg ttggggtatt gagtgttctt cccatggaag gcagtgggga 13740
tgcctcagtg ggggggtggg gctgtgggga ccctgggtgc cagggggctg ctaggccctc 13800
acctcctgcc atgtgcctcc caggaggaca aggaagctgt gtttgaagtg tcagacacta 13860
tgagtgccgt gctccaggtg gccactggcg tcatctctac gctgcaggca agacatcacc 13920
cccctgcttc tcctccccta ggtcccaggc actggggtgg gcatgcgggg agggtggcct 13980
tgggaggagg tgaggtgggg ctggaggacc tggggcaggg aaggagaggt gtgctcgctc 14040
ctgctcctgg ggaacaggga aaggacagaa actgctgcca tgcagtggaa gtagatgaga 14100
ctcagggggc ctggggcctg tcaaatggcc tgaccagaac tctttaaaaa aagaaaatct 14160
aaacaaaagg ccaggtgcag tggctcatgc ctggaatctc acactttggg aggccgaggc 14220
agatggagca cttgaggtca ggggtttgag accagcctgg ccaacatggc gtaaccacgt 14280
ctctactaaa aatacaaaaa ttagccaggc gtgatggccc acacctgtaa tcccagctac 14340
tcaggaggcg gaggcagaag aatagcttga acccaggaga tggaagttgt agtgagccaa 14400
gatcatgccg ctgcactcca gcctggacca cagagtaaaa ctccatctac aaatatataa 14460
attaaattaa attaaattaa atatctttaa aaaacatttt ttagagacag ggtcactctc 14520
tgtcgcccag gctggagtgc agtggtgcgg tcgtagctca ctgcagcctc aaactcttgg 14580
gctcaagtga tcttcccacc tcagtctcca gagtagctgg gactacaaac atgcgccacc 14640
acgcctggct aattttttta ttttttgtag agacagggtc tccctatgtt tcccaggctg 14700
gtctcaaatt cctggcccca agccatcctc ccaccttggt ctcccaaggt gctgggatta 14760
taggcatgag ccactttgcc tggctgattt cttttaaaat caattattat gggaaattta 14820
tgtatataac agctagagaa tgcataatga accctatgta ccgacaccca gcttcaatga 14880
taatcaactc acggacatcc tggctccagc tgtctttacc cacagctctc tcccactccc 14940
ttaccccctt attttgaagc aaattcccat catcacatca tttcattcct aaatagttca 15000
ggatatgtct tgaaatcagt gtttcttggc tgggtgcaga gcctcatgcc tgtaatccca 15060
tcaatttgcg agactaaggt gggcagatca ctcgaggtca ggagttcgag accagcctgg 15120
ccaacatggc gaaaccccgt ctttactaaa aatataaaaa ttagctgggt gtggtggtac 15180
acgcctgtaa tcccagctac tcaggaggct gaggcaggag aattgcttga acccgggaga 15240
tggagactgc agtgagcaga gatcacgcca ctgcgctcca gcctgtgtga cagtgcaaga 15300
ctccatctca aaaaaaaaaa aaaaaaaaaa aggcagtgtt tctggaggct agtcccccaa 15360
ctagcagcac cagcatcacc tcagaagtcc tgagaaatgt gatgtgaggc cccactccag 15420
atggctgaat cagagactct gggggtgctc cccagcaatt tgtatttttc ttagtaaatt 15480
ctccagtggc taggcctggt ggctcatgct tgtaatccca gcactttgag aagctgaggc 15540
aggagaagcg cttgagccca ggagttcaaa accagcctga gcaacatagc gagaccttgt 15600
ctgtaaaatt aaaaaaatta aattagccag tcgtgatggc gtgtacctgt ggtcccagcc 15660
acttaggaga ctgatgtggg aggatccctt gagcccagga gctcaaggat gcagagagcc 15720
aggattgtgc cattgcactc caacatgggc gaccctgtct caaaaaagcc caaaacaaca 15780
acaacaaatt agctaggcac ggtggtgtgc atggctgtag tcccagctac ttgggaggct 15840
gaggctggaa gatcccttga gtccaggctg cagagggcta taatggccac tgcactccag 15900
cctggacaac agagcaagac cctgtctcct aaaacagaaa acaaatcctc caggaacatc 15960
tgatgcatgc tgaagataag gactctttga aaacataaag gccagtaaaa catacaggcc 16020
agtaagtgtt catagcacat gtaaatatta tcgataatta tgagaagatg gttcaagttg 16080
agagtgagac agagccgagt gggtaagaga gtatctgccc aaggcaggga tgtcctggca 16140
gaggggcagg tcctgggcct ggcagcttca gatcccaggg tccccagggc tcaccactcg 16200
cccacctgtg cccccagatt caccaagaga acatgggaca ggctctcagc cccgacatgc 16260
tggccactga ccttgcctat tacctggtcc gcaaaggggt aagtgtgtag cagccagggg 16320
gagggtgagg agatggggtg ccccccccag agggtggggg agctcaggaa tgggtgcaag 16380
cggcccagcc tggtggctca cccctgtaat cccagcactt tgggaagccg aggtgggcgg 16440
gtcacttgag gccaggagtt cgagaccagc ctggtcaaca tggtgaaacc ccgtctcttt 16500
tgatgtaaaa atacaacaat tagctgggtg tggtggcaca ctcctgtaat cccagttact 16560
cgggaggctg aggcaggaga attgattgaa ctgggaggtg gagtttgcgg tgaggtgaga 16620
tcgcgccact gcactccagc ctgggcaaca gagcgagact ttgtgtcaaa aagaaaaaaa 16680
aaaaaaaaag gaagggggtg caggcaatgg aggcagatca gggcatggag aaacctgcct 16740
cagcgccatc ttcctccctg gcacccagat gccattccgc caggcccacg aggcctccgg 16800
gaaagctgtg ttcatggccg agaccaaggg ggtcgccctc aaccagctgt cactgcagga 16860
gctgcagacc atcaggtacg gcccatcccc ttccccatgc tgcctcctag gaagtgagcc 16920
tgggtgcctg gagcccaggg tggcctggcg ccctggccca cctcttcctc tctccccagc 16980
cccctgttct cgggcgacgt gatctgcgtg tgggactacg ggcacagtgt ggagcagtat 17040
ggtgccctgg gcggcactgc gcgctccagc gtcgactggc agatccgcca ggtgcgggcg 17100
ctactgcagg cacagcaggc ctaggtcctc ccacacctgc cccctaataa agtgggcgcg 17160
agaggaggct gctgtgtgtt tcctgcccca gcctggctcc ctcgttgctg ggctttcggg 17220
gctggccagt ggggacagtc agggactgga gaggcagggc agggtggcct gtaatcccag 17280
cactttggaa gggcaaggtg cgaggatgct tgaggccagg agtttgacac agcctgggca 17340
acacagggag acccccatct ctactcaata ataaaacaaa tagcctggcg tggtggccca 17400
tgcatatagt cccagctact tgtaaggctg aggtgagagg acacttgtgc ccaggagtgg 17460
aggctgcagt gagctatgat cacgccactg cattccagcc tggataacag agtgagaacc 17520
tatctctaaa aataaataaa taaacgaaaa ataaa 17555
<210> 31
<211> 8184
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 编码ODC1的序列
<400> 31
gaagccgggg gcgggggcca cgcgtggggc aggcggtgct cggctcggct gacgtcggcc 60
cgccggcgcc ccaccagctc cgcgcgggcc cgggttggcc accgccgggc ccccgcccct 120
cccccggcgg tgtcccggcc ggaaccgatc gtggctggtt tgagctggtg cgtctccatg 180
gcgacccgcc ggtgctataa gtagggagcg gcgtgccgtg gggctttgtc agtccctcct 240
gtagccgccg ccgccgccgc ccgccgcccc tctgccagca gctccggcgc cacctcgggc 300
cggcgtctcc ggcgggcggg agccaggcgc tgacgggcgc ggcgggggcg gccgagcgct 360
cctgcggctg cgactcaggc tccggcgtct gcgcttcccc atggggctgg cctgcggcgc 420
ctgggcgctc tgaggtgagg gactccccgg ccgcggagga agggagggag cgagggcggg 480
agccggggcg ggctgcgggc cccgggcccc gggcacgtgt gcggcgcgcc tcgccggcct 540
gcggagacac gtggtcgccg agcgggccac gaccttgagg cgccgcttcc tcccggcccg 600
gggttctccc gcggctggat aagggtgatc cgggcgcctc gttctgcccc cgtcttcaca 660
gctcggggct ggaggggcct aggggagacc cacccggaga ccctgcggcc ccgcgccggc 720
ctctttccca acccttcggc ggccgcgcgc tggccgggga gccgttgggg aggccctggc 780
ggccgcgcag caggtgcagg ggcgcagagc ccgggctcgc cttggtacag acgagcgggc 840
cccggccttg gcgccttcag tttccttcca gtttttattt tcgctgtgtc tacagagcag 900
atgacaccaa tttggaaacc cgcgagagtg ggtagagcta agatagtctt gctgtagtag 960
ctgtgatatt agatgctcgg ccatgactta gaggtgttta tttaaggact gtgaatgact 1020
cggtgatttc ggaaaagctt ggcttagatg aacggacata cacaggggag acagccctaa 1080
ggtttgcaga aaaggctgat tgtgctgttt gcgaagtcga aataattggt gaaagtgtag 1140
aaggcagaac ctctcaggaa tgtctgggga ggacaaagaa tgtgttggct gactttgttt 1200
aaacataaaa ttgggcagac tttaattgat ttgtgaaatt tttttcaaag tttgtttgaa 1260
ttagccccta tctcttctaa cattatcctc ttgtgctaat tgattgacca ttttaaataa 1320
cttagctgtt acagaaagac cgaaaggtgt tcttcagtaa aatatattca agtaagttac 1380
ttaagtaacg ccttaaaaga tacagaaaag caaaaaagta ttggcgtatt aaaaagaaat 1440
caaaactttc caagtttagg cctgaacatt gccttaaaaa tatttaataa ggcctcaaat 1500
gacccagtcc gagactgcat gagcctattt attattaaat tgtaaatatt cttcatataa 1560
acaaaaatat ataaccatgt ctgtaacaaa aatggttttg ctagcgttgt tactctcttc 1620
ccttctccga ggggtgattt aggcaacttc ggaggttgac aatgccaagc agtcacaata 1680
gatagagctt taaagcaaat tctatgcatg ggtttggatt tatgacaggc ccgtcaccct 1740
gggcctgtca tagtacccca tgccagagca aactgtgtcc ccgaaccatt gcctggcctc 1800
tgtgcccgta ggctgctggc actgaagtgg gttgcacagt ggaaaagaag aaagctctac 1860
ctggcagaaa tttttaaagg ttaaaataaa taattttaag aaagctggtt cacaaggtgc 1920
cacatttgat gaaagcaaaa tacagtggct tttattgtta ctagagtgat gttcttgctt 1980
gtttttcttt tttggtgaag ttagccccaa attattctca tagctaagca aatacgagag 2040
tgactgtaag gacagttggc attcccggaa ttgctaaact tggtaggcaa cgctggttta 2100
agaatactga gttctagccg ggcgtggtgg ctcacgcctg taatcccaac actttgggag 2160
gctgaggcag gcggatcacc tgaggtcggg agttggagac cagcctgact aacatggaga 2220
aacgccatct ccactaaaaa tataaaatta gccaggcccc gggtgtggtg gcacatgccg 2280
gtaatcccag ctactcggga gactgaggca ggagaatcgc ttgaacccag gaggcggagg 2340
ttgaggtgag ccgagatcat gccattgcac tccagcctgg gcaacaagag taaaactctg 2400
tctcaaaaaa aaaaaaaaaa aatactgaat tctgatcagg taacagcaac tgtaatacaa 2460
tgtgataagt tgacttgaag attacagttt ttaagaagta tatacccagc taatacatga 2520
aaattaactc gtaaaatctc aaatgctcca gacatttcca tgatgcctgt tggtcagtaa 2580
aaatcattct aagacttagt ggaagtagga aatgtttgta tggctgtgta taaaggctat 2640
aatgtaatcc cagcactttg gaagaccgag gcgggtggat cacctggggt caggagtttg 2700
agacccacct ggacaacgtg gtgaaatcct gtctctacta aaaacacaaa aattagccgg 2760
gcatggtggc aggcgcctgt aatcccagct gctggggagg ctgaggcagg agaatcgctt 2820
gaacccggga ggcagaggtt gcagtgagcc aagattgcac cgctgcactc cagcctgggt 2880
gacagcgtga gactctgtct caaaaaaaat aaaaaagtct ataatgctat tttaagtttc 2940
taaggaactg aaactgctct gaaataaatc agaccattat aagacttttt tccatatcag 3000
tgagctaagt gcagataagc ttctgaaact tgcatgctag atttttttgg tacaaatatt 3060
tgaaatgctt agtgtgctgc cttggaaaaa cctggtattt tttgttgtgt ccttatactg 3120
ccaaggttta tggaatcatg taccttatgc ctagtaataa ttaggatgac caggccagtg 3180
agtggttcat atccggggca tgattagctc tgcgtgtgct cagccagtgc cccatcttca 3240
actcgatgtg ttcctaaggt agacagcaaa ttccctattt tatttctcag attgtcactg 3300
ctgttccaag ggcacacgca gagggatttg gaattcctgg agagttgcct ttgtgagaag 3360
ctggaaatat ttctttcaat tccatctctt agttttccat gtaagtattc agtttacatt 3420
tatgttgcag gttaatctta agaattgtat tgctaaggct tctaagtgaa tttctccact 3480
ctatttgcat tttgttgcat ttcagaggaa catcaagaaa tcatgaacaa ctttggtaat 3540
gaagagtttg actgccactt cctcgatgaa ggttttactg ccaaggacat tctggaccag 3600
aaaattaatg aagtttcttc ttctgtaagt atatgaggcc catgctggca gtgcagctga 3660
gagtgccagg caagtggaaa actttggcaa ggtctaagga agagcaatga ggcttacatg 3720
tcttgttatg gaatgtagaa attaattcac tggtggtaaa ttaatagtga taatggtgat 3780
actcatatca gtggctagac tcaaaagagc aggattcatt gtgactgatg ggaatgaagg 3840
tcgctggcta ttggtgtggt gtgtggtgag gctgctagtg agtcacctgt gaccactctt 3900
gtttcaggat gataaggatg ccttctatgt ggcagacctg ggagacattc taaagaaaca 3960
tctgaggtgg ttaaaagctc tccctcgtgt cacccccttt tatgcagtca aatgtaatga 4020
tagcaaagcc atcgtgaaga cccttgctgc taccgggaca ggatttgact gtgctagcaa 4080
ggtaagcgat agcagcaggc ctcaaaagcg ttgtataaaa tgggcctggt attccccacg 4140
aggcagatac aagttgtgtt ttttgggcaa taaatgctca ctaaaggcaa atggggcggg 4200
ggggtacatg acaacttccc atgcttttct gtttattcca cgtgttaagc cacatatgga 4260
tagcatgaca ccactcttct ttttcagact gaaatacagt tggtgcagag tctgggggtg 4320
cctccagaga ggattatcta tgcaaatcct tgtaaacaag tatctcaaat taagtatgct 4380
gctaataatg gagtccagat gatgactttt gatagtgaag ttgagttgat gaaagttgcc 4440
agagcacatc ccaaagcaaa gtgagttatt cccccatctg agggcaagat cgggagcata 4500
agatatgtgg attcttatca aacaaactta aatttctgat tattatattt ctatacttta 4560
gtagaaagta gttgaaaccc ccattgagtc atgaagcctg ggactcaaac tacagaatat 4620
atcagcgaca gtatttagaa caggattgtt tttattttaa ttgtggctat aagtgaacat 4680
ctatcatgag acatttgctg cactttcctt gcttgtaggt tggttttgcg gattgccact 4740
gatgattcca aagcagtctg tcgtctcagt gtgaaattcg gtgccacgct cagaaccagc 4800
aggctccttt tggaacgggc gaaagagcta aatatcgatg ttgttggtgt caggtgagat 4860
tttggtggga tagctagagg tcaagacatt gaacagtttg agttttacag gctttctcct 4920
agtgtttgct attattttaa gaaatactaa gacacagtgt ctcgtctctt tattttaccc 4980
cagcttccat gtaggaagcg gctgtaccga tcctgagacc ttcgtgcagg caatctctga 5040
tgcccgctgt gtttttgaca tgggggtgag tatacgtgac cctgttaggg aagggcggga 5100
cacaactgac aataactagt cttaattcta gagttaactt tttatggcag ttggttctgt 5160
attacatggg tttcagccta tctgctgcat acatttttgt tattagctgt ggatctggct 5220
gacttatttt cttgattcta ggctgaggtt ggtttcagca tgtatctgct tgatattggc 5280
ggtggctttc ctggatctga ggatgtgaaa cttaaatttg aagaggtaat ttagaacaaa 5340
actgtaatac tcagtagccg ttctaataaa ttcctttttg gaatatttca aaatttaagt 5400
gtcttaacta ataccacaat gggctgaagt gtcttggtgt gatattttga gtgatttctt 5460
tgtgctgtct gacattacac ttgataccat ttggttttct aaagtgtgaa tcagctttcc 5520
cagaagtctt ggataattgg ttacattgga aatcatggct cacacctgta atccagcact 5580
tggggaggcc aaggtggtag gatcacttga gcccaggagt ttgagaccag cctgggcaac 5640
acagtgagac cccatctcta caaaaaaaat tttaaaatta gcctggtgtg gtggcgggca 5700
cctgtaatcc cagctacttg gaaggctgag gtgggaggat cacttgagcc caggaggttg 5760
aggctgcagt gagccatgat catgccactg cactcagcct gggctacaga gtgagaccct 5820
gtctcaaaaa aaaaaaagaa aaagcatgtt gctgtgggct tcctagagaa tatgctgact 5880
gtagcacatc atcaccccaa atgtgctttg ctagacctat gcttcctctc cttaaaatac 5940
ttgaaatgtt tagtcactta ggaagttaag ccattatatt ggtgcttgaa tttataaaat 6000
atatccacat ggtttgttaa aatcatgacg taggcagaat aggattttta tcctgttggc 6060
atgtatttgt taaaatgttt tgacatcttg atgccttcct aggtagtagt tagttgcgta 6120
ctgttctttg ataaaaatca tacccataac atcctaaagg agatagggtg cctggagggg 6180
aatgaaaacg agccacctgg gatatgtagc ctggttttca gggagatgtt gatgtttttt 6240
tgcttttgtt actttaatga taaacctgtc tgttgatgcc tggtctcatg atgtcatgtc 6300
acaaggccct gtgatgttac tcccccatgt gaatttccca caatgaaggc tgctctttct 6360
tttctgtttc actctcttag atcaccggcg taatcaaccc agcgttggac aaatactttc 6420
cgtcagactc tggagtgaga atcatagctg agcccggcag atactatgtt gcatcagctt 6480
tcacgcttgc agttaatatc attgccaaga aaattgtatt aaaggaacag acgggctctg 6540
atggtatgta taaaggacga atcacttcat gtataactga aagctgatgc aaaaagtcat 6600
taagattgtt gatctgcctt tctagacgaa gatgagtcga gtgagcagac ctttatgtat 6660
tatgtgaatg atggcgtcta tggatcattt aattgcatac tctatgacca cgcacatgta 6720
aagccccttc tgcaaaaggt aatttctgag catactgtat aaaacaatta agaggactgg 6780
tcacaacacg tgtaattaag tagtacttcc tctctccgtc tctttatata gagacctaaa 6840
ccagatgaga agtattattc atccagcata tggggaccaa catgtgatgg cctcgatcgg 6900
attgttgagc gctgtgacct gcctgaaatg catgtgggtg attggatgct ctttgaaaac 6960
atgggcgctt acactgttgc tgctgcctct acgttcaatg gcttccagag gccgacgatc 7020
tactatgtga tgtcagggcc tgcgtggtaa gtaagccatg catgttgatg gtgctgccaa 7080
gaataggcac cttcttggat gtgtgcttct tgtctagacg aataagaaat tgtcttgcct 7140
aagattaaat atatatggat atttttccta agaaaagttt tagaaaagac tgatgagtgt 7200
atttctatgt aattggaata tatttaagtt catgccatgt gtcttgtggt ttccttatta 7260
ccaaaacggt gactgaagaa acgcttgctt tagaaataca ttgaattggc caggtgtgct 7320
ggctcacacc tgaaatcaca acacattggg aggccaaggc agaaggatca cttgagccca 7380
ggagttcgag cctgggcaac atagtgagac cctgtctcta caaaaaatta aaaaattagt 7440
tggccatggt agtgggcgcc tgtagtccca gctgcttggc taaggtgaga ggtttgcttg 7500
agcctgggag gttgaggctg cggtgagcta tgatagcacc attgtattcc agcctgagta 7560
acagagaaag accctgtctc agaaaaaaaa aaaatacatt gaattgtttc ctgatgggaa 7620
gtaaatactc tcatgcccag ttaggagtga gtcagggttt ttaatatgcc actttttctt 7680
tctcaggcaa ctcatgcagc aattccagaa ccccgacttc ccacccgaag tagaggaaca 7740
ggatgccagc accctgcctg tgtcttgtgc ctgggagagt gggatgaaac gccacagagc 7800
agcctgtgct tcggctagta ttaatgtgta gatagcactc tggtagctgt taactgcaag 7860
tttagcttga attaagggat ttggggggac catgtaactt aattactgct agttttgaaa 7920
tgtctttgta agagtagggt cgccatgatg cagccatatg gaagactagg atatgggtca 7980
cacttatctg tgttcctatg gaaactattt gaatatttgt tttatatgga tttttattca 8040
ctcttcagac acgctactca agagtgcccc tcagctgctg aacaagcatt tgtagcttgt 8100
acaatggcag aatgggccaa aagcttagtg ttgtgacctg tttttaaaat aaagtatctt 8160
gaaataatta ggcattggga cgtt 8184
<210> 32
<211> 1344
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 编码ArgG的序列
<400> 32
atgacgacga ttctcaagca tctcccggta ggtcaacgta ttggtatcgc tttttctggc 60
ggtctggaca ccagtgccgc actgctgtgg atgcgacaaa agggagcggt tccttatgca 120
tatactgcaa acctgggcca gccagacgaa gaggattatg atgcgatccc tcgtcgtgcc 180
atggaatacg gcgcggagaa cgcacgtctg atcgactgcc gcaaacaact ggtggccgaa 240
ggtattgccg ctattcagtg tggcgcattt cataacacca ccggcggcct gacctatttc 300
aacacgacgc cgctgggccg cgccgtgact ggtaccatgc tggttgctgc gatgaaagaa 360
gatggcgtga atatctgggg tgacggtagc acctacaaag gaaacgatat cgaacgtttc 420
tatcgttatg gtctgctgac caatgctgaa ctgcagattt acaaaccgtg gcttgatact 480
gactttattg atgaactggg cggccgtcat gagatgtctg aatttatgat tgcctgcggt 540
ttcgactaca aaatgtctgt cgaaaaagcc tactccacag actccaacat gcttggtgca 600
acgcatgaag cgaaggatct ggaatacctc aactccagcg tcaaaatcgt caacccgatt 660
atgggcgtga aattctggga tgagagcgtg aagatcccgg cagaagaagt cacagtacgc 720
tttgaacaag gtcatccggt ggcgctgaac ggtaaaacct ttagcgacga cgtagaaatg 780
atgctggaag ctaaccgcat cggcggtcgt cacggcctgg gcatgagcga ccagattgaa 840
aaccgtatca tcgaagcgaa aagccgtggt atttacgaag ctccggggat ggcactgctg 900
cacattgcgt atgaacgcct gttgaccggt attcacaacg aagacaccat tgagcagtat 960
cacgcgcatg gtcgtcagtt gggccgtctg ctgtaccagg ggcgttggtt tgactcccag 1020
gcgctgatgc tgcgtgactc tctgcaacgc tgggttgcca gccagatcac tggtgaagtt 1080
accctggagc tgcgccgtgg gaacgattat tcaatcctga ataccgtctc agagaacctg 1140
acctacaagc cagagcgtct gacgatggaa aaaggcgact cggtgttctc gccagatgat 1200
cgtattggtc aattgaccat gcgtaacctg gatatcactg atacccgcga gaaacttttc 1260
ggttatgcca aaactggcct gctttcctcc tctgccgctt caggcgtgcc gcaggtggag 1320
aatctggaaa acaaaggcca gtaa 1344
<210> 33
<211> 1374
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 编码ArgH的序列
<400> 33
atggcacttt ggggcgggcg ttttacccag gcagcagatc aacggttcaa acaattcaac 60
gactcactgc gctttgatta ccgtctggcg gagcaggata ttgttggctc tgtggcctgg 120
tccaaagccc tggtcacggt aggcgtgtta accgcagaag agcaggcgca actggaagag 180
gcgctgaacg tgttgctgga agatgttcgc gccaggccac aacaaatcct tgaaagcgac 240
gccgaagata tccatagctg ggtggaaggc aaactgatcg acaaagtggg ccagttaggc 300
aaaaagctgc ataccgggcg tagccgtaat gatcaggtag cgactgacct gaaactgtgg 360
tgcaaagata ccgttagcga gttactgacg gctaaccggc agctgcaatc ggcgctggtg 420
gaaaccgcac aaaacaatca ggacgcggta atgccaggtt acactcacct gcaacgcgcc 480
cagccggtga cgttcgcgca ctggtgcctg gcctatgttg agatgctggc gcgtgatgaa 540
agccgtttgc aggatgcgct taagcgtctg gatgtcagcc cgctaggctg tggcgcgctg 600
gcgggaacgg cctatgaaat cgaccgtgaa cagttagcag gctggctggg ctttgcttcg 660
gcgacccgta acagtctcga cagcgtttct gaccgtgacc atgtgttgga actgctttct 720
gctgccgcta tcggcatggt gcatctgtcg cgttttgctg aagatctgat tttctttaac 780
accggcgaag cggggtttgt ggagctttct gaccgcgtga cttccggttc atcattaatg 840
ccgcagaaga aaaacccgga tgcgctggag ctgattcgcg gtaaatgcgg ccgggtgcag 900
ggggcgttaa ccggcatgat gatgacgctg aaaggtttgc cgctggctta caacaaagat 960
atgcaggaag acaaagaagg tctgttcgac gcgctcgata cctggctgga ctgcctgcat 1020
atggcggcgc tggtgctgga cggcattcag gtgaaacgtc cacgttgcca ggaagcggct 1080
cagcagggtt acgccaacgc caccgaactg gcggattatc tggtggcgaa aggcgtaccg 1140
ttccgcgagg cgcaccatat tgttggtgaa gcggtggtgg aagccattcg tcagggcaaa 1200
ccgctggaag atctgccgct cagtgagttg cagaaattca gtcaggtgat tgacgaagat 1260
gtctatccga ttctgtcgct gcaatcgtgc ctcgacaagc gtgcggcaaa aggcggcgtc 1320
tcaccgcagc aggtggcgca ggcgattgct tttgcgcagg ctcggttagg gtaa 1374
<210> 34
<211> 1005
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 编码ArgF的序列
<400> 34
atgtccgatt tatacaaaaa acactttctg aaactgctcg actttacccc tgcacagttc 60
acttctctgc tgacccttgc cgcacagctc aaagccgata aaaaaaatgg caaggaagta 120
cagaagctta ccggtaaaaa catcgcgctc atcttcgaaa aagactcgac tcgtacccgt 180
tgctctttcg aagttgccgc atttgaccag ggcgcgcgcg ttacctattt agggccgagc 240
ggcagccaga ttgggcataa agagtcaatt aaggacaccg cgcgggttct cgggcggatg 300
tatgacggca ttcagtatcg cggtcacggc caggaagtgg tcgaaacgct ggcgcagtat 360
gcgggcgtgc cggtgtggaa cgggctgacc aacgagttcc acccgaccca gctgctggcg 420
gacctgatga ccatgcagga gcacctgccg ggcaaggcgt ttaacgagat gacgctggtc 480
tacgcgggcg atgcgcgcaa caacatgggc aactcgatgc tggaagcggc ggcgctgacc 540
gggctggatc tgcgcctgtt ggccccgaaa gcctgctggc cggaagagag cctggtggcg 600
gagtgcagcg cgctggcgga gaagcacggc gggaaaatta ctctgacgga agacgtggcg 660
gcaggcgtta agggcgcgga ctttatctat accgacgtgt gggtgtcgat gggcgaggcc 720
aaagagaagt gggcagagcg gattgcgctg ctgcgcgggt atcaggtgaa cgcgcagatg 780
atggcgctga ccgacaaccc gaacgtgaag ttcctgcact gtctgccggc gttccatgac 840
gaccagacta cgctcggcaa gcagatggcg aaggagttcg atctgcacgg cgggatggag 900
gtgacggacg aggtgtttga gtcggcggcg agcatcgtgt tcgaccaggc ggaaaaccgg 960
atgcatacga ttaaggcggt gatgatggca acgcttgggg agtga 1005
<210> 35
<211> 2124
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 编码Trp5的序列
<400> 35
atgtcagaac aactcagaca aacatttgct aacgctaaaa aagaaaacag gaacgccttg 60
gtcacattta tgaccgcagg ttacccaaca gtcaaagaca ctgtccctat tctcaagggt 120
ttccaggatg gtggtgtaga tatcatcgaa ttgggtatgc ccttctctga tccaattgca 180
gatggtccta caattcaatt atctaatact gtggctttgc aaaacggtgt taccttgcct 240
caaactctag aaatggtctc ccaagctaga aatgaaggtg ttaccgtacc cataatccta 300
atgggttact ataaccctat tctaaactac ggtgaagaaa gatttattca ggacgctgcc 360
aaggctggtg ctaatggttt tatcatcgtc gatttgccac cagaggaggc gttgaaggtc 420
agaaactaca tcaatgataa tggtttgagc ctgatcccac tagtggctcc ttctaccacc 480
gacgaaagat tggaattact atcgcatatt gccgattcgt ttgtctacgt tgtgtctaga 540
atgggtacta ctggtgttca aagttctgtg gccagtgatt tggatgaact catctctaga 600
gtcagaaagt acaccaagga tactcctttg gccgttgggt ttggtgtctc taccagagaa 660
catttccaat cagttggtag tgttgctgac ggtgtagtga ttggttccaa aatcgtcaca 720
ttatgtggag atgctccaga gggcaaaagg tacgacgttg ctaaggaata tgtacaggga 780
attctaaatg gtgctaagca taaggttctg tccaaggacg aattctttgc ctttcaaaaa 840
gagtccttga agtccgcaaa cgttaagaag gaaatactgg acgaatttga tgaaaatcac 900
aagcacccaa ttagatttgg ggactttggt ggtcagtatg tcccagaagc tcttcatgca 960
tgtctaagag agttggaaaa gggttttgat gaagctgtcg ccgatcccac attctgggaa 1020
gacttcaaat ccttgtattc ttatattggc cgtccttctt cactacacaa agctgagaga 1080
ttaactgagc attgtcaagg tgctcaaatc tggttgaaga gagaagatct taaccacacg 1140
ggatctcaca agatcaacaa tgctttagca caagttcttc tagctaaaag attaggcaag 1200
aagaacgtta ttgctgaaac cggtgctggt caacacggtg ttgccactgc cactgcatgt 1260
gctaaatttg gcttaacctg tactgtgttc atgggtgcag aagatgttcg tcgccaagct 1320
ttaaacgtct tcagaatgag aattctcggt gctaaagtaa ttgctgttac taatggtaca 1380
aagactctaa gagacgctac ttcagaggca ttcagatttt gggttactaa cttgaaaact 1440
acttactacg tcgtcggttc tgccattggt cctcacccat atccaacttt ggttagaact 1500
ttccaaagtg tcattggtaa agaaaccaag gaacagtttg ctgccatgaa caatggtaaa 1560
ttacctgacg cagttgttgc atgtgttggg ggtggttcca actctacagg tatgttttca 1620
ccattcgagc atgatacttc cgttaagtta ttgggtgtgg aagccggtgg tgatggtgta 1680
gatacaaagt tccactctgc tactctaact gccggtagac ctggtgtctt ccatggtgtc 1740
aagacttatg tcttgcaaga tagtgatggt caagtccatg atactcattc tgtttctgct 1800
gggttagact acccaggtgt cggtccagaa ttggcatatt ggaaatctac tggccgtgct 1860
caattcattg cagctactga cgctcaggct ctgcttggct ttaaattatt atctcaatta 1920
gaaggtatta ttcccgcttt ggaatcttct catgctgttt atggcgcttg cgaattggct 1980
aagacgatga agcctgatca acatttggtt atcaatattt ctggtagagg tgataaagat 2040
gtccaaagtg tcgctgaagt cttgccgaaa ttaggtccaa agataggttg ggatttgaga 2100
ttcgaagaag acccatctgc ctaa 2124
<210> 36
<211> 2124
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 编码IDO的序列
<400> 36
atgtcagaac aactcagaca aacatttgct aacgctaaaa aagaaaacag gaacgccttg 60
gtcacattta tgaccgcagg ttacccaaca gtcaaagaca ctgtccctat tctcaagggt 120
ttccaggatg gtggtgtaga tatcatcgaa ttgggtatgc ccttctctga tccaattgca 180
gatggtccta caattcaatt atctaatact gtggctttgc aaaacggtgt taccttgcct 240
caaactctag aaatggtctc ccaagctaga aatgaaggtg ttaccgtacc cataatccta 300
atgggttact ataaccctat tctaaactac ggtgaagaaa gatttattca ggacgctgcc 360
aaggctggtg ctaatggttt tatcatcgtc gatttgccac cagaggaggc gttgaaggtc 420
agaaactaca tcaatgataa tggtttgagc ctgatcccac tagtggctcc ttctaccacc 480
gacgaaagat tggaattact atcgcatatt gccgattcgt ttgtctacgt tgtgtctaga 540
atgggtacta ctggtgttca aagttctgtg gccagtgatt tggatgaact catctctaga 600
gtcagaaagt acaccaagga tactcctttg gccgttgggt ttggtgtctc taccagagaa 660
catttccaat cagttggtag tgttgctgac ggtgtagtga ttggttccaa aatcgtcaca 720
ttatgtggag atgctccaga gggcaaaagg tacgacgttg ctaaggaata tgtacaggga 780
attctaaatg gtgctaagca taaggttctg tccaaggacg aattctttgc ctttcaaaaa 840
gagtccttga agtccgcaaa cgttaagaag gaaatactgg acgaatttga tgaaaatcac 900
aagcacccaa ttagatttgg ggactttggt ggtcagtatg tcccagaagc tcttcatgca 960
tgtctaagag agttggaaaa gggttttgat gaagctgtcg ccgatcccac attctgggaa 1020
gacttcaaat ccttgtattc ttatattggc cgtccttctt cactacacaa agctgagaga 1080
ttaactgagc attgtcaagg tgctcaaatc tggttgaaga gagaagatct taaccacacg 1140
ggatctcaca agatcaacaa tgctttagca caagttcttc tagctaaaag attaggcaag 1200
aagaacgtta ttgctgaaac cggtgctggt caacacggtg ttgccactgc cactgcatgt 1260
gctaaatttg gcttaacctg tactgtgttc atgggtgcag aagatgttcg tcgccaagct 1320
ttaaacgtct tcagaatgag aattctcggt gctaaagtaa ttgctgttac taatggtaca 1380
aagactctaa gagacgctac ttcagaggca ttcagatttt gggttactaa cttgaaaact 1440
acttactacg tcgtcggttc tgccattggt cctcacccat atccaacttt ggttagaact 1500
ttccaaagtg tcattggtaa agaaaccaag gaacagtttg ctgccatgaa caatggtaaa 1560
ttacctgacg cagttgttgc atgtgttggg ggtggttcca actctacagg tatgttttca 1620
ccattcgagc atgatacttc cgttaagtta ttgggtgtgg aagccggtgg tgatggtgta 1680
gatacaaagt tccactctgc tactctaact gccggtagac ctggtgtctt ccatggtgtc 1740
aagacttatg tcttgcaaga tagtgatggt caagtccatg atactcattc tgtttctgct 1800
gggttagact acccaggtgt cggtccagaa ttggcatatt ggaaatctac tggccgtgct 1860
caattcattg cagctactga cgctcaggct ctgcttggct ttaaattatt atctcaatta 1920
gaaggtatta ttcccgcttt ggaatcttct catgctgttt atggcgcttg cgaattggct 1980
aagacgatga agcctgatca acatttggtt atcaatattt ctggtagagg tgataaagat 2040
gtccaaagtg tcgctgaagt cttgccgaaa ttaggtccaa agataggttg ggatttgaga 2100
ttcgaagaag acccatctgc ctaa 2124
<210> 37
<211> 5691
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 编码示例性CAR GD2 ASS1+OTC的序列,不含MP71载体
<400> 37
atgcctcgcg gctggacagc cctgtgcctg ctgtctctgc tgccatccgg cttcatgagc 60
ctggataata acggcacagc caccccagag ctgcctacac agggcacctt cagcaatgtg 120
tccacaaacg tgagctatca ggagaccaca accccttcta ccctgggatc cacaagcctg 180
caccccgtgt ctcagcacgg caacgaagcc accaccaaca tcaccgagac cacagtgaag 240
tttacctcca cctctgtgat tacctctgtg tacggaaata caaactccag cgtgcagtct 300
cagacatctg tgatctccac agtgtttaca acacctgcca atgtgtccac cccagagaca 360
accctgaagc ccagcctgtc tcctggaaat gtgtccgatc tgtctaccac ctccaccagc 420
ctggccacct ctcccaccaa gccctatacc tcctcttctc ccatcctgag cgatatcaaa 480
gccgagatca aatgcagcgg gattcgggaa gtgaaactga cacagggcat ctgcctggaa 540
cagaataaga catccagctg cgccgagttt aagaaagata gaggagaggg actggccagg 600
gtgctgtgtg gcgaagagca ggccgacgcc gatgccggcg cccaggtgtg ttccctgctg 660
ctggcccagt ctgaggtgcg cccccagtgc ctgctgctgg tgctggccaa tcggacagaa 720
attagcagca agctgcagct gatgaaaaaa caccagagcg atctgaaaaa gctgggcatc 780
ctggacttta ccgagcagga cgtggcctct caccagagct acagccagaa aacactgatc 840
gccctggtga ccagcggagc cctgctggcc gtgctgggca tcaccggata tttcctgatg 900
aataggcgca gctggagccc caccggcgaa cggctggagc tggagcctgt cgaccgagtg 960
aagcagaccc tgaactttga tctgctgaag ctggccggcg acgtggagtc caaccccggg 1020
ccagggaata tggccttacc agtgaccgcc ttgctcctgc cgctggcctt gctgctccac 1080
gccgccaggc cggatattct gctcacacag accccactct ccctgcccgt gtcactcggg 1140
gatcaggcta gcatttcttg ccgctcatct cagtctctgg tccaccggaa tgggaacaca 1200
tacctccatt ggtacctcca gaaacctgga cagagcccta aactgctcat ccacaaagtc 1260
tcaaatcggt tctccggcgt gcccgatcgc tttagcggat ccggatctgg gaccgacttc 1320
acactgaaaa tctcacgagt ggaggctgag gatctcggcg tctacttctg tagtcagagt 1380
acccacgtcc cacccctcac ctttggcgct ggaacaaaac tggagctgaa acgagccgat 1440
gctgctccta ccgtgtccat ctttcctggc tccgggggag gcgggagcgg aggcgaagtg 1500
aaactccagc agtctggccc ttctctcgtg gaacctggcg cttctgtgat gatctcctgt 1560
aaggcctctg gatcttcctt taccggctac aacatgaact gggtccggca gaacattggc 1620
aaatccctgg aatggattgg cgccatcgat ccttactacg gcggcacatc atacaatcag 1680
aaattcaagg ggcgagcaac actcactgtc gacaaatctt catccaccgc ctacatgcac 1740
ctgaaatctc tcacatccga ggatagtgct gtctactact gtgtctctgg catggaatac 1800
tggggacagg gaacttctgt caccgtgtct agtgccaaaa ccacacctcc ctccgtgtac 1860
ggacgagtca ctgtctcatc tgctgaacca aaatcctgtg acaaaacaca cacatgccca 1920
ccttgtcctg cccctgaact gctcggcgga ccttccgtct ttctgtttcc ccccaaaccc 1980
aaggatacac tcatgatttc taggaccccc gaagtcactt gtgtcgtggt cgatgtgtct 2040
cacgaggatc ctgaagtgaa attcaactgg tacgtggacg gagtcgaggt ccacaatgcc 2100
aaaacaaaac cccgggagga acagtacaat agcacctacc gagtcgtgtc cgtgctcacc 2160
gtcctccatc aggattggct gaacggcaaa gagtacaagt gtaaagtgag taacaaggct 2220
ctccccgctc ctattgaaaa aaccatctca aaagcaaaag gccagcctag ggagcctcag 2280
gtctacacac tgccaccctc acgggacgaa ctcaccaaaa atcaggtgtc cctcacttgc 2340
ctggtgaaag gcttctaccc ttccgatatc gctgtggaat gggagtcaaa tgggcagccc 2400
gaaaacaact acaaaacaac cccccctgtg ctcgattccg atggctcttt tttcctgtac 2460
tccaaactca ccgtggacaa atcacgctgg cagcagggga atgtcttttc ttgctccgtg 2520
atgcacgagg ccctccacaa tcattacacc cagaaatccc tctcactctc acccggcaaa 2580
aaggacccta aaaccacgac gccagcgccg cgaccaccaa caccggcgcc caccatcgcg 2640
tcgcagcccc tgtccctgcg cccagaggcg tgccggccag cggcgggggg cgcagtgcac 2700
acgagggggc tggacttcgc ctgtgatatc tacatctggg cgcccttggc cgggacttgt 2760
ggggtccttc tcctgtcact ggttatcacc ctttactgca aacggggcag aaagaaactc 2820
ctgtatatat tcaaacaacc atttatgaga ccagtacaaa ctactcaaga ggaagatggc 2880
tgtagctgcc gatttccaga agaagaagaa ggaggatgtg aactgagagt gaagttcagc 2940
aggagcgcag acgcccccgc gtacaagcag ggccagaacc agctctataa cgagctcaat 3000
ctaggacgaa gagaggagta cgatgttttg gacaagagac gtggccggga ccctgagatg 3060
gggggaaagc cgagaaggaa gaaccctcag gaaggcctgt acaatgaact gcagaaagat 3120
aagatggcgg aggcctacag tgagattggg atgaaaggcg agcgccggag gggcaagggg 3180
cacgatggcc tttaccaggg tctcagtaca gccaccaagg acacctacga cgcccttcac 3240
atgcaggccc tgccccctcg cggcagcggc gccaccaact tcagcctgct gaagcaggcc 3300
ggcgacgtgg aggaaaaccc tggccccatg tccagcaaag gctccgtggt tctggcctac 3360
agtggcggcc tggacacctc gtgcatcctc gtgtggctga aggaacaagg ctatgacgtc 3420
attgcctatc tggccaacat tggccagaag gaagacttcg aggaagccag gaagaaggca 3480
ctgaaacttg gggccaaaaa ggtgttcatt gaggatgtca gcagggagtt tgtggaggag 3540
ttcatctggc cggccatcca gtccagcgca ctgtatgagg accgctacct cctgggcacc 3600
tctcttgcca ggccctgcat cgcccgcaaa caagtggaaa tcgcccagcg ggagggggcc 3660
aagtatgtgt cccacggcgc cacaggaaag gggaacgatc aggtccggtt tgagctcagc 3720
tgctactcac tggcccccca gataaaggtc attgctccct ggaggatgcc tgaattctac 3780
aaccggttca agggccgcaa tgacctgatg gagtacgcaa agcaacacgg gattcccatc 3840
ccggtcactc ccaagaaccc gtggagcatg gatgagaacc tcatgcacat cagctacgag 3900
gctggaatcc tggagaaccc caagaaccaa gcgcctccag gtctctacac gaagacccag 3960
gacccagcca aagcccccaa cacccctgac attctcgaga tcgagttcaa aaaaggggtc 4020
cctgtgaagg tgaccaacgt caaggatggc accacccacc agacctcctt ggagctcttc 4080
atgtacctga acgaagtcgc gggcaagcat ggcgtgggcc gtattgacat cgtggagaac 4140
cgcttcattg gaatgaagtc ccgaggtatc tacgagaccc cagcaggcac catcctttac 4200
catgctcatt tagacatcga ggccttcacc atggaccggg aagtgcgcaa aatcaaacaa 4260
ggcctgggct tgaaatttgc tgagctggtg tataccggtt tctggcacag ccctgagtgt 4320
gaatttgtcc gccactgcat cgccaagtcc caggagcgag tggaagggaa agtgcaggtg 4380
tccgtcctca agggccaggt gtacatcctc ggccgggagt ccccactgtc tctctacaat 4440
gaggagctgg tgagcatgaa cgtgcagggt gattatgagc caactgatgc caccgggttc 4500
atcaacatca attccctcag gctgaaggaa tatcatcgtc tccagagcaa ggtcactgcc 4560
aaaggaagcg gagagggcag aggaagtctg ctaacatgcg gtgacgtcga ggagaatcct 4620
ggacctatgc tgtttaatct gaggatcctg ttaaacaatg cagcttttag aaatggtcac 4680
aacttcatgg ttcgaaattt tcggtgtgga caaccactac aaaataaagt gcagctgaag 4740
ggccgtgacc ttctcactct aaaaaacttt accggagaag aaattaaata tatgctatgg 4800
ctatcagcag atctgaaatt taggataaaa cagaaaggag agtatttgcc tttattgcaa 4860
gggaagtcct taggcatgat ttttgagaaa agaagtactc gaacaagatt gtctacagaa 4920
acaggcttag cacttctggg aggacatcct tgttttctta ccacacaaga tattcatttg 4980
ggtgtgaatg aaagtctcac ggacacggcc cgtgtattgt ctagcatggc agatgcagta 5040
ttggctcgag tgtataaaca atcagatttg gacaccctgg ctaaagaagc atccatccca 5100
attatcaatg ggctgtcaga tttgtaccat cctatccaga tcctggctga ttacctcacg 5160
ctccaggaac actatagctc tctgaaaggt cttaccctca gctggatcgg ggatgggaac 5220
aatatcctgc actccatcat gatgagcgca gcgaaattcg gaatgcacct tcaggcagct 5280
actccaaagg gttatgagcc ggatgctagt gtaaccaagt tggcagagca gtatgccaaa 5340
gagaatggta ccaagctgtt gctgacaaat gatccattgg aagcagcgca tggaggcaat 5400
gtattaatta cagacacttg gataagcatg ggacaagaag aggagaagaa aaagcggctc 5460
caggctttcc aaggttacca ggttacaatg aagactgcta aagttgctgc ctctgactgg 5520
acatttttac actgcttgcc cagaaagcca gaagaagtgg atgatgaagt cttttattct 5580
cctcgatcac tagtgttccc agaggcagaa aacagaaagt ggacaatcat ggctgtcatg 5640
gtgtccctgc tgacagatta ctcacctcag ctccagaagc ctaaatttta a 5691
<210> 38
<211> 4566
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 编码GD2 ASS1的示例性CAR的序列,不含MP71载体
<400> 38
atgcctcgcg gctggacagc cctgtgcctg ctgtctctgc tgccatccgg cttcatgagc 60
ctggataata acggcacagc caccccagag ctgcctacac agggcacctt cagcaatgtg 120
tccacaaacg tgagctatca ggagaccaca accccttcta ccctgggatc cacaagcctg 180
caccccgtgt ctcagcacgg caacgaagcc accaccaaca tcaccgagac cacagtgaag 240
tttacctcca cctctgtgat tacctctgtg tacggaaata caaactccag cgtgcagtct 300
cagacatctg tgatctccac agtgtttaca acacctgcca atgtgtccac cccagagaca 360
accctgaagc ccagcctgtc tcctggaaat gtgtccgatc tgtctaccac ctccaccagc 420
ctggccacct ctcccaccaa gccctatacc tcctcttctc ccatcctgag cgatatcaaa 480
gccgagatca aatgcagcgg gattcgggaa gtgaaactga cacagggcat ctgcctggaa 540
cagaataaga catccagctg cgccgagttt aagaaagata gaggagaggg actggccagg 600
gtgctgtgtg gcgaagagca ggccgacgcc gatgccggcg cccaggtgtg ttccctgctg 660
ctggcccagt ctgaggtgcg cccccagtgc ctgctgctgg tgctggccaa tcggacagaa 720
attagcagca agctgcagct gatgaaaaaa caccagagcg atctgaaaaa gctgggcatc 780
ctggacttta ccgagcagga cgtggcctct caccagagct acagccagaa aacactgatc 840
gccctggtga ccagcggagc cctgctggcc gtgctgggca tcaccggata tttcctgatg 900
aataggcgca gctggagccc caccggcgaa cggctggagc tggagcctgt cgaccgagtg 960
aagcagaccc tgaactttga tctgctgaag ctggccggcg acgtggagtc caaccccggg 1020
ccagggaata tggccttacc agtgaccgcc ttgctcctgc cgctggcctt gctgctccac 1080
gccgccaggc cggatattct gctcacacag accccactct ccctgcccgt gtcactcggg 1140
gatcaggcta gcatttcttg ccgctcatct cagtctctgg tccaccggaa tgggaacaca 1200
tacctccatt ggtacctcca gaaacctgga cagagcccta aactgctcat ccacaaagtc 1260
tcaaatcggt tctccggcgt gcccgatcgc tttagcggat ccggatctgg gaccgacttc 1320
acactgaaaa tctcacgagt ggaggctgag gatctcggcg tctacttctg tagtcagagt 1380
acccacgtcc cacccctcac ctttggcgct ggaacaaaac tggagctgaa acgagccgat 1440
gctgctccta ccgtgtccat ctttcctggc tccgggggag gcgggagcgg aggcgaagtg 1500
aaactccagc agtctggccc ttctctcgtg gaacctggcg cttctgtgat gatctcctgt 1560
aaggcctctg gatcttcctt taccggctac aacatgaact gggtccggca gaacattggc 1620
aaatccctgg aatggattgg cgccatcgat ccttactacg gcggcacatc atacaatcag 1680
aaattcaagg ggcgagcaac actcactgtc gacaaatctt catccaccgc ctacatgcac 1740
ctgaaatctc tcacatccga ggatagtgct gtctactact gtgtctctgg catggaatac 1800
tggggacagg gaacttctgt caccgtgtct agtgccaaaa ccacacctcc ctccgtgtac 1860
ggacgagtca ctgtctcatc tgctgaacca aaatcctgtg acaaaacaca cacatgccca 1920
ccttgtcctg cccctgaact gctcggcgga ccttccgtct ttctgtttcc ccccaaaccc 1980
aaggatacac tcatgatttc taggaccccc gaagtcactt gtgtcgtggt cgatgtgtct 2040
cacgaggatc ctgaagtgaa attcaactgg tacgtggacg gagtcgaggt ccacaatgcc 2100
aaaacaaaac cccgggagga acagtacaat agcacctacc gagtcgtgtc cgtgctcacc 2160
gtcctccatc aggattggct gaacggcaaa gagtacaagt gtaaagtgag taacaaggct 2220
ctccccgctc ctattgaaaa aaccatctca aaagcaaaag gccagcctag ggagcctcag 2280
gtctacacac tgccaccctc acgggacgaa ctcaccaaaa atcaggtgtc cctcacttgc 2340
ctggtgaaag gcttctaccc ttccgatatc gctgtggaat gggagtcaaa tgggcagccc 2400
gaaaacaact acaaaacaac cccccctgtg ctcgattccg atggctcttt tttcctgtac 2460
tccaaactca ccgtggacaa atcacgctgg cagcagggga atgtcttttc ttgctccgtg 2520
atgcacgagg ccctccacaa tcattacacc cagaaatccc tctcactctc acccggcaaa 2580
aaggacccta aaaccacgac gccagcgccg cgaccaccaa caccggcgcc caccatcgcg 2640
tcgcagcccc tgtccctgcg cccagaggcg tgccggccag cggcgggggg cgcagtgcac 2700
acgagggggc tggacttcgc ctgtgatatc tacatctggg cgcccttggc cgggacttgt 2760
ggggtccttc tcctgtcact ggttatcacc ctttactgca aacggggcag aaagaaactc 2820
ctgtatatat tcaaacaacc atttatgaga ccagtacaaa ctactcaaga ggaagatggc 2880
tgtagctgcc gatttccaga agaagaagaa ggaggatgtg aactgagagt gaagttcagc 2940
aggagcgcag acgcccccgc gtacaagcag ggccagaacc agctctataa cgagctcaat 3000
ctaggacgaa gagaggagta cgatgttttg gacaagagac gtggccggga ccctgagatg 3060
gggggaaagc cgagaaggaa gaaccctcag gaaggcctgt acaatgaact gcagaaagat 3120
aagatggcgg aggcctacag tgagattggg atgaaaggcg agcgccggag gggcaagggg 3180
cacgatggcc tttaccaggg tctcagtaca gccaccaagg acacctacga cgcccttcac 3240
atgcaggccc tgccccctcg cggcagcggc gccaccaact tcagcctgct gaagcaggcc 3300
ggcgacgtgg aggaaaaccc tggccccatg tccagcaaag gctccgtggt tctggcctac 3360
agtggcggcc tggacacctc gtgcatcctc gtgtggctga aggaacaagg ctatgacgtc 3420
attgcctatc tggccaacat tggccagaag gaagacttcg aggaagccag gaagaaggca 3480
ctgaaacttg gggccaaaaa ggtgttcatt gaggatgtca gcagggagtt tgtggaggag 3540
ttcatctggc cggccatcca gtccagcgca ctgtatgagg accgctacct cctgggcacc 3600
tctcttgcca ggccctgcat cgcccgcaaa caagtggaaa tcgcccagcg ggagggggcc 3660
aagtatgtgt cccacggcgc cacaggaaag gggaacgatc aggtccggtt tgagctcagc 3720
tgctactcac tggcccccca gataaaggtc attgctccct ggaggatgcc tgaattctac 3780
aaccggttca agggccgcaa tgacctgatg gagtacgcaa agcaacacgg gattcccatc 3840
ccggtcactc ccaagaaccc gtggagcatg gatgagaacc tcatgcacat cagctacgag 3900
gctggaatcc tggagaaccc caagaaccaa gcgcctccag gtctctacac gaagacccag 3960
gacccagcca aagcccccaa cacccctgac attctcgaga tcgagttcaa aaaaggggtc 4020
cctgtgaagg tgaccaacgt caaggatggc accacccacc agacctcctt ggagctcttc 4080
atgtacctga acgaagtcgc gggcaagcat ggcgtgggcc gtattgacat cgtggagaac 4140
cgcttcattg gaatgaagtc ccgaggtatc tacgagaccc cagcaggcac catcctttac 4200
catgctcatt tagacatcga ggccttcacc atggaccggg aagtgcgcaa aatcaaacaa 4260
ggcctgggct tgaaatttgc tgagctggtg tataccggtt tctggcacag ccctgagtgt 4320
gaatttgtcc gccactgcat cgccaagtcc caggagcgag tggaagggaa agtgcaggtg 4380
tccgtcctca agggccaggt gtacatcctc ggccgggagt ccccactgtc tctctacaat 4440
gaggagctgg tgagcatgaa cgtgcagggt gattatgagc caactgatgc caccgggttc 4500
atcaacatca attccctcag gctgaaggaa tatcatcgtc tccagagcaa ggtcactgcc 4560
aaataa 4566
<210> 39
<211> 4398
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 编码GD2 OTC的示例性CAR的序列,不含MP71载体
<400> 39
atgcctcgcg gctggacagc cctgtgcctg ctgtctctgc tgccatccgg cttcatgagc 60
ctggataata acggcacagc caccccagag ctgcctacac agggcacctt cagcaatgtg 120
tccacaaacg tgagctatca ggagaccaca accccttcta ccctgggatc cacaagcctg 180
caccccgtgt ctcagcacgg caacgaagcc accaccaaca tcaccgagac cacagtgaag 240
tttacctcca cctctgtgat tacctctgtg tacggaaata caaactccag cgtgcagtct 300
cagacatctg tgatctccac agtgtttaca acacctgcca atgtgtccac cccagagaca 360
accctgaagc ccagcctgtc tcctggaaat gtgtccgatc tgtctaccac ctccaccagc 420
ctggccacct ctcccaccaa gccctatacc tcctcttctc ccatcctgag cgatatcaaa 480
gccgagatca aatgcagcgg gattcgggaa gtgaaactga cacagggcat ctgcctggaa 540
cagaataaga catccagctg cgccgagttt aagaaagata gaggagaggg actggccagg 600
gtgctgtgtg gcgaagagca ggccgacgcc gatgccggcg cccaggtgtg ttccctgctg 660
ctggcccagt ctgaggtgcg cccccagtgc ctgctgctgg tgctggccaa tcggacagaa 720
attagcagca agctgcagct gatgaaaaaa caccagagcg atctgaaaaa gctgggcatc 780
ctggacttta ccgagcagga cgtggcctct caccagagct acagccagaa aacactgatc 840
gccctggtga ccagcggagc cctgctggcc gtgctgggca tcaccggata tttcctgatg 900
aataggcgca gctggagccc caccggcgaa cggctggagc tggagcctgt cgaccgagtg 960
aagcagaccc tgaactttga tctgctgaag ctggccggcg acgtggagtc caaccccggg 1020
ccagggaata tggccttacc agtgaccgcc ttgctcctgc cgctggcctt gctgctccac 1080
gccgccaggc cggatattct gctcacacag accccactct ccctgcccgt gtcactcggg 1140
gatcaggcta gcatttcttg ccgctcatct cagtctctgg tccaccggaa tgggaacaca 1200
tacctccatt ggtacctcca gaaacctgga cagagcccta aactgctcat ccacaaagtc 1260
tcaaatcggt tctccggcgt gcccgatcgc tttagcggat ccggatctgg gaccgacttc 1320
acactgaaaa tctcacgagt ggaggctgag gatctcggcg tctacttctg tagtcagagt 1380
acccacgtcc cacccctcac ctttggcgct ggaacaaaac tggagctgaa acgagccgat 1440
gctgctccta ccgtgtccat ctttcctggc tccgggggag gcgggagcgg aggcgaagtg 1500
aaactccagc agtctggccc ttctctcgtg gaacctggcg cttctgtgat gatctcctgt 1560
aaggcctctg gatcttcctt taccggctac aacatgaact gggtccggca gaacattggc 1620
aaatccctgg aatggattgg cgccatcgat ccttactacg gcggcacatc atacaatcag 1680
aaattcaagg ggcgagcaac actcactgtc gacaaatctt catccaccgc ctacatgcac 1740
ctgaaatctc tcacatccga ggatagtgct gtctactact gtgtctctgg catggaatac 1800
tggggacagg gaacttctgt caccgtgtct agtgccaaaa ccacacctcc ctccgtgtac 1860
ggacgagtca ctgtctcatc tgctgaacca aaatcctgtg acaaaacaca cacatgccca 1920
ccttgtcctg cccctgaact gctcggcgga ccttccgtct ttctgtttcc ccccaaaccc 1980
aaggatacac tcatgatttc taggaccccc gaagtcactt gtgtcgtggt cgatgtgtct 2040
cacgaggatc ctgaagtgaa attcaactgg tacgtggacg gagtcgaggt ccacaatgcc 2100
aaaacaaaac cccgggagga acagtacaat agcacctacc gagtcgtgtc cgtgctcacc 2160
gtcctccatc aggattggct gaacggcaaa gagtacaagt gtaaagtgag taacaaggct 2220
ctccccgctc ctattgaaaa aaccatctca aaagcaaaag gccagcctag ggagcctcag 2280
gtctacacac tgccaccctc acgggacgaa ctcaccaaaa atcaggtgtc cctcacttgc 2340
ctggtgaaag gcttctaccc ttccgatatc gctgtggaat gggagtcaaa tgggcagccc 2400
gaaaacaact acaaaacaac cccccctgtg ctcgattccg atggctcttt tttcctgtac 2460
tccaaactca ccgtggacaa atcacgctgg cagcagggga atgtcttttc ttgctccgtg 2520
atgcacgagg ccctccacaa tcattacacc cagaaatccc tctcactctc acccggcaaa 2580
aaggacccta aaaccacgac gccagcgccg cgaccaccaa caccggcgcc caccatcgcg 2640
tcgcagcccc tgtccctgcg cccagaggcg tgccggccag cggcgggggg cgcagtgcac 2700
acgagggggc tggacttcgc ctgtgatttt tgggtgctgg tggtggttgg tggagtcctg 2760
gcttgctata gcttgctagt aacagtggcc tttattattt tctgggtgag gagtaagagg 2820
agcaggctcc tgcacagtga ctacatgaac atgactcccc gccgccccgg gcccacccgc 2880
aagcattacc agccctatgc cccacctcgc gacttcgcag cctatcgctc cagagtgaag 2940
ttcagcagga gcgcagacgc ccccgcgtac aagcagggcc agaaccagct ctataacgag 3000
ctcaatctag gacgaagaga ggagtacgat gttttggaca agagacgtgg ccgggaccct 3060
gagatggggg gaaagccgag aaggaagaac cctcaggaag gcctgtacaa tgaactgcag 3120
aaagataaga tggcggaggc ctacagtgag attgggatga aaggcgagcg ccggaggggc 3180
aaggggcacg atggccttta ccagggtctc agtacagcca ccaaggacac ctacgacgcc 3240
cttcacatgc aggccctgcc ccctcgcggc agcggcgcca ccaacttcag cctgctgaag 3300
caggccggcg acgtggagga aaaccctggc cccatgctgt ttaatctgag gatcctgtta 3360
aacaatgcag cttttagaaa tggtcacaac ttcatggttc gaaattttcg gtgtggacaa 3420
ccactacaaa ataaagtgca gctgaagggc cgtgaccttc tcactctaaa aaactttacc 3480
ggagaagaaa ttaaatatat gctatggcta tcagcagatc tgaaatttag gataaaacag 3540
aaaggagagt atttgccttt attgcaaggg aagtccttag gcatgatttt tgagaaaaga 3600
agtactcgaa caagattgtc tacagaaaca ggcttagcac ttctgggagg acatccttgt 3660
tttcttacca cacaagatat tcatttgggt gtgaatgaaa gtctcacgga cacggcccgt 3720
gtattgtcta gcatggcaga tgcagtattg gctcgagtgt ataaacaatc agatttggac 3780
accctggcta aagaagcatc catcccaatt atcaatgggc tgtcagattt gtaccatcct 3840
atccagatcc tggctgatta cctcacgctc caggaacact atagctctct gaaaggtctt 3900
accctcagct ggatcgggga tgggaacaat atcctgcact ccatcatgat gagcgcagcg 3960
aaattcggaa tgcaccttca ggcagctact ccaaagggtt atgagccgga tgctagtgta 4020
accaagttgg cagagcagta tgccaaagag aatggtacca agctgttgct gacaaatgat 4080
ccattggaag cagcgcatgg aggcaatgta ttaattacag acacttggat aagcatggga 4140
caagaagagg agaagaaaaa gcggctccag gctttccaag gttaccaggt tacaatgaag 4200
actgctaaag ttgctgcctc tgactggaca tttttacact gcttgcccag aaagccagaa 4260
gaagtggatg atgaagtctt ttattctcct cgatcactag tgttcccaga ggcagaaaac 4320
agaaagtgga caatcatggc tgtcatggtg tccctgctga cagattactc acctcagctc 4380
cagaagccta aattttaa 4398
<210> 40
<211> 342
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 编码可选的CD3z的序列
<400> 40
agagtgaagt tcagcaggag cgcagacgcc cccgcgtacc agcagggcca gaaccagctc 60
tataacgagc tcaatctagg acgaagagag gagtacgatg ttttggacaa gagacgtggc 120
cgggaccctg agatgggggg aaagccgcag agaaggaaga accctcagga aggcctgtac 180
aatgaactgc agaaagataa gatggcggag gcctacagtg agattgggat gaaaggcgag 240
cgccggaggg gcaaggggca cgatggcctt taccagggtc tcagtacagc caccaaggac 300
acctacgacg cccttcacat gcaggccctg ccccctcgct aa 342
<210> 41
<211> 786
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 编码可选的EGFRvIII靶结合部分的序列
(源自MR1抗体的EGFRvIII scFv序列)
<400> 41
atggactgga tttggcgcat ccttttcctt gtcggcgctg ctaccggcgc gcattctcag 60
gtacaactcc agcagtctgg gggaggctta gtgaagcctg gagcgtctct gaaactctcc 120
tgtgtaacct ctggattcac tttcagaaaa tttggcatgt cttgggttcg ccagactagt 180
gacaagaggc tggaatgggt cgcatccatt agtactggcg gttataacac gtactattca 240
gacaatgtaa agggccgatt caccatctcc agagagaatg ccaagaacac cctgtacctg 300
caaatgagta gtctgaagtc tgaggacacg gccttgtatt actgtacaag aggctattct 360
agtacctctt atgctatgga ctactggggc caagggacca cggtcaccgt ctcctcaagt 420
ggaggcggtt caggcggagg tggctctggc ggtggcggat cggacatcga gctcactcag 480
tctccagcat ccctgtccgt ggctacagga gaaaaagtca ctatcagatg catgaccagc 540
actgatattg atgatgatat gaactggtac cagcagaagc caggggaacc ccctaagttc 600
cttatttcag aaggcaatac tcttcggccg ggagtcccat cccgattttc cagcagtggc 660
actggcacag attttgtttt tacaattgaa aacacactct cggaagatgt tggagattac 720
tactgtttgc aaagctttaa cgtgcctctt acattcggtg atggcaccaa gcttgaaaaa 780
gctcta 786
<210> 42
<211> 1283
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 包含ASS-1结构域的EGFRvIII (采用可选的由SEQ ID NO: 41编码的EGFRvIII靶结合部分)的示例性CAR的氨基酸序列
<400> 42
Met Pro Arg Gly Trp Thr Ala Leu Cys Leu Leu Ser Leu Leu Pro Ser
1 5 10 15
Gly Phe Met Ser Leu Asp Asn Asn Gly Thr Ala Thr Pro Glu Leu Pro
20 25 30
Thr Gln Gly Thr Phe Ser Asn Val Ser Thr Asn Val Ser Tyr Gln Glu
35 40 45
Thr Thr Thr Pro Ser Thr Leu Gly Ser Thr Ser Leu His Pro Val Ser
50 55 60
Gln His Gly Asn Glu Ala Thr Thr Asn Ile Thr Glu Thr Thr Val Lys
65 70 75 80
Phe Thr Ser Thr Ser Val Ile Thr Ser Val Tyr Gly Asn Thr Asn Ser
85 90 95
Ser Val Gln Ser Gln Thr Ser Val Ile Ser Thr Val Phe Thr Thr Pro
100 105 110
Ala Asn Val Ser Thr Pro Glu Thr Thr Leu Lys Pro Ser Leu Ser Pro
115 120 125
Gly Asn Val Ser Asp Leu Ser Thr Thr Ser Thr Ser Leu Ala Thr Ser
130 135 140
Pro Thr Lys Pro Tyr Thr Ser Ser Ser Pro Ile Leu Ser Asp Ile Lys
145 150 155 160
Ala Glu Ile Lys Cys Ser Gly Ile Arg Glu Val Lys Leu Thr Gln Gly
165 170 175
Ile Cys Leu Glu Gln Asn Lys Thr Ser Ser Cys Ala Glu Phe Lys Lys
180 185 190
Asp Arg Gly Glu Gly Leu Ala Arg Val Leu Cys Gly Glu Glu Gln Ala
195 200 205
Asp Ala Asp Ala Gly Ala Gln Val Cys Ser Leu Leu Leu Ala Gln Ser
210 215 220
Glu Val Arg Pro Gln Cys Leu Leu Leu Val Leu Ala Asn Arg Thr Glu
225 230 235 240
Ile Ser Ser Lys Leu Gln Leu Met Lys Lys His Gln Ser Asp Leu Lys
245 250 255
Lys Leu Gly Ile Leu Asp Phe Thr Glu Gln Asp Val Ala Ser His Gln
260 265 270
Ser Tyr Ser Gln Lys Thr Leu Ile Ala Leu Val Thr Ser Gly Ala Leu
275 280 285
Leu Ala Val Leu Gly Ile Thr Gly Tyr Phe Leu Met Asn Arg Arg Ser
290 295 300
Trp Ser Pro Thr Gly Glu Arg Leu Glu Leu Glu Pro Val Asp Arg Val
305 310 315 320
Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu
325 330 335
Ser Asn Pro Gly Pro Gly Asn Met Ala Leu Pro Val Thr Ala Leu Leu
340 345 350
Leu Pro Leu Ala Leu Leu Leu His Ala Ala Arg Pro Met Asp Trp Ile
355 360 365
Trp Arg Ile Leu Phe Leu Val Gly Ala Ala Thr Gly Ala His Ser Gln
370 375 380
Val Gln Leu Gln Gln Ser Gly Gly Gly Leu Val Lys Pro Gly Ala Ser
385 390 395 400
Leu Lys Leu Ser Cys Val Thr Ser Gly Phe Thr Phe Arg Lys Phe Gly
405 410 415
Met Ser Trp Val Arg Gln Thr Ser Asp Lys Arg Leu Glu Trp Val Ala
420 425 430
Ser Ile Ser Thr Gly Gly Tyr Asn Thr Tyr Tyr Ser Asp Asn Val Lys
435 440 445
Gly Arg Phe Thr Ile Ser Arg Glu Asn Ala Lys Asn Thr Leu Tyr Leu
450 455 460
Gln Met Ser Ser Leu Lys Ser Glu Asp Thr Ala Leu Tyr Tyr Cys Thr
465 470 475 480
Arg Gly Tyr Ser Ser Thr Ser Tyr Ala Met Asp Tyr Trp Gly Gln Gly
485 490 495
Thr Thr Val Thr Val Ser Ser Ser Gly Gly Gly Ser Gly Gly Gly Gly
500 505 510
Ser Gly Gly Gly Gly Ser Asp Ile Glu Leu Thr Gln Ser Pro Ala Ser
515 520 525
Leu Ser Val Ala Thr Gly Glu Lys Val Thr Ile Arg Cys Met Thr Ser
530 535 540
Thr Asp Ile Asp Asp Asp Met Asn Trp Tyr Gln Gln Lys Pro Gly Glu
545 550 555 560
Pro Pro Lys Phe Leu Ile Ser Glu Gly Asn Thr Leu Arg Pro Gly Val
565 570 575
Pro Ser Arg Phe Ser Ser Ser Gly Thr Gly Thr Asp Phe Val Phe Thr
580 585 590
Ile Glu Asn Thr Leu Ser Glu Asp Val Gly Asp Tyr Tyr Cys Leu Gln
595 600 605
Ser Phe Asn Val Pro Leu Thr Phe Gly Asp Gly Thr Lys Leu Glu Lys
610 615 620
Ala Leu Thr Thr Thr Pro Ala Pro Arg Pro Pro Thr Pro Ala Pro Thr
625 630 635 640
Ile Ala Ser Gln Pro Leu Ser Leu Arg Pro Glu Ala Cys Arg Pro Ala
645 650 655
Ala Gly Gly Ala Val His Thr Arg Gly Leu Asp Phe Ala Cys Asp Ile
660 665 670
Tyr Ile Trp Ala Pro Leu Ala Gly Thr Cys Gly Val Leu Leu Leu Ser
675 680 685
Leu Val Ile Thr Leu Tyr Cys Lys Arg Gly Arg Lys Lys Leu Leu Tyr
690 695 700
Ile Phe Lys Gln Pro Phe Met Arg Pro Val Gln Thr Thr Gln Glu Glu
705 710 715 720
Asp Gly Cys Ser Cys Arg Phe Pro Glu Glu Glu Glu Gly Gly Cys Glu
725 730 735
Leu Arg Val Lys Phe Ser Arg Ser Ala Asp Ala Pro Ala Tyr Lys Gln
740 745 750
Gly Gln Asn Gln Leu Tyr Asn Glu Leu Asn Leu Gly Arg Arg Glu Glu
755 760 765
Tyr Asp Val Leu Asp Lys Arg Arg Gly Arg Asp Pro Glu Met Gly Gly
770 775 780
Lys Pro Arg Arg Lys Asn Pro Gln Glu Gly Leu Tyr Asn Glu Leu Gln
785 790 795 800
Lys Asp Lys Met Ala Glu Ala Tyr Ser Glu Ile Gly Met Lys Gly Glu
805 810 815
Arg Arg Arg Gly Lys Gly His Asp Gly Leu Tyr Gln Gly Leu Ser Thr
820 825 830
Ala Thr Lys Asp Thr Tyr Asp Ala Leu His Met Gln Ala Leu Pro Pro
835 840 845
Arg Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp
850 855 860
Val Glu Glu Asn Pro Gly Pro Met Ser Ser Lys Gly Ser Val Val Leu
865 870 875 880
Ala Tyr Ser Gly Gly Leu Asp Thr Ser Cys Ile Leu Val Trp Leu Lys
885 890 895
Glu Gln Gly Tyr Asp Val Ile Ala Tyr Leu Ala Asn Ile Gly Gln Lys
900 905 910
Glu Asp Phe Glu Glu Ala Arg Lys Lys Ala Leu Lys Leu Gly Ala Lys
915 920 925
Lys Val Phe Ile Glu Asp Val Ser Arg Glu Phe Val Glu Glu Phe Ile
930 935 940
Trp Pro Ala Ile Gln Ser Ser Ala Leu Tyr Glu Asp Arg Tyr Leu Leu
945 950 955 960
Gly Thr Ser Leu Ala Arg Pro Cys Ile Ala Arg Lys Gln Val Glu Ile
965 970 975
Ala Gln Arg Glu Gly Ala Lys Tyr Val Ser His Gly Ala Thr Gly Lys
980 985 990
Gly Asn Asp Gln Val Arg Phe Glu Leu Ser Cys Tyr Ser Leu Ala Pro
995 1000 1005
Gln Ile Lys Val Ile Ala Pro Trp Arg Met Pro Glu Phe Tyr Asn
1010 1015 1020
Arg Phe Lys Gly Arg Asn Asp Leu Met Glu Tyr Ala Lys Gln His
1025 1030 1035
Gly Ile Pro Ile Pro Val Thr Pro Lys Asn Pro Trp Ser Met Asp
1040 1045 1050
Glu Asn Leu Met His Ile Ser Tyr Glu Ala Gly Ile Leu Glu Asn
1055 1060 1065
Pro Lys Asn Gln Ala Pro Pro Gly Leu Tyr Thr Lys Thr Gln Asp
1070 1075 1080
Pro Ala Lys Ala Pro Asn Thr Pro Asp Ile Leu Glu Ile Glu Phe
1085 1090 1095
Lys Lys Gly Val Pro Val Lys Val Thr Asn Val Lys Asp Gly Thr
1100 1105 1110
Thr His Gln Thr Ser Leu Glu Leu Phe Met Tyr Leu Asn Glu Val
1115 1120 1125
Ala Gly Lys His Gly Val Gly Arg Ile Asp Ile Val Glu Asn Arg
1130 1135 1140
Phe Ile Gly Met Lys Ser Arg Gly Ile Tyr Glu Thr Pro Ala Gly
1145 1150 1155
Thr Ile Leu Tyr His Ala His Leu Asp Ile Glu Ala Phe Thr Met
1160 1165 1170
Asp Arg Glu Val Arg Lys Ile Lys Gln Gly Leu Gly Leu Lys Phe
1175 1180 1185
Ala Glu Leu Val Tyr Thr Gly Phe Trp His Ser Pro Glu Cys Glu
1190 1195 1200
Phe Val Arg His Cys Ile Ala Lys Ser Gln Glu Arg Val Glu Gly
1205 1210 1215
Lys Val Gln Val Ser Val Leu Lys Gly Gln Val Tyr Ile Leu Gly
1220 1225 1230
Arg Glu Ser Pro Leu Ser Leu Tyr Asn Glu Glu Leu Val Ser Met
1235 1240 1245
Asn Val Gln Gly Asp Tyr Glu Pro Thr Asp Ala Thr Gly Phe Ile
1250 1255 1260
Asn Ile Asn Ser Leu Arg Leu Lys Glu Tyr His Arg Leu Gln Ser
1265 1270 1275
Lys Val Thr Ala Lys
1280
<210> 43
<211> 1225
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 包含OTC结构域的EGFRvIII (采用可选的由SEQ ID NO: 41编码的EGFRvIII靶结合部分)的示例性CAR的氨基酸序列
<400> 43
Met Pro Arg Gly Trp Thr Ala Leu Cys Leu Leu Ser Leu Leu Pro Ser
1 5 10 15
Gly Phe Met Ser Leu Asp Asn Asn Gly Thr Ala Thr Pro Glu Leu Pro
20 25 30
Thr Gln Gly Thr Phe Ser Asn Val Ser Thr Asn Val Ser Tyr Gln Glu
35 40 45
Thr Thr Thr Pro Ser Thr Leu Gly Ser Thr Ser Leu His Pro Val Ser
50 55 60
Gln His Gly Asn Glu Ala Thr Thr Asn Ile Thr Glu Thr Thr Val Lys
65 70 75 80
Phe Thr Ser Thr Ser Val Ile Thr Ser Val Tyr Gly Asn Thr Asn Ser
85 90 95
Ser Val Gln Ser Gln Thr Ser Val Ile Ser Thr Val Phe Thr Thr Pro
100 105 110
Ala Asn Val Ser Thr Pro Glu Thr Thr Leu Lys Pro Ser Leu Ser Pro
115 120 125
Gly Asn Val Ser Asp Leu Ser Thr Thr Ser Thr Ser Leu Ala Thr Ser
130 135 140
Pro Thr Lys Pro Tyr Thr Ser Ser Ser Pro Ile Leu Ser Asp Ile Lys
145 150 155 160
Ala Glu Ile Lys Cys Ser Gly Ile Arg Glu Val Lys Leu Thr Gln Gly
165 170 175
Ile Cys Leu Glu Gln Asn Lys Thr Ser Ser Cys Ala Glu Phe Lys Lys
180 185 190
Asp Arg Gly Glu Gly Leu Ala Arg Val Leu Cys Gly Glu Glu Gln Ala
195 200 205
Asp Ala Asp Ala Gly Ala Gln Val Cys Ser Leu Leu Leu Ala Gln Ser
210 215 220
Glu Val Arg Pro Gln Cys Leu Leu Leu Val Leu Ala Asn Arg Thr Glu
225 230 235 240
Ile Ser Ser Lys Leu Gln Leu Met Lys Lys His Gln Ser Asp Leu Lys
245 250 255
Lys Leu Gly Ile Leu Asp Phe Thr Glu Gln Asp Val Ala Ser His Gln
260 265 270
Ser Tyr Ser Gln Lys Thr Leu Ile Ala Leu Val Thr Ser Gly Ala Leu
275 280 285
Leu Ala Val Leu Gly Ile Thr Gly Tyr Phe Leu Met Asn Arg Arg Ser
290 295 300
Trp Ser Pro Thr Gly Glu Arg Leu Glu Leu Glu Pro Val Asp Arg Val
305 310 315 320
Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu
325 330 335
Ser Asn Pro Gly Pro Gly Asn Met Ala Leu Pro Val Thr Ala Leu Leu
340 345 350
Leu Pro Leu Ala Leu Leu Leu His Ala Ala Arg Pro Met Asp Trp Ile
355 360 365
Trp Arg Ile Leu Phe Leu Val Gly Ala Ala Thr Gly Ala His Ser Gln
370 375 380
Val Gln Leu Gln Gln Ser Gly Gly Gly Leu Val Lys Pro Gly Ala Ser
385 390 395 400
Leu Lys Leu Ser Cys Val Thr Ser Gly Phe Thr Phe Arg Lys Phe Gly
405 410 415
Met Ser Trp Val Arg Gln Thr Ser Asp Lys Arg Leu Glu Trp Val Ala
420 425 430
Ser Ile Ser Thr Gly Gly Tyr Asn Thr Tyr Tyr Ser Asp Asn Val Lys
435 440 445
Gly Arg Phe Thr Ile Ser Arg Glu Asn Ala Lys Asn Thr Leu Tyr Leu
450 455 460
Gln Met Ser Ser Leu Lys Ser Glu Asp Thr Ala Leu Tyr Tyr Cys Thr
465 470 475 480
Arg Gly Tyr Ser Ser Thr Ser Tyr Ala Met Asp Tyr Trp Gly Gln Gly
485 490 495
Thr Thr Val Thr Val Ser Ser Ser Gly Gly Gly Ser Gly Gly Gly Gly
500 505 510
Ser Gly Gly Gly Gly Ser Asp Ile Glu Leu Thr Gln Ser Pro Ala Ser
515 520 525
Leu Ser Val Ala Thr Gly Glu Lys Val Thr Ile Arg Cys Met Thr Ser
530 535 540
Thr Asp Ile Asp Asp Asp Met Asn Trp Tyr Gln Gln Lys Pro Gly Glu
545 550 555 560
Pro Pro Lys Phe Leu Ile Ser Glu Gly Asn Thr Leu Arg Pro Gly Val
565 570 575
Pro Ser Arg Phe Ser Ser Ser Gly Thr Gly Thr Asp Phe Val Phe Thr
580 585 590
Ile Glu Asn Thr Leu Ser Glu Asp Val Gly Asp Tyr Tyr Cys Leu Gln
595 600 605
Ser Phe Asn Val Pro Leu Thr Phe Gly Asp Gly Thr Lys Leu Glu Lys
610 615 620
Ala Leu Thr Thr Thr Pro Ala Pro Arg Pro Pro Thr Pro Ala Pro Thr
625 630 635 640
Ile Ala Ser Gln Pro Leu Ser Leu Arg Pro Glu Ala Cys Arg Pro Ala
645 650 655
Ala Gly Gly Ala Val His Thr Arg Gly Leu Asp Phe Ala Cys Asp Ile
660 665 670
Tyr Ile Trp Ala Pro Leu Ala Gly Thr Cys Gly Val Leu Leu Leu Ser
675 680 685
Leu Val Ile Thr Leu Tyr Cys Lys Arg Gly Arg Lys Lys Leu Leu Tyr
690 695 700
Ile Phe Lys Gln Pro Phe Met Arg Pro Val Gln Thr Thr Gln Glu Glu
705 710 715 720
Asp Gly Cys Ser Cys Arg Phe Pro Glu Glu Glu Glu Gly Gly Cys Glu
725 730 735
Leu Arg Val Lys Phe Ser Arg Ser Ala Asp Ala Pro Ala Tyr Lys Gln
740 745 750
Gly Gln Asn Gln Leu Tyr Asn Glu Leu Asn Leu Gly Arg Arg Glu Glu
755 760 765
Tyr Asp Val Leu Asp Lys Arg Arg Gly Arg Asp Pro Glu Met Gly Gly
770 775 780
Lys Pro Arg Arg Lys Asn Pro Gln Glu Gly Leu Tyr Asn Glu Leu Gln
785 790 795 800
Lys Asp Lys Met Ala Glu Ala Tyr Ser Glu Ile Gly Met Lys Gly Glu
805 810 815
Arg Arg Arg Gly Lys Gly His Asp Gly Leu Tyr Gln Gly Leu Ser Thr
820 825 830
Ala Thr Lys Asp Thr Tyr Asp Ala Leu His Met Gln Ala Leu Pro Pro
835 840 845
Arg Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp
850 855 860
Val Glu Glu Asn Pro Gly Pro Met Leu Phe Asn Leu Arg Ile Leu Leu
865 870 875 880
Asn Asn Ala Ala Phe Arg Asn Gly His Asn Phe Met Val Arg Asn Phe
885 890 895
Arg Cys Gly Gln Pro Leu Gln Asn Lys Val Gln Leu Lys Gly Arg Asp
900 905 910
Leu Leu Thr Leu Lys Asn Phe Thr Gly Glu Glu Ile Lys Tyr Met Leu
915 920 925
Trp Leu Ser Ala Asp Leu Lys Phe Arg Ile Lys Gln Lys Gly Glu Tyr
930 935 940
Leu Pro Leu Leu Gln Gly Lys Ser Leu Gly Met Ile Phe Glu Lys Arg
945 950 955 960
Ser Thr Arg Thr Arg Leu Ser Thr Glu Thr Gly Leu Ala Leu Leu Gly
965 970 975
Gly His Pro Cys Phe Leu Thr Thr Gln Asp Ile His Leu Gly Val Asn
980 985 990
Glu Ser Leu Thr Asp Thr Ala Arg Val Leu Ser Ser Met Ala Asp Ala
995 1000 1005
Val Leu Ala Arg Val Tyr Lys Gln Ser Asp Leu Asp Thr Leu Ala
1010 1015 1020
Lys Glu Ala Ser Ile Pro Ile Ile Asn Gly Leu Ser Asp Leu Tyr
1025 1030 1035
His Pro Ile Gln Ile Leu Ala Asp Tyr Leu Thr Leu Gln Glu His
1040 1045 1050
Tyr Ser Ser Leu Lys Gly Leu Thr Leu Ser Trp Ile Gly Asp Gly
1055 1060 1065
Asn Asn Ile Leu His Ser Ile Met Met Ser Ala Ala Lys Phe Gly
1070 1075 1080
Met His Leu Gln Ala Ala Thr Pro Lys Gly Tyr Glu Pro Asp Ala
1085 1090 1095
Ser Val Thr Lys Leu Ala Glu Gln Tyr Ala Lys Glu Asn Gly Thr
1100 1105 1110
Lys Leu Leu Leu Thr Asn Asp Pro Leu Glu Ala Ala His Gly Gly
1115 1120 1125
Asn Val Leu Ile Thr Asp Thr Trp Ile Ser Met Gly Gln Glu Glu
1130 1135 1140
Glu Lys Lys Lys Arg Leu Gln Ala Phe Gln Gly Tyr Gln Val Thr
1145 1150 1155
Met Lys Thr Ala Lys Val Ala Ala Ser Asp Trp Thr Phe Leu His
1160 1165 1170
Cys Leu Pro Arg Lys Pro Glu Glu Val Asp Asp Glu Val Phe Tyr
1175 1180 1185
Ser Pro Arg Ser Leu Val Phe Pro Glu Ala Glu Asn Arg Lys Trp
1190 1195 1200
Thr Ile Met Ala Val Met Val Ser Leu Leu Thr Asp Tyr Ser Pro
1205 1210 1215
Gln Leu Gln Lys Pro Lys Phe
1220 1225
<210> 44
<211> 1658
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 包含ASS-1结构域和OTC结构域的EGFRvIII (采用可选的由SEQ ID NO: 41编码的EGFRvIII靶结合部分)的示例性CAR的氨基酸序列
<400> 44
Met Pro Arg Gly Trp Thr Ala Leu Cys Leu Leu Ser Leu Leu Pro Ser
1 5 10 15
Gly Phe Met Ser Leu Asp Asn Asn Gly Thr Ala Thr Pro Glu Leu Pro
20 25 30
Thr Gln Gly Thr Phe Ser Asn Val Ser Thr Asn Val Ser Tyr Gln Glu
35 40 45
Thr Thr Thr Pro Ser Thr Leu Gly Ser Thr Ser Leu His Pro Val Ser
50 55 60
Gln His Gly Asn Glu Ala Thr Thr Asn Ile Thr Glu Thr Thr Val Lys
65 70 75 80
Phe Thr Ser Thr Ser Val Ile Thr Ser Val Tyr Gly Asn Thr Asn Ser
85 90 95
Ser Val Gln Ser Gln Thr Ser Val Ile Ser Thr Val Phe Thr Thr Pro
100 105 110
Ala Asn Val Ser Thr Pro Glu Thr Thr Leu Lys Pro Ser Leu Ser Pro
115 120 125
Gly Asn Val Ser Asp Leu Ser Thr Thr Ser Thr Ser Leu Ala Thr Ser
130 135 140
Pro Thr Lys Pro Tyr Thr Ser Ser Ser Pro Ile Leu Ser Asp Ile Lys
145 150 155 160
Ala Glu Ile Lys Cys Ser Gly Ile Arg Glu Val Lys Leu Thr Gln Gly
165 170 175
Ile Cys Leu Glu Gln Asn Lys Thr Ser Ser Cys Ala Glu Phe Lys Lys
180 185 190
Asp Arg Gly Glu Gly Leu Ala Arg Val Leu Cys Gly Glu Glu Gln Ala
195 200 205
Asp Ala Asp Ala Gly Ala Gln Val Cys Ser Leu Leu Leu Ala Gln Ser
210 215 220
Glu Val Arg Pro Gln Cys Leu Leu Leu Val Leu Ala Asn Arg Thr Glu
225 230 235 240
Ile Ser Ser Lys Leu Gln Leu Met Lys Lys His Gln Ser Asp Leu Lys
245 250 255
Lys Leu Gly Ile Leu Asp Phe Thr Glu Gln Asp Val Ala Ser His Gln
260 265 270
Ser Tyr Ser Gln Lys Thr Leu Ile Ala Leu Val Thr Ser Gly Ala Leu
275 280 285
Leu Ala Val Leu Gly Ile Thr Gly Tyr Phe Leu Met Asn Arg Arg Ser
290 295 300
Trp Ser Pro Thr Gly Glu Arg Leu Glu Leu Glu Pro Val Asp Arg Val
305 310 315 320
Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu
325 330 335
Ser Asn Pro Gly Pro Gly Asn Met Ala Leu Pro Val Thr Ala Leu Leu
340 345 350
Leu Pro Leu Ala Leu Leu Leu His Ala Ala Arg Pro Met Asp Trp Ile
355 360 365
Trp Arg Ile Leu Phe Leu Val Gly Ala Ala Thr Gly Ala His Ser Gln
370 375 380
Val Gln Leu Gln Gln Ser Gly Gly Gly Leu Val Lys Pro Gly Ala Ser
385 390 395 400
Leu Lys Leu Ser Cys Val Thr Ser Gly Phe Thr Phe Arg Lys Phe Gly
405 410 415
Met Ser Trp Val Arg Gln Thr Ser Asp Lys Arg Leu Glu Trp Val Ala
420 425 430
Ser Ile Ser Thr Gly Gly Tyr Asn Thr Tyr Tyr Ser Asp Asn Val Lys
435 440 445
Gly Arg Phe Thr Ile Ser Arg Glu Asn Ala Lys Asn Thr Leu Tyr Leu
450 455 460
Gln Met Ser Ser Leu Lys Ser Glu Asp Thr Ala Leu Tyr Tyr Cys Thr
465 470 475 480
Arg Gly Tyr Ser Ser Thr Ser Tyr Ala Met Asp Tyr Trp Gly Gln Gly
485 490 495
Thr Thr Val Thr Val Ser Ser Ser Gly Gly Gly Ser Gly Gly Gly Gly
500 505 510
Ser Gly Gly Gly Gly Ser Asp Ile Glu Leu Thr Gln Ser Pro Ala Ser
515 520 525
Leu Ser Val Ala Thr Gly Glu Lys Val Thr Ile Arg Cys Met Thr Ser
530 535 540
Thr Asp Ile Asp Asp Asp Met Asn Trp Tyr Gln Gln Lys Pro Gly Glu
545 550 555 560
Pro Pro Lys Phe Leu Ile Ser Glu Gly Asn Thr Leu Arg Pro Gly Val
565 570 575
Pro Ser Arg Phe Ser Ser Ser Gly Thr Gly Thr Asp Phe Val Phe Thr
580 585 590
Ile Glu Asn Thr Leu Ser Glu Asp Val Gly Asp Tyr Tyr Cys Leu Gln
595 600 605
Ser Phe Asn Val Pro Leu Thr Phe Gly Asp Gly Thr Lys Leu Glu Lys
610 615 620
Ala Leu Thr Thr Thr Pro Ala Pro Arg Pro Pro Thr Pro Ala Pro Thr
625 630 635 640
Ile Ala Ser Gln Pro Leu Ser Leu Arg Pro Glu Ala Cys Arg Pro Ala
645 650 655
Ala Gly Gly Ala Val His Thr Arg Gly Leu Asp Phe Ala Cys Asp Ile
660 665 670
Tyr Ile Trp Ala Pro Leu Ala Gly Thr Cys Gly Val Leu Leu Leu Ser
675 680 685
Leu Val Ile Thr Leu Tyr Cys Lys Arg Gly Arg Lys Lys Leu Leu Tyr
690 695 700
Ile Phe Lys Gln Pro Phe Met Arg Pro Val Gln Thr Thr Gln Glu Glu
705 710 715 720
Asp Gly Cys Ser Cys Arg Phe Pro Glu Glu Glu Glu Gly Gly Cys Glu
725 730 735
Leu Arg Val Lys Phe Ser Arg Ser Ala Asp Ala Pro Ala Tyr Lys Gln
740 745 750
Gly Gln Asn Gln Leu Tyr Asn Glu Leu Asn Leu Gly Arg Arg Glu Glu
755 760 765
Tyr Asp Val Leu Asp Lys Arg Arg Gly Arg Asp Pro Glu Met Gly Gly
770 775 780
Lys Pro Arg Arg Lys Asn Pro Gln Glu Gly Leu Tyr Asn Glu Leu Gln
785 790 795 800
Lys Asp Lys Met Ala Glu Ala Tyr Ser Glu Ile Gly Met Lys Gly Glu
805 810 815
Arg Arg Arg Gly Lys Gly His Asp Gly Leu Tyr Gln Gly Leu Ser Thr
820 825 830
Ala Thr Lys Asp Thr Tyr Asp Ala Leu His Met Gln Ala Leu Pro Pro
835 840 845
Arg Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp
850 855 860
Val Glu Glu Asn Pro Gly Pro Met Ser Ser Lys Gly Ser Val Val Leu
865 870 875 880
Ala Tyr Ser Gly Gly Leu Asp Thr Ser Cys Ile Leu Val Trp Leu Lys
885 890 895
Glu Gln Gly Tyr Asp Val Ile Ala Tyr Leu Ala Asn Ile Gly Gln Lys
900 905 910
Glu Asp Phe Glu Glu Ala Arg Lys Lys Ala Leu Lys Leu Gly Ala Lys
915 920 925
Lys Val Phe Ile Glu Asp Val Ser Arg Glu Phe Val Glu Glu Phe Ile
930 935 940
Trp Pro Ala Ile Gln Ser Ser Ala Leu Tyr Glu Asp Arg Tyr Leu Leu
945 950 955 960
Gly Thr Ser Leu Ala Arg Pro Cys Ile Ala Arg Lys Gln Val Glu Ile
965 970 975
Ala Gln Arg Glu Gly Ala Lys Tyr Val Ser His Gly Ala Thr Gly Lys
980 985 990
Gly Asn Asp Gln Val Arg Phe Glu Leu Ser Cys Tyr Ser Leu Ala Pro
995 1000 1005
Gln Ile Lys Val Ile Ala Pro Trp Arg Met Pro Glu Phe Tyr Asn
1010 1015 1020
Arg Phe Lys Gly Arg Asn Asp Leu Met Glu Tyr Ala Lys Gln His
1025 1030 1035
Gly Ile Pro Ile Pro Val Thr Pro Lys Asn Pro Trp Ser Met Asp
1040 1045 1050
Glu Asn Leu Met His Ile Ser Tyr Glu Ala Gly Ile Leu Glu Asn
1055 1060 1065
Pro Lys Asn Gln Ala Pro Pro Gly Leu Tyr Thr Lys Thr Gln Asp
1070 1075 1080
Pro Ala Lys Ala Pro Asn Thr Pro Asp Ile Leu Glu Ile Glu Phe
1085 1090 1095
Lys Lys Gly Val Pro Val Lys Val Thr Asn Val Lys Asp Gly Thr
1100 1105 1110
Thr His Gln Thr Ser Leu Glu Leu Phe Met Tyr Leu Asn Glu Val
1115 1120 1125
Ala Gly Lys His Gly Val Gly Arg Ile Asp Ile Val Glu Asn Arg
1130 1135 1140
Phe Ile Gly Met Lys Ser Arg Gly Ile Tyr Glu Thr Pro Ala Gly
1145 1150 1155
Thr Ile Leu Tyr His Ala His Leu Asp Ile Glu Ala Phe Thr Met
1160 1165 1170
Asp Arg Glu Val Arg Lys Ile Lys Gln Gly Leu Gly Leu Lys Phe
1175 1180 1185
Ala Glu Leu Val Tyr Thr Gly Phe Trp His Ser Pro Glu Cys Glu
1190 1195 1200
Phe Val Arg His Cys Ile Ala Lys Ser Gln Glu Arg Val Glu Gly
1205 1210 1215
Lys Val Gln Val Ser Val Leu Lys Gly Gln Val Tyr Ile Leu Gly
1220 1225 1230
Arg Glu Ser Pro Leu Ser Leu Tyr Asn Glu Glu Leu Val Ser Met
1235 1240 1245
Asn Val Gln Gly Asp Tyr Glu Pro Thr Asp Ala Thr Gly Phe Ile
1250 1255 1260
Asn Ile Asn Ser Leu Arg Leu Lys Glu Tyr His Arg Leu Gln Ser
1265 1270 1275
Lys Val Thr Ala Lys Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu
1280 1285 1290
Thr Cys Gly Asp Val Glu Glu Asn Pro Gly Pro Met Leu Phe Asn
1295 1300 1305
Leu Arg Ile Leu Leu Asn Asn Ala Ala Phe Arg Asn Gly His Asn
1310 1315 1320
Phe Met Val Arg Asn Phe Arg Cys Gly Gln Pro Leu Gln Asn Lys
1325 1330 1335
Val Gln Leu Lys Gly Arg Asp Leu Leu Thr Leu Lys Asn Phe Thr
1340 1345 1350
Gly Glu Glu Ile Lys Tyr Met Leu Trp Leu Ser Ala Asp Leu Lys
1355 1360 1365
Phe Arg Ile Lys Gln Lys Gly Glu Tyr Leu Pro Leu Leu Gln Gly
1370 1375 1380
Lys Ser Leu Gly Met Ile Phe Glu Lys Arg Ser Thr Arg Thr Arg
1385 1390 1395
Leu Ser Thr Glu Thr Gly Leu Ala Leu Leu Gly Gly His Pro Cys
1400 1405 1410
Phe Leu Thr Thr Gln Asp Ile His Leu Gly Val Asn Glu Ser Leu
1415 1420 1425
Thr Asp Thr Ala Arg Val Leu Ser Ser Met Ala Asp Ala Val Leu
1430 1435 1440
Ala Arg Val Tyr Lys Gln Ser Asp Leu Asp Thr Leu Ala Lys Glu
1445 1450 1455
Ala Ser Ile Pro Ile Ile Asn Gly Leu Ser Asp Leu Tyr His Pro
1460 1465 1470
Ile Gln Ile Leu Ala Asp Tyr Leu Thr Leu Gln Glu His Tyr Ser
1475 1480 1485
Ser Leu Lys Gly Leu Thr Leu Ser Trp Ile Gly Asp Gly Asn Asn
1490 1495 1500
Ile Leu His Ser Ile Met Met Ser Ala Ala Lys Phe Gly Met His
1505 1510 1515
Leu Gln Ala Ala Thr Pro Lys Gly Tyr Glu Pro Asp Ala Ser Val
1520 1525 1530
Thr Lys Leu Ala Glu Gln Tyr Ala Lys Glu Asn Gly Thr Lys Leu
1535 1540 1545
Leu Leu Thr Asn Asp Pro Leu Glu Ala Ala His Gly Gly Asn Val
1550 1555 1560
Leu Ile Thr Asp Thr Trp Ile Ser Met Gly Gln Glu Glu Glu Lys
1565 1570 1575
Lys Lys Arg Leu Gln Ala Phe Gln Gly Tyr Gln Val Thr Met Lys
1580 1585 1590
Thr Ala Lys Val Ala Ala Ser Asp Trp Thr Phe Leu His Cys Leu
1595 1600 1605
Pro Arg Lys Pro Glu Glu Val Asp Asp Glu Val Phe Tyr Ser Pro
1610 1615 1620
Arg Ser Leu Val Phe Pro Glu Ala Glu Asn Arg Lys Trp Thr Ile
1625 1630 1635
Met Ala Val Met Val Ser Leu Leu Thr Asp Tyr Ser Pro Gln Leu
1640 1645 1650
Gln Lys Pro Lys Phe
1655

Claims (51)

1.一种融合靶结合蛋白,所述融合靶结合蛋白包含靶结合部分、细胞内信号传导区域和促进精氨酸或精氨酸前体的合成的结构域。
2.根据权利要求1所述的融合靶结合蛋白,其中所述促进精氨酸或精氨酸前体的合成的结构域包括酶结构域。
3.根据权利要求2所述的融合靶结合蛋白,其中所述酶结构域选自由以下组成的组:ASS-1结构域;OTC结构域;ASL结构域;OCD1结构域;ArgG结构域;ArgH结构域和ArgF结构域。
4.根据权利要求3所述的融合靶结合蛋白,其中所述ASS-1结构域包括SEQ ID NO.1的氨基酸序列。
5.根据权利要求3或权利要求4所述的融合靶结合蛋白,其中所述OTC结构域包括SEQID NO.2的氨基酸序列。
6.根据权利要求3至5中任一项所述的融合靶结合蛋白,其中所述ASL结构域包括由SEQID NO.30编码的氨基酸序列。
7.根据权利要求3至6中任一项所述的融合靶结合蛋白,其中所述ODC1结构域包括由SEQ ID NO.31编码的氨基酸序列。
8.根据权利要求3至7中任一项所述的融合靶结合蛋白,其中所述ArgG结构域包括由SEQ ID NO.32编码的氨基酸序列。
9.根据权利要求3至8中任一项所述的融合靶结合蛋白,其中所述ArgH结构域包括由SEQ ID NO.33编码的氨基酸序列。
10.根据权利要求3至9中任一项所述的融合靶结合蛋白,其中所述ArgF结构域包括由SEQ ID NO.34编码的氨基酸序列。
11.一种融合靶结合蛋白,所述融合靶结合蛋白包含靶结合部分、细胞内信号传导区域和促进色氨酸或色氨酸前体的合成的结构域。
12.根据权利要求11所述的融合靶结合蛋白,其中所述促进色氨酸或色氨酸前体的合成的结构域包括酶结构域。
13.根据权利要求11或权利要求12所述的融合靶结合蛋白,其中所述酶结构域选自由以下组成的组:TRP5结构域和IDO结构域。
14.根据权利要求13所述的融合靶结合蛋白,其中所述TRP5结构域包括由SEQ IDNO.35编码的氨基酸序列。
15.根据权利要求13或权利要求14所述的融合靶结合蛋白,其中所述IDO结构域包括由SEQ ID NO.36编码的氨基酸序列。
16.根据任一前述权利要求所述的融合靶结合蛋白,其中所述靶结合部分选自由以下组成的组:GD2靶结合部分;CD33靶结合部分;间皮素靶结合部分和EGFRvIII靶结合部分。
17.根据权利要求16所述的融合靶结合蛋白,其中所述GD2靶结合部分包括SEQ IDNO.3的氨基酸序列。
18.根据权利要求16所述的融合靶结合蛋白,其中所述CD33靶结合部分包括SEQ IDNO.4的氨基酸序列。
19.根据权利要求16所述的融合靶结合蛋白,其中所述间皮素靶结合部分包括SEQ IDNO.5的氨基酸序列。
20.根据权利要求16所述的融合靶结合蛋白,其中所述EGFRvIII靶结合部分包括SEQID NO.6的氨基酸序列。
21.根据任一前述权利要求所述的融合靶结合蛋白,其中所述细胞内信号传导区域包括选自由以下组成的组的区域:4-1BB信号传导区域;OX-40信号传导区域;CD28信号传导区域;ICOS信号传导区域和CD3ζ信号传导区域。
22.根据权利要求21所述的融合靶结合蛋白,其中所述细胞内信号传导区域包括4-1BB信号传导区域。
23.根据权利要求21或权利要求22所述的融合靶结合蛋白,其中所述4-1BB细胞内信号传导区域包括SEQ ID NO.7的氨基酸序列。
24.根据权利要求24至23中任一项所述的融合靶结合蛋白,其中所述细胞内信号传导区域包括CD3ζ结构域。
25.根据权利要求24所述的融合靶结合蛋白,其中所述CD3ζ结构域包括SEQ ID NO:11或SEQ ID NO:40的氨基酸序列。
26.根据权利要求21至25中任一项所述的融合靶结合蛋白,所述融合靶结合蛋白包含4-1BB结构域和CD3ζ结构域两者。
27.根据任一前述权利要求所述的融合靶结合蛋白,所述融合靶结合蛋白包括选自由SEQ ID NO:12至SEQ ID NO:23组成的组的氨基酸序列。
28.根据任一前述权利要求所述的融合靶结合蛋白,所述融合靶结合蛋白用于作为药物使用。
29.根据权利要求28所述的用于使用的融合靶结合蛋白,所述融合靶结合蛋白用于在预防或治疗癌症中使用。
30.一种细胞,所述细胞包含融合靶结合蛋白,所述融合靶结合蛋白包含靶结合部分、细胞内信号传导区域和促进精氨酸或精氨酸前体的合成的结构域。
31.根据权利要求30所述的细胞,其中所述融合靶结合蛋白如权利要求1至10或16至27中任一项所定义。
32.一种细胞,所述细胞包含融合靶结合蛋白,所述融合靶结合蛋白包含靶结合部分、细胞内信号传导区域和促进色氨酸或色氨酸前体的合成的结构域。
33.根据权利要求32所述的细胞,其中所述融合靶结合蛋白如权利要求11至27中任一项所定义。
34.根据权利要求30至33中任一项所述的细胞,所述细胞用于作为药物使用。
35.根据权利要求34所述的用于使用的细胞,所述细胞用于在预防或治疗癌症中使用。
36.一种核酸,所述核酸编码融合靶结合蛋白,所述融合靶结合蛋白包含靶结合部分、细胞内信号传导区域和促进精氨酸或精氨酸前体的合成的结构域。
37.根据权利要求36所述的核酸,其中所述融合靶结合蛋白如权利要求1至10或16至27中任一项所定义。
38.根据权利要求36或权利要求37所述的核酸,所述核酸包括SEQ ID NO:38、SEQ IDNO:39或SEQ ID NO:37的DNA序列。
39.一种核酸,所述核酸编码融合靶结合蛋白,所述融合靶结合蛋白包含靶结合部分、细胞内信号传导区域和促进色氨酸或色氨酸前体的合成的结构域。
40.根据权利要求39所述的核酸,其中所述融合靶结合蛋白如权利要求11至27中任一项所定义。
41.根据权利要求36至40中任一项所述的核酸,所述核酸用于作为药物使用。
42.根据权利要求41所述的用于使用的核酸,所述核酸用于在预防或治疗癌症中使用。
43.一种药物组合物,所述药物组合物包含根据权利要求1至30中任一项所述的融合靶结合蛋白;和/或根据权利要求30至35中任一项所述的细胞;和/或根据权利要求36至42中任一项所述的核酸。
44.根据权利要求43所述的药物组合物,所述药物组合物用于作为药物使用。
45.根据权利要求44所述的用于使用的药物组合物,所述药物组合物用于在预防或治疗癌症中使用。
46.一种治疗有相应需要的受试者的状况的方法,所述方法包括向所述受试者提供根据权利要求1至29中任一项所述的融合靶结合蛋白。
47.根据权利要求45所述的方法,其中所述融合靶结合蛋白通过根据权利要求37至43中任一项所述的核酸序列的细胞表达来提供。
48.一种治疗有相应需要的受试者的状况的方法,所述方法包括向所述受试者提供根据权利要求30至35中任一项所述的细胞。
49.一种治疗有相应需要的受试者的状况的方法,所述方法包括向所述受试者提供根据权利要求36至42中任一项所述的核酸。
50.根据权利要求46至49中任一项所述的方法,所述方法用于治疗癌症。
51.根据权利要求46至50中任一项所述的方法,所述方法用于治疗病毒感染。
CN201880089964.4A 2017-12-22 2018-12-24 融合蛋白 Pending CN111770933A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GBGB1721833.0A GB201721833D0 (en) 2017-12-22 2017-12-22 Fusion proteins
GB1721833.0 2017-12-22
PCT/GB2018/053771 WO2019122936A1 (en) 2017-12-22 2018-12-24 Fusion proteins

Publications (1)

Publication Number Publication Date
CN111770933A true CN111770933A (zh) 2020-10-13

Family

ID=61131454

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880089964.4A Pending CN111770933A (zh) 2017-12-22 2018-12-24 融合蛋白

Country Status (14)

Country Link
US (1) US20200308557A1 (zh)
EP (1) EP3728299A1 (zh)
JP (1) JP2021507716A (zh)
KR (1) KR20200110347A (zh)
CN (1) CN111770933A (zh)
AU (1) AU2018387430A1 (zh)
BR (1) BR112020012717A2 (zh)
CA (1) CA3085925A1 (zh)
GB (1) GB201721833D0 (zh)
IL (1) IL275560A (zh)
MX (1) MX2020006671A (zh)
SG (1) SG11202005761SA (zh)
WO (1) WO2019122936A1 (zh)
ZA (1) ZA202003845B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113736812A (zh) * 2021-09-06 2021-12-03 武汉翼康基因科技有限公司 一种pcMINI载体及其构建方法与应用
CN116003638A (zh) * 2023-01-20 2023-04-25 北京基因启明生物科技有限公司 一种有效杀伤胆管型肝癌的CAR-iNKT细胞技术
WO2023131285A1 (zh) * 2022-01-07 2023-07-13 原启生物科技(上海)有限责任公司 靶向cldn18.2和msln的嵌合抗原受体及其用途

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2023515806A (ja) * 2020-02-21 2023-04-14 スカイ パーフェクト インターナショナル リミテッド 免疫細胞においてアルギニン濃度をモジュレートするための方法および組成物
CN115779097B (zh) * 2022-11-09 2024-01-30 四川大学 基于工程化线粒体的肿瘤抗原递送系统及应用

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160075745A1 (en) * 2013-04-15 2016-03-17 BioBlast Pharma Ltd. Mitochondrial proteins constructs and uses thereof
WO2016126608A1 (en) * 2015-02-02 2016-08-11 Novartis Ag Car-expressing cells against multiple tumor antigens and uses thereof

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6420150B1 (en) * 2000-11-27 2002-07-16 Pe Corporation (Ny) Isolated human drug-metabolizing proteins, nucleic acid molecules encoding human drug-metabolizing proteins, and uses thereof
EP1578991A2 (en) * 2002-06-05 2005-09-28 Metabolex, Inc. Methods of diagnosing & treating diabetes and insulin resistance
JP5882735B2 (ja) * 2008-09-19 2016-03-09 ネステク ソシエテ アノニム 抗癌治療の間の骨髄麻痺又は好中球減少を阻止又は緩和するための栄養支援
SG190997A1 (en) * 2010-12-09 2013-07-31 Univ Pennsylvania Use of chimeric antigen receptor-modified t cells to treat cancer
SG192010A1 (en) * 2011-01-18 2013-08-30 Univ Pennsylvania Compositions and methods for treating cancer
CA2903096A1 (en) * 2013-03-05 2014-09-12 Baylor College Of Medicine Oncolytic virus
US8912147B2 (en) * 2013-04-15 2014-12-16 BioBlast Pharma Ltd. Mitochondrial proteins constructs and uses thereof
EP3087101B1 (en) * 2013-12-20 2024-06-05 Novartis AG Regulatable chimeric antigen receptor
WO2015188141A2 (en) * 2014-06-06 2015-12-10 Memorial Sloan-Kettering Cancer Ceneter Mesothelin-targeted chimeric antigen receptors and uses thereof
WO2016008973A1 (en) * 2014-07-16 2016-01-21 Universitaet Zu Koeln Chimeric antigen receptor and its use
JP6784687B2 (ja) * 2015-02-24 2020-11-11 ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア 結合誘発型転写スイッチ及びその使用方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160075745A1 (en) * 2013-04-15 2016-03-17 BioBlast Pharma Ltd. Mitochondrial proteins constructs and uses thereof
WO2016126608A1 (en) * 2015-02-02 2016-08-11 Novartis Ag Car-expressing cells against multiple tumor antigens and uses thereof

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
ULRICH H. WEIDLE等: "Genetically Engineered Fusion Proteins for Treatment of Cancer", CANCER GENOMICS & PROTEOMICS *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113736812A (zh) * 2021-09-06 2021-12-03 武汉翼康基因科技有限公司 一种pcMINI载体及其构建方法与应用
WO2023131285A1 (zh) * 2022-01-07 2023-07-13 原启生物科技(上海)有限责任公司 靶向cldn18.2和msln的嵌合抗原受体及其用途
CN116003638A (zh) * 2023-01-20 2023-04-25 北京基因启明生物科技有限公司 一种有效杀伤胆管型肝癌的CAR-iNKT细胞技术
CN116003638B (zh) * 2023-01-20 2023-09-05 北京基因启明生物科技有限公司 一种有效杀伤胆管型肝癌的CAR-iNKT细胞技术
WO2024152435A1 (zh) * 2023-01-20 2024-07-25 北京基因启明生物科技有限公司 一种有效杀伤胆管型肝癌的CAR-iNKT细胞技术

Also Published As

Publication number Publication date
US20200308557A1 (en) 2020-10-01
IL275560A (en) 2020-08-31
AU2018387430A1 (en) 2020-07-09
WO2019122936A1 (en) 2019-06-27
ZA202003845B (en) 2022-12-21
KR20200110347A (ko) 2020-09-23
MX2020006671A (es) 2020-10-28
CA3085925A1 (en) 2019-06-27
SG11202005761SA (en) 2020-07-29
GB201721833D0 (en) 2018-02-07
EP3728299A1 (en) 2020-10-28
JP2021507716A (ja) 2021-02-25
BR112020012717A2 (pt) 2020-11-24

Similar Documents

Publication Publication Date Title
CN111770933A (zh) 融合蛋白
CN111094345B (zh) 具有人结构域的抗b细胞成熟抗原嵌合抗原受体
CN111225675B (zh) 使用过继细胞疗法治疗的制品和方法
CN107106590B (zh) 组合
JP7085988B2 (ja) Pd-1-cd28融合タンパク質および医療におけるその使用
US20210189342A1 (en) Compositions and methods for modulating monocyte and macrophage inflammatory phenotypes and immunotherapy uses thereof
CN112585276A (zh) 产生表达重组受体的细胞的方法和相关组合物
KR20220078565A (ko) 분자에 연결된 세포외 소포 및 이의 용도
KR20220119038A (ko) 종양 침윤 림프구의 활성화 및 확장을 위한 방법
AU2019275479B2 (en) Chimeric antigen receptors with modified linker domains and uses thereof
TW202146439A (zh) 具有增強活性之bcma car-t細胞
WO2010088160A1 (en) T cell receptors and related materials and methods of use
AU2013313282B2 (en) Mitigating tissue damage and fibrosis via latent transforming growth factor beta binding protein (LTBP4)
CN111417650A (zh) 经修饰的car-t
KR20220101641A (ko) 세포 선택 및/또는 자극 장치 및 사용 방법
CN112004825A (zh) 细胞周期蛋白a1特异性t细胞受体及其用途
EP4253410A1 (en) Ras mutant epitope peptide and t cell receptor recognizing ras mutant
KR102517872B1 (ko) 암의 예방 또는 치료용 조성물
CA2488876A1 (en) Activating mutations of platelet derived growth factor receptor alpha (pdgfra) as diagnostic markers and therapeutic targets
IL297147A (en) Methods and Uses Related to Transgenic Cell Therapy with a Chimeric Antigen Receptor Directed to a B-Cell Maturation Antigen
KR20160098259A (ko) 인간 메조텔린 키메라 항원 수용체 및 그의 용도
KR20230160823A (ko) 치료 전달을 위한 조성물 및 방법
US20220062338A1 (en) Psca car-t cells
US20220402981A1 (en) Protein tag to induce ligand dependent degradation of protein/protein-fusions
RU2804664C2 (ru) Hpv-специфические связывающие молекулы

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40038914

Country of ref document: HK

WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20201013

WD01 Invention patent application deemed withdrawn after publication