CN117285643A - 一种相变调节套件及其用途 - Google Patents

一种相变调节套件及其用途 Download PDF

Info

Publication number
CN117285643A
CN117285643A CN202210687061.4A CN202210687061A CN117285643A CN 117285643 A CN117285643 A CN 117285643A CN 202210687061 A CN202210687061 A CN 202210687061A CN 117285643 A CN117285643 A CN 117285643A
Authority
CN
China
Prior art keywords
gly
ser
glu
seq
lys
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210687061.4A
Other languages
English (en)
Inventor
李丕龙
杜娟娟
李茹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Original Assignee
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University filed Critical Tsinghua University
Priority to CN202210687061.4A priority Critical patent/CN117285643A/zh
Priority to PCT/CN2023/000076 priority patent/WO2023241023A2/zh
Publication of CN117285643A publication Critical patent/CN117285643A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/18Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans
    • C07K16/28Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants
    • C07K16/2866Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants against receptors for cytokines, lymphokines, interferons
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • A61K38/16Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K47/00Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient
    • A61K47/50Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates
    • A61K47/51Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent
    • A61K47/68Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent the modifying agent being an antibody, an immunoglobulin or a fragment thereof, e.g. an Fc-fragment
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K47/00Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient
    • A61K47/50Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates
    • A61K47/51Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent
    • A61K47/68Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent the modifying agent being an antibody, an immunoglobulin or a fragment thereof, e.g. an Fc-fragment
    • A61K47/6835Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent the modifying agent being an antibody, an immunoglobulin or a fragment thereof, e.g. an Fc-fragment the modifying agent being an antibody or an immunoglobulin bearing at least one antigen-binding site
    • A61K47/6851Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent the modifying agent being an antibody, an immunoglobulin or a fragment thereof, e.g. an Fc-fragment the modifying agent being an antibody or an immunoglobulin bearing at least one antigen-binding site the antibody targeting a determinant of a tumour cell
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K47/00Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient
    • A61K47/50Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates
    • A61K47/51Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent
    • A61K47/68Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent the modifying agent being an antibody, an immunoglobulin or a fragment thereof, e.g. an Fc-fragment
    • A61K47/6835Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent the modifying agent being an antibody, an immunoglobulin or a fragment thereof, e.g. an Fc-fragment the modifying agent being an antibody or an immunoglobulin bearing at least one antigen-binding site
    • A61K47/6881Cluster-antibody conjugates, i.e. the modifying agent consists of a plurality of antibodies covalently linked to each other or of different antigen-binding fragments covalently linked to each other
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P29/00Non-central analgesic, antipyretic or antiinflammatory agents, e.g. antirheumatic agents; Non-steroidal antiinflammatory drugs [NSAID]
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/04Antibacterial agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/12Antivirals
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P37/00Drugs for immunological or allergic disorders
    • A61P37/02Immunomodulators
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/18Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans
    • C07K16/28Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants
    • C07K16/2878Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants against the NGF-receptor/TNF-receptor superfamily, e.g. CD27, CD30, CD40, CD95
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/46Hybrid immunoglobulins
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K19/00Hybrid peptides, i.e. peptides covalently bound to nucleic acids, or non-covalently bound protein-protein complexes
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6872Intracellular protein regulatory factors and their receptors, e.g. including ion channels
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/30Immunoglobulins specific features characterized by aspects of specificity or valency
    • C07K2317/31Immunoglobulins specific features characterized by aspects of specificity or valency multispecific
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/50Immunoglobulins specific features characterized by immunoglobulin fragments
    • C07K2317/56Immunoglobulins specific features characterized by immunoglobulin fragments variable (Fv) region, i.e. VH and/or VL
    • C07K2317/569Single domain, e.g. dAb, sdAb, VHH, VNAR or nanobody®
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/95Fusion polypeptide containing a motif/fusion for degradation (ubiquitin fusions, PEST sequence)
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2333/00Assays involving biological materials from specific organisms or of a specific nature
    • G01N2333/435Assays involving biological materials from specific organisms or of a specific nature from animals; from humans
    • G01N2333/705Assays involving receptors, cell surface antigens or cell surface determinants
    • G01N2333/70578NGF-receptor/TNF-receptor superfamily, e.g. CD27, CD30 CD40 or CD95
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2333/00Assays involving biological materials from specific organisms or of a specific nature
    • G01N2333/435Assays involving biological materials from specific organisms or of a specific nature from animals; from humans
    • G01N2333/705Assays involving receptors, cell surface antigens or cell surface determinants
    • G01N2333/715Assays involving receptors, cell surface antigens or cell surface determinants for cytokines; for lymphokines; for interferons
    • G01N2333/7158Assays involving receptors, cell surface antigens or cell surface determinants for cytokines; for lymphokines; for interferons for chemokines

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Immunology (AREA)
  • Organic Chemistry (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Engineering & Computer Science (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Molecular Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biochemistry (AREA)
  • Epidemiology (AREA)
  • Cell Biology (AREA)
  • Oncology (AREA)
  • Hematology (AREA)
  • Urology & Nephrology (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Genetics & Genomics (AREA)
  • Communicable Diseases (AREA)
  • Physics & Mathematics (AREA)
  • Food Science & Technology (AREA)
  • Rheumatology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Pain & Pain Management (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Virology (AREA)
  • Pathology (AREA)
  • General Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Inorganic Chemistry (AREA)

Abstract

本发明提供了新型的相变调节套件,其包含至少两种能够介由彼此相互作用而特异性地驱动自身以及与其结合的细胞表面分子发生相分离的独立组件,从而不仅能有效增强细胞表面分子寡聚化和对下游信号的调控作用,还能实现更高的靶向特异性。还提供了筛选所述相变调节套件的方法,包含所述套件的组合物或试剂盒,以及使用所述套件的疾病治疗方法或疾病预防方法。

Description

一种相变调节套件及其用途
技术领域
本发明涉及新型的相变调节套件,其包含至少两种能够介由彼此相互作用而特异性地驱动自身以及与其结合的细胞表面分子发生相分离的独立组件,从而不仅能有效增强细胞表面分子寡聚化和对下游信号的调控作用,还能实现更高的靶向特异性。本发明还涉及筛选所述相变调节套件的方法,包含所述套件的组合物或试剂盒,以及使用所述套件的疾病治疗方法或疾病预防方法。
背景技术
细胞表面分子是常见的药物治疗靶标候选物,但多数这类分子最终都难以成功地研发出有用的药物。例如,隶属肿瘤坏死因子(TNF)受体超家族的成员——死亡受体5(DR5)便迄今尚未成药。针对该受体已报道过多个嵌合抗体或全人抗体,例如Drozitumab、Conatumumab、LBY 135、重组天然配体Dulanermin等,但这些抗体或配体均因不明原因而功效极其有限甚至缺乏功效,最终均停止了开发(参见例如US2007/0031414、EP1922337A)。另外,也报道过四聚化纳米抗体TAS266(参见例如WO2011/098520),该抗体虽然可以高效地激活死亡受体5,但却不能特异性地靶向肿瘤,存在较高的系统性毒性。
研究发现,多价生物大分子可通过内部的多价结构域、介由分子间或分子内相互作用而聚集,从而与分子周围的普通溶液相发生分离,形成富集所述大分子的独立液态相,该过程被称为“液-液相分离(Liquid-Liquid Phase Separation,LLPS,在本文中也简称为“相分离”)”或“相变”。大量富集有所述大分子的小液滴存在于相分离所形成的液体相内,直径可达数微米甚至更大,这样的具有高辨识度的小液滴被称为“相变液滴”。迄今为止,尚未报道过利用具有相变调节功能的生物分子或其多价结构域来增强配体与细胞表面分子的结合活性,从而改善细胞表面分子的成药性等有用性状。
发明内容
本发明人通过深入研究发现,利用包括至少两种如下组件的相变调节套件,不仅能够提高各组件针对候选靶标的选择性和特异性,且较之结合相同靶标但不具有相分离调节功能的配体分子而言,本发明的相变调节套件在靶标选择性和特异性、细胞表面分子聚集效应及/或信号通路操控活性等方面均表现出优异效果。
因此,在一个方面,本发明提供了一种相变调节套件,其特征在于,所述套件包括第一组件和第二组件在内的多种组件,其中第一组件包含第一多价结构域和与第一细胞表面分子特异性结合的第一配体,第二组件包含第二多价结构域和与第二细胞表面分子特异性结合的第二配体,所述第一细胞表面分子与第二细胞表面分子相同或不同,并且,所述每种组件包含不多于一个配体。所述套件通过其中包含的多种组件之间的多价结构域之间的相互作用调节套件自身或与该套件相结合的细胞表面分子的相变。
在一些实施方案中,本发明的相变调节套件包含三种以上的组件,除第一组件和第二组件之外的其余组件包含能够与第一及/或第二多价结构域相互作用从而调节相变的结构域,并且任选地含有或不含与第三细胞表面分子特异性结合的第三配体。
在一些实施方案中,本发明的相变调节套件中的各种组件中所包含的配体任选地介由接头与所述多价结构域共价连接,所述接头可以为肽接头或非肽接头。
在另一个方面,本发明的相变调节套件在与所述配体靶向的一个或多个细胞表面分子结合后,所述一个或多个细胞表面分子的寡聚化程度较之未结合本发明的相变调节套件的情况,或者较之其结合本发明的相变调节套件所含配体本身的情况得以显著提高。
在优选的实施方案中,本发明的相变调节套件中,所述组件中的多价结构域包含至少2个串联连接的基序,例如所述串联连接的基序的个数为3、4、5、6、7、8、9或10个,所述基序可以相同或不同。
在更优选的实施方案中,本发明的相变调节套件中,每种组件所包含的所述多价结构域由至少两个以上的SUMO3基序、SIM基序、PRMH基序或SH3基序串联而成。所述SUMO3基序包含如SEQ ID NO:49所示的氨基酸序列或者包含与SEQ ID NO:49所示序列具有至少80%、90%、95%、99%以上同一性的氨基酸序列;所述SIM基序包含如SEQ ID NO:50所示的氨基酸序列或者包含与SEQ ID NO:50所示序列具有至少80%、90%、95%、99%以上同一性的氨基酸序列;所述PRMH基序包含如SEQ ID NO:51所示的氨基酸序列或者包含与SEQ IDNO:51所示序列具有至少80%、90%、95%、99%以上同一性的氨基酸序列;所述SH3基序包含如SEQ ID NO:52所示的氨基酸序列或者包含与SEQ ID NO:52所示序列具有至少80%、90%、95%、99%以上同一性的氨基酸序列。
在优选的实施方案中,所述多价结构域包含如SEQ ID NO:2、4、22、24、55或56所示的氨基酸序列或与SEQ ID NO:2、4、22、24、55或56所示的氨基酸序列具有至少80%、90%、95%、99%同一性的氨基酸系列,或者所述多价结构域是由如SEQ ID NO:2、4、22、24、55或56所示的氨基酸序列或与SEQ ID NO:2、4、22、24、55或56所示的氨基酸序列具有至少80%、90%、95%、99%同一性的氨基酸系列组成。
在另一优选的实施方案中,本发明的相变调节套件中包含的第一配体能够特异性结合肿瘤坏死因子受体,优选为死亡受体5(DR5)或Fas受体,更优选为死亡受体5(DR5)。
在另一优选的实施方案中,本发明的相变调节套件中包含的第二配体能够特异性结合肿瘤相关抗原。在更优选的方面,所述肿瘤相关抗原选自由CXC基序趋化因子受体4(CXCR4)、肝细胞生长因子受体(c-Met或HGFR)、表皮生长因子受体(EGFR)、表皮生长因子受体2(HER2)、前列腺特异性膜抗原(PSMA)、成纤维细胞活化蛋白(FAP)、癌胚抗原(CEA)、叶酸受体α(FolR1)、黑素瘤相关硫酸软骨素蛋白聚糖(MCSP)、p95HER2、EpCAM、HER3、CD30或TPBG(5T4)、CD19、CD79b、CD20、CD22、CD37、CD38、BCMA和GPRC5D组成的组。
在另一优选的实施方案中,本发明的相变调节套件中所述配体可以是肽配体或非肽配体,其中,所述肽配体可选自由以下各项组成的群组的一种或多种:特异性结合到细胞表面分子的抗体或其抗原结合片段、细胞因子、生长因子、粘附分子、肽激素、或者通过噬菌体展示或酵母展示等随机选择的多肽;所述非肽配体可选自由小分子激动剂或拮抗剂、反义寡核苷酸或小干扰RNA(siRNA)组成的群组中的一种或多种。在更优选的方面,所述抗体可选自单克隆体、多克隆抗体、人抗体或人源化抗体,所述抗原结合片段可选自F(ab’)2、Fab、单链可变片段(scFv)、单域抗体片段(VHH或纳米抗体)。
在其他优选的实施方案中,本发明的相变调节套件中的一个或多个配体为单链可变片段。在其他更优选的实施方案中,本发明的相变调节套件中包含的一个配体包含如SEQID NO:53所示的氨基酸序列或与SEQ ID NO:53所示的氨基酸序列具有至少80%、90%、95%、99%同一性的氨基酸序列,和/或另一个配体包含如SEQ ID NO:54所示的氨基酸序列或与SEQ ID NO:54所示的氨基酸序列具有至少80%、90%、95%、99%同一性的氨基酸序列。在其他更优选的实施方案中,本发明的相变调节套件中包含的一个配体由如SEQ IDNO:53所示的氨基酸序列或与SEQ ID NO:53所示的氨基酸序列具有至少80%、90%、95%、99%同一性的氨基酸序列组成,和/或另一个配体由如SEQ ID NO:54所示的氨基酸序列或与SEQ ID NO:54所示的氨基酸序列具有至少80%、90%、95%、99%同一性的氨基酸序列组成。
在进一步优选的实施方案中,本发明的相变调节套件包含如下第一组件和第二组件,或者由如下第一组件或第二组件组成,其中,所述第一组件包含SEQ ID NO:12的第27~673位所示氨基酸序列,或SEQ ID NO:20的第19~457位所示氨基酸序列,或SEQ ID NO:28的第19~550位所示氨基酸序列,或者包含与选自SEQ ID NO:12的第27~673位、SEQ IDNO:20的第19~457位或SEQ ID NO:28的第19~550位所示的序列具有至少80%、90%、95%、99%同一性的氨基酸序列,所述第二组件包含SEQ ID NO:10的第21~373位所示氨基酸序列,或SEQ ID NO:18的第19~257位所示氨基酸序列,或SEQ ID NO:26的第27~296位所示氨基酸序列,或者包含与选自SEQ ID NO:10的第21~373位、SEQ ID NO:18的第19~257位或SEQ ID NO:26的第27~296位所示的序列具有至少80%、90%、95%、99%同一性的氨基酸序列。
在优选的实施方案中,本发明的相变调节套件中的配体介由接头与所述多价结构域共价连接,所述接头可选自肽接头或非肽接头。
在优选的实施方案中,本发明的相变调节套件还可包含不影响所述配体与所述多价结构域的功能的标签和/或剪切所述标签的多肽。在一些实施方案中,所述标签用于分离、纯化、鉴定所述多价结构域。在一些实施方案中,所述标签可选自多聚组氨酸(Hisx)标签、麦芽糖结合蛋白(MBP)标签、谷胱甘肽S-转移酶(GST)标签以及小分子泛素样修饰蛋白(SUMO)标签。在本发明的相变调节套件中,所述标签可以连接于所述多价结构域的N末端及/或C末端。
在另一个方面,本发明提供一种筛选相变调节套件的方法,包括以下步骤:
步骤A:产生包含多种候选相变调节组件的文库,其中每种所述候选相变调节组件均包含一个多价结构域,以及包含或不包含能够与细胞表面分子特异性结合的不多于一个的配体;
步骤B:从所述步骤A所产生的文库中任意选择至少两种所述候选相变调节组件,组合为候选相变调节套件,所述候选套件中的候选组件介由所述配体而识别的细胞表面分子彼此可以相同或不同;
步骤C:在适于发生相变的条件下,测定所述步骤B中组合得到的候选相变调节套件产生相变液滴的活性,以不包含所述候选相变调节套件作为区别的平行测定作为阴性对照,选择所产生的相变液滴多于阴性对照的候选相变调节套件作为目标套件。
在另一个方面,本发明提供通过上述筛选相变调节套件的方法筛选获得的相变调节套件。
在又一个方面,本发明提供一种药物组合物,其特征在于所述药物组合物包含前述的相变调节套件,以及任选的药学上可接受的载体。在一些实施方案中,本发明提供的药物组合物是一种试剂盒。
在仍然另一个方面,本发明提供一种使用前述任意的相变调节套件或药物组合物治疗疾病的方法。在优选的实施方案中,所述疾病可选自由慢性自身免疫性障碍、炎性病症、细胞增殖异常或细胞凋亡异常相关性疾病、脓毒症或病毒感染组成的群组。在更优选的实施方案中,所述细胞增殖异常或细胞凋亡异常相关性疾病为癌症。在进一步优选的实施方案中,所述癌症选自由肺癌、结直肠癌、头颈部癌(例如,头颈部鳞状细胞癌)、胶质瘤(例如,神经胶质瘤)、神经母细胞瘤、黑素瘤、乳腺癌、膀胱癌、肾癌、卵巢癌、胰腺癌、宫颈癌、食道癌、肉瘤、食道癌(例如,食道鳞状细胞癌)、甲状腺癌(例如,乳头状甲状腺癌)或前列腺癌,B细胞淋巴瘤、慢性淋巴细胞白血病(CLL)、慢性髓性白血病、弥漫性大B细胞淋巴瘤(DLBCL)、滤泡性淋巴瘤、骨髓增生异常综合征(MDS)、非霍奇金淋巴瘤(NHL)、急性淋巴细胞白血病(ALL)、急性单核细胞白血病、多发性骨髓瘤、急性髓性白血病(AML)、混合系白血病、NUT中线癌、伯基特淋巴瘤或蕈状真菌病(MF)、或其转移形式组成的群组。
在再一个方面,本发明提供前述相变调节套件或前述药物组合物在制备用于治疗疾病的制剂中的用途。在优选的实施方案中,所述疾病可选自由慢性自身免疫性障碍、炎性病症、细胞增殖异常或细胞凋亡异常相关性疾病、脓毒症或病毒感染组成的群组。在更优选的实施方案中,所述细胞增殖异常或细胞凋亡异常相关性疾病选自癌症。在进一步优选的实施方案中,所述癌症选自由肺癌、结直肠癌、头颈部癌(例如,头颈部鳞状细胞癌)、胶质瘤(例如,神经胶质瘤)、神经母细胞瘤、黑素瘤、乳腺癌、膀胱癌、肾癌、卵巢癌、胰腺癌、宫颈癌、食道癌、肉瘤、食道癌(例如,食道鳞状细胞癌)、甲状腺癌(例如,乳头状甲状腺癌)或前列腺癌,B细胞淋巴瘤、慢性淋巴细胞白血病(CLL)、慢性髓性白血病、弥漫性大B细胞淋巴瘤(DLBCL)、滤泡性淋巴瘤、骨髓增生异常综合征(MDS)、非霍奇金淋巴瘤(NHL)、急性淋巴细胞白血病(ALL)、急性单核细胞白血病、多发性骨髓瘤、急性髓性白血病(AML)、混合系白血病、NUT中线癌、伯基特淋巴瘤或蕈状真菌病(MF)、或其转移形式组成的群组。
根据本发明,提供了一种新型的相变调节套件,其在结合细胞表面分子后能够通过驱动相分离而增加细胞表面分子聚集,进而可以例如改变对其下游信号传递的调控作用。并且,该新型套件由于含有两种以上不同的配体,可以通过不同配体之间的组合来实现更丰富、更细化的靶向特异性。更具体而言,本发明提供了包含至少两种不同的重组配体的相变调节套件,较之各重组配体本身,以及较之不能诱导相分离的配体组合而言,本发明的套件明显改变第一细胞表面分子及/或第二细胞表面分子相关的生物活性,例如明显改变细胞表面分子下游的信号传递效果。
附图说明
图1:为本申请的相变调节套件操控细胞表面分子相分离机制的示意图。
图2:为向人骨肉瘤细胞系SJSA-1添加不同的重组蛋白组合而得的激光共聚焦扫描显微成像的结果。
图3:显示了不同的相变调节套件引起人骨肉瘤细胞系SJSA-1发生相分离的结果比较。图3A示出了用(SIM)6-CNB(red)和(SUM)5-DNB(Green)处理SJSA-1细胞系后,相变调节套件与细胞表面受体所形成的斑点(puncta),以及SJSA-1细胞的内源性DR5和CXCR4受体与相变调节套件于斑点中的共定位。其中,“Anti DR5”和“Anti CXCR4”分别表示通过DR5抗体(Abcam,ab8416)、CXCR4抗体(Protein Tech,60042-1-Ig)进行免疫荧光染色所得内源性DR5和CXCR4的荧光图像。图3B示出了沿图3A中的红线所示路径的荧光强度分析,其中左图和右图分别对应图3A的第一行和第二行中的“merge”。横轴表示沿直线路径的相对距离,纵轴表示在对应位置处测得的相对荧光强度。图3C示出了用不同蛋白组合处理SJSA-1后,得到的活细胞全内反射荧光显微镜(TIRF)成像的随机视野。由左至右依次对应实施例2中列出的处理组1~3。图3D示出了针对图3C的随机视野中观察到的斑点(puncta)进行荧光面积统计的结果。横轴为终浓度为100nM的各种重组蛋白处理组合。纵轴为各斑点对应的荧光面积。
图4:不同重组蛋白或其组合针对SJSA-1细胞的凋亡诱导活性的评价结果。图4A为以20、50、100nM的终浓度分别将不同重组蛋白或其组合添加至培养基中孵育4hr后,通过基于Annexin V-FITC/PI双染法的流式细胞术测定的SJSA-1细胞的凋亡百分比。图4B为添加不同重组蛋白或其组合至100nM后,通过流式细胞术测得的、SJSA-1细胞随时间经过的存活比例变化的情况。图中NC表示未加蛋白的空白对照。
图5:显示了不同的融合蛋白引起人骨肉瘤细胞系SJSA-1发生相分离的结果比较。图5A示出了用(SIM)3-CNB(Red)和(SUM)3-DNB(Green)处理SJSA-1细胞系后,融合蛋白与细胞表面受体所形成的斑点(puncta),以及SJSA-1细胞的内源性DR5和CXCR4受体与融合蛋白于斑点中的共定位。其中,“Anti-DR5”和“Anti-CXCR4”分别表示通过DR5抗体(Abcam,货号ab8416)、CXCR4抗体(Protein Tech,货号60042-1-Ig)进行免疫荧光染色所得内源性DR5和CXCR4的荧光图像。图5B示出了沿图5A中的红线所示路径的荧光强度分析,其中左图和右图分别对应图5A的第一行和第二行中的“merge”。横轴表示沿直线路径的相对距离,纵轴表示在对应位置处测得的相对荧光强度。图5C示出了用实施例4的蛋白组合处理SJSA-1后,得到的活细胞TIRF成像的随机视野。图5D示出了针对图5C的随机视野中观察到的斑点进行荧光面积统计的结果。横轴为终浓度为100nM的各种重组蛋白处理组合。纵轴为各斑点对应的荧光面积。
图6:不同重组蛋白或其组合针对SJSA-1细胞的凋亡诱导活性的评价结果。图6A为分别以50、100nM的终浓度将不同重组蛋白或其组合添加至培养基中孵育4hr后,通过基于Annexin V-FITC/PI双染法的流式细胞术测定的SJSA-1细胞的凋亡百分比。图6B为添加不同重组蛋白或其组合至100nM后,通过流式细胞术测得的、SJSA-1细胞随时间经过的存活比例变化的情况。图中NC表示未加蛋白的空白对照。图6C为在用50nM的各种重组蛋白或其组合处理的SJSA-1细胞中,通过Western免疫印迹分析内源性细胞凋亡标志物PARP和Caspase3蛋白质表达的结果。使用β微管蛋白作为内参。
图7为不同的重组蛋白及其组合针对5种肿瘤细胞系和HEK293细胞的凋亡诱导活性的评价结果。根据细胞系的不同,使用图中所示浓度的重组蛋白或其组合处理细胞3hr或4hr,然后通过基于Annexin V-FITC/PI双染法的流式细胞术,测定细胞的凋亡百分比。图中NC表示未加蛋白的空白对照,Mia表示胰腺癌细胞系MIA PaCa-2,HEK表示人胚胎肾细胞系HEK293。
图8为死亡受体5(DR5)和CXC基序趋化因子受体4(CXCR4)在针对6种不同细胞系中的蛋白质表达的Western免疫印迹分析检测结果。使用β微管蛋白作为内参进行校正。HEK表示人胚胎肾细胞系HEK293,Mia-paca表示胰腺癌细胞系MIA PaCa-2,OCI表示急性髓细胞性白血病细胞系OCI-AML3,Colo-205表示结直肠腺癌细胞系COLO205。
图9:显示了本发明的融合蛋白对细胞膜受体的操控。用(PRMH)5-CNB和(SH3)5-DNB处理SJSA-1细胞系并分析细胞凋亡情况。图9A为向人骨肉瘤细胞系SJSA-1添加重组蛋白(PRMH)5-CNB和(SH3)5-DNB所得激光共聚焦扫描显微成像的结果。图9B示出了向SJSA-1细胞分别添加重组蛋白(PRMH)5-CNB、(SH3)5-DNB或二者的组合时的凋亡诱导活性,及其与阴性对照的比较结果。在相同条件下,用100nM重组蛋白分别处理SJSA-1细胞4hr,然后通过基于Annexin V-FITC/PI双染法的流式细胞术测定SJSA-1细胞分布于不同象限中的细胞百分比。图中NC表示作为未加蛋白的空白对照。
具体实施方式
下面结合具体实施方式对本发明进行进一步的详细描述,给出的实施例仅为了阐明本发明,而不是为了限制本发明的范围。以下提供的实施例可作为本技术领域普通技术人员进行进一步改进的指南,并不以任何方式构成对本发明的限制。
下述实施例中的实验方法,如无特殊说明,均为常规方法,按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。下述实施例中所用的材料、试剂、仪器等,如无特殊说明,均可从商业途径得到。以下实施例中的定量试验,如无特殊说明,均为三次重复实验的平均值。下述实施例中,如无特殊说明,序列表中各核苷酸序列均从左至右按5’至3’末端的的顺序书写,氨基酸序列均从左至右按氨基端至羧基端的顺序书写。
定义
如本发明的说明书中所用的,以下的词语和短语通常被认为具有如下阐明的含义,除非在使用这些词语或短语的上下文中另有指明。
如本文中使用的,术语“包括”或“包含”意指组合物及方法包含所记载的组件,但不排除其它组件。“主要由…组成”,当用在定义组合物及方法时,应意味排除任何对组合明显为重要的其它组件。因此,本文所定义的主要由这些组件所组成的组合物将不排除来自分离与纯化方法以及药学上可接受载剂的微量污染,所述的载剂如磷酸盐缓冲盐水、防腐剂等。“由…所组成”应意味排除用于施用本发明组合物的其它成分及实质方法的微量组分。由这些临时用语所定义的实施例都在本发明的范畴。
如本文所用的,术语“约”是指为此技术领域中的技术人员容易知晓的相应值的常见误差范围。在本文中以“约”的方式描述的值或参数包含该值或参数本身。
如本文中使用的,术语“液-液相分离”(LLPS,在本文中也简称为“相分离”或“相变”)是指多价大分子之间所发生的如下转变过程:在适宜的溶液条件中,多价大分子通过相互作用而聚集形成更大的复合体,所述复合体达到相应溶解度而从普通溶液相中分离出来,形成富集所述复合体的独立的液态相。
术语“相变液滴”是指存在于相分离所形成的液体相内、直径可达数微米甚至更大的具有高辨识度的小液滴。在本文中,“相变液滴”有时也简称为“液滴”。
如本文中使用的,术语“多价结构域”是指由多个与相分离相关的结构模块或基序组成的结构域。如前文所述,生物大分子可因分子间或分子内的相互作用而聚集发生相分离。能够导致上述分子间或分子内相互作用的模块或基序包括但不限于(1)蛋白质或多肽中呈线性排列且功能相似的结构模块或基序;(2)促进蛋白质或多肽发生寡聚化的结构模块或基序;(3)基于翻译后修饰作用而产生的多聚结合位点;(4)蛋白质或多肽中的固有无序区域或低复杂度结构域(参见例如Wang等人,Cell 174(3):688-699,2018;Nott,TimothyJ等人,Molecular Cell 57(5):936-947,2015)。本发明的多价结构域中含有的对于引起所述分子间相互作用所必需的结构模块或基序的数量为该多价结构域的价数。例如,对于由六个SIM基序串联重复而得的多价结构域(SIM)6而言,其价数为六价。
本文的术语“配体”以最广泛的含义使用,意指相互间具有特异性作用配对中的另一方。更具体而言,术语“配体”意指能够与细胞表面分子相互作用的化学实体。本发明所涉及的配体与其所针对的细胞表面分子之间的相互作用包括通过共价键、离子键、氢键或其他本领域已知的键合方式来进行。相对于其所作用的细胞表面分子,本发明的配体可以是天然存在的,如自细胞表面分子所来源的靶细胞群体或生物体分离得到的天然分子,例如某些小分子代谢物,或者抗体等大分子。本发明的配体也可以是非天然存在的,如通过人为合成或者修饰而得到的有别于天然分子的化学实体。也就是说,术语“配体”在本文中涵盖了各种配体结构,包括但不限于肽类或非肽类的配体。例如但不限于各种无机或有机小分子、抗体、抗原结合片段、肽、肽模拟物、反义寡核苷酸或小干扰RNA(siRNA),只要它们表现出与配对对象所需的特异的结合活性即可。在优选的情况下,配体在本文中是指由天然或非天然氨基酸介由肽键连接而成的肽或肽模拟物,例如,抗体或其抗原结合片段、细胞因子、生长因子、粘附分子、肽激素等。
术语“细胞表面分子”在本文中具有本领域通常所理解的含义。作为细胞表面分子的非限制性示例,可以是蛋白质分子、糖分子、糖蛋白等,可举出受体例如细胞因子受体、组织相容性受体、T细胞受体等,离子通道等。在一些情况下,细胞表面分子可以是靶细胞群体内存在、而在其他群体中基本不存在(或以较低浓度存在)的分子,从而能够指示或定义靶细胞群体的类型。在另一些情况下,细胞表面分子可以是靶细胞群体内存在的一种分子,它与将要纠正的病理学的状态或条件直接或间接相关,并且在未受该病理学影响的细胞或组织中基本不存在或以较低的浓度存在。本发明中的配体可介由与细胞表面分子的相互作用而结合于细胞表面,优选结合于具有将要纠正的病理学的状态或条件的细胞(例如肿瘤细胞)的表面。
在本文中,“受体”可包括内源受体或外源受体。内源受体包括细胞中天然存在的受体。外源受体包括外源引入细胞中的受体。在一些方面,外源受体可以是包含于同一个体的其他细胞中的天然存在的序列。在另一些方面,外源受体可以是不同生物体或不同物种的受体。外源受体还包括在任何生物体中都不自然存在的合成受体。外源受体包括嵌合受体,其是指通过连接不同分子(例如,不同蛋白质、同源蛋白质、直向同源蛋白质等)的区域(例如,细胞外、跨膜、细胞内等结构域)而构建的受体。
在本文中,“串联连接”包括将连接单元通过共价键直接连接或者通过间隔序列(或称连接子、连接序列)等间接连接。在串联连接而得的构建物中,连接单元之间可以以相同的方向排列,也可以不同的方向排列。
术语“增加”或“活化”在本文中意指引起总体增加的能力,例如,总体增加10%或以上,20%或以上,30%或以上,40%或以上,50%或以上,或75%、85%、90%、95%或以上。在某些方面,增加或活化可以指配体-细胞表面分子相互作用的下游活性。
术语“减少”或“抑制”在本文中意指引起总体降低的能力,例如,总体降低10%或以上,20%或以上,30%或以上,40%或以上,50%或以上,或75%、85%、90%、95%或以上。在某些方面,减少或抑制可以指配体-细胞表面分子相互作用的下游活性。
如本文中使用的,术语“寡聚化”意指几个生物大分子例如几个受体分子以非共价键聚合成为复合体,功能状态可能发生改变。
术语“抗体”在本文中涵盖各种抗体结构,包括但不限于单克隆抗体、多克隆抗体、多特异性抗体(例如双特异性抗体)和抗体片段(例如双Fab)。
术语“完整抗体”用于指代具有基本上类似于天然抗体结构的结构或具有含有如本文所定义的Fc区的重链的抗体。在本文中,“完整抗体”可与“全长抗体”及“全抗体”互换的使用。
术语“抗原结合片段”或“抗体片段”是指除了完整抗体以外的分子,其包含完整抗体的一部分,该部分结合完整抗体所结合的抗原。抗原结合片段的示例包括但不限于:双Fab、Fv、Fab、Fab、Fab’SH、F(ab’)2、双体抗体、线性抗体、单链抗体(例如,scFv、ScFab)、单结构域抗体(例如VH结构域、VHH结构域或纳米抗体),以及由抗体片段形成的多特异性抗体。
术语“单链抗体”,也称为“单链Fv”、“单链可变片段”、“sFv”或“scFv”,是包含连接至单个多肽链中的VH和VL抗体结构域的抗体片段。优选地,scFv多肽在VH和VL结构域之间进一步包含多肽连接基,使scFv形成所需的抗原结合结构。有关scFv的综述,参见Pluckthun的《单克隆抗体的药理学》(The Pharmacology of Monoclonal Antibodies),第113卷,Rosenburg和Moore主编,Springer Verlag,New York,第269~315页(1994);Malmborg等人,J.Immunol.Methods 183:7 13,1995。
术语“单结构域抗体”是指包含抗体的全部或部分重链可变结构域或全部或部分轻链可变结构域的抗体片段。在某些方面,单结构域抗体为人单结构域抗体(参见例如美国专利号6,248,516B1)。单结构域抗体的实例包括但不限于VHH。
术语“小分子”是指分子量为约2000道尔顿或更小,例如约1000道尔顿或更小的任何分子。在一些方面,小分子可以是有机分子。在另一些方面,小分子可以是无机分子。
如本文所用的,术语“模拟物”或“分子模拟物”是指一种多肽,其与给定多肽或所述多肽的一部分在构象和/或结合能力(例如,二级结构、三级结构)方面具有足够的相似性以结合所述多肽的结合配偶体。模拟物可以以与其模拟的多肽相等、较小或较大的亲和力与结合配偶体结合。分子模拟物与其模拟的多肽可能具有或不具有明显的氨基酸序列相似性。模拟物可以是天然存在的,也可以是经过工程改造的。在一些方面,模拟物可以执行所模拟多肽的所有功能。在其他方面,模拟物不执行所模拟多肽的所有功能。
如本文所用的“肿瘤相关抗原”或“TAA”是指存在于靶细胞表面上的抗原决定簇,该靶细胞为例如肿瘤中的细胞(诸如癌细胞、肿瘤基质的细胞)。在某些方面,靶细胞抗原为肿瘤细胞表面的抗原。在一个方面,TAA选自由以下项组成的组:CXC基序趋化因子受体4(CXCR4)、肝细胞生长因子受体(c-Met或HGFR)、表皮生长因子受体(EGFR)、表皮生长因子受体2(HER2)和前列腺特异性膜抗原(PSMA)、成纤维细胞活化蛋白(FAP)、癌胚抗原(CEA)、叶酸受体α(FolR1)、黑素瘤相关硫酸软骨素蛋白聚糖(MCSP)、p95HER2、EpCAM、HER3、CD30或TPBG(5T4)、CD19、CD79b、CD20、CD22、CD37、CD38、BCMA和GPRC5D。
除非另外指明,否则如本文所用的术语“CXC基序趋化因子受体4”或“CXCR4”广泛地指来自任何脊椎动物来源的任何天然CXCR4,所述脊椎动物来源包括哺乳动物诸如灵长类动物(例如人)、非人灵长类动物(例如食蟹猕猴)和啮齿动物(例如小鼠和大鼠)。该术语涵盖全长CXCR4和CXCR4的分离区域或结构域,例如CXCR4胞外结构域。该术语还涵盖CXCR4的天然存在变体,例如剪接变体或等位基因变体。示例性的人CXCR4的氨基酸序列如Uniprot ID:P61073所示序列。本发明还考虑了较小的序列变异,尤其是不影响CXCR4功能和/或活性的CXCR4的保守氨基酸取代。
除非另外指明,否则如本文所用的术语“死亡受体5”或“DR5”广泛地指来自任何脊椎动物来源的任何天然DR5,所述脊椎动物来源包括哺乳动物诸如灵长类动物(例如人)、非人灵长类动物(例如食蟹猕猴)和啮齿动物(例如小鼠和大鼠)。该术语涵盖全长DR5和DR5的分离区域或结构域,例如DR5胞外结构域。该术语还涵盖DR5的天然存在变体,例如剪接变体或等位基因变体。示例性的人DR5的氨基酸序列如Uniprot ID:O14763所示序列。本发明还考虑了较小的序列变异,尤其是不影响DR5功能和/或活性的DR5的保守氨基酸取代。
术语“表皮生长因子受体(EGFR)”也称为原癌基因c-ErbB-1或受体酪氨酸蛋白激酶erbB-1。除非另有说明,否则该术语泛指来自任何脊椎动物来源的任何天然EGFR,该脊椎动物来源包括哺乳动物诸如灵长类动物(例如人)、非人灵长类动物(例如食蟹猕猴)和啮齿动物(例如小鼠和大鼠)。该术语涵盖全长EGFR和EGFR的分离区域或结构域,例如EGFR胞外结构域。该术语还涵盖EGFR的天然存在变体,例如剪接变体或等位基因变体。人EGFR的氨基酸序列示出于UniProt登录号P00533(211版)中。本发明还考虑了较小的序列变异,尤其是不影响EGFR功能和/或活性的EGFR的保守氨基酸取代。
除非另外指明,否则如本文所用的术语“肝细胞生长因子受体(Met)”泛指来自任何脊椎动物来源的任何天然肝细胞生长因子受体,该脊椎动物来源包括哺乳动物诸如灵长类动物(例如人)、非人灵长类动物(例如食蟹猕猴)和啮齿动物(例如小鼠和大鼠)。该术语涵盖全长肝细胞生长因子受体及其分离区域或结构域,例如肝细胞生长因子受体的胞外结构域。该术语还涵盖肝细胞生长因子受体的天然存在变体,例如剪接变体或等位基因变体。本发明还考虑了较小的序列变异,尤其是不影响肝细胞生长因子受体功能和/或活性的肝细胞生长因子受体的保守氨基酸取代。
如本文所用的,“疾病”是指将从治疗获益的任何病症,包括但不限于慢性和急性疾患或疾病,包括那些使哺乳动物易患所述疾患的病理性病症。在某些方面,所述疾病是与细胞表面分子的功能或活性修改的疾病。在某些优选的方面,所述疾病是慢性自身免疫性障碍、炎性病症、细胞增殖异常相关性疾病、细胞凋亡异常相关性疾病、脓毒症或病毒感染。在最优选的方面,所述疾病是癌症。
术语“癌症”在本文中是指或描述哺乳动物中通常以细胞生长/增殖不受控制为特征的生理状况。癌症方面包括实体瘤癌症和非实体瘤癌症。实体癌肿瘤包括但不限于肺癌、结直肠癌、头颈部癌(例如,头颈部鳞状细胞癌)、胶质瘤(例如,神经胶质瘤)、神经母细胞瘤、黑素瘤、乳腺癌、膀胱癌、肾癌、卵巢癌、胰腺癌、宫颈癌、食道癌、肉瘤、食道癌(例如,食道鳞状细胞癌)、甲状腺癌(例如,乳头状甲状腺癌)或前列腺癌,或其转移形式。在一些方面,癌症为结直肠癌(CRC)。在一些方面,癌症为肺癌。肺癌的进一步方面包括表皮生长因子受体阳性(EGFR+)肺癌。肺癌的其他方面包括非小细胞肺癌(例如鳞状肺癌或非鳞状肺癌)和小细胞肺癌。在一些方面,癌症为前列腺癌。前列腺癌的进一步方面包括去势抵抗性前列腺癌(CRPC)。在一些方面,癌症为乳腺癌。乳腺癌的进一步方面包括包括HER2阳性(HER2+)乳腺癌。乳腺癌的其他方面还包括乳腺导管癌。在一些方面,乳腺癌为早期乳腺癌。在一些方面,癌症是实体瘤的转移形式。在一些方面,实体瘤的转移形式是肺癌、结直肠癌、头颈部癌、胶质瘤、神经母细胞瘤、黑素瘤、乳腺癌、膀胱癌、肾癌、卵巢癌、胰腺癌、宫颈癌、食道癌、肉瘤、食道癌、甲状腺癌和前列腺癌的转移形式。在一些方面,癌症为非实体瘤癌症。非实体瘤癌症包括但不限于B细胞淋巴瘤。B细胞淋巴瘤的进一步方面包括,例如,慢性淋巴细胞白血病(CLL)、慢性髓性白血病、弥漫性大B细胞淋巴瘤(DLBCL)、滤泡性淋巴瘤、骨髓增生异常综合征(MDS)、非霍奇金淋巴瘤(NHL)、急性淋巴细胞白血病(ALL)、急性单核细胞白血病、多发性骨髓瘤、急性髓性白血病(AML)、混合系白血病、NUT中线癌、伯基特淋巴瘤或蕈状真菌病(MF)。
术语“药学上可接受的载体”是指将可以与本发明的相变调节元件一起施用于患者且不破坏该调节元件的功能活性的无毒载体。在某些实施方案中,“药学上可接受的”物质适合用于与动物或人类的细胞、组织或器官接触,而没有过度的毒性、刺激性、变应性反应、免疫原性或其它不良反应,其在剂型中使用的量根据施用时间表,并与合理的利益/风险比成比例。在某些实施方案中,作为药物组合物的组分的“药学上可接受的”物质还与组合物的其他成分相容。在某些实施方案中,术语“药学上可接受的载体”包括但不限于药学上可接受的非活性成分、材料、组合物和载体、诸如液体填充剂、固体填充剂、稀释剂、赋形剂、载体、溶剂和包封材料。载体还包括所有药学上可接受的分散介质、包衣、缓冲剂、等渗剂、稳定剂、吸收延迟剂、抗微生物剂、抗菌剂、抗真菌剂、辅助剂等。除非任何常规载体与相变调节元件不相容,本公开内容涵盖在药物组合物中使用常规载体。参见例如Remington:The Science and Practice of Pharmacy,第21版,Lippincott Williams&Wilkins(Philadelphia,Pennsylvania,2005);Handbook of Pharmaceutical Excipients,5thEd.,Rowe等人编撰,The Pharmaceutical Press and the American PharmaceuticalAssociation(2005);Handbook of Pharmaceutical Additives,第3版,Ash和Ash编撰,Gower Publishing Co.(2007);和Pharmaceutical Preformulation and Formulation,Gibson编撰,CRC Press LLC(Boca Raton,Florida,2004)。
下面针对用于实施本发明的优选方式进行说明。需要说明的是,以下所说明的实施方式是示出本发明的代表性的实施方式的实施例,但是本发明不受这些实施例限制。
可以将下面所说明的方式之中2个以上的方式进行组合,这样的组合也包含于本发明中。
实施例
实施例1
已知趋化因子受体CXCR4定位于细胞膜,CXCR4可与其配体R4L结合;死亡受体DR5也定位于细胞膜,DR5可与其配体TRAIL互作。
通过本领域普遍已知的DNA克隆方法(Dhoble等人,International Journal ofGenetic Engineering and Recombination 3.1:1-10,2017),构建编码如下串联基序的DNA片段:将5个SUMO3基序串联而得的多价结构域(SUM)5,将6个SIM基序串联而得的多价结构域(SIM)6。再将编码R4L的DNA片段与上述编码(SIM)6的DNA片段连接,构建重组载体pRSFDuet-1-(SIM)6-R4L。将编码TRAIL的DNA片段与上述编码(SUM)5的编码区连接,构建了重组载体pRSFDuet-1-(SUM)5-TRAIL。分别使用上述重组载体,通过本领域普遍已知的原核表达和纯化方法,制备融合有多价结构域的重组配体(SIM)6-R4L和(SUM)5-TRAIL。具体步骤如下:
1.重组载体的构建
(SIM)6表达载体:通过本领域已知的DNA片段合成法(Kosuri等人,Naturemethods 11(5):499-507,2014),合成SEQ ID NO:1所示DNA片段。利用引物对(SIM)6-F和(SIM)6-R,以SEQ ID NO:1所示DNA片段为模板进行PCR扩增:
(SIM)6-F:
ACTTTAATAAGGAGATATACCATGAAACATCATCATCATCA(SEQ ID NO:29)
(SIM)6-R:
TTCTTTACCAGACTCGAGTTACCCCATGGAGCCGCCGCTA(SEQ ID NO:30)。
PCR扩增进行30个如下循环:94℃变性0.5分钟、60℃退火0.5分钟、72℃延伸1分钟。再使用限制性酶NcoI和XhoI,将得到的PCR产物与载体pRSFDuet-1同酶切,使用T4连接酶将酶切后纯化的PCR产物片段和载体片段连接,得到重组载体,其中经测序验证正确的重组载体记为pRSFDuet-1-(SIM)6。因此,pRSFDuet-1-(SIM)6能表达SEQ ID NO:2所示的多价结构域(SIM)6(下文也将该结构域简称为(SIM)6)。
为便于理解,SEQ ID NO:1中,第7-27位编码7×HisTag,第28-48位编码TEV,第61-735位编码(SIM)6。SEQ ID NO:1所示的DNA序列编码SEQ ID NO:2所示的蛋白质。SEQ IDNO:2中的第21-245位为多价结构域(SIM)6的氨基酸序列,第21-43位为单价SIM(即单个SIM基序)的氨基酸序列。
(SUM)5表达载体:通过与上述相同的克隆方法,利用如下所示的引物对(SUM)6-F和(SUM)6-R,以SEQ ID NO:3所示DNA片段为模板进行PCR扩增,获得重组载体pRSFDuet-1-(SUM)5
(SUM)6-F:
ACTTTAATAAGGAGATATACCATGAAACATCATCATCATCATC(SEQ ID NO:31),
(SUM)6-R:
TTCTTTACCAGACTCGAGTTAGCCCATGGAGCCGCCGCTA(SEQ ID NO:32)。
pRSFDuet-1-(SUM)5能表达SEQ ID NO:4所示的多价结构域(SUM)5(下文也将该结构域简称为(SUM)5)。
为便于理解,SEQ ID NO:3中,第7-27位编码7×HisTag,第28-48位编码TEV,第79-1653位编码(SUM)5。SEQ ID NO:3所示的DNA序列编码SEQ ID NO:4所示的蛋白质,序列4中的第27-551位为多价结构域(SUM)5的氨基酸序列,第27-118位为单价SUMO3(即单个SUMO3基序)的氨基酸序列。
(SIM)6-R4L表达载体:通过与上述相同的克隆方法,利用如下所示的引物对(SIM)6-R4L-F和(SIM)6-R4L-R,以SEQ ID NO:5所示DNA片段为模板进行PCR扩增,获得重组载体pRSFDuet-1-(SIM)6-R4L。
(SIM)6-R4L-F:
ACTTTAATAAGGAGATATACCATGAAACATCATCATCATCAT(SEQ ID NO:33),
(SIM)6-R4L-R;
TTCTTTACCAGACTCGAGTTAAGAACCACCAGAACCACC(SEQ ID NO:34)。
pRSFDuet-1-(SIM)6-R4L能表达SEQ ID NO:6所示的融合蛋白,下文也称为重组蛋白(SIM)6-R4L。
为便于理解,SEQ ID NO:5中,第7-27位编码7×HisTag,第28-48位编码TEV,第61-735位编码(SIM)6,第736-822位编码R4L。SEQ ID NO:5所示的DNA序列编码SEQ ID NO:6所示的蛋白质。SEQ ID NO:6中的第21-245位为(SIM)6的氨基酸序列,第246-274位为R4L的氨基酸序列。
(SUM)5-TRAIL表达载体:通过与上述相同的克隆方法,利用如下所示的引物对(SUM)5-TRAIL-F和(SUM)5-TRAIL-R,以SEQ ID NO:7所示DNA片段为模板进行PCR扩增,获得重组载体pRSFDuet-1-(SUM)5-TRAIL。
(SUM)5-TRAIL-F:
ACTTTAATAAGGAGATATACCATGAAACATCATCATCATCATC(SEQ ID NO:35)
(SUM)5-TRAIL-R:
TTCTTTACCAGACTCGAGttaGCCAACCAGGAACGCACC(SEQ ID NO:36)。
pRSFDuet-1-(SUM)5-TRAIL能表达SEQ ID NO:8所示的融合蛋白,下文也称为重组蛋白(SUM)5-TRAIL。
为便于理解,SEQ ID NO:7中,第7-27位编码7×HisTag,第28-48位编码TEV,第79-1653位编码(SUM)5,第1654-2127位编码TRAIL。SEQ ID NO:7所示的DNA序列编码SEQ IDNO:8所示的蛋白质。SEQ ID NO:8中的第27-551位为(SUM)5的氨基酸序列,第552-719位为TRAIL的氨基酸序列。
2.蛋白质的表达纯化
分别利用上述“1、重组载体的构建”步骤所得重组载体pRSFDuet-1-(SIM)6、pRSFDuet-1-(SUM)5、pRSFDuet-1-(SIM)6-R4L和pRSFDuet-1-(SUM)5-TRAIL,表达目标重组蛋白(SIM)6、(SUM)5、(SIM)6-R4L和(SUM)5-TRAIL,步骤如下:
用构建好的重组载体转染大肠杆菌BL21,第二天挑取菌落至50mL带有卡那霉素(Kan)抗性的LB培养基(Luria-Bertani培养基:胰蛋白胨10g/L、酵母提取物5g/L、氯化钠10g/L)中,于37℃、220rpm培养4h,然后转接到1L含有(100μg/ml浓度)卡那霉素的LB培养基中于37℃、220rpm扩大培养。
待菌体浓度达到OD600=0.8~1,降温至18℃,加入1ml的1mM IPTG静置过夜,诱导重组蛋白表达。诱导17小时后,将菌体富集,并进行超声破碎。然后,于20,000×g、4℃离心1hr。取离心上清液依次进行亲和层析和凝胶过滤层析,使用SDS-PAGE鉴定收取到的蛋白样品,得到目的重组蛋白(SIM)6-R4L、(SUM)5-TRAIL、(SIM)6、(SUM)5
3.细胞的处理
根据生产商的说明,利用Alexa594(ThermoFisher,A20004)-Red标记上述“2、蛋白质的表达纯化”所得重组蛋白(SIM)6-R4L和(SIM)6。将得到的Alexa594-Red标记蛋白分别记为(SIM)6-R4L(Red)和(SIM)6(Red)。同样地,利用Alexa647(ThermoFisher,A20006)-Green标记重组蛋白(SUM)5-TRAIL和(SUM)5,将得到的Alexa647-Green标记蛋白分别记为(SUM)5-TRAIL(Green)和(SUM)5(Green)。
将人骨肉瘤细胞SJSA-1(购自ATCC(https://www.atcc.org/))用上述标记的重组蛋白或对照溶液处理后,立即进行激光共聚焦扫描显微成像。步骤如下:
将人骨肉瘤细胞系SJSA-1培养于含有10%胎牛血清(FBS,购自Gibco)和1X青链霉素(购自HyClone)的RMPI-1640培养基中,至70%-80%汇合度。向培养基中同时添加以下重组蛋白的组合:(1)(SIM)6-R4L(Red)与(SUM)5(Green),(2)(SIM)6(Red)与(SUM)5-TRAIL(Green),(3)(SIM)6-R4L(Red)与(SUM)5-TRAIL(Green),(4))(SIM)6(Red)与(SUM)5(Green),至各自终浓度分别为100nM。将添加重组蛋白后的培养基混匀,于37℃孵育约1分钟后,通过NIKON A1R HD25激光共聚焦显微镜(购自Nikon,Inc.)成像。结果显示于图2中。
其结果显示,将细胞表面受体的特异性配体分子与多价结构域(SIM)6和(SUM)5中的任一者或两者融合,在同时存在多价SUMO3基序与多价SIM基序的情况下,标记多价SIM基序的红色荧光信号(Red)和标记SUMO3基序的绿色荧光信号(Green)均可以在细胞膜上共定位,且呈现明显的聚集性分布的斑点(puncta)(参见图2A至图2C)。并且,两种多价结构域分别融合不同配体分子时的斑点(图图2C)明显多于仅融合相同配体分子的情况(图2A和2B)。另一方面,在对照组中并未观察到上述聚集性分布的斑点(puncta)(参见图2D)。
上述结果表明,多价结构域本身不能引起细胞表面相分离,但当其与细胞表面受体的特异性配体分子融合后,多价结构域介由特异性配体与细胞表面受体蛋白互作,可以进一步提高多价结构域组件及/或受体蛋白的局部浓度,从而促进相分离的发生。
实施例2
通过与实施例1相同的方法,构建分别用纳米抗体CXCR4nanobody(在本文中也称为CNB)替代R4L、用纳米抗体DR5naobody(在本文中也称为DNB)替代TRAIL而得的融合蛋白,同样地实施诱导相分离实验。
1.重组载体的构建
(SIM)6-CNB表达载体:利用引物对(SIM)6-CNB-F和(SIM)6-CNB-R,以SEQ ID NO:9所示DNA片段为模板进行PCR扩增,获得重组载体pRSFDuet-1-(SIM)6-CNB。
(SIM)6-CNB-F:
ACTTTAATAAGGAGATATACCATGAAACATCATCATCATCATC(SEQ ID NO:37),
(SIM)6-CNB-R;
TTCTTTACCAGACTCGAGTTAAGAGCTTACGGTAACCTGA(SEQ ID NO:38)。
pRSFDuet-1-(SIM)6-CNB能表达SEQ ID NO:10所示的融合蛋白,下文也称为重组蛋白(SIM)6-CNB。
为了便于理解,SEQ ID NO:9中,第7-27位编码7×HisTag的编码DNA序列,第28-48位编码TEV,第61-735位编码(SIM)6,第736-1119位编码CNB。SEQ ID NO:9所示的DNA序列编码SEQ ID NO:10所示的蛋白质。SEQ ID NO:10中的第21-245位为(SIM)6的氨基酸序列,第246-373位为CNB的氨基酸序列。
(SUM)5-DNB表达载体:利用引物对(SUM)5-DNB-F和(SUM)5-DNB-R,以SEQ ID NO:11所示DNA片段为模板进行PCR扩增,获得重组载体pRSFDuet-1-(SUM)5-DNB。
(SUM)5-DNB-F:
ACTTTAATAAGGAGATATACCATGAAACATCATCATCATCAT(SEQ ID NO:39)
(SUM)5-DNB-R:
TTCTTTACCAGACTCGAGTTAAGAGCTTACGGTAACGAG(SEQ ID NO:40)。
pRSFDuet-1-(SUM)5-DNB能表达SEQ ID NO:12所示的融合蛋白,下文也称为重组蛋白(SUM)5-DNB。
为了便于理解,SEQ ID NO:11中,第7-27位编码7×HisTag,第28-48位编码TEV,第79-1653位编码(SUM)5,第1654-2019位编码DNB。SEQ ID NO:11所示的DNA序列编码SEQ IDNO:12所示的蛋白质,SEQ ID NO:12中的第27-551位为(SUM)5的氨基酸序列,第552-673位为DNB的氨基酸序列。
CNB表达载体:利用引物对pRSFDuet-1-CNB-F和pRSFDuet-1-CNB-R,以SEQ ID NO:13所示DNA片段为模板进行PCR扩增,获得重组载体pRSFDuet-1-CNB。
pRSFDuet-1-CNB-F:
ACTTTAATAAGGAGATATACCATGAAACATCATCATCATCAT(SEQ ID NO:41),
pRSFDuet-1-CNB-R;
TTCTTTACCAGACTCGAGTTAAGAGCTTACGGTAACCTG(SEQ ID NO:42)。
pRSFDuet-1-CNB能表达SEQ ID NO:14所示的融合蛋白,下文也称为重组蛋白CNB。
为了便于理解,SEQ ID NO:13中,第7-27位编码7×HisTag,第28-48位编码TEV,第61-444位编码CNB。SEQ ID NO:13所示的DNA序列编码SEQ ID NO:14所示的蛋白质,SEQ IDNO:14中的第21-148位为CNB的氨基酸序列。
DNB表达载体:利用引物对pRSFDuet-1-DNB-F和pRSFDuet-1-DNB-R,以SEQ ID NO:15所示DNA片段为模板进行PCR扩增,获得重组载体pRSFDuet-1-DNB。
pRSFDuet-1-DNB-F:
ACTTTAATAAGGAGATATACCATGAAACATCATCATCATCAT(SEQ ID NO:43)
pRSFDuet-1-DNB-R:
TTCTTTACCAGACTCGAGTTAAGAGCTTACGGTAACGAGA(SEQ ID NO:44)。
pRSFDuet-1-DNB能表达SEQ ID NO:16所示的融合蛋白,下文也称为重组蛋白DNB。
为了便于理解,SEQ ID NO:15中,第7-27位编码7×HisTag,第28-48位编码TEV,第79-444位编码DNB。SEQ ID NO:15所示的DNA序列编码SEQ ID NO:16所示的蛋白质,SEQ IDNO:16中的第27-148位为DNB的氨基酸序列。
2.蛋白质的表达纯化
利用本实施例上述“1、重组载体的构建”所得重组载体pRSFDuet-1-(SIM)6-CNB、pRSFDuet-1-(SUM)5-DNB、pRSFDuet-1-CNB和pRSFDuet-1-DNB,表达目标重组蛋白。通过与实施例1相同的纯化方法,得到目标重组蛋白(SIM)6-CNB、(SUM)5-DNB、CNB、DNB。
3.细胞的处理
根据生产商的说明,利用Alexa594(ThermoFisher,A20004)-Red标记上述“2、蛋白质的表达纯化”所得重组蛋白(SIM)6-CNB和CNB。将得到的Alexa594-Red标记蛋白分别记为(SIM)6-CNB(Red)和CNB(Red)。同样地,利用Alexa647(ThermoFisher,A20006)-Green标记重组蛋白(SUM)5-DNB和DNB,将得到的Alexa647-Green标记蛋白分别记为(SUM)5-DNB(Green)和DNB(Green)。
通过与实施例1相同的方法,针对用如下重组蛋白处理的人骨肉瘤细胞SJSA-1进行激光共聚焦扫描显微成像:
处理组1:(SIM)6-CNB(Red)和(SUM)5-DNB(Green)的组合
处理组2:(SIM)6(Red)和(SUM)5(Green)的组合
处理组3:CNB(Red)和DNB(Green)的组合。
分别向培养基中添加上述重组蛋白的组合至终浓度100nM。将添加后的培养基混匀,于37℃孵育约1分钟后,通过全内反射荧光显微镜(TIRF)成像。结果显示于图3中。
图3A和3B显示,在处理组1中观察到红色和绿色荧光的共定位,表明加入的重组蛋白(SIM)6-CNB(Red)和(SUM)5-DNB(Green)在细胞膜上发生聚集,并形成液-液相分离所特有的斑点(puncta)。图3A和3B还显示,细胞表达的内源性受体DR5和CXCR4与加入的重组蛋白于相分离的斑点中共定位。
同时,图3C和3D显示,在处理组2中,完全未观察到相分离斑点。在处理组3中,虽然可以检测到较小且不典型的斑点结构,但这些斑点中的荧光信号微弱,且两种荧光信号之间缺少共定位。上述结果表明,单独使用多价结构域或者单独使用配体均不能在细胞表面引起相分离,相分离的发生需要这二者的共同参与。
实施例3
通过流式细胞术,测定实施例1和2得到的各重组蛋白及其组合诱导细胞凋亡的效果。测定使用人骨肉瘤细胞系SJSA-1进行。具体步骤如下:
将SJSA-1细胞培养于RPMI 1640培养基(含有10%FBS与1%青链霉素)中,至密度106个细胞/ml。向SJSA-1细胞的培养基中加入如下所示重组蛋白和对照,至各重组蛋白的终浓度分别为20、50、100nM:
(SIM)6-CNB(组1)、(SUM)5-DNB(组2)、(SIM)6-CNB和(SUM)5-DNB的组合(组3)、(SIM)6和(SUM)5的组合(组4)、DNB和CNB的组合(组5)、(SIM)6(组6)、(SUM)5(组7)、CNB(组8)、DNB(组9)、阴性对照(组10)。
37℃孵育4h后,收集细胞,1700rpm离心5min,去除上清。将沉淀的细胞团块用500μL PBS重悬后,再次离心5min,去除上清。根据生产商的说明,使用Annexin V-FITC细胞凋亡检测试剂盒(购自碧云天)实施Annexin V-FITC/PI双染,用流式细胞仪LSRFortessa SORP(BD公司)检测细胞的凋亡状况并进行统计分析。细胞凋亡比例为发生凋亡的细胞数占总细胞数的相对比值。结果示于表1和图4A中。
表1、SJSA-1细胞的平均凋亡比例(%)*
*:各凋亡比例均为两次重复实验的平均值。
图4A显示,在各浓度条件下,均仅在组3中检测到与阴性对照具有统计学显著差异的细胞凋亡。
上述结果再次表明,多价结构域与配体的组合能够实现单独使用其中任一者时所不能实现的效果,二者的共同参与促使细胞表面发生相分离,进而引起与所述配体相关的各种细胞事件(例如细胞凋亡)。
此外,通过与上述相同的方法,向SJSA-1细胞的培养基中添加相同的重组蛋白及其组合,至各重组蛋白终浓度为200nM。根据生产商的说明,使用Zoom System进行监控各组细胞随时间经过的生存率,结果显示于表2和图4B中。其中,以刚加入重组蛋白或其组合时为时间“0”,利用未经过处理的SJSA-1细胞作为阴性对照(Negtive Control,NC)。细胞生存率(细胞平均存活比例)根据未凋亡细胞面积占视野总面积的百分比来计算。
表2、SJSA-1细胞的平均存活比例(%)*
*:各存活比例均为两次重复实验的平均值。
表2和图4B的结果显示,在相同条件下,仅在添加重组蛋白(SUM)5-DNB和(SIM)6-CNB的组中观察到了细胞生存率随时间经过的减少;换言之,添加重组蛋白(SUM)5-DNB和(SIM)6-CNB的组在任何时间点均呈现最低的细胞生存率。相反,其余处理组的细胞生存率随时间经过而增加,并且与阴性对照没有统计学意义上的显著差异。
实施例4
通过与实施例2相同的方法,构建价数较低的串联SIM基序和串联SUMO3基序,得到多价结构域(SIM)3和(SUM)3。其中,(SIM)3为三个SIM基序串联而得,(SUM)3为三个SUMO3基序串联而得。
1.重组载体的构建
(SIM)3-CNB表达载体:通过本领域已知的DNA片段合成法,合成SEQ ID NO:17。使用NcoI和XhoI限制性内切酶切割载体pRSFDuet-1,使用T4连接酶将上述DNA片段连接至酶切过的载体中,得到重组载体,其中经测序验证正确的重组载体记为pRSFDuet-1-(SIM)3-CNB。因此,pRSFDuet-1-(SIM)3-CNB能表达SEQ ID NO:18所示的融合蛋白(SIM)3-CNB(在本文中也将该融合蛋白称为重组蛋白(SIM)3-CNB)。
为便于理解,SEQ ID NO:17中,第7-27位编码7×HisTag,第28-48位编码TEV,第55-387位编码多价结构域(SIM)3,第388-771位编码纳米抗体CNB。SEQ ID NO:17所示的DNA序列编码SEQ ID NO:18所示的蛋白质。SEQ ID NO:18中的第19-129位为多价结构域(SIM)3的氨基酸序列,第130-257位为纳米抗体CNB的氨基酸序列。
(SUM)3-DNB表达载体:通过同样的方法,合成SEQ ID NO:19所示的DNA片段,并将其连接至载体pRSFDuet-1中。将得到的序列正确的重组载体记为pRSFDuet-1-(SUM)3-DNB。因此,pRSFDuet-1-(SUM)3-DNB能表达SEQ ID NO:20所示的融合蛋白(SUM)3-DNB(在本文中也将该融合蛋白称为重组蛋白(SUM)3-DNB)。
为便于理解,SEQ ID NO:19中,第7-27位编码7×HisTag,第28-48位编码TEV,第55-1005位编码多价结构域(SUM)3,第1006-1371位编码纳米抗体DNB。SEQ ID NO:19所示的DNA序列编码SEQ ID NO:20所示的蛋白质。SEQ ID NO:20中的第19-335位为多价结构域(SUM)3的氨基酸序列,第336-457位为纳米抗体DNB的氨基酸序列。
(SIM)3表达载体:通过同样的方法,合成SEQ ID NO:21所示的DNA片段,并将其连接至载体pRSFDuet-1中。将得到的序列正确的重组载体记为pRSFDuet-1-(SIM)3。因此,pRSFDuet-1-(SIM)3能表达SEQ ID NO:22所示的重组蛋白(SIM)3(在本文中也称为多价结构域(SIM)3)。
为便于理解,SEQ ID NO:21中,第7-27位编码7×HisTag,第28-48位编码TEV,第55-387位为编码(SIM)3。SEQ ID NO:21所示的DNA序列编码SEQ ID NO:22所示的蛋白质。SEQ ID NO:22为多价结构域(SIM)3的氨基酸序列。
(SUM)3表达载体:通过同样的方法,合成SEQ ID NO:23所示的DNA片段,并将其连接至载体pRSFDuet-1中。将得到的序列正确的重组载体记为pRSFDuet-1-(SUM)3。因此,pRSFDuet-1-(SUM)3能表达SEQ ID NO:24所示的重组蛋白(SUM)3(在本文中也称为多价结构域(SUM)3)。
为便于理解,SEQ ID NO:23中,第7-27位编码7×HisTag,第28-48位编码TEV,第55-1005位编码(SUM)3。SEQ ID NO:23所示的DNA序列编码SEQ ID NO:24所示的蛋白质。SEQID NO:24为多价结构域(SUM)3的氨基酸序列。
2.蛋白质的表达纯化
利用上述“1、重组载体的构建”所得重组载体pRSFDuet-1-(SIM)3-CNB、pRSFDuet-1-(SUM)3-DNB、pRSFDuet-1-(SIM)3、pRSFDuet-1-(SUM)3,表达目标重组蛋白。通过与实施例1相同的纯化方法,得到目标重组蛋白(SIM)3-CNB、(SUM)3-DNB、(SIM)3、(SUM)3
3.细胞的处理
通过与实施例2相同的的方法,测定如下重组蛋白组合针对人骨肉瘤细胞系SJSA-1的全内反射荧光显微镜(TIRF)成像,结果显示于图5中:
处理组:(SIM)3-CNB(Red)和(SUM)3-DNB(Green)的组合
对照组:(SIM)3(Red)和(SUM)3(Green)的组合
图5A和5B显示,在处理组中观察到红色和绿色荧光的共定位,表明加入的重组蛋白(SIM)3-CNB(Red)和(SUM)3-DNB(Green)在细胞膜上发生聚集,并形成液-液相分离所特有的斑点(puncta)。图5A和5B还显示,细胞表达的内源性受体DR5和CXCR4与加入的重组蛋白于相分离的斑点中共定位。图5C和5D显示,能够在细胞表面观察到本发明的套件所形成的相分离斑点,而在对照组中则完全未观察到。
实施例5
通过与实施例3相同的方法,测定重组蛋白(SIM)3-CNB、(SUM)3-DNB、(SIM)3、(SUM)3及其组合诱导细胞凋亡的效果。向SJSA-1细胞的培养基中加入如下所示重组蛋白和对照,至各重组蛋白的终浓度分别为50、100nM:
(SIM)3-CNB(组1)、(SUM)3-DNB(组2)、(SIM)3-CNB和(SUM)3-DNB的组合(组3)、(SIM)3和(SUM)3的组合(组4)、DNB和CNB的组合(组5)、(SIM)3(组6)、(SUM)3(组7)、CNB(组8)、DNB(组9)、阴性对照(组10)。结果显示于表3和图6A中。
表3、SJSA-1细胞的平均凋亡比例(%)*
*:组1~4和10的凋亡比例均为四次重复实验的平均值,其余组别为两次重复实验的平均值。
图6A显示,在50nM和100nM的浓度条件下,均仅在组3中检测到与阴性对照具有统计学显著差异的细胞凋亡。
上述结果表明,多价结构域中所含基序数量(即价数)减少可能对于最终诱导细胞凋亡的效果存在一定的不利影响,但本发明的套件仍然能够诱导相分离,进而增强其组件中所含有的配体涉及的活性或功能(例如在本实施例中为诱导细胞凋亡)。该结果也佐证了相分离是本发明的重组蛋白组合实现其操控活性的关键因素。
此外,通过与实施例3相同的方法,测定各重组蛋白的终浓度为200nM时的SJSA-1细胞随时间经过的生存率,结果显示于表4和图6B中。其中,以刚加入重组蛋白或其组合时为时间“0”,利用未经过处理的SJSA-1细胞作为阴性对照(Negtive Control,NC)。细胞生存率(细胞平均存活比例)根据未凋亡细胞面积占视野总面积的百分比来计算。
表4、SJSA-1细胞的平均存活比例(%)*
*:各存活比例均为两次重复实验的平均值。
表4和图6B的结果显示,在相同条件下,添加重组蛋白(SUM)3-DNB和(SIM)3-CNB的组合的处理组中观察到了细胞生存率随时间经过的减少。相反,其余处理组的细胞生存率均随时间经过而增加,且与阴性对照没有统计学意义上的显著差异。
实施例6
由全长半胱氨酸蛋白酶3的切割而介导的活化作用是细胞凋亡过程中的关键性事件(参见例如Nicholson,Donald W.等,"Identification and inhibition of the ICE/CED-3protease necessary for mammalian apoptosis."Nature 376.6535(1995):37-43;Hsia,Jiun-Yi等,"Prognostic significance of caspase-3expression in primaryresected esophageal squamous cell carcinoma."European Journal of SurgicalOncology(EJSO)29.1(2003):44-48),而PARP作为活化半胱氨酸蛋白酶3的底物,被切割后将产生一个85Kd的切割产物,PARP的切割同样也被认为是细胞凋亡的标志(Lazebnik等人,Nature 371(6495):346-347,1994)。通过分析SJSA-1细胞中的原半胱氨酸蛋白酶3(pro-caspase-3)的表达水平和PARP的切割产物,验证本发明的重组蛋白对细胞凋亡的诱导效果。
具体而言,将重组蛋白(SIM)3、(SUM)3、(SIM)3-CNB、(SUM)3-DNB、CNB和DNB以成为如下组合的方式分别添加至SJSA-1细胞(1×106个细胞/孔)的培养基中,至各重组蛋白的终浓度为50nM:
(SIM)3-CNB和(SUM)3-DNB的组合(组1)、(SUM)3-DNB(组2)、(SIM)3-CNB(组3)、DNB和CNB的组合(组4)、(SIM)3和(SUM)3的组合(组5)。
将添加重组蛋白后的细胞在37℃孵育4hr。然后,根据生产商的说明,使用MinuteTMTotal Protein Extraction Kit for Animal Cultured Cells/Tissues(购自InventBiotech)制备SJSA-1细胞裂解物。使用本领域普遍已知的Western印迹法(参见例如Zhang,T.等,"Discovery of a novel third-generation EGFR inhibitor and identificationof a potential combination strategy to overcome resistance."Molecular Cancer19.1(2020)),测定SJSA-1细胞裂解物中的原半胱氨酸蛋白酶3(pro-caspase-3)和PARP的切割产物的水平。测定使用β-微管蛋白作为内参,使用兔抗Caspase-3多克隆抗体(购自CST,货号9662S)、兔抗PARP抗体(购自CST,货号9542s)、兔抗Tublin抗体(购自GeneProtein Link,货号p01106)作为一抗,使用F(ab')2-山羊抗兔IgG(H+L),HRP作为二抗。结果示于图6C。
该结果显示,在组1中检测到原半胱氨酸蛋白酶-3的量的降低和PARP蛋白经切割后产生的85kDa条带。这表明,在同时添加有重组蛋白(SIM)3-CNB和(SUM)3-DNB的情况下,细胞发生凋亡标志性的细胞内事件。相反,单独添加多价结构域、特异性配体分子、或其组合,均不能诱导细胞发生凋亡。
实施例7
本发明人进而在其他细胞系中验证了本发明的重组蛋白的相变调节能力和凋亡诱导活性。
将待测定的细胞系以1×106个细胞/孔的密度接种于24孔平板(Falcon公司),分别加入如下重组蛋白或其组合,于37℃、5%CO2反应4hr。通过与实施例3相同的方法,进行流式细胞术分析。具体而言,将细胞用PBS缓冲液清洗后,用流式细胞仪LSRFortessa SORP(BD公司)测定荧光强度,实施基于Annexin V-FITC/PI双染法(Beyotime)的流式细胞,确定细胞的凋亡比例。
处理组1:(SIM)3-CNB
处理组2:(SUM)3-DNB
处理组3:(SIM)3-CNB和(SUM)3-DNB的组合
处理组4:(SIM)3和(SUM)3的组合
处理组5:CNB和DNB的组合
处理组6:阴性对照NC。
1.针对细胞系COLO205的凋亡诱导活性
细胞系COLO-205来自于人结肠腺癌,购自ATCC公司,于37℃、5%CO2的条件下,维持于包含10%胎牛血清和100Units/ml Pen-Strep的RMPI 1640中。将上述重组蛋白或其组合分别以10、20、50nM的终浓度添加至细胞培养基中,通过流式细胞术测定细胞凋亡比例。结果示于表5和图7A。
表5:人结肠直肠癌细胞系COLO205的平均凋亡比例(%)*
*:组4和5为两次重复实验的算术平均值,其余组均为四次重复实验的算术平均值。
2.针对细胞系Jurkat的凋亡诱导活性
细胞系Jurkat来自于人T淋巴细胞白血病,购自中国国家生物医学实验细胞资源库(http://www.crcpumc.com/),于37℃、5%CO2的条件下,维持于包含10%胎牛血清和100Units/ml Pen-Strep的RMPI 1640中。将上述重组蛋白或其组合分别以10、20、50nM的终浓度添加至细胞培养基中,通过流式细胞术测定细胞凋亡比例。结果示于表6和图7B。
表6:人T淋巴细胞白血病细胞系Jurkat的平均凋亡比例(%)*
*:组4和5为两次重复实验的算术平均值,其余组均为四次重复实验的算术平均值。
3.针对细胞系OCI-AML3的凋亡诱导活性
细胞系OCI-AML3来自于人急性髓细胞性白血病,购自中国国家生物医学实验细胞资源库(http://www.crcpumc.com/),于37℃、5%CO2的条件下,维持于包含20%胎牛血清和100Units/ml Pen-Strep的RMPI-1640中。将上述重组蛋白或其组合分别以20、50、100nM的终浓度添加至细胞培养基中,通过流式细胞术测定细胞凋亡比例。结果示于表7和图7C。
表7:人急性髓细胞性白血病OCI-AML3的平均凋亡比例(%)*
*:各组均为四次重复实验的算术平均值,“/”表示未进行测定。
4.针对细胞系MIA PaCa-2的凋亡诱导活性
细胞系MIA PaCa-2来自于人胰腺癌,购自中国国家生物医学实验细胞资源库(http://www.crcpumc.com/),于37℃、5%CO2的条件下,维持于包含20%胎牛血清和100Units/ml Pen-Strep的RMPI-1640中。将上述重组蛋白或其组合分别以20、50、100nM的终浓度添加至细胞培养基中,通过流式细胞术测定细胞凋亡比例。结果示于表8和图7D。
表8:人胰腺癌细胞系MIA PaCa-2的平均凋亡比例(%)*
*:各组均为四次重复实验的算术平均值。
5.针对细胞系HEK293的凋亡诱导活性
细胞系HEK293来自于人胚胎肾,购自中国国家生物医学实验细胞资源库(http://www.crcpumc.com/),于37℃、5%CO2的条件下,维持于包含10%胎牛血清和100Units/mlPen-Strep的DMEM中。将上述重组蛋白或其组合分别以20、50、100nM的终浓度添加至细胞培养基中,通过流式细胞术测定细胞凋亡比例。结果示于表9和图7E。
表9:人胚胎肾细胞系HEK293的平均凋亡比例(%)*
*:组1~4的20nM与50nM处理、组5的20nM、50nM与100nM处理均为两次重复实验的算术平均值,其余各组各浓度均为四次重复实验的算术平均值。
表5~8和图7A~7D的结果显示,在细胞系COLO205、Jurkat、OCI-AML3和MIA PaCa-2中,较之阴性对照,重组蛋白(SUM)3-DNB和(SIM)3-CNB的组合在各个浓度条件下均能引起显著的细胞凋亡,与单独使用重组蛋白(SUM)3-DNB或(SIM)3-CNB的情况相比,呈现明显的协同效应。此外,重组蛋白(SUM)3-DNB或(SIM)3-CNB作为上述组合的组件单独使用时,以及使用多价结构域(SUM)3或(SIM)3本身的组合、以及纳米抗体DNB和CNB本身形成的组合时,也均不足以在这些细胞系中引起细胞凋亡。
另一方面,表9以及图7E的结果显示,在作为阴性对照的细胞系HEK293T中,任一重组蛋白或其组合在任一浓度条件下均未能引起较之阴性对照而言显著的细胞凋亡。
实施例8
为了进一步确认本发明的融合蛋白通过基于与细胞表面受体的结合而促进相分离,进而操控细胞凋亡,本实施例通过本领域普遍已知的Western印迹测定了CXC基序趋化因子受体4(CXCR4)和死亡受体5(DR5)在细胞系COLO205、Jurkat、OCI-AML3、SJSA-1、MIAPaCa-2和HEK293中的表达量。测定使用β微管蛋白作为内参,使用兔抗DR5单克隆抗体(购自Abcam,货号ab8416)、兔抗CXCR4抗体(购自Protein Tech,货号60042-1-Ig)、兔抗Tublin抗体(购自Gene Protein Link,货号p01106)作为一抗,使用F(ab')2-山羊抗兔IgG(H+L),HRP作为二抗(Thermo Fisher Scientific,货号A24537)。结果示于图8。
该结果显示,在经过内参蛋白校正后,所有上述细胞系中均能够检测到CXCR4受体的表达。然而,DR5受体的表达仅在细胞系COLO205、Jurkat、OCI-AML3、MIA PaCa-2和SJSA-1中被检测到,这些细胞系恰好也是能够响应本发明的重组蛋白(SUM)3-DNB和(SIM)3-CNB而呈现细胞凋亡的细胞系。相反,在未能响应本发明的相变调节融合蛋白的细胞系HEK293中,也如预期的一样,未能检测到死亡受体DR5的表达。
上述结果表明,本发明的相变调节融合蛋白的组合是介由其所融合的配体来特异性地作用于细胞表面受体分子,进而通过相分离促进受体分子聚集,影响其下游信号通路,进而诱导细胞发生凋亡。
实施例9
使用与前述实施例类似的方法,将多价结构域更换为已被证实可以发生相分离的多价结构域——串联重复的PRMH和串联重复的SH3,以研究多价结构域与相分离和细胞凋亡的关系。
分别将5个PRMH基序和5个SH3基序串联,形成(PRMH)5和(SH3)5,将它们分别与CNB和DNB融合表达,产生融合蛋白(PRMH)5-CNB和(SH3)5-DNB。
1.重组载体的构建
(PRMH)5-CNB表达载体:通过本领域已知的DNA片段合成法,合成SEQ ID NO:25所示DNA片段。利用引物对pRSFDuet-1-(PRMH)5-CNB-F和pRSFDuet-1-(PRMH)5-CNB-R,以SEQID NO:25所示DNA片段为模板进行PCR扩增,获得重组载体pRSFDuet-1-(PRMH)5–CNB。
pRSFDuet-1-(PRMH)5-CNB-F:
ACTTTAATAAGGAGATATACCATGAAACATCATCATCATCA(SEQ ID NO:45)
pRSFDuet-1-(PRMH)5-CNB-R:
TTCTTTACCAGACTCGAGttaAGAGCTTACGGTAACCTG(SEQ ID NO:46)。
pRSFDuet-1-(PRMH)5-CNB能表达SEQ ID NO:26所示的融合蛋白,下文也称为重组蛋白(PRMH)5-CNB。
为了便于理解,SEQ ID NO:25中,第7-27位编码7×HisTag,第28-48位编码TEV,第79-504位编码(PRMH)5,第505-888位编码CNB。SEQ ID NO:25所示的DNA序列编码SEQ IDNO:26所示的蛋白质。SEQ ID NO:26中的第27-168位为(PRMH)5的氨基酸序列,第169-296位为CNB的氨基酸序列。序列26的第27-40位为1个PRMH基序的氨基酸序列。
(SH3)5-DNB表达载体:同样地合成SEQ ID NO:27所示DNA片段。利用引物对pRSFDuet-1-(SH3)5-DNB-F和pRSFDuet-1-(SH3)5-DNB-R,以所得DNA片段为模板进行PCR扩增,获得重组载体pRSFDuet-1-(SH3)5-DNB。
pRSFDuet-1-(SH3)5-DNB-F:
ACTTTAATAAGGAGATATACCATGAAACATCATCATCATCAT(SEQ ID NO:47)
pRSFDuet-1-(SH3)5-DNB-R:
TTCTTTACCAGACTCGAGttaAGAGCTTACGGTAACGAG(SEQ ID NO:48)。
pRSFDuet-1-(SH3)5-DNB能表达SEQ ID NO:28所示的融合蛋白,下文也称为重组蛋白(SH3)5-DNB。
为了便于理解,SEQ ID NO:27中,第7-27位编码7×HisTag,第28-48位编码TEV,第55-1284位编码(SH3)5,第1285-1650位编码DNB。SEQ ID NO:27所示的DNA分子编码SEQ IDNO:28所示的蛋白质。SEQ ID NO:28中的第19-428位为(SH3)5的氨基酸序列,第429-550位为DNB的氨基酸序列。SEQ ID NO:28的第19-81位为1个SH3基序的氨基酸序列。
2.蛋白质的表达纯化
利用上述“1、重组载体的构建”所得重组载体pRSFDuet-1-(PRMH)5-CNB和pRSFDuet-1-(SH3)5-DNB,表达目标重组蛋白。通过与实施例1相同的纯化方法,得到目标重组蛋白(PRMH)5-CNB和(SH3)5-DNB。
3.细胞的处理
根据生产商的说明,利用Alexa647(ThermoFisher,A20006)-Green标记上述“2、蛋白质的表达纯化”所得重组蛋白(SH3)5-DNB,将得到的被Alexa647-Green标记的重组蛋白记为(SH3)5-DNB(Green)。同样根据生产商的说明,利用Alexa594(ThermoFisher,A20004)-Red标记上述“2、蛋白质的表达纯化”所得重组蛋白(PRMH)5-CNB,将得到的被Alexa594-Red标记的重组蛋白记为(PRMH)5-CNB(Red)。
将重组蛋白(PRMH)5-CNB(Red)和(SH3)5-DNB(Green)添加至SJSA-1细胞的培养基(含有10%FBS和1%青链霉素的RMPI-1640培养基)中,至各自的终浓度均为100nM,混匀孵育1分钟后,通过与实施例1相同的方法,进行激光共聚焦扫描显微成像。结果示于图9A。
该结果显示,添加重组蛋白的组合之后,在细胞系SJSA-1的细胞膜上观察到相分离特征性的斑点(puncta),且表征(PRMH)5-CNB的绿色荧光信号和表征(SH3)5-DNB的红色荧光信号于所述斑点内共定位。
该结果与实施例1中使用(SIM)6-R4L(Red)和(SUM)5-TRAIL(Green)的组合时观察到的结果一致,表明改变所融合的多价结构域的种类没有影响融合蛋白介导相分离。
将重组蛋白以如下方式添加至SJSA-1细胞的培养基中,至各自的终浓度均为100nM,混匀孵育4小时后,通过与实施例3相同的流式细胞术,测定各组细胞的凋亡比例。结果示于图9B。
处理组1:阴性对照NC
处理组2:(PRMH)5-CNB(Red)
处理组3:(SH3)5-DNB(Green)
处理组4:(PRMH)5-CNB(Red)和(SH3)5-DNB(Green)的组合。
图9B显示,作为阴性对照的处理组1、单独添加重组蛋白(PRMH)5-CNB(Red)的处理组2和单独添加(SH3)5-DNB(Green)的处理组3,其细胞凋亡比例大致相同(分别为6.11%、6.26%和6.44%)。与之相对,同时添加(PRMH)5-CNB(Red)和(SH3)5-DNB(Green)的处理组4中,约58.4%的细胞发生凋亡,凋亡比例显著提高。这再次表明本发明的重组蛋白组合能够诱导细胞发生凋亡,且该效果并非依赖于特定的多价结构域。
实施例1~9的实验表明,将多价结构域与能够靶向特定细胞表面分子(如肿瘤抗原或膜受体)的配体(如抗体、细胞因子)连接而得到的重组融合蛋白能够形成具有协同作用的套件,在适于发生相分离的条件下,该套件的组件之间能够通过分子间相互作用,调节靶标蛋白的凝聚或寡聚化,进而实现对与该靶标蛋白相关的各种细胞事件的操控,例如增强或抑制细胞凋亡等。理论上,本发明的套件可以作为新型工具,调控与细胞表面分子相关的一切细胞内外事件,在疾病的诊断、治疗、分子检测、药物筛选等领域具有广泛的应用前景。并且,本领域技术人员可以理解,本发明的套件的上述技术效果并不限于本说明书实施例中所使用的特定多价结构域或特定配体的范围。
以上对本发明进行了详述。对于本领域技术人员来说,在不脱离本发明的宗旨和范围,以及无需进行不必要的实验情况下,可在等同参数、浓度和条件下,在较宽范围内实施本发明。虽然本发明给出了特殊的实施例,应该理解为,可以对本发明作进一步的改进。总之,按本发明的原理,本申请欲包括任何变更、用途或对本发明的改进,包括脱离了本申请中已公开范围,而用本领域已知的常规技术进行的改变。按以下附带的权利要求的范围,可以进行一些基本特征的应用。
序列表
<110> 清华大学
<120> 一种相变调节套件及其用途
<130> 待定
<141> 2022-06-12
<160> 54
<170> SIPOSequenceListing 1.0
<210> 1
<211> 738
<212> DNA
<213> 人工序列
<400> 1
atgaaacatc atcatcatca tcatcatgaa aacctgtatt ttcagggcgc catgagcagc 60
aaagtcgatg taattgactt aacgatcgaa tctagcagcg atgaagaaga agatccaccg 120
gctaaacgtg ggggctcagg gggttctggc ggttcaggcg gcagtaaagt tgacgtgatt 180
gacctcacca tcgaaagcag tagcgacgag gaagaagatc caccagcaaa acgcggaggg 240
agcgggggca gcggcggcag cggcggatct aaagtggacg ttatcgatct gacgatcgaa 300
agcagtagcg atgaggaaga ggacccgccg gcgaaacggg gcgccatgaa aggcggtagc 360
ggtggcagcg gtggtagcgg cggctccatg agcagcaaag tcgatgtaat tgacttaacg 420
atcgaatcta gcagcgatga agaagaagat ccaccggcta aacgtggggg ctcagtgggt 480
tctggcggtt caggcggcag taaagttgac gtgattgacc tcaccatcga aagcagtagc 540
gacgaggaag aagatccacc agcaaaacgc ggagggagcg ggggcagcgg cggcaggggc 600
ggatctaaag tggacgttat cgatctgacg atcgaaagca gtagcgatga ggaagaggac 660
ccgccggcga aacggggcgc catgaggtgc tggggcggta gcggtggcag cggtggtagc 720
ggcggctcca tggggtaa 738
<210> 2
<211> 245
<212> PRT
<213> 人工序列
<400> 2
Met Lys His His His His His His His Glu Asn Leu Tyr Phe Gln Gly
1 5 10 15
Ala Met Ser Ser Lys Val Asp Val Ile Asp Leu Thr Ile Glu Ser Ser
20 25 30
Ser Asp Glu Glu Glu Asp Pro Pro Ala Lys Arg Gly Gly Ser Gly Gly
35 40 45
Ser Gly Gly Ser Gly Gly Ser Lys Val Asp Val Ile Asp Leu Thr Ile
50 55 60
Glu Ser Ser Ser Asp Glu Glu Glu Asp Pro Pro Ala Lys Arg Gly Gly
65 70 75 80
Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Lys Val Asp Val Ile Asp
85 90 95
Leu Thr Ile Glu Ser Ser Ser Asp Glu Glu Glu Asp Pro Pro Ala Lys
100 105 110
Arg Gly Ala Met Lys Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly
115 120 125
Ser Met Ser Ser Lys Val Asp Val Ile Asp Leu Thr Ile Glu Ser Ser
130 135 140
Ser Asp Glu Glu Glu Asp Pro Pro Ala Lys Arg Gly Gly Ser Val Gly
145 150 155 160
Ser Gly Gly Ser Gly Gly Ser Lys Val Asp Val Ile Asp Leu Thr Ile
165 170 175
Glu Ser Ser Ser Asp Glu Glu Glu Asp Pro Pro Ala Lys Arg Gly Gly
180 185 190
Ser Gly Gly Ser Gly Gly Arg Gly Gly Ser Lys Val Asp Val Ile Asp
195 200 205
Leu Thr Ile Glu Ser Ser Ser Asp Glu Glu Glu Asp Pro Pro Ala Lys
210 215 220
Arg Gly Ala Met Arg Cys Trp Gly Gly Ser Gly Gly Ser Gly Gly Ser
225 230 235 240
Gly Gly Ser Met Gly
245
<210> 3
<211> 1656
<212> DNA
<213> 人工序列
<400> 3
atgaaacatc atcatcatca tcatcatgaa aacctgtatt ttcagggcga aaacctgtat 60
tttcagggcg ccatgagaat gtcagaagag aagcctaagg agggcgtgaa aaccgagaat 120
gaccacatta acttgaaggt tgctggacag gatgggtccg tggttcagtt caaaattaaa 180
cgccacacac cgttgtcgaa actgatgaaa gcgtactgcg aacgccaggg tctttctatg 240
cgtcagattc gcttccgctt tgatggtcaa ccgattaatg aaacggacac gccggcacag 300
ctggagatgg aggatgaaga cactatcgac gtatttcagc agcagaccgt cgtagggggc 360
tccggcggaa gcggggggtc gggaggttcc atgagcgaag agaaaccaaa agaaggagtt 420
aaaaccgaaa acgaccatat caacctgaag gtcgccggtc aggacggctc agtcgtgcag 480
ttcaagatta aacgtcatac cccattaagt aagctgatga aggcgtattg tgagcgccaa 540
ggcttgtcga tgcgccagat tcgttttcgc tttgatggtc agccaatcaa cgaaaccgac 600
accccggcgc agctggaaat ggaagatgaa gataccatcg atgtgttcca acagcaaacg 660
gttgttggcg gaagcggcgg gagcggtggt agcgggggtt ctatgtccga agaaaaaccg 720
aaagagggtg tgaagactga aaacgaccac attaatctga aggtggcggg ccaggacggt 780
tccgttgttc agtttaaaat caaacgtcac accccgctgt cgaaactgat gaaagcctat 840
tgcgaacgtc aagggctgag catgcgtcaa attcgttttc gctttgatgg tcagccaatc 900
aacgaaaccg atacaccggc gcagctggag atggaagacg aggacaccat tgacgtcttc 960
cagcaacaaa ctgtagtggg tggctccggt ggctctggtg ggtctggtgg ctcgatgagt 1020
gaggaaaaac ccaaagaagg cgtcaagact gagaacgatc atattaacct gaaagtcgcg 1080
ggtcaagatg gttcagtggt gcagttcaaa attaaacgcc acaccccgct gtcaaagctg 1140
atgaaagcct attgtgagcg tcaaggtctg tcgatgcgcc agatccgctt tcgctttgat 1200
ggtcagccaa tcaacgagac agacactccg gcacaactgg agatggaaga tgaagacacc 1260
atcgatgttt ttcaacagca gaccgtggtg ggagggagcg gcggtagcgg gggatcaggt 1320
ggtagtatgt ctgaggaaaa gccgaaggaa ggggtaaaga ccgaaaatga tcacattaat 1380
ctgaaagttg cgggccaaga tggtagtgta gtgcaattta aaatcaagcg tcacaccccg 1440
ttatctaaac tgatgaaagc atattgcgaa cgccaaggcc tgtctatgcg ccagattcgc 1500
tttcgctttg acgggcaacc aattaatgaa acggacaccc cggcacaact ggaaatggaa 1560
gacgaggata ctattgacgt gtttcagcaa cagacagtgg tcgccatgaa aggcggtagc 1620
ggtggcagcg gtggtagcgg cggctccatg ggctaa 1656
<210> 4
<211> 551
<212> PRT
<213> 人工序列
<400> 4
Met Lys His His His His His His His Glu Asn Leu Tyr Phe Gln Gly
1 5 10 15
Glu Asn Leu Tyr Phe Gln Gly Ala Met Arg Met Ser Glu Glu Lys Pro
20 25 30
Lys Glu Gly Val Lys Thr Glu Asn Asp His Ile Asn Leu Lys Val Ala
35 40 45
Gly Gln Asp Gly Ser Val Val Gln Phe Lys Ile Lys Arg His Thr Pro
50 55 60
Leu Ser Lys Leu Met Lys Ala Tyr Cys Glu Arg Gln Gly Leu Ser Met
65 70 75 80
Arg Gln Ile Arg Phe Arg Phe Asp Gly Gln Pro Ile Asn Glu Thr Asp
85 90 95
Thr Pro Ala Gln Leu Glu Met Glu Asp Glu Asp Thr Ile Asp Val Phe
100 105 110
Gln Gln Gln Thr Val Val Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly
115 120 125
Gly Ser Met Ser Glu Glu Lys Pro Lys Glu Gly Val Lys Thr Glu Asn
130 135 140
Asp His Ile Asn Leu Lys Val Ala Gly Gln Asp Gly Ser Val Val Gln
145 150 155 160
Phe Lys Ile Lys Arg His Thr Pro Leu Ser Lys Leu Met Lys Ala Tyr
165 170 175
Cys Glu Arg Gln Gly Leu Ser Met Arg Gln Ile Arg Phe Arg Phe Asp
180 185 190
Gly Gln Pro Ile Asn Glu Thr Asp Thr Pro Ala Gln Leu Glu Met Glu
195 200 205
Asp Glu Asp Thr Ile Asp Val Phe Gln Gln Gln Thr Val Val Gly Gly
210 215 220
Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Met Ser Glu Glu Lys Pro
225 230 235 240
Lys Glu Gly Val Lys Thr Glu Asn Asp His Ile Asn Leu Lys Val Ala
245 250 255
Gly Gln Asp Gly Ser Val Val Gln Phe Lys Ile Lys Arg His Thr Pro
260 265 270
Leu Ser Lys Leu Met Lys Ala Tyr Cys Glu Arg Gln Gly Leu Ser Met
275 280 285
Arg Gln Ile Arg Phe Arg Phe Asp Gly Gln Pro Ile Asn Glu Thr Asp
290 295 300
Thr Pro Ala Gln Leu Glu Met Glu Asp Glu Asp Thr Ile Asp Val Phe
305 310 315 320
Gln Gln Gln Thr Val Val Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly
325 330 335
Gly Ser Met Ser Glu Glu Lys Pro Lys Glu Gly Val Lys Thr Glu Asn
340 345 350
Asp His Ile Asn Leu Lys Val Ala Gly Gln Asp Gly Ser Val Val Gln
355 360 365
Phe Lys Ile Lys Arg His Thr Pro Leu Ser Lys Leu Met Lys Ala Tyr
370 375 380
Cys Glu Arg Gln Gly Leu Ser Met Arg Gln Ile Arg Phe Arg Phe Asp
385 390 395 400
Gly Gln Pro Ile Asn Glu Thr Asp Thr Pro Ala Gln Leu Glu Met Glu
405 410 415
Asp Glu Asp Thr Ile Asp Val Phe Gln Gln Gln Thr Val Val Gly Gly
420 425 430
Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Met Ser Glu Glu Lys Pro
435 440 445
Lys Glu Gly Val Lys Thr Glu Asn Asp His Ile Asn Leu Lys Val Ala
450 455 460
Gly Gln Asp Gly Ser Val Val Gln Phe Lys Ile Lys Arg His Thr Pro
465 470 475 480
Leu Ser Lys Leu Met Lys Ala Tyr Cys Glu Arg Gln Gly Leu Ser Met
485 490 495
Arg Gln Ile Arg Phe Arg Phe Asp Gly Gln Pro Ile Asn Glu Thr Asp
500 505 510
Thr Pro Ala Gln Leu Glu Met Glu Asp Glu Asp Thr Ile Asp Val Phe
515 520 525
Gln Gln Gln Thr Val Val Ala Met Lys Gly Gly Ser Gly Gly Ser Gly
530 535 540
Gly Ser Gly Gly Ser Met Gly
545 550
<210> 5
<211> 825
<212> DNA
<213> 人工序列
<400> 5
atgaaacatc atcatcatca tcatcatgaa aacctgtatt ttcagggcgc catgagcagc 60
aaagtcgatg taattgactt aacgatcgaa tctagcagcg atgaagaaga agatccaccg 120
gctaaacgtg ggggctcagg gggttctggc ggttcaggcg gcagtaaagt tgacgtgatt 180
gacctcacca tcgaaagcag tagcgacgag gaagaagatc caccagcaaa acgcggaggg 240
agcgggggca gcggcggcag cggcggatct aaagtggacg ttatcgatct gacgatcgaa 300
agcagtagcg atgaggaaga ggacccgccg gcgaaacggg gcgccatgaa aggcggtagc 360
ggtggcagcg gtggtagcgg cggctccatg agcagcaaag tcgatgtaat tgacttaacg 420
atcgaatcta gcagcgatga agaagaagat ccaccggcta aacgtggggg ctcagtgggt 480
tctggcggtt caggcggcag taaagttgac gtgattgacc tcaccatcga aagcagtagc 540
gacgaggaag aagatccacc agcaaaacgc ggagggagcg ggggcagcgg cggcaggggc 600
ggatctaaag tggacgttat cgatctgacg atcgaaagca gtagcgatga ggaagaggac 660
ccgccggcga aacggggcgc catgaggtgc tggggcggta gcggtggcag cggtggtagc 720
ggcggctcca tggggatgtg ctaccgtaaa tgccgtggtg gtcgtcgttg gtgctaccag 780
aaatgcggtg gttctggtgg ttctggtggt tctggtggtt cttaa 825
<210> 6
<211> 274
<212> PRT
<213> 人工序列
<400> 6
Met Lys His His His His His His His Glu Asn Leu Tyr Phe Gln Gly
1 5 10 15
Ala Met Ser Ser Lys Val Asp Val Ile Asp Leu Thr Ile Glu Ser Ser
20 25 30
Ser Asp Glu Glu Glu Asp Pro Pro Ala Lys Arg Gly Gly Ser Gly Gly
35 40 45
Ser Gly Gly Ser Gly Gly Ser Lys Val Asp Val Ile Asp Leu Thr Ile
50 55 60
Glu Ser Ser Ser Asp Glu Glu Glu Asp Pro Pro Ala Lys Arg Gly Gly
65 70 75 80
Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Lys Val Asp Val Ile Asp
85 90 95
Leu Thr Ile Glu Ser Ser Ser Asp Glu Glu Glu Asp Pro Pro Ala Lys
100 105 110
Arg Gly Ala Met Lys Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly
115 120 125
Ser Met Ser Ser Lys Val Asp Val Ile Asp Leu Thr Ile Glu Ser Ser
130 135 140
Ser Asp Glu Glu Glu Asp Pro Pro Ala Lys Arg Gly Gly Ser Val Gly
145 150 155 160
Ser Gly Gly Ser Gly Gly Ser Lys Val Asp Val Ile Asp Leu Thr Ile
165 170 175
Glu Ser Ser Ser Asp Glu Glu Glu Asp Pro Pro Ala Lys Arg Gly Gly
180 185 190
Ser Gly Gly Ser Gly Gly Arg Gly Gly Ser Lys Val Asp Val Ile Asp
195 200 205
Leu Thr Ile Glu Ser Ser Ser Asp Glu Glu Glu Asp Pro Pro Ala Lys
210 215 220
Arg Gly Ala Met Arg Cys Trp Gly Gly Ser Gly Gly Ser Gly Gly Ser
225 230 235 240
Gly Gly Ser Met Gly Met Cys Tyr Arg Lys Cys Arg Gly Gly Arg Arg
245 250 255
Trp Cys Tyr Gln Lys Cys Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly
260 265 270
Gly Ser
<210> 7
<211> 2160
<212> DNA
<213> 人工序列
<400> 7
atgaaacatc atcatcatca tcatcatgaa aacctgtatt ttcagggcga aaacctgtat 60
tttcagggcg ccatgagaat gtcagaagag aagcctaagg agggcgtgaa aaccgagaat 120
gaccacatta acttgaaggt tgctggacag gatgggtccg tggttcagtt caaaattaaa 180
cgccacacac cgttgtcgaa actgatgaaa gcgtactgcg aacgccaggg tctttctatg 240
cgtcagattc gcttccgctt tgatggtcaa ccgattaatg aaacggacac gccggcacag 300
ctggagatgg aggatgaaga cactatcgac gtatttcagc agcagaccgt cgtagggggc 360
tccggcggaa gcggggggtc gggaggttcc atgagcgaag agaaaccaaa agaaggagtt 420
aaaaccgaaa acgaccatat caacctgaag gtcgccggtc aggacggctc agtcgtgcag 480
ttcaagatta aacgtcatac cccattaagt aagctgatga aggcgtattg tgagcgccaa 540
ggcttgtcga tgcgccagat tcgttttcgc tttgatggtc agccaatcaa cgaaaccgac 600
accccggcgc agctggaaat ggaagatgaa gataccatcg atgtgttcca acagcaaacg 660
gttgttggcg gaagcggcgg gagcggtggt agcgggggtt ctatgtccga agaaaaaccg 720
aaagagggtg tgaagactga aaacgaccac attaatctga aggtggcggg ccaggacggt 780
tccgttgttc agtttaaaat caaacgtcac accccgctgt cgaaactgat gaaagcctat 840
tgcgaacgtc aagggctgag catgcgtcaa attcgttttc gctttgatgg tcagccaatc 900
aacgaaaccg atacaccggc gcagctggag atggaagacg aggacaccat tgacgtcttc 960
cagcaacaaa ctgtagtggg tggctccggt ggctctggtg ggtctggtgg ctcgatgagt 1020
gaggaaaaac ccaaagaagg cgtcaagact gagaacgatc atattaacct gaaagtcgcg 1080
ggtcaagatg gttcagtggt gcagttcaaa attaaacgcc acaccccgct gtcaaagctg 1140
atgaaagcct attgtgagcg tcaaggtctg tcgatgcgcc agatccgctt tcgctttgat 1200
ggtcagccaa tcaacgagac agacactccg gcacaactgg agatggaaga tgaagacacc 1260
atcgatgttt ttcaacagca gaccgtggtg ggagggagcg gcggtagcgg gggatcaggt 1320
ggtagtatgt ctgaggaaaa gccgaaggaa ggggtaaaga ccgaaaatga tcacattaat 1380
ctgaaagttg cgggccaaga tggtagtgta gtgcaattta aaatcaagcg tcacaccccg 1440
ttatctaaac tgatgaaagc atattgcgaa cgccaaggcc tgtctatgcg ccagattcgc 1500
tttcgctttg acgggcaacc aattaatgaa acggacaccc cggcacaact ggaaatggaa 1560
gacgaggata ctattgacgt gtttcagcaa cagacagtgg tcgccatgaa aggcggtagc 1620
ggtggcagcg gtggtagcgg cggctccatg ggcgttcgtg aacgtggtcc gcagcgtgtt 1680
gctgctcaca tcaccggtac ccgtggtcgt tctaacaccc tgtcttctcc gaactctaaa 1740
aacgaaaaag ctctgggtcg taaaatcaac tcttgggaat cttctcgttc tggtcactct 1800
ttcctgtcta acctgcacct gcgtaacggt gaactggtta tccacgaaaa aggtttctac 1860
tacatctact ctcagaccta cttccgtttc caggaagaaa tcaaagaaaa caccaaaaac 1920
gacaaacaga tggttcagta catctacaaa tacacctctt acccggaccc gatcctgctg 1980
atgaaatctg ctcgtaactc ttgctggtct aaagacgctg aatacggtct gtactctatc 2040
taccagggtg gtatcttcga actgaaagaa aacgaccgta tcttcgtttc tgttaccaac 2100
gaacacctga tcgacatgga ccacgaagct tctttttttg gtgcgttcct ggttggctaa 2160
<210> 8
<211> 719
<212> PRT
<213> 人工序列
<400> 8
Met Lys His His His His His His His Glu Asn Leu Tyr Phe Gln Gly
1 5 10 15
Glu Asn Leu Tyr Phe Gln Gly Ala Met Arg Met Ser Glu Glu Lys Pro
20 25 30
Lys Glu Gly Val Lys Thr Glu Asn Asp His Ile Asn Leu Lys Val Ala
35 40 45
Gly Gln Asp Gly Ser Val Val Gln Phe Lys Ile Lys Arg His Thr Pro
50 55 60
Leu Ser Lys Leu Met Lys Ala Tyr Cys Glu Arg Gln Gly Leu Ser Met
65 70 75 80
Arg Gln Ile Arg Phe Arg Phe Asp Gly Gln Pro Ile Asn Glu Thr Asp
85 90 95
Thr Pro Ala Gln Leu Glu Met Glu Asp Glu Asp Thr Ile Asp Val Phe
100 105 110
Gln Gln Gln Thr Val Val Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly
115 120 125
Gly Ser Met Ser Glu Glu Lys Pro Lys Glu Gly Val Lys Thr Glu Asn
130 135 140
Asp His Ile Asn Leu Lys Val Ala Gly Gln Asp Gly Ser Val Val Gln
145 150 155 160
Phe Lys Ile Lys Arg His Thr Pro Leu Ser Lys Leu Met Lys Ala Tyr
165 170 175
Cys Glu Arg Gln Gly Leu Ser Met Arg Gln Ile Arg Phe Arg Phe Asp
180 185 190
Gly Gln Pro Ile Asn Glu Thr Asp Thr Pro Ala Gln Leu Glu Met Glu
195 200 205
Asp Glu Asp Thr Ile Asp Val Phe Gln Gln Gln Thr Val Val Gly Gly
210 215 220
Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Met Ser Glu Glu Lys Pro
225 230 235 240
Lys Glu Gly Val Lys Thr Glu Asn Asp His Ile Asn Leu Lys Val Ala
245 250 255
Gly Gln Asp Gly Ser Val Val Gln Phe Lys Ile Lys Arg His Thr Pro
260 265 270
Leu Ser Lys Leu Met Lys Ala Tyr Cys Glu Arg Gln Gly Leu Ser Met
275 280 285
Arg Gln Ile Arg Phe Arg Phe Asp Gly Gln Pro Ile Asn Glu Thr Asp
290 295 300
Thr Pro Ala Gln Leu Glu Met Glu Asp Glu Asp Thr Ile Asp Val Phe
305 310 315 320
Gln Gln Gln Thr Val Val Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly
325 330 335
Gly Ser Met Ser Glu Glu Lys Pro Lys Glu Gly Val Lys Thr Glu Asn
340 345 350
Asp His Ile Asn Leu Lys Val Ala Gly Gln Asp Gly Ser Val Val Gln
355 360 365
Phe Lys Ile Lys Arg His Thr Pro Leu Ser Lys Leu Met Lys Ala Tyr
370 375 380
Cys Glu Arg Gln Gly Leu Ser Met Arg Gln Ile Arg Phe Arg Phe Asp
385 390 395 400
Gly Gln Pro Ile Asn Glu Thr Asp Thr Pro Ala Gln Leu Glu Met Glu
405 410 415
Asp Glu Asp Thr Ile Asp Val Phe Gln Gln Gln Thr Val Val Gly Gly
420 425 430
Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Met Ser Glu Glu Lys Pro
435 440 445
Lys Glu Gly Val Lys Thr Glu Asn Asp His Ile Asn Leu Lys Val Ala
450 455 460
Gly Gln Asp Gly Ser Val Val Gln Phe Lys Ile Lys Arg His Thr Pro
465 470 475 480
Leu Ser Lys Leu Met Lys Ala Tyr Cys Glu Arg Gln Gly Leu Ser Met
485 490 495
Arg Gln Ile Arg Phe Arg Phe Asp Gly Gln Pro Ile Asn Glu Thr Asp
500 505 510
Thr Pro Ala Gln Leu Glu Met Glu Asp Glu Asp Thr Ile Asp Val Phe
515 520 525
Gln Gln Gln Thr Val Val Ala Met Lys Gly Gly Ser Gly Gly Ser Gly
530 535 540
Gly Ser Gly Gly Ser Met Gly Val Arg Glu Arg Gly Pro Gln Arg Val
545 550 555 560
Ala Ala His Ile Thr Gly Thr Arg Gly Arg Ser Asn Thr Leu Ser Ser
565 570 575
Pro Asn Ser Lys Asn Glu Lys Ala Leu Gly Arg Lys Ile Asn Ser Trp
580 585 590
Glu Ser Ser Arg Ser Gly His Ser Phe Leu Ser Asn Leu His Leu Arg
595 600 605
Asn Gly Glu Leu Val Ile His Glu Lys Gly Phe Tyr Tyr Ile Tyr Ser
610 615 620
Gln Thr Tyr Phe Arg Phe Gln Glu Glu Ile Lys Glu Asn Thr Lys Asn
625 630 635 640
Asp Lys Gln Met Val Gln Tyr Ile Tyr Lys Tyr Thr Ser Tyr Pro Asp
645 650 655
Pro Ile Leu Leu Met Lys Ser Ala Arg Asn Ser Cys Trp Ser Lys Asp
660 665 670
Ala Glu Tyr Gly Leu Tyr Ser Ile Tyr Gln Gly Gly Ile Phe Glu Leu
675 680 685
Lys Glu Asn Asp Arg Ile Phe Val Ser Val Thr Asn Glu His Leu Ile
690 695 700
Asp Met Asp His Glu Ala Ser Phe Phe Gly Ala Phe Leu Val Gly
705 710 715
<210> 9
<211> 1122
<212> DNA
<213> 人工序列
<400> 9
atgaaacatc atcatcatca tcatcatgaa aacctgtatt ttcagggcgc catgagcagc 60
aaagtcgatg taattgactt aacgatcgaa tctagcagcg atgaagaaga agatccaccg 120
gctaaacgtg ggggctcagg gggttctggc ggttcaggcg gcagtaaagt tgacgtgatt 180
gacctcacca tcgaaagcag tagcgacgag gaagaagatc caccagcaaa acgcggaggg 240
agcgggggca gcggcggcag cggcggatct aaagtggacg ttatcgatct gacgatcgaa 300
agcagtagcg atgaggaaga ggacccgccg gcgaaacggg gcgccatgaa aggcggtagc 360
ggtggcagcg gtggtagcgg cggctccatg agcagcaaag tcgatgtaat tgacttaacg 420
atcgaatcta gcagcgatga agaagaagat ccaccggcta aacgtggggg ctcagtgggt 480
tctggcggtt caggcggcag taaagttgac gtgattgacc tcaccatcga aagcagtagc 540
gacgaggaag aagatccacc agcaaaacgc ggagggagcg ggggcagcgg cggcaggggc 600
ggatctaaag tggacgttat cgatctgacg atcgaaagca gtagcgatga ggaagaggac 660
ccgccggcga aacggggcgc catgaggtgc tggggcggta gcggtggcag cggtggtagc 720
ggcggctcca tgggggaagt tcagctgatg gaatctggtg gtggtctggt tcaggctggt 780
ggttctctgc gtctgtcttg cgctgcttct ggtcgtacct tcaacaacta cgctatgggt 840
tggttccgtc gtgctccgaa aggtgaacgt gaattcgttg ctgctatcac ccgttctggt 900
gttcgttctg gtgtttctgc tatctacggt gactctgtta aagaccgttt caccatctct 960
cgtgacaacg ctaaaaacac cctgtacctg cagatgaact ctctgaaacc ggaagacacc 1020
gctgtttaca cctgcgctgc ttctgctatc ggttctggtg cgctccgtag gttcgaatac 1080
gactactctg gtcagggtac tcaggttacc gtaagctctt aa 1122
<210> 10
<211> 373
<212> PRT
<213> 人工序列
<400> 10
Met Lys His His His His His His His Glu Asn Leu Tyr Phe Gln Gly
1 5 10 15
Ala Met Ser Ser Lys Val Asp Val Ile Asp Leu Thr Ile Glu Ser Ser
20 25 30
Ser Asp Glu Glu Glu Asp Pro Pro Ala Lys Arg Gly Gly Ser Gly Gly
35 40 45
Ser Gly Gly Ser Gly Gly Ser Lys Val Asp Val Ile Asp Leu Thr Ile
50 55 60
Glu Ser Ser Ser Asp Glu Glu Glu Asp Pro Pro Ala Lys Arg Gly Gly
65 70 75 80
Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Lys Val Asp Val Ile Asp
85 90 95
Leu Thr Ile Glu Ser Ser Ser Asp Glu Glu Glu Asp Pro Pro Ala Lys
100 105 110
Arg Gly Ala Met Lys Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly
115 120 125
Ser Met Ser Ser Lys Val Asp Val Ile Asp Leu Thr Ile Glu Ser Ser
130 135 140
Ser Asp Glu Glu Glu Asp Pro Pro Ala Lys Arg Gly Gly Ser Val Gly
145 150 155 160
Ser Gly Gly Ser Gly Gly Ser Lys Val Asp Val Ile Asp Leu Thr Ile
165 170 175
Glu Ser Ser Ser Asp Glu Glu Glu Asp Pro Pro Ala Lys Arg Gly Gly
180 185 190
Ser Gly Gly Ser Gly Gly Arg Gly Gly Ser Lys Val Asp Val Ile Asp
195 200 205
Leu Thr Ile Glu Ser Ser Ser Asp Glu Glu Glu Asp Pro Pro Ala Lys
210 215 220
Arg Gly Ala Met Arg Cys Trp Gly Gly Ser Gly Gly Ser Gly Gly Ser
225 230 235 240
Gly Gly Ser Met Gly Glu Val Gln Leu Met Glu Ser Gly Gly Gly Leu
245 250 255
Val Gln Ala Gly Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg
260 265 270
Thr Phe Asn Asn Tyr Ala Met Gly Trp Phe Arg Arg Ala Pro Lys Gly
275 280 285
Glu Arg Glu Phe Val Ala Ala Ile Thr Arg Ser Gly Val Arg Ser Gly
290 295 300
Val Ser Ala Ile Tyr Gly Asp Ser Val Lys Asp Arg Phe Thr Ile Ser
305 310 315 320
Arg Asp Asn Ala Lys Asn Thr Leu Tyr Leu Gln Met Asn Ser Leu Lys
325 330 335
Pro Glu Asp Thr Ala Val Tyr Thr Cys Ala Ala Ser Ala Ile Gly Ser
340 345 350
Gly Ala Leu Arg Arg Phe Glu Tyr Asp Tyr Ser Gly Gln Gly Thr Gln
355 360 365
Val Thr Val Ser Ser
370
<210> 11
<211> 2022
<212> DNA
<213> 人工序列
<400> 11
atgaaacatc atcatcatca tcatcatgaa aacctgtatt ttcagggcga aaacctgtat 60
tttcagggcg ccatgagaat gtcagaagag aagcctaagg agggcgtgaa aaccgagaat 120
gaccacatta acttgaaggt tgctggacag gatgggtccg tggttcagtt caaaattaaa 180
cgccacacac cgttgtcgaa actgatgaaa gcgtactgcg aacgccaggg tctttctatg 240
cgtcagattc gcttccgctt tgatggtcaa ccgattaatg aaacggacac gccggcacag 300
ctggagatgg aggatgaaga cactatcgac gtatttcagc agcagaccgt cgtagggggc 360
tccggcggaa gcggggggtc gggaggttcc atgagcgaag agaaaccaaa agaaggagtt 420
aaaaccgaaa acgaccatat caacctgaag gtcgccggtc aggacggctc agtcgtgcag 480
ttcaagatta aacgtcatac cccattaagt aagctgatga aggcgtattg tgagcgccaa 540
ggcttgtcga tgcgccagat tcgttttcgc tttgatggtc agccaatcaa cgaaaccgac 600
accccggcgc agctggaaat ggaagatgaa gataccatcg atgtgttcca acagcaaacg 660
gttgttggcg gaagcggcgg gagcggtggt agcgggggtt ctatgtccga agaaaaaccg 720
aaagagggtg tgaagactga aaacgaccac attaatctga aggtggcggg ccaggacggt 780
tccgttgttc agtttaaaat caaacgtcac accccgctgt cgaaactgat gaaagcctat 840
tgcgaacgtc aagggctgag catgcgtcaa attcgttttc gctttgatgg tcagccaatc 900
aacgaaaccg atacaccggc gcagctggag atggaagacg aggacaccat tgacgtcttc 960
cagcaacaaa ctgtagtggg tggctccggt ggctctggtg ggtctggtgg ctcgatgagt 1020
gaggaaaaac ccaaagaagg cgtcaagact gagaacgatc atattaacct gaaagtcgcg 1080
ggtcaagatg gttcagtggt gcagttcaaa attaaacgcc acaccccgct gtcaaagctg 1140
atgaaagcct attgtgagcg tcaaggtctg tcgatgcgcc agatccgctt tcgctttgat 1200
ggtcagccaa tcaacgagac agacactccg gcacaactgg agatggaaga tgaagacacc 1260
atcgatgttt ttcaacagca gaccgtggtg ggagggagcg gcggtagcgg gggatcaggt 1320
ggtagtatgt ctgaggaaaa gccgaaggaa ggggtaaaga ccgaaaatga tcacattaat 1380
ctgaaagttg cgggccaaga tggtagtgta gtgcaattta aaatcaagcg tcacaccccg 1440
ttatctaaac tgatgaaagc atattgcgaa cgccaaggcc tgtctatgcg ccagattcgc 1500
tttcgctttg acgggcaacc aattaatgaa acggacaccc cggcacaact ggaaatggaa 1560
gacgaggata ctattgacgt gtttcagcaa cagacagtgg tcgccatgaa aggcggtagc 1620
ggtggcagcg gtggtagcgg cggctccatg ggcgaagttc agctgctgga atctggtggt 1680
ggtctggttc agccgggtgg ttctctgcgt ctgtcttgcg ctgcttctgg taccttcgac 1740
aaaatcaaca acatgggttg gtaccgtcag gctccgggta aacagcgtga cctggttgct 1800
cagatcaccc cgggtggtat caccgactac gctgactctg ttaaaggtcg tttcaccatc 1860
tctcgtgaca actctaaaaa caccctgtac ctgcagatga actctctgcg tccggaagac 1920
accgctgttt actactgcaa cgctgaaatc ctgaaacgtg cttacatcga cgtttacgtt 1980
aactactggg gtcagggtac tctcgttacc gtaagctctt aa 2022
<210> 12
<211> 673
<212> PRT
<213> 人工序列
<400> 12
Met Lys His His His His His His His Glu Asn Leu Tyr Phe Gln Gly
1 5 10 15
Glu Asn Leu Tyr Phe Gln Gly Ala Met Arg Met Ser Glu Glu Lys Pro
20 25 30
Lys Glu Gly Val Lys Thr Glu Asn Asp His Ile Asn Leu Lys Val Ala
35 40 45
Gly Gln Asp Gly Ser Val Val Gln Phe Lys Ile Lys Arg His Thr Pro
50 55 60
Leu Ser Lys Leu Met Lys Ala Tyr Cys Glu Arg Gln Gly Leu Ser Met
65 70 75 80
Arg Gln Ile Arg Phe Arg Phe Asp Gly Gln Pro Ile Asn Glu Thr Asp
85 90 95
Thr Pro Ala Gln Leu Glu Met Glu Asp Glu Asp Thr Ile Asp Val Phe
100 105 110
Gln Gln Gln Thr Val Val Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly
115 120 125
Gly Ser Met Ser Glu Glu Lys Pro Lys Glu Gly Val Lys Thr Glu Asn
130 135 140
Asp His Ile Asn Leu Lys Val Ala Gly Gln Asp Gly Ser Val Val Gln
145 150 155 160
Phe Lys Ile Lys Arg His Thr Pro Leu Ser Lys Leu Met Lys Ala Tyr
165 170 175
Cys Glu Arg Gln Gly Leu Ser Met Arg Gln Ile Arg Phe Arg Phe Asp
180 185 190
Gly Gln Pro Ile Asn Glu Thr Asp Thr Pro Ala Gln Leu Glu Met Glu
195 200 205
Asp Glu Asp Thr Ile Asp Val Phe Gln Gln Gln Thr Val Val Gly Gly
210 215 220
Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Met Ser Glu Glu Lys Pro
225 230 235 240
Lys Glu Gly Val Lys Thr Glu Asn Asp His Ile Asn Leu Lys Val Ala
245 250 255
Gly Gln Asp Gly Ser Val Val Gln Phe Lys Ile Lys Arg His Thr Pro
260 265 270
Leu Ser Lys Leu Met Lys Ala Tyr Cys Glu Arg Gln Gly Leu Ser Met
275 280 285
Arg Gln Ile Arg Phe Arg Phe Asp Gly Gln Pro Ile Asn Glu Thr Asp
290 295 300
Thr Pro Ala Gln Leu Glu Met Glu Asp Glu Asp Thr Ile Asp Val Phe
305 310 315 320
Gln Gln Gln Thr Val Val Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly
325 330 335
Gly Ser Met Ser Glu Glu Lys Pro Lys Glu Gly Val Lys Thr Glu Asn
340 345 350
Asp His Ile Asn Leu Lys Val Ala Gly Gln Asp Gly Ser Val Val Gln
355 360 365
Phe Lys Ile Lys Arg His Thr Pro Leu Ser Lys Leu Met Lys Ala Tyr
370 375 380
Cys Glu Arg Gln Gly Leu Ser Met Arg Gln Ile Arg Phe Arg Phe Asp
385 390 395 400
Gly Gln Pro Ile Asn Glu Thr Asp Thr Pro Ala Gln Leu Glu Met Glu
405 410 415
Asp Glu Asp Thr Ile Asp Val Phe Gln Gln Gln Thr Val Val Gly Gly
420 425 430
Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Met Ser Glu Glu Lys Pro
435 440 445
Lys Glu Gly Val Lys Thr Glu Asn Asp His Ile Asn Leu Lys Val Ala
450 455 460
Gly Gln Asp Gly Ser Val Val Gln Phe Lys Ile Lys Arg His Thr Pro
465 470 475 480
Leu Ser Lys Leu Met Lys Ala Tyr Cys Glu Arg Gln Gly Leu Ser Met
485 490 495
Arg Gln Ile Arg Phe Arg Phe Asp Gly Gln Pro Ile Asn Glu Thr Asp
500 505 510
Thr Pro Ala Gln Leu Glu Met Glu Asp Glu Asp Thr Ile Asp Val Phe
515 520 525
Gln Gln Gln Thr Val Val Ala Met Lys Gly Gly Ser Gly Gly Ser Gly
530 535 540
Gly Ser Gly Gly Ser Met Gly Glu Val Gln Leu Leu Glu Ser Gly Gly
545 550 555 560
Gly Leu Val Gln Pro Gly Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser
565 570 575
Gly Thr Phe Asp Lys Ile Asn Asn Met Gly Trp Tyr Arg Gln Ala Pro
580 585 590
Gly Lys Gln Arg Asp Leu Val Ala Gln Ile Thr Pro Gly Gly Ile Thr
595 600 605
Asp Tyr Ala Asp Ser Val Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn
610 615 620
Ser Lys Asn Thr Leu Tyr Leu Gln Met Asn Ser Leu Arg Pro Glu Asp
625 630 635 640
Thr Ala Val Tyr Tyr Cys Asn Ala Glu Ile Leu Lys Arg Ala Tyr Ile
645 650 655
Asp Val Tyr Val Asn Tyr Trp Gly Gln Gly Thr Leu Val Thr Val Ser
660 665 670
Ser
<210> 13
<211> 447
<212> DNA
<213> 人工序列
<400> 13
atgaaacatc atcatcatca tcatcatgaa aacctgtatt ttcagggcgc catgagcagc 60
gaagttcagc tgatggaatc tggtggtggt ctggttcagg ctggtggttc tctgcgtctg 120
tcttgcgctg cttctggtcg taccttcaac aactacgcta tgggttggtt ccgtcgtgct 180
ccgaaaggtg aacgtgaatt cgttgctgct atcacccgtt ctggtgttcg ttctggtgtt 240
tctgctatct acggtgactc tgttaaagac cgtttcacca tctctcgtga caacgctaaa 300
aacaccctgt acctgcagat gaactctctg aaaccggaag acaccgctgt ttacacctgc 360
gctgcttctg ctatcggttc tggtgcgctc cgtaggttcg aatacgacta ctctggtcag 420
ggtactcagg ttaccgtaag ctcttaa 447
<210> 14
<211> 148
<212> PRT
<213> 人工序列
<400> 14
Met Lys His His His His His His His Glu Asn Leu Tyr Phe Gln Gly
1 5 10 15
Ala Met Ser Ser Glu Val Gln Leu Met Glu Ser Gly Gly Gly Leu Val
20 25 30
Gln Ala Gly Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr
35 40 45
Phe Asn Asn Tyr Ala Met Gly Trp Phe Arg Arg Ala Pro Lys Gly Glu
50 55 60
Arg Glu Phe Val Ala Ala Ile Thr Arg Ser Gly Val Arg Ser Gly Val
65 70 75 80
Ser Ala Ile Tyr Gly Asp Ser Val Lys Asp Arg Phe Thr Ile Ser Arg
85 90 95
Asp Asn Ala Lys Asn Thr Leu Tyr Leu Gln Met Asn Ser Leu Lys Pro
100 105 110
Glu Asp Thr Ala Val Tyr Thr Cys Ala Ala Ser Ala Ile Gly Ser Gly
115 120 125
Ala Leu Arg Arg Phe Glu Tyr Asp Tyr Ser Gly Gln Gly Thr Gln Val
130 135 140
Thr Val Ser Ser
145
<210> 15
<211> 447
<212> DNA
<213> 人工序列
<400> 15
atgaaacatc atcatcatca tcatcatgaa aacctgtatt ttcagggcga aaacctgtat 60
tttcagggcg ccatgagaga agttcagctg ctggaatctg gtggtggtct ggttcagccg 120
ggtggttctc tgcgtctgtc ttgcgctgct tctggtacct tcgacaaaat caacaacatg 180
ggttggtacc gtcaggctcc gggtaaacag cgtgacctgg ttgctcagat caccccgggt 240
ggtatcaccg actacgctga ctctgttaaa ggtcgtttca ccatctctcg tgacaactct 300
aaaaacaccc tgtacctgca gatgaactct ctgcgtccgg aagacaccgc tgtttactac 360
tgcaacgctg aaatcctgaa acgtgcttac atcgacgttt acgttaacta ctggggtcag 420
ggtactctcg ttaccgtaag ctcttaa 447
<210> 16
<211> 148
<212> PRT
<213> 人工序列
<400> 16
Met Lys His His His His His His His Glu Asn Leu Tyr Phe Gln Gly
1 5 10 15
Glu Asn Leu Tyr Phe Gln Gly Ala Met Arg Glu Val Gln Leu Leu Glu
20 25 30
Ser Gly Gly Gly Leu Val Gln Pro Gly Gly Ser Leu Arg Leu Ser Cys
35 40 45
Ala Ala Ser Gly Thr Phe Asp Lys Ile Asn Asn Met Gly Trp Tyr Arg
50 55 60
Gln Ala Pro Gly Lys Gln Arg Asp Leu Val Ala Gln Ile Thr Pro Gly
65 70 75 80
Gly Ile Thr Asp Tyr Ala Asp Ser Val Lys Gly Arg Phe Thr Ile Ser
85 90 95
Arg Asp Asn Ser Lys Asn Thr Leu Tyr Leu Gln Met Asn Ser Leu Arg
100 105 110
Pro Glu Asp Thr Ala Val Tyr Tyr Cys Asn Ala Glu Ile Leu Lys Arg
115 120 125
Ala Tyr Ile Asp Val Tyr Val Asn Tyr Trp Gly Gln Gly Thr Leu Val
130 135 140
Thr Val Ser Ser
145
<210> 17
<211> 774
<212> DNA
<213> 人工序列
<400> 17
atgaaacatc atcatcatca tcatcatgaa aacctgtatt ttcagggcgc catgaaagtg 60
gacgttatcg atctgacgat cgaaagcagt agcgatgagg aagaggaccc gccggcgaaa 120
cggggaggga gcgggggcag cggcggcagc ggcggatcca tgatgaaagt ggacgttatc 180
gatctgacga tcgaaagcag tagcgatgag gaagaggacc cgccggcgaa acggggaggg 240
agcgggggca gcggcggcag cggcggatcc atgatgaaag tggacgttat cgatctgacg 300
atcgaaagca gtagcgatga ggaagaggac ccgccggcga aacggggagg gagcgggggc 360
agcggcggca gcggcggatc catgggggaa gttcagctga tggaatctgg tggtggtctg 420
gttcaggctg gtggttctct gcgtctgtct tgcgctgctt ctggtcgtac cttcaacaac 480
tacgctatgg gttggttccg tcgtgctccg aaaggtgaac gtgaattcgt tgctgctatc 540
acccgttctg gtgttcgttc tggtgtttct gctatctacg gtgactctgt taaagaccgt 600
ttcaccatct ctcgtgacaa cgctaaaaac accctgtacc tgcagatgaa ctctctgaaa 660
ccggaagaca ccgctgttta cacctgcgct gcttctgcta tcggttctgg tgcgctccgt 720
aggttcgaat acgactactc tggtcagggt actcaggtta ccgtaagctc ttaa 774
<210> 18
<211> 257
<212> PRT
<213> 人工序列
<400> 18
Met Lys His His His His His His His Glu Asn Leu Tyr Phe Gln Gly
1 5 10 15
Ala Met Lys Val Asp Val Ile Asp Leu Thr Ile Glu Ser Ser Ser Asp
20 25 30
Glu Glu Glu Asp Pro Pro Ala Lys Arg Gly Gly Ser Gly Gly Ser Gly
35 40 45
Gly Ser Gly Gly Ser Met Met Lys Val Asp Val Ile Asp Leu Thr Ile
50 55 60
Glu Ser Ser Ser Asp Glu Glu Glu Asp Pro Pro Ala Lys Arg Gly Gly
65 70 75 80
Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Met Met Lys Val Asp Val
85 90 95
Ile Asp Leu Thr Ile Glu Ser Ser Ser Asp Glu Glu Glu Asp Pro Pro
100 105 110
Ala Lys Arg Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Met
115 120 125
Gly Glu Val Gln Leu Met Glu Ser Gly Gly Gly Leu Val Gln Ala Gly
130 135 140
Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Asn Asn
145 150 155 160
Tyr Ala Met Gly Trp Phe Arg Arg Ala Pro Lys Gly Glu Arg Glu Phe
165 170 175
Val Ala Ala Ile Thr Arg Ser Gly Val Arg Ser Gly Val Ser Ala Ile
180 185 190
Tyr Gly Asp Ser Val Lys Asp Arg Phe Thr Ile Ser Arg Asp Asn Ala
195 200 205
Lys Asn Thr Leu Tyr Leu Gln Met Asn Ser Leu Lys Pro Glu Asp Thr
210 215 220
Ala Val Tyr Thr Cys Ala Ala Ser Ala Ile Gly Ser Gly Ala Leu Arg
225 230 235 240
Arg Phe Glu Tyr Asp Tyr Ser Gly Gln Gly Thr Gln Val Thr Val Ser
245 250 255
Ser
<210> 19
<211> 1373
<212> DNA
<213> 人工序列
<400> 19
atgaaacatc atcatcatca tcatcatgaa aacctgtatt ttcagggcgc catgatgtca 60
gaagagaagc ctaaggaggg cgtgaaaacc gagaatgacc acattaactt gaaggttgct 120
ggacaggatg ggtccgtggt tcagttcaaa attaaacgcc acaccccgct gtcaaagctg 180
atgaaagcct attgtgagcg tcaaggtctg tcgatgcgcc agatccgctt tcgctttgat 240
ggtcagccaa tcaacgagac agacactccg gcacaactgg agatggaaga tgaagacacc 300
atcgatgttt ttcaacagca gaccgtggtg ggagggagcg gcggtagcgg gggatcaggt 360
ggtagtccaa tgtcagaaga gaagcctaag gagggcgtga aaaccgagaa tgaccacatt 420
aacttgaagg ttgctggaca ggatgggtcc gtggttcagt tcaaaattaa acgccacacc 480
ccgctgtcaa agctgatgaa agcctattgt gagcgtcaag gtctgtcgat gcgccagatc 540
cgctttcgct ttgatggtca gccaatcaac gagacagaca ctccggcaca actggagatg 600
gaagatgaag acaccatcga tgtttttcaa cagcagaccg tggtgggagg gagcggcggt 660
agcgggggat caggtggtag tccaatgtca gaagagaagc ctaaggaggg cgtgaaaacc 720
gagaatgacc acattaactt gaaggttgct ggacaggatg ggtccgtggt tcagttcaaa 780
attaaacgcc acaccccgct gtcaaagctg atgaaagcat attgcgaacg ccaaggcctg 840
tctatgcgcc agattcgctt tcgctttgat ggtcagccaa tcaacgagac agacactccg 900
gcacaactgg agatggaaga tgaagacacc atcgatgttt ttcaacagca gaccgtggtg 960
ggagggagcg gcggtagcgg gggatcaggt ggtagtgcca tggggaagtt cagctgctgg 1020
aatctggtgg tggtctggtt cagccgggtg gttctctgcg tctgtcttgc gctgcttctg 1080
gtaccttcga caaaatcaac aacatgggtt ggtaccgtca ggctccgggt aaacagcgtg 1140
acctggttgc tcagatcacc ccgggtggta tcaccgacta cgctgactct gttaaaggtc 1200
gtttcaccat ctctcgtgac aactctaaaa acaccctgta cctgcagatg aactctctgc 1260
gtccggaaga caccgctgtt tactactgca acgctgaaat cctgaaacgt gcttacatcg 1320
acgtttacgt taactactgg ggtcagggta ctctcgttac cgtaagctct taa 1373
<210> 20
<211> 457
<212> PRT
<213> 人工序列
<400> 20
Met Lys His His His His His His His Glu Asn Leu Tyr Phe Gln Gly
1 5 10 15
Ala Met Met Ser Glu Glu Lys Pro Lys Glu Gly Val Lys Thr Glu Asn
20 25 30
Asp His Ile Asn Leu Lys Val Ala Gly Gln Asp Gly Ser Val Val Gln
35 40 45
Phe Lys Ile Lys Arg His Thr Pro Leu Ser Lys Leu Met Lys Ala Tyr
50 55 60
Cys Glu Arg Gln Gly Leu Ser Met Arg Gln Ile Arg Phe Arg Phe Asp
65 70 75 80
Gly Gln Pro Ile Asn Glu Thr Asp Thr Pro Ala Gln Leu Glu Met Glu
85 90 95
Asp Glu Asp Thr Ile Asp Val Phe Gln Gln Gln Thr Val Val Gly Gly
100 105 110
Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Pro Met Ser Glu Glu Lys
115 120 125
Pro Lys Glu Gly Val Lys Thr Glu Asn Asp His Ile Asn Leu Lys Val
130 135 140
Ala Gly Gln Asp Gly Ser Val Val Gln Phe Lys Ile Lys Arg His Thr
145 150 155 160
Pro Leu Ser Lys Leu Met Lys Ala Tyr Cys Glu Arg Gln Gly Leu Ser
165 170 175
Met Arg Gln Ile Arg Phe Arg Phe Asp Gly Gln Pro Ile Asn Glu Thr
180 185 190
Asp Thr Pro Ala Gln Leu Glu Met Glu Asp Glu Asp Thr Ile Asp Val
195 200 205
Phe Gln Gln Gln Thr Val Val Gly Gly Ser Gly Gly Ser Gly Gly Ser
210 215 220
Gly Gly Ser Pro Met Ser Glu Glu Lys Pro Lys Glu Gly Val Lys Thr
225 230 235 240
Glu Asn Asp His Ile Asn Leu Lys Val Ala Gly Gln Asp Gly Ser Val
245 250 255
Val Gln Phe Lys Ile Lys Arg His Thr Pro Leu Ser Lys Leu Met Lys
260 265 270
Ala Tyr Cys Glu Arg Gln Gly Leu Ser Met Arg Gln Ile Arg Phe Arg
275 280 285
Phe Asp Gly Gln Pro Ile Asn Glu Thr Asp Thr Pro Ala Gln Leu Glu
290 295 300
Met Glu Asp Glu Asp Thr Ile Asp Val Phe Gln Gln Gln Thr Val Val
305 310 315 320
Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Ala Met Gly Glu
325 330 335
Val Gln Leu Leu Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Gly Ser
340 345 350
Leu Arg Leu Ser Cys Ala Ala Ser Gly Thr Phe Asp Lys Ile Asn Asn
355 360 365
Met Gly Trp Tyr Arg Gln Ala Pro Gly Lys Gln Arg Asp Leu Val Ala
370 375 380
Gln Ile Thr Pro Gly Gly Ile Thr Asp Tyr Ala Asp Ser Val Lys Gly
385 390 395 400
Arg Phe Thr Ile Ser Arg Asp Asn Ser Lys Asn Thr Leu Tyr Leu Gln
405 410 415
Met Asn Ser Leu Arg Pro Glu Asp Thr Ala Val Tyr Tyr Cys Asn Ala
420 425 430
Glu Ile Leu Lys Arg Ala Tyr Ile Asp Val Tyr Val Asn Tyr Trp Gly
435 440 445
Gln Gly Thr Leu Val Thr Val Ser Ser
450 455
<210> 21
<211> 390
<212> DNA
<213> 人工序列
<400> 21
atgaaacatc atcatcatca tcatcatgaa aacctgtatt ttcagggcgc catgaaagtg 60
gacgttatcg atctgacgat cgaaagcagt agcgatgagg aagaggaccc gccggcgaaa 120
cggggaggga gcgggggcag cggcggcagc ggcggatcca tgatgaaagt ggacgttatc 180
gatctgacga tcgaaagcag tagcgatgag gaagaggacc cgccggcgaa acggggaggg 240
agcgggggca gcggcggcag cggcggatcc atgatgaaag tggacgttat cgatctgacg 300
atcgaaagca gtagcgatga ggaagaggac ccgccggcga aacggggagg gagcgggggc 360
agcggcggca gcggcggatc catggggtaa 390
<210> 22
<211> 115
<212> PRT
<213> 人工序列
<400> 22
Met Lys His His His His His His His Glu Asn Leu Tyr Phe Gln Gly
1 5 10 15
Ala Met Lys Val Asp Val Ile Asp Leu Thr Ile Glu Ser Ser Ser Asp
20 25 30
Glu Glu Glu Asp Pro Pro Ala Lys Arg Gly Gly Ser Gly Gly Ser Gly
35 40 45
Gly Ser Gly Gly Ser Met Met Lys Val Asp Val Ile Asp Leu Thr Ile
50 55 60
Glu Ser Ser Ser Asp Glu Glu Glu Asp Pro Pro Ala Lys Arg Gly Gly
65 70 75 80
Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Met Met Lys Val Asp Val
85 90 95
Ile Asp Leu Thr Ile Glu Ser Ser Ser Asp Glu Glu Glu Asp Pro Pro
100 105 110
Ala Lys Arg
115
<210> 23
<211> 1005
<212> DNA
<213> 人工序列
<400> 23
atgaaacatc atcatcatca tcatcatgaa aacctgtatt ttcagggcgc catgatgtca 60
gaagagaagc ctaaggaggg cgtgaaaacc gagaatgacc acattaactt gaaggttgct 120
ggacaggatg ggtccgtggt tcagttcaaa attaaacgcc acaccccgct gtcaaagctg 180
atgaaagcct attgtgagcg tcaaggtctg tcgatgcgcc agatccgctt tcgctttgat 240
ggtcagccaa tcaacgagac agacactccg gcacaactgg agatggaaga tgaagacacc 300
atcgatgttt ttcaacagca gaccgtggtg ggagggagcg gcggtagcgg gggatcaggt 360
ggtagtccaa tgtcagaaga gaagcctaag gagggcgtga aaaccgagaa tgaccacatt 420
aacttgaagg ttgctggaca ggatgggtcc gtggttcagt tcaaaattaa acgccacacc 480
ccgctgtcaa agctgatgaa agcctattgt gagcgtcaag gtctgtcgat gcgccagatc 540
cgctttcgct ttgatggtca gccaatcaac gagacagaca ctccggcaca actggagatg 600
gaagatgaag acaccatcga tgtttttcaa cagcagaccg tggtgggagg gagcggcggt 660
agcgggggat caggtggtag tccaatgtca gaagagaagc ctaaggaggg cgtgaaaacc 720
gagaatgacc acattaactt gaaggttgct ggacaggatg ggtccgtggt tcagttcaaa 780
attaaacgcc acaccccgct gtcaaagctg atgaaagcct attgtgagcg tcaaggtctg 840
tcgatgcgcc agatccgctt tcgctttgat ggtcagccaa tcaacgagac agacactccg 900
gcacaactgg agatggaaga tgaagacacc atcgatgttt ttcaacagca gaccgtggtg 960
ggagggagcg gcggtagcgg gggatcaggt ggtagtccat ggtaa 1005
<210> 24
<211> 320
<212> PRT
<213> 人工序列
<400> 24
Met Lys His His His His His His His Glu Asn Leu Tyr Phe Gln Gly
1 5 10 15
Ala Met Met Ser Glu Glu Lys Pro Lys Glu Gly Val Lys Thr Glu Asn
20 25 30
Asp His Ile Asn Leu Lys Val Ala Gly Gln Asp Gly Ser Val Val Gln
35 40 45
Phe Lys Ile Lys Arg His Thr Pro Leu Ser Lys Leu Met Lys Ala Tyr
50 55 60
Cys Glu Arg Gln Gly Leu Ser Met Arg Gln Ile Arg Phe Arg Phe Asp
65 70 75 80
Gly Gln Pro Ile Asn Glu Thr Asp Thr Pro Ala Gln Leu Glu Met Glu
85 90 95
Asp Glu Asp Thr Ile Asp Val Phe Gln Gln Gln Thr Val Val Gly Gly
100 105 110
Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Pro Met Ser Glu Glu Lys
115 120 125
Pro Lys Glu Gly Val Lys Thr Glu Asn Asp His Ile Asn Leu Lys Val
130 135 140
Ala Gly Gln Asp Gly Ser Val Val Gln Phe Lys Ile Lys Arg His Thr
145 150 155 160
Pro Leu Ser Lys Leu Met Lys Ala Tyr Cys Glu Arg Gln Gly Leu Ser
165 170 175
Met Arg Gln Ile Arg Phe Arg Phe Asp Gly Gln Pro Ile Asn Glu Thr
180 185 190
Asp Thr Pro Ala Gln Leu Glu Met Glu Asp Glu Asp Thr Ile Asp Val
195 200 205
Phe Gln Gln Gln Thr Val Val Gly Gly Ser Gly Gly Ser Gly Gly Ser
210 215 220
Gly Gly Ser Pro Met Ser Glu Glu Lys Pro Lys Glu Gly Val Lys Thr
225 230 235 240
Glu Asn Asp His Ile Asn Leu Lys Val Ala Gly Gln Asp Gly Ser Val
245 250 255
Val Gln Phe Lys Ile Lys Arg His Thr Pro Leu Ser Lys Leu Met Lys
260 265 270
Ala Tyr Cys Glu Arg Gln Gly Leu Ser Met Arg Gln Ile Arg Phe Arg
275 280 285
Phe Asp Gly Gln Pro Ile Asn Glu Thr Asp Thr Pro Ala Gln Leu Glu
290 295 300
Met Glu Asp Glu Asp Thr Ile Asp Val Phe Gln Gln Gln Thr Val Val
305 310 315 320
<210> 25
<211> 891
<212> DNA
<213> 人工序列
<400> 25
atgaaacatc atcatcatca tcatcatgaa aacctgtatt ttcagggtca tatgaaaggc 60
ggcagctggg gtggtagcaa aaaaaccccg ccgccagtgc caccacgcac caccagcaaa 120
ggtggtagcg gtggtagcgg tggtagcggt ggtagtaaaa aaaccccgcc accggtgccg 180
ccacgtacca ccagcaaagg tggtagcggt ggcagtggtg gtagtggtgg tagcaaaaaa 240
accccgccgc cagtgccacc acgtaccacc agtaaaggtg gtagcggcgg tagcggtggt 300
agcggtggta gcaaaaaaac cccgccacca gtgccgccac gcaccaccag taaaggtggc 360
agtggtggta gcggcggtag cggtggtagt aaaaaaaccc cgccaccggt gccgccacgt 420
accaccagca aaggcggtag cggtagcaaa aatctgtatt ttcagggcgg tagcggtggc 480
agcggtggta gcggcggctc catggaagtt cagctgatgg aatctggtgg tggtctggtt 540
caggctggtg gttctctgcg tctgtcttgc gctgcttctg gtcgtacctt caacaactac 600
gctatgggtt ggttccgtcg tgctccgaaa ggtgaacgtg aattcgttgc tgctatcacc 660
cgttctggtg ttcgttctgg tgtttctgct atctacggtg actctgttaa agaccgtttc 720
accatctctc gtgacaacgc taaaaacacc ctgtacctgc agatgaactc tctgaaaccg 780
gaagacaccg ctgtttacac ctgcgctgct tctgctatcg gttctggtgc gctccgtagg 840
ttcgaatacg actactctgg tcagggtact caggttaccg taagctctta a 891
<210> 26
<211> 296
<212> PRT
<213> 人工序列
<400> 26
Met Lys His His His His His His His Glu Asn Leu Tyr Phe Gln Gly
1 5 10 15
His Met Lys Gly Gly Ser Trp Gly Gly Ser Lys Lys Thr Pro Pro Pro
20 25 30
Val Pro Pro Arg Thr Thr Ser Lys Gly Gly Ser Gly Gly Ser Gly Gly
35 40 45
Ser Gly Gly Ser Lys Lys Thr Pro Pro Pro Val Pro Pro Arg Thr Thr
50 55 60
Ser Lys Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Lys Lys
65 70 75 80
Thr Pro Pro Pro Val Pro Pro Arg Thr Thr Ser Lys Gly Gly Ser Gly
85 90 95
Gly Ser Gly Gly Ser Gly Gly Ser Lys Lys Thr Pro Pro Pro Val Pro
100 105 110
Pro Arg Thr Thr Ser Lys Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly
115 120 125
Gly Ser Lys Lys Thr Pro Pro Pro Val Pro Pro Arg Thr Thr Ser Lys
130 135 140
Gly Gly Ser Gly Ser Lys Asn Leu Tyr Phe Gln Gly Gly Ser Gly Gly
145 150 155 160
Ser Gly Gly Ser Gly Gly Ser Met Glu Val Gln Leu Met Glu Ser Gly
165 170 175
Gly Gly Leu Val Gln Ala Gly Gly Ser Leu Arg Leu Ser Cys Ala Ala
180 185 190
Ser Gly Arg Thr Phe Asn Asn Tyr Ala Met Gly Trp Phe Arg Arg Ala
195 200 205
Pro Lys Gly Glu Arg Glu Phe Val Ala Ala Ile Thr Arg Ser Gly Val
210 215 220
Arg Ser Gly Val Ser Ala Ile Tyr Gly Asp Ser Val Lys Asp Arg Phe
225 230 235 240
Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Leu Tyr Leu Gln Met Asn
245 250 255
Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Thr Cys Ala Ala Ser Ala
260 265 270
Ile Gly Ser Gly Ala Leu Arg Arg Phe Glu Tyr Asp Tyr Ser Gly Gln
275 280 285
Gly Thr Gln Val Thr Val Ser Ser
290 295
<210> 27
<211> 1653
<212> DNA
<213> 人工序列
<400> 27
atgaaacatc atcatcatca tcatcatgaa aacctgtatt ttcagggcca tatggatctg 60
aatatgccgg cgtatgtgaa atttaattac atggcggaac gcgaagatga gctgagcctg 120
attaaaggca ccaaagtgat tgtgatggaa aagagcagcg atggctggtg gcgcggcagc 180
tataatggcc aagttggttg gtttccgagc aattatgtga ccgaagaagg cgatagcccg 240
ctggcgagtg gtgcgggtgg tagcgaaggt ggtggtagcg aaggtggtac cagcggtgcg 300
accgatttga atatgccggc gtatgtgaaa tttaattaca tggcggaacg cgaggatgag 360
ctgagcctga ttaaaggcac caaagtgatt gtgatggaaa agagcagcga tggctggtgg 420
cgcggcagct ataatggcca agttggctgg tttccgagca attatgtgac cgaagaaggc 480
gatagcccgc tggcgagcgg tgcgggtggt agcgaaggtg gtggcagcga aggtggtacc 540
agcggtgcga cccatatgga tttaaatatg ccggcgtatg tgaaattcaa ctacatggcg 600
gaacgcgagg atgagctgag cctgattaaa ggcaccaaag tgattgtgat ggaaaagagc 660
agcgatggct ggtggcgcgg cagctataat ggccaagttg gctggtttcc gagcaattat 720
gtgaccgaag aaggcgatag cccgctggcg agcggtgcgg gtggtagtga aggtggcggt 780
agtgaaggcg gtaccagcgg tgcgaccgat ttgaatatgc cggcgtatgt gaaatttaat 840
tacatggcgg aacgcgagga tgagctgagc ctgattaaag gcaccaaagt gattgtgatg 900
gaaaagagca gcgatggctg gtggcgcggc agctataatg gccaagttgg ttggtttccg 960
agcaattatg tgaccgaaga aggcgatagc ccgctggcga gtggtgcggg tggtagcgaa 1020
ggtggtggta gcgaaggtgg taccagcggt gcgaccgatt taaatatgcc ggcgtatgtg 1080
aaatttaatt acatggcgga acgcgaggac gagctgagcc tgattaaagg caccaaagtg 1140
attgtgatgg aaaagagcag cgatggctgg tggcgcggca gctataatgg ccaagtaggc 1200
tggtttccga gcaattatgt gaccgaagaa ggcgatagcc cgctgggcgg tagcggtggc 1260
agcggtggta gcggcggctc catggaagtt cagctgctgg aatctggtgg tggtctggtt 1320
cagccgggtg gttctctgcg tctgtcttgc gctgcttctg gtaccttcga caaaatcaac 1380
aacatgggtt ggtaccgtca ggctccgggt aaacagcgtg acctggttgc tcagatcacc 1440
ccgggtggta tcaccgacta cgctgactct gttaaaggtc gtttcaccat ctctcgtgac 1500
aactctaaaa acaccctgta cctgcagatg aactctctgc gtccggaaga caccgctgtt 1560
tactactgca acgctgaaat cctgaaacgt gcttacatcg acgtttacgt taactactgg 1620
ggtcagggta ctctcgttac cgtaagctct taa 1653
<210> 28
<211> 550
<212> PRT
<213> 人工序列
<400> 28
Met Lys His His His His His His His Glu Asn Leu Tyr Phe Gln Gly
1 5 10 15
His Met Asp Leu Asn Met Pro Ala Tyr Val Lys Phe Asn Tyr Met Ala
20 25 30
Glu Arg Glu Asp Glu Leu Ser Leu Ile Lys Gly Thr Lys Val Ile Val
35 40 45
Met Glu Lys Ser Ser Asp Gly Trp Trp Arg Gly Ser Tyr Asn Gly Gln
50 55 60
Val Gly Trp Phe Pro Ser Asn Tyr Val Thr Glu Glu Gly Asp Ser Pro
65 70 75 80
Leu Ala Ser Gly Ala Gly Gly Ser Glu Gly Gly Gly Ser Glu Gly Gly
85 90 95
Thr Ser Gly Ala Thr Asp Leu Asn Met Pro Ala Tyr Val Lys Phe Asn
100 105 110
Tyr Met Ala Glu Arg Glu Asp Glu Leu Ser Leu Ile Lys Gly Thr Lys
115 120 125
Val Ile Val Met Glu Lys Ser Ser Asp Gly Trp Trp Arg Gly Ser Tyr
130 135 140
Asn Gly Gln Val Gly Trp Phe Pro Ser Asn Tyr Val Thr Glu Glu Gly
145 150 155 160
Asp Ser Pro Leu Ala Ser Gly Ala Gly Gly Ser Glu Gly Gly Gly Ser
165 170 175
Glu Gly Gly Thr Ser Gly Ala Thr His Met Asp Leu Asn Met Pro Ala
180 185 190
Tyr Val Lys Phe Asn Tyr Met Ala Glu Arg Glu Asp Glu Leu Ser Leu
195 200 205
Ile Lys Gly Thr Lys Val Ile Val Met Glu Lys Ser Ser Asp Gly Trp
210 215 220
Trp Arg Gly Ser Tyr Asn Gly Gln Val Gly Trp Phe Pro Ser Asn Tyr
225 230 235 240
Val Thr Glu Glu Gly Asp Ser Pro Leu Ala Ser Gly Ala Gly Gly Ser
245 250 255
Glu Gly Gly Gly Ser Glu Gly Gly Thr Ser Gly Ala Thr Asp Leu Asn
260 265 270
Met Pro Ala Tyr Val Lys Phe Asn Tyr Met Ala Glu Arg Glu Asp Glu
275 280 285
Leu Ser Leu Ile Lys Gly Thr Lys Val Ile Val Met Glu Lys Ser Ser
290 295 300
Asp Gly Trp Trp Arg Gly Ser Tyr Asn Gly Gln Val Gly Trp Phe Pro
305 310 315 320
Ser Asn Tyr Val Thr Glu Glu Gly Asp Ser Pro Leu Ala Ser Gly Ala
325 330 335
Gly Gly Ser Glu Gly Gly Gly Ser Glu Gly Gly Thr Ser Gly Ala Thr
340 345 350
Asp Leu Asn Met Pro Ala Tyr Val Lys Phe Asn Tyr Met Ala Glu Arg
355 360 365
Glu Asp Glu Leu Ser Leu Ile Lys Gly Thr Lys Val Ile Val Met Glu
370 375 380
Lys Ser Ser Asp Gly Trp Trp Arg Gly Ser Tyr Asn Gly Gln Val Gly
385 390 395 400
Trp Phe Pro Ser Asn Tyr Val Thr Glu Glu Gly Asp Ser Pro Leu Gly
405 410 415
Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Met Glu Val Gln Leu
420 425 430
Leu Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Gly Ser Leu Arg Leu
435 440 445
Ser Cys Ala Ala Ser Gly Thr Phe Asp Lys Ile Asn Asn Met Gly Trp
450 455 460
Tyr Arg Gln Ala Pro Gly Lys Gln Arg Asp Leu Val Ala Gln Ile Thr
465 470 475 480
Pro Gly Gly Ile Thr Asp Tyr Ala Asp Ser Val Lys Gly Arg Phe Thr
485 490 495
Ile Ser Arg Asp Asn Ser Lys Asn Thr Leu Tyr Leu Gln Met Asn Ser
500 505 510
Leu Arg Pro Glu Asp Thr Ala Val Tyr Tyr Cys Asn Ala Glu Ile Leu
515 520 525
Lys Arg Ala Tyr Ile Asp Val Tyr Val Asn Tyr Trp Gly Gln Gly Thr
530 535 540
Leu Val Thr Val Ser Ser
545 550
<210> 29
<211> 41
<212> DNA
<213> 人工序列
<400> 29
actttaataa ggagatatac catgaaacat catcatcatc a 41
<210> 30
<211> 40
<212> DNA
<213> 人工序列
<400> 30
ttctttacca gactcgagtt accccatgga gccgccgcta 40
<210> 31
<211> 43
<212> DNA
<213> 人工序列
<400> 31
actttaataa ggagatatac catgaaacat catcatcatc atc 43
<210> 32
<211> 40
<212> DNA
<213> 人工序列
<400> 32
ttctttacca gactcgagtt agcccatgga gccgccgcta 40
<210> 33
<211> 42
<212> DNA
<213> 人工序列
<400> 33
actttaataa ggagatatac catgaaacat catcatcatc at 42
<210> 34
<211> 39
<212> DNA
<213> 人工序列
<400> 34
ttctttacca gactcgagtt aagaaccacc agaaccacc 39
<210> 35
<211> 43
<212> DNA
<213> 人工序列
<400> 35
actttaataa ggagatatac catgaaacat catcatcatc atc 43
<210> 36
<211> 39
<212> DNA
<213> 人工序列
<400> 36
ttctttacca gactcgagtt agccaaccag gaacgcacc 39
<210> 37
<211> 43
<212> DNA
<213> 人工序列
<400> 37
actttaataa ggagatatac catgaaacat catcatcatc atc 43
<210> 38
<211> 40
<212> DNA
<213> 人工序列
<400> 38
ttctttacca gactcgagtt aagagcttac ggtaacctga 40
<210> 39
<211> 42
<212> DNA
<213> 人工序列
<400> 39
actttaataa ggagatatac catgaaacat catcatcatc at 42
<210> 40
<211> 39
<212> DNA
<213> 人工序列
<400> 40
ttctttacca gactcgagtt aagagcttac ggtaacgag 39
<210> 41
<211> 42
<212> DNA
<213> 人工序列
<400> 41
actttaataa ggagatatac catgaaacat catcatcatc at 42
<210> 42
<211> 39
<212> DNA
<213> 人工序列
<400> 42
ttctttacca gactcgagtt aagagcttac ggtaacctg 39
<210> 43
<211> 42
<212> DNA
<213> 人工序列
<400> 43
actttaataa ggagatatac catgaaacat catcatcatc at 42
<210> 44
<211> 40
<212> DNA
<213> 人工序列
<400> 44
ttctttacca gactcgagtt aagagcttac ggtaacgaga 40
<210> 45
<211> 41
<212> DNA
<213> 人工序列
<400> 45
actttaataa ggagatatac catgaaacat catcatcatc a 41
<210> 46
<211> 39
<212> DNA
<213> 人工序列
<400> 46
ttctttacca gactcgagtt aagagcttac ggtaacctg 39
<210> 47
<211> 42
<212> DNA
<213> 人工序列
<400> 47
actttaataa ggagatatac catgaaacat catcatcatc at 42
<210> 48
<211> 39
<212> DNA
<213> 人工序列
<400> 48
ttctttacca gactcgagtt aagagcttac ggtaacgag 39
<210> 49
<211> 23
<212> PRT
<213> 人工序列
<400> 49
Lys Val Asp Val Ile Asp Leu Thr Ile Glu Ser Ser Ser Asp Glu Glu
1 5 10 15
Glu Asp Pro Pro Ala Lys Arg
20
<210> 50
<211> 92
<212> PRT
<213> 人工序列
<400> 50
Met Ser Glu Glu Lys Pro Lys Glu Gly Val Lys Thr Glu Asn Asp His
1 5 10 15
Ile Asn Leu Lys Val Ala Gly Gln Asp Gly Ser Val Val Gln Phe Lys
20 25 30
Ile Lys Arg His Thr Pro Leu Ser Lys Leu Met Lys Ala Tyr Cys Glu
35 40 45
Arg Gln Gly Leu Ser Met Arg Gln Ile Arg Phe Arg Phe Asp Gly Gln
50 55 60
Pro Ile Asn Glu Thr Asp Thr Pro Ala Gln Leu Glu Met Glu Asp Glu
65 70 75 80
Asp Thr Ile Asp Val Phe Gln Gln Gln Thr Val Val
85 90
<210> 51
<211> 14
<212> PRT
<213> 人工序列
<400> 51
Lys Lys Thr Pro Pro Pro Val Pro Pro Arg Thr Thr Ser Lys
1 5 10
<210> 52
<211> 63
<212> PRT
<213> 人工序列
<400> 52
Asp Leu Asn Met Pro Ala Tyr Val Lys Phe Asn Tyr Met Ala Glu Arg
1 5 10 15
Glu Asp Glu Leu Ser Leu Ile Lys Gly Thr Lys Val Ile Val Met Glu
20 25 30
Lys Ser Ser Asp Gly Trp Trp Arg Gly Ser Tyr Asn Gly Gln Val Gly
35 40 45
Trp Phe Pro Ser Asn Tyr Val Thr Glu Glu Gly Asp Ser Pro Leu
50 55 60
<210> 53
<211> 122
<212> PRT
<213> 人工序列
<400> 53
Glu Val Gln Leu Leu Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Gly
1 5 10 15
Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Thr Phe Asp Lys Ile Asn
20 25 30
Asn Met Gly Trp Tyr Arg Gln Ala Pro Gly Lys Gln Arg Asp Leu Val
35 40 45
Ala Gln Ile Thr Pro Gly Gly Ile Thr Asp Tyr Ala Asp Ser Val Lys
50 55 60
Gly Arg Phe Thr Ile Ser Arg Asp Asn Ser Lys Asn Thr Leu Tyr Leu
65 70 75 80
Gln Met Asn Ser Leu Arg Pro Glu Asp Thr Ala Val Tyr Tyr Cys Asn
85 90 95
Ala Glu Ile Leu Lys Arg Ala Tyr Ile Asp Val Tyr Val Asn Tyr Trp
100 105 110
Gly Gln Gly Thr Leu Val Thr Val Ser Ser
115 120
<210> 54
<211> 128
<212> PRT
<213> 人工序列
<400> 54
Glu Val Gln Leu Met Glu Ser Gly Gly Gly Leu Val Gln Ala Gly Gly
1 5 10 15
Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Asn Asn Tyr
20 25 30
Ala Met Gly Trp Phe Arg Arg Ala Pro Lys Gly Glu Arg Glu Phe Val
35 40 45
Ala Ala Ile Thr Arg Ser Gly Val Arg Ser Gly Val Ser Ala Ile Tyr
50 55 60
Gly Asp Ser Val Lys Asp Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys
65 70 75 80
Asn Thr Leu Tyr Leu Gln Met Asn Ser Leu Lys Pro Glu Asp Thr Ala
85 90 95
Val Tyr Thr Cys Ala Ala Ser Ala Ile Gly Ser Gly Ala Leu Arg Arg
100 105 110
Phe Glu Tyr Asp Tyr Ser Gly Gln Gly Thr Gln Val Thr Val Ser Ser
115 120 125

Claims (14)

1.一种相变调节套件,其特征在于,所述套件包括第一组件和第二组件在内的多种组件,其中第一组件包含第一多价结构域和与第一细胞表面分子特异性结合的第一配体,第二组件包含第二多价结构域和与第二细胞表面分子特异性结合的第二配体,所述第一细胞表面分子与第二细胞表面分子相同或不同,并且,所述每种组件包含不多于一个配体,
所述套件通过其中包含的多种组件的多价结构域之间的相互作用调节套件自身或与该套件相结合的细胞表面分子的相变。
2.权利要求1所述的相变调节套件,其包含三种以上的组件,除第一组件和第二组件之外的其余组件包含能够与第一及/或第二多价结构域相互作用从而调节相变的结构域,并且任选地含有或不含与第三细胞表面分子特异性结合的第三配体。
3.前述任一权利要求所述的相变调节套件,其中各种组件中所包含的配体任选地介由接头与所述多价结构域共价连接,所述接头可以为肽接头或非肽接头。
4.前述任一权利要求所述的相变调节套件,其中所述组件中的多价结构域包含至少2个串联连接的基序,例如所述串联连接的基序的个数为3、4、5、6、7、8、9或10个。
5.前述任一权利要求所述的相变调节套件,其中所述多价结构域包含至少两个串联连接的SEQ ID NO:49所示的SUMO3基序或与SEQ ID NO:49所示SUMO3基序具有至少80%、90%、95%、99%序列同一性的基序,或者至少两个串联连接的SEQ ID NO:50所示的SIM基序或与SEQ ID NO:50所示的SIM基序具有至少80%、90%、95%、99%序列同一性的基序,或者至少两个串联连接的SEQ ID NO:51所示的PRMH基序或与SEQ ID NO:51所示的PRMH基序具有至少80%、90%、95%、99%序列同一性的基序,或者至少两个串联连接的SEQ ID NO:52所示的SH3基序或与SEQ ID NO:52所示的SH3基序具有至少80%、90%、95%、99%序列同一性的基序。
6.前述任一权利要求所述的相变调节套件,其中所述第一细胞表面分子为肿瘤坏死因子受体,优选为死亡受体5(DR5)或Fas受体,更优选为死亡受体5(DR5)。
7.前述任一权利要求所述的相变调节套件,其中所述第二细胞表面分子为肿瘤相关抗原,优选所述肿瘤相关抗原选自由CXC基序趋化因子受体4(CXCR4)、肝细胞生长因子受体(c-Met或HGFR)、表皮生长因子受体(EGFR)、人表皮生长因子受体2(HER2)和前列腺特异性膜抗原(PSMA)组成的群组,最优选为CXC基序趋化因子受体4(CXCR4)、成纤维细胞活化蛋白(FAP)、癌胚抗原(CEA)、叶酸受体α(FolR1)、黑素瘤相关硫酸软骨素蛋白聚糖(MCSP)、p95HER2、EpCAM、HER3、CD30或TPBG(5T4)、CD19、CD79b、CD20、CD22、CD37、CD38、BCMA和GPRC5D。
8.前述任一权利要求所述的相变调节套件,其中所述配体可选自肽配体或非肽配体,所述肽配体优选选自由以下各项组成的群组中的一种或多种:特异性结合到细胞表面分子的抗体或其抗原结合片段、细胞因子、生长因子、粘附分子、肽激素、或者噬菌体展示或酵母展示等随机选择的多肽,所述抗体更优选选自单克隆抗体、多克隆抗体、人抗体或人源化抗体,所述抗原结合片段可选自F(ab’)2、Fab、单链可变片段(scFv)、单域抗体片段(VHH或纳米抗体),所述非肽配体优选选自由小分子激动剂或拮抗剂、反义寡核苷酸或小干扰RNA(siRNA)组成的群组中的一种或多种。
9.前述任一权利要求所述的相变调节套件,其中所述第一配体和第二配体均为单链可变片段,优选该单链可变片段形式的第一配体包含如SEQ ID NO:53所示的氨基酸序列或与SEQ ID NO:53所示的氨基酸序列具有至少80%、90%、95%、99%同一性的氨基酸序列,该单链可变片段形式的第二配体包含SEQ ID NO:54所示的氨基酸序列或与SEQ ID NO:54所示的氨基酸序列具有至少80%、90%、95%、99%同一性的氨基酸序列。
10.前述任一权利要求所述的相变调节套件,其中所述第一组件包含SEQ ID NO:12的第27~673位所示氨基酸序列,或SEQ ID NO:20的第19~457位所示氨基酸序列,或SEQ IDNO:28的第19~550位所示氨基酸序列,或者包含与选自SEQ ID NO:12的第27~673位、SEQID NO:20的第19~457位或SEQ ID NO:28的第19~550位所示的序列具有至少80%、90%、95%、99%同一性的氨基酸序列,所述第二组件包含SEQ ID NO:10的第21~373位所示氨基酸序列,或SEQ ID NO:18的第19~257位所示氨基酸序列,或SEQ ID NO:26的第27~296位所示氨基酸序列,或者包含与选自SEQ ID NO:10的第21~373位、SEQ ID NO:18的第19~257位或SEQ ID NO:26的第27~296位所示的序列具有至少80%、90%、95%、99%同一性的氨基酸序列。
11.前述任一权利要求所述的相变调节套件,其还包含不影响所述配体与所述多价结构域的功能的标签和/或剪切所述标签的多肽。
12.一种筛选相变调节套件的方法,所述方法包括以下步骤:
步骤A:产生包含多种候选相变调节组件的文库,其中每种所述候选相变调节组件均包含一个多价结构域,以及包含或不包含能够与细胞表面分子特异性结合的不多于一个的配体;
步骤B:从所述步骤A所产生的文库中任意选择至少两种所述候选相变调节组件,组合为候选相变调节套件,所述候选套件中的候选组件介由所述配体而识别的细胞表面分子彼此可以相同或不同;
步骤C:在适于发生相变的条件下,测定所述步骤B中组合得到的候选相变调节套件产生相变液滴的活性,以不包含所述候选相变调节套件作为区别的平行测定作为阴性对照,选择所产生的相变液滴多于阴性对照的候选相变调节套件作为目标套件。
13.药物组合物,其包含前述任一权利要求所述的相变调节套件,以及任选的药学上可接受的载体,优选地,所述药物组合物是试剂盒。
14.前述任一权利要求所述的相变调节套件或药物组合物在制备用于治疗疾病的药剂中的用途,所述疾病可选自由慢性自身免疫性障碍、炎性病症、细胞增殖异常或细胞凋亡异常相关性疾病、脓毒症或病毒感染组成的群组,优选所述细胞增殖异常或细胞凋亡异常相关性疾病为癌症,更优选所述癌症选自由肺癌、结直肠癌、头颈部癌(例如,头颈部鳞状细胞癌)、胶质瘤(例如,神经胶质瘤)、神经母细胞瘤、黑素瘤、乳腺癌、膀胱癌、肾癌、卵巢癌、胰腺癌、宫颈癌、食道癌、肉瘤、食道癌(例如,食道鳞状细胞癌)、甲状腺癌(例如,乳头状甲状腺癌)或前列腺癌,B细胞淋巴瘤、慢性淋巴细胞白血病(CLL)、慢性髓性白血病、弥漫性大B细胞淋巴瘤(DLBCL)、滤泡性淋巴瘤、骨髓增生异常综合征(MDS)、非霍奇金淋巴瘤(NHL)、急性淋巴细胞白血病(ALL)、急性单核细胞白血病、多发性骨髓瘤、急性髓性白血病(AML)、混合系白血病、NUT中线癌、伯基特淋巴瘤或蕈状真菌病(MF)、或其转移形式组成的群组。
CN202210687061.4A 2022-06-16 2022-06-16 一种相变调节套件及其用途 Pending CN117285643A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202210687061.4A CN117285643A (zh) 2022-06-16 2022-06-16 一种相变调节套件及其用途
PCT/CN2023/000076 WO2023241023A2 (zh) 2022-06-16 2023-06-16 一种相变调节套件及其用途

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210687061.4A CN117285643A (zh) 2022-06-16 2022-06-16 一种相变调节套件及其用途

Publications (1)

Publication Number Publication Date
CN117285643A true CN117285643A (zh) 2023-12-26

Family

ID=89193073

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210687061.4A Pending CN117285643A (zh) 2022-06-16 2022-06-16 一种相变调节套件及其用途

Country Status (2)

Country Link
CN (1) CN117285643A (zh)
WO (1) WO2023241023A2 (zh)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2297209A4 (en) * 2008-06-03 2012-08-01 Abbott Lab IMMUNOGLOBULINS WITH TWO VARIABLE DOMAINS AND USES THEREOF
WO2020084608A1 (en) * 2018-10-22 2020-04-30 Explore Bio 1 Ltd Precursor bispecific antibody constructs and methods of use thereof

Also Published As

Publication number Publication date
WO2023241023A2 (zh) 2023-12-21
WO2023241023A3 (zh) 2024-02-08

Similar Documents

Publication Publication Date Title
US11827712B2 (en) IL13Rα2 binding agents and use thereof
US11673935B2 (en) Car T-cells recognizing cancer-specific IL 13Ra2
ES2759248T3 (es) Constructos de anticuerpo para CDH19 y CD3
KR20180031728A (ko) 다가 및 다중특이적 gitr 결합 융합 단백질
KR20200093639A (ko) 천연 항체 구조-유사 헤테로다이머 형태의 항 pd-l1/항 cd47 이중특이성 항체 및 이의 제조
CN112218686A (zh) 具有受限cd3结合的多特异性多肽构建体以及相关方法和用途
TW201936638A (zh) 雙特異性異質二聚體雙功能抗體及彼等之用途
PL207087B1 (pl) Przeciwciało, które wiąże się swoiście z białkiem Cripto, zawierająca je kompozycja farmaceutyczna i zastosowanie przeciwciała
CN110300603A (zh) Cd47-car-t细胞
CN114127115A (zh) 结合CLEC12a的多肽及其用途
CN114040926A (zh) 结合cd123的多肽及其用途
CN113614111A (zh) 用于调节细胞内化的组合物和方法
JP2018154641A (ja) 改変axlペプチド及び抗転移療法のaxlシグナル伝達阻害におけるその使用
KR20100045683A (ko) 핵산가수분해 능 및 암세포내 침투능력을 갖는 인간화된 항체 및 그 용도
TWI837517B (zh) 抗claudin 18.2和cd3的雙特異性抗體以及其用途
CN114222757A (zh) 重组4-1bb结合蛋白及其用途
CN115956085A (zh) 转化生长因子β(TGFβ)结合剂及其用途
CN115427455A (zh) 抗IL13Rα2抗体、其抗原结合片段和用途
CN114761435A (zh) 一种分离的结合抗原axl的蛋白及其用途
CN111378040B (zh) 检测多种恶性肿瘤细胞的抗体及其应用
CN117285643A (zh) 一种相变调节套件及其用途
EP3273991B1 (en) Anti-cd89 cytotoxic complex
CN117285644A (zh) 一种相变调节元件及其用途
Hutt Multivalent antibody-scTRAIL fusion proteins for tumor therapy: impact of format and targeting
Liu Functional and structural analysis of RET receptor tyrosine kinase and its complexes

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40102800

Country of ref document: HK