CN107810273A - 用为或衍生自β‑(1,4)‑N‑乙酰半乳糖胺转移酶的糖基转移酶修饰糖蛋白的方法 - Google Patents

用为或衍生自β‑(1,4)‑N‑乙酰半乳糖胺转移酶的糖基转移酶修饰糖蛋白的方法 Download PDF

Info

Publication number
CN107810273A
CN107810273A CN201680036546.XA CN201680036546A CN107810273A CN 107810273 A CN107810273 A CN 107810273A CN 201680036546 A CN201680036546 A CN 201680036546A CN 107810273 A CN107810273 A CN 107810273A
Authority
CN
China
Prior art keywords
seq
glycan
formula
glycoprotein
preferred
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201680036546.XA
Other languages
English (en)
Other versions
CN107810273B (zh
Inventor
S·S·范博凯尔
R·范吉尔
M·A·维基德文
F·L·范代尔夫特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Synaffix BV
Original Assignee
Synaffix BV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Synaffix BV filed Critical Synaffix BV
Priority to CN202211121609.5A priority Critical patent/CN115960981A/zh
Publication of CN107810273A publication Critical patent/CN107810273A/zh
Application granted granted Critical
Publication of CN107810273B publication Critical patent/CN107810273B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/005Glycopeptides, glycoproteins
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K47/00Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient
    • A61K47/50Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates
    • A61K47/51Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent
    • A61K47/56Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent the modifying agent being an organic macromolecular compound, e.g. an oligomeric, polymeric or dendrimeric molecule
    • A61K47/61Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent the modifying agent being an organic macromolecular compound, e.g. an oligomeric, polymeric or dendrimeric molecule the organic macromolecular compound being a polysaccharide or a derivative thereof
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K47/00Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient
    • A61K47/50Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates
    • A61K47/51Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent
    • A61K47/62Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent the modifying agent being a protein, peptide or polyamino acid
    • A61K47/64Drug-peptide, drug-protein or drug-polyamino acid conjugates, i.e. the modifying agent being a peptide, protein or polyamino acid which is covalently bonded or complexed to a therapeutically active agent
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K47/00Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient
    • A61K47/50Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates
    • A61K47/51Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent
    • A61K47/68Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent the modifying agent being an antibody, an immunoglobulin or a fragment thereof, e.g. an Fc-fragment
    • A61K47/6801Drug-antibody or immunoglobulin conjugates defined by the pharmacologically or therapeutically active agent
    • A61K47/6803Drugs conjugated to an antibody or immunoglobulin, e.g. cisplatin-antibody conjugates
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K47/00Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient
    • A61K47/50Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates
    • A61K47/51Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent
    • A61K47/68Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent the modifying agent being an antibody, an immunoglobulin or a fragment thereof, e.g. an Fc-fragment
    • A61K47/6835Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent the modifying agent being an antibody, an immunoglobulin or a fragment thereof, e.g. an Fc-fragment the modifying agent being an antibody or an immunoglobulin bearing at least one antigen-binding site
    • A61K47/6849Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent the modifying agent being an antibody, an immunoglobulin or a fragment thereof, e.g. an Fc-fragment the modifying agent being an antibody or an immunoglobulin bearing at least one antigen-binding site the antibody targeting a receptor, a cell surface antigen or a cell surface determinant
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/18Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans
    • C07K16/28Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants
    • C07K16/2878Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants against the NGF-receptor/TNF-receptor superfamily, e.g. CD27, CD30, CD40, CD95
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/18Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans
    • C07K16/32Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against translation products of oncogenes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • C12N9/1051Hexosyltransferases (2.4.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y204/00Glycosyltransferases (2.4)
    • C12Y204/01Hexosyltransferases (2.4.1)
    • C12Y204/01038Beta-N-acetylglucosaminylglycopeptide beta-1,4-galactosyltransferase (2.4.1.38)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y204/00Glycosyltransferases (2.4)
    • C12Y204/01Hexosyltransferases (2.4.1)
    • C12Y204/01092(N-acetylneuraminyl)-galactosylglucosylceramide N-acetylgalactosaminyltransferase (2.4.1.92)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/10Immunoglobulins specific features characterized by their source of isolation or production
    • C07K2317/14Specific host cells or culture conditions, e.g. components, pH or temperature
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/40Immunoglobulins specific features characterized by post-translational modification
    • C07K2317/41Glycosylation, sialylation, or fucosylation

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biochemistry (AREA)
  • Medicinal Chemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Immunology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Epidemiology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Animal Behavior & Ethology (AREA)
  • Veterinary Medicine (AREA)
  • Public Health (AREA)
  • Biophysics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Biomedical Technology (AREA)
  • Oncology (AREA)
  • Cell Biology (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)
  • Medicinal Preparation (AREA)
  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
  • Polysaccharides And Polysaccharide Derivatives (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

本发明涉及一种酶法修饰糖蛋白的方法。所述方法包括以下步骤:在为或衍生自β‑(1,4)‑N‑乙酰半乳糖胺转移酶的糖基转移酶的存在下,使包含含有末端GlcNAc部分的聚糖的糖蛋白与非天然的糖衍生物核苷酸接触。所述非天然的糖衍生物核苷酸如式(3)所示:其中A选自‑N3、‑C(O)R3、‑(CH2)iC≡C‑R4、‑SH、‑SC(O)R8、‑SC(O)OR8、‑SC(S)OR8、‑F、‑Cl、‑Br、‑I、‑OS(O)2R5、末端C2‑C24烯基、C3‑C5环烯基、C4‑C8链二烯基、末端C3‑C24丙二烯基和氨基。本发明还涉及一种通过本发明的方法可获得的糖蛋白,涉及一种可通过将糖蛋白与接头缀合物缀合而获得的生物缀合物,并且涉及可用于制备本发明的糖蛋白的β‑(1,4)‑N‑乙酰半乳糖胺转移酶。

Description

用为或衍生自β-(1,4)-N-乙酰半乳糖胺转移酶的糖基转移酶 修饰糖蛋白的方法
技术领域
本发明涉及酶法修饰糖蛋白的方法。更具体地,本发明涉及使用为或衍生自β-(1,4)-N-乙酰半乳糖胺转移酶的糖基转移酶,用糖衍生物核苷酸修饰糖蛋白的方法。本发明还涉及通过所述方法可获得的糖蛋白,涉及可通过将糖蛋白与接头缀合物缀合而获得的生物缀合物,并且涉及可用于制备本发明的糖蛋白的β-(1,4)-N-乙酰半乳糖胺转移酶。
背景技术
糖基转移酶构成参与糖蛋白和糖脂上存在的复合碳水化合物的合成的酶的超家族。糖基转移酶的基本作用是将核苷酸衍生物的糖基部分转移至特定的糖受体。β-1,4-半乳糖基转移酶(β4Gal-T)(EC 2.4.1.38)组成糖基转移酶超家族的亚家族之一,所述亚家族至少包含Gal-T1至Gal-T7七个成员,其催化半乳糖(Gal)从UDP-Gal转移至不同的糖受体。半乳糖转移酶在末端GlcNAc残基上产生的共有基序是乳糖胺序列Galβ4GlcNAc-R(LacNAc或LN),其随后通过添加其他糖和硫酸根基团以多种方式修饰。膜糖缀合物的最常见和最重要的糖结构是聚-N-乙酰乳糖胺(聚-LN),其连接至蛋白(或脂质),在细胞通讯、黏附和信号传导中起重要作用,并且是免疫应答调节中的重要分子。
在脊椎动物和无脊椎动物糖缀合物中存在的另一个共有的末端基序是GalNAcβ4GlcNAc-R(LaCdiNAc或LDN)序列。LDN基序存在于哺乳动物垂体糖蛋白激素中,其中末端GalNAc残基是4-O-硫酸化的,并且作为内皮细胞Man/S4GGnM受体清除的识别标志物发挥作用。然而,非垂体哺乳动物糖蛋白还含有LDN决定簇。此外,LDN和LDN序列的修饰是许多寄生线虫和吸虫中的常见抗原决定簇。LDN的生物合成涉及将GalNAc转移至末端GlcNAc,这是由高度特异性GalNAc转移酶执行的过程。例如由Miller等人在J.Biol.Chem.2008,283,第1985页(通过引用的方式纳入本文)中报道,认为两个密切相关的β1,4-N-乙酰半乳糖胺转移酶——β4GalNAc-T3和β4GalNAc-T4——引起β1,4连接的GalNAc至许多糖蛋白(包括糖蛋白促黄体激素(LH)和碳酸酐酶-6(CA6))上的Asn-连接的寡糖的蛋白特异性的添加。
已经在一系列生物体中鉴定了β-(1,4)-乙酰半乳糖胺转移酶(β-(1,4)-GalNAcT),所述生物体包括人、秀丽隐杆线虫(Caenorhabditiselegans)(Kawar等人,J.Biol.Chem.2002,277,34924,通过引用纳入本文)、黑腹果蝇(Drosophilamelanogaster)(Hoskins等人,Science 2007,316,1625,通过引用的方式纳入本文)和粉纹夜蛾(Trichoplusia ni)(Vadaie等人,J.Biol.Chem.2004,279,33501,通过引用的方式纳入本文)。
最后,除了参与N-糖蛋白修饰的GalT和GalNAcT之外,称为UDP-N-乙酰半乳糖胺:多肽N-乙酰半乳糖胺转移酶(也称为ppGalNAcT)的非相关类别的酶负责粘蛋白型连接(GalNAc-α-1-O-Ser/Thr)的生物合成。这些酶将GalNAc从糖供体UDP-GalNAc转移至丝氨酸和苏氨酸残基,形成O-糖蛋白中典型的α端基异构键。尽管ppGalNAcT催化功能看似简单,但是基于计算机分析估计仅有24种独特的ppGalNAcT人类基因。因为O-连接的糖基化逐步进行,将GalNAc添加到至丝氨酸或苏氨酸中代表粘蛋白生物合成中的第一个关键步骤。尽管这看似简单,但多个ppGalNAcT家族成员对于其蛋白底物的完全糖基化似乎是必需的。
已经表明,半乳糖基转移酶类除了转移天然底物UDP-Gal之外,还能够将一系列非天然半乳糖衍生物转移至受体GlcNAc底物。例如,Elling等人在ChemBioChem 2001,2,884(通过引用的方式纳入本文)中表明,通过在一系列半乳糖基转移酶的作用下从UDP-糖转移6-修饰的半乳糖,可以将含末端GlcNAc的蛋白质生物素化。类似地,Pannecoucke等人在Tetrahedron Lett.2008,49,2294(通过引用的方式纳入本文)中证实,在经受牛β1,4-半乳糖基转移酶之后,6-叠氮基-6-脱氧半乳糖可以(在一定程度上)从对应的UDP-糖转移至小分子GlcNAc底物上。在US2008/0108557(WO 2006/035057,Novo Nordisk A/S)中早先也报道了用于修饰的半乳糖衍生物的糖基转移酶的用途,其中要求在C-6处修饰的广泛范围的半乳糖衍生物(例如硫醇、叠氮化物、O-炔丙基、醛)可以在(牛或人)β1,4-半乳糖基转移酶的作用下,使用2-10当量的UDP-糖转移至GlcNAc底物上。然而,提供的用于支持这样的权利要求的数据仅涉及半乳糖的6-O-炔丙基和6-醛基变体。在C2处具有化学柄的许多GalNAc衍生物也被要求为糖基转移酶的底物,但没有提供实施例。
特别地,如由Ramakrishnan等人J.Biol.Chem.2002,23,20833(通过引用的方式纳入本文)所报道的,牛β4Gal-T1中Tyr-289残基至Leu-289的突变产生了酶的催化口袋,其可以有助于在C2处携带化学柄的UDP-Gal分子,例如2-酮基-Gal。通过包括首先转移非天然半乳糖部分,接着将肟连接到C-2柄上的两步过程,该突变型酶β4GalT(Y289L)已经用于体外检测蛋白上的O-GlcNAc残基或正常和恶性肿瘤组织的细胞表面聚糖上的末端GlcNAc部分的存在。
例如Khidekel等人,J.Am.Chem.Soc.2003,125,16162(通过引用的方式纳入本文)公开了非天然酮官能团到具有β4GalT(Y289L)的O-GlcNAc修饰的蛋白的化学选择性安装。酮部分充当独特标记物以使用肟连接用生物素来“标记”O-GlcNAc糖基化蛋白。一旦被生物素化,可以使用与辣根过氧化物酶(HRP)缀合的链霉亲和素通过化学发光来容易地检测糖缀合物。
例如WO 2007/095506、WO 2008/029281(均为Invitrogen Corporation的)、WO2014/065661(SynAffix B.V.)和Clark等人J.Am.Chem.Soc.2008,130,11576(均通过引用的方式纳入本文)报道了类似的方法,其使用β4GalT(Y289L)和半乳糖胺的叠氮乙酰基变体,取得了类似的成功。
例如US 8697061(Glykos)(通过引用的方式纳入本文)报道了一种类似的方法,其使用β4GalT(Y289L)和2-修饰的糖,获得类似的成功。
最近,突变体β4GalT(Y289L)也以制备方式应用于对抗体的重链聚糖进行位点选择性放射性标记,如Zeglis等人在Bioconj.Chem.2013,24,1057(通过引用的方式纳入本文)中所报道的。特别地,将叠氮化物修饰的N-乙酰半乳糖胺单糖(GalNAz)掺入至抗体的聚糖允许在合适的螯合剂的点击化学引入之后用89Zr进行受控标记。
Ramakrishnan等人在Biochemistry 2004,43,12513(通过引用的方式纳入本文)中描述了双突变体β4GalT(Y289L、M344H)失去其Mn2+依赖性活性的98%,但是在Mg2+存在下表现出25-30%的活性,包括转移C-2修饰的半乳糖底物的能力。发现双突变体β4GalT(Y289L、M344H)可用于体外半乳糖苷化测定,因为已知5-10mM Mn2+的典型需求对细胞具有潜在的细胞毒性作用。
Mercer等人,Bioconjugate.Chem.2013,24,144(通过引用的方式纳入本文)描述了在Mg 2+的存在下,双突变体Y289L-M344H-β4Gal-T1酶将GalNAc和类似物糖转移至受体GlcNAc。
使用野生型β-(1,4)-N-乙酰半乳糖胺转移酶(在本文也称为β-(1,4)-GalNAcT)来转移C-2修饰的GalNAc的尝试迄今已获得了小小的成功。
Bertozzi等人在ACS Chem.Biol.2009,4,1068(通过引用的方式纳入本文)中将生物正交化学报告技术应用于粘蛋白型O-聚糖在活的秀丽隐杆线虫中的分子成像。将蠕虫用N-乙酰半乳糖胺(GalNAz)的叠氮基-糖变体处理,使得能够体内掺入这种非天然糖。虽然观察到GalNAz代谢性掺入到糖蛋白中,但是对秀丽隐杆线虫溶解产物的软骨素酶ABC和肽N-糖苷酶F(PNGase F)消化,随后使用膦-Flag标签进行的施陶丁格连接(Staudingerligation)以及随后通过使用α-Flag抗体的Western印迹对糖蛋白的探测,表明糖蛋白上的大多数GalNAz残基位于除N-聚糖外的其他类型的聚糖中。此外,没有观察到叠氮化物标记的糖蛋白与N-聚糖特异性凝集素伴刀豆球蛋白A(ConA)的可检测的结合,这与绝大多数标记的聚糖是O-连接的而非N-连接的假说一致。基于这些观察结果,可以得出结论,GalNAz不会在该生物体中代谢性地掺入到N-GlcNAc化蛋白上。
最近,由Burnham-Marusich等人在Plos One 2012,7,e49020(通过引用的方式纳入本文)中得出了类似的结论,其中还观察到在PNGAse处理时缺乏信号减少——表明GalNAz在N-糖蛋白中没有明显掺入。Burnham-Marusich等人描述了使用末端炔烃探针与叠氮基标记的糖蛋白的Cu(I)-催化的叠氮化物-炔烃环化加成反应来检测代谢标记的糖蛋白的研究。结果表明大多数GalNAz标记掺入至对pNGase F不敏感、因此不是N-糖蛋白的聚糖类。
β-(1,4)-GalNAcT对UDP-GalNAc的高底物特异性从对UDP-GlcNAc、UDP-Glc和UDP-Gal的差的识别中变得显而易见,对UDP-GlcNAc、UDP-Glc和UDP-Gal分别仅有0.7%、0.2%和1%的转移酶活性残留,如Kawar等人,J.Biol.Chem.2002,277,34924(通过引用的方式纳入本文)中所报道的。
综上,没有通过非天然GalNAc衍生物(如2-酮基或2-叠氮乙酰基衍生物)的GalNAc转移酶的方式来修饰糖蛋白的体外方法的报道是不足为奇的。
同时,已由Qasba等人,J.Mol.Biol.2007,365,570(通过引用的方式纳入本文)报道,无脊椎动物GalNAcT中的Ile或Leu活性位点残基——对应于人β4Gal-T1同源酶(ortholog enzyme)中的Tyr-289残基——到Tyr残基的置换,通过将N-乙酰半乳糖胺基转移酶活性降低近1000倍,同时将其半乳糖基转移酶活性提高80倍,将酶转化为β(1,4)半乳糖基转移酶。
Taron等人,Carbohydr.Res.2012,362,62(通过引用的方式纳入本文)描述了GalNAz在GPI锚中的体内代谢掺入。
发明内容
本发明涉及一种修饰糖蛋白的方法,所述方法包括以下步骤:在糖基转移酶的存在下,使糖蛋白与糖衍生物核苷酸Su(A)-Nuc接触,所述糖蛋白包含含有末端GlcNAc部分的聚糖,其中:
(i)所述糖基转移酶为或衍生自β-(1,4)-N-乙酰半乳糖胺转移酶;
(ii)所述含有末端GlcNAc部分的聚糖如式(1)或(2)所示:
其中:
b为0或1;
d为0或1;
e为0或1;以及
G为单糖、或包含2至20个糖部分的直链或支链寡糖;以及
(iii)所述糖衍生物核苷酸Su(A)-Nuc如式(3)所示:
其中:
a为0或1;
f为0或1;
g为0或1;
Nuc为核苷酸;
U为[C(R1)2]n或[C(R1)2]p-O-[C(R1)2C(R1)2O]o-[C(R1)2]q,其中n为1至24的整数;o为0至12的整数;p和q独立地为0、1或2;R1独立地选自H、F、Cl、Br、I、OH和任选取代的C1-C24烷基;
T为C3-C12(杂)亚芳基,其中(杂)亚芳基被任选地取代;
A选自:
(a)-N3
(b)-C(O)R3
其中R3为任选取代的C1-C24烷基;
(c)(杂)环炔基或-(CH2)iC≡C-R4部分
其中i为0-10且R4为氢或任选取代的C1-C24烷基;
(d)-SH
(e)-SC(O)R8
其中R8为任选取代的C1-C24烷基或苯基;
(f)-SC(V)OR8
其中V为O或S,R8为任选取代的C1-C24烷基或苯基;
(g)-X
其中X选自F、Cl、Br和I;
(h)-OS(O)2R5
其中R5选自C1-C24烷基、C6-C24芳基、C7-C24烷基芳基和C7-C24芳基烷基,所述烷基、芳基、烷基芳基和芳基烷基被任选地取代;
(i)R12
其中R12选自任选取代的末端C2-C24烯基、C3-C5环烯基和C4-C8链二烯基;以及
(j)R13
其中R13为任选取代的末端C3-C24丙二烯基;以及
(k)N(R17)2
其中R17独立地选自H和C1-C12烷基;
Z为CH2、CF2或C(O);或Z为CHOH,条件是当Z为CHOH时,g为0、f为1且a为0或1;
Y选自O、S、N(R15)、N(R15)C(O)、N(R15)C(O)N(R15)、N(R15)C(O)O、OC(O)N(R15)S(O)2N(R15)和N(R15)C(O)N(R15)S(O)2O,其中R15独立地选自H、C1-C12烷基和(U)f-(T)a-A,其中f、a、U、T和A如上所定义;以及
R14独立地选自:
其中:
a、f、T、A和U如上所定义;
h为0或1;以及
W选自O、S、NR15、NHS(O)2O和NHS(O)2NR15,其中R15如上所定义。
本发明还涉及通过本发明的方法可获得的糖蛋白。
附图说明
在图1中示出了可通过本发明的方法修饰的糖蛋白的几个实例,所述糖蛋白包含含有末端GlcNAc部分的聚糖。
在图2中示出了修饰糖蛋白的方法的实施方案,其中所述糖蛋白是抗体。在该实施方案中,糖衍生物Su(A)-Nuc在糖基转移酶(其中糖基转移酶为或衍生自β-(1,4)-N-乙酰半乳糖胺转移酶)的作用下连接到抗体聚糖的末端GlcNAc部分,形成经修饰的抗体。
图3示出了抗体聚糖G0、G1、G2、G0F、G1F和G2F的不同糖型。
图4示出了一种通过用唾液酸酶和半乳糖苷酶处理糖型G0、G1、G2、G0F、G1F和G2F的混合物来提供包含式(10)的聚糖的糖蛋白的方法,以及通过用内切糖苷酶处理糖型G0、G1、G2、G0F、G1F和G2F的混合物来提供包含式(1)的聚糖的糖蛋白的方法。包含式(10)或(1)的聚糖的糖蛋白与叠氮基修饰的UDP-GalNAc衍生物(例如6-叠氮基GalNAc)的孵育分别得到叠氮基修饰的糖蛋白(33)或(32)。
图5示出了在本发明的经修饰的糖蛋白中的代表性的一组官能团(A),其经与反应性基团Q1的反应得到连接基团CG和官能化的糖蛋白。
具体实施方式
定义
如本说明书和权利要求书中使用的动词“包含”及其变化形式以其非限制性意义使用,意指包括该词之后的项目,但不排除未具体提及的项目。
另外,通过不定冠词“一(a)”或“一个(an)”提及要素不排除存在多于一个要素的可能性,除非上下文清楚地要求存在一个且仅存在一个该要素。因此,不定冠词“一”或“一个”通常意指“至少一个”。
未取代的烷基具有通式CnH2n+1,并且可以是直链的或支链的。未取代的烷基还可以含有环状部分,因此具有随之而来的通式CnH2n-1。任选地,烷基被本文中进一步详细说明的一个或多个取代基取代。烷基的实例包括甲基、乙基、丙基、2-丙基、叔丁基、1-己基、1-十二烷基等。
芳基包含6至12个碳原子并且可以包括单环结构和双环结构。任选地,芳基可以被本文中进一步详细说明的一个或多个取代基取代。芳基的实例是苯基和萘基。
芳基烷基和烷基芳基包含至少七个碳原子,并且可以包括单环结构和双环结构。任选地,芳基烷基和烷基芳基可以被本文中进一步详细说明的一个或多个取代基取代。芳基烷基为例如苄基。烷基芳基为例如4-叔丁基苯基。
杂芳基包含至少两个碳原子(即至少C2)和一个或多个杂原子N、O、P或S。杂芳基可具有单环结构或双环结构。任选地,杂芳基可以被本文中进一步详细说明的一个或多个取代基取代。合适的杂芳基的实例包括吡啶基、喹啉基、嘧啶基、吡嗪基、吡唑基、咪唑基、噻唑基、吡咯基、呋喃基、三唑基、苯并呋喃基、吲哚基、嘌呤基、苯并噁唑基、噻吩基、磷酰基和噁唑基。
杂芳基烷基和烷基杂芳基包含至少三个碳原子(即至少C3),并且可以包括单环结构和双环结构。任选地,杂芳基可以被本文中进一步详细说明的一个或多个取代基取代。
当芳基被表示为(杂)芳基时,该表示意指包括芳基和杂芳基。类似地,烷基(杂)芳基意指包括烷基芳基和烷基杂芳基,并且(杂)芳基烷基意指包括芳基烷基和杂芳基烷基。因此,C2-C24(杂)芳基被解释为包括C2-C24杂芳基和C6-C24芳基。类似地,C3-C24烷基(杂)芳基意指包括C7-C24烷基芳基和C3-C24烷基杂芳基,并且C3-C24(杂)芳基烷基意指包括C7-C24芳基烷基和C3-C24杂芳基烷基。
除非另有说明,烷基、烯基、烯烃、炔烃、(杂)芳基、(杂)芳基烷基、烷基(杂)芳基、亚烷基、亚烯基、环亚烷基、(杂)亚芳基、烷基(杂)亚芳基、(杂)芳基亚烷基、烯基、炔基、环烷基、烷氧基、烯氧基、(杂)芳氧基、炔氧基和环烷氧基可以被一个或多个独立地选自以下的取代基取代:C1-C12烷基、C2-C12烯基、C2-C12炔基、C3-C12环烷基、C5-C12环烯基、C8-C12环炔基、C1-C12烷氧基、C2-C12烯氧基、C2-C12炔氧基、C3-C12环烷氧基、卤素、氨基、氧代和甲硅烷基,其中甲硅烷基可以由式(R2)3Si-表示,其中R2独立地选自C1-C12烷基、C2-C12烯基、C2-C12炔基、C3-C12环烷基、C1-C12烷氧基、C2-C12烯氧基、C2-C12炔氧基和C3-C12环烷氧基,其中烷基、烯基、炔基、环烷基、烷氧基、烯氧基、炔氧基和环烷氧基被任选地取代,烷基、烷氧基、环烷基和环烷氧基被一个或多个选自O、N和S的杂原子任选地间隔。
炔基包含碳-碳三键。包含一个三键的未取代的炔基具有通式CnH2n-3。末端炔基是其中三键位于碳链的末端位置的炔基。任选地,炔基被一个或多个本文中进一步详细说明的取代基取代,和/或被选自氧、氮和硫的杂原子间隔。炔基的实例包括乙炔基、丙炔基、丁炔基、辛炔基等。
环炔基是环状炔基。包含一个三键的未取代的环炔基具有通式CnH2n-5。任选地,环炔基被一个或多个本文中进一步详细说明的取代基取代。环炔基的实例是环辛炔基。
杂环炔基是被选自氧、氮和硫的杂原子间隔的环炔基。任选地,杂环炔基被一个或多个本文中进一步详细说明的取代基取代。杂环炔基的实例是氮杂环辛炔基。
(杂)芳基包括芳基和杂芳基。烷基(杂)芳基包括烷基芳基和烷基杂芳基。(杂)芳基烷基包括芳基烷基和杂芳基烷基。(杂)炔基包括炔基和杂炔基。(杂)环炔基包括环炔基和杂环炔基。
本文中的(杂)环炔化合物定义为包含(杂)环炔基的化合物。
本说明书和权利要求书中公开的几种化合物可以描述为稠合(杂)环炔化合物,即其中第二个环结构是与(杂)环炔基稠合(即成环)的(杂)环炔化合物。例如在稠合(杂)环辛炔化合物中,环烷基(例如环丙基)或芳烃(例如苯)可以与(杂)环辛炔基成环。稠合(杂)环辛炔化合物中的(杂)环辛炔基的三键可以位于三个可能位置的任一个上,即在环辛炔部分的2、3或4位上(根据“IUPAC Nomenclature of OrganicChemistry”,Rule A31.2编号)。本说明书和权利要求书中对任何稠合(杂)环辛炔化合物的描述意指包括环辛炔部分的所有三种单独的区域异构体。
本文中的一般性术语“糖”用于表示单糖,例如葡萄糖(Glc)、半乳糖(Gal)、甘露糖(Man)和岩藻糖(Fuc)。本文中的术语“糖衍生物”用于表示单糖的衍生物,即包含取代基和/或官能团的单糖。糖衍生物的实例包括氨基糖和糖酸,例如葡糖胺(GlcNH2)、半乳糖胺(GalNH2)、N-乙酰葡糖胺(GlcNAc)、N-乙酰半乳糖胺(GalNAc)、唾液酸(Sia)(其也称为N-乙酰神经氨酸(NeuNAc)),以及N-乙酰胞壁酸(MurNAc)、葡糖醛酸(GlcA)和艾杜糖醛酸(IdoA)。
本文中的术语“核苷酸”以其通常的科学含义使用。术语“核苷酸”是指由核碱基、五碳糖(核糖或2-脱氧核糖)和一个、两个或三个磷酸基团组成的分子。没有磷酸基团,核碱基和糖组成核苷。因此,核苷酸也可以称为一磷酸核苷、二磷酸核苷或三磷酸核苷。核碱基可以是腺嘌呤、鸟嘌呤、胞嘧啶、尿嘧啶或胸腺嘧啶。核苷酸的实例包括尿苷二磷酸(UDP)、鸟苷二磷酸(GDP)、胸苷二磷酸(TDP)、胞苷二磷酸(CDP)和胞苷一磷酸(CMP)。
本文中的术语“蛋白”以其通常的科学含义使用。在本文中,包含约10个或更多个氨基酸的多肽被认为是蛋白。蛋白可以包含天然的氨基酸,但也包括非天然的氨基酸。
本文中的术语“糖蛋白”以其通常的科学含义使用,并且是指包含与蛋白共价键合的一个或多个单糖链或寡糖链(“聚糖”)的蛋白。聚糖可以连接到蛋白的羟基上(O-连接的聚糖),例如,连接到丝氨酸、苏氨酸、酪氨酸、羟赖氨酸或羟脯氨酸的羟基上;或连接到蛋白的氮官能团上(N-糖蛋白),例如天冬酰胺或精氨酸;或连接到蛋白的碳上(C-糖蛋白),例如色氨酸。糖蛋白可以包含一个以上的聚糖,可以包含一个或多个单糖和一个或多个寡糖聚糖的组合,并且可以包含N-连接的、O-连接的和C-连接的聚糖的组合。据估计,超过50%的所有蛋白具有某种形式的糖基化,因此被认为是糖蛋白。糖蛋白的实例包括PSMA(前列腺特异性膜抗原)、CAL(南极假丝酵母脂肪酶)、gp41、gp120、EPO(促红细胞生成素)、抗冻蛋白和抗体。
本文中的术语“聚糖”以其通常的科学含义使用,并且是指与蛋白连接的单糖链或寡糖链。因此,术语聚糖是指糖蛋白的碳水化合物部分。聚糖经由一个糖的C-1碳连接至蛋白,所述糖可以不经进一步取代(单糖)或可以在其一个或多个羟基上被进一步取代(寡糖)。天然存在的聚糖通常包含1至约10个糖类部分。然而,当更长的糖链与蛋白连接时,所述糖链在本文中也被认为是聚糖。
糖蛋白的聚糖可以是单糖。通常,糖蛋白的单糖聚糖由与蛋白共价连接的单一的N-乙酰葡糖胺(GlcNAc)、葡萄糖(Glc)、甘露糖(Man)或岩藻糖(Fuc)组成。
聚糖也可以是寡糖。糖蛋白的寡糖链可以是直链或支链的。在寡糖中,直接连接至蛋白的糖称为核心糖。在寡糖中,不直接连接至蛋白并连接至至少两种其他糖的糖称为内部糖。在寡糖中,不直接连接至蛋白而是连接至单个其他糖的糖,即在其一个或多个其他羟基处不具有其他糖取代基的糖,称为末端糖。为了避免疑义,在糖蛋白的寡糖中可以存在多个末端糖,但是仅存在一个核心糖。
聚糖可以是O-连接的聚糖、N-连接的聚糖或C-连接的聚糖。在O-连接的聚糖中,单糖或寡糖聚糖通常经由丝氨酸(Ser)或苏氨酸(Thr)的羟基与蛋白的氨基酸中的O原子键合。在N-连接的聚糖中,单糖或寡糖聚糖经由蛋白的氨基酸中的N-原子,通常经由天冬酰胺(Asn)或精氨酸(Arg)侧链中的酰胺氮与蛋白键合。在C-连接的聚糖中,单糖或寡糖聚糖与蛋白的氨基酸中的C-原子键合,通常与色氨酸(Trp)的C-原子键合。
与蛋白直接连接的寡糖的末端称为聚糖的还原末端。寡糖的另一端称为聚糖的非还原端。
对于O-连接的聚糖,存在多种多样的链。天然存在的O-连接的聚糖的特征通常在于丝氨酸或苏氨酸连接的α-O-GalNAc部分,其进一步用另一个GalNAc、半乳糖、GlcNAc、唾液酸和/或岩藻糖取代。具有聚糖取代的羟基化氨基酸可以是蛋白中任何氨基酸序列的一部分。
对于N-连接的聚糖,存在多种多样的链。天然存在的N-连接的聚糖的特征通常在于天冬酰胺连接的β-N-GlcNAc部分,进而在其4-OH处用β-GlcNAc进一步取代,进而在其4-OH处用β-Man进一步取代,进而在其3-OH和6-OH处用α-Man进一步取代,得到聚糖戊多糖Man3GlcNAc2。核心GlcNAc部分可以在其6-OH处被α-Fuc进一步取代。戊多糖Man3GlcNAc2是几乎所有N-连接的糖蛋白的常见寡糖支架,并且可以携带多种其他取代基,包括但不限于Man、GlcNAc、Gal和唾液酸。在其侧链上用聚糖取代的天冬酰胺通常是序列Asn-X-Ser/Thr的一部分,其中X为除了脯氨酸以外的任何氨基酸,Ser/Thr是丝氨酸或苏氨酸。
本文中的术语“抗体”以其通常的科学含义使用。抗体是由免疫系统产生的能够识别和结合至特定抗原的蛋白。抗体是糖蛋白的一个实例。本文中的术语抗体以其最广泛的含义使用,并具体包括单克隆抗体、多克隆抗体、二聚体、多聚体、多特异性抗体(例如双特异性抗体)、抗体片段以及双链抗体和单链抗体。本文中的术语“抗体”还意指包括人抗体、人源化抗体、嵌合抗体和特异性结合癌抗原的抗体。术语“抗体”意指包括全抗体,但也包括抗体的片段,例如抗体Fab片段、F(ab’)2、来自切割抗体的Fv片段或Fc片段、scFv-Fc片段、微抗体、双特异抗体或scFv。此外,该术语包括基因工程抗体和抗体的衍生物。抗体、抗体的片段和遗传工程抗体可以通过本领域已知的方法获得。合适的市售抗体主要包括阿昔单抗、利妥昔单抗、巴利昔单抗、帕利珠单抗、英夫利昔单抗、曲妥珠单抗、阿仑珠单抗、阿达木单抗、托西莫单抗-I131、西妥昔单抗、ibrituximab tiuxetan、奥马珠单抗、贝伐单抗、那他珠单抗、雷珠单抗、帕尼单抗、依库珠单抗、赛妥珠单抗(certolizumab pegol)、戈利木单抗、卡那奴单抗、卡妥索单抗、乌司奴单抗、托珠单抗、奥法木单抗、地舒单抗、贝利木单抗、伊匹木单抗和本妥昔单抗(brentuximab)。
同一性/相似性
在本发明的上下文中,蛋白或蛋白片段由氨基酸序列表示。
应理解,如本文中通过给定的序列身份号(SEQ ID NO)所确定的每个蛋白或蛋白片段或肽或衍生肽或多肽不限于所公开的这种特定序列。本文中的“序列同一性”定义为通过比较序列确定的两个或更多个氨基酸(多肽或蛋白)序列之间的关系。在本领域中,“同一性”还意指根据情况可通过这种序列的字符串之间的匹配确定的氨基酸序列之间的序列相似性程度。除非本文另有说明,与给定SEQ ID NO的同一性或相似性意指基于所述序列的全长(即在其整个长度上或作为整体)的同一性或相似性。
本发明包含的与由其SEQ ID NO所定义的具体指定序列具有小于100%序列同一性的任何酶优选具有为与由SEQ ID NO所定义的所述序列具有100%同一性的酶的酶活性的至少10%、20%、30%、40%、50%、60%、70%或优选至少80%或90%或至少100%的酶活性。
两个氨基酸序列之间的“相似性”通过将一个多肽的氨基酸序列和其保守氨基酸取代物与第二多肽的序列进行比较来确定。“同一性”和“相似性”可以通过已知方法容易地计算,包括但不限于在以下中描述的那些:Computational Molecular Biology,Lesk,A.M.编辑,牛津大学出版社,纽约,1988;Biocomputing:Informatics and Genome Projects,Smith,D.W.编辑,Academic Press,纽约,1993;Computer Analysis of Sequence Data,Part I,Griffin,A.M.,和Griffin,H.G.编辑,胡玛纳出版社,新泽西州,1994;SequenceAnalysis in Molecular Biology,von Heine,G.,AcademicPress,1987;以及SequenceAnalysis Primer,Gribskov,M.和Devereux,J.,eds.,M Stockton Press,纽约,1991以及Carillo,H.,和Lipman,D.,SIAM J.Applied Math.,48:1073(1988)。
设计确定同一性的优选方法以在测试的两个或更多个序列之间给出最大匹配。确定同一性和相似性的方法编码在可公开获得的计算机程序中。确定两个序列之间的同一性和相似性的优选计算机程序方法包括例如GCG程序包(Devereux,J.等人,Nucleic AcidsResearch 12(1):387(1984))、BestFit、BLASTP、BLASTN和FASTA(Altschul,S.F.等人,J.Mol.Biol.215:403-410(1990))。BLAST X程序可公开获自NCBI和其他来源(BLASTManual,Altschul,S.,等人,NCBI NLM NIH Bethesda,MD20894;Altschul,S.等人,J.Mol.Biol.215:403-410(1990))。众所周知的Smith Waterman算法也可用于确定同一性。
用于多肽序列比较的优选参数包括如下内容:算法:Needleman和Wunsch,J.Mol.Biol.48:443-453(1970);比较矩阵:来自Hentikoff和Hentikoff的BLOSSUM62,Proc.Natl.Acad.Sci.USA.89:10915-10919(1992);缺口罚分:12;以及缺口长度罚分:4。具有这些参数的有用的程序作为“Ogap”程序公开获自位于Madison,WI的GeneticsComputerGroup。上述参数是用于氨基酸比较的默认参数(以及对于末端缺口没有罚分)。
任选地,在确定氨基酸相似性程度时,技术人员还可以考虑所谓的“保守”氨基酸置换,这对技术人员将是清楚的。保守氨基酸置换是指具有相似侧链的残基的可互换性。例如,具有脂肪族侧链的氨基酸组是甘氨酸、丙氨酸、缬氨酸、亮氨酸和异亮氨酸;具有脂肪族-羟基侧链的氨基酸组是丝氨酸和苏氨酸;具有含酰胺侧链的氨基酸组是天冬酰胺和谷氨酰胺;具有芳族侧链的氨基酸组是苯丙氨酸、酪氨酸和色氨酸;具有碱性侧链的氨基酸组是赖氨酸、精氨酸和组氨酸;具有含硫侧链的氨基酸组是半胱氨酸和甲硫氨酸。优选的保守氨基酸置换基是:缬氨酸-亮氨酸-异亮氨酸、苯丙氨酸-酪氨酸、赖氨酸-精氨酸、丙氨酸-缬氨酸和天冬酰胺-谷氨酰胺。本文公开的氨基酸序列的置换变体是其中已经除去所公开序列中的至少一个残基并且在其位置插入不同残基的那些。优选地,氨基酸改变是保守的。每个天然存在的氨基酸的优选保守置换如下:Ala至Ser;Arg至Lys;Asn至Gln或His;Asp至Glu;Cys至Ser或Ala;Gln至Asn;Glu至Asp;Gly至Pro;His至Asn或Gln;Ile至Leu或Val;Leu至Ile或Val;Lys至Arg;Gln或Glu;Met至Leu或Ile;Phe至Met、Leu或Tyr;Ser至Thr;Thr至Ser;Trp至Tyr或His;Tyr至Trp或Phe;以及Val至Ile或Leu。
用于修饰糖蛋白的方法
本发明涉及用于在糖基转移酶的作用下修饰糖蛋白以获得经修饰的糖蛋白的方法,其中所述糖基转移酶为或衍生自β-(1,4)-N-乙酰半乳糖胺转移酶。优选地,所述方法是体外方法。
具体地,本发明涉及用于修饰糖蛋白的方法,所述方法包括以下步骤:在糖基转移酶的存在下,将糖蛋白与糖衍生物核苷酸Su(A)-Nuc接触,所述糖蛋白包含含有末端GlcNAc部分的聚糖,其中:
(i)所述糖基转移酶为或衍生自β-(1,4)-N-乙酰半乳糖胺转移酶;
(ii)所述含有末端GlcNAc部分的聚糖如式(1)或(2)所示:
其中:
b为0或1;
d为0或1;
e为0或1;以及
G为单糖,或包含2至20个糖部分的直链或支链寡糖;以及
(iii)所述糖衍生物核苷酸Su(A)-Nuc如式(3)所示:
其中:
a为0或1;
f为0或1;g为0或1;
Nuc为核苷酸;
U为[C(R1)2]n或[C(R1)2]p-O-[C(R1)2C(R1)2O]o-[C(R1)2]q,其中n为1至24的整数;o为0至12的整数;p和q独立地为0、1或2;R1独立地选自H、F、Cl、Br、I、OH和任选取代的C1-C24烷基;
T为C3-C12(杂)亚芳基,其中(杂)亚芳基被任选地取代;
A选自:
(a)-N3
(b)-C(O)R3
其中R3为任选取代的C1-C24烷基;
(c)(杂)环炔基或-(CH2)iC≡C-R4部分
其中i为0-10且R4为氢或任选取代的C1-C24烷基;
(d)-SH
(e)-SC(O)R8
其中R8为任选取代的C1-C24烷基或苯基;
(f)-SC(V)OR8
其中V为O或S,R8为任选取代的C1-C24烷基或苯基;
(g)-X
其中X选自F、Cl、Br和I;
(h)-OS(O)2R5
其中R5选自C1-C24烷基、C6-C24芳基、C7-C24烷基芳基和C7-C24芳基烷基,所述烷基、芳基、烷基芳基和芳基烷基被任选地取代;
(i)R12
其中R12选自任选取代的末端C2-C24烯基、C3-C5环烯基和C4-C8链二烯基;以及
(j)R13
其中R13为任选取代的末端C3-C24丙二烯基;以及
(k)N(R17)2
其中R17独立地选自H和C1-C12烷基;
Z为CH2、CF2或C(O);或Z为CHOH,条件是当Z为CHOH时,g为0、f为1且a为0或1;
Y选自O、S、N(R15)、N(R15)C(O)、N(R15)C(O)N(R15)、N(R15)C(O)O、OC(O)N(R15)S(O)2N(R15)和N(R15)C(O)N(R15)S(O)2O,其中R15独立地选自H、C1-C12烷基和(U)f-(T)a-A,其中f、a、U、T和A如上所定义;以及
R14选自:
其中:
a、f、T、A和U如上所定义;
h为0或1;以及
W选自O、S、NR15、NHS(O)2O和NHS(O)2NR15,其中R15如上所定义。
在一个实施方案中,如式(3)所示的Su(A)-Nuc中的A选自如上所定义的选项(a)至(j)。在另一个实施方案中,如式(3)所示的Su(A)-Nuc中的A选自如上定义的选项(a)至(d)和(g)至(k),更优选选自(a)至(d)和(g)至(j)。
如上所述,本发明用于修饰糖蛋白的方法提供了经修饰的糖蛋白。在本文中,经修饰的糖蛋白定义为包含式(4)或(5)的聚糖的糖蛋白:
其中:
b、d、e和G如上所定义;以及
Su(A)是式(6)的糖衍生物:
其中:
R14、Z、Y、U、T、A、g、f和a如上所定义。
在式(4)和(5)的经修饰的糖蛋白聚糖中,糖衍生物Su(A)的C1经由β-1,4-O-糖苷键连接至GlcNAc部分的C4。
用于修饰糖蛋白的方法可以进一步包括以下步骤:提供包含含有末端GlcNAc部分的聚糖的糖蛋白。因此,本发明还涉及用于修饰糖蛋白的方法,其包括以下步骤:
(1)提供包含含有末端GlcNAc部分的聚糖的糖蛋白,其中含有末端GlcNAc部分的聚糖如上文定义的式(1)或(2)所示;以及
(2)在糖基转移酶的存在下、更特别是在糖基转移酶的作用下,将所述糖蛋白与糖衍生物核苷酸Su(A)-Nuc接触,其中所述糖基转移酶为或衍生自β-(1,4)-N-乙酰半乳糖胺转移酶,并且其中Su(A)-Nuc如上文定义的式(3)所示。
下文更详细地描述了包含含有末端GlcNAc部分的聚糖的糖蛋白、糖衍生物核苷酸Su(A)-Nuc和经修饰的糖蛋白,及其优选的实施方案。
下文更详细地描述了为或衍生自β-(1,4)-N-乙酰半乳糖胺转移酶的糖基转移酶。
在本发明的方法的优选实施方案中,β-(1,4)-N-乙酰半乳糖胺转移酶为或衍生自选自SEQ ID NO:2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、25、26、27、28、29、30、31、32、33、34、46、47、49、50、51、52、53、54、55、56、57、58、59、71、72和73的序列。当R14为-NHC(O)CH3、-NHC(O)-(W)h-(U)f-(T)a-A或-N3时,该实施方案是特别优选的。
在本发明的方法的另一个优选实施方案中,β-(1,4)-N-乙酰半乳糖胺转移酶为或衍生自SEQ ID NO:35、36、37、38、39、40、41、42、43、44、45、48、60、61、62、63、64、65、66、67、68、69、70和74。当R14为-OH时,该实施方案是特别优选的。
在本发明的方法的另一个优选实施方案中,β-(1,4)-N-乙酰半乳糖胺转移酶与选自SEQ ID NO:2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、25、26、27、28、29、30、31、32、33、34、46、47、49、50、51、52、53、54、55、56、57、58、59、71、72和73的序列具有至少50%的同一性。在该实施方案中进一步优选β-(1,4)-N-乙酰半乳糖胺转移酶与选自SEQ ID NO:2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、25、26、27、28、29、30、31、32、33、34、46、47、49、50、51、52、53、54、55、56、57、58、59、71、72和73的序列具有至少55%的序列同一性,优选至少60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或优选100%的序列同一性。当R14为-NHC(O)CH3、-NHC(O)-(W)h-(U)f-(T)a-A或-N3时,这些实施方案是特别优选的。
在本发明的方法的另一个优选实施方案中,β-(1,4)-N-乙酰半乳糖胺转移酶与选自SEQ ID NO:35、36、37、38、39、40、41、42、43、44、45、48、60、61、62、63、64、65、66、67、68、69、70和74的序列具有至少50%的同一性。在该实施方案中进一步优选β-(1,4)-N-乙酰半乳糖胺转移酶与选自SEQ ID NO:35、36、37、38、39、40、41、42、43、44、45、48、60、61、62、63、64、65、66、67、68、69、70和74的序列具有至少55%的序列同一性,优选至少60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或优选100%的序列同一性。当R14为-OH时,这些实施方案是特别优选的。
糖蛋白
在本发明的方法中待修饰的糖蛋白包含聚糖,所述聚糖含有末端GlcNAc部分,即存在于聚糖的非还原端的GlcNAc部分。所述聚糖包含一个或多个糖部分,并且可以是直链的或支链的。含有末端GlcNAc部分的聚糖如式(1)或(2)所示:
其中:
b为0或1;
d为0或1;
e为0或1;以及
G为单糖,或包含2至20个糖部分的直链或支链寡糖。
所述待修饰的糖蛋白可包含多于一个含有末端GlcNAc部分的聚糖。当是这种情况时,两种或更多种聚糖可互不相同。所述糖蛋白还可以包含一种或多种不含有末端GlcNAc部分的其他聚糖。
核心GlcNAc部分(即连接至蛋白的GlcNAc部分)任选地被岩藻糖基化(b为0或1)。当核心GlcNAc部分被岩藻糖基化时,岩藻糖最通常地将α-1,6连接至所述GlcNAc部分的C6。
应注意,式(1)中b为1的聚糖的GlcNAc部分,即由岩藻糖基化的GlcNAc组成的聚糖中的GlcNAc部分,在本文中也被认为是末端GlcNAc部分。
在一个实施方案中,含有末端GlcNAc部分的聚糖由一个GlcNAc部分组成,并且所述聚糖是式(1)中b为0的聚糖。在另一个实施方案中,所述聚糖由岩藻糖基化的GlcNAc部分组成,并且所述聚糖是式(1)中b为1的聚糖。
在另一个实施方案中,所述聚糖是式(2)的聚糖,其中核心GlcNAc(如果存在)被任选地岩藻糖基化(b为0或1)。在式(2)的聚糖中,G表示单糖或包含1至20个,优选1至12个,更优选1至10个,甚至更优选1、2、3、4、5、6、7或8个,最优选1、2、3、4、5或6个糖部分的直链或支链寡糖。当G是支链寡糖时,G可以包含一个或多个末端GlcNAc部分。因此,式(2)的聚糖可包含一个以上的末端GlcNAc部分。在聚糖(2)中,优选当d为0时,e为1,以及当e为0时,d为1。更优选地,在聚糖(2)中d为1,甚至更优选d为1且e为1。
可存在于聚糖中的糖部分是本领域技术人员已知的,包括例如葡萄糖(Glc)、半乳糖(Gal)、甘露糖(Man)、岩藻糖(Fuc)、N-乙酰葡萄糖胺(GlcNAc)、N-乙酰半乳糖胺(GalNAc)、N-乙酰神经氨酸(NeuNAc)或唾液酸以及木糖(Xyl)。
在本发明的方法的一个优选的实施方案中,含有末端GlcNAc部分的聚糖如式(1)所示,如上所定义。在另一个优选的实施方案中,含有末端GlcNAc部分的聚糖如式(2)所示。进一步优选聚糖是N-连接的聚糖。当聚糖是如式(2)所示的N-连接的聚糖时,优选d为1。
当含有末端GlcNAc部分的聚糖如式(2)所示时,进一步优选如式(2)所示的聚糖是如式(9)、(10)、(11)、(12)、(13)或(14)所示的聚糖:
其中b为0或1。
在本发明的方法的一个优选的实施方案中,含有末端GlcNAc部分的聚糖是如式(1)、(9)、(10)、(11)、(12)、(13)或(14)所示的聚糖,更优选如式(1)、(9)、(10)、(11)、(12)、(13)或(14)所示的N-连接的聚糖。在其他优选的实施方案中,含有末端GlcNAc部分的聚糖是如式(1)、(9)、(10)或(11)所示的聚糖,更优选如式(1)、(9)、(10)或(11)所示的N-连接的聚糖。最优选地,含有末端GlcNAc部分的聚糖是如式(1)或(10)所示的聚糖,更优选如式(1)所示的N-连接的聚糖。
包含含有末端GlcNAc部分的聚糖的糖蛋白优选如式(7)、(8)或(8b)所示:
其中:
b、d、e和G及其优选的实施方案如上所定义;
y独立地为1至24的整数;以及
Pr为蛋白。
在本发明的方法中待修饰的糖蛋白包含一个或多个含有末端GlcNAc部分的聚糖(y为1至24)。优选地,y是1至12的整数,更优选地是1至10的整数。更优选地,y是1、2、3、4、5、6、7或8,还更优选地,y是1、2、3、4、5或6。甚至更优选地,y是1、2、3或4。当所述待修饰的糖蛋白包含多于一个聚糖时(y为2或更多),所述聚糖可互不相同。如上文所述,糖蛋白还可以包含一个或多个不具有末端GlcNAc部分的聚糖。
当本发明的方法中待修饰的糖蛋白如式(7)、(8)或(8b)所示时,还优选含有末端GlcNAc部分的聚糖是如式(1)、(9)、(10)、(11)、(12)、(13)或(14)所示的聚糖,优选N-连接的聚糖,如上文所述,更优选如式(1)、(9)、(10)或(11)所示且甚至更优选如式(1)或(10)所示的聚糖,优选N-连接的聚糖。最优选地,含有末端GlcNAc部分的聚糖是如式(1)所示的N-连接的聚糖。
在本发明的方法的一个优选的实施方案中,包含含有末端GlcNAc部分的聚糖的糖蛋白是抗体,更优选如式(7)、(8)或(8b)所示的抗体,其中蛋白(Pr)是抗体(Ab)。并且,当待修饰的糖蛋白是抗体且所述抗体包含多于一个聚糖(y为2或更多)时,所述聚糖可互不相同。抗体还可以包含一个或多个不含有末端GlcNAc部分的聚糖。并且,当待修饰的糖蛋白是抗体时,优选含有末端GlcNAc部分的聚糖是如式(1)、(9)、(10)、(11)、(12)、(13)或(14)所示,更优选如式(1)、(9)、(10)或(11)所示,甚至更优选如式(1)或(10)所示的聚糖,如上文所述。在该实施方案中,进一步优选含有末端GlcNAc部分的聚糖是如式(1)、(9)、(10)、(11)、(12)、(13)或(14)所示的N-连接的聚糖,更优选如式(1)、(9)、(10)或(11)所示的N-连接的聚糖,最优选如式(1)或(10)所示的N-连接的聚糖。
当待修饰的糖蛋白是抗体时,优选y为1、2、3、4、5、6、7或8,更优选y为1、2、4、6或8,甚至更优选y是1、2或4,最优选y是1或2。
如上所定义,所述抗体可以是全抗体,但也可以是抗体片段。当抗体是全抗体时,所述抗体优选在每条重链上包含一个或多个,更优选一个末端非还原性GlcNAc聚糖。因此,所述全抗体优选包含2种或更多种,优选2种、4种、6种或8种所述聚糖,更优选2种或4种,最优选2种聚糖。换言之,当所述抗体是全抗体时,y优选为2、4、6或8,更优选y为2或4,最优选y为2。当所述抗体是抗体片段时,优选y为1、2、3或4,更优选y为1或2。
在一个优选的实施方案中,所述抗体是单克隆抗体(mAb)。优选地,所述抗体选自IgA、IgD、IgE、IgG和IgM抗体。更优选地,所述抗体是IgG1、IgG2、IgG3或IgG4抗体,最优选地,所述抗体是IgG1抗体。
在本发明的方法中,包含岩藻糖基化以及非岩藻糖基化的聚糖的糖蛋白混合物可以用作起始糖蛋白。所述混合物例如可以包含含有一个或多个岩藻糖基化的(b为1)聚糖(1)和/或(2)和/或一个或多个非岩藻糖基化的(b为0)聚糖(1)和/或(2)的糖蛋白。因此,在本发明的方法之前从岩藻糖基化的聚糖中除去岩藻糖不是必需的,而是任选的。
包含含有末端GlcNAc部分的聚糖的糖蛋白在本文中也称为“末端非还原性GlcNAc蛋白”,含有末端GlcNAc部分的聚糖在本文中也称为“末端非还原性GlcNAc聚糖”。应注意,术语“末端非还原性GlcNAc蛋白”包括其中b为1的式(7)的蛋白,术语“末端非还原性GlcNAc聚糖”包括其中b为1的式(1)的聚糖。
末端非还原性GlcNAc蛋白可以包含一个或多个直链和/或一个或多个支链的末端非还原性GlcNAc聚糖。聚糖经由聚糖核心糖部分的C1键合至蛋白,并且所述核心糖部分优选是核心GlcNAc部分。因此,当键合至蛋白的末端非还原性GlcNAc聚糖是如式(2)所示的聚糖时,优选d是1。更优选地,当聚糖如式(2)所示时,d为1且e为1。
在优选的实施方案中,末端非还原性GlcNAc聚糖的核心糖部分的C1经由N-糖苷键键合至蛋白,所述N-糖苷键键合至所述蛋白中的氨基酸残基中的氮原子,更优选键合至天冬酰胺(Asn)或精氨酸(Arg)氨基酸的侧链中的氮原子。然而,非还原性GlcNAc聚糖的核心糖部分的C1也可以经由O-糖苷键键合至蛋白,所述O-糖苷键键合至所述蛋白中的氨基酸残基中的氧原子,更优选键合至丝氨酸(Ser)或苏氨酸(Thr)氨基酸的侧链中的氧原子。在该实施方案中,优选所述聚糖的核心糖部分是GlcNAc部分或GalNAc部分,优选GlcNAc部分。非还原性GlcNAc聚糖的核心糖部分的C1也可以经由C-糖苷键键合至蛋白,所述C-糖苷键键合至蛋白上的碳原子,例如键合至色氨酸(Trp)。如上文所述,糖蛋白可以包含多于一个聚糖,并且可以包含N-连接的、O-连接的和/或C-连接的聚糖的组合。
末端非还原性GlcNAc聚糖可以存在于蛋白的天然糖基化位点,但也可以被引入蛋白的不同位点上。
当糖蛋白是抗体时,优选包含末端GlcNAc部分的聚糖连接至Fc片段中的区域290-305中的天冬酰胺处(通常在N297处)的保守N-糖基化位点。
可在本发明的方法中被修饰的末端非还原性GlcNAc蛋白的几个实例示于图1中。图1(A)示出了包含单个、任选地岩藻糖基化的GlcNAc部分的糖蛋白。该GlcNAc聚糖可以例如经由N-糖苷键或O-糖苷键连接至蛋白。图1(A)中的糖蛋白可以例如通过常规表达,然后用内切糖苷酶或内切糖苷酶的组合修剪(trimming)而获得。图1(B)示出了包含支链寡糖聚糖的糖蛋白,其中支链之一含有末端GlcNAc部分(该聚糖也称为GnM5)。核心GlcNAc部分可任选地被岩藻糖基化。图1(B)中的糖蛋白可以例如通过在苦马豆素的存在下在哺乳动物系统中表达糖蛋白或通过在工程宿主生物体(例如LeC1CHO或毕赤酵母)中表达而获得。图1(C)示出了包含单个、任选地岩藻糖基化的GlcNAc部分的抗体。该GlcNAc聚糖优选地经由N-糖苷键连接至抗体。图1(C)中的糖蛋白可例如通过常规表达、接着用内切糖苷酶或内切糖苷酶的组合修剪来获得。图1(D)示出了包含支链寡糖聚糖的抗体,其中核心GlcNAc部分被任选地岩藻糖基化,并且其中所有支链含有末端GlcNAc部分。图1(D)中的糖蛋白可以例如通过在唾液酸酶和半乳糖苷酶的组合作用下修剪抗体糖型(G0、G1、G2、G0F、G1F和G2F)的常规混合物而获得。
在图2中示出了用于修饰糖蛋白的方法的实施方案,其中糖蛋白是抗体。在该实施方案中,在为或衍生自β-(1,4)-N-乙酰半乳糖胺转移酶的糖基转移酶的作用下,将糖衍生物Su(A)从Su(A)-Nuc转移至抗体聚糖的末端GlcNAc部分,以形成经修饰的抗体。
如上文所述,本发明的用于修饰糖蛋白的方法还可以包括以下步骤:提供包含含有末端GlcNAc部分的聚糖的糖蛋白,因此本发明还涉及用于修饰糖蛋白的方法,其包括以下步骤:
(1)提供包含含有末端GlcNAc部分的聚糖的糖蛋白,其中含有末端GlcNAc部分的聚糖如式(1)或(2)所示,如上文所定义;以及
(2)在糖基转移酶的存在下、更特别是在糖基转移酶的作用下,使所述糖蛋白与糖衍生物核苷酸Su(A)-Nuc接触,其中所述糖基转移酶为或衍生自β-(1,4)-N-乙酰半乳糖胺转移酶,其中Su(A)-Nuc如式(3)所示,如上所定义。
当例如在本发明的方法中待修饰的糖蛋白包含式(1)的聚糖时,在方法的步骤(1)中,待修饰的糖蛋白可以通过包括以下步骤的方法来提供:在合适的酶,优选内切糖苷酶的作用下修剪包含寡糖聚糖的糖蛋白。
在大量的聚糖中,第二GlcNAc残基与直接键合至糖蛋白的GlcNAc残基键合,也如图1(B)和(C)所示。可以修剪其中第二GlcNAc残基与直接键合至糖蛋白的GlcNAc残基键合的聚糖,以获得包含式(1)的聚糖的糖蛋白。修剪发生在所述两个GlcNAc残基之间。
“合适的酶”定义为待修剪的聚糖是其底物的酶。在本发明的方法的该具体实施方案的步骤(1)中待使用的酶的优选类型取决于被修剪的特定的聚糖。在本发明的方法的该具体实施方案的一个优选实施方案中,所述方法的该具体实施方案的步骤(1)中的酶选自内切糖苷酶。
内切糖苷酶能够切割聚糖结构中的内部糖苷键,这为重构和合成工作提供了益处。例如,当内切糖苷酶在保守的聚糖区域内的可预测位点切割时,可以用于使异源聚糖群体容易均化。在这方面,最重要的一类糖苷内切酶包括内-β-N-乙酰葡糖苷酶(EC3.2.1.96,通常称为Endo和ENGase),一类通过水解N,N’-二乙酰基壳二糖核心中的β-1,4-糖苷键从糖蛋白中除去N-聚糖的水解酶(Wong等人Chem.Rev.2011,111,4259的综述,通过引用的方式纳入本文),留下单核心N-连接的GlcNAc残基。发现内-β-N-乙酰葡糖苷酶以普通的化学酶变体广泛分布于自然界,所述化学酶变体包括对寡甘露糖特异的Endo D;对高甘露糖特异的Endo A和Endo H;范围从高甘露糖到双触角复合物的Endo F亚型;可以切割除藻糖基化聚糖以外的大多数N-聚糖结构(高甘露糖/复合型/杂合型),并且对高甘露糖型寡糖的水解活性显著高于对复合型和杂合型寡糖的水解活性的EndoM。这些ENGase对远端N-聚糖结构而不是显示其的蛋白表现出特异性,使得它们可用于在天然条件下从糖蛋白切割大多数N-连接的聚糖。
内切糖苷酶F1、F2和F3最适合天然蛋白的去糖基化。endo F1、F2和F3的连接特异性表明可除去所有类别的N-连接的寡糖而不使蛋白变性的蛋白去糖基化的一般策略。双触角和三触角结构可以分别通过内切糖苷酶F2和F3立即除去。低聚甘露糖和杂合结构可以通过Endo F1除去。
Endo F3的独特之处在于其裂解对寡糖的肽键的状态以及核心岩藻糖基化的状态敏感。内切糖苷酶F3切割天冬酰胺连接的双触角和三触角复合寡糖。它将以缓慢的速率切割非岩藻糖基化的双触角和三触角结构,但仅当肽连接时。核心岩藻糖基化的双触角结构是Endo F3的有效底物,其活性最高达高400倍。对寡甘露糖和杂合分子没有活性。参见例如Tarentino等人Glycobiology 1995,5,599,通过引用的方式纳入本文。
Endo S是来自酿脓链球菌(Streptococcus pyogenes)的分泌的糖苷内切酶,并且也属于糖苷水解酶家族18,如由Collin等人(EMBO J.2001,20,3046,通过引用的方式纳入本文)所公开的。与上述ENGase相比,Endo S具有更明确的特异性,并且仅特异性用于切割人IgG的Fc结构域中的保守N-聚糖(迄今为止尚未鉴定到其他底物),这表明酶和IgG之间的蛋白-蛋白相互作用提供了这种特异性。
Endo S49,也称为Endo S2,记载于WO 2013/037824(Genovis AB)中,其通过引用的方式纳入本文。Endo S49分离自酿脓链球菌NZ131,并且是Endo S的同源物。Endo S49对天然IgG具有特异性内切糖苷酶活性,并且比Endo S切割更多种类的Fc聚糖。
在一个优选的实施方案中,本实施方案步骤(1)中的酶是内-β-N-乙酰葡糖苷酶。在其他优选的实施方案中,内-β-N-乙酰葡糖苷酶选自Endo S、Endo S49、Endo F1、EndoF2、Endo F3、Endo H、Endo M和Endo A或其组合。
当待修剪的聚糖是复合型的双触角结构时,内-β-N-乙酰葡糖苷酶优选选自EndoS、Endo S49、Endo F1、Endo F2和Endo F3或其组合。
当糖蛋白是抗体并且待修剪的寡糖是复合型的双触角结构(即如图1(C)所示),并且其存在于N297处的IgG保守的N-糖基化位点时,内-β-N-乙酰葡糖苷酶优选选自Endo S、Endo S49、Endo F1、Endo F2和Endo F3或其组合,更优选选自Endo S和Endo S49或其组合。
当糖蛋白是抗体并且待修剪的聚糖是复合型的双触角结构,并且其不存在于N297处的IgG保守的N-糖基化位点时,内-β-N-乙酰葡糖苷酶优选选自Endo F1、Endo F2和EndoF3或其组合。
当待修剪的聚糖为高甘露糖时,内-β-N-乙酰葡糖苷酶优选选自EndoH、Endo M、Endo A和Endo F1。
因此,当在本发明的方法中待修饰的糖蛋白包含式(1)的聚糖时,在所述方法的步骤(1)中,优选通过包括以下步骤的方法提供待修饰的糖蛋白:通过内-β-N-乙酰葡糖苷酶的作用修剪包含寡糖聚糖的糖蛋白的聚糖,以提供包含式(1)的聚糖的糖蛋白。
在其他优选的实施方案中,内-β-N-乙酰葡糖苷酶选自Endo S、EndoS49、Endo F1、Endo F2、Endo F3、Endo H、Endo M和Endo A及其任意组合。更优选地,内-β-N-乙酰葡糖苷酶选自Endo S、Endo S49、EndoH、Endo F1、Endo F2和Endo F3及其任意组合。甚至更优选地,内-β-N-乙酰葡糖苷酶为Endo S或Endo S49。最优选地,内-β-N-乙酰葡糖苷酶是Endo H或Endo S的组合。
通过用内切糖苷酶处理糖型G0、G1、G2、G0F、G1F和G2F的混合物来提供包含式(1)的聚糖的糖蛋白的方法示于图4中。图4示出了用内切糖苷酶处理包含糖型G0、G1、G2、G0F、G1F和G2F(所述糖型示于图3中)的混合物的糖蛋白(在这种情况下为抗体),然后使用β-(1,4)-GalNAcT酶从UDP-GalNAz转移例如N-叠氮基乙酰半乳糖胺(GalNAz),产生式(32)的经修饰的抗体。
当例如在本发明的方法中待修饰的糖蛋白包含式(9)的聚糖时,可以以多种方式提供包含所述聚糖的糖蛋白(也称为“GnM5”)。在该实施方案中,优选糖蛋白通过在苦马豆素存在下杂合的N-糖蛋白的表达来提供,例如在Kanda等人,Glycobiology 2006,17,104中所述的(通过引用的方式纳入本文),并且如果必要的话随后进行唾液酸酶/半乳糖苷酶处理。替代方法包括对宿主生物体的基因工程。例如,LeC1CHO是缺乏表达Mns-II的基因的敲除CHO细胞系。因此,N-聚糖的生物合成不可避免地停止在聚糖(可从上清液中分离纯化)的GnM5阶段。更大规模的方法需要工程改造不正常编程以产生杂合或复合N-聚糖的宿主生物体,例如酵母或昆虫细胞。然而,已经充分证明了这些非哺乳动物宿主细胞(例如GlycoswitchTM)也可用于选择性表达特定N-糖蛋白的单一糖型,包括GnM5型聚糖和M5型聚糖。
因此,当在本发明的方法中待修饰的糖蛋白包含式(9)的聚糖时,在所述方法的步骤(1)中,包含式(9)的任选岩藻糖基化的聚糖的糖蛋白优选通过包括在苦马豆素存在下在宿主生物体中表达糖蛋白的方法来提供。优选地,所述宿主生物体是哺乳动物细胞系,例如HEK293或NS0或CHO细胞系。所得糖蛋白可作为包含以下聚糖的蛋白的混合物而获得:式(9)的聚糖(也称为GnM5)、称为GalGnM5的聚糖、称为SiaGalGnM5的唾液酸化聚糖和/或其混合物。可以通过用唾液酸酶(除去唾液酸部分)和/或β-半乳糖苷酶(除去半乳糖部分)处理糖蛋白来除去非还原性唾液酸和/或半乳糖部分(如果存在),从而得到包含式(9)的聚糖的糖蛋白。优选地,用唾液酸酶和β-半乳糖苷酶的处理发生在(1b)中的单一步骤中。在该实施方案中,进一步优选在所述方法的步骤(1)中,通过包括以下步骤的方法提供待修饰的糖蛋白:
(1a)在苦马豆素存在下,在宿主生物体中表达糖蛋白;以及
(1b)用唾液酸酶和/或β-半乳糖苷酶处理所获得的糖蛋白,以获得包含式(9)的聚糖的糖蛋白。
当在本发明的方法中待修饰的糖蛋白包含式(10)的聚糖时,在所述方法的步骤(1)中,待修饰的糖蛋白可以例如通过包括以下步骤的方法提供:用唾液酸酶和半乳糖苷酶处理糖蛋白的糖型G0、G1、G2、G0F、G1F和G2F的混合物。在图3中,示出了包含双触角聚糖的抗体的糖型G0、G1、G2、G0F、G1F和G2F。
图4示出了提供包含式(10)的聚糖的糖蛋白(在这种情况下为抗体)的方法:用唾液酸酶和半乳糖苷酶处理糖型G0、G1、G2、G0F、G1F和G2F的混合物,然后在为β-(1,4)-GalNAcT或衍生自β-(1,4)-GalNAcT的糖基转移酶的作用下从糖衍生物核苷酸Su(A)-UDP(其中A是叠氮基,例如6-叠氮基-GalNAc-UDP)转移糖部分,得到式(33)的经修饰的抗体。
糖衍生物核苷酸Su(A)-Nuc
在本发明的修饰糖蛋白的方法中,包含式(1)或(2)的聚糖的糖蛋白在为β-(1,4)-GalNAcT或衍生自β-(1,4)-GalNAcT的糖基转移酶的作用下与糖衍生物核苷酸Su(A)-Nuc接触。糖衍生物核苷酸Su(A)-Nuc如式(3)所示:
其中Nuc、R14、a、f、g、U、T、A、Z和Y如上文所定义。
Nuc在本文中定义为核苷酸。Nuc优选选自核苷一磷酸和核苷二磷酸,更优选选自尿苷二磷酸(UDP)、鸟苷二磷酸(GDP)、胸苷二磷酸(TDP)、胞苷二磷酸(CDP)和胞苷一磷酸(CMP),更优选选自尿苷二磷酸(UDP)、鸟苷二磷酸(GDP)和胞苷二磷酸(CDP)。最优选地,Nuc为尿苷二磷酸(UDP)。因此,在本发明的方法的一个优选的实施方案中,Su(A)-Nuc(3)是Su(A)-UDP(34):
其中R14、a、f、g、U、T、A、Z和Y如上文所定义。
在一个实施方案中,A是叠氮基-N3
在另一个实施方案中,A是酮基-C(O)R3,其中R3是任选取代的C1-C24烷基,优选任选取代的C1-C12烷基,更优选任选取代的C1-C6烷基。甚至更优选地,R3是甲基、乙基、正丙基、异丙基、正丁基、仲丁基或叔丁基,最优选地,R3是甲基。
在另一个实施方案中,A是炔基。换言之,A是包含C≡C键的官能部分,优选(杂)环炔基或-(CH2)iC≡C-R4部分。在一个实施方案中,炔基是(杂)环炔基,优选(杂)环辛炔基。在一个优选的实施方案中,炔基是-(CH2)iC≡C-R4,其中i是0-10且R4是氢或任选取代的C1-C24烷基,优选氢或任选取代的C1-C12烷基,更优选氢或任选取代的C1-C6烷基。甚至更优选地,R4是氢、甲基、乙基、正丙基、异丙基、正丁基、仲丁基或叔丁基,更优选地,R4是氢或甲基。优选地,i是0、1、2、3、4、5或6,更优选地,i是0、1、2、3或4,甚至更优选地,i是0、1或2,还甚至更优选地,i是0或1,最优选地,i是1。更优选地,R4是氢、甲基、乙基、正丙基、异丙基、正丁基、仲丁基或叔丁基且i是0、1或2。甚至更优选地,R4是氢或甲基且i是0、1或2。在该实施方案中,进一步优选炔基是末端炔基,即R4最优选为氢。在特别优选的实施方案中,炔基是-CH2-C≡CH或-C≡CH,最优选地,-CH2-C≡CH。
在另一个实施方案中,A是巯基-SH。
在另一个实施方案中,A是巯基-SC(O)R8的前体,其中R8是任选取代的C1-C24烷基或苯基。优选地,R8是任选取代的C1-C12烷基或苯基,更优选R8是任选取代的C1-C6烷基或苯基,甚至更优选R8是甲基、乙基、正丙基、异丙基、正丁基、仲丁基、叔丁基或苯基。甚至更优选地,R8是甲基或苯基,最优选地,R8是甲基。在本发明的用于修饰糖蛋白的方法中,可以使用其中A是巯基前体的糖衍生物核苷酸。在该过程中,巯基前体转化为巯基。
在另一个实施方案中,A是-SC(V)OR8,其中V是O或S,R8是任选取代的C1-C24烷基或苯基。在一个优选的实施方案中,A是-SC(O)OR8。在另一个优选的实施方案中,A是-SC(S)OR8。当A是-SC(O)OR8以及当A是-SC(S)OR8时,R8优选是任选取代的C1-C12烷基或苯基,更优选R8是任选取代的C1-C6烷基或苯基,甚至更优选R8是甲基、乙基、正丙基、异丙基、正丁基、仲丁基、叔丁基或苯基。甚至更优选地,R8是甲基或苯基,最优选地,R8是甲基。
在另一个实施方案中,A是卤素X。X选自F、Cl、Br和I,优选选自Cl、Br和I,更优选选自Cl和Br。最优选地,X是Cl。
在另一个实施方案中,A是磺酰氧基-OS(O)2R5,其中R5选自C1-C24烷基、C6-C24芳基、C7-C24烷基芳基和C7-C24芳基烷基,烷基、芳基、烷基芳基和芳基烷基被任选地取代。优选地,R5是C1-C12烷基、C6-C12芳基、C7-C12烷基芳基或C7-C12芳基烷基。更优选地,R5选自-CH3、-C2H5、C3直链或支链烷基、C4直链或支链烷基、C6-C10芳基及C7烷基芳基。甚至更优选地,R5是甲基、乙基、苯基或对甲苯基。最优选地,磺酰氧基为甲磺酸酯基(-OS(O)2CH3)、苯磺酸酯基(-OS(O)2(C6H5))或甲苯磺酸酯基(-OS(O)2C6H4CH3)。
在另一个实施方案中,A是R12,其中R12选自任选取代的末端C2-C24烯基、C3-C5环烯基和C4-C8链二烯基。
术语“末端烯基”在本文中是指其中碳-碳双键位于烯基的末端的烯基。当R12是任选取代的末端C2-C24烯基时,末端C2-C24烯基优选以C=CH2部分、更优选以C(H)=CH2部分结束。优选地,R12是任选取代的末端C2-C12烯基,更优选任选取代的末端C2-C6烯基。更优选地,末端烯基是直链烯基,优选未取代的直链烯基。甚至更优选R12选自-C(H)=CH2、-CH2-C(H)=CH2、-CH2-CH2-C(H)=CH2、-CH2-CH2-CH2-C(H)=CH2和-CH2-CH2-CH2-CH2-C(H)=CH2。还甚至更优选地,R12选自-C(H)=CH2、-CH2-C(H)=CH2和-CH2-CH2-C(H)=CH2。还甚至更优选地,R12为-C(H)=CH2或-CH2-C(H)=CH2,最优选地,R12为-C(H)=CH2
当R12是任选取代的末端C3-C5环烯基时,R12优选包含环丙烯基。更优选地,(任选取代的)C3-C5环烯基选自:
当R12是任选取代的C4-C8链二烯基时,优选C4-C8链二烯基以C=CH2部分、更优选C=C(H)-C(H)=CH2部分结束。优选地,C4-C8链二烯基选自C(H)=C(H)-C(H)=CH2、CH2-C=C(H)-C(H)=CH2和CH2-CH2-C=C(H)-C(H)=CH2,更优选地选自C(H)=C(H)-C(H)=CH2和CH2-C=C(H)-C(H)=CH2。当R12是任选取代的C4-C8链二烯基时,最优选R12是C(H)=C(H)-C(H)=CH2
在另一个实施方案中,A是R13,其中R13是任选取代的末端C3-C24丙二烯基。在本文中,术语“末端丙二烯基”是指其中C=C=C部分位于丙二烯基的末端的丙二烯基。末端C3-C24烯基优选以–C(H)=C=CH2部分结束。优选地,R13是任选取代的末端C3-C12烯基,更优选任选取代的末端C3-C6烯基。更优选地,末端丙二烯基是直链丙二烯基,优选未取代的直链丙二烯基。甚至更优选地,R13选自-C(H)=C=CH2、-CH2-C(H)=C=CH2、-CH2-CH2-C(H)=C=CH2和-CH2-CH2-CH2-C(H)=C=CH2。还甚至更优选地,R13选自-C(H)=C=CH2和-CH2-C(H)=C=CH2。最优选地,R13是-C(H)=C=CH2。当A是R13时,特别优选在Su(A)-Nuc(3)中,U和T都不存在,即特别优选a是0且f是0。
在另一个实施方案中,A是N(R17)2,其中R17独立地选自H、C1-C12烷基。在上下文中,优选的R17的烷基是C1–C6烷基,最优选C1–C4烷基。优选地,R17的至少一个为H且A为NHR17,最优选两个R17均为H且A为NH2。当A为N(R17)2时,优选在Su(A)-Nuc(3)中,Y不存在,即g为0,更优选U和T也都不存在,即特别优选g为0、a为0且f为0。
在本发明的方法的优选实施方案中,Su(A)-Nuc(3)中的A和下文更详细描述的(3)的优选实施方案选自-N3、-C(O)R3、-SH、-(CH2)iC≡CR4和R12,其中i、R3、R4、R12及其优选实施方案如上文所定义。更优选地,A选自-N3、-C(O)CH3、-SH、-CH=CH2和-CH2C≡CH。最优选A是N3
在糖衍生物核苷酸Su(A)-Nuc(3)及其优选实施方案(例如(34))中,R14选自:
其中W、h、a、f、T、A和U如上所定义。
在糖衍生物核苷酸Su(A)-Nuc(3)的优选实施方案中,R14选自:
其中W、h、a、f、T、A和U如上文所定义。
最优选R14是-NHAc。
当R14是-NHC(O)-(W)h-(U)f-(T)a-A时,W、h、a、f、T、A和U如上文所定义。下文更详细地描述了W、h、a、f、T和U的优选实施方案。A的优选实施方案如上文更详细描述的。
在本发明的方法的优选实施方案中,Su(A)-Nuc(3)中的R14是-NHC(O)CH3。在该实施方案中,糖衍生物核苷酸Su(A)-Nuc如式(3a)所示:
其中Nuc、Z、Y、U、T、A、g、f和a如上文所定义。
此外,当糖衍生物核苷酸Su(A)-Nuc如式(3a)所示或根据其优选实施方案时,优选Nuc为UDP。
此外,同样在Su(A)-Nuc(3a)中,A优选选自-N3、-C(O)R3、-SH、-(CH2)iC≡CR4和R12,其中i、R3、R4、R12及其优选实施方案如上文所定义。更优选地,A选自-N3、-C(O)CH3、-SH、-CH=CH2和-CH2C≡CH。最优选地,A是N3
在特别优选的实施方案中,在Su(A)-Nuc(3a)中Nuc是UDP,A选自-N3、-C(O)R3、-SH、-(CH2)iC≡CR4和R12,其中i、R3、R4、R12及其优选实施方案如上文所定义。甚至更优选地,Nuc是UDP,A选自-N3、-C(O)CH3、-SH、-CH=CH2和-CH2C≡CH。最优选地,Nuc是UDP,A是N3
在本发明的方法的另一个优选实施方案中,R14是-NHC(O)-(W)h-(U)f-(T)a-A。在该实施方案中,糖衍生物核苷酸Su(A)-Nuc如式(3b)所示:
其中Nuc、Z、Y、U、T、A、W、h、g、f和a如上文所定义。
在糖衍生物核苷酸Su(A)-Nuc(3b)中,独立地选择A、T、U、a和f。换言之,(3b)的C2上的取代基中的A、T、U、a和f可以不同于(3b)的C6上的取代基中的A、T、U、a和f。
此外,当Su(A)-Nuc如式(3b)所示或根据其优选实施方案时,优选Nuc为UDP。
此外,同样在Su(A)-Nuc(3b)中,A优选选自-N3、-C(O)R3、-SH、-(CH2)iC≡CR4和R12,其中i、R3、R4、R12及其优选实施方案如上文所定义。更优选地,A选自-N3、-C(O)CH3、-SH、-CH=CH2和-CH2C≡CH。最优选地,A是N3
在特别优选的实施方案中,在Su(A)-Nuc(3b)中Nuc是UDP,A选自-N3、-C(O)R3、-SH、-(CH2)iC≡CR4和R12,其中i、R3、R4、R12及其优选实施方案如上文所定义。甚至更优选地,Nuc是UDP,A选自-N3、-C(O)CH3、-SH、-CH=CH2和-CH2C≡CH。最优选地,Nuc是UDP,A是N3
在本发明的方法的另一个优选实施方案中,R14是-OH。因此,在该实施方案中,糖衍生物核苷酸Su(A)-Nuc如式(3c)所示:
其中Nuc、Z、Y、U、T、A、g、f和a如上所定义。
此外,当糖衍生物核苷酸Su(A)-Nuc如式(3c)所示或根据其优选实施方案时,优选Nuc为UDP。
此外,同样在Su(A)-Nuc(3c)中,A优选选自-N3、-C(O)R3、-SH、-(CH2)iC≡CR4和R12,其中i、R3、R4、R12及其优选实施方案如上文所定义。更优选地,A选自-N3、-C(O)CH3、-SH、-CH=CH2和-CH2C≡CH。最优选地,A是N3
在特别优选的实施方案中,在Su(A)-Nuc(3c)中Nuc是UDP,A选自-N3、-C(O)R3、-SH、-(CH2)iC≡CR4和R12,其中i、R3、R4、R12及其优选实施方案如上文所定义。甚至更优选地,Nuc是UDP,A选自-N3、-C(O)CH3、-SH、-CH=CH2和-CH2C≡CH。最优选地,Nuc是UDP,A是N3
在本发明的方法的另一个优选实施方案中,R14是-N3。因此,在该实施方案中,糖衍生物核苷酸Su(A)-Nuc如式(3d)所示:
其中Nuc、Z、Y、U、T、A、g、f和a如上文所定义。
此外,当糖衍生物核苷酸Su(A)-Nuc如式(3d)所示或根据其优选实施方案时,优选Nuc为UDP。
此外,同样在Su(A)-Nuc(3d)中,A优选选自-N3、-C(O)R3、-SH、-(CH2)iC≡CR4和R12,其中i、R3、R4、R12及其优选实施方案如上所定义。更优选地,A选自-N3、-C(O)CH3、-SH、-CH=CH2和-CH2C≡CH。最优选地,A是N3
在特别优选的实施方案中,在Su(A)-Nuc(3d)中Nuc是UDP,A选自-N3、-C(O)R3、-SH、-(CH2)iC≡CR4和R12,其中i、R3、R4、R12及其优选实施方案如上文所定义。甚至更优选地,Nuc是UDP,A选自-N3、-C(O)CH3、-SH、-CH=CH2和-CH2C≡CH。最优选地,Nuc是UDP,A是N3
在Su(A)-Nuc(3)及其优选实施方案(例如(34)、(3a)、(3b)、(3c)或(3d))中,T是C3-C12(杂)亚芳基,其中(杂)亚芳基被任选地取代。在一个优选的实施方案中,T不存在(a是0)。在另一个优选实施方案中,T存在(a是1)。当a为1时,(3)中的(杂)亚芳基T被A取代,其中A如上文所定义。
(杂)亚芳基T任选进一步被一个或多个取代基R2取代,其中R2独立地选自卤素(-F、-Cl、-Br、-I,优选-F、-Cl、-Br)、-CN、-NO2、-C(O)R9、-C(O)OR9、-C(O)N(R10)2、C1-C12烷基、C2-C12烯基、C2-C12炔基、C3-C12环烷基、C5-C12环烯基、C8-C12环炔基、C1-C12烷氧基、C2-C12烯氧基、C2-C12炔氧基、C3-C12环烷氧基、氨基(优选-N(R10)2)、氧代基团和-Si(R7)3基团,其中烷基、烯基、炔基、环烷基、环烯基、环炔基、烷氧基、烯氧基、炔氧基和环烷氧基被一个或多个选自O、N和S的杂原子任选地间隔,其中R7独立地选自C1-C12烷基、C2-C12烯基、C2-C12炔基、C3-C12环烷基、C1-C12烷氧基、C2-C12烯氧基、C2-C12炔氧基和C3-C12环烷氧基,其中烷基、烯基、炔基、环烷基、烷氧基、烯氧基、炔氧基和环烷氧基被任选地取代,其中R9是C1-C12烷基,其中R10独立地选自氢和C1-C12烷基。优选地,R9是C1-C6烷基,甚至更优选C1-C4烷基,最优选甲基、乙基、正丙基、异丙基、正丁基、仲丁基或叔丁基。优选地,R10是氢或C1-C6烷基,更优选氢或C1-C4烷基,最优选R10是氢、甲基、乙基、正丙基、异丙基、正丁基、仲丁基或叔丁基。
当R2是-Si(R7)3基团时,优选R7独立地是C1-C12烷基,更优选独立地是C1-C6烷基,甚至更优选独立地是C1-C4烷基,最优选R7独立地是甲基、乙基、正丙基、异丙基、正丁基、仲丁基或叔丁基。
优选地,R2(存在时)独立地选自-F、-Cl、-Br、-I、-CN、-NO2、-C(O)R9、-C(O)OR9、-C(O)N(R10)2、C1-C12烷基、C1-C12烷氧基、氨基(-N(R10)2)、氧代基团和-Si(R7)3基团,其中R7、R9、R10以及R7、R9、R10的优选实施方案如上文所定义。
更优选地,R2(存在时)独立地选自-F、-Cl、-Br、-CN、-NO2、-C(O)R9、-C(O)OR9、-C(O)N(R10)2、C1-C6烷基、C1-C6烷氧基、氨基、氧代基团和-Si(R7)3基团,其中R7、R9、R10以及R7、R9、R10的优选实施方案如上文所定义。
甚至更优选地,R2(存在时)独立地选自-F、-Cl、-Br、-CN、-NO2、-C(O)R9、-C(O)OR9、-C(O)N(R10)2、C1-C4烷基和C1-C4烷氧基,其中R9和R10以及R9和R10的优选实施方案如上文所定义。
还甚至更优选地,R2(存在时)独立地选自-F、-Cl、-Br、-CN、-NO2、甲基、甲氧基、乙基、乙氧基、正丙基、正丙氧基、异丙基、异丙氧基、正丁基、正丁氧基、仲丁基、仲丁氧基、叔丁基和叔丁氧基。最优选地,R2(存在时)独立地选自-F、-Cl、-Br、-CN、-NO2、甲基和甲氧基。
在一个优选的实施方案中,(3)中的(杂)亚芳基是未取代的。在另一个优选实施方案中,(3)中的(杂)亚芳基包含一个或多个取代基R2,其中R2和R2的优选实施方案如上文所定义。
术语“(杂)亚芳基”在本文中是指亚芳基以及杂亚芳基。术语“(杂)亚芳基”在本文中是指单环(杂)亚芳基以及双环(杂)亚芳基。Su(A)-Nuc(3)中的(杂)亚芳基可以是任何亚芳基或任何杂亚芳基。
在本发明的方法的一个优选实施方案中,(3)中的(杂)亚芳基T选自亚苯基、亚萘基、亚蒽基、亚吡咯基、亚吡咯鎓(pyrroliumylene)基、亚呋喃基、亚噻吩(thiophenylene)基(即亚噻吩(thiofuranylene)基)、亚吡唑基、亚咪唑基、亚嘧啶鎓(pyrimidiniumylene)基、亚咪唑鎓(imidazoliumylene)基、亚异噁唑基、亚噁唑基、亚噁唑鎓(oxazoliumylene)基、亚异噻唑基、亚噻唑基、1,2,3-亚三唑基、1,3,4-亚三唑基、亚二唑基、1-氧杂-2,3-亚二唑基、1-氧杂-2,4-亚二唑基、1-氧杂-2,5-亚二唑基、1-氧杂-3,4-亚二唑基、1-硫杂-2,3-亚二唑基、1-硫杂-2,4-亚二唑基、1-硫杂-2,5-亚二唑基、1-硫杂-3,4-亚二唑基、亚四唑基、亚吡啶基、亚哒嗪基、亚嘧啶基、亚吡嗪基、亚吡二嗪基、亚吡啶鎓(pyridiniumylene)基、亚嘧啶鎓(pyrimidiniumylene)基、亚苯并呋喃基、亚苯并噻吩基、亚苯并咪唑基、亚吲唑基、亚苯并三唑基、吡咯并[2,3-b]亚吡啶基、吡咯并[2,3-c]亚吡啶基、吡咯并[3,2-c]亚吡啶基、吡咯并[3,2-b]亚吡啶基、咪唑并[4,5-b]亚吡啶基、咪唑并[4,5-c]亚吡啶基、吡唑并[4,3-d]亚吡啶基、吡唑并[4,3-c]亚吡啶基、吡唑并[3,4-c]亚吡啶基、吡唑并[3,4-b]亚吡啶基、亚异吲哚基、亚吲唑基、亚嘌呤基、亚二氢吲哚基(indolininylene group)、咪唑并[1,2-a]亚吡啶基、咪唑并[1,5-a]亚吡啶基、吡唑并[1,5-a]亚吡啶基、吡咯并[1,2-b]亚哒嗪基、咪唑并[1,2-c]亚嘧啶基、亚喹啉基、亚异喹啉基、亚噌啉基、亚喹唑啉基、亚喹喔啉基、亚酞嗪基、1,6-亚萘啶基、1,7-亚萘啶基、1,8-亚萘啶基、1,5-亚萘啶基、2,6-亚萘啶基、2,7-亚萘啶基、吡啶并[3,2-d]亚嘧啶基、吡啶并[4,3-d]亚嘧啶基、吡啶并[3,4-d]亚嘧啶基、吡啶并[2,3-d]亚嘧啶基、吡啶并[2,3-b]亚吡嗪基、吡啶并[3,4-b]亚吡嗪基、嘧啶并[5,4-d]亚嘧啶基、吡嗪并[2,3-b]亚吡嗪基和嘧啶并[4,5-d]亚嘧啶基,所有的基团任选地用一个或多个取代基R2取代,其中R2和R2的优选实施方案如上文所定义。
在其他优选的实施方案中,(杂)亚芳基T选自亚苯基、亚吡啶基、亚吡啶鎓基、亚嘧啶基、亚嘧啶鎓基、亚吡嗪基、亚吡二嗪基、亚吡咯基、亚吡咯鎓基、亚呋喃基、亚噻吩基(即亚噻吩(thiofuranylene)基)、亚二唑基、亚喹啉基、亚咪唑基、亚嘧啶鎓基、亚咪唑鎓基、亚噁唑基和亚噁唑鎓基,所有的基团任选地用一个或多个取代基R2取代,其中R2和R2的优选实施方案如上文所定义。
甚至更优选地,(杂)亚芳基T选自亚苯基、亚吡啶基、亚吡啶鎓基、亚嘧啶基、亚嘧啶鎓基、亚咪唑基、亚嘧啶鎓基、亚咪唑鎓基、亚吡咯基、亚呋喃基和亚噻吩基,所有的基团任选地用一个或多个取代基R2取代,其中R2和R2的优选实施方案如上文所定义。
最优选地,(杂)芳基T选自亚苯基、亚咪唑基、亚咪唑鎓基、亚嘧啶鎓基、亚吡啶基、亚吡啶鎓基,所有的基团任选地用一个或多个取代基R2取代,其中R2和R2的优选实施方案如上文所定义。
在Su(A)-Nuc(3)及其优选实施方案(例如(34)、(3a)、(3b)、(3c)或(3d))中,U可以存在(f是1)或不存在(f是0)。存在时,U是[C(R1)2]n,其中n是1至24的整数;或U是[C(R1)2]p-O-[C(R1)2C(R1)2O]o-[C(R1)2]q,其中o是0至12的整数,p和q独立地为0、1或2,R1独立地选自H、F、Cl、Br、I、OH和任选取代的C1-C24烷基。当U是[C(R1)2]p-O-[C(R1)2C(R1)2O]o-[C(R1)2]q时,优选p、o和q中的至少一个不是0。
在优选的实施方案中,U不存在,即f是0。
在另一个优选的实施方案中,U存在,即f是1。
当U是[C(R1)2]n时,n是1至24的整数,n优选1至12的整数。更优选n为1、2、3、4、5、6、7或8,甚至更优选n为1、2、3、4、5或6,还甚至更优选n为1、2、3或4,还甚至更优选n为1、2或3,最优选n为1或2。
R1独立地选自H、F、Cl、Br、I和任选取代的C1-C24烷基,优选选自H、F、Cl、Br、I和任选取代的C1-C12烷基,更优选选自H、F、Cl、Br、I和任选取代的C1-C6烷基。甚至更优选地,R1独立地选自H、F、Cl、Br、I、甲基、乙基、正丙基、异丙基、正丁基、仲丁基或叔丁基。甚至更优选地,R1独立地选自H、F、Cl和甲基,最优选地,R1独立地选自H和F。
当U为[C(R1)2]n且n为1或2时,Su(A)-Nuc中的-[C(R1)2]n-部分的优选实例包括-(CH2)-、-(CF2)-、-(CCl2)-、-(CBr2)-、-(CMe2)-、-(CH2CH2)-、-(CH2CF2)-、-(CH2CCl2)-、-(CH2CBr2)-、-(CH2CI2)-、-(CH2CMe2)-、-(CF2CF2)-、-(CCl2CCl2)-、-(CBr2CBr2)-和-(CMe2CMe2)-,更优选地,-(CH2)-、-(CF2)-、-(CH2CH2)-、-(CH2CF2)-和-(CF2CF2)-。
当U为[C(R1)2]n且n为3或更大时,Su(A)-Nuc中的-[C(R1)2]n-部分的优选实例包括-(CnH2n)-、-(CnF2n)-、-(CnCl2n)-、-(CnBr2n)-、-(C(n-1)H2(n-1)CF2)-、-(C(n-1)H2(n-1)CCl2)-、-(C(n-1)H2(n-1)CBr2)-和-(C(n-1)H2(n-1)CMe2)-,例如-(C3H6)-、-(C3F6)-、-(C3Cl6)-、-(C3Br6)-、-(CH2CH2CF2)-、-(CH2CH2CCl2)-、-(CH2CH2CBr2)-和-(C4H8)-。更优选的实例包括-(CnH2n)-、-(CnF2n)-,例如-(C3H6)-、-(C4H8)-、-(C3F6)-和-(C4F8)-。
当U为[C(R1)2]p-O-[C(R1)2C(R1)2O]o-[C(R1)2]q时,o是0至12的整数,p和q独立地为0、1或2。优选地,o是1至10的整数,更优选地,o是1、2、3、4、5、6、7或8,甚至更优选地,o是1、2、3、4、5或6,还甚至更优选地,o是1、2、3或4,还甚至更优选地,o是1、2或3,还甚至更优选地,o是1或2,最优选地,o是1。在另一个优选的实施方案中,o为0。特别优选o为0、1或2。当o为0时,进一步优选当p为0时,q为1或2,当q为0时,p为1或2。
当U为[C(R1)2]p-O-[C(R1)2C(R1)2O]o-[C(R1)2]q且o和/或p和/或q为1或更大时,R1独立地选自H、F、Cl、Br、I和任选取代的C1-C24烷基,优选选自H、F、Cl、Br、I和任选取代的C1-C12烷基,更优选选自H、F、Cl、Br、I和任选取代的C1-C6烷基。甚至更优选地,R1独立地选自H、F、Cl、Br、I、甲基、乙基、正丙基、异丙基、正丁基、仲丁基或叔丁基。甚至更优选地,R1独立地选自H、F、Cl和甲基。最优选地,R1为H。
当U是[C(R1)2]p-O-[C(R1)2C(R1)2O]o-[C(R1)2]q时,Su(A)-Nuc中的-[C(R1)2]p-O-[C(R1)2C(R1)2O]o-[C(R1)2]q-部分的优选实例包括-CH2-O-、-(CH2)2-O-、-O-CH2-、-O-(CH2)2-、-CH2-O-(CH2CH2O)o-、-(CH2)2-O-(CH2CH2O)o-、-O-(CH2CH2O)o-、-O-(CH2CH2O)o-CH2-、-O-(CH2CH2O)o-(CH2)2-、-CH2-O-(CH2CH2O)o-CH2-、-CH2-O-(CH2CH2O)o-(CH2)2-、-(CH2)2-O-(CH2CH2O)o-CH2-和-(CH2)2-O-(CH2CH2O)o-(CH2)2-,其中o是1、2、3、4、5或6,优选o是1、2、3或4,更优选o是1或2,最优选o是1。
在糖衍生物核苷酸Su(A)-Nuc(3)及其优选实施方案(例如(34)、(3a)、(3b)、(3c)或(3d))中,优选a和f不都为0。在另一个优选的实施方案中,a为0且f为1,或者a为1且f为0。在这些实施方案中,g可为0或1。
在本发明方法的优选实施方案中,a为0,f为1且U为[C(R1)2]n。在该实施方案中,进一步优选a是0,f为1且n为1至12,更优选a为0,f为1且n为1、2、3、4、5、6、7或8,甚至更优选a为0,f为1且n为1、2、3、4、5或6,还甚至更优选a为0,f为1且n为1、2、3或4,还甚至更优选a为0,f为1且n为1或2,最优选a为0,f为1且n为1。[C(R1)2]n的优选实例如上文更详细描述的。
在本发明的方法的另一个优选实施方案中,a为0,f为1且U为[C(R1)2]p-O-[C(R1)2C(R1)2O]o-[C(R1)2]q。更优选p、o和q不都为0,即o为1至12的整数和/或p为1或2和/或q为1或2。在该实施方案中,进一步优选a为0,f为1且o为1至12,更优选a为0,f为1且o为1至10,甚至更优选a为0,f为1且o为1、2,1、2、3、4、5、6、7或8,甚至更优选地,a为0,f为1且o为1、2、3、4、5或6,还甚至更优选地,a为0,f为1且o为1、2、3或4,还甚至更优选a为0,f为1且o为1或2,最优选a为0,f为1且o为1。同样在该实施方案中,p和q独立地为0、1或2。[C(R1)2]p-O-[C(R1)2C(R1)2O]o-[C(R1)2]q的优选实例如上文更详细描述的。
在另一个优选实施方案中,a为1,f为1且U为[C(R1)2]n。在该实施方案中,进一步优选n为1至12,更优选n为1、2、3、4、5、6、7或8,甚至更优选n为1、2、3、4、5或6,还甚至更优选n为1、2、3或4,还甚至更优选n为1或2,最优选n为1。[C(R1)2]n的优选实例如上文更详细描述的。
在另一个优选实施方案中,a为1,f为1且U为[C(R1)2]p-O-[C(R1)2C(R1)2O]o-[C(R1)2]q,o为1至12的整数,p和q独立地为0、1或2。在该实施方案中,进一步优选o为1至10,更优选o为1、2、3、4、5、6、7或8,甚至更优选o为1、2、3、4、5或6,还甚至更优选o为1、2、3或4,还甚至更优选o为1或2,最优选o为1。在该实施方案中,p和q独立地为0、1或2。[C(R1)2]p-O-[C(R1)2C(R1)2O]o-[C(R1)2]q的优选实例如上文更详细描述的。
如上文所定义,在Su(A)-Nuc(3)及其优选实施方案(例如(34)、(3a)、(3b)、(3C)或(3d))中,Z为CH2、CF2或C(O);或Z为CHOH,条件是g为0、f为1且a为0或1。在优选的实施方案中,Z选自CH2、CF2和C(O)。在另一个优选的实施方案中,Z为CHOH,条件是g为0、f为1且a为0或1。
在Su(A)-Nuc(3)及其优选实施方案(例如(34)、(3a)、(3b)、(3C)或(3d))中,Y可以不存在(g为0)或存在(g为1)。当Y存在时,Y选自O、S、N(R15)、N(R15)C(O)、N(R15)C(O)N(R15)、N(R15)C(O)O、OC(O)N(R15)S(O)2N(R15)和N(R15)C(O)N(R15)S(O)2O,其中R15独立地选自H、C1-C12烷基和(U)f-(T)a-A,其中f、a、U、T和A如上所定义。优选地,Y选自O、S、N(R15)、NHC(O)、NHC(O)N(R15)、NHC(O)O,OC(O)NHS(O)2NH和NHC(O)NHS(O)2O,其中R15独立地选自H、C1-C12烷基和(U)f-(T)a-A,其中f、a、U、T和A如上文所定义。在这些实施方案中,进一步优选R15独立地选自H、C1–C6烷基和(U)f-(T)a-A,其中f、a、U、T和A如上文所定义。更优选地,R15独立地选自H、甲基、乙基、异丙基、正丙基和(U)f-(T)a-A,其中f、a、U、T和A如上文所定义。最优选地,R15选自H和甲基。
在优选的实施方案中,Z是CH2且g是1。在该实施方案中,进一步优选Y选自O、S、N(R15)、N(R15)C(O)、N(R15)C(O)N(R15)和N(R15)C(O)O,更优选选自O、S、N(R15)、NHC(O)、NHC(O)N(R15)和NHC(O)O,其中R15和R15的优选实施方案如上文所定义。
在另一个优选的实施方案中,Z是C(O),g是1。在该实施方案中,进一步优选Y是N(R15),其中R15和R15的优选实施方案如上所定义。
因此,在本发明的方法的优选实施方案中,糖衍生物核苷酸Su(A)-Nuc如式(15)、(16)、(17)或(18)所示:
其中Nuc、a、f、R14、R15、A、U和T如上文所定义。
在(15)、(16)、(17)和(18)的优选实施方案中,R14是-OH。在另一个优选的实施方案中,R14是-N3。在另一个优选的实施方案中,R14是-NHC(O)CH3。在另一个优选的实施方案中,R14是-NHC(O)-(W)h-(U)f-(T)a-A,其中W、U、T、A、h、f和a如上文所定义。在这些实施方案中,进一步优选Nuc是UDP。
(15)、(16)、(17)和(18)中的U、T、a和f的优选实施方案如上文所述。如上文所定义的A的优选实施方案也适用于(15)、(16)、(17)和(18)。
在(15)、(16)、(17)和(18)的特别优选的实施方案中,a是0,f是1,U是-CH2CF2-。在该实施方案中,进一步优选A为N3
在(15)、(16)、(17)和(18)的另一个特别优选的实施方案中,a是1,T优选为任选取代的苯基。如上所述,苯基任选被R2取代,优选地,R2选自H,F,Cl和Br,更优选地选自H、F和Cl,最优选地选自H和F。在该实施方案中,f为0或1,当f为1时,U优选为-CH2-。在这些实施方案中,进一步优选A为N3。优选地,A存在于任选取代的苯基的对位。
在本发明的方法的优选实施方案中,糖衍生物核苷酸Su(A)-Nuc如式(19)、(20)、(21)、(22)、(23)、(24)、(25)、(26)、(65)或(66)所示,优选地如(19)、(20)、(21)、(22)、(23)、(24)、(25)或(26)所示:
其中:
R14和R15如上所定义;以及
R16独立地选自H和F。
在本发明的方法的优选实施方案中,糖衍生物核苷酸Su(A)-Nuc如式(67)、(68)或(69)所示:
其中R14如上文所定义。
在其他优选的实施方案中,R15选自H和C1-C12烷基,优选选自H和C1–C6烷基,更优选选自H、甲基、乙基、异丙基、正丙基、正丁基、仲丁基和叔丁基,最优选选自H和甲基。在另一个优选的实施方案中,R15是(U)f-(T)a-A,其中f、a、U、T和A及其优选实施方案如上文所定义。当R15为(U)f-(T)a-A时,优选R15的(U)f-(T)a-A基团对应于源自Su(A)-Nuc(3)中的Z-(Y)g-(U)f-(T)a-A部分的(U)f-(T)a-A基团。例如,当(24)中的R15为(U)f-(T)a-A时,优选R15为-(C6H4(N3)),N3在苯基的对位。在这些实施方案中,优选Nuc为UDP。
在如上所述的(19)、(20)、(21)、(22)、(23)、(24)、(25)、(26)、(65)、(66)、(67)、(68)和(69)及其优选实施方案的优选实施方案中,R14是-OH。在另一个优选的实施方案中,R14为-N3。在另一个优选的实施方案中,R14是-NHC(O)CH3。在另一个优选的实施方案中,R14是-NHC(O)-(W)h-(U)f-(T)a-A,其中W、U、T、A、h、f和a如上文所定义。同样在这些实施方案中,还优选Nuc为UDP。
在优选的实施方案中,R14为-N3。在本发明的方法的另一个优选实施方案中,R14选自:
其中a、f、h、T、A、U和W及其优选实施方案如上文所定义。
在本发明的方法的其他优选的实施方案中,糖衍生物核苷酸Su(A)-Nuc如式(27)、(28)、(29)、(30)或(31)所示,或如式(36)所示:
其中Nuc如上文所定义。
在本发明的方法进一步优选的实施方案中,其中R14是OH。在该实施方案中,进一步优选糖衍生物核苷酸Su(A)-Nuc如式(35)所示:
其中Nuc如上文所定义。
此外,当Su(A)-Nuc如式(27)、(28)、(29)、(30)、(31)、(35)或(36)所示时,优选Nuc是UDP。
本发明的方法包括以下步骤:在糖基转移酶的存在下、更特别是在糖基转移酶的作用下,将包含含有末端GlcNAc部分的聚糖的糖蛋白与糖衍生物核苷酸Su(A)-Nuc接触,以提供经修饰的糖蛋白,其中所述糖基转移酶为或衍生自β-(1,4)-N-乙酰半乳糖胺转移酶。在本文中,β-(1,4)-N-乙酰半乳糖胺转移酶也称为β(1,4)-GalNAcT酶、或β-(1,4)-GalNAcT或GalNAcT。
β-(1,4)-N-乙酰半乳糖胺转移酶(β-(1,4)-GalNAcT)是本领域已知的。通常,β-(1,4)-GalNAcT是催化N-乙酰半乳糖胺(GalNAc)从尿苷二磷酸-GalNAc(UDP-GalNAc,也称为GalNAc-UDP)转移至糖蛋白聚糖的末端GlcNAc部分的酶,其中GalNAc部分的C1经由β-1,4-O-糖苷键连接至GlcNAc部分的C4。如上文更详细描述的,其中b是1的式(1)的聚糖中的GlcNAc部分,即由岩藻糖基化的GlcNAc组成的聚糖中的GlcNAc部分在本文中也被认为是末端GlcNAc部分。
在本发明的方法中,为或衍生自β-(1,4)-GalNAcT的糖基转移酶催化糖衍生物Su(A)从糖衍生物核苷酸Su(A)-Nuc转移至糖蛋白聚糖的末端GlcNAc部分,以提供经修饰的糖蛋白,其中Su(A)如式(6)所示、Su(A)-Nuc如式(3)所示、含有末端GlcNAc部分的聚糖如式(1)或(2)所示且经修饰的糖蛋白如式(4)或(5)所示,如上文所述。在该方法中,Su(A)部分的C1经由β-1,4-O-糖苷键连接至GlcNAc部分的C4。
优选地,本发明的方法中使用的β-(1,4)-GalNAcT酶为或衍生自无脊椎动物β-(1,4)-GalNAcT酶,即为或衍生自来源于无脊椎动物物种的β-(1,4)-GalNAcT。β-(1,4)-GalNAcT酶可以为或可以衍生自本领域技术人员已知的任何无脊椎动物β-(1,4)-GalNAcT酶。优选地,β-(1,4)-GalNAcT酶为或衍生自来源于线虫动物门(Nematoda)、优选来源于色矛纲(Chromadorea)或胞管肾纲(Secernentea),或来源于节肢动物门(Arthropoda),优选来源于昆虫纲(Insecta)的β-(1,4)-GalNAcT酶。优选地,β-(1,4)-GalNAcT酶为或衍生自来源于秀丽隐杆线虫(Caenorhabditis elegans)、腐生水果线虫(Caenorhabditisremanei)、Caenorhabditis briggsae、猪蛔虫(Ascaris suum)、粉纹夜蛾(Trichoplusiani)、黑腹果蝇(Drosophila melanogaster)、吴策线虫(Wuchereriabancrofti)、罗阿丝虫(Loa loa)、毕氏粗角猛蚁(Cerapachys biroi)、湿木白蚁(Zootermopsis nevadensis)、佛罗里达弓背蚁(Camponotusfloridanus)、长牡蛎(Crassostrea gigas)或大红斑蝶(Danaus plexippus),优选来源于秀丽隐杆线虫、猪蛔虫、粉纹夜蛾或黑腹果蝇的β-(1,4)-GalNAcT酶。更优选地,β-(1,4)-GalNAcT酶为或衍生自来源于秀丽隐杆线虫、猪蛔虫或粉纹夜蛾的β-(1,4)-GalNAcT酶。在其他优选的实施方案中,β-(1,4)-GalNAcT酶为或衍生自来源于猪蛔虫的β-(1,4)-GalNAcT酶。在另一个优选的实施方案中,β-(1,4)-GalNAcT酶为或衍生自来源于粉纹夜蛾的β-(1,4)-GalNAcT酶。在另一个优选的实施方案中,β-(1,4)-GalNAcT酶为或衍生自来源于秀丽隐杆线虫的β-(1,4)-GalNAcT酶。
在本文中,秀丽隐杆线虫也称为Ce,猪蛔虫也称为As,粉纹夜蛾也称为Tn,黑腹果蝇也称为Dm。
优选地,用于本发明的方法的β-(1,4)-GalNAcT酶与选自SEQ ID NO:2-5和15-23的序列,更优选与选自SEQ ID NO:2-5的序列具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或优选100%的序列同一性。换言之,优选用于本发明的方法的β-(1,4)-GalNAcT酶与选自SEQ IDNO:2、SEQ ID NO:3、SEQ ID NO:4和SEQ ID NO:5、SEQ ID NO:15、SEQ ID NO:16、SEQ IDNO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22和SEQID NO:23的序列,更优选与选自SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4和SEQ ID NO:5的序列,甚至更优选与选自SEQ ID NO:2、SEQ ID NO:3和SEQ ID NO:4的序列,甚至更优选与选自SEQ ID NO:3和SEQ ID NO:4的序列,最优选与SEQ ID NO:4具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或优选100%的序列同一性。
优选地,用于本发明的方法的β-(1,4)-GalNAcT酶为或衍生自选自如下的任何天然存在的或野生型β-(1,4)-GalNAcT酶:本文中命名为CeGalNAcT的秀丽隐杆线虫β-(1,4)-GalNAcT(SEQ ID NO:2)、本文中命名为AsGalNAcT的猪蛔虫β-(1,4)-GalNAcT(SEQ ID NO:3)、本文中命名为TnGalNAcT的粉纹夜蛾β-(1,4)-GalNAcT(SEQ ID NO:4)、本文中命名为DmGalNAcT的黑腹果蝇β-(1,4)-GalNAcT(SEQ ID NO:5)、腐生水果线虫β-(1,4)-GalNAcT(SEQ ID NO:15)、Caenorhabditis briggsaeβ-(1,4)-GalNAcT(SEQ ID NO:16)、吴策线虫β-(1,4)-GalNAcT(SEQ ID NO:17)、罗阿丝虫β-(1,4)-GalNAcT(SEQ ID NO:18)、毕氏粗角猛蚁β-(1,4)-GalNAcT(SEQ ID NO:19)、湿木白蚁β-(1,4)-GalNAcT(SEQ ID NO:20)、佛罗里达弓背蚁β-(1,4)-GalNAcT(SEQ ID NO:21)、长牡蛎β-(1,4)-GalNAcT(SEQ ID NO:22)和大红斑蝶β-(1,4)-GalNAcT(SEQ ID NO:23)。
在优选的实施方案中,用于本发明的方法的β-(1,4)-GalNAcT酶为或衍生自选自如下的任何天然存在的或野生型β-(1,4)-GalNAcT酶:本文中命名为CeGalNAcT的秀丽隐杆线虫β-(1,4)-GalNAcT(SEQ ID NO:2)、本文中命名为AsGalNAcT的猪蛔虫β-(1,4)-GalNAcT(SEQ ID NO:3)、本文中命名为TnGalNAcT的粉纹夜蛾β-(1,4)-GalNAcT(SEQ ID NO:4)和本文中命名为DmGalNAcT的黑腹果蝇β-(1,4)-GalNAcT(SEQ ID NO:5)。
在另一个优选的实施方案中,用于本发明的方法的β-(1,4)-GalNAcT酶为或衍生自选自如下的任何天然存在的或野生型β-(1,4)-GalNAcT酶:本文中命名为CeGalNAcT的秀丽隐杆线虫β-(1,4)-GalNAcT(SEQ ID NO:2)、本文中命名为AsGalNAcT的猪蛔虫β-(1,4)-GalNAcT(SEQ ID NO:3)和本文中命名为TnGalNAcT的粉纹夜蛾β-(1,4)-GalNAcT(SEQ IDNO:4)。
在另一个优选的实施方案中,用于本发明的方法的β-(1,4)-GalNAcT酶为或衍生自选自如下的任何天然存在的或野生型β-(1,4)-GalNAcT酶:本文中命名为AsGalNAcT的猪蛔虫β-(1,4)-GalNAcT(SEQ ID NO:3)和本文中命名为TnGalNAcT的粉纹夜蛾β-(1,4)-GalNAcT(SEQ ID NO:4)。
在特别优选的实施方案中,用于本发明的方法的β-(1,4)-GalNAcT酶为或衍生自本文中命名为TnGalNAcT的粉纹夜蛾β-(1,4)-GalNAcT(SEQ ID NO:4)。
在另一个优选的实施方案中,用于本发明的方法的β-(1,4)-GalNAcT酶是β-(1,4)-GalNAcT酶,其为或衍生自来源于无脊椎动物物种的β-(1,4)-GalNAcT酶,所述无脊椎动物为线虫动物门、优选色矛纲(Chromadorea)、优选杆线虫目(Rhabditida)、优选小杆科(Rhabditidae)、优选新杆状线虫属(Caenorhabditis)。优选地,用于本发明的方法的β-(1,4)-GalNAcT酶与SEQ ID NO:2、15和16的序列具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或优选100%的序列同一性。更优选地,所述无脊椎动物物种是秀丽隐杆线虫。优选地,用于本发明的方法的β-(1,4)-GalNAcT酶与SEQ ID NO:2具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或优选100%的序列同一性。
在另一个优选的实施方案中,用于本发明的方法的β-(1,4)-GalNAcT酶为或衍生自来源于无脊椎动物物种的β-(1,4)-GalNAcT酶,所述无脊椎动物为线虫动物门、优选胞管肾纲(Secernentea)、优选蛔目(Ascaridida)、优选蛔虫科(Ascarididae)、优选蛔虫属(Ascaris)。更优选地,所述无脊椎动物物种是猪蛔虫(Ascaris Sum)。优选地,用于本发明的方法的β-(1,4)-GalNAcT酶与SEQ ID NO:3的序列具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或优选100%的序列同一性。
在另一个优选的实施方案中,用于本发明的方法的β-(1,4)-GalNAcT酶为或衍生自来源于无脊椎动物物种的β-(1,4)-GalNAcT酶,所述无脊椎动物物种为节肢动物门(Anthropoda)、优选昆虫纲(Insecta)、优选鳞翅目(Lepidoptera)、优选夜蛾科(Noctuidae)、优选粉纹夜蛾属(Trichoplusia)。更优选地,所述无脊椎动物物种是粉纹夜蛾。粉纹夜蛾有时也可称为Phytometra brassicae、Plusia innata或甘蓝银纹夜蛾(cabbage looper)。优选地,用于本发明的方法的β-(1,4)-GalNAcT酶与SEQ ID NO:4的序列具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或优选100%的序列同一性。
在另一个优选的实施方案中,用于本发明的方法的β-(1,4)-GalNAcT酶为或衍生自来源于无脊椎动物物种的β-(1,4)-GalNAcT酶,所述无脊椎动物物种为节肢动物门、优选昆虫纲(Insecta)、优选双翅目(Diptera)、优选果蝇科(Drosophilidae)、优选果蝇属(Drosophila)。更优选地,所述无脊椎动物物种是黑腹果蝇。优选地,用于本发明的方法的β-(1,4)-GalNAcT酶与SEQ ID NO:5的序列具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或优选100%的序列同一性。
在本文中,“衍生自”β-(1,4)-GalNAcT酶应理解为具有分别通过置换、插入、缺失或添加一个或多个,优选1、2、3、4、5、6、7、8、9、10、12、14、16、18、20或更多个氨基酸而改变自天然存在的β-(1,4)-GalNAcT酶的氨基酸序列的β-(1,4)-GalNAcT酶。在本文中,衍生自β-(1,4)-GalNAcT酶的β-(1,4)-GalNAcT酶也称为衍生的β-(1,4)-GalNAcT酶或修饰的β-(1,4)-GalNAcT酶或β-(1,4)-GalNAcT突变酶或β-(1,4)-GalNAcT突变体。
衍生的酶是本领域已知的,包括已经经过氨基酸序列的常规和标准修饰的酶,例如去除跨膜结构域、包含标签(例如如本文所述的溶解性和/或纯化标签)。得到具有经修饰的氨基酸序列的酶的这些方法是本领域公知的,并且包括在本发明的方法中。
在一个实施方案中,衍生的酶——即与本文提及的天然存在的β-(1,4)-GalNAcT酶具有小于100%的序列同一性——优选具有天然存在的β-(1,4)-GalNAcT酶的酶活性的至少10%、20%、30%、40%、50%、60%、70%或优选至少80%或90%或至少100%的酶活性。在本文中,将活性方便地测定为将(修饰的)GalNAc残基掺入糖蛋白的末端GlcNAc残基上的功效。
所述酶不是半乳糖基转移酶。在一个实施方案中,所述酶不是归类为E.C.2.4.1.38或归类为E.C.2.4.1.133的酶,优选不是归类为E.C.2.4.1.22、归类为E.C.2.4.1.38、归类为E.C.2.4.1.90或归类为E.C.2.4.1.133的酶。
在一个实施方案中,所述酶是归类为E.C.2.4.1.41、归类为E.C.2.4.1.92、归类为E.C.2.4.1.174或归类为E.C.2.4.1.244的酶,优选归类为E.C.2.4.1.92或归类为E.C.2.4.1.244的酶。
优选地,通过添加额外的N-或C-末端氨基酸或化学部分,或通过缺失N-或C-末端氨基酸来修饰所述衍生的β-(1,4)-GalNAcT酶以增加稳定性、溶解性、活性和/或易于纯化。
优选地,通过缺失N-末端胞质结构域和跨膜结构域来修饰β-(1,4)-GalNAcT酶,其在本文中称为截短的酶。本领域已知这些结构域的缺失产生在水溶液中表现出增加的溶解度的酶。
例如,CeGalNAcT(30-383)在本文中应理解为由SEQ ID NO:2的第30-383位上的氨基酸表示的氨基酸序列组成的截短的秀丽隐杆线虫β-(1,4)-GalNAcT酶。类似地,AsGalNAcT(30-383)在本文中应理解为由SEQ ID NO:3的第30-383位上的氨基酸表示的氨基酸序列组成的截短的猪蛔虫β-(1,4)-GalNAcT酶,TnGalNAcT(33-421)在本文中应理解为由SEQ ID NO:4的第33-421位上的氨基酸表示的氨基酸序列组成的截短的粉纹夜蛾β-(1,4)-GalNAcT酶,DmGalNAcT(47-403)在本文中应理解为由SEQ ID NO:5的第47-403位上的氨基酸表示的氨基酸序列组成的截短的黑腹果蝇β-(1,4)-GalNAcT酶。
优选地,用于本发明的方法的β-(1,4)-GalNAcT酶与SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8或SEQ ID NO:9的任一序列,更优选与SEQ ID NO:6、SEQ ID NO:7或SEQ IDNO:8的序列,甚至更优选与SEQ ID NO:7或SEQ ID NO:8的序列,甚至更优选与序列SEQ IDNO:8具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或优选至少100%的序列同一性。
其中一个或多个氨基酸已被置换、添加或缺失的β-(1,4)-GalNAcT酶在本文中也称为衍生的β-(1,4)-GalNAcT酶。优选地,通过缺失N-末端胞质结构域和跨膜结构域来修饰,并通过置换一个或多个氨基酸来修饰β-(1,4)-GalNAcT酶。在本文中,一个或多个氨基酸的置换也称为突变。包含一个或多个置换的氨基酸的酶也称为突变酶。
在本发明的方法中,当糖基转移酶衍生自秀丽隐杆线虫β-(1,4)-GalNAcT酶或截短的β-(1,4)-GalNAcT酶时,优选所述酶还包含一个或多个突变。优选的突变包括在第257位由亮氨酸(Leu,也称为L)、甲硫氨酸(Met,也称为M)或丙氨酸(Ala,也称为A)置换异亮氨酸(Ile,也称为I)。优选的突变还包括在第312位由组氨酸(His,也称为H)置换甲硫氨酸(Met,也称为M)。因此,当糖基转移酶衍生自CeGalNAcT或CeGalNAcT(30-383)时,优选所述酶包含I257L、I257M或I257A突变,和/或M312H突变。
应注意,在本文中氨基酸位置的编号是基于野生型β-(1,4)-GalNAcT酶中氨基酸位置的编号。当β-(1,4)-GalNAcT酶是例如截短的酶时,本文中用来表示例如氨基酸置换的位置的数字对应于相应的野生型β-(1,4)-GalNAcT酶中的氨基酸位置的编号。
作为实例,在野生型CeGalNAcT(SEQ ID NO:2)中,异亮氨酸(Ile,I)存在于第257位氨基酸位置上。在CeGalNAcT(I257L)中,第257位的异亮氨酸氨基酸被亮氨酸氨基酸(Leu,L)置换。如上所述,CeGalNAcT(30-383)在本文中应理解为由SEQ ID NO:2的第30-383位的氨基酸表示的氨基酸序列组成的截短的CeGalNAcT酶,而CeGalNAcT(30-383)本身由SEQ ID NO:6表示。在CeGalNAcT(30-383;I257L)中,I257L中的数字“257”表示它是相应野生型CeGalNAcT中的第257位上的I氨基酸(即用L氨基酸置换的SEQ ID NO:2的数字257)。在SEQ ID NO:2的第257位的异亮氨酸氨基酸由SEQ ID NO:6的第228位的异亮氨酸氨基酸表示。
优选的截短的秀丽隐杆线虫β-(1,4)-GalNAcT突变酶包括CeGalNAcT(30-383;I257L)(SEQ ID NO:10)、CeGalNAcT(30-383;I257M)(SEQ ID NO:11)、CeGalNAcT(30-383;I257A)(SEQ ID NO:12)和CeGalNAcT(30-383;M312H)(SEQ ID NO:13)。
在本发明的方法中,当糖基转移酶衍生自粉纹夜蛾β-(1,4)-GalNAcT酶或截短的粉纹夜蛾β-(1,4)-GalNAcT酶时,优选所述酶还包含一个或多个突变。优选的突变包括在第336位由苯丙氨酸(Phe,也称为F)、组氨酸(His,也称为H)或缬氨酸(Val,也称为V)置换色氨酸(Trp,也称为W)。因此,当糖基转移酶衍生自TnGalNAcT或TnGalNAcT(33-421)时,优选所述酶包含W336F、W336H或W336V突变。TnGalNAcT或TnGalNAcT(33-421)的优选突变还包括在第339位由丙氨酸(Ala,也称为A)、甘氨酸(Gly,也称为G)、天冬氨酸(Asp,也称为D)或丝氨酸(Ser,也称为S)置换谷氨酸(Glu,也称为E)。因此,当糖基转移酶衍生自TnGalNAcT或TnGalNAcT(33-421)时,优选所述酶包含E339A、E339G、E339D或E339S突变。更优选地,当糖基转移酶衍生自TnGalNAcT或TnGalNAcT(33-421)时,第336位和第339位均如上所述突变。因此,当糖基转移酶衍生自TnGalNAcT或TnGalNAcT(33-421)时,优选所述酶包含W336F、W336H或W336V突变或E339A、E339G、E339D或E339S突变。
TnGalNAcT或TnGalNAcT(33-421)的优选突变还包括在第311位由酪氨酸(Tyr,也称为Y)置换异亮氨酸(Ile,也称为I)。因此,当糖基转移酶衍生自TnGalNAcT或TnGalNAcT(33-421)时,优选所述酶包含I311Y突变。
当糖基转移酶衍生自TnGalNAcT或TnGalNAcT(33-421)且包含I311Y突变时,所述酶还可以包含如上所述的第336位上的突变和/或如上所述的第339位上的突变。因此,当糖基转移酶衍生自包含I311Y突变的TnGalNAcT或TnGalNAcT(33-421)时,所述酶还可以包含W336F、W336H或W336V突变和/或E339A、E339G、E339D或E339S突变。
在本发明的方法的优选实施方案中,为或衍生自β-(1,4)-GalNAcT酶的糖基转移酶是选自以下的粉纹夜蛾β-(1,4)-GalNAcT酶:TnGalNAcT(33-421;W336F)(SEQ ID NO:25)、TnGalNAcT(33-421;W336H)(SEQ ID NO:26)、TnGalNAcT(33-421;W336V)(SEQ ID NO:27)、TnGalNAcT(33-421;E339A)(SEQ ID NO:28)、TnGalNAcT(33-421;E339G)(SEQ ID NO:29)、TnGalNAcT(33-421;E339D)(SEQ IDNO:30)和TnGalNAcT(33-421;E339S)(SEQ ID NO:31)。
在本发明的方法的另一个优选实施方案中,为或衍生自β-(1,4)-GalNAcT酶的糖基转移酶为选自TnGalNAcT(33-421;W336H、E339A)(SEQ ID NO:32)、TnGalNAcT(33-421;W336H、E339D)(SEQ ID NO:33)和TnGalNAcT(33-421;W336H、E339S)(SEQ IDNO:34)的粉纹夜蛾β-(1,4)-GalNAcT酶。
在本发明的方法的另一个优选实施方案中,为或衍生自β-(1,4)-GalNAcT酶的糖基转移酶为粉纹夜蛾β-(1,4)-GalNAcT酶TnGalNAcT(33-421;I311Y)(SEQ ID NO:35)。
在本发明的方法的另一个优选实施方案中,为或衍生自β-(1,4)-GalNAcT酶的糖基转移酶为选自TnGalNAcT(33-421;I311Y、W336F)(SEQ ID NO:36)、TnGalNAcT(33-421;I311Y、W336H)(SEQ ID NO:37)、TnGalNAcT(33-421;I311Y、W336V)(SEQ IDNO:38)、TnGalNAcT(33-421;I311Y、E339A)(SEQ ID NO:39)、TnGalNAcT(33-421;I311Y、E339G)(SEQID NO:40)、TnGalNAcT(33-421;I311Y、E339D)(SEQ ID NO:41)和TnGalNAcT(33-421;I311Y、E339S)(SEQ ID NO:42)的粉纹夜蛾β-(1,4)-GalNAcT酶。
在本发明的方法的另一个优选实施方案中,为或衍生自β-(1,4)-GalNAcT酶的糖基转移酶为选自TnGalNAcT(33-421;I311Y、W336H、E339A)(SEQ ID NO:43)、TnGalNAcT(33-421;I311Y、W336H、E339D)(SEQ ID NO:44)和TnGalNAcT(33-421;I311Y、W336H、E339S)(SEQID NO:45)的粉纹夜蛾β-(1,4)-GalNAcT酶。
在本发明的方法中,当糖基转移酶衍生自猪蛔虫β-(1,4)-GalNAcT酶或截短的猪蛔虫β-(1,4)-GalNAcT酶时,优选所述酶还包含一个或多个突变。优选的突变包括在第282位由组氨酸(His,也称为H)置换色氨酸(Trp,也称为W),和/或在第285位由天冬氨酸(Asp,也称为D)置换谷氨酸(Glu,也称为E),和/或在第257位由酪氨酸(Tyr,也称为Y)置换异亮氨酸(Ile,也称为I)。因此,当糖基转移酶衍生自AsGalNAcT或AsGalNAcT(30-383)时,优选所述酶包含W282H突变、E285D突变和/或I257Y突变。
在本发明的方法的一个优选实施方案中,为或衍生自β-(1,4)-GalNAcT酶的糖基转移酶是选自以下的猪蛔虫β-(1,4)-GalNAcT:AsGalNAcT(30-383;W282H)(SEQ ID NO:46)和AsGalNAcT(30-383;E285D)(SEQ ID NO:47)。
在本发明的方法的另一个优选实施方案中,为或衍生自β-(1,4)-GalNAcT酶的糖基转移酶是猪蛔虫β-(1,4)-GalNAcT:AsGalNAcT(30-383;I257Y)(SEQ ID NO:48)。
在本发明的方法的另一个优选实施方案中,为或衍生自β-(1,4)-GalNAcT酶的糖基转移酶是选自以下的猪蛔虫β-(1,4)-GalNAcT:AsGalNAcT(30-383;I257Y、W282H)和AsGalNAcT(30-383;I257Y、E285D)。
在本发明的方法的优选实施方案中,本文中定义的为或衍生自β-(1,4)-GalNAcT酶的糖基转移酶包含编码易于纯化的标签的序列。优选地,所述标签选自但不限于FLAG标签、聚(His)标签、HA标签、Myc标签、SUMO标签、GST标签、MBP标签或CBP标签,更优选所述标签为6xHis标签。其他优选的待被掺入酶中的标签为可溶性标签,例如AFV标签、SlyD标签、Tsf标签、SUMO标签、Bla标签、MBP标签和GST标签。在其他优选的实施方案中,所述标签共价连接至β-(1,4)-GalNAcT酶的C-末端。在另一个优选的实施方案中,所述标签共价连接至β-(1,4)-GalNAcT酶的N-末端。
当β-(1,4)-GalNAcT酶衍生自秀丽隐杆线虫β-(1,4)-GalNAcT时,His-标记的β-(1,4)-GalNAcT酶优选为CeGalNAcT(30-383)-His(SEQ ID NO:14)。
在本发明的方法的一个优选的实施方案中,当β-(1,4)-GalNAcT酶为或衍生自粉纹夜蛾β-(1,4)-GalNAcT时,His-标记的β-(1,4)-GalNAcT酶为或衍生自His-TnGalNAcT(33-421)(SEQ ID NO:49)。
在本发明的方法的另一个优选实施方案中,当β-(1,4)-GalNAcT酶为或衍生自粉纹夜蛾β-(1,4)-GalNAcT时,His-标记的β-(1,4)-GalNAcT酶为或衍生自His-TnGalNAcT(33-421;W336F)(SEQ ID NO:50)、His-TnGalNAcT(33-421;W336H)(SEQ ID NO:51)、His-TnGalNAcT(33-421;W336V)(SEQ ID NO:52)、His-TnGalNAcT(33-421;339A)(SEQ ID NO:53)、His-TnGalNAcT(33-421;E339G)(SEQ ID NO:54)、His-TnGalNAcT(33-421;E339D)(SEQID NO:55)、His-TnGalNAcT(33-421;E339S)(SEQ ID NO:56)、His-TnGalNAcT(33-421;W336H、E339A)(SEQ ID NO:57)、His-TnGalNAcT(33-421;W336H、E339D)(SEQ ID NO:58)或His-TnGalNAcT(33-421;W336H、E339S)(SEQ ID NO:59)。
在本发明的方法的另一个优选实施方案中,当β-(1,4)-GalNAcT酶为或衍生自粉纹夜蛾β-(1,4)-GalNAcT时,His-标记的β-(1,4)-GalNAcT酶为或衍生自His-TnGalNAcT(33-421;I311Y)(SEQ ID NO:60)。
在本发明的方法的另一个优选实施方案中,当β-(1,4)-GalNAcT酶为或衍生自粉纹夜蛾β-(1,4)-GalNAcT时,His-标记的β-(1,4)-GalNAcT酶为或衍生自His-TnGalNAcT(33-421;I311Y、W336F)(SEQ ID NO:61)、His-TnGalNAcT(33-421;I311Y、W336H)(SEQ IDNO:62)、His-TnGalNAcT(33-421;I311Y、W336V)(SEQ ID NO:63)、His-TnGalNAcT(33-421;I311Y、E339A)(SEQ ID NO:64)、His-TnGalNAcT(33-421;I311Y、E336G)(SEQ ID NO:65)、His-TnGalNAcT(33-421;I311Y、E339D)(SEQ ID NO:66)、His-TnGalNAcT(33-421;I311Y、E339S)(SEQ ID NO:67)、His-TnGalNAcT(33-421;I311Y、W336H、E339A)(SEQ ID NO:68)、His-TnGalNAcT(33-421;I311Y、W336H、E339D)(SEQ ID NO:69)或His-TnGalNAcT(33-421;I311Y、W336H、E339S)(SEQ ID NO:70)。
在本发明的方法的另一个优选实施方案中,当β-(1,4)-GalNAcT酶为或衍生自猪蛔虫β-(1,4)-GalNAcT时,His-标记的β-(1,4)-GalNAcT酶为或衍生自His-AsGalNAcT(30-383)(SEQ ID NO:71)。
在本发明的方法的另一个优选实施方案中,当β-(1,4)-GalNAcT酶为或衍生自猪蛔虫β-(1,4)-GalNAcT时,His-标记的β-(1,4)-GalNAcT酶为或衍生自His-AsGalNAcT(30-383;W282H)(SEQ ID NO:72)、His-AsGalNAcT(30-383;E285D)(SEQ ID NO:73)或His-AsGalNAcT(30-383;I257Y)(SEQ ID NO:74)。
在本发明的方法的优选实施方案中,用于所述方法的β-(1,4)-N-乙酰半乳糖胺转移酶为或衍生自选自SEQ ID NO:2-23和SEQ ID NO:25-74的序列。
在本发明的方法的优选实施方案中,用于所述方法的β-(1,4)-N-乙酰半乳糖胺转移酶为或衍生自选自SEQ ID NO:2-23的序列。换言之,在优选的实施方案中,用于本发明的方法的β-(1,4)-N-乙酰半乳糖胺转移酶为或衍生自选自以下的序列:SEQ ID NO:2、SEQ IDNO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ IDNO:21、SEQ ID NO:22和SEQ ID NO:23。
在本文中,术语“衍生自”包括例如截短的酶、突变酶和包含易于纯化的标签的酶,这些修饰在上文更详细地描述。术语“衍生自”还包括包含在上文更详细描述的修饰的组合的酶。
在另一个优选的实施方案中,用于本发明的方法的β-(1,4)-N-乙酰半乳糖胺转移酶与选自SEQ ID NO:2-23,即选自SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22和SEQ ID NO:23的序列具有至少50%的同一性,优选至少55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或优选100%的序列同一性。
在本发明的方法的优选实施方案中,用于所述方法的β-(1,4)-N-乙酰半乳糖胺转移酶为或衍生自选自SEQ ID NO:2-9的序列。换言之,在优选的实施方案中,用于本发明的方法的β-(1,4)-N-乙酰半乳糖胺转移酶为或衍生自选自以下的序列:SEQ ID NO:2、SEQ IDNO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8和SEQ ID NO:9。
在另一个优选的实施方案中,用于本发明的方法的β-(1,4)-N-乙酰半乳糖胺转移酶与选自SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ IDNO:7、SEQ ID NO:8和SEQ ID NO:9的序列具有至少50%的同一性,优选至少55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或优选100%的序列同一性。
在本发明的方法的另一个优选实施方案中,用于所述方法的β-(1,4)-N-乙酰半乳糖胺转移酶为或衍生自选自SEQ ID NO:25-45和SEQ ID NO:50-70的序列。换言之,在优选的实施方案中,用于本发明的方法的β-(1,4)-N-乙酰半乳糖胺转移酶为或衍生自选自以下的序列:SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQID NO:30、SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:33、SEQ ID NO:34、SEQ ID NO:35、SEQID NO:36、SEQ ID NO:37、SEQ ID NO:38、SEQ ID NO:39、SEQ ID NO:40、SEQ ID NO:41、SEQID NO:42、SEQ ID NO:43、SEQ ID NO:44、SEQ ID NO:45、SEQ ID NO:50、SEQ ID NO:51、SEQID NO:52、SEQ ID NO:53、SEQ ID NO:54、SEQ ID NO:55、SEQ ID NO:56、SEQ ID NO:57、SEQID NO:58、SEQ ID NO:59、SEQ ID NO:60、SEQ ID NO:61、SEQ ID NO:62、SEQ ID NO:63、SEQID NO:64、SEQ ID NO:65、SEQ ID NO:66、SEQ ID NO:67、SEQ ID NO:68、SEQ ID NO:69和SEQ ID NO:70。
在另一个优选的实施方案中,用于本发明的方法的β-(1,4)-N-乙酰半乳糖胺转移酶与选自SEQ ID NO:25-45和SEQ ID NO:50-70的序列,即与选自SEQ ID NO:25、SEQ IDNO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ IDNO:32、SEQ ID NO:33、SEQ ID NO:34、SEQ ID NO:35、SEQ ID NO:36、SEQ ID NO:37、SEQ IDNO:38、SEQ ID NO:39、SEQ ID NO:40、SEQ ID NO:41、SEQ ID NO:42、SEQ ID NO:43、SEQ IDNO:44、SEQ ID NO:45、SEQ ID NO:50、SEQ ID NO:51、SEQ ID NO:52、SEQ ID NO:53、SEQ IDNO:54、SEQ ID NO:55、SEQ ID NO:56、SEQ ID NO:57、SEQ ID NO:58、SEQ ID NO:59、SEQ IDNO:60、SEQ ID NO:61、SEQ ID NO:62、SEQ ID NO:63、SEQ ID NO:64、SEQ ID NO:65、SEQ IDNO:66、SEQ ID NO:67、SEQ ID NO:68、SEQ ID NO:69和SEQ ID NO:70的序列具有至少50%的同一性,优选至少55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或优选100%的序列同一性。
在本发明的方法的另一个优选实施方案中,用于所述方法的β-(1,4)-N-乙酰半乳糖胺转移酶为或衍生自选自SEQ ID NO:46-49和SEQ ID NO:71-74的序列。换言之,在优选的实施方案中,用于本发明的方法的β-(1,4)-N-乙酰半乳糖胺转移酶为或衍生自选自以下的序列:SEQ ID NO:46、SEQ ID NO:47、SEQ ID NO:48、SEQ ID NO:49、SEQ ID NO:71、SEQID NO:72、SEQ ID NO:73和SEQ ID NO:74。
在另一个优选的实施方案中,用于本发明的方法的β-(1,4)-N-乙酰半乳糖胺转移酶与选自SEQ ID NO:46-49和SEQ ID NO:71-74的序列,即选自SEQ ID NO:46、SEQ ID NO:47、SEQ ID NO:48、SEQ ID NO:49、SEQ ID NO:71、SEQ ID NO:72、SEQ ID NO:73和SEQ IDNO:74的序列具有至少50%的序列同一性,优选至少55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或优选100%的序列同一性。
在本发明的方法中,糖衍生物核苷酸Su(A)-Nuc如式(3)或其优选的实施方案所示,如上文中更详细描述的。R14选自:
其中W、h、a、f、T、A和U及其优选实施方案如上文所定义。
当R14为-NHC(O)CH3时优选的糖基转移酶
在本发明的方法的优选实施方案中,R14是-NHC(O)CH3。在该实施方案中,糖衍生物核苷酸Su(A)-Nuc如式(3a)所示,如上文所定义的。
当Su(A)-Nuc如式(3a)或如上文所述的(3a)的优选实施方案所示时,在所述方法的优选实施方案中,为或衍生自β-(1,4)-GalNAcT的糖基转移酶为或衍生自野生型β-(1,4)-GalNAcT,优选无脊椎动物β-(1,4)-GalNAcT。在所述方法的另一个优选实施方案中,糖基转移酶为或衍生自无脊椎动物β-(1,4)-GalNAcT。在另一个优选的实施方案中,糖基转移酶为或衍生自秀丽隐杆线虫β-(1,4)-GalNAcT(CeGalNAcT)、猪蛔虫β-(1,4)-GalNAcT(AsGalNAcT)或粉纹夜蛾β-(1,4)-GalNAcT(TnGalNAcT)。为或衍生自(CeGalNAcT)、(AsGalNAcT)或(TnGalNAcT)的β-(1,4)-GalNAcT如上文中更详细描述的。
当糖衍生物核苷酸Su(A)-Nuc中的R14为-NHC(O)CH3时,特别优选用于所述方法的β-(1,4)-N-乙酰半乳糖胺转移酶为或衍生自选自SEQ ID NO:2-9,即选自SEQ ID NO:2、SEQID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8和SEQ IDNO:9的序列。更优选地,当R14为-NHC(O)CH3时,用于所述方法的β-(1,4)-N-乙酰半乳糖胺转移酶为或衍生自选自SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8,甚至更优选选自SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8,甚至更优选选自SEQ ID NO:7和SEQ ID NO:8的序列。最优选地,用于所述方法的β-(1,4)-N-乙酰半乳糖胺转移酶为或衍生自SEQ ID NO:8。
在另一个特别优选的实施方案中,当糖衍生物核苷酸Su(A)-Nuc中的R14为-NHC(O)CH3时,用于所述方法的β-(1,4)-N-乙酰半乳糖胺转移酶与选自SEQ ID NO:2-9,即选自SEQID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ IDNO:8和SEQ ID NO:9的序列具有至少50%的序列同一性,优选至少55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或优选100%的序列同一性。更优选地,当R14为-NHC(O)CH3时,用于所述方法的β-(1,4)-N-乙酰半乳糖胺转移酶与选自SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:7和SEQ IDNO:8,更优选选自SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8,甚至更优选选自SEQ ID NO:7和SEQ ID NO:8的序列具有至少50%的序列同一性,优选至少55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或优选100%的序列同一性。最优选地,用于所述方法的β-(1,4)-N-乙酰半乳糖胺转移酶与SEQ ID NO:8具有至少50%的序列同一性,优选至少55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或优选100%的序列同一性。
在其中R14为-NHC(O)CH3的本发明的方法的另一个特别优选的实施方案中,糖基转移酶为或衍生自秀丽隐杆线虫β-(1,4)-GalNAcT(CeGalNAcT)。
在其中R14为-NHC(O)CH3的方法的另一个特别优选的实施方案中,CeGalNAcT为或衍生自SEQ ID NO:2或SEQ ID NO:6。
在其中R14为-NHC(O)CH3的方法的另一个特别优选的实施方案中,用于所述方法的CeGalNAcT为或衍生自SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13或SEQID NO:14。
在其中R14为-NHC(O)CH3的方法的另一个特别优选的实施方案中,用于所述方法的CeGalNAcT与SEQ ID NO:2或SEQ ID NO:6具有至少50%的序列同一性,优选至少55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或优选100%的序列同一性。
在其中R14为-NHC(O)CH3的方法的另一个特别优选的实施方案中,用于所述方法的CeGalNAcT与序列SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13或SEQ IDNO:14具有至少50%的序列同一性,优选至少55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或优选100%的序列同一性。
在其中R14为-NHC(O)CH3的本发明的方法的另一个特别优选的实施方案中,糖基转移酶为或衍生自粉纹夜蛾β-(1,4)-GalNAcT(TnGalNAcT)。
在其中R14为-NHC(O)CH3的方法的其他优选的实施方案中,TnGalNAcT为或衍生自SEQ ID NO:4或SEQ ID NO:8。
在其中R14为-NHC(O)CH3的方法的另一个优选的实施方案中,用于所述方法的TnGalNAcT与SEQ ID NO:4或SEQ ID NO:8具有至少50%的序列同一性,优选至少55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或优选100%的序列同一性。
在其中R14为-NHC(O)CH3的方法的另一个优选实施方案中,用于所述方法的TnGalNAcT为或衍生自选自SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:33、SEQ ID NO:34、SEQ ID NO:49、SEQ ID NO:50、SEQ ID NO:51、SEQ ID NO:52、SEQ ID NO:53、SEQ IDNO:54、SEQ ID NO:55、SEQ ID NO:56、SEQ ID NO:57、SEQ ID NO:58和SEQ ID NO:59的序列。
在另一个优选的实施方案中,用于其中R14为-NHC(O)CH3的方法的TnGalNAcT与选自SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:33、SEQ ID NO:34、SEQ ID NO:49、SEQ IDNO:50、SEQ ID NO:51、SEQ ID NO:52、SEQ ID NO:53、SEQ ID NO:54、SEQ ID NO:55、SEQ IDNO:56、SEQ ID NO:57、SEQ ID NO:58和SEQ ID NO:59的序列具有至少50%的序列同一性,优选至少55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或优选100%的序列同一性。
在其中R14为-NHC(O)CH3的本发明的方法的另一个特别优选的实施方案中,糖基转移酶为或衍生自猪蛔虫β-(1,4)-GalNAcT(AsGalNAcT)。
在其中R14为-NHC(O)CH3的方法的该实施方案中,进一步优选AsGalNAcT为或衍生自SEQ ID NO:3或SEQ ID NO:7。
在其中R14为-NHC(O)CH3的方法的另一个优选的实施方案中,用于所述方法的AsGalNAcT与SEQ ID NO:3或SEQ ID NO:7具有至少50%的序列同一性,优选至少55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或优选100%的序列同一性。
在其中R14为-NHC(O)CH3的方法的另一个优选的实施方案中,用于所述方法的AsGalNAcT为或衍生自选自SEQ ID NO:46、SEQ ID NO:47、SEQ ID NO:71、SEQ ID NO:72和SEQ ID NO:73的序列。
在其中R14为-NHC(O)CH3的方法的另一个优选的实施方案中,用于所述方法的AsGalNAcT与选自SEQ ID NO:46、SEQ ID NO:47、SEQ ID NO:71、SEQ ID NO:72和SEQ IDNO:73的序列具有至少50%的序列同一性,优选至少55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或优选100%的序列同一性。
在本文描述的其中R14为-NHC(O)CH3的本发明的方法的优选实施方案以及如上文中所描述的糖基转移酶中,进一步优选糖衍生物核苷酸Su(A)-Nuc如上文所定义的式(15)、(16)、(17)或(18)所示,其中R14为-NHC(O)CH3;或如上文所定义的式(19)、(20)、(21)、(22)、(23)、(24)、(25)、(26)、(65)、(66)、(67)、(68)或(69)所示,其中R14为-NHC(O)CH3;或如上文所定义的式(27)所示。在这些特别优选的实施方案中,进一步优选的是Nuc为UDP。
当R14为-NHC(O)-(W)h-(U)f-(T)a-A时优选的糖基转移酶
在本发明的方法的另一个优选实施方案中,R14是-NHC(O)-(W)h-(U)f-(T)a-A。在该实施方案中,糖衍生物核苷酸Su(A)-Nuc如式(3b)所示,如上文所定义的。
当Su(A)-Nuc如式(3b)或如上文所述的(3b)的优选实施方案所示时,在所述方法的优选实施方案中,为或衍生自β-(1,4)-GalNAcT的糖基转移酶为或衍生自野生型β-(1,4)-GalNAcT,优选无脊椎动物β-(1,4)-GalNAcT。在所述方法的另一个优选实施方案中,糖基转移酶为或衍生自无脊椎动物β(1,4)-GalNAcT。在另一个优选的实施方案中,糖基转移酶为或衍生自秀丽隐杆线虫β-(1,4)-GalNAcT(CeGalNAcT)、猪蛔虫β-(1,4)-GalNAcT(AsGalNAcT)或粉纹夜蛾β-(1,4)-GalNAcT(TnGalNAcT)。为或衍生自(CeGalNAcT)、(AsGalNAcT)或(TnGalNAcT)的β-(1,4)-GalNAcT如上文中更详细描述的。
当糖衍生物核苷酸Su(A)-Nuc中的R14为-NHC(O)-(W)h-(U)f-(T)a-A时,特别优选用于所述方法的β-(1,4)-N-乙酰半乳糖胺转移酶为或衍生自选自SEQ ID NO:2-9,即选自SEQID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ IDNO:8和SEQ ID NO:9的序列。更优选地,当R14为-NHC(O)-(W)h-(U)f-(T)a-A时,用于所述方法的β-(1,4)-N-乙酰半乳糖胺转移酶为或衍生自选自SEQ ID NO:2、SEQ ID NO:3、SEQ IDNO:4、SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8,更优选选自SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8,甚至更优选选自SEQ ID NO:7和SEQ ID NO:8的序列。最优选地,用于所述方法的β-(1,4)-N-乙酰半乳糖胺转移酶为或衍生自SEQ ID NO:8。
在另一个特别优选的实施方案中,当糖衍生物核苷酸Su(A)-Nuc中的R14为-NHC(O)-(W)h-(U)f-(T)a-A时,用于所述方法的β-(1,4)-N-乙酰半乳糖胺转移酶与选自SEQ IDNO:2-9,即选自SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQID NO:7、SEQ ID NO:8和SEQ ID NO:9的序列具有至少50%的序列同一性,优选至少55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或优选100%的序列同一性。更优选地,当R14为-NHC(O)-(W)h-(U)f-(T)a-A时,用于所述方法的β-(1,4)-N-乙酰半乳糖胺转移酶与选自SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8,更优选选自SEQ ID NO:6、SEQ ID NO:7和SEQID NO:8,甚至更优选选自SEQ ID NO:7和SEQ ID NO:8的序列具有至少50%的序列同一性,优选至少55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或优选100%的序列同一性。最优选地,用于所述方法的β-(1,4)-N-乙酰半乳糖胺转移酶与SEQ ID NO:8具有至少50%的序列同一性,优选至少55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或优选100%的序列同一性。
在其中R14为-NHC(O)-(W)h-(U)f-(T)a-A的本发明的方法的另一个特别优选的实施方案中,糖基转移酶为或衍生自秀丽隐杆线虫β-(1,4)-GalNAcT(CeGalNAcT)。
在其中R14为-NHC(O)-(W)h-(U)f-(T)a-A的方法的另一个特别优选的实施方案中,CeGalNAcT为或衍生自SEQ ID NO:2或SEQ ID NO:6。
在其中R14为-NHC(O)-(W)h-(U)f-(T)a-A的方法的另一个特别优选的实施方案中,用于所述方法的CeGalNAcT为或衍生自SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQID NO:13或SEQ ID NO:14。
在其中R14为-NHC(O)-(W)h-(U)f-(T)a-A的方法的另一个特别优选的实施方案中,用于所述方法的CeGalNAcT与SEQ ID NO:2或SEQ ID NO:6具有至少50%的序列同一性,优选至少55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或优选100%的序列同一性。
在其中R14为-NHC(O)-(W)h-(U)f-(T)a-A的方法的另一个特别优选的实施方案中,用于所述方法的CeGalNAcT与序列SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ IDNO:13或SEQ ID NO:14具有至少50%的序列同一性,优选至少55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或优选100%的序列同一性。
在其中R14为-NHC(O)-(W)h-(U)f-(T)a-A的本发明的方法的另一个特别优选的实施方案中,糖基转移酶为或衍生自粉纹夜蛾β-(1,4)-GalNAcT(TnGalNAcT)。
在其中R14为-NHC(O)-(W)h-(U)f-(T)a-A的方法的其他优选的实施方案中,TnGalNAcT为或衍生自SEQ ID NO:4或SEQ ID NO:8。
在其中R14为-NHC(O)-(W)h-(U)f-(T)a-A的方法的另一个优选的实施方案中,用于所述方法的TnGalNAcT与SEQ ID NO:4或SEQ ID NO:8具有至少50%的序列同一性,优选至少55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或优选100%的序列同一性。
在其中R14为-NHC(O)-(W)h-(U)f-(T)a-A的方法的另一个优选实施方案中,用于所述方法的TnGalNAcT为或衍生自选自SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ IDNO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:33、SEQ IDNO:34、SEQ ID NO:49、SEQ ID NO:50、SEQ ID NO:51、SEQ ID NO:52、SEQ ID NO:53、SEQ IDNO:54、SEQ ID NO:55、SEQ ID NO:56、SEQ ID NO:57、SEQ ID NO:58和SEQ ID NO:59的序列。
在另一个优选的实施方案中,用于其中R14为-NHC(O)-(W)h-(U)f-(T)a-A的方法的TnGalNAcT与选自SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:33、SEQ ID NO:34、SEQ IDNO:49、SEQ ID NO:50、SEQ ID NO:51、SEQ ID NO:52、SEQ ID NO:53、SEQ ID NO:54、SEQ IDNO:55、SEQ ID NO:56、SEQ ID NO:57、SEQ ID NO:58和SEQ ID NO:59的序列具有至少50%的序列同一性,优选至少55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或优选100%的序列同一性。
在其中R14为-NHC(O)-(W)h-(U)f-(T)a-A的本发明的方法的另一个特别优选的实施方案中,糖基转移酶为或衍生自猪蛔虫β-(1,4)-GalNAcT(AsGalNAcT)。
在其中R14为-NHC(O)-(W)h-(U)f-(T)a-A的方法的该实施方案中,进一步优选的是AsGalNAcT为或衍生自SEQ ID NO:3或SEQ ID NO:7。
在其中R14为-NHC(O)-(W)h-(U)f-(T)a-A的方法的另一个优选的实施方案中,用于所述方法的AsGalNAcT与SEQ ID NO:3或SEQ ID NO:7具有至少50%的序列同一性,优选至少55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或优选100%的序列同一性。
在其中R14为-NHC(O)-(W)h-(U)f-(T)a-A的方法的另一个优选的实施方案中,用于所述方法的AsGalNAcT为或衍生自选自SEQ ID NO:46、SEQ ID NO:47、SEQ ID NO:71、SEQID NO:72和SEQ ID NO:73的序列。
在其中R14为-NHC(O)-(W)h-(U)f-(T)a-A的方法的另一个优选的实施方案中,用于所述方法的AsGalNAcT与选自SEQ ID NO:46、SEQ ID NO:47、SEQ ID NO:71、SEQ ID NO:72和SEQ ID NO:73的序列具有至少50%的序列同一性,优选至少55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或优选100%的序列同一性。
在本文描述的其中R14为-NHC(O)-(W)h-(U)f-(T)a-A的本发明的方法的优选实施方案以及如上文中所描述的糖基转移酶中,进一步优选糖衍生物核苷酸Su(A)-Nuc如上文所定义的式(15)、(16)、(17)或(18)所示,其中R14为-NHC(O)-(W)h-(U)f-(T)a-A;或如上文所定义的式(19)、(20)、(21)、(22)、(23)、(24)、(25)、(26)、(65)、(66)、(67)、(68)或(69)所示,其中R14为-NHC(O)-(W)h-(U)f-(T)a-A;或如上文所定义的式(28)、(29)、(30)或(31)所示。在这些特别优选的实施方案中,进一步优选的是Nuc为UDP。
当R14为-OH时优选的糖基转移酶
在本发明的方法的优选实施方案中,R14是-OH。在该实施方案中,糖衍生物核苷酸Su(A)-Nuc如式(3c)所示,如上文所定义的。
当Su(A)-Nuc如式(3c)或如上文所述的(3c)的优选实施方案所示时,在所述方法的优选实施方案中,糖基转移酶衍生自野生型β-(1,4)-GalNAcT,优选无脊椎动物β-(1,4)-GalNAcT。在所述方法的另一个优选实施方案中,糖基转移酶衍生自无脊椎动物β-(1,4)-GalNAcT。在其他优选的实施方案中,糖基转移酶衍生自秀丽隐杆线虫β-(1,4)-GalNAcT(CeGalNAcT)、猪蛔虫β-(1,4)-GalNAcT(AsGalNAcT)或粉纹夜蛾β-(1,4)-GalNAcT(TnGalNAcT)。衍生自(CeGalNAcT)、(AsGalNAcT)或(TnGalNAcT)的β-(1,4)-GalNAcT如上文中更详细描述的。
在其中R14为-OH的本发明的方法的另一个特别优选的实施方案中,糖基转移酶衍生自秀丽隐杆线虫β-(1,4)-GalNAcT(CeGalNAcT)。
在其中R14为-OH的本发明的方法的另一个特别优选的实施方案中,糖基转移酶衍生自粉纹夜蛾β-(1,4)-GalNAcT(TnGalNAcT)。
在其中R14为-OH的方法的另一个优选的实施方案中,TnGalNAcT为或衍生自SEQ IDNO:35或SEQ ID NO:60。
在其中R14为-OH的方法的另一个优选的实施方案中,用于所述方法的TnGalNAcT与SEQ ID NO:35或SEQ ID NO:60具有至少50%的序列同一性,优选至少55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或优选100%的序列同一性。
在其中R14为-OH的方法的另一个优选实施方案中,用于所述方法的TnGalNAcT为或衍生自选自SEQ ID NO:36、SEQ ID NO:37、SEQ ID NO:38、SEQ ID NO:39、SEQ ID NO:40、SEQ ID NO:41、SEQ ID NO:42、SEQ ID NO:43、SEQ ID NO:44、SEQ ID NO:45、SEQ ID NO:61、SEQ ID NO:62、SEQ ID NO:63、SEQ ID NO:64、SEQ ID NO:65、SEQ ID NO:66、SEQ IDNO:67、SEQ ID NO:68、SEQ ID NO:69和SEQ ID NO:70的序列。
在另一个优选的实施方案中,用于其中R14为-OH的方法的TnGalNAcT与选自SEQ IDNO:36、SEQ ID NO:37、SEQ ID NO:38、SEQ ID NO:39、SEQ ID NO:40、SEQ ID NO:41、SEQ IDNO:42、SEQ ID NO:43、SEQ ID NO:44、SEQ ID NO:45、SEQ ID NO:61、SEQ ID NO:62、SEQ IDNO:63、SEQ ID NO:64、SEQ ID NO:65、SEQ ID NO:66、SEQ ID NO:67、SEQ ID NO:68、SEQ IDNO:69和SEQ ID NO:70的序列具有至少50%的序列同一性,优选至少55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或优选100%的序列同一性。
在其中R14为-OH的本发明的方法的另一个特别优选的实施方案中,糖基转移酶衍生自猪蛔虫β-(1,4)-GalNAcT(AsGalNAcT)。
在其中R14为-OH的方法的该实施方案中,进一步优选的是AsGalNAcT为或衍生自SEQ ID NO:48或SEQ ID NO:74。
在其中R14为-OH的方法的另一个优选的实施方案中,用于所述方法的AsGalNAcT与SEQ ID NO:48或SEQ ID NO:74具有至少50%的序列同一性,优选至少55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或优选100%的序列同一性。
在本文描述的其中R14为-OH的本发明的方法的优选实施方案以及如上文中所描述的糖基转移酶中,进一步优选糖衍生物核苷酸Su(A)-Nuc如上文所定义的式(15)、(16)、(17)或(18)所示,其中R14为-OH;或如上文所定义的式(19)、(20)、(21)、(22)、(23)、(24)、(25)、(26)、(65)、(66)、(67)、(68)或(69)所示,其中R14为-OH;或如上文所定义的式(35)所示。在这些特别优选的实施方案中,进一步优选的是Nuc为UDP。
当R14为-N3时优选的糖基转移酶
在本发明的方法的另一个优选实施方案中,R14是-N3。在该实施方案中,糖衍生物核苷酸Su(A)-Nuc如式(3d)所示,如上文所定义的。
当Su(A)-Nuc如式(3d)或如上文所述的(3d)的优选实施方案所示时,在所述方法的优选实施方案中,为或衍生自β-(1,4)-GalNAcT的糖基转移酶为或衍生自野生型β-(1,4)-GalNAcT,优选无脊椎动物β-(1,4)-GalNAcT。在所述方法的另一个优选实施方案中,糖基转移酶为或衍生自无脊椎动物β-(1,4)-GalNAcT。在其他优选的实施方案中,糖基转移酶为或衍生自秀丽隐杆线虫β-(1,4)-GalNAcT(CeGalNAcT)、猪蛔虫β-(1,4)-GalNAcT(AsGalNAcT)或粉纹夜蛾β-(1,4)-GalNAcT(TnGalNAcT)。为或衍生自(CeGalNAcT)、(AsGalNAcT)或(TnGalNAcT)的β-(1,4)-GalNAcT如上文中更详细描述的。
当糖衍生物核苷酸Su(A)-Nuc中的R14为-N3时,特别优选用于所述方法的β-(1,4)-N-乙酰半乳糖胺转移酶为或衍生自选自SEQ ID NO:2-9,即选自SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8和SEQ ID NO:9的序列。更优选地,当R14为-N3时,用于所述方法的β-(1,4)-N-乙酰半乳糖胺转移酶为或衍生自选自SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8,更优选选自SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8,甚至更优选选自SEQ ID NO:7和SEQ ID NO:8的序列。最优选地,用于所述方法的β-(1,4)-N-乙酰半乳糖胺转移酶为或衍生自SEQ ID NO:8。
在另一个特别优选的实施方案中,当糖衍生物核苷酸Su(A)-Nuc中的R14为-N3时,用于所述方法的β-(1,4)-N-乙酰半乳糖胺转移酶与选自SEQ ID NO:2-9,即选自SEQ IDNO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8和SEQ ID NO:9的序列具有至少50%的序列同一性,优选至少55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或优选100%的序列同一性。更优选地,当R14为-N3时,用于所述方法的β-(1,4)-N-乙酰半乳糖胺转移酶与选自SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8,更优选选自SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8,甚至更优选选自SEQ ID NO:7和SEQ IDNO:8的序列具有至少50%的序列同一性,优选至少55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或优选100%的序列同一性。最优选地,用于所述方法的β-(1,4)-N-乙酰半乳糖胺转移酶与SEQ ID NO:8具有至少50%的序列同一性,优选至少55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或优选100%的序列同一性。
在其中R14为-N3的本发明的方法的另一个特别优选的实施方案中,糖基转移酶为或衍生自秀丽隐杆线虫β-(1,4)-GalNAcT(CeGalNAcT)。
在其中R14为-N3的方法的另一个特别优选的实施方案中,CeGalNAcT为或衍生自SEQ ID NO:2或SEQ ID NO:6。
在其中R14为-N3的方法的另一个特别优选的实施方案中,用于所述方法的CeGalNAcT为或衍生自SEQ ID NO:10、SEQ ID NO:11、SEQ IDNO:12、SEQ ID NO:13或SEQ IDNO:14。
在其中R14为-N3的方法的另一个特别优选的实施方案中,用于所述方法的CeGalNAcT与SEQ ID NO:2或SEQ ID NO:6具有至少50%的序列同一性,优选至少55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或优选100%的序列同一性。
在其中R14为-N3的方法的另一个特别优选的实施方案中,用于所述方法的CeGalNAcT与序列SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13或SEQ IDNO:14具有至少50%的序列同一性,优选至少55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或优选100%的序列同一性。
在其中R14为-N3的本发明的方法的另一个特别优选的实施方案中,糖基转移酶为或衍生自粉纹夜蛾β-(1,4)-GalNAcT(TnGalNAcT)。
在其中R14为-N3的方法的其他优选的实施方案中,TnGalNAcT为或衍生自SEQ IDNO:4或SEQ ID NO:8。
在其中R14为-N3的方法的另一个优选的实施方案中,用于所述方法的TnGalNAcT与SEQ ID NO:4或SEQ ID NO:8具有至少50%的序列同一性,优选至少55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或优选100%的序列同一性。
在其中R14为-N3的方法的另一个优选实施方案中,用于所述方法的TnGalNAcT为或衍生自选自SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:33、SEQ ID NO:34、SEQ ID NO:49、SEQ ID NO:50、SEQ ID NO:51、SEQ ID NO:52、SEQ ID NO:53、SEQ ID NO:54、SEQ IDNO:55、SEQ ID NO:56、SEQ ID NO:57、SEQ ID NO:58和SEQ ID NO:59的序列。
在另一个优选的实施方案中,用于其中R14为-N3的方法的TnGalNAcT与选自SEQ IDNO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ IDNO:31、SEQ ID NO:32、SEQ ID NO:33、SEQ ID NO:34、SEQ ID NO:49、SEQ ID NO:50、SEQ IDNO:51、SEQ ID NO:52、SEQ ID NO:53、SEQ ID NO:54、SEQ ID NO:55、SEQ ID NO:56、SEQ IDNO:57、SEQ ID NO:58和SEQ ID NO:59的序列具有至少50%的序列同一性,优选至少55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或优选100%的序列同一性。
在其中R14为-N3的本发明的方法的另一个特别优选的实施方案中,糖基转移酶为或衍生自猪蛔虫β-(1,4)-GalNAcT(AsGalNAcT)。
在其中R14为-N3的方法的该实施方案中,进一步优选的是AsGalNAcT为或衍生自SEQ ID NO:3或SEQ ID NO:7。
在其中R14为-N3的方法的另一个优选的实施方案中,用于所述方法的AsGalNAcT与SEQ ID NO:3或SEQ ID NO:7具有至少50%的序列同一性,优选至少55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或优选100%的序列同一性。
在其中R14为-N3的方法的另一个优选的实施方案中,用于所述方法的AsGalNAcT为或衍生自选自SEQ ID NO:46、SEQ ID NO:47、SEQ ID NO:71、SEQ ID NO:72和SEQ ID NO:73的序列。
在其中R14为-N3的方法的另一个优选的实施方案中,用于所述方法的AsGalNAcT与选自SEQ ID NO:46、SEQ ID NO:47、SEQ ID NO:71、SEQ ID NO:72和SEQ ID NO:73的序列具有至少50%的序列同一性,优选至少55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或优选100%的序列同一性。
在本文描述的其中R14为-N3的本发明的方法的优选实施方案以及如上文中所描述的糖基转移酶中,进一步优选糖衍生物核苷酸Su(A)-Nuc如上文所定义的式(15)、(16)、(17)或(18)所示,其中R14为-N3;或如上文所定义的式(19)、(20)、(21)、(22)、(23)、(24)、(25)、(26)、(65)、(66)、(67)、(68)或(69)所示,其中R14为-N3;或如上文所定义的式(36)所示。在这些特别优选的实施方案中,进一步优选的是Nuc为UDP。
在一个方面,本发明涉及如本文中所定义的酶,即为或衍生自β-(1,4)-GalNAcT的糖基转移酶,特别是衍生自β-(1,4)-GalNAcT的糖基转移酶,即衍生的β-(1,4)-GalNAcT酶。在一个实施方案中,所述酶衍生自无脊椎动物物种。在一个实施方案中,根据该方面的酶为分离形式。根据本方面,在本发明方法的上下文中,酶及其优选实施方案在上文中进一步定义,这同样适用于酶自身。
在一个实施方案中,根据本发明该方面的酶衍生自β-(1,4)-N-乙酰半乳糖胺转移酶,优选衍生自具有选自SEQ ID NO:2-23和SEQ ID NO:25-74,更优选选自SEQ ID NO:14和SEQ ID NO:25-74,最优选选自SEQ ID NO:10-13、SEQ ID NO:25-48、SEQ ID NO:50-70和SEQ ID NO:72-74的序列的β-(1,4)-N-乙酰半乳糖胺转移酶。根据该实施方案的酶通常为分离形式。
在一个实施方案中,根据本发明该方面的酶涉及与选自SEQ ID NO:2-23和SEQ IDNO:25-74的序列具有至少40%的序列同一性,优选至少45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或优选100%的序列同一性的β-(1,4)-N-乙酰半乳糖胺转移酶。根据该实施方案的酶通常为分离形式。优选地,本发明涉及与选自SEQ ID NO:10-14和SEQ ID NO:25-74,最优选选自SEQ ID NO:10-13、SEQ ID NO:25-48、SEQ ID NO:50-70和SEQ ID NO:72-74的序列具有至少40%的序列同一性,优选至少45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或优选100%的序列同一性的β-(1,4)-N-乙酰半乳糖胺转移酶。
在优选的实施方案中,根据本发明该方面的酶涉及与选自SEQ ID NO:6-14,即选自SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13和SEQ ID NO:14,优选选自SEQ ID NO:10-13,即选自SEQ IDNO:10、SEQ ID NO:11、SEQ ID NO:12和SEQ ID NO:13的序列具有至少40%的序列同一性,优选至少45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或优选100%的序列同一性的β-(1,4)-N-乙酰半乳糖胺转移酶。
在另一个优选的实施方案中,根据本发明该方面的酶涉及与选自SEQ ID NO:25-45和SEQ ID NO:50-70,即选自SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:33、SEQ IDNO:34、SEQ ID NO:35、SEQ ID NO:36、SEQ ID NO:37、SEQ ID NO:38、SEQ ID NO:39、SEQ IDNO:40、SEQ ID NO:41、SEQ ID NO:42、SEQ ID NO:43、SEQ ID NO:44、SEQ ID NO:45、SEQ IDNO:50、SEQ ID NO:51、SEQ ID NO:52、SEQ ID NO:53、SEQ ID NO:54、SEQ ID NO:55、SEQ IDNO:56、SEQ ID NO:57、SEQ ID NO:58、SEQ ID NO:59、SEQ ID NO:60、SEQ ID NO:61、SEQ IDNO:62、SEQ ID NO:63、SEQ ID NO:64、SEQ ID NO:65、SEQ ID NO:66、SEQ ID NO:67、SEQ IDNO:68、SEQ ID NO:69和SEQ ID NO:70的序列具有至少40%的序列同一性,优选至少45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或优选100%的序列同一性的β-(1,4)-N-乙酰半乳糖胺转移酶。
在另一个优选的实施方案中,根据本发明该方面的酶涉及与选自SEQ ID NO:46-48和SEQ ID NO:72-74,即选自SEQ ID NO:46、SEQ ID NO:47、SEQ ID NO:48、SEQ ID NO:72、SEQ ID NO:73和SEQ ID NO:74的序列具有至少40%的序列同一性,优选至少45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或优选100%的序列同一性的β-(1,4)-N-乙酰半乳糖胺转移酶。
本发明还涉及如上文所定义的本发明的酶在用于糖蛋白的修饰的方法中,优选在本发明的方法中的用途。所述方法包括以下步骤:在酶的存在下,使包含含有末端GlcNAc部分的聚糖的糖蛋白与糖衍生物核苷酸接触。在优选的实施方案中,所述糖蛋白如本文中所定义,最优选包含如本文中进一步定义的如式(1)或(2)所示的聚糖的糖蛋白。在优选的实施方案中,糖衍生物核苷酸是如本文中进一步定义的如式(3)所示的糖衍生物核苷酸Su(A)-Nuc。
经修饰的糖蛋白
本发明还涉及经修饰的糖蛋白,其通过本发明用于修饰糖蛋白的方法而获得。更特别地,本发明涉及包含如式(4)或(5)所示的聚糖的糖蛋白:
其中:
b为0或1;
d为0或1;
e为0或1;
G为单糖、或包含2至20个糖部分的直链或支链寡糖;以及
Su(A)如式(6)所示:
其中R14、Z、Y、U、T、A、g、f和a如上文针对(3)所定义的。
(6)中的R14、Z、Y、U、T、A、g、f和a的优选实施方案如上文中对于(3)和(3)的优选实施方案(例如(3a)、(3b)、(3c)和(3d))所更详细描述的。
在本发明的经修饰的糖蛋白中,Su(A)部分的C1经由β-1,4-O-糖苷键连接至GlcNAc部分的C4。
本发明的经修饰的糖蛋白可以包含多于一个如式(4)或(5)所示的聚糖。当为这种情况时,两种或更多种聚糖可互不相同。所述糖蛋白还可以包含一种或多种不包含Su(A)部分的另外的聚糖。
在优选的实施方案中,经修饰的糖蛋白包含如式(4)所示的聚糖,其中b为0。在另一个优选的实施方案中,经修饰的糖蛋白包含如式(4)所示的聚糖,其中b为1。
在另一个优选的实施方案中,经修饰的糖蛋白包含如式(5)所示的聚糖,其中b为0。在另一个优选的实施方案中,经修饰的糖蛋白包含如式(5)所示的聚糖,其中b为1。在如式(5)所示的聚糖中,G表示单糖或包含1至20,优选1至12,更优选1至10,甚至更优选1、2、3、4、5、6、7或8,最优选1、2、3、4、5或6个糖部分的直链或支链寡糖。在聚糖(5)中,优选当d为0时,e为1,当e为0时,d为1。更优选地,在聚糖(5)中,d为1,甚至更优选d为1且e为1。可存在于聚糖中的糖部分是本领域技术人员已知的,并且包括例如葡萄糖(Glc)、半乳糖(Gal)、甘露糖(Man)、岩藻糖(Fuc)、N-乙酰葡糖胺(GlcNAc)、N-乙酰半乳糖胺(GalNAc)、N-乙酰神经氨酸(NeuNAc)或唾液酸和木糖(Xyl)。当聚糖如式(5)所示时,进一步优选聚糖如式(37)、(38)、(39)、(40)、(41)或(42)所示:
其中b是0或1;以及
Su(A)如如上文所定义的式(6)所示。
在优选的实施方案中,本发明的经修饰的糖蛋白包含如式(4)、(37)、(38)、(39)、(40)、(41)或(42)所示的聚糖,更优选如式(4)、(37)、(38)、(39)、(40)、(41)或(42)所示的N-连接的聚糖。在其他优选的实施方案中,本发明的经修饰的糖蛋白包含如式(4)、(37)、(38)或(39)所示的聚糖,更优选如式(4)、(37)、(38)或(39)所示的N-连接的聚糖。最优选地,本发明的经修饰的糖蛋白包含如式(4)或(38)所示的聚糖,更优选如式(4)或(38)所示的N-连接的聚糖。
本发明的经修饰的糖蛋白优选如式(43)、(44)或(45)所示:
其中:
b、d、e和G及其优选实施方案如上文所定义;
Su(A)如上文所定义的式(6)所示;
y独立地为1至24的整数;以及
Pr为蛋白质。
经修饰的糖蛋白可以包含一种或多种聚糖(4)或(5)(y为1至24)。优选地,y为1至12的整数,更优选地为1至10的整数。更优选地,y为1、2、3、4、5、6、7或8,甚至更优选地,y为1、2、3、4、5或6。甚至更优选地,y为1、2、3或4。当y为2或更多时,聚糖可以互不相同。经修饰的糖蛋白还可以包含一种或多种聚糖(4)和一种或多种聚糖(5)的组合。如上文所述,糖蛋白还可以包含一个或多个不具有Su(A)部分的聚糖。
当本发明的经修饰的糖蛋白如式(43)、(44)或(45)所示时,还优选糖蛋白包含如上文所述的式(4)、(37)、(38)、(39)、(40)、(41)或(42)所示的聚糖,更优选如式(4)、(37)、(38)或(39)所示,甚至更优选如式(4)或(38)所示的聚糖,优选N连接的聚糖。最优选地,包含末端GlcNAc部分的聚糖是如式(4)或(38)所示的N-连接的聚糖。
在本发明的方法的优选实施方案中,包含含有末端GlcNAc部分的聚糖的糖蛋白是抗体,更优选如式(43)、(44)或(45)所示的抗体,其中蛋白质(Pr)是抗体(Ab),或更具体地,Pr是抗体的多肽部分。此外,当待修饰的糖蛋白是抗体并且所述抗体包含多于一个聚糖(y为2或更多)时,聚糖可以互不相同。抗体还可以包含一个或多个不具有Su(A)部分的聚糖。此外,当经修饰的糖蛋白是抗体时,优选经修饰的抗体包含如上文所定义的式(4)、(37)、(38)、(39)、(40)、(41)或(42)所示,更优选如式(4)、(37)、(38)或(39)所示,甚至更优选如式(4)或(38)所示的聚糖。在该实施方案中,进一步优选的是,抗体包含如式(4)、(37)、(38)、(39)、(40)、(41)或(42)所示的N-连接的聚糖,更优选如式(4)、(37)、(38)或(39)所示的N-连接的聚糖,最优选如式(4)或(38)所示的N-连接的聚糖。
当经修饰的糖蛋白是抗体时,优选y为1、2、3、4、5、6、7或8,更优选y为1、2、4、6或8,甚至更优选y为1、2或4,最优选y为1或2。
如上文所定义的,所述抗体可以是全抗体,也可以是抗体片段。当抗体是全抗体时,所述抗体优选在每个重链上包含一个或多个,更优选一个聚糖。因此,所述全抗体优选包含2个或更多个,优选2、4、6或8个所述聚糖,更优选2或4个,最优选2个聚糖。换言之,当所述抗体为全抗体时,y优选为2、4、6或8,更优选y为2或4,最优选y为2。当所述抗体为抗体片段时,优选y为1、2、3或4,更优选y为1或2。
在优选的实施方案中,所述抗体为单克隆抗体(mAb)。优选地,所述抗体选自IgA、IgD、IgE、IgG和IgM抗体。更优选地,所述抗体是IgG1、IgG2、IgG3或IgG4抗体,最优选地,所述抗体是IgG1抗体。
在本发明的经修饰的糖蛋白中,如式(6)所示的Su(A)中的R14选自:
其中W、h、a、f、T、A和U如上文所定义。
在本发明的经修饰的糖蛋白的优选实施方案中,如式(6)所示的Su(A)中的R14选自:
其中W、h、a、f、T、A和U如上文所定义。
最优选地,如式(6)所示的Su(A)中的R14是-NHAc。
在其他优选的实施方案中,本发明的经修饰的糖蛋白包含如式(4)或(5)所示的聚糖,更优选N-连接的聚糖,其中Su(A)(6)中的R14为-OH。在该实施方案中,优选经修饰的糖蛋白如式(43)、(44)或(45)所示。
在另一个优选的实施方案中,本发明的经修饰的糖蛋白包含如式(4)或(5)所示的聚糖,更优选N-连接的聚糖,其中Su(A)(6)中的R14为-N3。在该实施方案中,优选经修饰的糖蛋白如式(43)、(44)或(45)所示。
在另一个优选的实施方案中,本发明的经修饰的糖蛋白包含如式(4)或(5)所示的聚糖,更优选N-连接的聚糖,其中Su(A)(6)中的R14为-NHC(O)CH3。在该实施方案中,优选经修饰的糖蛋白如式(43)、(44)或(45)所示。
在另一个优选的实施方案中,本发明的经修饰的糖蛋白包含如式(4)或(5)所示的聚糖,更优选N-连接的聚糖,其中Su(A)(6)中的R14为-NHC(O)-(W)h-(U)f-(T)a-A,其中W、h、U、f、T、a和A及其优选的实施方案如上文中所更详细描述的。在该实施方案中,优选经修饰的糖蛋白如式(43)、(44)或(45)所示。
在另一个优选的实施方案中,本发明的经修饰的糖蛋白包含如式(37)、(38)、(39)、(40)、(41)或(42)所示的聚糖,更优选N-连接的聚糖,其中Su(A)(6)中的R14为-OH。在该实施方案中,优选经修饰的糖蛋白如式(43)、(44)或(45)所示。
在另一个优选的实施方案中,本发明的经修饰的糖蛋白包含如式(37)、(38)、(39)、(40)、(41)或(42)所示的聚糖,更优选N-连接的聚糖,其中Su(A)(6)中的R14为-N3。在该实施方案中,优选经修饰的糖蛋白如式(43)、(44)或(45)所示。
在另一个优选的实施方案中,本发明的经修饰的糖蛋白包含如式(37)、(38)、(39)、(40)、(41)或(42)所示的聚糖,更优选N-连接的聚糖,其中Su(A)(6)中的R14为-NHC(O)CH3。在该实施方案中,优选经修饰的糖蛋白如式(43)、(44)或(45)所示。
在另一个优选的实施方案中,本发明的经修饰的糖蛋白包含如式(37)、(38)、(39)、(40)、(41)或(42)所示的聚糖,更优选N-连接的聚糖,其中Su(A)(6)中的R14为-NHC(O)-(W)h-(U)f-(T)a-A。在该实施方案中,优选经修饰的糖蛋白如式(43)、(44)或(45)所示。
在另一个优选的实施方案中,本发明的经修饰的糖蛋白包含如式(4)或(5)所示的聚糖,优选N-连接的聚糖,更优选如式(37)、(38)、(39)、(40)、(41)或(42)所示的聚糖,甚至更优选N-连接的聚糖,其中Su(A)(6)如式(46)、(47)、(48)或(49)所示:
其中a、f、R14、R15、A、U和T及其优选实施方案如上文针对(15)、(16)、(17)和(18)所定义的。
在其中Su(A)(6)如式(46)、(47)、(48)或(49)所示的这些实施方案中,在其他优选的实施方案中,R14是-OH。在另一个优选的实施方案中,R14是-N3。在另一个优选的实施方案中,R14是-NHC(O)CH3。在另一个优选的实施方案中,R14是-NHC(O)-(W)h-(U)f-(T)a-A,其中W、h、U、f、T、a和A及其优选实施方案如上文更详细描述的。同样在这些实施方案中,优选经修饰的糖蛋白如式(43)、(44)或(45)所示。
在另一个优选的实施方案中,本发明的经修饰的糖蛋白包含如式(4)或(5)所示的聚糖,优选N-连接的聚糖,更优选如式(37)、(38)、(39)、(40)、(41)或(42)所示的聚糖,甚至更优选N-连接的聚糖,其中Su(A)(6)如式(50)、(51)、(52)、(53)、(54)、(55)、(56)、(57)、(70)或(71)所示,优选如式(50)、(51)、(52)、(53)、(54)、(55)、(56)或(57)所示:
其中R14、R15和R16及其优选实施方案如上文针对(19)、(20)、(21)、(22)、(23)、(24)、(25)、(26)、(65)、(66)、(67)、(68)和(69)所定义的。
在另一个优选的实施方案中,本发明的经修饰的糖蛋白包含如式(4)或(5)所示的聚糖,优选N-连接的聚糖,更优选如式(37)、(38)、(39)、(40)、(41)或(42)所示的聚糖,甚至更优选N-连接的聚糖,其中Su(A)(6)如(72)、(73)或(74)所示:
其中R14及其优选实施方案如上文针对(72)、(73)和(74)所定义的。
在其他优选的实施方案中,本发明的经修饰的糖蛋白包含如式(37)所示的聚糖,优选N-连接的聚糖,其中Su(A)(6)如(50)、(51)、(52)、(53)、(54)、(55)、(56)、(57)、(70)、(71)、(72)、(73)或(74)所示,优选如式(50)、(51)、(52)、(53)、(54)、(55)、(56)或(57)所示。在另一个优选的实施方案中,本发明的经修饰的糖蛋白包含如式(38)所示的聚糖,优选N-连接的聚糖,其中Su(A)(6)如(50)、(51)、(52)、(53)、(54)、(55)、(56)、(57)、(70)、(71)、(72)、(73)或(74)所示,优选如式(50)、(51)、(52)、(53)、(54)、(55)、(56)或(57)所示。在另一个优选的实施方案中,本发明的经修饰的糖蛋白包含如式(39)所示的聚糖,优选N-连接的聚糖,其中Su(A)(6)如(50)、(51)、(52)、(53)、(54)、(55)、(56)、(57)、(70)、(71)、(72)、(73)或(74)所示,优选如式(50)、(51)、(52)、(53)、(54)、(55)、(56)或(57)所示。在另一个优选的实施方案中,本发明的经修饰的糖蛋白包含如式(40)所示的聚糖,优选N-连接的聚糖,其中Su(A)(6)如(50)、(51)、(52)、(53)、(54)、(55)、(56)、(57)、(70)、(71)、(72)、(73)或(74)所示,优选如式(50)、(51)、(52)、(53)、(54)、(55)、(56)或(57)所示。在另一个进一步优选的实施方案中,本发明的经修饰的糖蛋白包含如式(41)所示的聚糖,优选N-连接的聚糖,其中Su(A)(6)如(50)、(51)、(52)、(53)、(54)、(55)、(56)、(57)、(70)、(71)、(72)、(73)或(74)所示,优选如式(50)、(51)、(52)、(53)、(54)、(55)、(56)或(57)所示。在另一个优选的实施方案中,本发明的经修饰的糖蛋白包含如式(42)所示的聚糖,优选N-连接的聚糖,其中Su(A)(6)如(50)、(51)、(52)、(53)、(54)、(55)、(56)、(57)、(70)、(71)、(72)、(73)或(74)所示,优选如式(50)、(51)、(52)、(53)、(54)、(55)、(56)或(57)所示。
在其中Su(A)(6)如式(50)、(51)、(52)、(53)、(54)、(55)、(56)、(57)、(70)、(71)、(72)、(73)或(74)所示,优选如(50)、(51)、(52)、(53)、(54)、(55)、(56)或(57)所示的这些实施方案中,在其他优选的实施方案中,R14是-OH。在另一个优选的实施方案中,R14是-N3。在另一个优选的实施方案中,R14是-NHC(O)CH3。在另一个优选的实施方案中,R14是-NHC(O)-(W)h-(U)f-(T)a-A,其中W、h、U、f、T、a和A及其优选实施方案如上文更详细描述的。同样在这些实施方案中,优选经修饰的糖蛋白如式(43)、(44)或(45)所示。
在另一个优选的实施方案中,本发明的经修饰的糖蛋白包含如式(4)或(5)所示的聚糖,优选N-连接的聚糖,更优选如式(37)、(38)、(39)、(40)、(41)或(42)所示聚糖,甚至更优选N-连接的聚糖,其中Su(A)(6)如式(58)、(59)、(60)、(61)或(62)所示:
在其他优选的实施方案中,本发明的经修饰的糖蛋白包含如式(38)所示的聚糖,优选N-连接的聚糖,其中Su(A)(6)如式(58)、(59)、(60)、(61)或(62)所示。在另一个优选的实施方案中,本发明的经修饰的糖蛋白包含如式(39)所示的聚糖,优选N-连接的聚糖,其中Su(A)(6)如式(58)、(59)、(60)、(61)或(62)所示。在另一个优选的实施方案中,本发明的经修饰的糖蛋白包含如式(40)所示的聚糖,优选N-连接的聚糖,其中Su(A)(6)如式(58)、(59)、(60)、(61)或(62)所示。在另一个优选的实施方案中,本发明的经修饰的糖蛋白包含如式(41)所示的聚糖,优选N-连接的聚糖,其中Su(A)(6)如式(58)、(59)、(60)、(61)或(62)所示。在另一个优选的实施方案中,本发明的经修饰的糖蛋白包含如式(42)所示的聚糖,优选N-连接的聚糖,其中Su(A)(6)如式(58)、(59)、(60)、(61)或(62)所示。
在其中Su(A)(6)如式(58)、(59)、(60)、(61)或(62)所示的这些实施方案中,优选经修饰的糖蛋白如式(43)、(44)或(45)所示。
在另一个优选的实施方案中,本发明的经修饰的糖蛋白包含如式(4)或(5)所示的聚糖,优选N-连接的聚糖,更优选如式(37)、(38)、(39)、(40)、(41)或(42)所示聚糖,甚至更优选N-连接的聚糖,其中Su(A)(6)如式(63)或(64)所示:
在其他优选的实施方案中,本发明的经修饰的糖蛋白包含如式(38)所示的聚糖,优选N-连接的聚糖,其中Su(A)(6)如式(63)或(64)所示。在另一个优选的实施方案中,本发明的经修饰的糖蛋白包含如式(39)所示的聚糖,优选N-连接的聚糖,其中Su(A)(6)如式(63)或(64)所示。
在其中Su(A)(6)如式(63)或(64)所示的这些实施方案中,优选经修饰的糖蛋白如式(43)、(44)或(45)所示。
本发明还涉及如上文所定义的本发明的经修饰的糖蛋白在制备生物缀合物(优选本发明的生物缀合物)的方法中的用途。所述方法优选用于制备抗体-药物缀合物(ADC)。所述方法包括使经修饰的糖蛋白与接头缀合物接触。在优选的实施方案中,接头缀合物如本文中所定义。在优选的实施方案中,生物缀合物是如式(75)、(76)或(77)所示的生物缀合物,如下文进一步定义的。
生物缀合物
本发明还涉及通过将接头缀合物与本发明的经修饰的糖蛋白缀合而获得的生物缀合物。接头缀合物在本领域中已知作为生物缀合反应中的反应物之一,其中糖蛋白——例如本发明的经修饰的糖蛋白——是其他反应物。接头缀合物在本文中定义为其中靶分子经由接头与反应基团Q1共价连接的化合物。反应基团Q1能够与存在于本发明的经修饰的糖蛋白上的官能团A反应。接头缀合物可以包含多于一个反应基团Q1和/或多于一个靶分子。合适的接头缀合物包括WO 2014/065661和WO 2016/053107(通过引用的方式纳入本文)中公开的那些。
生物缀合反应是抗体-缀合物如抗体-药物缀合物(ADC)领域中已知的,其中它们用于制备抗体与靶分子(通常为细胞毒素)的缀合物。在这种生物缀合反应中,本发明的经修饰的糖蛋白通过存在于经修饰的糖蛋白上的官能团A与存在于接头缀合物上的反应基团Q1之间的反应与接头缀合物偶联或缀合。本发明的生物缀合物优选是抗体缀合物,其中抗体与靶分子缀合,最优选如抗体-药物缀合物,其中抗体与药物(通常为细胞毒素)缀合。
更具体地,本发明涉及如式(75)、(76)或(77)所示的生物缀合物:
其中:
Pr是蛋白质
y独立地如上文针对(43)所定义的;
b、d、e和G独立地如上文针对(5)所定义的;
CG是将Su连接至Sp或D的连接基团;
Sp是间隔基;
D是靶分子;
j独立地为1、2、3、4或5,优选j为1;
k独立地为1至10的整数,优选k为1、2、3或4,最优选k为1;
m为0或1,优选m为1。
Su如式(78)所示:
其中R14、Z、Y、U、T、g、f和a如上文针对(3)所定义的,并且Su经由β-1,4-O-糖苷键通过C1连接至GlcNAc部分的C4,并经由Z、Y、U或T连接至CG。
(75)、(76)或(77)中的Pr和y的优选实施方案如上文针对(43)、(44)和(45)更详细描述的。在优选的实施方案中,糖蛋白是抗体。生物缀合物——特别是抗体——可包含多于一个官能化聚糖(y为2或更多),聚糖可以互不相同。抗体可以进一步包含一个或多个不具有Su-(CG-(Sp)l-(D)k)j部分的聚糖。进一步优选的是官能化聚糖是N-连接的聚糖。当本发明的生物缀合物是抗体缀合物时,优选y是1、2、3、4、5、6、7或8,更优选y为1、2、4、6或8,甚至更优选y为1、2或4,最优选y为1或2。
如上文所定义的,所述抗体可以是全抗体,也可以是抗体片段。当抗体是全抗体时,所述抗体优选在每个重链上包含一个或多个,更优选一个聚糖。因此,所述全抗体优选包含2个或更多个,优选2、4、6或8个所述官能化聚糖,更优选2或4个,最优选2个官能化聚糖。换言之,当所述抗体为全抗体时,y优选为2、4、6或8,更优选y为2或4,最优选y为2。当抗体为抗体片段时,优选y为1、2、3或4,更优选y为1或2。
在优选的实施方案中,所述抗体为单克隆抗体(mAb)。优选地,所述抗体选自IgA、IgD、IgE、IgG和IgM抗体。更优选地,所述抗体是IgG1、IgG2、IgG3或IgG4抗体,最优选地,所述抗体是IgG1抗体。
(75)、(76)或(77)中的聚糖链,特别是b、d、e和G的优选实施方案如上文针对(4)和(5)及其优选实施方案——例如(37)、(38)、(39)、(40)、(41)或(42)——所更详细描述的。
(78)中的R14、Z、Y、U、T、g、f和a的优选实施方案如上文针对(3)和(3)的优选实施方案——例如(3a)、(3b)、(3c)和(3d)——所更详细描述的。如式(78)所示的Su的优选实施方案对应于如式(46)至(64)和(70)至(74)中任一项所述的Su(A)及其优选实施方案,如上针对(6)所更详细描述的,除了A与Q1反应生成CG。
在本发明的生物缀合物中,如式(78)所示的Su中的R14选自:
其中W、h、a、f、T、A和U如上文所定义。
在本发明的经修饰的糖蛋白的优选实施方案中,如式(78)所示的Su中的R14选自:
其中W、h、a、f、T、A和U如上文所定义。
最优选地,如式(78)所示的Su中的R14是-NHAc。
D是靶分子。在本文中,靶分子被定义为具有在缀合时赋予生物分子的所需性质的分子结构。靶分子D优选选自活性物质、报告分子、聚合物、固体表面、水凝胶、纳米颗粒、微粒和生物分子。最优选地,靶分子D是活性物质。
在本文中,术语“活性物质”涉及药理学和/或生物学物质,即具有生物学活性和/或药物活性的物质,例如药物、前药、诊断试剂、蛋白质、肽、多肽、肽标签、氨基酸、聚糖、脂质、维生素、类固醇、核苷酸、核苷、多核苷酸、RNA或DNA。肽标签的实例包括细胞穿透肽如人乳铁蛋白或聚精氨酸。聚糖的一个实例是寡甘露糖。氨基酸的实例是赖氨酸。当靶分子是活性物质时,活性物质优选选自药物和前药。更优选地,活性物质选自药物活性化合物,特别是低至中等分子量化合物(例如约200至约2500Da,优选约300至约1750Da)。在其他优选的实施方案中,活性物质选自细胞毒素,抗病毒剂、抗菌剂、肽和寡核苷酸。细胞毒素的实例包括秋水仙碱、长春花生物碱、蒽环类、喜树碱、多柔比星、柔红霉素、紫杉烷类、刺孢霉素、微管溶素、伊立替康、抑制肽、鹅膏蕈碱、deBouganin、多卡米星、美登素、auristatin或吡咯苯并二氮杂卓(PBD)。
在本文中,术语“报告分子”是指容易检测其存在的分子,例如诊断剂、染料、荧光团、放射性同位素标记、造影剂、磁共振成像剂或质量标签。多种荧光团,也称为荧光探针,是本领域技术人员已知的。在例如G.T.Hermanson,“Bioconjugate Techniques”,Elsevier,3rd Ed.2013,Chapter 10:“Fluorescent probes”,p.395–463中更详细地描述了几种荧光团,该文献通过引用的方式纳入本文。荧光团的实例包括各种AlexaFluor(例如Alexa Fluor 555)、花青染料(例如Cy3或Cy5)和花青染料衍生物、香豆素衍生物、荧光素和荧光素衍生物、罗丹明和罗丹明衍生物、硼二吡咯亚甲基衍生物、芘衍生物、萘酰亚胺衍生物、藻胆蛋白衍生物(例如别藻蓝蛋白)、色霉素、镧系元素螯合物和量子点纳米晶体。放射性同位素标记的实例包括99mTc、111In、114mIn、115In、18F、14C、64Cu、131I、125I、123I、212Bi、88Y、90Y、67Cu、186Rh、188Rh、66Ga、67Ga和10B,其任选地经由螯合部分连接,所述螯合部分例如DTPA(二亚乙基三胺五乙酸酐)、DOTA(1,4,7,10-四氮杂环十二烷-N,N′,N″,N″′-四乙酸)、NOTA(1,4,7-三氮杂环壬烷N,N′,N″-三乙酸)、TETA(1,4,8,11-四氮杂环十四烷-N,N′,N″,N″′-四乙酸)、DTTA(N1-(对异硫氰酸酯基苄基)-二亚乙基三胺-N1,N2,N3,N3-四乙酸)、去铁胺或DFA(N'-[5-[[4-[[5-(乙酰基羟氨基)-戊基]氨基]-1,4-二氧代丁基]羟氨基]-N-(5-氨基戊基)-N-羟基丁二酰胺)或HYNIC(肼基-烟酰胺)。同位素标记技术是本领域技术人员已知的,并且在例如G.T.Hermanson,“Bioconjugate Techniques”,Elsevier,3rd Ed.2013,第12章:“Isotopic labelling techniques”,p.507–534中更详细地进行了描述,该文献通过引用的方式纳入本文。
适合用作本发明的化合物中的靶分子D的聚合物是本领域技术人员已知的,并且在例如G.T.Hermanson,“Bioconjugate Techniques”,Elsevier,3rd Ed.2013,Chapter 18:“PEGylation and synthetic polymer modification”,p.787–838中更详细地描述了几个实例,该文献通过引用的方式纳入本文。当靶分子D是聚合物时,靶分子D优选独立地选自聚(乙二醇)(PEG)、聚环氧乙烷(PEO)、聚丙二醇(PPG)、聚环氧丙烷(PPO)、1,x-二氨基烷烃聚合物(其中x是烷烃中的碳原子数,优选x为2至200,优选2至10的整数)、(聚)乙二醇二胺(例如,1,8-二氨基-3,6-二氧杂辛烷和含有较长的乙二醇链的等同物)、多糖(例如葡聚糖)、聚(氨基酸)(例如聚(L-赖氨酸))和聚(乙烯醇)、聚(2-噁唑啉)(PAOx)。
适合用作靶分子D的固体表面是本领域技术人员已知的。固体表面是例如功能性表面(例如纳米材料、碳纳米管、富勒烯或病毒壳体的表面)、金属表面(例如钛、金、银、铜、镍、锡、铑或锌表面)、金属合金表面(其中合金来自例如铝、铋、铬、钴、铜、镓、金、铟、铁、铅、镁、汞、镍、钾、钚、铑、钪、银、钠、钛、锡、铀、锌和/或锆)、聚合物表面(其中聚合物为例如聚苯乙烯、聚氯乙烯、聚乙烯、聚丙烯、聚(二甲基硅氧烷)或聚甲基丙烯酸甲酯、聚丙烯酰胺)、玻璃表面、硅氧烷表面、色谱载体表面(其中色谱载体为例如二氧化硅载体、琼脂糖载体、纤维素载体或氧化铝载体)等。当靶分子D是固体表面时,优选D独立地选自功能性表面或聚合物表面。
水凝胶是本领域技术人员已知的。水凝胶是由聚合物成分之间的交联形成的水溶胀网。参见例如A.S.Hoffman,Adv.Drug Delivery Rev.2012,64,18,其通过引用的方式纳入本文。当靶分子是水凝胶时,优选的是水凝胶由作为聚合物基体的聚乙二醇(PEG)组成。
适合用作靶分子D的微米颗粒和纳米颗粒是本领域技术人员已知的。各种合适的微米颗粒和纳米颗粒描述于例如G.T.Hermanson,“Bioconjugate Techniques”,Elsevier,3rd Ed.2013,Chapter 14:“Microparticles and nanoparticles”,p.549–587中,其通过引用的方式纳入本文。微米颗粒或纳米颗粒可以是任何形状,例如球体、杆、管、立方体、三角形和锥体。优选地,微米颗粒或纳米颗粒是球体形状的。微米颗粒和纳米颗粒的化学组成可以不同。当靶分子D是微米颗粒或纳米颗粒时,微米颗粒或纳米颗粒例如是聚合物微米颗粒或纳米颗粒、二氧化硅微米颗粒或纳米颗粒或金微米颗粒或纳米颗粒。当颗粒是聚合物微米颗粒或纳米颗粒时,聚合物优选为聚苯乙烯或苯乙烯的共聚物(例如苯乙烯与二乙烯基苯、丁二烯、丙烯酸酯和/或乙烯基甲苯的共聚物)、聚甲基丙烯酸甲酯(PMMA)、聚乙烯基甲苯、聚(甲基丙烯酸羟乙酯)(pHEMA)或聚(二甲基丙烯酸乙二醇酯/2-甲基丙烯酸羟乙酯)[聚(EDGMA/HEMA)]。任选地,微米颗粒或纳米颗粒的表面是经修饰的,例如使用洗涤剂通过次级聚合物的接枝聚合或通过另一个聚合物的共价连接或间隔基部分的共价连接等来修饰。
靶分子D也可以是生物分子。当靶分子D是生物分子时,优选生物分子选自蛋白质(包括糖蛋白和抗体)、多肽、肽、聚糖、脂质、核酸、寡核苷酸、多糖、寡糖、酶、激素、氨基酸和单糖。
CG是连接基团。在本文中,术语“连接基团”是指连接化合物的一个部分和同一化合物的另一部分的结构元件。通常,生物缀合物通过存在于接头缀合物中的反应性基团Q1与存在于本发明的经修饰的糖蛋白中的官能团A的反应来制备。CG是经反应性基团Q1与官能部分A反应形成的部分。如本领域技术人员将理解的,CG的性质取决于用于建立本发明的经修饰的糖蛋白和接头缀合物之间的连接的有机反应的类型。换言之,CG的性质取决于接头缀合物上的反应性基团Q1的性质和生物分子中官能团A的性质。由于存在大量不同的化学反应可用于建立经修饰的糖蛋白和接头缀合物之间的连接,因此CG具有大量的可能性。当包含Q1的接头缀合物与包含互补官能团F1的生物分子缀合时,将存在于生物缀合物中的F1和Q1的合适的组合的若干实例,以及连接基团Z3的若干实例如图5所示。
当A为例如硫醇基时,互补基团Q1包括N-马来酰亚胺基和链烯基,相应的连接基团CG如图5所示。当A是硫醇基时,互补基团Q1还包括丙二烯酰胺基(allenamide group)。
当A为例如氨基时,互补基团Q1包括酮基、活化酯基和叠氮基,相应的连接基团CG如图5所示。
当A为例如酮基时,互补基团Q1包括(O-烷基)羟氨基和肼基,相应的连接基团CG如图5所示。
当A为例如炔基时,互补基团Q1包括叠氮基,相应的连接基团CG如图5所示。
当A为例如烯基时,互补基团Q1包括硫醇、在Diels-Alder环加成中反应的二烯或异二烯基和四嗪基,相应的连接基团CG可以分别是硫醚、Diels-Alder加合物(环己烯或其类似物)或二氢哒嗪。
当A为例如叠氮基时,互补基团Q1包括炔基,相应的连接基团CG如图5所示。
当A为例如环丙烯基、反式环辛烯基或环辛炔基时,互补基团Q1包括四嗪基,相应的连接基团Z3如图5所示。在这些特定的情况下,Z3仅为中间体结构并将去掉N2,由此产生二氢哒嗪(来自与烯烃的反应)或哒嗪(来自与炔的反应)。
当A为例如卤素(X)时,互补基团Q1包括硫醇,相应的连接基团CG可以是硫醚。
当A为例如–OS(O)2R5时,互补基团Q1包括羟基和(伯和仲)胺基团,相应的连接基团CG可以是醚或(仲或叔)胺基团。
当A为例如丙二烯基时,互补基团Q1包括硫醇,相应的连接基团CG可以是硫醚,通常是甲基取代的硫醚。
当A为例如–SC(O)R8或–SC(V)OR8时,A通常首先对硫醇反应,互补基团Q1包括N-马来酰亚胺基、烯基、丙二烯酰胺基。A是硫醇的相应的连接基团CG可如图5所示。
A和Q1的其他合适的组合,以及所得连接基团CG的性质是本领域技术人员已知的,例如描述于G.T.Hermanson,“Bioconjugate Techniques”,Elsevier,3rd Ed.2013(ISBN:978-0-12-382239-0),特别是在第3章,第229-258页,其通过引用的方式纳入本文。适用于生物缀合过程的互补反应性基团的列表公开于G.T.Hermanson,“BioconjugateTechniques”,Elsevier,3rd Ed.2013(ISBN:978-0-12-382239-0)的第3章的表3.1,第230-232页,该表的内容明确地通过引用的方式纳入本文。
Sp是间隔基或接头。在本文中将接头定义为连接化合物的两个或更多个元素的部分。例如在生物缀合物中,生物分子和靶分子通过接头彼此共价连接;在接头缀合物中,反应性基团Q1通过接头与靶分子共价连接。本领域已知的适合用于生物缀合物,特别是抗体缀合物的任何接头可用作Sp。这些间隔基部分是本领域技术人员已知的。合适的间隔基部分的实例包括(聚)乙二醇二胺(例如1,8-二氨基-3,6-二氧杂辛烷或包含更长乙二醇链的等同物)、聚乙二醇链或聚环氧乙烷链、聚丙二醇链或聚环氧丙烷链和1,x-二氨基烷烃,其中x是烷烃中的碳原子数。另一类合适的间隔基部分包括可切割的间隔基部分或可切割的接头。可切割的接头是本领域公知的。例如Shabat等人,Soft Matter 2012,6,1073(通过引用的方式纳入本文)公开了可切割的接头,其包含经生物学触发——例如,酶裂解或氧化事件——释放的自消性部分。合适的可切割的接头的一些实例是在还原时被切割的二硫化物接头,在通过蛋白酶——例如组织蛋白酶、纤溶酶或金属蛋白酶——特异性识别时被切割的肽接头,或在糖苷酶——例如葡萄糖醛酸酶——特异性识别时被切割的基于糖苷的接头,或在贫氧、缺氧区域中被还原的硝基芳族化合物。在本文中,合适的可切割间隔基部分还包括包含特定的、可切割的氨基酸序列的间隔基部分。实例包括例如包含Val-Ala(缬氨酸-丙氨酸)或Val-Cit(缬氨酸-瓜氨酸)部分的间隔基部分。
在优选的实施方案中,Sp选自直链或支链C1-C200亚烷基、C2-C200亚烯基、C2-C200亚炔基、C3-C200亚环烷基、C5-C200亚环烯基、C8-C200亚环炔基、C7-C200烷基亚芳基、C7-C200芳基亚烷基、C8-C200芳基亚烯基和C9-C200芳基亚炔基、亚烷基、亚烯基、亚炔基、亚环烷基、亚环烯基、亚环炔基、烷基亚芳基、芳基亚烷基、芳基亚烯基和芳基亚炔基,其被一个或多个选自O、S和NR19的杂原子任选地取代和任选地间隔,其中R19独立地选自任选地被取代的氢、C1-C24烷基、C2-C24烯基、C2-C24炔基和C3-C24环烷基,烷基、烯基、炔基和环烷基。当亚烷基、亚烯基、亚炔基、亚环烷基、亚环烯基、亚环炔基、烷基亚芳基、芳基亚烷基、芳基亚烯基和芳基亚炔基被一个或多个如上文所定义的杂原子间隔时,优选地所述基团被一个或多个O原子和/或被一个或多个S-S基团间隔。
更优选地,Sp选自直链或支链C1-C100亚烷基、C2-C100亚烯基、C2-C100亚炔基、C3-C100亚环烷基、C5-C100亚环烯基、C8-C100亚环炔基、C7-C100烷基亚芳基、C7-C100芳基亚烷基、C8-C100芳基亚烯基和C9-C100芳基亚炔基,亚烷基、亚烯基、亚炔基、亚环烷基、亚环烯基、亚环炔基、烷基亚芳基、芳基亚烷基、芳基亚烯基和芳基亚炔基,其被一个或多个选自O、S和NR19的杂原子任选地取代和任选地间隔,其中R19独立地选自任选地被取代的氢、C1-C24烷基、C2-C24烯基、C2-C24炔基和C3-C24环烷基,烷基、烯基、炔基和环烷基。
甚至更优选地,Sp选自直链或支链C1-C50亚烷基、C2-C50亚烯基、C2-C50亚炔基、C3-C50亚环烷基、C5-C50亚环烯基、C8-C50亚环炔基、C7-C50烷基亚芳基、C7-C50芳基亚烷基、C8-C50芳基亚烯基和C9-C50芳基亚炔基,亚烷基、亚烯基、亚炔基、亚环烷基、亚环烯基、亚环炔基、烷基亚芳基、芳基亚烷基、芳基亚烯基和芳基亚炔基,其被一个或多个选自O、S和NR19的杂原子任选地取代和任选地间隔,其中R19独立地选自任选地被取代的氢、C1-C24烷基、C2-C24烯基、C2-C24炔基和C3-C24环烷基,烷基、烯基、炔基和环烷基。
甚至更优选地,Sp选自直链或支链C1-C20亚烷基、C2-C20亚烯基、C2-C20亚炔基、C3-C20亚环烷基、C5-C20亚环烯基、C8-C20亚环炔基、C7-C20烷基亚芳基、C7-C20芳基亚烷基、C8-C20芳基亚烯基和C9-C20芳基亚炔基,亚烷基、亚烯基、亚炔基、亚环烷基、亚环烯基、亚环炔基、烷基亚芳基、芳基亚烷基、芳基亚烯基和芳基亚炔基,其被一个或多个选自O、S和NR19的杂原子任选地取代和任选地间隔,其中R19独立地选自任选地被取代的氢、C1-C24烷基、C2-C24烯基、C2-C24炔基和C3-C24环烷基,烷基、烯基、炔基和环烷基。
在这些优选的实施方案中,进一步优选亚烷基、亚烯基、亚炔基、亚环烷基、亚环烯基、亚环炔基、烷基亚芳基、芳基亚烷基、芳基亚烯基和芳基亚炔基是未被取代的并且任选地被一个或多个选自O、S和NR19,优选O的杂原子间隔,其中R19独立地选自氢和C1-C4烷基,优选氢或甲基。
最优选地,Sp选自直链或支链C1-C20亚烷基,亚烷基被一个或多个选自O、S和NR19的杂原子任选地取代和任选地间隔,其中R19独立地选自任选地被取代的氢、C1-C24烷基、C2-C24烯基、C2-C24炔基和C3-C24环烷基,烷基、烯基、炔基和环烷基。在该实施方案中,进一步优选亚烷基是未取代的且任选地被一个或多个选自O、S和NR19,优选O和/或S-S的杂原子间隔,其中R19独立地选自氢和C1-C4烷基,优选氢或甲基。
特别优选的Sp部分包括-(CH2)n-、-(CH2CH2)n-、-(CH2CH2O)n-、-(OCH2CH2)n-、-(CH2CH2O)nCH2CH2-、-CH2CH2(OCH2CH2)n-、-(CH2CH2CH2O)n-、-(OCH2CH2CH2)n-、-(CH2CH2CH2O)nCH2CH2CH2-和-CH2CH2CH2(O-CH2CH2CH2)n-,其中n为1至50的整数,优选1至40,更优选1至30,甚至更优选1至20,甚至更优选1至15。更优选n为1、2、3、4、5、6、7、8、9或10,更优选为1、2、3、4、5、6、7或8,甚至更优选为1、2、3、4、5或6,甚至更优选为1、2、3或4。
实施例
实施例1.GalNAc转移酶的选择和设计
选择四个特异性序列用于初始评估,特别是Uniprot登录号:Q9GUM2(秀丽隐杆线虫;在本文中表示为SEQ ID NO:2)、U1MEV9(猪蛔虫;在本文中表示为SEQ ID NO:3)、Q6J4T9(粉纹夜蛾,在本文中表示为SEQ ID NO:4)和Q7KN92(黑腹果蝇;在本文中表示为SEQID NO:5)。
基于预测的胞质结构域和跨膜结构域的缺失来构建多肽。这些多肽包含预测的秀丽隐杆线虫(由SEQ ID NO:6表示的CeGalNAcT[30-383])、猪蛔虫(由SEQ ID NO:7表示的AsGalNAcT[30-383])、粉纹夜蛾(由SEQ ID NO:8表示的TnGalNAcT[33-421])和黑腹果蝇(由SEQ ID NO:9表示的DmGalNAcT[47-403])。
此外,针对AsGalNAcT[30-383](由SEQ ID NO:71表示的His-AsGalNAcT[30-383])和TnGalNAcT[33-421](由SEQ ID NO:49表示的His-TnGalNAcT[33-421])构建含有N-末端His-标签的多肽变体。
实施例2.设计粉纹夜蛾GalNAcT突变体和猪蛔虫GalNAcT突变体
基于与UDP-N-乙酰基-半乳糖胺(PDB条目1OQM)复合的牛β(1,4)-Gal-T1和由Qasba等人(J.Biol.Chem.2002,277:20833-20839,通过引用的方式纳入本文)报道的β(1,4)-Gal-T1(Y289L)突变体的晶体结构来设计TnGalNAcT和AsGalNAcT的突变体。基于TnGalNAcT和AsGalNAcT与牛β(1,4)Gal-T1的序列比对来设计TnGalNAcT和AsGalNAcT的突变体。这些蛋白之间的对应氨基酸残基示于表1中。表1.不同物种的GalNAcT/GalT中对应氨基酸的编号
TnGalNAcT AsGalNAcT 牛β(1,4)-Gal-T1
I311 I257 Y289
W336 W282 W314
E339 E285 E317
实施例3.His-TnGalNAcT(33-421)突变体的定点诱变
从Genscript获得含有在NdeI-BamHI位点之间的密码子优化序列(其编码TnGalNAcT(由SEQ ID NO:8表示)的残基33-421)的pET15b载体,产生His-TnGalNAcT(33-421)(由SEQ ID NO:49表示)。使用一组重叠引物通过线性扩增PCR从上述构建体扩增TnGalNaCT突变基因。用于每个突变体的重叠引物组示于表2中。为了构建His-TnGalNAcT(33-421;W336F)(由SEQ ID NO:50表示),用本文定义为SEQ ID NO:79和SEQ ID NO:80的一对引物扩增DNA片段。为了构建His-TnGalNAcT(33-421;W336H)(由SEQ ID NO:51表示),用本文定义为SEQ ID NO:81和SEQ ID NO:82的一对引物扩增DNA片段。为了构建His-TnGalNAcT(33-421;W336V)(由SEQ ID NO:52表示),用本文定义为SEQ ID NO:83和SEQ IDNO:84的一对引物扩增DNA片段。为了构建His-TnGalNAcT(33-421;E339A)(由SEQ ID NO:53表示),用本文定义为SEQ ID NO:85和SEQ ID NO:86的一对引物扩增DNA片段。为了构建His-TnGalNAcT(33-421;E339G))(由SEQ ID NO:54表示),用本文定义为SEQ ID NO:87和SEQ ID NO:88的一对引物扩增DNA片段。为了构建His-TnGalNAcT(33-421;E339D)(由SEQID NO:55表示),用本文定义为SEQ ID NO:89和SEQ ID NO:90的一对引物扩增DNA片段。为了构建His-TnGalNAcT(33-421;I311Y)(由SEQ ID NO:60表示),用本文定义为SEQ ID NO:91和SEQ ID NO:92的一对引物扩增DNA片段。在PCR扩增后,用DpnI处理反应混合物以消化模板DNA,随后转化到NEB 10-β感受态细胞(获自New England Biolabs)中。分离DNA并通过对于以下突变体的序列分析来确认序列:His-TnGalNAcT(33-421;W336F)(由SEQ ID NO:50表示)、His-TnGalNAcT(33-421;W336V)(由SEQ ID NO:52表示)、His-TnGalNAcT(33-421;E339A)(由SEQ ID NO:53表示)和His-TnGalNAcT(33-421;I311Y)(由SEQ ID NO:60表示)。
表2.所用引物的序列标识。对应于突变氨基酸的密码子以粗体显示。
实施例4.His-TnGalNAcT(33-421)、His-TnGalNAcT(33-421;W336F)、His-TnGalNAcT(33-421;W336V)和His-TnGalNAcT(33-421;E339A)在大肠杆菌中的表达和重折叠
从如实施例3中所述获得的相应的pET15b构建体表达His-TnGalNAcT(33-421)、His-TnGalNAcT(33-421;W336F)、His-TnGalNAcT(33-421;W336V)和His-TnGalNAcT(33-421;E339A)。根据由Qasba等人(Prot.Expr.Pur.2003,30,219-76229,通过引用的方式纳入本文)报道的过程进行表达、包涵体分离和重折叠。重折叠后,通过离心(以8000×g离心10分钟)除去不溶性蛋白,随后通过0.45μM孔径的过滤器过滤。使用HisTrap HP 5mL柱(GEHealthcare)纯化和浓缩可溶性蛋白。首先用缓冲液A(20mM Tris缓冲液、20mM咪唑、500mMNaCl,pH 7.5)洗涤柱。用缓冲液B(20mM Tris、500mM NaCl、250mM咪唑,pH 7.5,10mL)洗脱保留的蛋白。通过SDS-PAGE在聚丙烯酰胺凝胶(12%)上分析级分,合并含有纯化的靶蛋白的级分,并通过在4℃下透析过夜,相对于20mM Tris pH 7.5和150mM NaCl交换缓冲液。使用Amicon Ultra-0.5、Ultracel-10Membrane(Millipore)将纯化的蛋白浓缩至至少2mg/mL,并在进一步使用之前储存在-80℃下。
实施例5.GalNAcT和突变体在CHO中的瞬时表达
用Evitria(苏黎世,瑞士)以20mL的量在CHO K1细胞中瞬时表达蛋白。表达以下的GalNAcT变体:CeGalNAcT(30-383)(由SEQ ID NO:6表示)、AsGalNAcT(30-383)(由SEQ IDNO:7表示)、TnGalNAcT(33-421)(由SEQ ID NO:8表示)、DmGalNAcT(47-403)(由SEQ ID NO:9表示)和TnGalNAcT(33-421;E339A)(由SEQ ID NO:28表示)。在典型的纯化实验中,将含有表达的GalNAcT的CHO产生的上清液相对于20mM Tris缓冲液(pH 7.5)透析。将上清液(通常为25mL)通过0.45μm孔径过滤器过滤,随后经阳离子交换柱(HiTrap SP HP 5mL柱,GEHealthcare)进行纯化,所述阳离子交换柱在使用前用20mM Tris缓冲液(pH 7.5)平衡。在配备有外部级分收集器的AKTA Prime色谱系统上进行纯化。从系统泵A装载样品。通过用10倍柱体积(CV)的20mM Tris缓冲液(pH 7.5)洗涤柱来从柱上洗脱未结合的蛋白。用洗脱缓冲液(20mM Tris,1NaCl,pH 7.5;10mL)洗脱保留的蛋白。通过SDS-PAGE在聚丙烯酰胺凝胶(12%)上分析收集的级分,合并含有靶蛋白的级分并使用自旋过滤浓缩至0.5mL的体积。除了TnGalNAcT(33-421;E339A)之外,接下来使用AKTA purifier-10系统(UNICORN v6.3)在Superdex200 10/300GL尺寸排阻色谱柱(GEHealthcare)上纯化蛋白以获得纯的单体级分。通过SDS-PAGE分析级分,并在进一步使用之前将含有单体蛋白的级分储存在-80℃下。
IgG的质谱分析的一般方案
在质谱分析之前,将IgG用DTT处理,这使得能够分析轻链和重链,或用FabricatorTM(可从Genovis,Lund,Sweden商购获得)处理,这使得能够分析Fc/2片段。为了分析轻链和重链,将20μg(经修饰的)IgG溶液用总体积4μL的100mM DTT在37℃下孵育5分钟。如果存在的话,在这些条件下将叠氮官能团还原成胺。为了分析Fc/2片段,将20μg(经修饰的)IgG溶液用在总体积10μL的磷酸盐缓冲盐水(PBS)pH 6.6中的FabricatorTM(1.25U/μL)在37℃下孵育1小时。在还原或Fabricator消化后,使用Amicon Ultra-0.5、Ultracel-10Membrane(Millipore)将样品用milliQ洗涤两次,得到约40μL体积的最终样品。接下来,通过JEOL AccuTOF上的电喷雾离子化飞行时间(ESI-TOF)分析样品。使用Magtran软件获得去卷积的光谱。
实施例6.通过内切酶S处理制备经修剪的曲妥珠单抗。
用来自酿脓链球菌的内切酶S(可从Genovis,Lund,Sweden商购获得)进行曲妥珠单抗的聚糖修剪。因此,将曲妥珠单抗(10mg/mL)用于25mM Tris pH 8.0中的内切酶S(40U/mL)在37℃下孵育约16小时。将去糖基化的IgG浓缩,并使用Amicon Ultra-0.5,Ultracel-10Membrane(Millipore)用10mM MnCl2和25mM Tris-HCl pH 8.0洗涤。在峰的去卷积后,质谱显示轻链的一个峰和重链的两个峰。重链的两个峰属于由核心GlcNAc(Fuc)取代的曲妥珠单抗产生的一种主要产物(49496Da,总重链的90%)和由经修剪的曲妥珠单抗产生的次要产物(49351Da,总重链的±10%)。
实施例7.在牛β(1,4)-Gal-T1的作用下,6-叠氮基-Gal-UDP糖基转移至经修剪的曲妥珠单抗
将通过如上文所述的曲妥珠单抗的内切酶S处理获得的经修剪的曲妥珠单抗(10mg/mL)用在10mM MnCl2和25mM Tris-HCl pH 8.0中的6-叠氮基-Gal-UDP(1mM,可从GlycoHub商购获得)和0.1或0.5mg/mL牛β(1,4)-Gal-T1(可从Sigma Aldrich商购获得)在30℃下孵育过夜。经还原的样品的质谱分析表明,对于两种浓度的牛β(1,4)-Gal-T1均没有产物形成(主要重链峰49494Da,总重链的90%,由核心GlcNAc(Fuc)取代的曲妥珠单抗产生)。
实施例8.在牛β(1,4)-Gal-T1(130-402;Y289L,C342T)的作用下,6-叠氮基-N-乙酰半乳糖胺-UDP糖基转移至经修剪的曲妥珠单抗
使用衍生自牛β(1,4)-Gal-T1(由SEQ ID NO:1表示)的突变体,其含有Y289L和C342T突变且仅含有催化结构域(氨基酸残基130-402)。该牛β(1,4)-Gal-T1(130-402;Y289L,C342T)突变体由Qasba等人描述(J.Biol.Chem.2002,277,20833-20839,通过引用的方式纳入),并且根据Qasba等人报道的方法(Prot.Expr.Pur.2003,30,219-76229,通过引用的方式纳入)表达、包涵体分离和重折叠。将通过如上文所述的曲妥珠单抗的内切酶S处理获得的经修剪的曲妥珠单抗(10mg/mL)用在10mM MnCl2和25mM Tris-HCl pH7.5中的6-叠氮基-GalNAc-UDP(2.5mM,可从GlycoHub商购获得)和1mg/mLβ(1,4)-Gal-T1(130-402;Y289L,C342T)在37℃下孵育过夜。经还原的样品的质谱分析表明没有产物形成(主要重链峰49502Da,总重链的90%,由核心GlcNAc(Fuc)取代的曲妥珠单抗产生)。
实施例9.在GalNAcT的作用下,6-叠氮基-N-乙酰半乳糖胺-UDP糖基转移至经修剪的曲妥珠单抗
测试如实施例5中所述的进行表达和纯化的CeGalNAcT(30-383)(由SEQ ID NO:6表示)、AsGalNAcT(30-383)(由SEQ ID NO:7表示)、TnGalNAcT(33-421)(由SEQ ID NO:8表示)和DmGalNAcT(47-403)(由SEQ ID NO:9表示)的6-叠氮基GalNAc掺入。将通过如上文所述的曲妥珠单抗的内切酶S处理获得的经修剪的曲妥珠单抗(10mg/mL)用在10mM MnCl2和25mM Tris-HCl pH 7.5以及0.2或0.5mg/mL的上述GalNAcT之一中的6-叠氮基-GalNAc-UDP(1mM,可从GlycoHub商购获得)在37℃下孵育过夜。
FabricatorTM消化的样品的质谱分析表明,两种浓度的CeGalNAcT(30-383)和DmGalNAcT(47-403)均没有产物形成(主要Fc/2峰24139Da,总重链的90%,由核心GlcNAc(Fuc)取代的曲妥珠单抗产生),而AsGalNAcT(30-383)和TnGalNAcT(33-421)均显示核心GlcNac(Fuc)取代的曲妥珠单抗(观察到的质量为24139Da)部分转化为产物(观察到的质量为24366Da),由6-叠氮基-GalNAc转移至核心GlcNAc(Fuc)取代的曲妥珠单抗产生。获得的转化率示于表3中。
表3.通过不同酶浓度的GalNAcT将GlcNAc(Fuc)取代的曲妥珠单抗转化为6-叠氮基-GalNAc-GlcNAc(Fuc)取代的曲妥珠单抗的转化率(%)。
方案1:化合物88-94的合成以及经修饰的糖蛋白95-96的合成(实施例10-26)
实施例10.6-叠氮基-6-脱氧-GalNAc-1-单磷酸酯80的合成
可以根据Wang等人,Bioorg.Med.Chem.Lett.,2009,19,5433中的方法来制备乙酰化糖79。
向乙酰化糖79(4.9g,11.9mmol)在MeOH(15mL)中的悬浮液中加入25%的NH4OH水溶液(60mL)。将反应在室温下搅拌,并用LCMS监测转化率。4h后,将混合物减压浓缩,并在-20℃下保存2天。然后将固体重新溶解在25%的NH4OH水溶液(75mL)中,在室温下搅拌,3h后,MS显示完全转化。浓缩溶剂得到为黄色固体的粗产物。采用定量NMR,显示60重量%为产物80,产量为3.2g(83%)。
1H-NMR(400MHz,D2O):δ5.28(dd,J=7.2,3.2Hz,1H),4.12(dd,J=6.8,6.4Hz,1H),4.06(ddd,J=10.8,3.2,2.0Hz,1H),3.92-3.81(m,2H),3.47(dd,J=12.8,7.2Hz,1H),3.40(dd,J=12.8Hz,6.4Hz,1H),1.88(s,3H)。C8H15N4O8P(M-H+)LRMS(ESI-)计算值325.06,实测值325.30。
实施例11.6-氨基-6-脱氧-GalNAc-1-单磷酸酯81的合成
向叠氮化物80(5.9mmol)在H2O(30mL)和MeOH(30mL)中的溶液中加入Pd/C(400mg),并将H2鼓泡通过反应混合物1h。用TLC(7:3MeOH:MeCN)监测反应的转化率。将反应混合物通过硅藻土过滤,用MeOH和H2O彻底冲洗,真空浓缩,得到产量为1.8g(99%)的粗产物81。
1H-NMR(400MHz,D2O):δ5.28(dd,J=7.2,3.6Hz,1H),4.25(dd,J=8.8,4.0Hz,1H),4.09-4.04(m,1H),3.90-3.79(m,2H),3.19-3.08(m,2H),1.85(s,3H)。C8H17N2O8P(M-H+)LRMS(ESI-)计算值299.06,实测值229.29。
实施例12.6-(2-氯乙酰氨基)-6-脱氧-GalNAc-1-单磷酸酯82的合成
根据Hosztafi等人,Helv.Chim.Acta,1996,79,133中的方法制备氯乙酸琥珀酰亚胺酯。
在氮气气氛下,向糖81(12mg,0.040mmol)的无水DMF(0.5mL)溶液中加入氯乙酸琥珀酰亚胺酯(9mg,0.044mmol)和Et3N(6.7μL,0.048mmol)。将反应混合物在室温下搅拌并真空浓缩,得到粗产物82。
1H-NMR(400MHz,D2O):δ5.42-5.32(m,1H),4.13-4.02(m,4H),3.92-3.81(m,2H),3.53-3.46(m,1H),3.33-3.26(m,1H),1.94(s,3H)。C10H18ClN2O9P(M-H+)LRMS(ESI-)计算值375.68(100%),377.03(30%),实测值3.75.08(100%),377.19(25%)。
实施例13.6-(4-叠氮基苯甲酰氨基)-6-脱氧-GalNAc-1-单磷酸酯83的合成
根据Hartman等人,Chem.Comm.,2012,48,4755中的方法制备4-叠氮基苯甲酸琥珀酰亚胺酯。
在氮气气氛下,向糖81(38mg,0.127mmol)的无水DMF(1.5mL)溶液中加入Et3N(21μL,0.152mmol)和4-叠氮基苯甲酸琥珀酰亚胺酯(36mg,0.139mmol),在室温下搅拌反应混合物。加入另外的4-叠氮基苯甲酸琥珀酰亚胺酯(36mg,0.139mmol)和Et3N(42μL,0.304mmol),将反应物在室温下搅拌5天。用TLC和MS监测产物形成。6天后将反应混合物浓缩,得到粗产物83。
C15H20N5O9P(M-H+)LRMS(ESI-)计算值444.09,实测值444.20。
实施例14.6-(N-2-叠氮基-2,2-二氟乙基氨基甲酸酯)-6-脱氧-GalNAc-1-单磷酸酯84的合成
根据WO2015/112016中所述的方法制备2-叠氮基-2,2-二氟乙醇。
在氮气气氛下,将2-叠氮基-2,2-二氟乙醇(200mg,1.63mmol)溶于DCM(10mL)中,加入4-硝基苯基氯甲酸酯(295mg,1.46mmol)和Et3N(226μL,1.63mmol),将所得混合物在室温下搅拌1h。接下来,将糖81(122mg,0.41mmol)溶于H2O(2mL)中,加入Et3N(113μL,0.81mmol)和DMF(5mL),将所得溶液加入到反应混合物中。将反应在室温下搅拌16h,当TLC和LCMS确认糖81完全消耗时。减压除去溶剂,得到粗产物。用离子交换色谱法(Q HITRAP,3×5mL和1×15mL柱)进行纯化。通过加载缓冲液A(10mM NH4HCO3)实现柱上的第一次结合,并用缓冲液A冲洗柱。接下来,进行至40%B(250mMNH4HCO3)的梯度来洗脱产物并用100%B冲洗柱以除去剩余的副产物。将含有产物的级分冻干,得到所需产物84(147mg,0.33mmol,80%)。
1H-NMR(400MHz,D2O):δ5.17(dd,J=6.4,3.2Hz,1H),4.40-4.24(m,2H),4.07-3.93(m,2H),3.85-3.70(m,2H),3.28-3.13(m,2H),1.87(s,3H)。C11H18F2N5O10P(M-H+)LRMS(ESI-)计算值448.07,实测值448.14。
实施例15.6-(N-1-(2-叠氮基乙基)脲)-6-脱氧-GalNAc-1-单磷酸酯85的合成
根据Zhang等人,J.Am.Chem.Soc.,2015,137,6000中所述的方法制备2-叠氮基乙胺。1H-NMR(400MHz,CDCl3):δ3.40-3.33(m,2H),2.91-2.81(m,2H)。
将羰基二咪唑(377mg,2.32mmol)溶于无水DMF(10mL)中,并在氮气气氛下搅拌。将2-叠氮基乙胺(200mg,2.32mmol)溶于无水DMF(5mL)中并滴加到CDI中。将所得溶液在室温下搅拌1h,然后加热至60℃。将糖81溶于H2O(2mL)和DMF(5mL)中并加入到反应中。将所得悬浮液在60℃下搅拌16h。用LCMS监测所需产物的形成。搅拌16h后,加入H2O(5mL),然后加入在DCM(15mL)中的新活化的2-叠氮基乙胺。将所得混合物在60℃下再搅拌16h,并在减压下除去溶剂。然后将粗产物溶于MeOH(10mL)和H2O(15mL)中,并用EtOAC(2×30mL)洗涤。将水相浓缩以得到粗产物,将该粗产物用离子交换色谱法纯化(Q-HITRAP,3x5mL和1x15mL色谱柱)。通过加载缓冲液A(10mM NH4HCO3)实现柱上的第一次结合,并用缓冲液A冲洗柱。接下来,进行至40%B(250mM NH4HCO3)的梯度来洗脱产物并用100%B冲洗柱以除去剩余的副产物。将含有产物的级分冻干,得到所需产物85(147mg,0.33mmol,80%)。
1H-NMR(400MHz,D2O):δ5.30(br s,1H),4.13-3.93(m,2H),3.91-3.76(m,2H),3.35-3.10(m,5H),1.92(s,3H)。C11H21N6O9P(M-H+)LRMS(ESI-)计算值411.10,实测值411.24。
实施例16.6-(N-(2-S-乙酰基)巯基乙酰氨基)-6-脱氧-GalNAc-1-单磷酸酯86的合成
将糖81(105mg,0.35mmol)溶于H2O(1.7mL)中并在室温下搅拌。在单独的小瓶中,将S-乙酰基巯基乙醇酸五氟苯基酯(210mg,0.70mmol)溶于DMF(1.7mL)中,并与Et3N(146μL,1.05mmol)一起加入到反应中。将所得混合物在室温下搅拌16h,当LCMS显示完全消耗糖81时。在减压下除去溶剂,将粗产物通过快速色谱法(6:2:1-4:2:1EtOAc:MeOH:H2O)纯化,得到产物86(95mg,0.23mmol,65%)。
1H-NMR(400MHz,D2O):δ5.33(dd,J=6.8,3.6Hz,1H),4.11-4.00(m,2H),3.90-3.80(m,2H),3.63-3.53(m,2H),3.44(dd,J=14.0,5.2Hz,1H),3.23(dd,J=14.0,8.0Hz,1H),2.31(s,3H),1.94(s,3H)。C12H21N2O10PS(M-H+)LRMS(ESI-)计算值415.06,实测值415.18。
实施例17.6-(N-2-叠氮基乙酰胺基)-6-脱氧-GalNAc-1-单磷酸酯87的合成
将叠氮基乙酸(101mg,1.0mmol)溶于DMF(2mL)中,加入EDC(192mg,1.0mmol)、NHS(115mg,1.0mmol)和DMAP(4mg,0.03mmol)。接下来,将糖81(100mg,0.33mmol)溶于H2O(3mL)中,加入到反应中,在室温下搅拌16h。用LCMS监测所需产物的形成。将另一部分叠氮乙酸按如上所述活化,并加入到反应中。4h后,将反应物真空浓缩。用离子交换色谱法(Q-HITRAP,3×5mL和1×15mL柱)进行纯化。通过加载缓冲液A(10mM NH4HCO3)实现柱上的第一次结合,并用缓冲液A冲洗柱。接下来,进行至40%B(250mM NH4HCO3)的梯度来洗脱产物并用100%B冲洗柱以除去剩余的副产物。将含有产物的级分冻干,得到所需产物87(100mg,0.26mmol,79%)。
1H-NMR(400MHz,D2O):δ5.34(br s,1H),4.13-4.03(m,2H),3.93(s,2H),3.92-3.81(m,2H),3.48(dd,J=14.0,4.0Hz,1H),3.29(dd,J=14.0,8.0Hz,1H),1.95(s,3H)。C10H18N5O9P(M-H+)LRMS(ESI-)计算值382.08,实测值382.15。
实施例18.6-(2-氯乙酰胺基)-6-脱氧-GalNAc-UDP 88的合成
根据由Baisch等人Bioorg.Med.Chem.,1997,5,383描述的方法将单磷酸酯82与UMP偶联。
简言之,在氮气气氛下将尿苷-5'-单磷酸三丁基铵(31mg,0.06mmol)溶于无水DMF(0.5mL)中。加入羰基二咪唑(13mg,0.04mmol),将反应混合物在室温下搅拌30min。接下来,加入无水MeOH(2.5μL)并搅拌15min以除去过量的CDI。在高真空下15min除去剩余的MeOH。随后,将单磷酸酯82(15mg,0.04mmol)溶于无水DMF(0.5mL)中,加入到反应混合物中,然后加入N-甲基咪唑、HCl盐(25mg,0.16mmol)。将反应在室温下搅拌过夜,然后真空浓缩。通过MS监测单磷酸盐中间体的消耗。用离子交换色谱法(Q-HITRAP,1×5mL柱)进行纯化。通过加载缓冲液A(10mM NH4HCO3)实现柱上的第一次结合,并用缓冲液A冲洗柱。接下来,进行至40%B(250mM NH4HCO3)的梯度来洗脱产物并用100%B冲洗柱以除去剩余的副产物。将含有产物的级分冻干,得到所需产物88(1mg,1.46μmol,4%)。
C19H29ClN4O17P2(M-H+)LRMS(ESI-)计算值681.06(100%),683.06(32%),实测值681.13(100%),683.15(40%)。
实施例19.6-(4-叠氮基苯甲酰氨基)-6-脱氧-GalNAc-UDP 89的合成
根据由Baisch等人Bioorg.Med.Chem.,1997,5,383描述的方法将单磷酸酯83与UMP偶联。
简言之,在氮气气氛下将尿苷-5'-单磷酸三丁基铵(77mg,0.15mmol)溶于无水DMF(1mL)中。加入羰基二咪唑(41mg,0.25mmol),将反应混合物在室温下搅拌30min。接下来,加入无水MeOH(6.2μL)并搅拌15min以除去过量的CDI。在高真空下15min除去剩余的MeOH。随后,将单磷酸酯83(56mg,0.13mmol)溶于无水DMF(1mL)中,加入到反应混合物中,然后加入N-甲基咪唑、HCl盐(79mg,0.51mmol)。将反应在室温下搅拌过夜,然后真空浓缩。通过MS监测单磷酸盐中间体的消耗。用离子交换色谱法(Q-HITRAP,3×5mL柱,1×15mL柱)进行纯化。通过加载缓冲液A(10mM NH4HCO3)实现柱上的第一次结合,并用缓冲液A冲洗柱。接下来,进行至40%B(250mM NH4HCO3)的梯度来洗脱产物并用100%B冲洗柱以除去剩余的副产物。将含有产物的级分冻干,得到所需产物89(13mg,0.017mmol,14%)。
C24H31N7O17P2(M-H+)LRMS(ESI-)计算值750.12,实测值750.33。
实施例20.6-(N-2-叠氮基-2,2-二氟乙基氨基甲酸酯)-6-脱氧-GalNAc-UDP 90的合成
根据由Baisch等人Bioorg.Med.Chem.,1997,5,383描述的方法将单磷酸酯84与UMP偶联。
简言之,在氮气气氛下将尿苷-5'-单磷酸三丁基铵(200mg,0.39mmol)溶于无水DMF(3mL)中。加入羰基二咪唑(106mg,0.65mmol),将反应混合物在室温下搅拌30min。接下来,加入无水MeOH(16μL)并搅拌15min以除去过量的CDI。在高真空下15min除去剩余的MeOH。随后,将单磷酸酯84(147mg,0.33mmol)悬浮于无水DMF(3mL)中,加入到反应混合物中,然后加入N-甲基咪唑、HCl盐(204mg,1.31mmol)。通过MS监测单磷酸盐中间体的消耗。将反应在室温下搅拌3天。将另一部分的UMP如上所述地活化,并与1mL H2O一起加入到反应中。搅拌过夜后,反应完成,减压除去溶剂。用离子交换色谱法(QHITRAP,3×5mL柱,1×15mL柱)进行纯化。通过加载缓冲液A(10mMNH4HCO3)实现柱上的第一次结合,并用缓冲液A冲洗柱。接下来,进行至40%B(250mM NH4HCO3)的梯度来洗脱产物并用100%B冲洗柱以除去剩余的副产物。将含有产物的级分冻干,得到所需产物90(122mg,0.16mmol,49%)。
C20H29F2N7O18P2(M-H+)LRMS(ESI-)计算值754.09,实测值754.16。
实施例21.6-(N-1-(2-叠氮基乙基)脲)-6-脱氧-GalNAc-UDP 91的合成
根据由Baisch等人Bioorg.Med.Chem.,1997,5,383描述的方法将单磷酸酯85与UMP偶联。
简言之,在氮气气氛下将尿苷-5'-单磷酸三丁基铵(126mg,0.25mmol)溶于无水DMF(2mL)中。加入羰基二咪唑(67mg,0.41mmol),将反应混合物在室温下搅拌30min。接下来,加入无水MeOH(10μL)并搅拌15min以除去过量的CDI。在高真空下15min除去剩余的MeOH。随后,将单磷酸酯85(85mg,0.21mmol)溶于无水DMF(2mL)中,加入到反应混合物中,然后加入N-甲基咪唑、HCl盐(129mg,0.82mmol)。将反应在室温下搅拌2天,然后真空浓缩。通过MS监测单磷酸盐中间体的消耗。用离子交换色谱法(Q HITRAP,3×5mL柱,1×15mL柱)进行纯化。通过加载缓冲液A(10mM NH4HCO3)实现柱上的第一次结合,并用缓冲液A冲洗柱。接下来,进行至40%B(250mM NH4HCO3)的梯度来洗脱产物并用100%B冲洗柱以除去剩余的副产物。将含有产物的级分冻干,得到所需产物91(83mg,012mmol,56%)。
C20H32N8O17P2(M-H+)LRMS(ESI-)计算值717.13,实测值717.27。
实施例22.6-(N-(2-S-乙酰基)-巯基乙酰胺基)-6-脱氧-GalNAc-UDP 92的合成
根据由Baisch等人Bioorg.Med.Chem.,1997,5,383描述的方法将单磷酸酯86与UMP偶联。
简言之,在氮气气氛下将尿苷-5'-单磷酸三丁基铵(139mg,0.27mmol)溶于无水DMF(2mL)中。加入羰基二咪唑(74mg,0.46mmol),将反应混合物在室温下搅拌30min。接下来,加入无水MeOH(11μL)并搅拌15min以除去过量的CDI。在高真空下15min除去剩余的MeOH。随后,将单磷酸酯86(95mg,0.27mmol)溶于无水DMF(2mL)中,加入到反应混合物中,然后加入N-甲基咪唑、HCl盐(142mg,0.91mmol)。将反应在室温下搅拌3天,然后真空浓缩。通过MS监测单磷酸盐中间体的消耗。用快速色谱(7:2:1-4:2:1EtOAc:MeOH:H2O)进行纯化,得到产物92(97mg,0.13mmol,49%)。
C21H32N4O18P2S(M-H+)LRMS(ESI-)计算值721.08,实测值721.39。
实施例23.6-(2-叠氮基乙酰氨基)-6-脱氧-GalNAc-UDP 93的合成
根据由Baisch等人Bioorg.Med.Chem.,1997,5,383描述的方法将单磷酸酯87与UMP偶联。
简言之,在氮气气氛下将尿苷-5'-单磷酸三丁基铵(191mg,0.38mmol)溶于无水DMF(3mL)中。加入羰基二咪唑(102mg,0.63mmol),将反应混合物在室温下搅拌30min。接下来,加入无水MeOH(16μL)并搅拌15min以除去过量的CDI。在高真空下15min除去剩余的MeOH。随后,将单磷酸酯87(120mg,0.31mmol)溶于无水DMF(3mL)中,加入到反应混合物中,然后加入N-甲基咪唑、HCl盐(195mg,1.25mmol)。通过MS监测单磷酸盐中间体的消耗。将反应在室温下搅拌16h。为了溶解反应物中的所有组分,加入1mL H2O。搅拌3h后,减压除去溶剂。用离子交换色谱法(Q-HITRAP,3×5mL柱,1×15mL柱)进行纯化。通过加载缓冲液A(10mMNH4HCO3)实现柱上的第一次结合,并用缓冲液A冲洗柱。接下来,进行至40%B(250mMNH4HCO3)的梯度来洗脱产物并用100%B冲洗柱以除去剩余的副产物。将含有产物的级分冻干,得到所需产物93(10mg,0.015mmol,5%)。
C19H29N7O17P2(M-H+)LRMS(ESI-)计算值688.10,实测值688.10。
实施例24.6-氨基-6-脱氧-GalNAc-UDP 94的合成
向6-叠氮基-GalNAc-UDP(25mg,0.04mmol)的H2O(0.5mL)溶液中加入DTT(6mg,0.04mmol),并加入几滴Et3N。将反应在室温下搅拌2h,然后用LCMS监测反应。为了加速反应,加入额外的DTT(12mg,0.08mmol),1h后反应完成,真空浓缩。用离子交换色谱法(Q-HITRAP,1×5mL柱)进行纯化。通过加载缓冲液A(10mMNH4HCO3)实现柱上的第一次结合,并用缓冲液A冲洗柱。接下来,进行至40%B(250mM NH4HCO3)的梯度来洗脱产物并用100%B冲洗柱以除去剩余的副产物。将含有产物的级分冻干,得到所需产物94(12mg,0.019mmol,51%)。
C17H28N4O16P2(M-H+)LRMS(ESI-)计算值605.09,实测值605.11。
实施例25.本妥昔单抗–(6-氨基-6-脱氧-GalNAc),95的制备
类似于实施例6中所述的对曲妥珠单抗的修剪来修剪本妥昔单抗。
将经修剪的本妥昔单抗(15mg/mL)用在10mM MnCl2和25mMTris-HCl pH 8.0中的6-氨基-6-脱氧-GalNAc-UDP 94(5mM)和TnGalNAcT(1.5mg/mL)在30℃下孵育过夜。将反应混合物的样品(2μL)用总体积10μL的磷酸盐缓冲盐水(PBS)pH 6.6中的FabricatorTM(1.25U/μL)在37℃下孵育1小时。该样品的质谱分析显示完全转化为产物本妥昔单抗-(6-氨基-GalNAc)(24307Da(70%)和24435(30%,C-末端赖氨酸变体))。
实施例26.本妥昔单抗-(6-(2-叠氮基乙酰氨基)-6-脱氧-GalNAc),96的制备
将经修剪的本妥昔单抗(15mg/mL)用10mM MnCl2和25mM Tris-HCl pH 8.0中的6-(2-叠氮基乙酰氨基)-6-脱氧-GalNAc 93(5mM)和TnGalNAcT(1.5mg/mL)在30℃下孵育过夜。将反应混合物的样品(2μL)用总体积10μL的磷酸盐缓冲盐水(PBS)pH6.6中的FabricatorTM(1.25U/μL)在37℃下孵育1小时。该样品的质谱分析显示70%转化为产物本妥昔单抗-(6-(2-叠氮基乙酰氨基)-6-脱氧-GalNAc)(24391Da(70%)和24518(30%,C-末端赖氨酸变体))。
序列表
<110> 西纳福克斯股份有限公司
<120> 用为或衍生自β-(1,4)-N-乙酰半乳糖胺转移酶的糖基转移酶修饰糖蛋白的方法
<130> P6055617PCT
<150> EP15164864.9
<151> 2015-04-23
<160> 92
<170> SIPOSequenceListing 1.0
<210> 1
<211> 402
<212> PRT
<213> Bos taurus
<400> 1
Met Lys Phe Arg Glu Pro Leu Leu Gly Gly Ser Ala Ala Met Pro Gly
1 5 10 15
Ala Ser Leu Gln Arg Ala Cys Arg Leu Leu Val Ala Val Cys Ala Leu
20 25 30
His Leu Gly Val Thr Leu Val Tyr Tyr Leu Ala Gly Arg Asp Leu Arg
35 40 45
Arg Leu Pro Gln Leu Val Gly Val His Pro Pro Leu Gln Gly Ser Ser
50 55 60
His Gly Ala Ala Ala Ile Gly Gln Pro Ser Gly Glu Leu Arg Leu Arg
65 70 75 80
Gly Val Ala Pro Pro Pro Pro Leu Gln Asn Ser Ser Lys Pro Arg Ser
85 90 95
Arg Ala Pro Ser Asn Leu Asp Ala Tyr Ser His Pro Gly Pro Gly Pro
100 105 110
Gly Pro Gly Ser Asn Leu Thr Ser Ala Pro Val Pro Ser Thr Thr Thr
115 120 125
Arg Ser Leu Thr Ala Cys Pro Glu Glu Ser Pro Leu Leu Val Gly Pro
130 135 140
Met Leu Ile Glu Phe Asn Ile Pro Val Asp Leu Lys Leu Ile Glu Gln
145 150 155 160
Gln Asn Pro Lys Val Lys Leu Gly Gly Arg Tyr Thr Pro Met Asp Cys
165 170 175
Ile Ser Pro His Lys Val Ala Ile Ile Ile Leu Phe Arg Asn Arg Gln
180 185 190
Glu His Leu Lys Tyr Trp Leu Tyr Tyr Leu His Pro Met Val Gln Arg
195 200 205
Gln Gln Leu Asp Tyr Gly Ile Tyr Val Ile Asn Gln Ala Gly Glu Ser
210 215 220
Met Phe Asn Arg Ala Lys Leu Leu Asn Val Gly Phe Lys Glu Ala Leu
225 230 235 240
Lys Asp Tyr Asp Tyr Asn Cys Phe Val Phe Ser Asp Val Asp Leu Ile
245 250 255
Pro Met Asn Asp His Asn Thr Tyr Arg Cys Phe Ser Gln Pro Arg His
260 265 270
Ile Ser Val Ala Met Asp Lys Phe Gly Phe Ser Leu Pro Tyr Val Gln
275 280 285
Leu Phe Gly Gly Val Ser Ala Leu Ser Lys Gln Gln Phe Leu Ser Ile
290 295 300
Asn Gly Phe Pro Asn Asn Tyr Trp Gly Trp Gly Gly Glu Asp Asp Asp
305 310 315 320
Ile Tyr Asn Arg Leu Ala Phe Arg Gly Met Ser Val Ser Arg Pro Asn
325 330 335
Ala Val Ile Gly Lys Cys Arg Met Ile Arg His Ser Arg Asp Lys Lys
340 345 350
Asn Glu Pro Asn Pro Gln Arg Phe Asp Arg Ile Ala His Thr Lys Glu
355 360 365
Thr Met Leu Ser Asp Gly Leu Asn Ser Leu Thr Tyr Met Val Leu Glu
370 375 380
Val Gln Arg Tyr Pro Leu Tyr Thr Lys Ile Thr Val Asp Ile Gly Thr
385 390 395 400
Pro Ser
<210> 2
<211> 383
<212> PRT
<213> 秀丽隐杆线虫(Caenorhabditis elegans)
<400> 2
Met Ala Phe Arg His Leu Ala Val Ala Arg Leu Lys Ser Leu Leu Val
1 5 10 15
Leu Cys Ala Val Leu Leu Leu Val His Ala Met Ile Tyr Lys Ile Pro
20 25 30
Ser Leu Tyr Glu Asn Leu Thr Ile Gly Ser Ser Thr Leu Ile Ala Asp
35 40 45
Val Asp Ala Met Glu Ala Val Leu Gly Asn Thr Ala Ser Thr Ser Asp
50 55 60
Asp Leu Leu Asp Thr Trp Asn Ser Thr Phe Ser Pro Ile Ser Glu Val
65 70 75 80
Asn Gln Thr Ser Phe Met Glu Asp Ile Arg Pro Ile Leu Phe Pro Asp
85 90 95
Asn Gln Thr Leu Gln Phe Cys Asn Gln Thr Pro Pro His Leu Val Gly
100 105 110
Pro Ile Arg Val Phe Leu Asp Glu Pro Asp Phe Lys Thr Leu Glu Lys
115 120 125
Ile Tyr Pro Asp Thr His Ala Gly Gly His Gly Met Pro Lys Asp Cys
130 135 140
Val Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr Arg Asp Arg Glu
145 150 155 160
Ala His Leu Arg Ile Met Leu His Asn Leu His Ser Leu Leu Ala Lys
165 170 175
Gln Gln Leu Asp Tyr Ala Ile Phe Ile Val Glu Gln Val Ala Asn Gln
180 185 190
Thr Phe Asn Arg Gly Lys Leu Met Asn Val Gly Tyr Asp Val Ala Ser
195 200 205
Arg Leu Tyr Pro Trp Gln Cys Phe Ile Phe His Asp Val Asp Leu Leu
210 215 220
Pro Glu Asp Asp Arg Asn Leu Tyr Thr Cys Pro Ile Gln Pro Arg His
225 230 235 240
Met Ser Val Ala Ile Asp Lys Phe Asn Tyr Lys Leu Pro Tyr Ser Ala
245 250 255
Ile Phe Gly Gly Ile Ser Ala Leu Thr Lys Asp His Leu Lys Lys Ile
260 265 270
Asn Gly Phe Ser Asn Asp Phe Trp Gly Trp Gly Gly Glu Asp Asp Asp
275 280 285
Leu Ala Thr Arg Thr Ser Met Ala Gly Leu Lys Val Ser Arg Tyr Pro
290 295 300
Thr Gln Ile Ala Arg Tyr Lys Met Ile Lys His Ser Thr Glu Ala Thr
305 310 315 320
Asn Pro Val Asn Lys Cys Arg Tyr Lys Ile Met Gly Gln Thr Lys Arg
325 330 335
Arg Trp Thr Arg Asp Gly Leu Ser Asn Leu Lys Tyr Lys Leu Val Asn
340 345 350
Leu Glu Leu Lys Pro Leu Tyr Thr Arg Ala Val Val Asp Leu Leu Glu
355 360 365
Lys Asp Cys Arg Arg Glu Leu Arg Arg Asp Phe Pro Thr Cys Phe
370 375 380
<210> 3
<211> 383
<212> PRT
<213> 猪蛔虫(Ascaris suum)
<400> 3
Met Asn Ser Lys Leu Lys Leu Val Ile Val Leu Thr Leu Cys Val Ala
1 5 10 15
Ile Ile His Phe Leu Leu Ser Asp Cys Pro Ile Ser Pro Asp Tyr Ser
20 25 30
Phe Trp Ser Pro Ala Phe Ile Ile Ser Ala Pro Lys Thr Leu Thr Thr
35 40 45
Leu Gln Pro Phe Ser Gln Ser Thr Ser Thr Asn Asp Leu Ala Val Ser
50 55 60
Ala Leu Glu Ser Val Glu Phe Ser Met Leu Asp Asn Ser Ser Ile Leu
65 70 75 80
His Ala Ser Asp Asn Trp Thr Asn Asp Glu Leu Val Met Arg Ala Gln
85 90 95
Asn Glu Asn Leu Gln Leu Cys Pro Met Thr Pro Pro Ala Leu Val Gly
100 105 110
Pro Ile Lys Val Trp Met Asp Ala Pro Ser Phe Ala Glu Leu Glu Arg
115 120 125
Leu Tyr Pro Phe Leu Glu Pro Gly Gly His Gly Met Pro Thr Ala Cys
130 135 140
Arg Ala Arg His Arg Val Ala Ile Val Val Pro Tyr Arg Asp Arg Glu
145 150 155 160
Ser His Leu Arg Thr Phe Leu His Asn Leu His Ser Leu Leu Thr Lys
165 170 175
Gln Gln Leu Asp Tyr Ala Ile Phe Val Val Glu Gln Thr Ala Asn Glu
180 185 190
Thr Phe Asn Arg Ala Lys Leu Met Asn Val Gly Tyr Ala Glu Ala Ile
195 200 205
Arg Leu Tyr Asp Trp Arg Cys Phe Ile Phe His Asp Val Asp Leu Leu
210 215 220
Pro Glu Asp Asp Arg Asn Leu Tyr Ser Cys Pro Asp Glu Pro Arg His
225 230 235 240
Met Ser Val Ala Val Asp Lys Phe Asn Tyr Lys Leu Pro Tyr Gly Ser
245 250 255
Ile Phe Gly Gly Ile Ser Ala Leu Thr Arg Glu Gln Phe Glu Gly Ile
260 265 270
Asn Gly Phe Ser Asn Asp Tyr Trp Gly Trp Gly Gly Glu Asp Asp Asp
275 280 285
Leu Ser Thr Arg Val Thr Leu Ala Gly Tyr Lys Ile Ser Arg Tyr Pro
290 295 300
Ala Glu Ile Ala Arg Tyr Lys Met Ile Lys His Asn Ser Glu Lys Lys
305 310 315 320
Asn Pro Val Asn Arg Cys Arg Tyr Lys Leu Met Ser Ala Thr Lys Ser
325 330 335
Arg Trp Arg Asn Asp Gly Leu Ser Ser Leu Ser Tyr Asp Leu Ile Ser
340 345 350
Leu Gly Arg Leu Pro Leu Tyr Thr His Ile Lys Val Asp Leu Leu Glu
355 360 365
Lys Gln Ser Arg Arg Tyr Leu Arg Thr His Gly Phe Pro Thr Cys
370 375 380
<210> 4
<211> 421
<212> PRT
<213> 粉纹夜蛾(Trichoplusia ni)
<400> 4
Met Gly Gly Arg Ala Thr Arg Ala Leu Arg Leu Leu Leu Leu Leu Val
1 5 10 15
Leu Ala Leu Ala Ala Val Glu Tyr Leu Phe Gly Ser Ile Leu Asp Ala
20 25 30
Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu Tyr Asn Ala Thr Gln
35 40 45
Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala Asn Trp Pro Lys Lys
50 55 60
Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu Tyr Ser Ile Lys Asn
65 70 75 80
Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser Val Val His Pro Pro
85 90 95
Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp Lys Asn Met Thr Ile
100 105 110
Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr Pro Leu Leu Ile Thr
115 120 125
Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr Thr Glu Asp Gly Val
130 135 140
Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu Cys Asp Ser Met Pro
145 150 155 160
Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr Glu Leu Glu Leu Glu
165 170 175
Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp Gly Gly Arg Tyr Ser
180 185 190
Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr
195 200 205
Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu Asn His Met His Pro
210 215 220
Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile Phe Ile Val Glu Gln
225 230 235 240
Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu Met Asn Val Gly Phe
245 250 255
Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp Gln Cys Phe Val Phe
260 265 270
His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg Asn Leu Tyr Ser Cys
275 280 285
Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile Asp Lys Leu His Phe
290 295 300
Lys Leu Pro Tyr Glu Asp Ile Phe Gly Gly Val Ser Ala Met Thr Leu
305 310 315 320
Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn Lys Tyr Trp Gly Trp
325 330 335
Gly Gly Glu Asp Asp Asp Met Ser Tyr Arg Leu Lys Lys Ile Asn Tyr
340 345 350
His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg Tyr Ala Met Leu Asp
355 360 365
His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr Gln Leu Leu Ser Gln
370 375 380
Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser Thr Leu Glu Tyr Glu
385 390 395 400
Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr His Ile Leu Val Asn
405 410 415
Ile Asp Glu Arg Ser
420
<210> 5
<211> 403
<212> PRT
<213> 黑腹果蝇(Drosophila melanogaster)
<400> 5
Met Tyr Leu Phe Thr Lys Ala Asn Leu Ile Arg Phe Leu Ala Gly Ala
1 5 10 15
Ile Cys Leu Leu Leu Val Leu Asn Phe Val Gly Phe Arg Ser Asp Gly
20 25 30
Gly Ser Ala Thr Ser Leu Ser Lys Leu Ser Ile Arg Arg Val His Lys
35 40 45
Tyr Ala His Ile Tyr Gly Asn Ala Ser Ser Asp Gly Ala Gly Gly Ser
50 55 60
Glu Ala Ser Arg Leu Pro Ala Ser Pro Leu Ala Leu Ser Lys Asp Arg
65 70 75 80
Glu Arg Asp Gln Glu Leu Asn Gly Gly Pro Asn Ser Thr Ile Arg Thr
85 90 95
Val Ile Ala Thr Ala Asn Phe Thr Ser Ile Pro Gln Asp Leu Thr Arg
100 105 110
Phe Leu Leu Gly Thr Lys Lys Phe Leu Pro Pro Arg Gln Lys Ser Thr
115 120 125
Ser Ala Leu Leu Ala Asn Cys Thr Asp Pro Asp Pro Arg Asp Gly Gly
130 135 140
Pro Ile Thr Pro Asn Thr Thr Leu Glu Ser Leu Asp Val Ile Glu Ala
145 150 155 160
Glu Leu Gly Pro Leu Leu Arg Pro Gly Gly Ala Phe Glu Pro Glu Asn
165 170 175
Cys Asn Ala Gln His His Val Ala Ile Val Val Pro Phe Arg Asp Arg
180 185 190
Tyr Ala His Leu Leu Leu Phe Leu Arg Asn Ile His Pro Phe Leu Met
195 200 205
Lys Gln Arg Ile Ala Tyr Arg Ile Phe Ile Val Glu Gln Thr Asn Gly
210 215 220
Lys Pro Phe Asn Arg Ala Ala Met Met Asn Ile Gly Tyr Leu Glu Ala
225 230 235 240
Leu Lys Leu Tyr Gln Trp Asp Cys Phe Ile Phe His Asp Val Asp Leu
245 250 255
Leu Pro Leu Asp Asp Arg Asn Leu Tyr Asn Cys Pro Arg Gln Pro Arg
260 265 270
His Met Ser Val Ala Ile Asp Thr Leu Asn Phe Arg Leu Pro Tyr Arg
275 280 285
Ser Ile Phe Gly Gly Val Ser Ala Met Thr Arg Glu His Phe Gln Ala
290 295 300
Val Asn Gly Phe Ser Asn Ser Phe Phe Gly Trp Gly Gly Glu Asp Asp
305 310 315 320
Asp Met Ser Asn Arg Leu Lys His Ala Asn Leu Phe Ile Ser Arg Tyr
325 330 335
Pro Val Asn Ile Ala Arg Tyr Lys Met Leu Lys His Gln Lys Glu Lys
340 345 350
Ala Asn Pro Lys Arg Tyr Glu Asn Leu Gln Asn Gly Met Ser Lys Ile
355 360 365
Glu Gln Asp Gly Ile Asn Ser Ile Lys Tyr Ser Ile Tyr Ser Ile Lys
370 375 380
Gln Phe Pro Thr Phe Thr Trp Tyr Leu Ala Glu Leu Lys Asn Ser Glu
385 390 395 400
Arg Lys Ser
<210> 6
<211> 354
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 6
Lys Ile Pro Ser Leu Tyr Glu Asn Leu Thr Ile Gly Ser Ser Thr Leu
1 5 10 15
Ile Ala Asp Val Asp Ala Met Glu Ala Val Leu Gly Asn Thr Ala Ser
20 25 30
Thr Ser Asp Asp Leu Leu Asp Thr Trp Asn Ser Thr Phe Ser Pro Ile
35 40 45
Ser Glu Val Asn Gln Thr Ser Phe Met Glu Asp Ile Arg Pro Ile Leu
50 55 60
Phe Pro Asp Asn Gln Thr Leu Gln Phe Cys Asn Gln Thr Pro Pro His
65 70 75 80
Leu Val Gly Pro Ile Arg Val Phe Leu Asp Glu Pro Asp Phe Lys Thr
85 90 95
Leu Glu Lys Ile Tyr Pro Asp Thr His Ala Gly Gly His Gly Met Pro
100 105 110
Lys Asp Cys Val Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr Arg
115 120 125
Asp Arg Glu Ala His Leu Arg Ile Met Leu His Asn Leu His Ser Leu
130 135 140
Leu Ala Lys Gln Gln Leu Asp Tyr Ala Ile Phe Ile Val Glu Gln Val
145 150 155 160
Ala Asn Gln Thr Phe Asn Arg Gly Lys Leu Met Asn Val Gly Tyr Asp
165 170 175
Val Ala Ser Arg Leu Tyr Pro Trp Gln Cys Phe Ile Phe His Asp Val
180 185 190
Asp Leu Leu Pro Glu Asp Asp Arg Asn Leu Tyr Thr Cys Pro Ile Gln
195 200 205
Pro Arg His Met Ser Val Ala Ile Asp Lys Phe Asn Tyr Lys Leu Pro
210 215 220
Tyr Ser Ala Ile Phe Gly Gly Ile Ser Ala Leu Thr Lys Asp His Leu
225 230 235 240
Lys Lys Ile Asn Gly Phe Ser Asn Asp Phe Trp Gly Trp Gly Gly Glu
245 250 255
Asp Asp Asp Leu Ala Thr Arg Thr Ser Met Ala Gly Leu Lys Val Ser
260 265 270
Arg Tyr Pro Thr Gln Ile Ala Arg Tyr Lys Met Ile Lys His Ser Thr
275 280 285
Glu Ala Thr Asn Pro Val Asn Lys Cys Arg Tyr Lys Ile Met Gly Gln
290 295 300
Thr Lys Arg Arg Trp Thr Arg Asp Gly Leu Ser Asn Leu Lys Tyr Lys
305 310 315 320
Leu Val Asn Leu Glu Leu Lys Pro Leu Tyr Thr Arg Ala Val Val Asp
325 330 335
Leu Leu Glu Lys Asp Cys Arg Arg Glu Leu Arg Arg Asp Phe Pro Thr
340 345 350
Cys Phe
<210> 7
<211> 354
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 7
Asp Tyr Ser Phe Trp Ser Pro Ala Phe Ile Ile Ser Ala Pro Lys Thr
1 5 10 15
Leu Thr Thr Leu Gln Pro Phe Ser Gln Ser Thr Ser Thr Asn Asp Leu
20 25 30
Ala Val Ser Ala Leu Glu Ser Val Glu Phe Ser Met Leu Asp Asn Ser
35 40 45
Ser Ile Leu His Ala Ser Asp Asn Trp Thr Asn Asp Glu Leu Val Met
50 55 60
Arg Ala Gln Asn Glu Asn Leu Gln Leu Cys Pro Met Thr Pro Pro Ala
65 70 75 80
Leu Val Gly Pro Ile Lys Val Trp Met Asp Ala Pro Ser Phe Ala Glu
85 90 95
Leu Glu Arg Leu Tyr Pro Phe Leu Glu Pro Gly Gly His Gly Met Pro
100 105 110
Thr Ala Cys Arg Ala Arg His Arg Val Ala Ile Val Val Pro Tyr Arg
115 120 125
Asp Arg Glu Ser His Leu Arg Thr Phe Leu His Asn Leu His Ser Leu
130 135 140
Leu Thr Lys Gln Gln Leu Asp Tyr Ala Ile Phe Val Val Glu Gln Thr
145 150 155 160
Ala Asn Glu Thr Phe Asn Arg Ala Lys Leu Met Asn Val Gly Tyr Ala
165 170 175
Glu Ala Ile Arg Leu Tyr Asp Trp Arg Cys Phe Ile Phe His Asp Val
180 185 190
Asp Leu Leu Pro Glu Asp Asp Arg Asn Leu Tyr Ser Cys Pro Asp Glu
195 200 205
Pro Arg His Met Ser Val Ala Val Asp Lys Phe Asn Tyr Lys Leu Pro
210 215 220
Tyr Gly Ser Ile Phe Gly Gly Ile Ser Ala Leu Thr Arg Glu Gln Phe
225 230 235 240
Glu Gly Ile Asn Gly Phe Ser Asn Asp Tyr Trp Gly Trp Gly Gly Glu
245 250 255
Asp Asp Asp Leu Ser Thr Arg Val Thr Leu Ala Gly Tyr Lys Ile Ser
260 265 270
Arg Tyr Pro Ala Glu Ile Ala Arg Tyr Lys Met Ile Lys His Asn Ser
275 280 285
Glu Lys Lys Asn Pro Val Asn Arg Cys Arg Tyr Lys Leu Met Ser Ala
290 295 300
Thr Lys Ser Arg Trp Arg Asn Asp Gly Leu Ser Ser Leu Ser Tyr Asp
305 310 315 320
Leu Ile Ser Leu Gly Arg Leu Pro Leu Tyr Thr His Ile Lys Val Asp
325 330 335
Leu Leu Glu Lys Gln Ser Arg Arg Tyr Leu Arg Thr His Gly Phe Pro
340 345 350
Thr Cys
<210> 8
<211> 389
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 8
Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu Tyr Asn Ala Thr Gln
1 5 10 15
Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala Asn Trp Pro Lys Lys
20 25 30
Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu Tyr Ser Ile Lys Asn
35 40 45
Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser Val Val His Pro Pro
50 55 60
Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp Lys Asn Met Thr Ile
65 70 75 80
Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr Pro Leu Leu Ile Thr
85 90 95
Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr Thr Glu Asp Gly Val
100 105 110
Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu Cys Asp Ser Met Pro
115 120 125
Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr Glu Leu Glu Leu Glu
130 135 140
Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp Gly Gly Arg Tyr Ser
145 150 155 160
Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr
165 170 175
Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu Asn His Met His Pro
180 185 190
Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile Phe Ile Val Glu Gln
195 200 205
Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu Met Asn Val Gly Phe
210 215 220
Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp Gln Cys Phe Val Phe
225 230 235 240
His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg Asn Leu Tyr Ser Cys
245 250 255
Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile Asp Lys Leu His Phe
260 265 270
Lys Leu Pro Tyr Glu Asp Ile Phe Gly Gly Val Ser Ala Met Thr Leu
275 280 285
Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn Lys Tyr Trp Gly Trp
290 295 300
Gly Gly Glu Asp Asp Asp Met Ser Tyr Arg Leu Lys Lys Ile Asn Tyr
305 310 315 320
His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg Tyr Ala Met Leu Asp
325 330 335
His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr Gln Leu Leu Ser Gln
340 345 350
Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser Thr Leu Glu Tyr Glu
355 360 365
Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr His Ile Leu Val Asn
370 375 380
Ile Asp Glu Arg Ser
385
<210> 9
<211> 357
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 9
His Lys Tyr Ala His Ile Tyr Gly Asn Ala Ser Ser Asp Gly Ala Gly
1 5 10 15
Gly Ser Glu Ala Ser Arg Leu Pro Ala Ser Pro Leu Ala Leu Ser Lys
20 25 30
Asp Arg Glu Arg Asp Gln Glu Leu Asn Gly Gly Pro Asn Ser Thr Ile
35 40 45
Arg Thr Val Ile Ala Thr Ala Asn Phe Thr Ser Ile Pro Gln Asp Leu
50 55 60
Thr Arg Phe Leu Leu Gly Thr Lys Lys Phe Leu Pro Pro Arg Gln Lys
65 70 75 80
Ser Thr Ser Ala Leu Leu Ala Asn Cys Thr Asp Pro Asp Pro Arg Asp
85 90 95
Gly Gly Pro Ile Thr Pro Asn Thr Thr Leu Glu Ser Leu Asp Val Ile
100 105 110
Glu Ala Glu Leu Gly Pro Leu Leu Arg Pro Gly Gly Ala Phe Glu Pro
115 120 125
Glu Asn Cys Asn Ala Gln His His Val Ala Ile Val Val Pro Phe Arg
130 135 140
Asp Arg Tyr Ala His Leu Leu Leu Phe Leu Arg Asn Ile His Pro Phe
145 150 155 160
Leu Met Lys Gln Arg Ile Ala Tyr Arg Ile Phe Ile Val Glu Gln Thr
165 170 175
Asn Gly Lys Pro Phe Asn Arg Ala Ala Met Met Asn Ile Gly Tyr Leu
180 185 190
Glu Ala Leu Lys Leu Tyr Gln Trp Asp Cys Phe Ile Phe His Asp Val
195 200 205
Asp Leu Leu Pro Leu Asp Asp Arg Asn Leu Tyr Asn Cys Pro Arg Gln
210 215 220
Pro Arg His Met Ser Val Ala Ile Asp Thr Leu Asn Phe Arg Leu Pro
225 230 235 240
Tyr Arg Ser Ile Phe Gly Gly Val Ser Ala Met Thr Arg Glu His Phe
245 250 255
Gln Ala Val Asn Gly Phe Ser Asn Ser Phe Phe Gly Trp Gly Gly Glu
260 265 270
Asp Asp Asp Met Ser Asn Arg Leu Lys His Ala Asn Leu Phe Ile Ser
275 280 285
Arg Tyr Pro Val Asn Ile Ala Arg Tyr Lys Met Leu Lys His Gln Lys
290 295 300
Glu Lys Ala Asn Pro Lys Arg Tyr Glu Asn Leu Gln Asn Gly Met Ser
305 310 315 320
Lys Ile Glu Gln Asp Gly Ile Asn Ser Ile Lys Tyr Ser Ile Tyr Ser
325 330 335
Ile Lys Gln Phe Pro Thr Phe Thr Trp Tyr Leu Ala Glu Leu Lys Asn
340 345 350
Ser Glu Arg Lys Ser
355
<210> 10
<211> 354
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 10
Lys Ile Pro Ser Leu Tyr Glu Asn Leu Thr Ile Gly Ser Ser Thr Leu
1 5 10 15
Ile Ala Asp Val Asp Ala Met Glu Ala Val Leu Gly Asn Thr Ala Ser
20 25 30
Thr Ser Asp Asp Leu Leu Asp Thr Trp Asn Ser Thr Phe Ser Pro Ile
35 40 45
Ser Glu Val Asn Gln Thr Ser Phe Met Glu Asp Ile Arg Pro Ile Leu
50 55 60
Phe Pro Asp Asn Gln Thr Leu Gln Phe Cys Asn Gln Thr Pro Pro His
65 70 75 80
Leu Val Gly Pro Ile Arg Val Phe Leu Asp Glu Pro Asp Phe Lys Thr
85 90 95
Leu Glu Lys Ile Tyr Pro Asp Thr His Ala Gly Gly His Gly Met Pro
100 105 110
Lys Asp Cys Val Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr Arg
115 120 125
Asp Arg Glu Ala His Leu Arg Ile Met Leu His Asn Leu His Ser Leu
130 135 140
Leu Ala Lys Gln Gln Leu Asp Tyr Ala Ile Phe Ile Val Glu Gln Val
145 150 155 160
Ala Asn Gln Thr Phe Asn Arg Gly Lys Leu Met Asn Val Gly Tyr Asp
165 170 175
Val Ala Ser Arg Leu Tyr Pro Trp Gln Cys Phe Ile Phe His Asp Val
180 185 190
Asp Leu Leu Pro Glu Asp Asp Arg Asn Leu Tyr Thr Cys Pro Ile Gln
195 200 205
Pro Arg His Met Ser Val Ala Ile Asp Lys Phe Asn Tyr Lys Leu Pro
210 215 220
Tyr Ser Ala Leu Phe Gly Gly Ile Ser Ala Leu Thr Lys Asp His Leu
225 230 235 240
Lys Lys Ile Asn Gly Phe Ser Asn Asp Phe Trp Gly Trp Gly Gly Glu
245 250 255
Asp Asp Asp Leu Ala Thr Arg Thr Ser Met Ala Gly Leu Lys Val Ser
260 265 270
Arg Tyr Pro Thr Gln Ile Ala Arg Tyr Lys Met Ile Lys His Ser Thr
275 280 285
Glu Ala Thr Asn Pro Val Asn Lys Cys Arg Tyr Lys Ile Met Gly Gln
290 295 300
Thr Lys Arg Arg Trp Thr Arg Asp Gly Leu Ser Asn Leu Lys Tyr Lys
305 310 315 320
Leu Val Asn Leu Glu Leu Lys Pro Leu Tyr Thr Arg Ala Val Val Asp
325 330 335
Leu Leu Glu Lys Asp Cys Arg Arg Glu Leu Arg Arg Asp Phe Pro Thr
340 345 350
Cys Phe
<210> 11
<211> 354
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 11
Lys Ile Pro Ser Leu Tyr Glu Asn Leu Thr Ile Gly Ser Ser Thr Leu
1 5 10 15
Ile Ala Asp Val Asp Ala Met Glu Ala Val Leu Gly Asn Thr Ala Ser
20 25 30
Thr Ser Asp Asp Leu Leu Asp Thr Trp Asn Ser Thr Phe Ser Pro Ile
35 40 45
Ser Glu Val Asn Gln Thr Ser Phe Met Glu Asp Ile Arg Pro Ile Leu
50 55 60
Phe Pro Asp Asn Gln Thr Leu Gln Phe Cys Asn Gln Thr Pro Pro His
65 70 75 80
Leu Val Gly Pro Ile Arg Val Phe Leu Asp Glu Pro Asp Phe Lys Thr
85 90 95
Leu Glu Lys Ile Tyr Pro Asp Thr His Ala Gly Gly His Gly Met Pro
100 105 110
Lys Asp Cys Val Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr Arg
115 120 125
Asp Arg Glu Ala His Leu Arg Ile Met Leu His Asn Leu His Ser Leu
130 135 140
Leu Ala Lys Gln Gln Leu Asp Tyr Ala Ile Phe Ile Val Glu Gln Val
145 150 155 160
Ala Asn Gln Thr Phe Asn Arg Gly Lys Leu Met Asn Val Gly Tyr Asp
165 170 175
Val Ala Ser Arg Leu Tyr Pro Trp Gln Cys Phe Ile Phe His Asp Val
180 185 190
Asp Leu Leu Pro Glu Asp Asp Arg Asn Leu Tyr Thr Cys Pro Ile Gln
195 200 205
Pro Arg His Met Ser Val Ala Ile Asp Lys Phe Asn Tyr Lys Leu Pro
210 215 220
Tyr Ser Ala Met Phe Gly Gly Ile Ser Ala Leu Thr Lys Asp His Leu
225 230 235 240
Lys Lys Ile Asn Gly Phe Ser Asn Asp Phe Trp Gly Trp Gly Gly Glu
245 250 255
Asp Asp Asp Leu Ala Thr Arg Thr Ser Met Ala Gly Leu Lys Val Ser
260 265 270
Arg Tyr Pro Thr Gln Ile Ala Arg Tyr Lys Met Ile Lys His Ser Thr
275 280 285
Glu Ala Thr Asn Pro Val Asn Lys Cys Arg Tyr Lys Ile Met Gly Gln
290 295 300
Thr Lys Arg Arg Trp Thr Arg Asp Gly Leu Ser Asn Leu Lys Tyr Lys
305 310 315 320
Leu Val Asn Leu Glu Leu Lys Pro Leu Tyr Thr Arg Ala Val Val Asp
325 330 335
Leu Leu Glu Lys Asp Cys Arg Arg Glu Leu Arg Arg Asp Phe Pro Thr
340 345 350
Cys Phe
<210> 12
<211> 354
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 12
Lys Ile Pro Ser Leu Tyr Glu Asn Leu Thr Ile Gly Ser Ser Thr Leu
1 5 10 15
Ile Ala Asp Val Asp Ala Met Glu Ala Val Leu Gly Asn Thr Ala Ser
20 25 30
Thr Ser Asp Asp Leu Leu Asp Thr Trp Asn Ser Thr Phe Ser Pro Ile
35 40 45
Ser Glu Val Asn Gln Thr Ser Phe Met Glu Asp Ile Arg Pro Ile Leu
50 55 60
Phe Pro Asp Asn Gln Thr Leu Gln Phe Cys Asn Gln Thr Pro Pro His
65 70 75 80
Leu Val Gly Pro Ile Arg Val Phe Leu Asp Glu Pro Asp Phe Lys Thr
85 90 95
Leu Glu Lys Ile Tyr Pro Asp Thr His Ala Gly Gly His Gly Met Pro
100 105 110
Lys Asp Cys Val Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr Arg
115 120 125
Asp Arg Glu Ala His Leu Arg Ile Met Leu His Asn Leu His Ser Leu
130 135 140
Leu Ala Lys Gln Gln Leu Asp Tyr Ala Ile Phe Ile Val Glu Gln Val
145 150 155 160
Ala Asn Gln Thr Phe Asn Arg Gly Lys Leu Met Asn Val Gly Tyr Asp
165 170 175
Val Ala Ser Arg Leu Tyr Pro Trp Gln Cys Phe Ile Phe His Asp Val
180 185 190
Asp Leu Leu Pro Glu Asp Asp Arg Asn Leu Tyr Thr Cys Pro Ile Gln
195 200 205
Pro Arg His Met Ser Val Ala Ile Asp Lys Phe Asn Tyr Lys Leu Pro
210 215 220
Tyr Ser Ala Ala Phe Gly Gly Ile Ser Ala Leu Thr Lys Asp His Leu
225 230 235 240
Lys Lys Ile Asn Gly Phe Ser Asn Asp Phe Trp Gly Trp Gly Gly Glu
245 250 255
Asp Asp Asp Leu Ala Thr Arg Thr Ser Met Ala Gly Leu Lys Val Ser
260 265 270
Arg Tyr Pro Thr Gln Ile Ala Arg Tyr Lys Met Ile Lys His Ser Thr
275 280 285
Glu Ala Thr Asn Pro Val Asn Lys Cys Arg Tyr Lys Ile Met Gly Gln
290 295 300
Thr Lys Arg Arg Trp Thr Arg Asp Gly Leu Ser Asn Leu Lys Tyr Lys
305 310 315 320
Leu Val Asn Leu Glu Leu Lys Pro Leu Tyr Thr Arg Ala Val Val Asp
325 330 335
Leu Leu Glu Lys Asp Cys Arg Arg Glu Leu Arg Arg Asp Phe Pro Thr
340 345 350
Cys Phe
<210> 13
<211> 354
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 13
Lys Ile Pro Ser Leu Tyr Glu Asn Leu Thr Ile Gly Ser Ser Thr Leu
1 5 10 15
Ile Ala Asp Val Asp Ala Met Glu Ala Val Leu Gly Asn Thr Ala Ser
20 25 30
Thr Ser Asp Asp Leu Leu Asp Thr Trp Asn Ser Thr Phe Ser Pro Ile
35 40 45
Ser Glu Val Asn Gln Thr Ser Phe Met Glu Asp Ile Arg Pro Ile Leu
50 55 60
Phe Pro Asp Asn Gln Thr Leu Gln Phe Cys Asn Gln Thr Pro Pro His
65 70 75 80
Leu Val Gly Pro Ile Arg Val Phe Leu Asp Glu Pro Asp Phe Lys Thr
85 90 95
Leu Glu Lys Ile Tyr Pro Asp Thr His Ala Gly Gly His Gly Met Pro
100 105 110
Lys Asp Cys Val Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr Arg
115 120 125
Asp Arg Glu Ala His Leu Arg Ile Met Leu His Asn Leu His Ser Leu
130 135 140
Leu Ala Lys Gln Gln Leu Asp Tyr Ala Ile Phe Ile Val Glu Gln Val
145 150 155 160
Ala Asn Gln Thr Phe Asn Arg Gly Lys Leu Met Asn Val Gly Tyr Asp
165 170 175
Val Ala Ser Arg Leu Tyr Pro Trp Gln Cys Phe Ile Phe His Asp Val
180 185 190
Asp Leu Leu Pro Glu Asp Asp Arg Asn Leu Tyr Thr Cys Pro Ile Gln
195 200 205
Pro Arg His Met Ser Val Ala Ile Asp Lys Phe Asn Tyr Lys Leu Pro
210 215 220
Tyr Ser Ala Ile Phe Gly Gly Ile Ser Ala Leu Thr Lys Asp His Leu
225 230 235 240
Lys Lys Ile Asn Gly Phe Ser Asn Asp Phe Trp Gly Trp Gly Gly Glu
245 250 255
Asp Asp Asp Leu Ala Thr Arg Thr Ser Met Ala Gly Leu Lys Val Ser
260 265 270
Arg Tyr Pro Thr Gln Ile Ala Arg Tyr Lys His Ile Lys His Ser Thr
275 280 285
Glu Ala Thr Asn Pro Val Asn Lys Cys Arg Tyr Lys Ile Met Gly Gln
290 295 300
Thr Lys Arg Arg Trp Thr Arg Asp Gly Leu Ser Asn Leu Lys Tyr Lys
305 310 315 320
Leu Val Asn Leu Glu Leu Lys Pro Leu Tyr Thr Arg Ala Val Val Asp
325 330 335
Leu Leu Glu Lys Asp Cys Arg Arg Glu Leu Arg Arg Asp Phe Pro Thr
340 345 350
Cys Phe
<210> 14
<211> 360
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 14
Lys Ile Pro Ser Leu Tyr Glu Asn Leu Thr Ile Gly Ser Ser Thr Leu
1 5 10 15
Ile Ala Asp Val Asp Ala Met Glu Ala Val Leu Gly Asn Thr Ala Ser
20 25 30
Thr Ser Asp Asp Leu Leu Asp Thr Trp Asn Ser Thr Phe Ser Pro Ile
35 40 45
Ser Glu Val Asn Gln Thr Ser Phe Met Glu Asp Ile Arg Pro Ile Leu
50 55 60
Phe Pro Asp Asn Gln Thr Leu Gln Phe Cys Asn Gln Thr Pro Pro His
65 70 75 80
Leu Val Gly Pro Ile Arg Val Phe Leu Asp Glu Pro Asp Phe Lys Thr
85 90 95
Leu Glu Lys Ile Tyr Pro Asp Thr His Ala Gly Gly His Gly Met Pro
100 105 110
Lys Asp Cys Val Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr Arg
115 120 125
Asp Arg Glu Ala His Leu Arg Ile Met Leu His Asn Leu His Ser Leu
130 135 140
Leu Ala Lys Gln Gln Leu Asp Tyr Ala Ile Phe Ile Val Glu Gln Val
145 150 155 160
Ala Asn Gln Thr Phe Asn Arg Gly Lys Leu Met Asn Val Gly Tyr Asp
165 170 175
Val Ala Ser Arg Leu Tyr Pro Trp Gln Cys Phe Ile Phe His Asp Val
180 185 190
Asp Leu Leu Pro Glu Asp Asp Arg Asn Leu Tyr Thr Cys Pro Ile Gln
195 200 205
Pro Arg His Met Ser Val Ala Ile Asp Lys Phe Asn Tyr Lys Leu Pro
210 215 220
Tyr Ser Ala Ile Phe Gly Gly Ile Ser Ala Leu Thr Lys Asp His Leu
225 230 235 240
Lys Lys Ile Asn Gly Phe Ser Asn Asp Phe Trp Gly Trp Gly Gly Glu
245 250 255
Asp Asp Asp Leu Ala Thr Arg Thr Ser Met Ala Gly Leu Lys Val Ser
260 265 270
Arg Tyr Pro Thr Gln Ile Ala Arg Tyr Lys Met Ile Lys His Ser Thr
275 280 285
Glu Ala Thr Asn Pro Val Asn Lys Cys Arg Tyr Lys Ile Met Gly Gln
290 295 300
Thr Lys Arg Arg Trp Thr Arg Asp Gly Leu Ser Asn Leu Lys Tyr Lys
305 310 315 320
Leu Val Asn Leu Glu Leu Lys Pro Leu Tyr Thr Arg Ala Val Val Asp
325 330 335
Leu Leu Glu Lys Asp Cys Arg Arg Glu Leu Arg Arg Asp Phe Pro Thr
340 345 350
Cys Phe His His His His His His
355 360
<210> 15
<211> 383
<212> PRT
<213> 腐生水果线虫(Caenorhabditis remanei)
<400> 15
Met Ala Leu Arg His Leu Ala Val Ala Lys Leu Lys Thr Phe Phe Val
1 5 10 15
Leu Cys Ala Ala Leu Leu Leu Val His Thr Met Ile Tyr Lys Ala Pro
20 25 30
Ser Leu Tyr Glu Asn Phe Ser Ile Gly Ser Ser Thr Leu Ile Ala Asp
35 40 45
Val Asp Ala Met Glu Ala Val Leu Gly Asn Thr Ala Ser Thr Ser Tyr
50 55 60
Asp Leu Leu Asp Thr Trp Asn Ser Thr Phe Ser Pro Ile Ser Glu Val
65 70 75 80
Asn Gln Thr Ser Phe Leu Glu Asp Val Arg Pro Ile Leu Phe Thr Asp
85 90 95
Asn Gln Thr Lys Pro Phe Cys Asn Gln Thr Pro Pro His Leu Val Gly
100 105 110
Pro Ile Arg Val Phe Leu Asp Glu Pro Asp Phe Ala Thr Leu Glu Lys
115 120 125
Ile Tyr Pro Asp Val His Thr Gly Gly His Gly Ile Pro Asp Glu Cys
130 135 140
Ile Ala Arg His Arg Val Ala Val Ile Val Pro Tyr Arg Asp Arg Glu
145 150 155 160
Ala His Leu Arg Ile Met Leu His Asn Leu His Ser Leu Leu Ala Lys
165 170 175
Gln Gln Leu Asp Tyr Ala Ile Ile Val Val Glu Gln Ile Val Asn Gln
180 185 190
Thr Phe Asn Arg Gly Lys Leu Met Asn Val Gly Tyr Asp Val Ala Ser
195 200 205
Arg Leu Tyr Pro Trp Gln Cys Phe Ile Phe His Asp Val Asp Leu Leu
210 215 220
Pro Glu Asp Asp Arg Asn Leu Tyr Thr Cys Pro Ile Gln Pro Arg His
225 230 235 240
Met Ser Val Ala Ile Asp Lys Phe Asp Tyr Lys Leu Pro Tyr Ser Thr
245 250 255
Ile Phe Gly Gly Ile Ser Ala Leu Thr Gln Glu His Val Lys Lys Ile
260 265 270
Asn Gly Phe Ser Asn Asp Phe Trp Gly Trp Gly Gly Glu Asp Asp Asp
275 280 285
Leu Ala Thr Arg Thr Ser Met Ala Gly Leu Lys Val Ser Arg Tyr Pro
290 295 300
Ala Gln Ile Ala Arg Tyr Lys Met Ile Lys His Ser Thr Glu Ala Thr
305 310 315 320
Asn Pro Val Asn Lys Cys Arg Tyr Lys Ile Met Gly Gln Thr Lys Arg
325 330 335
Arg Trp Thr Arg Asp Gly Leu Ser Ser Leu Lys Tyr Lys Leu Val Lys
340 345 350
Leu Asp Leu Lys Pro Leu Tyr Thr Arg Ala Val Val Asp Leu Leu Glu
355 360 365
Lys Asp Cys Arg Arg Glu Leu Arg Lys Asp Phe Pro Thr Cys Phe
370 375 380
<210> 16
<211> 384
<212> PRT
<213> Caenorhabditis briggsae
<400> 16
Met Ala Phe Arg His Leu Ala Ser Ala Lys Leu Lys Thr Phe Phe Val
1 5 10 15
Leu Cys Ala Ala Leu Leu Leu Val His Ala Met Ile Tyr Lys Val Pro
20 25 30
Ser Leu Tyr Glu Asn Phe Ser Ile Gly Ser Ser Thr Leu Ile Ala Asp
35 40 45
Val Asp Ala Met Glu Ala Val Leu Gly Asn Thr Ala Ser Thr Ser Asp
50 55 60
Asp Pro Phe Asp Val Trp Asn Ser Thr Phe Ser Pro Ile Ser Glu Val
65 70 75 80
Asn Gln Thr Ala Phe Met Glu Asp Ile Arg Pro Ile Leu Phe Gly Asp
85 90 95
Ala Asn Glu Thr Arg Pro His Cys Asn Gln Thr Pro Pro His Leu Val
100 105 110
Gly Pro Ile Arg Val Phe Leu Asp Glu Pro Asp Phe Ala Thr Leu Glu
115 120 125
Lys Ile Tyr Pro Glu Thr His Pro Gly Gly His Gly Ile Pro Thr Glu
130 135 140
Cys Val Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr Arg Asp Arg
145 150 155 160
Glu Ala His Leu Arg Ile Met Leu His Asn Leu His Ser Leu Leu Ala
165 170 175
Lys Gln Gln Leu Asp Tyr Ala Ile Phe Val Val Glu Gln Val Ala Asn
180 185 190
Gln Thr Phe Asn Arg Gly Lys Leu Met Asn Val Gly Tyr Asp Val Ala
195 200 205
Ser Arg Leu Tyr Pro Trp Gln Cys Phe Ile Phe His Asp Val Asp Leu
210 215 220
Leu Pro Glu Asp Asp Arg Asn Leu Tyr Thr Cys Pro Ile Gln Pro Arg
225 230 235 240
His Met Ser Val Ala Ile Asp Lys Phe His Tyr Lys Leu Pro Tyr Ser
245 250 255
Ala Ile Phe Gly Gly Ile Ser Ala Leu Thr Gln Glu His Val Lys Ala
260 265 270
Ile Asn Gly Phe Ser Asn Asp Phe Trp Gly Trp Gly Gly Glu Asp Asp
275 280 285
Asp Leu Ala Thr Arg Thr Ser Gln Ala Gly Leu Lys Val Ser Arg Tyr
290 295 300
Pro Ala Gln Ile Ala Arg Tyr Lys Met Ile Lys His Ser Thr Glu Ala
305 310 315 320
Thr Asn Pro Val Asn Lys Cys Arg Tyr Lys Ile Met Gly Gln Thr Lys
325 330 335
Arg Arg Trp Lys Thr Asp Gly Leu Ser Ser Leu Lys Tyr Lys Leu Val
340 345 350
Lys Leu Glu Leu Lys Pro Leu Tyr Thr Arg Ala Val Val Asp Leu Leu
355 360 365
Glu Lys Glu Cys Arg Arg Glu Leu Arg Arg Asp Phe Pro Thr Cys Phe
370 375 380
<210> 17
<211> 464
<212> PRT
<213> 吴策线虫(Wuchereria bancrofti)
<400> 17
Met Pro Ala Ala Gly Arg Phe Val Ile Ile Leu Leu Ile Phe Gly Ala
1 5 10 15
Ala Ala His Ile Phe Leu Gly Gly Gly Leu Ser Phe Ile Ser Asp Tyr
20 25 30
His Ile Trp Arg Pro Val Val Glu Ser Ser Arg Gln Glu Ile Val Leu
35 40 45
Val His Asn Ile Asp Asn Asn Ser Asp Gln Asn Ala Glu Lys Ile Ile
50 55 60
Ser Asn Asn Glu Thr Lys Phe His Leu Thr Ser Ala Thr Pro Ile Asp
65 70 75 80
Asn Leu Val Ser Ile His Ser Asn Phe Tyr Glu Leu Phe Ile Asn Gly
85 90 95
Leu Arg Phe Gly Lys Leu Thr Thr Val Tyr Pro Ile Ile Asn Gln Ser
100 105 110
Ile Asn Asn Gly Ser Thr Thr Asp Lys Ser Thr Glu Thr Tyr Ala Glu
115 120 125
Ser Val Tyr Phe Leu Lys Thr Asp Gly Asn Ile His Ser Asn Thr Leu
130 135 140
Leu Ser Thr Ile Thr Asp Ala Gln Ser Thr Arg Gln Leu Phe Gly Asn
145 150 155 160
Glu Thr Leu Ser Ala Cys Asn Val Ile Pro Ser Phe Gln Met Met His
165 170 175
Gln Asn Leu Ser Leu Val Asn Cys Pro Val Thr Pro Pro Gly Leu Val
180 185 190
Gly Pro Ile Lys Val Trp Tyr Asp Glu Pro Thr Phe Glu Glu Ile Glu
195 200 205
Arg Leu Asn Pro Asn Leu Glu Ala Gly Gly His Gly Lys Pro Glu Asn
210 215 220
Cys Leu Ser Arg His Arg Val Ala Val Ile Val Pro Tyr Arg Asp Arg
225 230 235 240
Glu Ala His Leu Arg Ile Leu Leu His Asn Leu His Ser Leu Leu Thr
245 250 255
Lys Gln Gln Leu Asp Tyr Gly Ile Phe Val Ile Glu Gln His Glu Asn
260 265 270
Glu Thr Phe Asn Arg Ala Lys Leu Met Asn Val Gly Tyr Val Glu Ala
275 280 285
Leu Lys Leu Tyr Asp Trp Gln Cys Phe Val Phe His Asp Val Asp Leu
290 295 300
Leu Ala Glu Asp Asp Arg Asn Ile Tyr Ser Cys Pro Asp Gln Pro Arg
305 310 315 320
His Met Ser Val Ala Val Asn Lys Phe Lys Tyr Lys Leu Pro Tyr Gly
325 330 335
Ser Ile Phe Gly Gly Val Ser Ala Ile Arg Thr Glu Gln Phe Ala Thr
340 345 350
Leu Asn Gly Phe Ser Asn Ser Tyr Trp Gly Trp Gly Gly Glu Asp Asp
355 360 365
Asp Leu Ser Met Arg Val Thr Ser Ala Gly Tyr Lys Ile Met Arg Tyr
370 375 380
Pro Ser Glu Ile Ala Arg Tyr Gln Met Val Gln His Lys Ser Glu Met
385 390 395 400
Lys Asn Pro Ile Asn Arg Cys Arg Tyr Asp Leu Leu Ala Lys Thr Lys
405 410 415
Val Arg Gln Gln Thr Asp Gly Ile Ser Ser Leu Lys Tyr Glu Cys Tyr
420 425 430
Asp Leu Gln Phe Phe Thr Leu Phe Thr His Ile Lys Val Lys Leu Phe
435 440 445
Glu Gln Glu Ser Lys Ala Gln Leu Arg Glu Glu Gly Phe Lys Arg Cys
450 455 460
<210> 18
<211> 291
<212> PRT
<213> 罗阿丝虫(Loa loa)
<400> 18
Met Glu Arg Gln Asn Leu Ser Leu Val Asp Cys Pro Ile Ile Pro Pro
1 5 10 15
Gly Leu Val Gly Pro Ile Lys Val Trp Tyr Asp Glu Pro Thr Phe Glu
20 25 30
Glu Ile Glu Arg Leu Asn Pro Tyr Leu Glu Leu Gly Gly His Gly Lys
35 40 45
Pro Gly Ser Cys Leu Ser Arg His Arg Val Ala Ile Ile Val Pro Tyr
50 55 60
Arg Asp Arg Glu Ala His Leu Arg Ile Leu Leu His Asn Leu His Ser
65 70 75 80
Leu Leu Thr Lys Gln Gln Leu Asp Tyr Ala Ile Phe Val Ile Glu Gln
85 90 95
His Glu Asn Glu Thr Phe Asn Arg Ala Lys Leu Met Asn Val Gly Tyr
100 105 110
Thr Glu Ala Met Lys Leu Tyr Asp Trp Gln Cys Phe Ile Phe His Asp
115 120 125
Val Asp Leu Leu Ala Glu Asp Asp Arg Asn Ile Tyr Ser Cys Pro Asp
130 135 140
Gln Pro Arg His Met Ser Val Ala Ile Asn Lys Phe Lys Tyr Arg Leu
145 150 155 160
Pro Tyr Gly Ser Ile Phe Gly Gly Val Ser Ala Ile Arg Thr Glu Gln
165 170 175
Phe Leu Lys Met Asn Gly Phe Ser Asn Ser Tyr Trp Gly Trp Gly Gly
180 185 190
Glu Asp Asp Asp Leu Ser Ile Arg Val Thr Ser Leu Gly Tyr Lys Ile
195 200 205
Met Arg Tyr Pro Leu Glu Ile Ala Arg Tyr Gln Met Val Lys His Glu
210 215 220
Ser Glu Thr Lys Asn Pro Ile Asn Arg Cys Arg Tyr Asp Leu Leu Ala
225 230 235 240
Lys Thr Lys Val Arg Gln Gln Met Asp Gly Ile Ser Ser Leu Lys Tyr
245 250 255
Glu Cys Tyr Asp Leu His Phe Leu Pro Leu Phe Thr His Ile Lys Val
260 265 270
Lys Leu Phe Glu Gln Glu Ser Lys Ala Gln Leu Arg Glu Glu Gly Phe
275 280 285
Lys Lys Cys
290
<210> 19
<211> 296
<212> PRT
<213> 毕氏粗角猛蚁(Cerapachys biroi)
<400> 19
Met Pro Ile Arg Asn Leu Ala Gly Asn Gly Gly Thr Ala Arg Glu Leu
1 5 10 15
Pro Val Ala Asn Thr Thr Ser Asn Ala Thr Ile Pro Arg Cys Pro Leu
20 25 30
Ile Pro Pro Asn Leu Val Gly Pro Val Ala Val Ser Lys Ser Pro Pro
35 40 45
Pro Leu Ser Glu Met Glu Arg Ser Phe Val Glu Val Lys Ala Gly Gly
50 55 60
Lys Gly Arg Pro Ala Asp Cys Val Ala Arg His Arg Val Ala Ile Ile
65 70 75 80
Ile Pro Phe Arg Asp Arg Pro Gln His Leu Gln Thr Leu Leu Tyr Asn
85 90 95
Leu His Pro Ile Leu Leu Arg Gln Gln Ile Asp Tyr Gln Ile Phe Val
100 105 110
Ile Glu Gln Glu Gly Thr Gly Thr Phe Asn Arg Ala Met Leu Met Asn
115 120 125
Val Gly Tyr Val Glu Ala Leu Lys Glu Arg Ile Phe Asp Cys Phe Ile
130 135 140
Phe His Asp Val Asp Leu Leu Pro Glu Asp Asp Arg Asn Leu Tyr Thr
145 150 155 160
Cys Pro Glu Gln Pro Arg His Met Ser Val Ala Val Asp Lys Phe Lys
165 170 175
Tyr Arg Leu Pro Tyr Ala Asp Leu Phe Gly Gly Val Ser Ala Met Ser
180 185 190
Arg Glu His Phe Gln Leu Val Asn Gly Phe Ser Asn Val Phe Trp Gly
195 200 205
Trp Gly Gly Glu Asp Asp Asp Met Ala Asn Arg Ile Lys Ala His Gly
210 215 220
Leu His Ile Ser Arg Tyr Pro Ala Asn Val Ala Arg Tyr Lys Met Leu
225 230 235 240
Thr His Lys Lys Glu Lys Ala Asn Pro Lys Arg Tyr Glu Phe Leu Lys
245 250 255
Thr Gly Lys Lys Arg Phe Ser Thr Asp Gly Leu Ala Asn Leu Gln Tyr
260 265 270
Glu Leu Cys Asp Lys Arg Lys Pro Lys Leu Tyr Thr Trp Leu Leu Val
275 280 285
Arg Leu Thr Pro Pro Gln Pro Ser
290 295
<210> 20
<211> 422
<212> PRT
<213> 湿木白蚁(Zootermopsis nevadensis)
<400> 20
Met Arg Cys Arg Cys Leu Ser Ala Trp Ser Arg Ile Thr Gln His Val
1 5 10 15
Pro Arg Gln Pro Cys Leu His Ile His Ser His Leu Cys Lys Val Val
20 25 30
Ile Val Leu Ala Val Leu Ile Ala Leu Gln Phe Leu Leu Thr Thr Ile
35 40 45
Phe Glu Ala Arg Gln Ile Glu Pro Leu Phe Thr Val Asn Phe Thr Tyr
50 55 60
Ser Gly Arg Arg Ser Arg Trp Gly Leu Ile Ser His Ser Arg Gly Leu
65 70 75 80
Leu Ser Pro Ser His Asn Ser Ser Phe Asn Gly Ser Met Arg Val Ser
85 90 95
Val Glu Arg Thr Leu Ser Pro Val Glu Asn Ile Ser Gly Glu Thr Lys
100 105 110
Asn Leu Ser Phe Leu His Thr His Glu Asn Ala Val Arg Asn Ala Ser
115 120 125
Ser Leu Val Leu Asn Ile Ser Leu Pro Ser Asp Leu Asn Pro Thr Thr
130 135 140
Ser Pro Ser Leu Thr Val Pro Phe Thr Gly Lys Ser Leu Cys Pro Pro
145 150 155 160
Ile Pro Pro Asn Leu Asn Gly Pro Ile Lys Val Leu Lys Asp Ser Pro
165 170 175
Ser Leu Glu Glu Leu Glu Lys Met Phe Pro Leu Leu Glu Pro Gly Gly
180 185 190
His Tyr His Pro Glu Glu Cys Gln Ala Arg Asp Arg Val Ala Ile Ile
195 200 205
Val Pro Tyr Arg Asp Arg Ala Glu His Leu Ser Thr Phe Leu Leu Asn
210 215 220
Leu His Pro Leu Leu Gln Arg Gln Gln Leu Asp Tyr Gly Met Phe Val
225 230 235 240
Ile Glu Gln Gly Gly Asp Gly Pro Phe Asn Arg Ala Met Leu Met Asn
245 250 255
Val Gly Phe Val Glu Ala Leu Lys Leu Tyr Ser Tyr Asp Cys Phe Ile
260 265 270
Phe His Asp Val Asp Leu Leu Pro Glu Asp Asp Arg Asn Leu Tyr Thr
275 280 285
Cys Pro Glu Gln Pro Arg His Met Ser Val Ala Val Asp Val Leu Lys
290 295 300
Tyr Lys Leu Pro Tyr Gln Ala Ile Phe Gly Gly Val Ser Ala Met Thr
305 310 315 320
Lys Thr Gln Phe Gln Lys Val Asn Gly Phe Ser Asn Leu Phe Trp Gly
325 330 335
Trp Gly Gly Glu Asp Asp Asp Met Ser Asn Arg Val Arg His His Gly
340 345 350
Tyr His Ile Ser Arg Tyr Pro Ala Asn Ile Ala Arg Tyr Lys Met Leu
355 360 365
Ala His Arg Lys Gln His Ala Asn Pro Lys Arg Tyr Glu Phe Leu Asn
370 375 380
Thr Gly Arg Lys Arg Phe Lys Thr Asp Gly Leu Ser Asn Leu Gln Tyr
385 390 395 400
Asp Arg Lys Glu Leu Asn Leu Gly Lys Leu Tyr Thr Arg Val Leu Val
405 410 415
Glu Leu Ala Thr Pro Ser
420
<210> 21
<211> 295
<212> PRT
<213> 佛罗里达弓背蚁(Camponotus floridanus)
<400> 21
Met Pro Thr Arg Asn Leu Val Gly Gly Gly Thr Ala Arg Glu Leu Pro
1 5 10 15
Val Ala Asn Ala Thr Asn Asn Thr Thr Met Pro Arg Cys Pro Leu Ile
20 25 30
Pro Pro Asn Leu Val Gly Pro Met Val Val Ser Lys Ser Pro Pro Pro
35 40 45
Leu Ser Glu Met Glu Arg Ser Phe Val Glu Val Asn Ala Gly Gly Arg
50 55 60
Gly Arg Pro Ala Asp Cys Val Ala Arg His Arg Val Ala Ile Ile Ile
65 70 75 80
Pro Phe Arg Asp Arg Pro Gln His Leu Gln Thr Leu Leu Tyr Asn Leu
85 90 95
His Pro Ile Leu Leu Arg Gln Gln Ile Glu Tyr Gln Ile Phe Val Ile
100 105 110
Glu Gln Glu Gly Thr Gly Ala Phe Asn Arg Ala Met Leu Met Asn Val
115 120 125
Gly Tyr Val Glu Ala Leu Lys Glu Arg Thr Phe Asp Cys Phe Ile Phe
130 135 140
His Asp Val Asp Leu Leu Pro Glu Asp Asp Arg Asn Leu Tyr Thr Cys
145 150 155 160
Pro Glu Gln Pro Arg His Met Ser Val Ala Val Asp Lys Phe Lys Tyr
165 170 175
Arg Leu Pro Tyr Thr Asp Leu Phe Gly Gly Val Ser Ala Met Ser Arg
180 185 190
Glu His Phe Gln Leu Val Asn Gly Phe Ser Asn Val Phe Trp Gly Trp
195 200 205
Gly Gly Glu Asp Asp Asp Met Ala Asn Arg Ile Lys Ala His Gly Leu
210 215 220
His Ile Ser Arg Tyr Pro Ala Asn Val Ala Arg Tyr Lys Met Leu Thr
225 230 235 240
His Lys Lys Glu Lys Ala Asn Pro Lys Arg Tyr Glu Phe Leu Lys Thr
245 250 255
Gly Lys Lys Arg Phe Ser Thr Asp Gly Leu Ala Asn Leu Gln Tyr Glu
260 265 270
Leu Ser Asp Lys Arg Lys Pro Lys Leu Tyr Thr Trp Leu Leu Val Arg
275 280 285
Leu Thr Pro Pro Gln Pro Ser
290 295
<210> 22
<211> 310
<212> PRT
<213> 长牡蛎(Crassostrea gigas)
<400> 22
Met Asp Arg Gly Cys Lys Pro Met Arg Val Cys Ser Ser Ser Pro Ser
1 5 10 15
Asp Leu Val Gly Ser Leu Ala Thr Tyr Lys Glu Ala Pro Ser Tyr Lys
20 25 30
Glu Met Ile Lys Ile Tyr Pro Leu Val Arg Pro Gly Gly Leu Tyr Thr
35 40 45
Pro Pro Asp Cys Ile Ala Arg Glu Arg Val Ala Ile Ile Ile Pro Phe
50 55 60
Arg Asp Arg Glu Glu His Leu Arg Ile Leu Leu His Asn Leu His Pro
65 70 75 80
Met Leu Gln Arg Gln Gln Leu Asp Tyr Gly Ile Tyr Val Val Glu Gln
85 90 95
Glu Asn Gly Thr Gln Phe Asn Arg Ala Met Leu Met Asn Ile Gly Tyr
100 105 110
Ala Glu Ser Ile Lys Leu Tyr Asn Tyr Thr Cys Phe Ile Phe His Asp
115 120 125
Val Asp Leu Ile Pro Glu Asn Asp Arg Ile Met Tyr Asp Cys Arg Asp
130 135 140
Ser Pro Arg His Leu Ser Ser Ala Val Asp Lys Phe Lys Tyr Lys Leu
145 150 155 160
Pro Tyr Pro Gln Leu Phe Gly Gly Val Thr Ala Ile Lys Arg Ala His
165 170 175
Phe Glu Lys Val Asn Gly His Ser Asn Lys Phe Phe Gly Trp Gly Gly
180 185 190
Glu Asp Asp Asp Met Phe Arg Arg Leu Val Asn Asn Gly Phe Lys Ile
195 200 205
Ser Arg Tyr Gln Ala Ser Leu Ser Lys Tyr Lys Met Ile Lys His Leu
210 215 220
His Asp Ala Gly Asn Lys Ala Asn Lys Arg Arg His His Leu Ile Lys
225 230 235 240
Thr Gly Lys Gly Arg Tyr Arg Arg Asp Gly Ile Asn Asn Leu His Tyr
245 250 255
Lys Lys Leu Gly Ile Glu Tyr Gln Tyr Leu His Thr Arg Ile Leu Val
260 265 270
Ser Ile Asn Glu Thr Lys Val Met Thr Val Ser Leu Leu Tyr Met Tyr
275 280 285
Ser Ser Thr Thr Val Tyr Ile Ile Val Asn Ile Tyr Thr Ile Tyr Cys
290 295 300
Lys Ser Arg Asn Ile Arg
305 310
<210> 23
<211> 338
<212> PRT
<213> 大红斑蝶(Danaus plexippus)
<400> 23
Met Ala Lys Lys Leu Leu Thr Gln Gly Thr Glu Ser Val Thr Asn Tyr
1 5 10 15
Thr His Thr Thr Asn Ser Ser Asn Lys Asn Pro Ala Lys Glu Thr Phe
20 25 30
Asn Met Thr Lys Pro Asn Leu Ser Asp Asp Thr Ser Thr Pro Leu Leu
35 40 45
Ile Thr Lys Ile Met Glu Ser Ile Lys Asn Leu Val Thr Thr Glu Glu
50 55 60
Asp Phe Arg Asp Glu Pro Ser Leu Pro Leu Cys Asp Glu Met Pro Pro
65 70 75 80
Asp Leu Gly Pro Ile Ser Val Asn Lys Thr Glu Ile Glu Leu Asp Trp
85 90 95
Val Glu Lys Arg Tyr Pro Glu Val Arg Ser Gly Gly Ile Tyr Ser Ser
100 105 110
Ser Asn Cys Thr Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr Arg
115 120 125
Asp Arg Gln Gln His Leu Ala Ile Phe Leu Asn His Met His Pro Phe
130 135 140
Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile Tyr Ile Ile Glu Gln Glu
145 150 155 160
Gly Thr Ser Glu Phe Asn Arg Ala Lys Leu Met Asn Val Gly Phe Val
165 170 175
Glu Ser Gln Arg Gln Arg Ser Trp Gln Cys Phe Ile Phe His Asp Ile
180 185 190
Asp Leu Leu Pro Leu Asp Ser Arg Asn Met Tyr Ser Cys Pro Lys Gln
195 200 205
Pro Arg His Met Ser Ala Ser Ile Asp Lys Leu Asn Phe Arg Leu Pro
210 215 220
Tyr Glu Asp Ile Phe Gly Gly Val Ser Ala Met Thr Leu Glu Gln Phe
225 230 235 240
Thr Lys Val Asn Gly Phe Ser Asn Lys Tyr Trp Gly Trp Gly Gly Glu
245 250 255
Asp Asp Asp Met Phe Tyr Arg Leu Lys Lys Met Asn Tyr His Ile Ala
260 265 270
Arg Tyr Lys Met Ser Ile Ala Arg Tyr Ala Met Leu Asp His Lys Lys
275 280 285
Ser Ala Pro Asn Pro Lys Arg Tyr Gln Leu Leu Ser Gln Thr Ser Lys
290 295 300
Thr Phe Gln Lys Asp Gly Leu Ser Thr Leu Glu Tyr Glu Val Ile Lys
305 310 315 320
Val Thr Ala Asn His Leu Tyr Thr His Ile Leu Val Asn Ile Asp Glu
325 330 335
Arg Ser
<210> 24
<211> 941
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 24
Arg Tyr Gly Ser Trp Arg Glu Leu Ala Lys Ala Leu Ala Ser Arg Asn
1 5 10 15
Ile Pro Ala Val Asp Pro His Leu Gln Phe Tyr His Pro Gln Arg Leu
20 25 30
Ser Leu Glu Asp His Asp Ile Asp Gln Gly Val Ser Ser Asn Ser Ser
35 40 45
Tyr Leu Lys Trp Asn Lys Pro Val Pro Trp Leu Ser Glu Phe Arg Gly
50 55 60
Arg Ala Asn Leu His Val Phe Glu Asp Trp Cys Gly Ser Ser Ile Gln
65 70 75 80
Gln Leu Arg Arg Asn Leu His Phe Pro Leu Tyr Pro His Ile Arg Thr
85 90 95
Thr Leu Arg Lys Leu Ala Val Ser Pro Lys Trp Thr Asn Tyr Gly Leu
100 105 110
Arg Ile Phe Gly Tyr Leu His Pro Phe Thr Asp Gly Lys Ile Gln Phe
115 120 125
Ala Ile Ala Ala Asp Asp Asn Ala Glu Phe Trp Leu Ser Leu Asp Asp
130 135 140
Gln Val Ser Gly Leu Gln Leu Leu Ala Ser Val Gly Lys Thr Gly Lys
145 150 155 160
Glu Trp Thr Ala Pro Gly Glu Phe Gly Lys Phe Arg Ser Gln Ile Ser
165 170 175
Lys Pro Val Ser Leu Ser Ala Ser His Arg Tyr Tyr Phe Glu Val Leu
180 185 190
His Lys Gln Asn Glu Glu Gly Thr Asp His Val Glu Val Ala Trp Arg
195 200 205
Arg Asn Asp Pro Gly Ala Lys Phe Thr Ile Ile Asp Ser Leu Ser Leu
210 215 220
Ser Leu Phe Thr Asn Glu Thr Phe Leu Gln Met Asp Glu Val Gly His
225 230 235 240
Ile Pro Gln Thr Ala Ala Ser His Val Asp Ser Ser Asn Ala Leu Pro
245 250 255
Arg Asp Glu Gln Pro Pro Ala Asp Met Leu Arg Pro Asp Pro Arg Asp
260 265 270
Thr Leu Tyr Arg Val Pro Leu Ile Pro Lys Ser His Leu Arg His Val
275 280 285
Leu Pro Asp Cys Pro Tyr Lys Pro Ser Tyr Leu Val Asp Gly Leu Pro
290 295 300
Leu Gln Arg Tyr Gln Gly Leu Arg Phe Val His Leu Ser Phe Val Tyr
305 310 315 320
Pro Asn Asp Tyr Thr Arg Leu Ser His Met Glu Thr His Asn Lys Cys
325 330 335
Phe Tyr Gln Glu Asn Ala Tyr Tyr Gln Asp Arg Phe Ser Phe Gln Glu
340 345 350
Tyr Ile Lys Ile Asp Gln Pro Glu Lys Gln Gly Leu Glu Gln Pro Gly
355 360 365
Phe Glu Glu Asn Leu Leu Glu Glu Ser Gln Tyr Gly Glu Val Ala Glu
370 375 380
Glu Thr Pro Ala Ser Asn Asn Gln Asn Ala Arg Met Leu Glu Gly Arg
385 390 395 400
Gln Thr Pro Ala Ser Thr Leu Glu Gln Asp Ala Thr Asp Tyr Arg Leu
405 410 415
Arg Ser Leu Arg Lys Leu Leu Ala Gln Pro Arg Glu Gly Leu Leu Ala
420 425 430
Pro Phe Ser Lys Arg Asn Ser Thr Ala Ser Phe Pro Gly Arg Thr Ser
435 440 445
His Ile Pro Val Gln Gln Pro Glu Lys Arg Lys Gln Lys Pro Ser Pro
450 455 460
Glu Pro Ser Gln Asp Ser Pro His Ser Asp Lys Trp Pro Pro Gly His
465 470 475 480
Pro Val Lys Asn Leu Pro Gln Met Arg Gly Pro Arg Pro Arg Pro Ala
485 490 495
Gly Asp Ser Pro Arg Lys Thr Gln Trp Leu Asn Gln Val Glu Ser Tyr
500 505 510
Ile Ala Glu Gln Arg Arg Gly Asp Arg Met Arg Pro Gln Ala Pro Gly
515 520 525
Arg Gly Trp His Gly Glu Glu Glu Val Val Ala Ala Ala Gly Gln Glu
530 535 540
Gly Gln Val Glu Gly Glu Glu Glu Gly Glu Glu Glu Glu Glu Glu Glu
545 550 555 560
Asp Met Ser Glu Val Phe Glu Tyr Val Pro Val Phe Asp Pro Val Val
565 570 575
Asn Trp Asp Gln Thr Phe Ser Ala Arg Asn Leu Asp Phe Gln Ala Leu
580 585 590
Arg Thr Asp Trp Ile Asp Leu Ser Cys Asn Thr Ser Gly Asn Leu Leu
595 600 605
Leu Pro Glu Gln Glu Ala Leu Glu Val Thr Arg Val Phe Leu Lys Lys
610 615 620
Leu Asn Gln Arg Ser Arg Gly Arg Tyr Gln Leu Gln Arg Ile Val Asn
625 630 635 640
Val Glu Lys Arg Gln Asp Gln Leu Arg Gly Gly Arg Tyr Leu Leu Glu
645 650 655
Leu Glu Leu Leu Glu Gln Gly Gln Arg Val Val Arg Leu Ser Glu Tyr
660 665 670
Val Ser Ala Arg Gly Trp Gln Gly Ile Asp Pro Ala Gly Gly Glu Glu
675 680 685
Val Glu Ala Arg Asn Leu Gln Gly Leu Val Trp Asp Pro His Asn Arg
690 695 700
Arg Arg Gln Val Leu Asn Thr Arg Ala Gln Glu Pro Lys Leu Cys Trp
705 710 715 720
Pro Gln Gly Phe Ser Trp Ser His Arg Ala Val Val His Phe Val Val
725 730 735
Pro Val Lys Asn Gln Ala Arg Trp Val Gln Gln Phe Ile Lys Asp Met
740 745 750
Glu Asn Leu Phe Gln Val Thr Gly Asp Pro His Phe Asn Ile Val Ile
755 760 765
Thr Asp Tyr Ser Ser Glu Asp Met Asp Val Glu Met Ala Leu Lys Arg
770 775 780
Ser Lys Leu Arg Ser Tyr Gln Tyr Val Lys Leu Ser Gly Asn Phe Glu
785 790 795 800
Arg Ser Ala Gly Leu Gln Ala Gly Ile Asp Leu Val Lys Asp Pro His
805 810 815
Ser Ile Ile Phe Leu Cys Asp Leu His Ile His Phe Pro Ala Gly Val
820 825 830
Ile Asp Ala Ile Arg Lys His Cys Val Glu Gly Lys Met Ala Phe Ala
835 840 845
Pro Met Val Met Arg Leu His Cys Gly Ala Thr Pro Gln Trp Pro Glu
850 855 860
Gly Tyr Trp Glu Val Asn Gly Phe Gly Leu Leu Gly Ile Tyr Lys Ser
865 870 875 880
Asp Leu Asp Arg Ile Gly Gly Met Asn Thr Lys Glu Phe Arg Asp Arg
885 890 895
Trp Gly Gly Glu Asp Trp Glu Leu Leu Asp Arg Ile Leu Gln Gly Leu
900 905 910
Asp Val Glu Arg Leu Ser Leu Arg Asn Phe Phe His His Phe His Ser
915 920 925
Lys Arg Gly Met Trp Ser Arg Arg Gln Met Lys Thr Leu
930 935 940
<210> 25
<211> 389
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 25
Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu Tyr Asn Ala Thr Gln
1 5 10 15
Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala Asn Trp Pro Lys Lys
20 25 30
Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu Tyr Ser Ile Lys Asn
35 40 45
Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser Val Val His Pro Pro
50 55 60
Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp Lys Asn Met Thr Ile
65 70 75 80
Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr Pro Leu Leu Ile Thr
85 90 95
Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr Thr Glu Asp Gly Val
100 105 110
Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu Cys Asp Ser Met Pro
115 120 125
Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr Glu Leu Glu Leu Glu
130 135 140
Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp Gly Gly Arg Tyr Ser
145 150 155 160
Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr
165 170 175
Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu Asn His Met His Pro
180 185 190
Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile Phe Ile Val Glu Gln
195 200 205
Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu Met Asn Val Gly Phe
210 215 220
Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp Gln Cys Phe Val Phe
225 230 235 240
His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg Asn Leu Tyr Ser Cys
245 250 255
Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile Asp Lys Leu His Phe
260 265 270
Lys Leu Pro Tyr Glu Asp Ile Phe Gly Gly Val Ser Ala Met Thr Leu
275 280 285
Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn Lys Tyr Trp Gly Phe
290 295 300
Gly Gly Glu Asp Asp Asp Met Ser Tyr Arg Leu Lys Lys Ile Asn Tyr
305 310 315 320
His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg Tyr Ala Met Leu Asp
325 330 335
His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr Gln Leu Leu Ser Gln
340 345 350
Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser Thr Leu Glu Tyr Glu
355 360 365
Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr His Ile Leu Val Asn
370 375 380
Ile Asp Glu Arg Ser
385
<210> 26
<211> 389
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 26
Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu Tyr Asn Ala Thr Gln
1 5 10 15
Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala Asn Trp Pro Lys Lys
20 25 30
Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu Tyr Ser Ile Lys Asn
35 40 45
Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser Val Val His Pro Pro
50 55 60
Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp Lys Asn Met Thr Ile
65 70 75 80
Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr Pro Leu Leu Ile Thr
85 90 95
Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr Thr Glu Asp Gly Val
100 105 110
Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu Cys Asp Ser Met Pro
115 120 125
Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr Glu Leu Glu Leu Glu
130 135 140
Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp Gly Gly Arg Tyr Ser
145 150 155 160
Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr
165 170 175
Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu Asn His Met His Pro
180 185 190
Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile Phe Ile Val Glu Gln
195 200 205
Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu Met Asn Val Gly Phe
210 215 220
Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp Gln Cys Phe Val Phe
225 230 235 240
His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg Asn Leu Tyr Ser Cys
245 250 255
Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile Asp Lys Leu His Phe
260 265 270
Lys Leu Pro Tyr Glu Asp Ile Phe Gly Gly Val Ser Ala Met Thr Leu
275 280 285
Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn Lys Tyr Trp Gly His
290 295 300
Gly Gly Glu Asp Asp Asp Met Ser Tyr Arg Leu Lys Lys Ile Asn Tyr
305 310 315 320
His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg Tyr Ala Met Leu Asp
325 330 335
His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr Gln Leu Leu Ser Gln
340 345 350
Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser Thr Leu Glu Tyr Glu
355 360 365
Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr His Ile Leu Val Asn
370 375 380
Ile Asp Glu Arg Ser
385
<210> 27
<211> 389
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 27
Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu Tyr Asn Ala Thr Gln
1 5 10 15
Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala Asn Trp Pro Lys Lys
20 25 30
Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu Tyr Ser Ile Lys Asn
35 40 45
Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser Val Val His Pro Pro
50 55 60
Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp Lys Asn Met Thr Ile
65 70 75 80
Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr Pro Leu Leu Ile Thr
85 90 95
Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr Thr Glu Asp Gly Val
100 105 110
Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu Cys Asp Ser Met Pro
115 120 125
Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr Glu Leu Glu Leu Glu
130 135 140
Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp Gly Gly Arg Tyr Ser
145 150 155 160
Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr
165 170 175
Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu Asn His Met His Pro
180 185 190
Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile Phe Ile Val Glu Gln
195 200 205
Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu Met Asn Val Gly Phe
210 215 220
Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp Gln Cys Phe Val Phe
225 230 235 240
His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg Asn Leu Tyr Ser Cys
245 250 255
Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile Asp Lys Leu His Phe
260 265 270
Lys Leu Pro Tyr Glu Asp Ile Phe Gly Gly Val Ser Ala Met Thr Leu
275 280 285
Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn Lys Tyr Trp Gly Val
290 295 300
Gly Gly Glu Asp Asp Asp Met Ser Tyr Arg Leu Lys Lys Ile Asn Tyr
305 310 315 320
His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg Tyr Ala Met Leu Asp
325 330 335
His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr Gln Leu Leu Ser Gln
340 345 350
Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser Thr Leu Glu Tyr Glu
355 360 365
Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr His Ile Leu Val Asn
370 375 380
Ile Asp Glu Arg Ser
385
<210> 28
<211> 389
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 28
Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu Tyr Asn Ala Thr Gln
1 5 10 15
Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala Asn Trp Pro Lys Lys
20 25 30
Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu Tyr Ser Ile Lys Asn
35 40 45
Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser Val Val His Pro Pro
50 55 60
Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp Lys Asn Met Thr Ile
65 70 75 80
Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr Pro Leu Leu Ile Thr
85 90 95
Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr Thr Glu Asp Gly Val
100 105 110
Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu Cys Asp Ser Met Pro
115 120 125
Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr Glu Leu Glu Leu Glu
130 135 140
Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp Gly Gly Arg Tyr Ser
145 150 155 160
Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr
165 170 175
Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu Asn His Met His Pro
180 185 190
Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile Phe Ile Val Glu Gln
195 200 205
Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu Met Asn Val Gly Phe
210 215 220
Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp Gln Cys Phe Val Phe
225 230 235 240
His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg Asn Leu Tyr Ser Cys
245 250 255
Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile Asp Lys Leu His Phe
260 265 270
Lys Leu Pro Tyr Glu Asp Ile Phe Gly Gly Val Ser Ala Met Thr Leu
275 280 285
Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn Lys Tyr Trp Gly Trp
290 295 300
Gly Gly Ala Asp Asp Asp Met Ser Tyr Arg Leu Lys Lys Ile Asn Tyr
305 310 315 320
His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg Tyr Ala Met Leu Asp
325 330 335
His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr Gln Leu Leu Ser Gln
340 345 350
Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser Thr Leu Glu Tyr Glu
355 360 365
Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr His Ile Leu Val Asn
370 375 380
Ile Asp Glu Arg Ser
385
<210> 29
<211> 389
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 29
Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu Tyr Asn Ala Thr Gln
1 5 10 15
Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala Asn Trp Pro Lys Lys
20 25 30
Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu Tyr Ser Ile Lys Asn
35 40 45
Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser Val Val His Pro Pro
50 55 60
Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp Lys Asn Met Thr Ile
65 70 75 80
Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr Pro Leu Leu Ile Thr
85 90 95
Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr Thr Glu Asp Gly Val
100 105 110
Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu Cys Asp Ser Met Pro
115 120 125
Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr Glu Leu Glu Leu Glu
130 135 140
Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp Gly Gly Arg Tyr Ser
145 150 155 160
Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr
165 170 175
Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu Asn His Met His Pro
180 185 190
Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile Phe Ile Val Glu Gln
195 200 205
Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu Met Asn Val Gly Phe
210 215 220
Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp Gln Cys Phe Val Phe
225 230 235 240
His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg Asn Leu Tyr Ser Cys
245 250 255
Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile Asp Lys Leu His Phe
260 265 270
Lys Leu Pro Tyr Glu Asp Ile Phe Gly Gly Val Ser Ala Met Thr Leu
275 280 285
Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn Lys Tyr Trp Gly Trp
290 295 300
Gly Gly Gly Asp Asp Asp Met Ser Tyr Arg Leu Lys Lys Ile Asn Tyr
305 310 315 320
His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg Tyr Ala Met Leu Asp
325 330 335
His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr Gln Leu Leu Ser Gln
340 345 350
Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser Thr Leu Glu Tyr Glu
355 360 365
Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr His Ile Leu Val Asn
370 375 380
Ile Asp Glu Arg Ser
385
<210> 30
<211> 389
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 30
Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu Tyr Asn Ala Thr Gln
1 5 10 15
Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala Asn Trp Pro Lys Lys
20 25 30
Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu Tyr Ser Ile Lys Asn
35 40 45
Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser Val Val His Pro Pro
50 55 60
Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp Lys Asn Met Thr Ile
65 70 75 80
Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr Pro Leu Leu Ile Thr
85 90 95
Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr Thr Glu Asp Gly Val
100 105 110
Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu Cys Asp Ser Met Pro
115 120 125
Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr Glu Leu Glu Leu Glu
130 135 140
Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp Gly Gly Arg Tyr Ser
145 150 155 160
Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr
165 170 175
Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu Asn His Met His Pro
180 185 190
Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile Phe Ile Val Glu Gln
195 200 205
Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu Met Asn Val Gly Phe
210 215 220
Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp Gln Cys Phe Val Phe
225 230 235 240
His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg Asn Leu Tyr Ser Cys
245 250 255
Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile Asp Lys Leu His Phe
260 265 270
Lys Leu Pro Tyr Glu Asp Ile Phe Gly Gly Val Ser Ala Met Thr Leu
275 280 285
Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn Lys Tyr Trp Gly Trp
290 295 300
Gly Gly Asp Asp Asp Asp Met Ser Tyr Arg Leu Lys Lys Ile Asn Tyr
305 310 315 320
His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg Tyr Ala Met Leu Asp
325 330 335
His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr Gln Leu Leu Ser Gln
340 345 350
Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser Thr Leu Glu Tyr Glu
355 360 365
Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr His Ile Leu Val Asn
370 375 380
Ile Asp Glu Arg Ser
385
<210> 31
<211> 389
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 31
Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu Tyr Asn Ala Thr Gln
1 5 10 15
Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala Asn Trp Pro Lys Lys
20 25 30
Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu Tyr Ser Ile Lys Asn
35 40 45
Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser Val Val His Pro Pro
50 55 60
Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp Lys Asn Met Thr Ile
65 70 75 80
Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr Pro Leu Leu Ile Thr
85 90 95
Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr Thr Glu Asp Gly Val
100 105 110
Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu Cys Asp Ser Met Pro
115 120 125
Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr Glu Leu Glu Leu Glu
130 135 140
Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp Gly Gly Arg Tyr Ser
145 150 155 160
Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr
165 170 175
Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu Asn His Met His Pro
180 185 190
Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile Phe Ile Val Glu Gln
195 200 205
Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu Met Asn Val Gly Phe
210 215 220
Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp Gln Cys Phe Val Phe
225 230 235 240
His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg Asn Leu Tyr Ser Cys
245 250 255
Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile Asp Lys Leu His Phe
260 265 270
Lys Leu Pro Tyr Glu Asp Ile Phe Gly Gly Val Ser Ala Met Thr Leu
275 280 285
Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn Lys Tyr Trp Gly Trp
290 295 300
Gly Gly Ser Asp Asp Asp Met Ser Tyr Arg Leu Lys Lys Ile Asn Tyr
305 310 315 320
His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg Tyr Ala Met Leu Asp
325 330 335
His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr Gln Leu Leu Ser Gln
340 345 350
Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser Thr Leu Glu Tyr Glu
355 360 365
Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr His Ile Leu Val Asn
370 375 380
Ile Asp Glu Arg Ser
385
<210> 32
<211> 389
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 32
Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu Tyr Asn Ala Thr Gln
1 5 10 15
Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala Asn Trp Pro Lys Lys
20 25 30
Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu Tyr Ser Ile Lys Asn
35 40 45
Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser Val Val His Pro Pro
50 55 60
Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp Lys Asn Met Thr Ile
65 70 75 80
Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr Pro Leu Leu Ile Thr
85 90 95
Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr Thr Glu Asp Gly Val
100 105 110
Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu Cys Asp Ser Met Pro
115 120 125
Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr Glu Leu Glu Leu Glu
130 135 140
Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp Gly Gly Arg Tyr Ser
145 150 155 160
Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr
165 170 175
Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu Asn His Met His Pro
180 185 190
Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile Phe Ile Val Glu Gln
195 200 205
Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu Met Asn Val Gly Phe
210 215 220
Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp Gln Cys Phe Val Phe
225 230 235 240
His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg Asn Leu Tyr Ser Cys
245 250 255
Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile Asp Lys Leu His Phe
260 265 270
Lys Leu Pro Tyr Glu Asp Ile Phe Gly Gly Val Ser Ala Met Thr Leu
275 280 285
Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn Lys Tyr Trp Gly His
290 295 300
Gly Gly Ala Asp Asp Asp Met Ser Tyr Arg Leu Lys Lys Ile Asn Tyr
305 310 315 320
His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg Tyr Ala Met Leu Asp
325 330 335
His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr Gln Leu Leu Ser Gln
340 345 350
Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser Thr Leu Glu Tyr Glu
355 360 365
Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr His Ile Leu Val Asn
370 375 380
Ile Asp Glu Arg Ser
385
<210> 33
<211> 389
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 33
Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu Tyr Asn Ala Thr Gln
1 5 10 15
Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala Asn Trp Pro Lys Lys
20 25 30
Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu Tyr Ser Ile Lys Asn
35 40 45
Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser Val Val His Pro Pro
50 55 60
Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp Lys Asn Met Thr Ile
65 70 75 80
Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr Pro Leu Leu Ile Thr
85 90 95
Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr Thr Glu Asp Gly Val
100 105 110
Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu Cys Asp Ser Met Pro
115 120 125
Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr Glu Leu Glu Leu Glu
130 135 140
Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp Gly Gly Arg Tyr Ser
145 150 155 160
Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr
165 170 175
Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu Asn His Met His Pro
180 185 190
Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile Phe Ile Val Glu Gln
195 200 205
Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu Met Asn Val Gly Phe
210 215 220
Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp Gln Cys Phe Val Phe
225 230 235 240
His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg Asn Leu Tyr Ser Cys
245 250 255
Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile Asp Lys Leu His Phe
260 265 270
Lys Leu Pro Tyr Glu Asp Ile Phe Gly Gly Val Ser Ala Met Thr Leu
275 280 285
Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn Lys Tyr Trp Gly His
290 295 300
Gly Gly Asp Asp Asp Asp Met Ser Tyr Arg Leu Lys Lys Ile Asn Tyr
305 310 315 320
His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg Tyr Ala Met Leu Asp
325 330 335
His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr Gln Leu Leu Ser Gln
340 345 350
Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser Thr Leu Glu Tyr Glu
355 360 365
Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr His Ile Leu Val Asn
370 375 380
Ile Asp Glu Arg Ser
385
<210> 34
<211> 389
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 34
Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu Tyr Asn Ala Thr Gln
1 5 10 15
Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala Asn Trp Pro Lys Lys
20 25 30
Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu Tyr Ser Ile Lys Asn
35 40 45
Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser Val Val His Pro Pro
50 55 60
Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp Lys Asn Met Thr Ile
65 70 75 80
Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr Pro Leu Leu Ile Thr
85 90 95
Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr Thr Glu Asp Gly Val
100 105 110
Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu Cys Asp Ser Met Pro
115 120 125
Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr Glu Leu Glu Leu Glu
130 135 140
Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp Gly Gly Arg Tyr Ser
145 150 155 160
Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr
165 170 175
Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu Asn His Met His Pro
180 185 190
Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile Phe Ile Val Glu Gln
195 200 205
Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu Met Asn Val Gly Phe
210 215 220
Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp Gln Cys Phe Val Phe
225 230 235 240
His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg Asn Leu Tyr Ser Cys
245 250 255
Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile Asp Lys Leu His Phe
260 265 270
Lys Leu Pro Tyr Glu Asp Ile Phe Gly Gly Val Ser Ala Met Thr Leu
275 280 285
Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn Lys Tyr Trp Gly His
290 295 300
Gly Gly Ser Asp Asp Asp Met Ser Tyr Arg Leu Lys Lys Ile Asn Tyr
305 310 315 320
His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg Tyr Ala Met Leu Asp
325 330 335
His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr Gln Leu Leu Ser Gln
340 345 350
Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser Thr Leu Glu Tyr Glu
355 360 365
Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr His Ile Leu Val Asn
370 375 380
Ile Asp Glu Arg Ser
385
<210> 35
<211> 389
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 35
Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu Tyr Asn Ala Thr Gln
1 5 10 15
Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala Asn Trp Pro Lys Lys
20 25 30
Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu Tyr Ser Ile Lys Asn
35 40 45
Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser Val Val His Pro Pro
50 55 60
Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp Lys Asn Met Thr Ile
65 70 75 80
Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr Pro Leu Leu Ile Thr
85 90 95
Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr Thr Glu Asp Gly Val
100 105 110
Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu Cys Asp Ser Met Pro
115 120 125
Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr Glu Leu Glu Leu Glu
130 135 140
Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp Gly Gly Arg Tyr Ser
145 150 155 160
Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr
165 170 175
Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu Asn His Met His Pro
180 185 190
Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile Phe Ile Val Glu Gln
195 200 205
Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu Met Asn Val Gly Phe
210 215 220
Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp Gln Cys Phe Val Phe
225 230 235 240
His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg Asn Leu Tyr Ser Cys
245 250 255
Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile Asp Lys Leu His Phe
260 265 270
Lys Leu Pro Tyr Glu Asp Tyr Phe Gly Gly Val Ser Ala Met Thr Leu
275 280 285
Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn Lys Tyr Trp Gly Trp
290 295 300
Gly Gly Glu Asp Asp Asp Met Ser Tyr Arg Leu Lys Lys Ile Asn Tyr
305 310 315 320
His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg Tyr Ala Met Leu Asp
325 330 335
His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr Gln Leu Leu Ser Gln
340 345 350
Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser Thr Leu Glu Tyr Glu
355 360 365
Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr His Ile Leu Val Asn
370 375 380
Ile Asp Glu Arg Ser
385
<210> 36
<211> 389
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 36
Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu Tyr Asn Ala Thr Gln
1 5 10 15
Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala Asn Trp Pro Lys Lys
20 25 30
Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu Tyr Ser Ile Lys Asn
35 40 45
Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser Val Val His Pro Pro
50 55 60
Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp Lys Asn Met Thr Ile
65 70 75 80
Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr Pro Leu Leu Ile Thr
85 90 95
Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr Thr Glu Asp Gly Val
100 105 110
Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu Cys Asp Ser Met Pro
115 120 125
Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr Glu Leu Glu Leu Glu
130 135 140
Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp Gly Gly Arg Tyr Ser
145 150 155 160
Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr
165 170 175
Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu Asn His Met His Pro
180 185 190
Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile Phe Ile Val Glu Gln
195 200 205
Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu Met Asn Val Gly Phe
210 215 220
Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp Gln Cys Phe Val Phe
225 230 235 240
His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg Asn Leu Tyr Ser Cys
245 250 255
Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile Asp Lys Leu His Phe
260 265 270
Lys Leu Pro Tyr Glu Asp Tyr Phe Gly Gly Val Ser Ala Met Thr Leu
275 280 285
Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn Lys Tyr Trp Gly Phe
290 295 300
Gly Gly Glu Asp Asp Asp Met Ser Tyr Arg Leu Lys Lys Ile Asn Tyr
305 310 315 320
His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg Tyr Ala Met Leu Asp
325 330 335
His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr Gln Leu Leu Ser Gln
340 345 350
Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser Thr Leu Glu Tyr Glu
355 360 365
Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr His Ile Leu Val Asn
370 375 380
Ile Asp Glu Arg Ser
385
<210> 37
<211> 389
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 37
Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu Tyr Asn Ala Thr Gln
1 5 10 15
Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala Asn Trp Pro Lys Lys
20 25 30
Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu Tyr Ser Ile Lys Asn
35 40 45
Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser Val Val His Pro Pro
50 55 60
Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp Lys Asn Met Thr Ile
65 70 75 80
Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr Pro Leu Leu Ile Thr
85 90 95
Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr Thr Glu Asp Gly Val
100 105 110
Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu Cys Asp Ser Met Pro
115 120 125
Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr Glu Leu Glu Leu Glu
130 135 140
Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp Gly Gly Arg Tyr Ser
145 150 155 160
Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr
165 170 175
Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu Asn His Met His Pro
180 185 190
Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile Phe Ile Val Glu Gln
195 200 205
Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu Met Asn Val Gly Phe
210 215 220
Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp Gln Cys Phe Val Phe
225 230 235 240
His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg Asn Leu Tyr Ser Cys
245 250 255
Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile Asp Lys Leu His Phe
260 265 270
Lys Leu Pro Tyr Glu Asp Tyr Phe Gly Gly Val Ser Ala Met Thr Leu
275 280 285
Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn Lys Tyr Trp Gly His
290 295 300
Gly Gly Glu Asp Asp Asp Met Ser Tyr Arg Leu Lys Lys Ile Asn Tyr
305 310 315 320
His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg Tyr Ala Met Leu Asp
325 330 335
His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr Gln Leu Leu Ser Gln
340 345 350
Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser Thr Leu Glu Tyr Glu
355 360 365
Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr His Ile Leu Val Asn
370 375 380
Ile Asp Glu Arg Ser
385
<210> 38
<211> 389
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 38
Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu Tyr Asn Ala Thr Gln
1 5 10 15
Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala Asn Trp Pro Lys Lys
20 25 30
Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu Tyr Ser Ile Lys Asn
35 40 45
Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser Val Val His Pro Pro
50 55 60
Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp Lys Asn Met Thr Ile
65 70 75 80
Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr Pro Leu Leu Ile Thr
85 90 95
Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr Thr Glu Asp Gly Val
100 105 110
Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu Cys Asp Ser Met Pro
115 120 125
Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr Glu Leu Glu Leu Glu
130 135 140
Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp Gly Gly Arg Tyr Ser
145 150 155 160
Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr
165 170 175
Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu Asn His Met His Pro
180 185 190
Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile Phe Ile Val Glu Gln
195 200 205
Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu Met Asn Val Gly Phe
210 215 220
Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp Gln Cys Phe Val Phe
225 230 235 240
His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg Asn Leu Tyr Ser Cys
245 250 255
Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile Asp Lys Leu His Phe
260 265 270
Lys Leu Pro Tyr Glu Asp Tyr Phe Gly Gly Val Ser Ala Met Thr Leu
275 280 285
Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn Lys Tyr Trp Gly Val
290 295 300
Gly Gly Glu Asp Asp Asp Met Ser Tyr Arg Leu Lys Lys Ile Asn Tyr
305 310 315 320
His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg Tyr Ala Met Leu Asp
325 330 335
His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr Gln Leu Leu Ser Gln
340 345 350
Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser Thr Leu Glu Tyr Glu
355 360 365
Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr His Ile Leu Val Asn
370 375 380
Ile Asp Glu Arg Ser
385
<210> 39
<211> 389
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 39
Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu Tyr Asn Ala Thr Gln
1 5 10 15
Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala Asn Trp Pro Lys Lys
20 25 30
Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu Tyr Ser Ile Lys Asn
35 40 45
Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser Val Val His Pro Pro
50 55 60
Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp Lys Asn Met Thr Ile
65 70 75 80
Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr Pro Leu Leu Ile Thr
85 90 95
Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr Thr Glu Asp Gly Val
100 105 110
Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu Cys Asp Ser Met Pro
115 120 125
Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr Glu Leu Glu Leu Glu
130 135 140
Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp Gly Gly Arg Tyr Ser
145 150 155 160
Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr
165 170 175
Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu Asn His Met His Pro
180 185 190
Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile Phe Ile Val Glu Gln
195 200 205
Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu Met Asn Val Gly Phe
210 215 220
Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp Gln Cys Phe Val Phe
225 230 235 240
His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg Asn Leu Tyr Ser Cys
245 250 255
Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile Asp Lys Leu His Phe
260 265 270
Lys Leu Pro Tyr Glu Asp Tyr Phe Gly Gly Val Ser Ala Met Thr Leu
275 280 285
Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn Lys Tyr Trp Gly Trp
290 295 300
Gly Gly Ala Asp Asp Asp Met Ser Tyr Arg Leu Lys Lys Ile Asn Tyr
305 310 315 320
His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg Tyr Ala Met Leu Asp
325 330 335
His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr Gln Leu Leu Ser Gln
340 345 350
Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser Thr Leu Glu Tyr Glu
355 360 365
Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr His Ile Leu Val Asn
370 375 380
Ile Asp Glu Arg Ser
385
<210> 40
<211> 389
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 40
Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu Tyr Asn Ala Thr Gln
1 5 10 15
Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala Asn Trp Pro Lys Lys
20 25 30
Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu Tyr Ser Ile Lys Asn
35 40 45
Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser Val Val His Pro Pro
50 55 60
Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp Lys Asn Met Thr Ile
65 70 75 80
Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr Pro Leu Leu Ile Thr
85 90 95
Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr Thr Glu Asp Gly Val
100 105 110
Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu Cys Asp Ser Met Pro
115 120 125
Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr Glu Leu Glu Leu Glu
130 135 140
Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp Gly Gly Arg Tyr Ser
145 150 155 160
Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr
165 170 175
Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu Asn His Met His Pro
180 185 190
Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile Phe Ile Val Glu Gln
195 200 205
Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu Met Asn Val Gly Phe
210 215 220
Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp Gln Cys Phe Val Phe
225 230 235 240
His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg Asn Leu Tyr Ser Cys
245 250 255
Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile Asp Lys Leu His Phe
260 265 270
Lys Leu Pro Tyr Glu Asp Tyr Phe Gly Gly Val Ser Ala Met Thr Leu
275 280 285
Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn Lys Tyr Trp Gly Trp
290 295 300
Gly Gly Gly Asp Asp Asp Met Ser Tyr Arg Leu Lys Lys Ile Asn Tyr
305 310 315 320
His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg Tyr Ala Met Leu Asp
325 330 335
His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr Gln Leu Leu Ser Gln
340 345 350
Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser Thr Leu Glu Tyr Glu
355 360 365
Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr His Ile Leu Val Asn
370 375 380
Ile Asp Glu Arg Ser
385
<210> 41
<211> 389
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 41
Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu Tyr Asn Ala Thr Gln
1 5 10 15
Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala Asn Trp Pro Lys Lys
20 25 30
Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu Tyr Ser Ile Lys Asn
35 40 45
Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser Val Val His Pro Pro
50 55 60
Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp Lys Asn Met Thr Ile
65 70 75 80
Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr Pro Leu Leu Ile Thr
85 90 95
Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr Thr Glu Asp Gly Val
100 105 110
Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu Cys Asp Ser Met Pro
115 120 125
Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr Glu Leu Glu Leu Glu
130 135 140
Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp Gly Gly Arg Tyr Ser
145 150 155 160
Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr
165 170 175
Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu Asn His Met His Pro
180 185 190
Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile Phe Ile Val Glu Gln
195 200 205
Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu Met Asn Val Gly Phe
210 215 220
Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp Gln Cys Phe Val Phe
225 230 235 240
His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg Asn Leu Tyr Ser Cys
245 250 255
Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile Asp Lys Leu His Phe
260 265 270
Lys Leu Pro Tyr Glu Asp Tyr Phe Gly Gly Val Ser Ala Met Thr Leu
275 280 285
Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn Lys Tyr Trp Gly Trp
290 295 300
Gly Gly Asp Asp Asp Asp Met Ser Tyr Arg Leu Lys Lys Ile Asn Tyr
305 310 315 320
His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg Tyr Ala Met Leu Asp
325 330 335
His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr Gln Leu Leu Ser Gln
340 345 350
Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser Thr Leu Glu Tyr Glu
355 360 365
Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr His Ile Leu Val Asn
370 375 380
Ile Asp Glu Arg Ser
385
<210> 42
<211> 389
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 42
Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu Tyr Asn Ala Thr Gln
1 5 10 15
Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala Asn Trp Pro Lys Lys
20 25 30
Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu Tyr Ser Ile Lys Asn
35 40 45
Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser Val Val His Pro Pro
50 55 60
Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp Lys Asn Met Thr Ile
65 70 75 80
Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr Pro Leu Leu Ile Thr
85 90 95
Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr Thr Glu Asp Gly Val
100 105 110
Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu Cys Asp Ser Met Pro
115 120 125
Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr Glu Leu Glu Leu Glu
130 135 140
Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp Gly Gly Arg Tyr Ser
145 150 155 160
Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr
165 170 175
Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu Asn His Met His Pro
180 185 190
Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile Phe Ile Val Glu Gln
195 200 205
Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu Met Asn Val Gly Phe
210 215 220
Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp Gln Cys Phe Val Phe
225 230 235 240
His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg Asn Leu Tyr Ser Cys
245 250 255
Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile Asp Lys Leu His Phe
260 265 270
Lys Leu Pro Tyr Glu Asp Tyr Phe Gly Gly Val Ser Ala Met Thr Leu
275 280 285
Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn Lys Tyr Trp Gly Trp
290 295 300
Gly Gly Ser Asp Asp Asp Met Ser Tyr Arg Leu Lys Lys Ile Asn Tyr
305 310 315 320
His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg Tyr Ala Met Leu Asp
325 330 335
His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr Gln Leu Leu Ser Gln
340 345 350
Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser Thr Leu Glu Tyr Glu
355 360 365
Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr His Ile Leu Val Asn
370 375 380
Ile Asp Glu Arg Ser
385
<210> 43
<211> 389
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 43
Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu Tyr Asn Ala Thr Gln
1 5 10 15
Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala Asn Trp Pro Lys Lys
20 25 30
Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu Tyr Ser Ile Lys Asn
35 40 45
Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser Val Val His Pro Pro
50 55 60
Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp Lys Asn Met Thr Ile
65 70 75 80
Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr Pro Leu Leu Ile Thr
85 90 95
Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr Thr Glu Asp Gly Val
100 105 110
Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu Cys Asp Ser Met Pro
115 120 125
Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr Glu Leu Glu Leu Glu
130 135 140
Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp Gly Gly Arg Tyr Ser
145 150 155 160
Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr
165 170 175
Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu Asn His Met His Pro
180 185 190
Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile Phe Ile Val Glu Gln
195 200 205
Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu Met Asn Val Gly Phe
210 215 220
Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp Gln Cys Phe Val Phe
225 230 235 240
His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg Asn Leu Tyr Ser Cys
245 250 255
Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile Asp Lys Leu His Phe
260 265 270
Lys Leu Pro Tyr Glu Asp Tyr Phe Gly Gly Val Ser Ala Met Thr Leu
275 280 285
Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn Lys Tyr Trp Gly His
290 295 300
Gly Gly Ala Asp Asp Asp Met Ser Tyr Arg Leu Lys Lys Ile Asn Tyr
305 310 315 320
His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg Tyr Ala Met Leu Asp
325 330 335
His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr Gln Leu Leu Ser Gln
340 345 350
Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser Thr Leu Glu Tyr Glu
355 360 365
Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr His Ile Leu Val Asn
370 375 380
Ile Asp Glu Arg Ser
385
<210> 44
<211> 389
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 44
Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu Tyr Asn Ala Thr Gln
1 5 10 15
Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala Asn Trp Pro Lys Lys
20 25 30
Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu Tyr Ser Ile Lys Asn
35 40 45
Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser Val Val His Pro Pro
50 55 60
Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp Lys Asn Met Thr Ile
65 70 75 80
Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr Pro Leu Leu Ile Thr
85 90 95
Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr Thr Glu Asp Gly Val
100 105 110
Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu Cys Asp Ser Met Pro
115 120 125
Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr Glu Leu Glu Leu Glu
130 135 140
Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp Gly Gly Arg Tyr Ser
145 150 155 160
Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr
165 170 175
Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu Asn His Met His Pro
180 185 190
Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile Phe Ile Val Glu Gln
195 200 205
Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu Met Asn Val Gly Phe
210 215 220
Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp Gln Cys Phe Val Phe
225 230 235 240
His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg Asn Leu Tyr Ser Cys
245 250 255
Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile Asp Lys Leu His Phe
260 265 270
Lys Leu Pro Tyr Glu Asp Tyr Phe Gly Gly Val Ser Ala Met Thr Leu
275 280 285
Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn Lys Tyr Trp Gly His
290 295 300
Gly Gly Asp Asp Asp Asp Met Ser Tyr Arg Leu Lys Lys Ile Asn Tyr
305 310 315 320
His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg Tyr Ala Met Leu Asp
325 330 335
His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr Gln Leu Leu Ser Gln
340 345 350
Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser Thr Leu Glu Tyr Glu
355 360 365
Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr His Ile Leu Val Asn
370 375 380
Ile Asp Glu Arg Ser
385
<210> 45
<211> 389
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 45
Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu Tyr Asn Ala Thr Gln
1 5 10 15
Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala Asn Trp Pro Lys Lys
20 25 30
Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu Tyr Ser Ile Lys Asn
35 40 45
Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser Val Val His Pro Pro
50 55 60
Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp Lys Asn Met Thr Ile
65 70 75 80
Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr Pro Leu Leu Ile Thr
85 90 95
Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr Thr Glu Asp Gly Val
100 105 110
Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu Cys Asp Ser Met Pro
115 120 125
Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr Glu Leu Glu Leu Glu
130 135 140
Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp Gly Gly Arg Tyr Ser
145 150 155 160
Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr
165 170 175
Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu Asn His Met His Pro
180 185 190
Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile Phe Ile Val Glu Gln
195 200 205
Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu Met Asn Val Gly Phe
210 215 220
Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp Gln Cys Phe Val Phe
225 230 235 240
His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg Asn Leu Tyr Ser Cys
245 250 255
Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile Asp Lys Leu His Phe
260 265 270
Lys Leu Pro Tyr Glu Asp Tyr Phe Gly Gly Val Ser Ala Met Thr Leu
275 280 285
Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn Lys Tyr Trp Gly His
290 295 300
Gly Gly Ser Asp Asp Asp Met Ser Tyr Arg Leu Lys Lys Ile Asn Tyr
305 310 315 320
His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg Tyr Ala Met Leu Asp
325 330 335
His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr Gln Leu Leu Ser Gln
340 345 350
Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser Thr Leu Glu Tyr Glu
355 360 365
Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr His Ile Leu Val Asn
370 375 380
Ile Asp Glu Arg Ser
385
<210> 46
<211> 354
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 46
Asp Tyr Ser Phe Trp Ser Pro Ala Phe Ile Ile Ser Ala Pro Lys Thr
1 5 10 15
Leu Thr Thr Leu Gln Pro Phe Ser Gln Ser Thr Ser Thr Asn Asp Leu
20 25 30
Ala Val Ser Ala Leu Glu Ser Val Glu Phe Ser Met Leu Asp Asn Ser
35 40 45
Ser Ile Leu His Ala Ser Asp Asn Trp Thr Asn Asp Glu Leu Val Met
50 55 60
Arg Ala Gln Asn Glu Asn Leu Gln Leu Cys Pro Met Thr Pro Pro Ala
65 70 75 80
Leu Val Gly Pro Ile Lys Val Trp Met Asp Ala Pro Ser Phe Ala Glu
85 90 95
Leu Glu Arg Leu Tyr Pro Phe Leu Glu Pro Gly Gly His Gly Met Pro
100 105 110
Thr Ala Cys Arg Ala Arg His Arg Val Ala Ile Val Val Pro Tyr Arg
115 120 125
Asp Arg Glu Ser His Leu Arg Thr Phe Leu His Asn Leu His Ser Leu
130 135 140
Leu Thr Lys Gln Gln Leu Asp Tyr Ala Ile Phe Val Val Glu Gln Thr
145 150 155 160
Ala Asn Glu Thr Phe Asn Arg Ala Lys Leu Met Asn Val Gly Tyr Ala
165 170 175
Glu Ala Ile Arg Leu Tyr Asp Trp Arg Cys Phe Ile Phe His Asp Val
180 185 190
Asp Leu Leu Pro Glu Asp Asp Arg Asn Leu Tyr Ser Cys Pro Asp Glu
195 200 205
Pro Arg His Met Ser Val Ala Val Asp Lys Phe Asn Tyr Lys Leu Pro
210 215 220
Tyr Gly Ser Ile Phe Gly Gly Ile Ser Ala Leu Thr Arg Glu Gln Phe
225 230 235 240
Glu Gly Ile Asn Gly Phe Ser Asn Asp Tyr Trp Gly His Gly Gly Glu
245 250 255
Asp Asp Asp Leu Ser Thr Arg Val Thr Leu Ala Gly Tyr Lys Ile Ser
260 265 270
Arg Tyr Pro Ala Glu Ile Ala Arg Tyr Lys Met Ile Lys His Asn Ser
275 280 285
Glu Lys Lys Asn Pro Val Asn Arg Cys Arg Tyr Lys Leu Met Ser Ala
290 295 300
Thr Lys Ser Arg Trp Arg Asn Asp Gly Leu Ser Ser Leu Ser Tyr Asp
305 310 315 320
Leu Ile Ser Leu Gly Arg Leu Pro Leu Tyr Thr His Ile Lys Val Asp
325 330 335
Leu Leu Glu Lys Gln Ser Arg Arg Tyr Leu Arg Thr His Gly Phe Pro
340 345 350
Thr Cys
<210> 47
<211> 354
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 47
Asp Tyr Ser Phe Trp Ser Pro Ala Phe Ile Ile Ser Ala Pro Lys Thr
1 5 10 15
Leu Thr Thr Leu Gln Pro Phe Ser Gln Ser Thr Ser Thr Asn Asp Leu
20 25 30
Ala Val Ser Ala Leu Glu Ser Val Glu Phe Ser Met Leu Asp Asn Ser
35 40 45
Ser Ile Leu His Ala Ser Asp Asn Trp Thr Asn Asp Glu Leu Val Met
50 55 60
Arg Ala Gln Asn Glu Asn Leu Gln Leu Cys Pro Met Thr Pro Pro Ala
65 70 75 80
Leu Val Gly Pro Ile Lys Val Trp Met Asp Ala Pro Ser Phe Ala Glu
85 90 95
Leu Glu Arg Leu Tyr Pro Phe Leu Glu Pro Gly Gly His Gly Met Pro
100 105 110
Thr Ala Cys Arg Ala Arg His Arg Val Ala Ile Val Val Pro Tyr Arg
115 120 125
Asp Arg Glu Ser His Leu Arg Thr Phe Leu His Asn Leu His Ser Leu
130 135 140
Leu Thr Lys Gln Gln Leu Asp Tyr Ala Ile Phe Val Val Glu Gln Thr
145 150 155 160
Ala Asn Glu Thr Phe Asn Arg Ala Lys Leu Met Asn Val Gly Tyr Ala
165 170 175
Glu Ala Ile Arg Leu Tyr Asp Trp Arg Cys Phe Ile Phe His Asp Val
180 185 190
Asp Leu Leu Pro Glu Asp Asp Arg Asn Leu Tyr Ser Cys Pro Asp Glu
195 200 205
Pro Arg His Met Ser Val Ala Val Asp Lys Phe Asn Tyr Lys Leu Pro
210 215 220
Tyr Gly Ser Ile Phe Gly Gly Ile Ser Ala Leu Thr Arg Glu Gln Phe
225 230 235 240
Glu Gly Ile Asn Gly Phe Ser Asn Asp Tyr Trp Gly Trp Gly Gly Asp
245 250 255
Asp Asp Asp Leu Ser Thr Arg Val Thr Leu Ala Gly Tyr Lys Ile Ser
260 265 270
Arg Tyr Pro Ala Glu Ile Ala Arg Tyr Lys Met Ile Lys His Asn Ser
275 280 285
Glu Lys Lys Asn Pro Val Asn Arg Cys Arg Tyr Lys Leu Met Ser Ala
290 295 300
Thr Lys Ser Arg Trp Arg Asn Asp Gly Leu Ser Ser Leu Ser Tyr Asp
305 310 315 320
Leu Ile Ser Leu Gly Arg Leu Pro Leu Tyr Thr His Ile Lys Val Asp
325 330 335
Leu Leu Glu Lys Gln Ser Arg Arg Tyr Leu Arg Thr His Gly Phe Pro
340 345 350
Thr Cys
<210> 48
<211> 354
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 48
Asp Tyr Ser Phe Trp Ser Pro Ala Phe Ile Ile Ser Ala Pro Lys Thr
1 5 10 15
Leu Thr Thr Leu Gln Pro Phe Ser Gln Ser Thr Ser Thr Asn Asp Leu
20 25 30
Ala Val Ser Ala Leu Glu Ser Val Glu Phe Ser Met Leu Asp Asn Ser
35 40 45
Ser Ile Leu His Ala Ser Asp Asn Trp Thr Asn Asp Glu Leu Val Met
50 55 60
Arg Ala Gln Asn Glu Asn Leu Gln Leu Cys Pro Met Thr Pro Pro Ala
65 70 75 80
Leu Val Gly Pro Ile Lys Val Trp Met Asp Ala Pro Ser Phe Ala Glu
85 90 95
Leu Glu Arg Leu Tyr Pro Phe Leu Glu Pro Gly Gly His Gly Met Pro
100 105 110
Thr Ala Cys Arg Ala Arg His Arg Val Ala Ile Val Val Pro Tyr Arg
115 120 125
Asp Arg Glu Ser His Leu Arg Thr Phe Leu His Asn Leu His Ser Leu
130 135 140
Leu Thr Lys Gln Gln Leu Asp Tyr Ala Ile Phe Val Val Glu Gln Thr
145 150 155 160
Ala Asn Glu Thr Phe Asn Arg Ala Lys Leu Met Asn Val Gly Tyr Ala
165 170 175
Glu Ala Ile Arg Leu Tyr Asp Trp Arg Cys Phe Ile Phe His Asp Val
180 185 190
Asp Leu Leu Pro Glu Asp Asp Arg Asn Leu Tyr Ser Cys Pro Asp Glu
195 200 205
Pro Arg His Met Ser Val Ala Val Asp Lys Phe Asn Tyr Lys Leu Pro
210 215 220
Tyr Gly Ser Tyr Phe Gly Gly Ile Ser Ala Leu Thr Arg Glu Gln Phe
225 230 235 240
Glu Gly Ile Asn Gly Phe Ser Asn Asp Tyr Trp Gly Trp Gly Gly Glu
245 250 255
Asp Asp Asp Leu Ser Thr Arg Val Thr Leu Ala Gly Tyr Lys Ile Ser
260 265 270
Arg Tyr Pro Ala Glu Ile Ala Arg Tyr Lys Met Ile Lys His Asn Ser
275 280 285
Glu Lys Lys Asn Pro Val Asn Arg Cys Arg Tyr Lys Leu Met Ser Ala
290 295 300
Thr Lys Ser Arg Trp Arg Asn Asp Gly Leu Ser Ser Leu Ser Tyr Asp
305 310 315 320
Leu Ile Ser Leu Gly Arg Leu Pro Leu Tyr Thr His Ile Lys Val Asp
325 330 335
Leu Leu Glu Lys Gln Ser Arg Arg Tyr Leu Arg Thr His Gly Phe Pro
340 345 350
Thr Cys
<210> 49
<211> 410
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 49
Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro
1 5 10 15
Arg Gly Ser His Met Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu
20 25 30
Tyr Asn Ala Thr Gln Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala
35 40 45
Asn Trp Pro Lys Lys Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu
50 55 60
Tyr Ser Ile Lys Asn Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser
65 70 75 80
Val Val His Pro Pro Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp
85 90 95
Lys Asn Met Thr Ile Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr
100 105 110
Pro Leu Leu Ile Thr Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr
115 120 125
Thr Glu Asp Gly Val Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu
130 135 140
Cys Asp Ser Met Pro Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr
145 150 155 160
Glu Leu Glu Leu Glu Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp
165 170 175
Gly Gly Arg Tyr Ser Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala
180 185 190
Ile Ile Val Pro Tyr Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu
195 200 205
Asn His Met His Pro Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile
210 215 220
Phe Ile Val Glu Gln Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu
225 230 235 240
Met Asn Val Gly Phe Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp
245 250 255
Gln Cys Phe Val Phe His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg
260 265 270
Asn Leu Tyr Ser Cys Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile
275 280 285
Asp Lys Leu His Phe Lys Leu Pro Tyr Glu Asp Ile Phe Gly Gly Val
290 295 300
Ser Ala Met Thr Leu Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn
305 310 315 320
Lys Tyr Trp Gly Trp Gly Gly Glu Asp Asp Asp Met Ser Tyr Arg Leu
325 330 335
Lys Lys Ile Asn Tyr His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg
340 345 350
Tyr Ala Met Leu Asp His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr
355 360 365
Gln Leu Leu Ser Gln Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser
370 375 380
Thr Leu Glu Tyr Glu Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr
385 390 395 400
His Ile Leu Val Asn Ile Asp Glu Arg Ser
405 410
<210> 50
<211> 410
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 50
Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro
1 5 10 15
Arg Gly Ser His Met Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu
20 25 30
Tyr Asn Ala Thr Gln Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala
35 40 45
Asn Trp Pro Lys Lys Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu
50 55 60
Tyr Ser Ile Lys Asn Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser
65 70 75 80
Val Val His Pro Pro Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp
85 90 95
Lys Asn Met Thr Ile Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr
100 105 110
Pro Leu Leu Ile Thr Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr
115 120 125
Thr Glu Asp Gly Val Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu
130 135 140
Cys Asp Ser Met Pro Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr
145 150 155 160
Glu Leu Glu Leu Glu Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp
165 170 175
Gly Gly Arg Tyr Ser Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala
180 185 190
Ile Ile Val Pro Tyr Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu
195 200 205
Asn His Met His Pro Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile
210 215 220
Phe Ile Val Glu Gln Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu
225 230 235 240
Met Asn Val Gly Phe Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp
245 250 255
Gln Cys Phe Val Phe His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg
260 265 270
Asn Leu Tyr Ser Cys Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile
275 280 285
Asp Lys Leu His Phe Lys Leu Pro Tyr Glu Asp Ile Phe Gly Gly Val
290 295 300
Ser Ala Met Thr Leu Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn
305 310 315 320
Lys Tyr Trp Gly Phe Gly Gly Glu Asp Asp Asp Met Ser Tyr Arg Leu
325 330 335
Lys Lys Ile Asn Tyr His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg
340 345 350
Tyr Ala Met Leu Asp His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr
355 360 365
Gln Leu Leu Ser Gln Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser
370 375 380
Thr Leu Glu Tyr Glu Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr
385 390 395 400
His Ile Leu Val Asn Ile Asp Glu Arg Ser
405 410
<210> 51
<211> 410
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 51
Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro
1 5 10 15
Arg Gly Ser His Met Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu
20 25 30
Tyr Asn Ala Thr Gln Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala
35 40 45
Asn Trp Pro Lys Lys Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu
50 55 60
Tyr Ser Ile Lys Asn Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser
65 70 75 80
Val Val His Pro Pro Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp
85 90 95
Lys Asn Met Thr Ile Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr
100 105 110
Pro Leu Leu Ile Thr Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr
115 120 125
Thr Glu Asp Gly Val Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu
130 135 140
Cys Asp Ser Met Pro Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr
145 150 155 160
Glu Leu Glu Leu Glu Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp
165 170 175
Gly Gly Arg Tyr Ser Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala
180 185 190
Ile Ile Val Pro Tyr Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu
195 200 205
Asn His Met His Pro Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile
210 215 220
Phe Ile Val Glu Gln Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu
225 230 235 240
Met Asn Val Gly Phe Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp
245 250 255
Gln Cys Phe Val Phe His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg
260 265 270
Asn Leu Tyr Ser Cys Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile
275 280 285
Asp Lys Leu His Phe Lys Leu Pro Tyr Glu Asp Ile Phe Gly Gly Val
290 295 300
Ser Ala Met Thr Leu Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn
305 310 315 320
Lys Tyr Trp Gly His Gly Gly Glu Asp Asp Asp Met Ser Tyr Arg Leu
325 330 335
Lys Lys Ile Asn Tyr His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg
340 345 350
Tyr Ala Met Leu Asp His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr
355 360 365
Gln Leu Leu Ser Gln Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser
370 375 380
Thr Leu Glu Tyr Glu Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr
385 390 395 400
His Ile Leu Val Asn Ile Asp Glu Arg Ser
405 410
<210> 52
<211> 410
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 52
Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro
1 5 10 15
Arg Gly Ser His Met Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu
20 25 30
Tyr Asn Ala Thr Gln Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala
35 40 45
Asn Trp Pro Lys Lys Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu
50 55 60
Tyr Ser Ile Lys Asn Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser
65 70 75 80
Val Val His Pro Pro Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp
85 90 95
Lys Asn Met Thr Ile Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr
100 105 110
Pro Leu Leu Ile Thr Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr
115 120 125
Thr Glu Asp Gly Val Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu
130 135 140
Cys Asp Ser Met Pro Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr
145 150 155 160
Glu Leu Glu Leu Glu Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp
165 170 175
Gly Gly Arg Tyr Ser Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala
180 185 190
Ile Ile Val Pro Tyr Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu
195 200 205
Asn His Met His Pro Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile
210 215 220
Phe Ile Val Glu Gln Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu
225 230 235 240
Met Asn Val Gly Phe Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp
245 250 255
Gln Cys Phe Val Phe His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg
260 265 270
Asn Leu Tyr Ser Cys Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile
275 280 285
Asp Lys Leu His Phe Lys Leu Pro Tyr Glu Asp Ile Phe Gly Gly Val
290 295 300
Ser Ala Met Thr Leu Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn
305 310 315 320
Lys Tyr Trp Gly Val Gly Gly Glu Asp Asp Asp Met Ser Tyr Arg Leu
325 330 335
Lys Lys Ile Asn Tyr His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg
340 345 350
Tyr Ala Met Leu Asp His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr
355 360 365
Gln Leu Leu Ser Gln Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser
370 375 380
Thr Leu Glu Tyr Glu Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr
385 390 395 400
His Ile Leu Val Asn Ile Asp Glu Arg Ser
405 410
<210> 53
<211> 410
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 53
Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro
1 5 10 15
Arg Gly Ser His Met Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu
20 25 30
Tyr Asn Ala Thr Gln Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala
35 40 45
Asn Trp Pro Lys Lys Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu
50 55 60
Tyr Ser Ile Lys Asn Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser
65 70 75 80
Val Val His Pro Pro Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp
85 90 95
Lys Asn Met Thr Ile Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr
100 105 110
Pro Leu Leu Ile Thr Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr
115 120 125
Thr Glu Asp Gly Val Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu
130 135 140
Cys Asp Ser Met Pro Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr
145 150 155 160
Glu Leu Glu Leu Glu Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp
165 170 175
Gly Gly Arg Tyr Ser Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala
180 185 190
Ile Ile Val Pro Tyr Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu
195 200 205
Asn His Met His Pro Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile
210 215 220
Phe Ile Val Glu Gln Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu
225 230 235 240
Met Asn Val Gly Phe Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp
245 250 255
Gln Cys Phe Val Phe His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg
260 265 270
Asn Leu Tyr Ser Cys Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile
275 280 285
Asp Lys Leu His Phe Lys Leu Pro Tyr Glu Asp Ile Phe Gly Gly Val
290 295 300
Ser Ala Met Thr Leu Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn
305 310 315 320
Lys Tyr Trp Gly Trp Gly Gly Ala Asp Asp Asp Met Ser Tyr Arg Leu
325 330 335
Lys Lys Ile Asn Tyr His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg
340 345 350
Tyr Ala Met Leu Asp His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr
355 360 365
Gln Leu Leu Ser Gln Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser
370 375 380
Thr Leu Glu Tyr Glu Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr
385 390 395 400
His Ile Leu Val Asn Ile Asp Glu Arg Ser
405 410
<210> 54
<211> 410
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 54
Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro
1 5 10 15
Arg Gly Ser His Met Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu
20 25 30
Tyr Asn Ala Thr Gln Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala
35 40 45
Asn Trp Pro Lys Lys Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu
50 55 60
Tyr Ser Ile Lys Asn Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser
65 70 75 80
Val Val His Pro Pro Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp
85 90 95
Lys Asn Met Thr Ile Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr
100 105 110
Pro Leu Leu Ile Thr Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr
115 120 125
Thr Glu Asp Gly Val Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu
130 135 140
Cys Asp Ser Met Pro Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr
145 150 155 160
Glu Leu Glu Leu Glu Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp
165 170 175
Gly Gly Arg Tyr Ser Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala
180 185 190
Ile Ile Val Pro Tyr Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu
195 200 205
Asn His Met His Pro Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile
210 215 220
Phe Ile Val Glu Gln Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu
225 230 235 240
Met Asn Val Gly Phe Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp
245 250 255
Gln Cys Phe Val Phe His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg
260 265 270
Asn Leu Tyr Ser Cys Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile
275 280 285
Asp Lys Leu His Phe Lys Leu Pro Tyr Glu Asp Ile Phe Gly Gly Val
290 295 300
Ser Ala Met Thr Leu Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn
305 310 315 320
Lys Tyr Trp Gly Trp Gly Gly Gly Asp Asp Asp Met Ser Tyr Arg Leu
325 330 335
Lys Lys Ile Asn Tyr His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg
340 345 350
Tyr Ala Met Leu Asp His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr
355 360 365
Gln Leu Leu Ser Gln Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser
370 375 380
Thr Leu Glu Tyr Glu Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr
385 390 395 400
His Ile Leu Val Asn Ile Asp Glu Arg Ser
405 410
<210> 55
<211> 410
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 55
Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro
1 5 10 15
Arg Gly Ser His Met Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu
20 25 30
Tyr Asn Ala Thr Gln Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala
35 40 45
Asn Trp Pro Lys Lys Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu
50 55 60
Tyr Ser Ile Lys Asn Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser
65 70 75 80
Val Val His Pro Pro Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp
85 90 95
Lys Asn Met Thr Ile Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr
100 105 110
Pro Leu Leu Ile Thr Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr
115 120 125
Thr Glu Asp Gly Val Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu
130 135 140
Cys Asp Ser Met Pro Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr
145 150 155 160
Glu Leu Glu Leu Glu Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp
165 170 175
Gly Gly Arg Tyr Ser Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala
180 185 190
Ile Ile Val Pro Tyr Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu
195 200 205
Asn His Met His Pro Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile
210 215 220
Phe Ile Val Glu Gln Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu
225 230 235 240
Met Asn Val Gly Phe Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp
245 250 255
Gln Cys Phe Val Phe His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg
260 265 270
Asn Leu Tyr Ser Cys Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile
275 280 285
Asp Lys Leu His Phe Lys Leu Pro Tyr Glu Asp Ile Phe Gly Gly Val
290 295 300
Ser Ala Met Thr Leu Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn
305 310 315 320
Lys Tyr Trp Gly Trp Gly Gly Asp Asp Asp Asp Met Ser Tyr Arg Leu
325 330 335
Lys Lys Ile Asn Tyr His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg
340 345 350
Tyr Ala Met Leu Asp His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr
355 360 365
Gln Leu Leu Ser Gln Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser
370 375 380
Thr Leu Glu Tyr Glu Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr
385 390 395 400
His Ile Leu Val Asn Ile Asp Glu Arg Ser
405 410
<210> 56
<211> 410
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 56
Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro
1 5 10 15
Arg Gly Ser His Met Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu
20 25 30
Tyr Asn Ala Thr Gln Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala
35 40 45
Asn Trp Pro Lys Lys Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu
50 55 60
Tyr Ser Ile Lys Asn Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser
65 70 75 80
Val Val His Pro Pro Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp
85 90 95
Lys Asn Met Thr Ile Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr
100 105 110
Pro Leu Leu Ile Thr Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr
115 120 125
Thr Glu Asp Gly Val Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu
130 135 140
Cys Asp Ser Met Pro Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr
145 150 155 160
Glu Leu Glu Leu Glu Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp
165 170 175
Gly Gly Arg Tyr Ser Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala
180 185 190
Ile Ile Val Pro Tyr Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu
195 200 205
Asn His Met His Pro Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile
210 215 220
Phe Ile Val Glu Gln Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu
225 230 235 240
Met Asn Val Gly Phe Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp
245 250 255
Gln Cys Phe Val Phe His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg
260 265 270
Asn Leu Tyr Ser Cys Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile
275 280 285
Asp Lys Leu His Phe Lys Leu Pro Tyr Glu Asp Ile Phe Gly Gly Val
290 295 300
Ser Ala Met Thr Leu Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn
305 310 315 320
Lys Tyr Trp Gly Trp Gly Gly Ser Asp Asp Asp Met Ser Tyr Arg Leu
325 330 335
Lys Lys Ile Asn Tyr His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg
340 345 350
Tyr Ala Met Leu Asp His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr
355 360 365
Gln Leu Leu Ser Gln Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser
370 375 380
Thr Leu Glu Tyr Glu Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr
385 390 395 400
His Ile Leu Val Asn Ile Asp Glu Arg Ser
405 410
<210> 57
<211> 410
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 57
Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro
1 5 10 15
Arg Gly Ser His Met Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu
20 25 30
Tyr Asn Ala Thr Gln Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala
35 40 45
Asn Trp Pro Lys Lys Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu
50 55 60
Tyr Ser Ile Lys Asn Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser
65 70 75 80
Val Val His Pro Pro Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp
85 90 95
Lys Asn Met Thr Ile Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr
100 105 110
Pro Leu Leu Ile Thr Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr
115 120 125
Thr Glu Asp Gly Val Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu
130 135 140
Cys Asp Ser Met Pro Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr
145 150 155 160
Glu Leu Glu Leu Glu Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp
165 170 175
Gly Gly Arg Tyr Ser Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala
180 185 190
Ile Ile Val Pro Tyr Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu
195 200 205
Asn His Met His Pro Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile
210 215 220
Phe Ile Val Glu Gln Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu
225 230 235 240
Met Asn Val Gly Phe Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp
245 250 255
Gln Cys Phe Val Phe His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg
260 265 270
Asn Leu Tyr Ser Cys Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile
275 280 285
Asp Lys Leu His Phe Lys Leu Pro Tyr Glu Asp Ile Phe Gly Gly Val
290 295 300
Ser Ala Met Thr Leu Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn
305 310 315 320
Lys Tyr Trp Gly His Gly Gly Ala Asp Asp Asp Met Ser Tyr Arg Leu
325 330 335
Lys Lys Ile Asn Tyr His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg
340 345 350
Tyr Ala Met Leu Asp His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr
355 360 365
Gln Leu Leu Ser Gln Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser
370 375 380
Thr Leu Glu Tyr Glu Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr
385 390 395 400
His Ile Leu Val Asn Ile Asp Glu Arg Ser
405 410
<210> 58
<211> 410
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 58
Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro
1 5 10 15
Arg Gly Ser His Met Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu
20 25 30
Tyr Asn Ala Thr Gln Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala
35 40 45
Asn Trp Pro Lys Lys Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu
50 55 60
Tyr Ser Ile Lys Asn Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser
65 70 75 80
Val Val His Pro Pro Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp
85 90 95
Lys Asn Met Thr Ile Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr
100 105 110
Pro Leu Leu Ile Thr Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr
115 120 125
Thr Glu Asp Gly Val Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu
130 135 140
Cys Asp Ser Met Pro Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr
145 150 155 160
Glu Leu Glu Leu Glu Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp
165 170 175
Gly Gly Arg Tyr Ser Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala
180 185 190
Ile Ile Val Pro Tyr Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu
195 200 205
Asn His Met His Pro Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile
210 215 220
Phe Ile Val Glu Gln Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu
225 230 235 240
Met Asn Val Gly Phe Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp
245 250 255
Gln Cys Phe Val Phe His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg
260 265 270
Asn Leu Tyr Ser Cys Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile
275 280 285
Asp Lys Leu His Phe Lys Leu Pro Tyr Glu Asp Ile Phe Gly Gly Val
290 295 300
Ser Ala Met Thr Leu Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn
305 310 315 320
Lys Tyr Trp Gly His Gly Gly Asp Asp Asp Asp Met Ser Tyr Arg Leu
325 330 335
Lys Lys Ile Asn Tyr His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg
340 345 350
Tyr Ala Met Leu Asp His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr
355 360 365
Gln Leu Leu Ser Gln Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser
370 375 380
Thr Leu Glu Tyr Glu Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr
385 390 395 400
His Ile Leu Val Asn Ile Asp Glu Arg Ser
405 410
<210> 59
<211> 410
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 59
Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro
1 5 10 15
Arg Gly Ser His Met Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu
20 25 30
Tyr Asn Ala Thr Gln Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala
35 40 45
Asn Trp Pro Lys Lys Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu
50 55 60
Tyr Ser Ile Lys Asn Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser
65 70 75 80
Val Val His Pro Pro Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp
85 90 95
Lys Asn Met Thr Ile Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr
100 105 110
Pro Leu Leu Ile Thr Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr
115 120 125
Thr Glu Asp Gly Val Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu
130 135 140
Cys Asp Ser Met Pro Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr
145 150 155 160
Glu Leu Glu Leu Glu Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp
165 170 175
Gly Gly Arg Tyr Ser Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala
180 185 190
Ile Ile Val Pro Tyr Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu
195 200 205
Asn His Met His Pro Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile
210 215 220
Phe Ile Val Glu Gln Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu
225 230 235 240
Met Asn Val Gly Phe Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp
245 250 255
Gln Cys Phe Val Phe His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg
260 265 270
Asn Leu Tyr Ser Cys Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile
275 280 285
Asp Lys Leu His Phe Lys Leu Pro Tyr Glu Asp Ile Phe Gly Gly Val
290 295 300
Ser Ala Met Thr Leu Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn
305 310 315 320
Lys Tyr Trp Gly His Gly Gly Ser Asp Asp Asp Met Ser Tyr Arg Leu
325 330 335
Lys Lys Ile Asn Tyr His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg
340 345 350
Tyr Ala Met Leu Asp His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr
355 360 365
Gln Leu Leu Ser Gln Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser
370 375 380
Thr Leu Glu Tyr Glu Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr
385 390 395 400
His Ile Leu Val Asn Ile Asp Glu Arg Ser
405 410
<210> 60
<211> 410
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 60
Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro
1 5 10 15
Arg Gly Ser His Met Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu
20 25 30
Tyr Asn Ala Thr Gln Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala
35 40 45
Asn Trp Pro Lys Lys Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu
50 55 60
Tyr Ser Ile Lys Asn Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser
65 70 75 80
Val Val His Pro Pro Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp
85 90 95
Lys Asn Met Thr Ile Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr
100 105 110
Pro Leu Leu Ile Thr Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr
115 120 125
Thr Glu Asp Gly Val Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu
130 135 140
Cys Asp Ser Met Pro Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr
145 150 155 160
Glu Leu Glu Leu Glu Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp
165 170 175
Gly Gly Arg Tyr Ser Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala
180 185 190
Ile Ile Val Pro Tyr Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu
195 200 205
Asn His Met His Pro Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile
210 215 220
Phe Ile Val Glu Gln Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu
225 230 235 240
Met Asn Val Gly Phe Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp
245 250 255
Gln Cys Phe Val Phe His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg
260 265 270
Asn Leu Tyr Ser Cys Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile
275 280 285
Asp Lys Leu His Phe Lys Leu Pro Tyr Glu Asp Tyr Phe Gly Gly Val
290 295 300
Ser Ala Met Thr Leu Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn
305 310 315 320
Lys Tyr Trp Gly Trp Gly Gly Glu Asp Asp Asp Met Ser Tyr Arg Leu
325 330 335
Lys Lys Ile Asn Tyr His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg
340 345 350
Tyr Ala Met Leu Asp His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr
355 360 365
Gln Leu Leu Ser Gln Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser
370 375 380
Thr Leu Glu Tyr Glu Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr
385 390 395 400
His Ile Leu Val Asn Ile Asp Glu Arg Ser
405 410
<210> 61
<211> 410
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 61
Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro
1 5 10 15
Arg Gly Ser His Met Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu
20 25 30
Tyr Asn Ala Thr Gln Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala
35 40 45
Asn Trp Pro Lys Lys Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu
50 55 60
Tyr Ser Ile Lys Asn Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser
65 70 75 80
Val Val His Pro Pro Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp
85 90 95
Lys Asn Met Thr Ile Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr
100 105 110
Pro Leu Leu Ile Thr Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr
115 120 125
Thr Glu Asp Gly Val Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu
130 135 140
Cys Asp Ser Met Pro Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr
145 150 155 160
Glu Leu Glu Leu Glu Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp
165 170 175
Gly Gly Arg Tyr Ser Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala
180 185 190
Ile Ile Val Pro Tyr Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu
195 200 205
Asn His Met His Pro Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile
210 215 220
Phe Ile Val Glu Gln Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu
225 230 235 240
Met Asn Val Gly Phe Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp
245 250 255
Gln Cys Phe Val Phe His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg
260 265 270
Asn Leu Tyr Ser Cys Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile
275 280 285
Asp Lys Leu His Phe Lys Leu Pro Tyr Glu Asp Tyr Phe Gly Gly Val
290 295 300
Ser Ala Met Thr Leu Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn
305 310 315 320
Lys Tyr Trp Gly Phe Gly Gly Glu Asp Asp Asp Met Ser Tyr Arg Leu
325 330 335
Lys Lys Ile Asn Tyr His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg
340 345 350
Tyr Ala Met Leu Asp His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr
355 360 365
Gln Leu Leu Ser Gln Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser
370 375 380
Thr Leu Glu Tyr Glu Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr
385 390 395 400
His Ile Leu Val Asn Ile Asp Glu Arg Ser
405 410
<210> 62
<211> 410
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 62
Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro
1 5 10 15
Arg Gly Ser His Met Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu
20 25 30
Tyr Asn Ala Thr Gln Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala
35 40 45
Asn Trp Pro Lys Lys Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu
50 55 60
Tyr Ser Ile Lys Asn Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser
65 70 75 80
Val Val His Pro Pro Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp
85 90 95
Lys Asn Met Thr Ile Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr
100 105 110
Pro Leu Leu Ile Thr Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr
115 120 125
Thr Glu Asp Gly Val Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu
130 135 140
Cys Asp Ser Met Pro Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr
145 150 155 160
Glu Leu Glu Leu Glu Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp
165 170 175
Gly Gly Arg Tyr Ser Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala
180 185 190
Ile Ile Val Pro Tyr Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu
195 200 205
Asn His Met His Pro Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile
210 215 220
Phe Ile Val Glu Gln Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu
225 230 235 240
Met Asn Val Gly Phe Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp
245 250 255
Gln Cys Phe Val Phe His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg
260 265 270
Asn Leu Tyr Ser Cys Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile
275 280 285
Asp Lys Leu His Phe Lys Leu Pro Tyr Glu Asp Tyr Phe Gly Gly Val
290 295 300
Ser Ala Met Thr Leu Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn
305 310 315 320
Lys Tyr Trp Gly His Gly Gly Glu Asp Asp Asp Met Ser Tyr Arg Leu
325 330 335
Lys Lys Ile Asn Tyr His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg
340 345 350
Tyr Ala Met Leu Asp His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr
355 360 365
Gln Leu Leu Ser Gln Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser
370 375 380
Thr Leu Glu Tyr Glu Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr
385 390 395 400
His Ile Leu Val Asn Ile Asp Glu Arg Ser
405 410
<210> 63
<211> 409
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 63
Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro Arg
1 5 10 15
Gly Ser His Met Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu Tyr
20 25 30
Asn Ala Thr Gln Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala Asn
35 40 45
Trp Pro Lys Lys Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu Tyr
50 55 60
Ser Ile Lys Asn Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser Val
65 70 75 80
Val His Pro Pro Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp Lys
85 90 95
Asn Met Thr Ile Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr Pro
100 105 110
Leu Leu Ile Thr Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr Thr
115 120 125
Glu Asp Gly Val Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu Cys
130 135 140
Asp Ser Met Pro Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr Glu
145 150 155 160
Leu Glu Leu Glu Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp Gly
165 170 175
Gly Arg Tyr Ser Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala Ile
180 185 190
Ile Val Pro Tyr Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu Asn
195 200 205
His Met His Pro Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile Phe
210 215 220
Ile Val Glu Gln Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu Met
225 230 235 240
Asn Val Gly Phe Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp Gln
245 250 255
Cys Phe Val Phe His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg Asn
260 265 270
Leu Tyr Ser Cys Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile Asp
275 280 285
Lys Leu His Phe Lys Leu Pro Tyr Glu Asp Tyr Phe Gly Gly Val Ser
290 295 300
Ala Met Thr Leu Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn Lys
305 310 315 320
Tyr Trp Gly Val Gly Gly Glu Asp Asp Asp Met Ser Tyr Arg Leu Lys
325 330 335
Lys Ile Asn Tyr His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg Tyr
340 345 350
Ala Met Leu Asp His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr Gln
355 360 365
Leu Leu Ser Gln Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser Thr
370 375 380
Leu Glu Tyr Glu Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr His
385 390 395 400
Ile Leu Val Asn Ile Asp Glu Arg Ser
405
<210> 64
<211> 410
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 64
Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro
1 5 10 15
Arg Gly Ser His Met Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu
20 25 30
Tyr Asn Ala Thr Gln Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala
35 40 45
Asn Trp Pro Lys Lys Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu
50 55 60
Tyr Ser Ile Lys Asn Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser
65 70 75 80
Val Val His Pro Pro Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp
85 90 95
Lys Asn Met Thr Ile Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr
100 105 110
Pro Leu Leu Ile Thr Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr
115 120 125
Thr Glu Asp Gly Val Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu
130 135 140
Cys Asp Ser Met Pro Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr
145 150 155 160
Glu Leu Glu Leu Glu Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp
165 170 175
Gly Gly Arg Tyr Ser Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala
180 185 190
Ile Ile Val Pro Tyr Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu
195 200 205
Asn His Met His Pro Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile
210 215 220
Phe Ile Val Glu Gln Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu
225 230 235 240
Met Asn Val Gly Phe Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp
245 250 255
Gln Cys Phe Val Phe His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg
260 265 270
Asn Leu Tyr Ser Cys Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile
275 280 285
Asp Lys Leu His Phe Lys Leu Pro Tyr Glu Asp Tyr Phe Gly Gly Val
290 295 300
Ser Ala Met Thr Leu Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn
305 310 315 320
Lys Tyr Trp Gly Trp Gly Gly Ala Asp Asp Asp Met Ser Tyr Arg Leu
325 330 335
Lys Lys Ile Asn Tyr His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg
340 345 350
Tyr Ala Met Leu Asp His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr
355 360 365
Gln Leu Leu Ser Gln Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser
370 375 380
Thr Leu Glu Tyr Glu Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr
385 390 395 400
His Ile Leu Val Asn Ile Asp Glu Arg Ser
405 410
<210> 65
<211> 410
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 65
Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro
1 5 10 15
Arg Gly Ser His Met Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu
20 25 30
Tyr Asn Ala Thr Gln Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala
35 40 45
Asn Trp Pro Lys Lys Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu
50 55 60
Tyr Ser Ile Lys Asn Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser
65 70 75 80
Val Val His Pro Pro Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp
85 90 95
Lys Asn Met Thr Ile Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr
100 105 110
Pro Leu Leu Ile Thr Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr
115 120 125
Thr Glu Asp Gly Val Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu
130 135 140
Cys Asp Ser Met Pro Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr
145 150 155 160
Glu Leu Glu Leu Glu Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp
165 170 175
Gly Gly Arg Tyr Ser Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala
180 185 190
Ile Ile Val Pro Tyr Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu
195 200 205
Asn His Met His Pro Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile
210 215 220
Phe Ile Val Glu Gln Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu
225 230 235 240
Met Asn Val Gly Phe Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp
245 250 255
Gln Cys Phe Val Phe His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg
260 265 270
Asn Leu Tyr Ser Cys Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile
275 280 285
Asp Lys Leu His Phe Lys Leu Pro Tyr Glu Asp Tyr Phe Gly Gly Val
290 295 300
Ser Ala Met Thr Leu Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn
305 310 315 320
Lys Tyr Trp Gly Trp Gly Gly Gly Asp Asp Asp Met Ser Tyr Arg Leu
325 330 335
Lys Lys Ile Asn Tyr His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg
340 345 350
Tyr Ala Met Leu Asp His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr
355 360 365
Gln Leu Leu Ser Gln Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser
370 375 380
Thr Leu Glu Tyr Glu Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr
385 390 395 400
His Ile Leu Val Asn Ile Asp Glu Arg Ser
405 410
<210> 66
<211> 410
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 66
Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro
1 5 10 15
Arg Gly Ser His Met Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu
20 25 30
Tyr Asn Ala Thr Gln Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala
35 40 45
Asn Trp Pro Lys Lys Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu
50 55 60
Tyr Ser Ile Lys Asn Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser
65 70 75 80
Val Val His Pro Pro Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp
85 90 95
Lys Asn Met Thr Ile Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr
100 105 110
Pro Leu Leu Ile Thr Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr
115 120 125
Thr Glu Asp Gly Val Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu
130 135 140
Cys Asp Ser Met Pro Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr
145 150 155 160
Glu Leu Glu Leu Glu Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp
165 170 175
Gly Gly Arg Tyr Ser Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala
180 185 190
Ile Ile Val Pro Tyr Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu
195 200 205
Asn His Met His Pro Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile
210 215 220
Phe Ile Val Glu Gln Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu
225 230 235 240
Met Asn Val Gly Phe Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp
245 250 255
Gln Cys Phe Val Phe His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg
260 265 270
Asn Leu Tyr Ser Cys Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile
275 280 285
Asp Lys Leu His Phe Lys Leu Pro Tyr Glu Asp Tyr Phe Gly Gly Val
290 295 300
Ser Ala Met Thr Leu Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn
305 310 315 320
Lys Tyr Trp Gly Trp Gly Gly Asp Asp Asp Asp Met Ser Tyr Arg Leu
325 330 335
Lys Lys Ile Asn Tyr His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg
340 345 350
Tyr Ala Met Leu Asp His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr
355 360 365
Gln Leu Leu Ser Gln Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser
370 375 380
Thr Leu Glu Tyr Glu Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr
385 390 395 400
His Ile Leu Val Asn Ile Asp Glu Arg Ser
405 410
<210> 67
<211> 410
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 67
Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro
1 5 10 15
Arg Gly Ser His Met Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu
20 25 30
Tyr Asn Ala Thr Gln Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala
35 40 45
Asn Trp Pro Lys Lys Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu
50 55 60
Tyr Ser Ile Lys Asn Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser
65 70 75 80
Val Val His Pro Pro Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp
85 90 95
Lys Asn Met Thr Ile Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr
100 105 110
Pro Leu Leu Ile Thr Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr
115 120 125
Thr Glu Asp Gly Val Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu
130 135 140
Cys Asp Ser Met Pro Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr
145 150 155 160
Glu Leu Glu Leu Glu Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp
165 170 175
Gly Gly Arg Tyr Ser Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala
180 185 190
Ile Ile Val Pro Tyr Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu
195 200 205
Asn His Met His Pro Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile
210 215 220
Phe Ile Val Glu Gln Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu
225 230 235 240
Met Asn Val Gly Phe Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp
245 250 255
Gln Cys Phe Val Phe His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg
260 265 270
Asn Leu Tyr Ser Cys Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile
275 280 285
Asp Lys Leu His Phe Lys Leu Pro Tyr Glu Asp Tyr Phe Gly Gly Val
290 295 300
Ser Ala Met Thr Leu Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn
305 310 315 320
Lys Tyr Trp Gly Trp Gly Gly Ser Asp Asp Asp Met Ser Tyr Arg Leu
325 330 335
Lys Lys Ile Asn Tyr His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg
340 345 350
Tyr Ala Met Leu Asp His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr
355 360 365
Gln Leu Leu Ser Gln Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser
370 375 380
Thr Leu Glu Tyr Glu Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr
385 390 395 400
His Ile Leu Val Asn Ile Asp Glu Arg Ser
405 410
<210> 68
<211> 410
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 68
Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro
1 5 10 15
Arg Gly Ser His Met Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu
20 25 30
Tyr Asn Ala Thr Gln Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala
35 40 45
Asn Trp Pro Lys Lys Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu
50 55 60
Tyr Ser Ile Lys Asn Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser
65 70 75 80
Val Val His Pro Pro Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp
85 90 95
Lys Asn Met Thr Ile Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr
100 105 110
Pro Leu Leu Ile Thr Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr
115 120 125
Thr Glu Asp Gly Val Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu
130 135 140
Cys Asp Ser Met Pro Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr
145 150 155 160
Glu Leu Glu Leu Glu Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp
165 170 175
Gly Gly Arg Tyr Ser Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala
180 185 190
Ile Ile Val Pro Tyr Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu
195 200 205
Asn His Met His Pro Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile
210 215 220
Phe Ile Val Glu Gln Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu
225 230 235 240
Met Asn Val Gly Phe Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp
245 250 255
Gln Cys Phe Val Phe His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg
260 265 270
Asn Leu Tyr Ser Cys Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile
275 280 285
Asp Lys Leu His Phe Lys Leu Pro Tyr Glu Asp Tyr Phe Gly Gly Val
290 295 300
Ser Ala Met Thr Leu Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn
305 310 315 320
Lys Tyr Trp Gly His Gly Gly Ala Asp Asp Asp Met Ser Tyr Arg Leu
325 330 335
Lys Lys Ile Asn Tyr His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg
340 345 350
Tyr Ala Met Leu Asp His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr
355 360 365
Gln Leu Leu Ser Gln Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser
370 375 380
Thr Leu Glu Tyr Glu Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr
385 390 395 400
His Ile Leu Val Asn Ile Asp Glu Arg Ser
405 410
<210> 69
<211> 410
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 69
Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro
1 5 10 15
Arg Gly Ser His Met Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu
20 25 30
Tyr Asn Ala Thr Gln Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala
35 40 45
Asn Trp Pro Lys Lys Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu
50 55 60
Tyr Ser Ile Lys Asn Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser
65 70 75 80
Val Val His Pro Pro Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp
85 90 95
Lys Asn Met Thr Ile Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr
100 105 110
Pro Leu Leu Ile Thr Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr
115 120 125
Thr Glu Asp Gly Val Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu
130 135 140
Cys Asp Ser Met Pro Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr
145 150 155 160
Glu Leu Glu Leu Glu Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp
165 170 175
Gly Gly Arg Tyr Ser Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala
180 185 190
Ile Ile Val Pro Tyr Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu
195 200 205
Asn His Met His Pro Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile
210 215 220
Phe Ile Val Glu Gln Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu
225 230 235 240
Met Asn Val Gly Phe Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp
245 250 255
Gln Cys Phe Val Phe His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg
260 265 270
Asn Leu Tyr Ser Cys Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile
275 280 285
Asp Lys Leu His Phe Lys Leu Pro Tyr Glu Asp Tyr Phe Gly Gly Val
290 295 300
Ser Ala Met Thr Leu Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn
305 310 315 320
Lys Tyr Trp Gly His Gly Gly Asp Asp Asp Asp Met Ser Tyr Arg Leu
325 330 335
Lys Lys Ile Asn Tyr His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg
340 345 350
Tyr Ala Met Leu Asp His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr
355 360 365
Gln Leu Leu Ser Gln Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser
370 375 380
Thr Leu Glu Tyr Glu Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr
385 390 395 400
His Ile Leu Val Asn Ile Asp Glu Arg Ser
405 410
<210> 70
<211> 410
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 70
Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro
1 5 10 15
Arg Gly Ser His Met Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu
20 25 30
Tyr Asn Ala Thr Gln Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala
35 40 45
Asn Trp Pro Lys Lys Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu
50 55 60
Tyr Ser Ile Lys Asn Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser
65 70 75 80
Val Val His Pro Pro Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp
85 90 95
Lys Asn Met Thr Ile Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr
100 105 110
Pro Leu Leu Ile Thr Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr
115 120 125
Thr Glu Asp Gly Val Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu
130 135 140
Cys Asp Ser Met Pro Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr
145 150 155 160
Glu Leu Glu Leu Glu Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp
165 170 175
Gly Gly Arg Tyr Ser Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala
180 185 190
Ile Ile Val Pro Tyr Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu
195 200 205
Asn His Met His Pro Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile
210 215 220
Phe Ile Val Glu Gln Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu
225 230 235 240
Met Asn Val Gly Phe Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp
245 250 255
Gln Cys Phe Val Phe His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg
260 265 270
Asn Leu Tyr Ser Cys Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile
275 280 285
Asp Lys Leu His Phe Lys Leu Pro Tyr Glu Asp Tyr Phe Gly Gly Val
290 295 300
Ser Ala Met Thr Leu Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn
305 310 315 320
Lys Tyr Trp Gly His Gly Gly Ser Asp Asp Asp Met Ser Tyr Arg Leu
325 330 335
Lys Lys Ile Asn Tyr His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg
340 345 350
Tyr Ala Met Leu Asp His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr
355 360 365
Gln Leu Leu Ser Gln Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser
370 375 380
Thr Leu Glu Tyr Glu Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr
385 390 395 400
His Ile Leu Val Asn Ile Asp Glu Arg Ser
405 410
<210> 71
<211> 375
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 71
Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro
1 5 10 15
Arg Gly Ser His Met Asp Tyr Ser Phe Trp Ser Pro Ala Phe Ile Ile
20 25 30
Ser Ala Pro Lys Thr Leu Thr Thr Leu Gln Pro Phe Ser Gln Ser Thr
35 40 45
Ser Thr Asn Asp Leu Ala Val Ser Ala Leu Glu Ser Val Glu Phe Ser
50 55 60
Met Leu Asp Asn Ser Ser Ile Leu His Ala Ser Asp Asn Trp Thr Asn
65 70 75 80
Asp Glu Leu Val Met Arg Ala Gln Asn Glu Asn Leu Gln Leu Cys Pro
85 90 95
Met Thr Pro Pro Ala Leu Val Gly Pro Ile Lys Val Trp Met Asp Ala
100 105 110
Pro Ser Phe Ala Glu Leu Glu Arg Leu Tyr Pro Phe Leu Glu Pro Gly
115 120 125
Gly His Gly Met Pro Thr Ala Cys Arg Ala Arg His Arg Val Ala Ile
130 135 140
Val Val Pro Tyr Arg Asp Arg Glu Ser His Leu Arg Thr Phe Leu His
145 150 155 160
Asn Leu His Ser Leu Leu Thr Lys Gln Gln Leu Asp Tyr Ala Ile Phe
165 170 175
Val Val Glu Gln Thr Ala Asn Glu Thr Phe Asn Arg Ala Lys Leu Met
180 185 190
Asn Val Gly Tyr Ala Glu Ala Ile Arg Leu Tyr Asp Trp Arg Cys Phe
195 200 205
Ile Phe His Asp Val Asp Leu Leu Pro Glu Asp Asp Arg Asn Leu Tyr
210 215 220
Ser Cys Pro Asp Glu Pro Arg His Met Ser Val Ala Val Asp Lys Phe
225 230 235 240
Asn Tyr Lys Leu Pro Tyr Gly Ser Ile Phe Gly Gly Ile Ser Ala Leu
245 250 255
Thr Arg Glu Gln Phe Glu Gly Ile Asn Gly Phe Ser Asn Asp Tyr Trp
260 265 270
Gly Trp Gly Gly Glu Asp Asp Asp Leu Ser Thr Arg Val Thr Leu Ala
275 280 285
Gly Tyr Lys Ile Ser Arg Tyr Pro Ala Glu Ile Ala Arg Tyr Lys Met
290 295 300
Ile Lys His Asn Ser Glu Lys Lys Asn Pro Val Asn Arg Cys Arg Tyr
305 310 315 320
Lys Leu Met Ser Ala Thr Lys Ser Arg Trp Arg Asn Asp Gly Leu Ser
325 330 335
Ser Leu Ser Tyr Asp Leu Ile Ser Leu Gly Arg Leu Pro Leu Tyr Thr
340 345 350
His Ile Lys Val Asp Leu Leu Glu Lys Gln Ser Arg Arg Tyr Leu Arg
355 360 365
Thr His Gly Phe Pro Thr Cys
370 375
<210> 72
<211> 375
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 72
Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro
1 5 10 15
Arg Gly Ser His Met Asp Tyr Ser Phe Trp Ser Pro Ala Phe Ile Ile
20 25 30
Ser Ala Pro Lys Thr Leu Thr Thr Leu Gln Pro Phe Ser Gln Ser Thr
35 40 45
Ser Thr Asn Asp Leu Ala Val Ser Ala Leu Glu Ser Val Glu Phe Ser
50 55 60
Met Leu Asp Asn Ser Ser Ile Leu His Ala Ser Asp Asn Trp Thr Asn
65 70 75 80
Asp Glu Leu Val Met Arg Ala Gln Asn Glu Asn Leu Gln Leu Cys Pro
85 90 95
Met Thr Pro Pro Ala Leu Val Gly Pro Ile Lys Val Trp Met Asp Ala
100 105 110
Pro Ser Phe Ala Glu Leu Glu Arg Leu Tyr Pro Phe Leu Glu Pro Gly
115 120 125
Gly His Gly Met Pro Thr Ala Cys Arg Ala Arg His Arg Val Ala Ile
130 135 140
Val Val Pro Tyr Arg Asp Arg Glu Ser His Leu Arg Thr Phe Leu His
145 150 155 160
Asn Leu His Ser Leu Leu Thr Lys Gln Gln Leu Asp Tyr Ala Ile Phe
165 170 175
Val Val Glu Gln Thr Ala Asn Glu Thr Phe Asn Arg Ala Lys Leu Met
180 185 190
Asn Val Gly Tyr Ala Glu Ala Ile Arg Leu Tyr Asp Trp Arg Cys Phe
195 200 205
Ile Phe His Asp Val Asp Leu Leu Pro Glu Asp Asp Arg Asn Leu Tyr
210 215 220
Ser Cys Pro Asp Glu Pro Arg His Met Ser Val Ala Val Asp Lys Phe
225 230 235 240
Asn Tyr Lys Leu Pro Tyr Gly Ser Ile Phe Gly Gly Ile Ser Ala Leu
245 250 255
Thr Arg Glu Gln Phe Glu Gly Ile Asn Gly Phe Ser Asn Asp Tyr Trp
260 265 270
Gly His Gly Gly Glu Asp Asp Asp Leu Ser Thr Arg Val Thr Leu Ala
275 280 285
Gly Tyr Lys Ile Ser Arg Tyr Pro Ala Glu Ile Ala Arg Tyr Lys Met
290 295 300
Ile Lys His Asn Ser Glu Lys Lys Asn Pro Val Asn Arg Cys Arg Tyr
305 310 315 320
Lys Leu Met Ser Ala Thr Lys Ser Arg Trp Arg Asn Asp Gly Leu Ser
325 330 335
Ser Leu Ser Tyr Asp Leu Ile Ser Leu Gly Arg Leu Pro Leu Tyr Thr
340 345 350
His Ile Lys Val Asp Leu Leu Glu Lys Gln Ser Arg Arg Tyr Leu Arg
355 360 365
Thr His Gly Phe Pro Thr Cys
370 375
<210> 73
<211> 375
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 73
Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro
1 5 10 15
Arg Gly Ser His Met Asp Tyr Ser Phe Trp Ser Pro Ala Phe Ile Ile
20 25 30
Ser Ala Pro Lys Thr Leu Thr Thr Leu Gln Pro Phe Ser Gln Ser Thr
35 40 45
Ser Thr Asn Asp Leu Ala Val Ser Ala Leu Glu Ser Val Glu Phe Ser
50 55 60
Met Leu Asp Asn Ser Ser Ile Leu His Ala Ser Asp Asn Trp Thr Asn
65 70 75 80
Asp Glu Leu Val Met Arg Ala Gln Asn Glu Asn Leu Gln Leu Cys Pro
85 90 95
Met Thr Pro Pro Ala Leu Val Gly Pro Ile Lys Val Trp Met Asp Ala
100 105 110
Pro Ser Phe Ala Glu Leu Glu Arg Leu Tyr Pro Phe Leu Glu Pro Gly
115 120 125
Gly His Gly Met Pro Thr Ala Cys Arg Ala Arg His Arg Val Ala Ile
130 135 140
Val Val Pro Tyr Arg Asp Arg Glu Ser His Leu Arg Thr Phe Leu His
145 150 155 160
Asn Leu His Ser Leu Leu Thr Lys Gln Gln Leu Asp Tyr Ala Ile Phe
165 170 175
Val Val Glu Gln Thr Ala Asn Glu Thr Phe Asn Arg Ala Lys Leu Met
180 185 190
Asn Val Gly Tyr Ala Glu Ala Ile Arg Leu Tyr Asp Trp Arg Cys Phe
195 200 205
Ile Phe His Asp Val Asp Leu Leu Pro Glu Asp Asp Arg Asn Leu Tyr
210 215 220
Ser Cys Pro Asp Glu Pro Arg His Met Ser Val Ala Val Asp Lys Phe
225 230 235 240
Asn Tyr Lys Leu Pro Tyr Gly Ser Ile Phe Gly Gly Ile Ser Ala Leu
245 250 255
Thr Arg Glu Gln Phe Glu Gly Ile Asn Gly Phe Ser Asn Asp Tyr Trp
260 265 270
Gly Trp Gly Gly Asp Asp Asp Asp Leu Ser Thr Arg Val Thr Leu Ala
275 280 285
Gly Tyr Lys Ile Ser Arg Tyr Pro Ala Glu Ile Ala Arg Tyr Lys Met
290 295 300
Ile Lys His Asn Ser Glu Lys Lys Asn Pro Val Asn Arg Cys Arg Tyr
305 310 315 320
Lys Leu Met Ser Ala Thr Lys Ser Arg Trp Arg Asn Asp Gly Leu Ser
325 330 335
Ser Leu Ser Tyr Asp Leu Ile Ser Leu Gly Arg Leu Pro Leu Tyr Thr
340 345 350
His Ile Lys Val Asp Leu Leu Glu Lys Gln Ser Arg Arg Tyr Leu Arg
355 360 365
Thr His Gly Phe Pro Thr Cys
370 375
<210> 74
<211> 375
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 74
Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro
1 5 10 15
Arg Gly Ser His Met Asp Tyr Ser Phe Trp Ser Pro Ala Phe Ile Ile
20 25 30
Ser Ala Pro Lys Thr Leu Thr Thr Leu Gln Pro Phe Ser Gln Ser Thr
35 40 45
Ser Thr Asn Asp Leu Ala Val Ser Ala Leu Glu Ser Val Glu Phe Ser
50 55 60
Met Leu Asp Asn Ser Ser Ile Leu His Ala Ser Asp Asn Trp Thr Asn
65 70 75 80
Asp Glu Leu Val Met Arg Ala Gln Asn Glu Asn Leu Gln Leu Cys Pro
85 90 95
Met Thr Pro Pro Ala Leu Val Gly Pro Ile Lys Val Trp Met Asp Ala
100 105 110
Pro Ser Phe Ala Glu Leu Glu Arg Leu Tyr Pro Phe Leu Glu Pro Gly
115 120 125
Gly His Gly Met Pro Thr Ala Cys Arg Ala Arg His Arg Val Ala Ile
130 135 140
Val Val Pro Tyr Arg Asp Arg Glu Ser His Leu Arg Thr Phe Leu His
145 150 155 160
Asn Leu His Ser Leu Leu Thr Lys Gln Gln Leu Asp Tyr Ala Ile Phe
165 170 175
Val Val Glu Gln Thr Ala Asn Glu Thr Phe Asn Arg Ala Lys Leu Met
180 185 190
Asn Val Gly Tyr Ala Glu Ala Ile Arg Leu Tyr Asp Trp Arg Cys Phe
195 200 205
Ile Phe His Asp Val Asp Leu Leu Pro Glu Asp Asp Arg Asn Leu Tyr
210 215 220
Ser Cys Pro Asp Glu Pro Arg His Met Ser Val Ala Val Asp Lys Phe
225 230 235 240
Asn Tyr Lys Leu Pro Tyr Gly Ser Tyr Phe Gly Gly Ile Ser Ala Leu
245 250 255
Thr Arg Glu Gln Phe Glu Gly Ile Asn Gly Phe Ser Asn Asp Tyr Trp
260 265 270
Gly Trp Gly Gly Glu Asp Asp Asp Leu Ser Thr Arg Val Thr Leu Ala
275 280 285
Gly Tyr Lys Ile Ser Arg Tyr Pro Ala Glu Ile Ala Arg Tyr Lys Met
290 295 300
Ile Lys His Asn Ser Glu Lys Lys Asn Pro Val Asn Arg Cys Arg Tyr
305 310 315 320
Lys Leu Met Ser Ala Thr Lys Ser Arg Trp Arg Asn Asp Gly Leu Ser
325 330 335
Ser Leu Ser Tyr Asp Leu Ile Ser Leu Gly Arg Leu Pro Leu Tyr Thr
340 345 350
His Ile Lys Val Asp Leu Leu Glu Lys Gln Ser Arg Arg Tyr Leu Arg
355 360 365
Thr His Gly Phe Pro Thr Cys
370 375
<210> 75
<211> 1173
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 75
atgtcaccgc tgcgtaccta cctgtatacc ccgctgtata atgccaccca accgaccctg 60
cgtaatgtgg aacgtctggc tgcgaactgg ccgaagaaaa ttccgagcaa ctatatcgaa 120
gattcagaag aatactcgat caaaaacatc agtctgtcca atcataccac gcgtgcgagt 180
gtggttcacc cgccgagctc tatcaccgaa acggcctcca aactggacaa aaatatgacc 240
attcaggatg gcgcgttcgc catgattagc ccgaccccgc tgctgatcac gaaactgatg 300
gacagcatta aatcttatgt caccacggaa gatggcgtga agaaagcgga agctgtcgtt 360
accctgccgc tgtgtgactc catgccgcca gatctgggtc cgattaccct gaacaaaacg 420
gaactggaac tggaatgggt tgagaaaaaa tttccggaag tcgaatgggg cggtcgctat 480
agtccgccga actgtaccgc acgtcatcgc gtggctatta tcgttccgta ccgtgaccgc 540
cagcaacacc tggcaatctt tctgaatcac atgcacccgt tcctgatgaa acagcaaatt 600
gaatacggca tttttatcgt ggaacaggaa ggtaataaag atttcaatcg tgcaaaactg 660
atgaacgttg gctttgtcga atctcagaaa ctggtggctg aaggttggca atgctttgtt 720
ttccatgaca tcgatctgct gccgctggat acccgcaatc tgtatagttg tccgcgccag 780
ccgcgtcaca tgtcagccag catcgacaaa ctgcacttta aactgccgta cgaagatatt 840
ttcggcggtg tctcagccat gaccctggaa caatttacgc gtgttaacgg cttctcgaat 900
aaatattggg gttggggcgg tgaagatgac gatatgagct accgcctgaa gaaaattaac 960
tatcatatcg cccgttacaa aatgagcatt gcgcgctatg ccatgctgga ccacaaaaaa 1020
tctaccccga atccgaaacg ttaccagctg ctgagtcaaa ccagcaaaac gtttcagaaa 1080
gatggtctgt ctacgctgga atatgaactg gtccaagttg tgcagtatca tctgtacacg 1140
catattctgg tgaacattga cgaacgctct tga 1173
<210> 76
<211> 1233
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 76
atgggcagca gccatcatca tcatcatcac agcagcggcc tggtgccgcg cggcagccat 60
atgtcaccgc tgcgtaccta cctgtatacc ccgctgtata atgccaccca accgaccctg 120
cgtaatgtgg aacgtctggc tgcgaactgg ccgaagaaaa ttccgagcaa ctatatcgaa 180
gattcagaag aatactcgat caaaaacatc agtctgtcca atcataccac gcgtgcgagt 240
gtggttcacc cgccgagctc tatcaccgaa acggcctcca aactggacaa aaatatgacc 300
attcaggatg gcgcgttcgc catgattagc ccgaccccgc tgctgatcac gaaactgatg 360
gacagcatta aatcttatgt caccacggaa gatggcgtga agaaagcgga agctgtcgtt 420
accctgccgc tgtgtgactc catgccgcca gatctgggtc cgattaccct gaacaaaacg 480
gaactggaac tggaatgggt tgagaaaaaa tttccggaag tcgaatgggg cggtcgctat 540
agtccgccga actgtaccgc acgtcatcgc gtggctatta tcgttccgta ccgtgaccgc 600
cagcaacacc tggcaatctt tctgaatcac atgcacccgt tcctgatgaa acagcaaatt 660
gaatacggca tttttatcgt ggaacaggaa ggtaataaag atttcaatcg tgcaaaactg 720
atgaacgttg gctttgtcga atctcagaaa ctggtggctg aaggttggca atgctttgtt 780
ttccatgaca tcgatctgct gccgctggat acccgcaatc tgtatagttg tccgcgccag 840
ccgcgtcaca tgtcagccag catcgacaaa ctgcacttta aactgccgta cgaagatatt 900
ttcggcggtg tctcagccat gaccctggaa caatttacgc gtgttaacgg cttctcgaat 960
aaatattggg gttggggcgg tgaagatgac gatatgagct accgcctgaa gaaaattaac 1020
tatcatatcg cccgttacaa aatgagcatt gcgcgctatg ccatgctgga ccacaaaaaa 1080
tctaccccga atccgaaacg ttaccagctg ctgagtcaaa ccagcaaaac gtttcagaaa 1140
gatggtctgt ctacgctgga atatgaactg gtccaagttg tgcagtatca tctgtacacg 1200
catattctgg tgaacattga cgaacgctct tga 1233
<210> 77
<211> 1068
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 77
atggattact cattctggag cccggcgttc atcatctctg ccccgaaaac cctgaccacc 60
ctgcaaccgt tctctcagtc tacctctacc aacgacctgg cagtctcagc tctggaatcg 120
gtggaattta gcatgctgga taatagctct attctgcatg cgtctgacaa ctggaccaat 180
gatgaactgg tgatgcgcgc ccagaacgaa aatctgcaac tgtgtccgat gacgccgccg 240
gcgctggttg gcccgatcaa agtttggatg gatgcgccga gctttgccga actggaacgt 300
ctgtatccgt tcctggaacc gggcggtcat ggtatgccga ccgcctgtcg tgcacgtcac 360
cgtgttgcca ttgtggttcc gtatcgcgac cgtgaatccc acctgcgcac cttcctgcat 420
aacctgcact cactgctgac gaaacagcaa ctggattacg caatctttgt cgtggaacag 480
accgcaaacg aaacgttcaa tcgtgctaaa ctgatgaatg ttggctatgc ggaagccatt 540
cgcctgtacg attggcgttg ctttatcttc catgacgtcg atctgctgcc ggaagatgac 600
cgcaacctgt attcttgtcc ggacgaaccg cgtcacatga gtgttgcagt cgataaattc 660
aactacaaac tgccgtacgg ttcgattttc ggcggtatca gcgctctgac ccgcgaacaa 720
tttgaaggca ttaacggttt cagcaatgat tactggggct ggggcggtga agatgacgat 780
ctgtcgaccc gtgtgacgct ggcgggttat aaaatcagcc gctacccggc agaaatcgct 840
cgttacaaaa tgatcaaaca taacagtgaa aagaaaaacc cggttaatcg ctgccgttac 900
aaactgatgt ctgccaccaa aagtcgctgg cgtaatgacg gcctgagttc cctgtcctat 960
gatctgattt cactgggtcg cctgccgctg tacacgcaca tcaaagttga cctgctggaa 1020
aaacaatctc gccgctatct gcgtacccac ggcttcccga cctgctga 1068
<210> 78
<211> 1128
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 78
atgggcagca gccatcatca tcatcatcac agcagcggcc tggtgccgcg cggcagccat 60
atggattact cattctggag cccggcgttc atcatctctg ccccgaaaac cctgaccacc 120
ctgcaaccgt tctctcagtc tacctctacc aacgacctgg cagtctcagc tctggaatcg 180
gtggaattta gcatgctgga taatagctct attctgcatg cgtctgacaa ctggaccaat 240
gatgaactgg tgatgcgcgc ccagaacgaa aatctgcaac tgtgtccgat gacgccgccg 300
gcgctggttg gcccgatcaa agtttggatg gatgcgccga gctttgccga actggaacgt 360
ctgtatccgt tcctggaacc gggcggtcat ggtatgccga ccgcctgtcg tgcacgtcac 420
cgtgttgcca ttgtggttcc gtatcgcgac cgtgaatccc acctgcgcac cttcctgcat 480
aacctgcact cactgctgac gaaacagcaa ctggattacg caatctttgt cgtggaacag 540
accgcaaacg aaacgttcaa tcgtgctaaa ctgatgaatg ttggctatgc ggaagccatt 600
cgcctgtacg attggcgttg ctttatcttc catgacgtcg atctgctgcc ggaagatgac 660
cgcaacctgt attcttgtcc ggacgaaccg cgtcacatga gtgttgcagt cgataaattc 720
aactacaaac tgccgtacgg ttcgattttc ggcggtatca gcgctctgac ccgcgaacaa 780
tttgaaggca ttaacggttt cagcaatgat tactggggct ggggcggtga agatgacgat 840
ctgtcgaccc gtgtgacgct ggcgggttat aaaatcagcc gctacccggc agaaatcgct 900
cgttacaaaa tgatcaaaca taacagtgaa aagaaaaacc cggttaatcg ctgccgttac 960
aaactgatgt ctgccaccaa aagtcgctgg cgtaatgacg gcctgagttc cctgtcctat 1020
gatctgattt cactgggtcg cctgccgctg tacacgcaca tcaaagttga cctgctggaa 1080
aaacaatctc gccgctatct gcgtacccac ggcttcccga cctgctga 1128
<210> 79
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 79
ctcgaataaa tattggggtt ttggcggtga agatgacgat atg 43
<210> 80
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 80
catatcgtca tcttcaccgc caaaacccca atatttattc gag 43
<210> 81
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 81
cgaataaata ttggggtcac ggcggtgaag atgacg 36
<210> 82
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 82
cgtcatcttc accgccgtga ccccaatatt tattcg 36
<210> 83
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 83
cgaataaata ttggggtgtg ggcggtgaag atgacg 36
<210> 84
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 84
cgtcatcttc accgcccaca ccccaatatt tattcg 36
<210> 85
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 85
gggttggggc ggtgcggatg acgatatgag c 31
<210> 86
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 86
gctcatatcg tcatccgcac cgccccaacc c 31
<210> 87
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 87
gggttggggc ggtggagatg acgatatgag 30
<210> 88
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 88
ctcatatcgt catctccacc gccccaaccc 30
<210> 89
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 89
gggttggggc ggtgatgatg acgatatgag c 31
<210> 90
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 90
gctcatatcg tcatcatcac cgccccaacc c 31
<210> 91
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 91
gccgtacgaa gattatttcg gcggtgtctc ag 32
<210> 92
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 92
ctgagacacc gccgaaataa tcttcgtacg gc 32

Claims (23)

1.修饰糖蛋白的方法,所述方法包括以下步骤:在糖基转移酶的存在下,使包含含有末端GlcNAc部分的聚糖的糖蛋白与糖衍生物核苷酸Su(A)-Nuc接触,其中:
(i)所述糖基转移酶为或衍生自β-(1,4)-N-乙酰半乳糖胺转移酶;
(ii)所述含有末端GlcNAc部分的聚糖如式(1)或(2)所示:
其中:
b为0或1;
d为0或1;
e为0或1;以及
G为单糖,或包含2至20个糖部分的直链或支链寡糖;以及
(iii)所述糖衍生物核苷酸Su(A)-Nuc如式(3)所示:
其中:
a为0或1;
f为0或1;
g为0或1;
Nuc为核苷酸;
U为[C(R1)2]n或[C(R1)2]p-O-[C(R1)2C(R1)2O]o-[C(R1)2]q,其中n为1至24的整数;o为0至12的整数;p和q独立地为0、1或2;R1独立地选自H、F、Cl、Br、I、OH和任选取代的C1-C24烷基;
T为C3-C12(杂)亚芳基,其中(杂)亚芳基被任选地取代;
A选自:
(a)-N3
(b)-C(O)R3
其中R3为任选取代的C1-C24烷基;
(c)(杂)环炔基或-(CH2)iC≡C-R4部分
其中i为0-10且R4为氢或任选取代的C1-C24烷基;
(d)-SH
(e)-SC(O)R8
其中R8为任选取代的C1-C24烷基或苯基;
(f)-SC(V)OR8
其中V为O或S,R8为任选取代的C1-C24烷基或苯基;
(g)-X
其中X选自F、Cl、Br和I;
(h)-OS(O)2R5
其中R5选自C1-C24烷基、C6-C24芳基、C7-C24烷基芳基和C7-C24芳基烷基,所述烷基、芳基、烷基芳基和芳基烷基被任选地取代;
(i)R12
其中R12选自任选取代的末端C2-C24烯基、C3-C5环烯基和C4-C8链二烯基;以及
(j)R13
其中R13为任选取代的末端C3-C24丙二烯基;以及
(k)N(R17)2
其中R17独立地选自H和C1-C12烷基;
Z为CH2、CF2或C(O);或Z为CHOH,条件是g为0、f为1且a为0或1;
Y选自O、S、N(R15)、N(R15)C(O)、N(R15)C(O)N(R15)、N(R15)C(O)O、OC(O)N(R15)S(O)2N(R15)和N(R15)C(O)N(R15)S(O)2O,其中R15独立地选自H、C1-C12烷基和(U)f-(T)a-A,其中f、a、U、T和A如上文所定义;以及
R14独立地选自:
其中:
a、f、T、A和U如上文所定义;
h为0或1;以及
W选自O、S、NR15、NHS(O)2O和NHS(O)2NR15,其中R15如上文所定义。
2.权利要求1的方法,其中所述β-(1,4)-N-乙酰半乳糖胺转移酶为或衍生自无脊椎动物β-(1,4)-GalNAcT酶。
3.前述权利要求中任一项的方法,其中所述β-(1,4)-N-乙酰半乳糖胺转移酶为或衍生自选自SEQ ID NO:2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、25、26、27、28、29、30、31、32、33、34、46、47、49、50、51、52、53、54、55、56、57、58、59、71、72和73,或选自SEQ ID NO:35、36、37、38、39、40、41、42、43、44、45、48、60、61、62、63、64、65、66、67、68、69、70和74的序列。
4.前述权利要求中任一项的方法,其中所述β-(1,4)-N-乙酰半乳糖胺转移酶与选自SEQ ID NO:2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、25、26、27、28、29、30、31、32、33、34、46、47、49、50、51、52、53、54、55、56、57、58、59、71、72和73,或选自SEQ ID NO:35、36、37、38、39、40、41、42、43、44、45、48、60、61、62、63、64、65、66、67、68、69、70和74的序列具有至少50%的序列同一性。
5.前述权利要求中任一项的方法,其中A选自-N3、-C(O)CH3、-SH、-CH=CH2和-CH2C≡CH。
6.前述权利要求中任一项的方法,其中糖衍生物核苷酸Su(A)-Nuc如式(15)、(16)、(17)或(18)所示:
其中Nuc、a、f、R14、R15、A、U和T如权利要求1中所定义。
7.前述权利要求中任一项的方法,其中糖衍生物核苷酸Su(A)-Nuc如式(19)、(20)、(21)、(22)、(23)、(24)、(25)、(26)、(65)、(66)、(67)、(68)或(69)所示:
其中:
R14和R15如权利要求1中所定义;和
R16独立地选自H和F。
8.前述权利要求中任一项的方法,其中R14是-N3,或R14选自:
其中a、f、h、T、A、U和W如权利要求1中所定义。
9.权利要求8的方法,其中糖衍生物核苷酸Su(A)-Nuc如式(27)、(28)、(29)、(30)或(31)所示,或如式(36)所示:
其中Nuc如权利要求1中所定义。
10.权利要求1-7中任一项的方法,其中R14是OH。
11.权利要求10的方法,其中糖衍生物核苷酸Su(A)-Nuc如式(35)所示:
其中Nuc如权利要求1中所定义。
12.前述权利要求中任一项的方法,其中糖衍生物核苷酸Su(A)-Nuc中的核苷酸是UDP。
13.前述权利要求中任一项的方法,其中包含末端GlcNAc部分的聚糖如式(1)、(9)、(10)或(11)所示:
其中b如权利要求1中所定义。
14.前述权利要求中任一项的方法,其中包含含有末端GlcNAc部分的聚糖的糖蛋白如式(7)、(8)或(8b)所示:
其中:
b、d、e和G如权利要求1中所定义;
y独立地为1至24的整数;以及
Pr为蛋白。
15.前述权利要求中任一项的方法,其中所述包含含有末端GlcNAc部分的聚糖的糖蛋白是抗体。
16.通过权利要求1-15中任一项的方法可获得的糖蛋白。
17.权利要求16的糖蛋白,其中所述糖蛋白是抗体。
18.权利要求16或17的糖蛋白,其中R14是-NHCOMe。
19.如式(75)、(76)或(77)所示的生物缀合物:
其中:
Pr为蛋白;
y独立地为1至24的整数;
CG是将Su连接到Sp或D的连接基团;
Sp是间隔基;
D是靶分子;
j独立地为1、2、3、4或5;
k独立地为1至10的整数;
m为0或1;
Su如式(78)所示:
其中b、d、e、G、R14、Z、Y、U、T、g、f和a如权利要求1中所定义,Su经由β-(1,4)-O-糖苷键经C1连接至GlcNAc部分的C4,并且经由Z、Y、U或T连接至CG。
20.权利要求19的生物缀合物,其中R14是-NHCOMe。
21.权利要求19或20的生物缀合物,其中D是细胞毒素。
22.权利要求19-21中任一项的生物缀合物,其是抗体-药物缀合物。
23.β-(1,4)-N-乙酰半乳糖胺转移酶,其与选自SEQ ID NO:10-14和SEQ ID NO:25-74,优选选自SEQ ID NO:10-13、SEQ ID NO:25-48、SEQ ID NO:50-70和SEQ ID NO:72-74的序列具有至少40%的序列同一性。
CN201680036546.XA 2015-04-23 2016-04-25 用为或衍生自β-(1,4)-N-乙酰半乳糖胺转移酶的糖基转移酶修饰糖蛋白的方法 Active CN107810273B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211121609.5A CN115960981A (zh) 2015-04-23 2016-04-25 用为或衍生自β-(1,4)-N-乙酰半乳糖胺转移酶的糖基转移酶修饰糖蛋白的方法

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP15164864.9 2015-04-23
EP15164864 2015-04-23
PCT/EP2016/059194 WO2016170186A1 (en) 2015-04-23 2016-04-25 PROCESS FOR THE MODIFICATION OF A GLYCOPROTEIN USING A GLYCOSYLTRANSFERASE THAT IS OR IS DERIVED FROM A β(1,4)-N-ACETYLGALACTOSAMINYLTRANSFERASE

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202211121609.5A Division CN115960981A (zh) 2015-04-23 2016-04-25 用为或衍生自β-(1,4)-N-乙酰半乳糖胺转移酶的糖基转移酶修饰糖蛋白的方法

Publications (2)

Publication Number Publication Date
CN107810273A true CN107810273A (zh) 2018-03-16
CN107810273B CN107810273B (zh) 2022-09-27

Family

ID=52997984

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202211121609.5A Pending CN115960981A (zh) 2015-04-23 2016-04-25 用为或衍生自β-(1,4)-N-乙酰半乳糖胺转移酶的糖基转移酶修饰糖蛋白的方法
CN201680036546.XA Active CN107810273B (zh) 2015-04-23 2016-04-25 用为或衍生自β-(1,4)-N-乙酰半乳糖胺转移酶的糖基转移酶修饰糖蛋白的方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN202211121609.5A Pending CN115960981A (zh) 2015-04-23 2016-04-25 用为或衍生自β-(1,4)-N-乙酰半乳糖胺转移酶的糖基转移酶修饰糖蛋白的方法

Country Status (12)

Country Link
US (3) US9988661B2 (zh)
EP (1) EP3134520B1 (zh)
JP (1) JP6966162B2 (zh)
CN (2) CN115960981A (zh)
DK (1) DK3134520T3 (zh)
ES (1) ES2659816T3 (zh)
HR (1) HRP20180439T1 (zh)
HU (1) HUE038511T2 (zh)
NO (1) NO3134520T3 (zh)
PL (1) PL3134520T3 (zh)
PT (1) PT3134520T (zh)
WO (1) WO2016170186A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114423773A (zh) * 2019-07-25 2022-04-29 西纳福克斯股份有限公司 6-叠氮基-6-脱氧-2-n-乙酰基-己糖胺-核苷二磷酸的合成

Families Citing this family (51)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DK3438131T3 (da) 2006-02-10 2022-04-11 Life Technologies Corp Oligosaccharidmodifikation og mærkning af proteiner
JP2017528124A (ja) 2014-08-04 2017-09-28 シンアフィックス ビー.ブイ. ベータ−(1,4)−n−アセチルガラクトサミニルトランスフェラーゼ又はその突然変異体を用いる糖タンパク質の改変方法
PL3134520T3 (pl) 2015-04-23 2018-06-29 Synaffix B.V. Sposób modyfikacji glikoproteiny z zastosowaniem glikozylotransferazy, która jest lub pochodzi od β-(1,4)-N-acetylogalaktozaminylotransferazy
EP3413922A1 (en) 2016-02-08 2018-12-19 SynAffix B.V. Improved sulfamide linkers for use in bioconjugates
WO2017137457A1 (en) 2016-02-08 2017-08-17 Synaffix B.V. Antibody-conjugates with improved therapeutic index for targeting cd30 tumours and method for improving therapeutic index of antibody-conjugates
CN108883191B (zh) 2016-02-08 2022-10-14 西纳福克斯股份有限公司 用于靶向cd30肿瘤的具有改善的治疗指数的抗体-缀合物以及用于改善抗体-缀合物的治疗指数的方法
EP3413915A1 (en) 2016-02-08 2018-12-19 Synaffix B.V. Antibody-conjugates with improved therapeutic index for targeting her2 tumours and method for improving therapeutic index of antibody-conjugates
JP2019507741A (ja) 2016-02-08 2019-03-22 シンアフィックス ビー.ブイ. 治療において使用するためのスルファミドリンカーを含むバイオコンジュゲート
CN111683686A (zh) 2017-12-06 2020-09-18 西纳福克斯股份有限公司 烯二炔缀合物
JP2021528406A (ja) 2018-06-19 2021-10-21 グリコス バイオメディカル オーワイ コンジュゲート
EP3813883A1 (en) 2018-06-29 2021-05-05 Glykos Biomedical Oy Conjugates
MX2021001281A (es) 2018-08-02 2021-07-15 Dyne Therapeutics Inc Complejos dirigidos a músculos y sus usos para el tratamiento de distrofinopatías.
US11168141B2 (en) 2018-08-02 2021-11-09 Dyne Therapeutics, Inc. Muscle targeting complexes and uses thereof for treating dystrophinopathies
US12018087B2 (en) 2018-08-02 2024-06-25 Dyne Therapeutics, Inc. Muscle-targeting complexes comprising an anti-transferrin receptor antibody linked to an oligonucleotide and methods of delivering oligonucleotide to a subject
US11911484B2 (en) 2018-08-02 2024-02-27 Dyne Therapeutics, Inc. Muscle targeting complexes and uses thereof for treating myotonic dystrophy
CA3108289A1 (en) 2018-08-02 2020-02-06 Dyne Therapeutics, Inc. Muscle targeting complexes and uses thereof for treating facioscapulohumeral muscular dystrophy
US12097263B2 (en) 2018-08-02 2024-09-24 Dyne Therapeutics, Inc. Muscle targeting complexes and uses thereof for treating myotonic dystrophy
WO2020094670A1 (en) 2018-11-05 2020-05-14 Synaffix B.V. Antibody-conjugates for targeting of tumours expressing trop-2
GB201901608D0 (en) 2019-02-06 2019-03-27 Vib Vzw Vaccine adjuvant conjugates
CN110195043A (zh) * 2019-05-15 2019-09-03 武汉格莱利生物科技有限公司 一种高水溶性的cgta酶及其制备方法和应用
EP3976112A1 (en) 2019-06-03 2022-04-06 Synaffix B.V. Acetal-based cleavable linkers
WO2021123506A1 (en) 2019-12-18 2021-06-24 Glykos Biomedical Oy Stabile conjugate
AU2021205312A1 (en) 2020-01-09 2022-07-14 Mersana Therapeutics, Inc. Site specific antibody-drug conjugates with peptide-containing linkers
WO2021144314A1 (en) 2020-01-13 2021-07-22 Synaffix B.V. Via cycloaddition bilaterally functionalized antibodies
EP4090376A1 (en) 2020-01-13 2022-11-23 Synaffix B.V. Via cycloaddition bilaterally functionalized antibodies
WO2021144315A1 (en) 2020-01-13 2021-07-22 Synaffix B.V. Conjugates of antibodies an immune cell engagers
NL2026400B1 (en) 2020-09-02 2022-05-04 Synaffix Bv Methods for the preparation of bioconjugates
WO2022058395A1 (en) 2020-09-15 2022-03-24 Synaffix B.V. Antibody-exatecan conjugates
NL2026947B1 (en) 2020-11-20 2022-07-01 Synaffix Bv Tyrosine-based antibody conjugates
WO2022136705A1 (en) 2020-12-24 2022-06-30 Synaffix B.V. Glycan-conjugated antibodies binding to fc-gamma receptor
MX2023008000A (es) 2021-01-04 2023-07-13 Mersana Therapeutics Inc Conjugados de anticuerpo dirigido a b7-h4 y farmaco, y metodos de uso de los mismos.
EP4288108A1 (en) 2021-02-08 2023-12-13 Synaffix B.V. Multifunctional antibodies
EP4301782A1 (en) 2021-03-05 2024-01-10 Go Therapeutics, Inc. Anti-glyco-cd44 antibodies and their uses
US11771776B2 (en) 2021-07-09 2023-10-03 Dyne Therapeutics, Inc. Muscle targeting complexes and uses thereof for treating dystrophinopathies
US11648318B2 (en) 2021-07-09 2023-05-16 Dyne Therapeutics, Inc. Anti-transferrin receptor (TFR) antibody and uses thereof
US11638761B2 (en) 2021-07-09 2023-05-02 Dyne Therapeutics, Inc. Muscle targeting complexes and uses thereof for treating Facioscapulohumeral muscular dystrophy
US11633498B2 (en) 2021-07-09 2023-04-25 Dyne Therapeutics, Inc. Muscle targeting complexes and uses thereof for treating myotonic dystrophy
US11969475B2 (en) 2021-07-09 2024-04-30 Dyne Therapeutics, Inc. Muscle targeting complexes and uses thereof for treating facioscapulohumeral muscular dystrophy
AU2022324456A1 (en) 2021-08-05 2024-02-15 Go Therapeutics, Inc. Anti-glyco-muc4 antibodies and their uses
MX2024010267A (es) 2022-02-22 2024-08-28 Adc Therapeutics Sa Método de conjugación que incluye una transglutaminasa en la región fc que comprende un n-glicano recortado.
WO2023180484A1 (en) 2022-03-23 2023-09-28 Synaffix B.V. Antibody-conjugates for targeting of tumours expressing ptk7
WO2023180490A1 (en) 2022-03-23 2023-09-28 Synaffix B.V. Antibody-conjugates for targeting of tumours expressing nectin-4
WO2023180489A1 (en) 2022-03-23 2023-09-28 Synaffix B.V. Antibody-conjugates for targeting of tumours expressing carcinoembyronic antigen
WO2023180485A1 (en) 2022-03-23 2023-09-28 Synaffix B.V. Antibody-conjugates for targeting of tumours expressing trop-2
AU2023254846A1 (en) 2022-04-15 2024-10-10 Dyne Therapeutics, Inc. Muscle targeting complexes and formulations for treating myotonic dystrophy
EP4285934A1 (en) 2022-05-30 2023-12-06 CER Groupe Modified trimannose-oligosacharides, bisected n-glycans comprising said trimannose core and method for obtaining them
WO2024038065A1 (en) 2022-08-15 2024-02-22 Synaffix B.V. Anthracyclins and conjugates thereof
EP4389152A1 (en) 2022-12-23 2024-06-26 Synaffix B.V. Conjugates of pbd prodrugs
EP4410313A1 (en) 2023-01-31 2024-08-07 Synaffix B.V. Homogeneous antibody-conjugates with high payload loading
EP4450093A1 (en) 2023-04-17 2024-10-23 Synaffix B.V. Cleavable immune cell engagers
EP4450489A1 (en) 2023-04-18 2024-10-23 Synaffix B.V. Stable 4-isoxazoline conjugates

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1483077A (zh) * 2000-12-21 2004-03-17 Э�ͷ��͹�ҵ��ʽ���� Udp-n-乙酰半乳糖胺和含n-乙酰半乳糖胺的碳水化合物的生产方法
US20080108557A1 (en) * 2004-09-29 2008-05-08 Novo Nordisk Healthcare A/G Modified Proteins
CN101575631A (zh) * 2009-05-15 2009-11-11 南开大学 一种半乳糖基转移酶修饰黄酮类糖苷化合物的方法
CN102313801A (zh) * 2011-06-03 2012-01-11 南开大学 一种抗体的代谢标记方法及其荧光检测中的应用

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FI20011671A (fi) 2001-08-20 2003-02-21 Carbion Oy Tuumorispesifiset oligosakkaridisekvenssit ja niiden käyttö
AU2003270645A1 (en) * 2002-09-13 2004-04-30 Richard D. Cummings Beta1,4-N-ACETYLGALACTOSAMINYLTRANSFERASES, NUCLEIC ACIDS AND METHODS OF USE THEREOF
DK3438131T3 (da) 2006-02-10 2022-04-11 Life Technologies Corp Oligosaccharidmodifikation og mærkning af proteiner
UY32621A (es) * 2009-05-11 2010-12-31 Stichting Tech Wetenschapp Antígeno glicano
GB201115841D0 (en) 2011-09-13 2011-10-26 Genovis Ab Protein and method
LT3912642T (lt) * 2012-10-23 2023-07-25 Synaffix B.V. Modifikuotas antikūnas, antikūno konjugatas ir jų gamybos būdas
WO2015112016A1 (en) 2014-01-24 2015-07-30 Synaffix B.V. Process for the cycloaddition of a halogenated 1,3-dipole compound with a (hetero)cycloalkyne
JP6733993B2 (ja) 2014-10-03 2020-08-05 シンアフィックス ビー.ブイ. スルファミドリンカー、スルファミドリンカーのコンジュゲート、及び調製の方法
PL3134520T3 (pl) * 2015-04-23 2018-06-29 Synaffix B.V. Sposób modyfikacji glikoproteiny z zastosowaniem glikozylotransferazy, która jest lub pochodzi od β-(1,4)-N-acetylogalaktozaminylotransferazy

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1483077A (zh) * 2000-12-21 2004-03-17 Э�ͷ��͹�ҵ��ʽ���� Udp-n-乙酰半乳糖胺和含n-乙酰半乳糖胺的碳水化合物的生产方法
US20080108557A1 (en) * 2004-09-29 2008-05-08 Novo Nordisk Healthcare A/G Modified Proteins
CN101575631A (zh) * 2009-05-15 2009-11-11 南开大学 一种半乳糖基转移酶修饰黄酮类糖苷化合物的方法
CN102313801A (zh) * 2011-06-03 2012-01-11 南开大学 一种抗体的代谢标记方法及其荧光检测中的应用

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
BRIAN M ZEGLIS ET AL.: "Enzyme-mediated methodology for the site-specific radiolabeling of antibodies based on catalyst-free click chemistry", 《BIOCONJUG CHEM.》 *
MICHAËLBOSCO ET AL.: "6-Azido d-galactose transfer to N-acetyl-d-glucosamine derivative using commercially available β-1,4-galactosyltransferase", 《TETRAHEDRON LETTERS》 *
NADIA VADAIE ET AL.: "Molecular Cloning and Functional Characterization of a Lepidopteran Insect β4-N-Acetylgalactosaminyltransferase with Broad Substrate Specificity, a Functional Role in Glycoprotein Biosynthesis, and a Potential Functional Role in Glycolipid Biosynthesis", 《THE JOURNAL OF BIOLOGICAL CHEMISTRY》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114423773A (zh) * 2019-07-25 2022-04-29 西纳福克斯股份有限公司 6-叠氮基-6-脱氧-2-n-乙酰基-己糖胺-核苷二磷酸的合成

Also Published As

Publication number Publication date
CN107810273B (zh) 2022-09-27
PL3134520T3 (pl) 2018-06-29
HUE038511T2 (hu) 2018-10-29
US20230100074A1 (en) 2023-03-30
EP3134520B1 (en) 2017-12-20
US11299759B2 (en) 2022-04-12
ES2659816T3 (es) 2018-03-19
JP6966162B2 (ja) 2021-11-10
CN115960981A (zh) 2023-04-14
US20170130256A1 (en) 2017-05-11
PT3134520T (pt) 2018-03-26
DK3134520T3 (en) 2018-03-19
US20180245119A1 (en) 2018-08-30
US12049656B2 (en) 2024-07-30
HRP20180439T1 (hr) 2018-07-13
EP3134520A1 (en) 2017-03-01
JP2018518149A (ja) 2018-07-12
EP3354726A1 (en) 2018-08-01
WO2016170186A1 (en) 2016-10-27
US9988661B2 (en) 2018-06-05
NO3134520T3 (zh) 2018-05-19

Similar Documents

Publication Publication Date Title
CN107810273A (zh) 用为或衍生自β‑(1,4)‑N‑乙酰半乳糖胺转移酶的糖基转移酶修饰糖蛋白的方法
CN107109454A (zh) 用β‑(1,4)‑N‑乙酰半乳糖胺转移酶或其突变体修饰糖蛋白的方法
CN107106701A (zh) 磺酰胺接头、其缀合物及制备方法
Tang et al. One-pot N-glycosylation remodeling of IgG with non-natural sialylglycopeptides enables glycosite-specific and dual-payload antibody–drug conjugates
EP2935611B1 (en) Glycoengineered antibody, antibody-conjugate and methods for their preparation
Shi et al. One-step synthesis of site-specific antibody–drug conjugates by reprograming IgG glycoengineering with LacNAc-based substrates
CN105814213A (zh) 经修饰的糖蛋白、蛋白质-缀合物及其制备方法
CN108883191A (zh) 用于靶向cd30肿瘤的具有改善的治疗指数的抗体-缀合物以及用于改善抗体-缀合物的治疗指数的方法
BG98713A (bg) Метод за получаване на фукозилирани въглехидратичрез фукозилираща синтеза на захарни нуклеотиди ирегенериране на gdр-фукозата in siтu
US20170009266A1 (en) Process for the attachment of a galnac moiety comprising a (hetero)aryl group to a glcnac moiety, and product obtained thereby
Huang et al. Site-selective sulfation of N-glycans by human GlcNAc-6-O-sulfotransferase 1 (CHST2) and chemoenzymatic synthesis of sulfated antibody glycoforms
EP3354726B1 (en) Process for the modification of a glycoprotein using a glycosyltransferase that is or is derived from a beta-(1,4)-n-acetylgalactosaminyltransferase
Morimura et al. Identification of antibiotic clarithromycin binding peptide displayed by T7 phage particles
CN118056009A (zh) 分离的多肽及其应用
Serna et al. Minimal epitope for Mannitou IgM on paucimannose-carrying glycoproteins
Reichardt et al. Minimal epitope for Mannitou IgM on paucimannose-carrying glycoproteins
Fyvie Synthesis and reactivity of olefinic, carbohydrate-derived natural product analogs

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant