CN107810273A

CN107810273A - 用为或衍生自β‑(1,4)‑N‑乙酰半乳糖胺转移酶的糖基转移酶修饰糖蛋白的方法

Info

Publication number: CN107810273A
Application number: CN201680036546.XA
Authority: CN
Inventors: S·S·范博凯尔; R·范吉尔; M·A·维基德文; F·L·范代尔夫特
Original assignee: Synaffix BV
Current assignee: Synaffix BV
Priority date: 2015-04-23
Filing date: 2016-04-25
Publication date: 2018-03-16
Anticipated expiration: 2036-04-25
Also published as: CN107810273B; PL3134520T3; HUE038511T2; US20230100074A1; EP3134520B1; US11299759B2; ES2659816T3; JP6966162B2; CN115960981A; US20170130256A1; PT3134520T; DK3134520T3; US20180245119A1; US12049656B2; HRP20180439T1; EP3134520A1; JP2018518149A; EP3354726A1; WO2016170186A1; US9988661B2

Abstract

本发明涉及一种酶法修饰糖蛋白的方法。所述方法包括以下步骤：在为或衍生自β‑(1,4)‑N‑乙酰半乳糖胺转移酶的糖基转移酶的存在下，使包含含有末端GlcNAc部分的聚糖的糖蛋白与非天然的糖衍生物核苷酸接触。所述非天然的糖衍生物核苷酸如式(3)所示：其中A选自‑N₃、‑C(O)R³、‑(CH₂)_iC≡C‑R⁴、‑SH、‑SC(O)R⁸、‑SC(O)OR⁸、‑SC(S)OR⁸、‑F、‑Cl、‑Br、‑I、‑OS(O)₂R⁵、末端C₂‑C₂₄烯基、C₃‑C₅环烯基、C₄‑C₈链二烯基、末端C₃‑C₂₄丙二烯基和氨基。本发明还涉及一种通过本发明的方法可获得的糖蛋白，涉及一种可通过将糖蛋白与接头缀合物缀合而获得的生物缀合物，并且涉及可用于制备本发明的糖蛋白的β‑(1,4)‑N‑乙酰半乳糖胺转移酶。

Description

用为或衍生自β-(1,4)-N-乙酰半乳糖胺转移酶的糖基转移酶修饰糖蛋白的方法

技术领域

本发明涉及酶法修饰糖蛋白的方法。更具体地，本发明涉及使用为或衍生自β-(1,4)-N-乙酰半乳糖胺转移酶的糖基转移酶，用糖衍生物核苷酸修饰糖蛋白的方法。本发明还涉及通过所述方法可获得的糖蛋白，涉及可通过将糖蛋白与接头缀合物缀合而获得的生物缀合物，并且涉及可用于制备本发明的糖蛋白的β-(1,4)-N-乙酰半乳糖胺转移酶。

背景技术

糖基转移酶构成参与糖蛋白和糖脂上存在的复合碳水化合物的合成的酶的超家族。糖基转移酶的基本作用是将核苷酸衍生物的糖基部分转移至特定的糖受体。β-1,4-半乳糖基转移酶(β4Gal-T)(EC 2.4.1.38)组成糖基转移酶超家族的亚家族之一，所述亚家族至少包含Gal-T1至Gal-T7七个成员，其催化半乳糖(Gal)从UDP-Gal转移至不同的糖受体。半乳糖转移酶在末端GlcNAc残基上产生的共有基序是乳糖胺序列Galβ4GlcNAc-R(LacNAc或LN)，其随后通过添加其他糖和硫酸根基团以多种方式修饰。膜糖缀合物的最常见和最重要的糖结构是聚-N-乙酰乳糖胺(聚-LN)，其连接至蛋白(或脂质)，在细胞通讯、黏附和信号传导中起重要作用，并且是免疫应答调节中的重要分子。

在脊椎动物和无脊椎动物糖缀合物中存在的另一个共有的末端基序是GalNAcβ4GlcNAc-R(LaCdiNAc或LDN)序列。LDN基序存在于哺乳动物垂体糖蛋白激素中，其中末端GalNAc残基是4-O-硫酸化的，并且作为内皮细胞Man/S4GGnM受体清除的识别标志物发挥作用。然而，非垂体哺乳动物糖蛋白还含有LDN决定簇。此外，LDN和LDN序列的修饰是许多寄生线虫和吸虫中的常见抗原决定簇。LDN的生物合成涉及将GalNAc转移至末端GlcNAc，这是由高度特异性GalNAc转移酶执行的过程。例如由Miller等人在J.Biol.Chem.2008,283，第1985页(通过引用的方式纳入本文)中报道，认为两个密切相关的β1,4-N-乙酰半乳糖胺转移酶——β4GalNAc-T3和β4GalNAc-T4——引起β1,4连接的GalNAc至许多糖蛋白(包括糖蛋白促黄体激素(LH)和碳酸酐酶-6(CA6))上的Asn-连接的寡糖的蛋白特异性的添加。

已经在一系列生物体中鉴定了β-(1,4)-乙酰半乳糖胺转移酶(β-(1,4)-GalNAcT)，所述生物体包括人、秀丽隐杆线虫(Caenorhabditiselegans)(Kawar等人，J.Biol.Chem.2002,277,34924，通过引用纳入本文)、黑腹果蝇(Drosophilamelanogaster)(Hoskins等人，Science 2007,316,1625，通过引用的方式纳入本文)和粉纹夜蛾(Trichoplusia ni)(Vadaie等人，J.Biol.Chem.2004,279,33501，通过引用的方式纳入本文)。

最后，除了参与N-糖蛋白修饰的GalT和GalNAcT之外，称为UDP-N-乙酰半乳糖胺:多肽N-乙酰半乳糖胺转移酶(也称为ppGalNAcT)的非相关类别的酶负责粘蛋白型连接(GalNAc-α-1-O-Ser/Thr)的生物合成。这些酶将GalNAc从糖供体UDP-GalNAc转移至丝氨酸和苏氨酸残基，形成O-糖蛋白中典型的α端基异构键。尽管ppGalNAcT催化功能看似简单，但是基于计算机分析估计仅有24种独特的ppGalNAcT人类基因。因为O-连接的糖基化逐步进行，将GalNAc添加到至丝氨酸或苏氨酸中代表粘蛋白生物合成中的第一个关键步骤。尽管这看似简单，但多个ppGalNAcT家族成员对于其蛋白底物的完全糖基化似乎是必需的。

已经表明，半乳糖基转移酶类除了转移天然底物UDP-Gal之外，还能够将一系列非天然半乳糖衍生物转移至受体GlcNAc底物。例如，Elling等人在ChemBioChem 2001,2,884(通过引用的方式纳入本文)中表明，通过在一系列半乳糖基转移酶的作用下从UDP-糖转移6-修饰的半乳糖，可以将含末端GlcNAc的蛋白质生物素化。类似地，Pannecoucke等人在Tetrahedron Lett.2008,49,2294(通过引用的方式纳入本文)中证实，在经受牛β1,4-半乳糖基转移酶之后，6-叠氮基-6-脱氧半乳糖可以(在一定程度上)从对应的UDP-糖转移至小分子GlcNAc底物上。在US2008/0108557(WO 2006/035057，Novo Nordisk A/S)中早先也报道了用于修饰的半乳糖衍生物的糖基转移酶的用途，其中要求在C-6处修饰的广泛范围的半乳糖衍生物(例如硫醇、叠氮化物、O-炔丙基、醛)可以在(牛或人)β1,4-半乳糖基转移酶的作用下，使用2-10当量的UDP-糖转移至GlcNAc底物上。然而，提供的用于支持这样的权利要求的数据仅涉及半乳糖的6-O-炔丙基和6-醛基变体。在C2处具有化学柄的许多GalNAc衍生物也被要求为糖基转移酶的底物，但没有提供实施例。

特别地，如由Ramakrishnan等人J.Biol.Chem.2002,23,20833(通过引用的方式纳入本文)所报道的，牛β4Gal-T1中Tyr-289残基至Leu-289的突变产生了酶的催化口袋，其可以有助于在C2处携带化学柄的UDP-Gal分子，例如2-酮基-Gal。通过包括首先转移非天然半乳糖部分，接着将肟连接到C-2柄上的两步过程，该突变型酶β4GalT(Y289L)已经用于体外检测蛋白上的O-GlcNAc残基或正常和恶性肿瘤组织的细胞表面聚糖上的末端GlcNAc部分的存在。

例如Khidekel等人，J.Am.Chem.Soc.2003,125,16162(通过引用的方式纳入本文)公开了非天然酮官能团到具有β4GalT(Y289L)的O-GlcNAc修饰的蛋白的化学选择性安装。酮部分充当独特标记物以使用肟连接用生物素来“标记”O-GlcNAc糖基化蛋白。一旦被生物素化，可以使用与辣根过氧化物酶(HRP)缀合的链霉亲和素通过化学发光来容易地检测糖缀合物。

例如WO 2007/095506、WO 2008/029281(均为Invitrogen Corporation的)、WO2014/065661(SynAffix B.V.)和Clark等人J.Am.Chem.Soc.2008,130,11576(均通过引用的方式纳入本文)报道了类似的方法，其使用β4GalT(Y289L)和半乳糖胺的叠氮乙酰基变体，取得了类似的成功。

例如US 8697061(Glykos)(通过引用的方式纳入本文)报道了一种类似的方法，其使用β4GalT(Y289L)和2-修饰的糖，获得类似的成功。

最近，突变体β4GalT(Y289L)也以制备方式应用于对抗体的重链聚糖进行位点选择性放射性标记，如Zeglis等人在Bioconj.Chem.2013,24,1057(通过引用的方式纳入本文)中所报道的。特别地，将叠氮化物修饰的N-乙酰半乳糖胺单糖(GalNAz)掺入至抗体的聚糖允许在合适的螯合剂的点击化学引入之后用⁸⁹Zr进行受控标记。

Ramakrishnan等人在Biochemistry 2004,43,12513(通过引用的方式纳入本文)中描述了双突变体β4GalT(Y289L、M344H)失去其Mn²⁺依赖性活性的98％，但是在Mg²⁺存在下表现出25-30％的活性，包括转移C-2修饰的半乳糖底物的能力。发现双突变体β4GalT(Y289L、M344H)可用于体外半乳糖苷化测定，因为已知5-10mM Mn²⁺的典型需求对细胞具有潜在的细胞毒性作用。

Mercer等人，Bioconjugate.Chem.2013,24,144(通过引用的方式纳入本文)描述了在M_g ²⁺的存在下，双突变体Y289L-M344H-β4Gal-T1酶将GalNAc和类似物糖转移至受体GlcNAc。

使用野生型β-(1,4)-N-乙酰半乳糖胺转移酶(在本文也称为β-(1,4)-GalNAcT)来转移C-2修饰的GalNAc的尝试迄今已获得了小小的成功。

Bertozzi等人在ACS Chem.Biol.2009,4,1068(通过引用的方式纳入本文)中将生物正交化学报告技术应用于粘蛋白型O-聚糖在活的秀丽隐杆线虫中的分子成像。将蠕虫用N-乙酰半乳糖胺(GalNAz)的叠氮基-糖变体处理，使得能够体内掺入这种非天然糖。虽然观察到GalNAz代谢性掺入到糖蛋白中，但是对秀丽隐杆线虫溶解产物的软骨素酶ABC和肽N-糖苷酶F(PNGase F)消化，随后使用膦-Flag标签进行的施陶丁格连接(Staudingerligation)以及随后通过使用α-Flag抗体的Western印迹对糖蛋白的探测，表明糖蛋白上的大多数GalNAz残基位于除N-聚糖外的其他类型的聚糖中。此外，没有观察到叠氮化物标记的糖蛋白与N-聚糖特异性凝集素伴刀豆球蛋白A(ConA)的可检测的结合，这与绝大多数标记的聚糖是O-连接的而非N-连接的假说一致。基于这些观察结果，可以得出结论，GalNAz不会在该生物体中代谢性地掺入到N-GlcNAc化蛋白上。

最近，由Burnham-Marusich等人在Plos One 2012,7,e49020(通过引用的方式纳入本文)中得出了类似的结论，其中还观察到在PNGAse处理时缺乏信号减少——表明GalNAz在N-糖蛋白中没有明显掺入。Burnham-Marusich等人描述了使用末端炔烃探针与叠氮基标记的糖蛋白的Cu(I)-催化的叠氮化物-炔烃环化加成反应来检测代谢标记的糖蛋白的研究。结果表明大多数GalNAz标记掺入至对pNGase F不敏感、因此不是N-糖蛋白的聚糖类。

β-(1,4)-GalNAcT对UDP-GalNAc的高底物特异性从对UDP-GlcNAc、UDP-Glc和UDP-Gal的差的识别中变得显而易见，对UDP-GlcNAc、UDP-Glc和UDP-Gal分别仅有0.7％、0.2％和1％的转移酶活性残留，如Kawar等人，J.Biol.Chem.2002,277,34924(通过引用的方式纳入本文)中所报道的。

综上，没有通过非天然GalNAc衍生物(如2-酮基或2-叠氮乙酰基衍生物)的GalNAc转移酶的方式来修饰糖蛋白的体外方法的报道是不足为奇的。

同时，已由Qasba等人，J.Mol.Biol.2007,365,570(通过引用的方式纳入本文)报道，无脊椎动物GalNAcT中的Ile或Leu活性位点残基——对应于人β4Gal-T1同源酶(ortholog enzyme)中的Tyr-289残基——到Tyr残基的置换，通过将N-乙酰半乳糖胺基转移酶活性降低近1000倍，同时将其半乳糖基转移酶活性提高80倍，将酶转化为β(1,4)半乳糖基转移酶。

Taron等人，Carbohydr.Res.2012,362,62(通过引用的方式纳入本文)描述了GalNAz在GPI锚中的体内代谢掺入。

发明内容

本发明涉及一种修饰糖蛋白的方法，所述方法包括以下步骤：在糖基转移酶的存在下，使糖蛋白与糖衍生物核苷酸Su(A)-Nuc接触，所述糖蛋白包含含有末端GlcNAc部分的聚糖，其中：

(i)所述糖基转移酶为或衍生自β-(1,4)-N-乙酰半乳糖胺转移酶；

(ii)所述含有末端GlcNAc部分的聚糖如式(1)或(2)所示：

其中：

b为0或1；

d为0或1；

e为0或1；以及

G为单糖、或包含2至20个糖部分的直链或支链寡糖；以及

(iii)所述糖衍生物核苷酸Su(A)-Nuc如式(3)所示：

其中：

a为0或1；

f为0或1；

g为0或1；

Nuc为核苷酸；

U为[C(R¹)₂]_n或[C(R¹)₂]_p-O-[C(R¹)₂C(R¹)₂O]_o-[C(R¹)₂]_q，其中n为1至24的整数；o为0至12的整数；p和q独立地为0、1或2；R¹独立地选自H、F、Cl、Br、I、OH和任选取代的C₁-C₂₄烷基；

T为C₃-C₁₂(杂)亚芳基，其中(杂)亚芳基被任选地取代；

A选自：

(a)-N₃

(b)-C(O)R³

其中R³为任选取代的C₁-C₂₄烷基；

(c)(杂)环炔基或-(CH₂)_iC≡C-R⁴部分

其中i为0-10且R⁴为氢或任选取代的C₁-C₂₄烷基；

(d)-SH

(e)-SC(O)R⁸

其中R⁸为任选取代的C₁-C₂₄烷基或苯基；

(f)-SC(V)OR⁸

其中V为O或S，R⁸为任选取代的C₁-C₂₄烷基或苯基；

(g)-X

其中X选自F、Cl、Br和I；

(h)-OS(O)₂R⁵

其中R⁵选自C₁-C₂₄烷基、C₆-C₂₄芳基、C₇-C₂₄烷基芳基和C₇-C₂₄芳基烷基，所述烷基、芳基、烷基芳基和芳基烷基被任选地取代；

(i)R¹²

其中R¹²选自任选取代的末端C₂-C₂₄烯基、C₃-C₅环烯基和C₄-C₈链二烯基；以及

(j)R¹³

其中R¹³为任选取代的末端C₃-C₂₄丙二烯基；以及

(k)N(R¹⁷)₂

其中R¹⁷独立地选自H和C₁-C₁₂烷基；

Z为CH₂、CF₂或C(O)；或Z为CHOH，条件是当Z为CHOH时，g为0、f为1且a为0或1；

Y选自O、S、N(R¹⁵)、N(R¹⁵)C(O)、N(R¹⁵)C(O)N(R¹⁵)、N(R¹⁵)C(O)O、OC(O)N(R¹⁵)S(O)₂N(R¹⁵)和N(R¹⁵)C(O)N(R¹⁵)S(O)₂O，其中R¹⁵独立地选自H、C₁-C₁₂烷基和(U)_f-(T)_a-A，其中f、a、U、T和A如上所定义；以及

R¹⁴独立地选自：

其中：

a、f、T、A和U如上所定义；

h为0或1；以及

W选自O、S、NR¹⁵、NHS(O)₂O和NHS(O)₂NR¹⁵，其中R¹⁵如上所定义。

本发明还涉及通过本发明的方法可获得的糖蛋白。

附图说明

在图1中示出了可通过本发明的方法修饰的糖蛋白的几个实例，所述糖蛋白包含含有末端GlcNAc部分的聚糖。

在图2中示出了修饰糖蛋白的方法的实施方案，其中所述糖蛋白是抗体。在该实施方案中，糖衍生物Su(A)-Nuc在糖基转移酶(其中糖基转移酶为或衍生自β-(1,4)-N-乙酰半乳糖胺转移酶)的作用下连接到抗体聚糖的末端GlcNAc部分，形成经修饰的抗体。

图3示出了抗体聚糖G0、G1、G2、G0F、G1F和G2F的不同糖型。

图4示出了一种通过用唾液酸酶和半乳糖苷酶处理糖型G0、G1、G2、G0F、G1F和G2F的混合物来提供包含式(10)的聚糖的糖蛋白的方法，以及通过用内切糖苷酶处理糖型G0、G1、G2、G0F、G1F和G2F的混合物来提供包含式(1)的聚糖的糖蛋白的方法。包含式(10)或(1)的聚糖的糖蛋白与叠氮基修饰的UDP-GalNAc衍生物(例如6-叠氮基GalNAc)的孵育分别得到叠氮基修饰的糖蛋白(33)或(32)。

图5示出了在本发明的经修饰的糖蛋白中的代表性的一组官能团(A)，其经与反应性基团Q¹的反应得到连接基团CG和官能化的糖蛋白。

具体实施方式

定义

如本说明书和权利要求书中使用的动词“包含”及其变化形式以其非限制性意义使用，意指包括该词之后的项目，但不排除未具体提及的项目。

另外，通过不定冠词“一(a)”或“一个(an)”提及要素不排除存在多于一个要素的可能性，除非上下文清楚地要求存在一个且仅存在一个该要素。因此，不定冠词“一”或“一个”通常意指“至少一个”。

未取代的烷基具有通式C_nH_2n+1，并且可以是直链的或支链的。未取代的烷基还可以含有环状部分，因此具有随之而来的通式C_nH_2n-1。任选地，烷基被本文中进一步详细说明的一个或多个取代基取代。烷基的实例包括甲基、乙基、丙基、2-丙基、叔丁基、1-己基、1-十二烷基等。

芳基包含6至12个碳原子并且可以包括单环结构和双环结构。任选地，芳基可以被本文中进一步详细说明的一个或多个取代基取代。芳基的实例是苯基和萘基。

芳基烷基和烷基芳基包含至少七个碳原子，并且可以包括单环结构和双环结构。任选地，芳基烷基和烷基芳基可以被本文中进一步详细说明的一个或多个取代基取代。芳基烷基为例如苄基。烷基芳基为例如4-叔丁基苯基。

杂芳基包含至少两个碳原子(即至少C₂)和一个或多个杂原子N、O、P或S。杂芳基可具有单环结构或双环结构。任选地，杂芳基可以被本文中进一步详细说明的一个或多个取代基取代。合适的杂芳基的实例包括吡啶基、喹啉基、嘧啶基、吡嗪基、吡唑基、咪唑基、噻唑基、吡咯基、呋喃基、三唑基、苯并呋喃基、吲哚基、嘌呤基、苯并噁唑基、噻吩基、磷酰基和噁唑基。

杂芳基烷基和烷基杂芳基包含至少三个碳原子(即至少C₃)，并且可以包括单环结构和双环结构。任选地，杂芳基可以被本文中进一步详细说明的一个或多个取代基取代。

当芳基被表示为(杂)芳基时，该表示意指包括芳基和杂芳基。类似地，烷基(杂)芳基意指包括烷基芳基和烷基杂芳基，并且(杂)芳基烷基意指包括芳基烷基和杂芳基烷基。因此，C₂-C₂₄(杂)芳基被解释为包括C₂-C₂₄杂芳基和C₆-C₂₄芳基。类似地，C₃-C₂₄烷基(杂)芳基意指包括C₇-C₂₄烷基芳基和C₃-C₂₄烷基杂芳基，并且C₃-C₂₄(杂)芳基烷基意指包括C₇-C₂₄芳基烷基和C₃-C₂₄杂芳基烷基。

除非另有说明，烷基、烯基、烯烃、炔烃、(杂)芳基、(杂)芳基烷基、烷基(杂)芳基、亚烷基、亚烯基、环亚烷基、(杂)亚芳基、烷基(杂)亚芳基、(杂)芳基亚烷基、烯基、炔基、环烷基、烷氧基、烯氧基、(杂)芳氧基、炔氧基和环烷氧基可以被一个或多个独立地选自以下的取代基取代：C₁-C₁₂烷基、C₂-C₁₂烯基、C₂-C₁₂炔基、C₃-C₁₂环烷基、C₅-C₁₂环烯基、C₈-C₁₂环炔基、C₁-C₁₂烷氧基、C₂-C₁₂烯氧基、C₂-C₁₂炔氧基、C₃-C₁₂环烷氧基、卤素、氨基、氧代和甲硅烷基，其中甲硅烷基可以由式(R²)₃Si-表示，其中R²独立地选自C₁-C₁₂烷基、C₂-C₁₂烯基、C₂-C₁₂炔基、C₃-C₁₂环烷基、C₁-C₁₂烷氧基、C₂-C₁₂烯氧基、C₂-C₁₂炔氧基和C₃-C₁₂环烷氧基，其中烷基、烯基、炔基、环烷基、烷氧基、烯氧基、炔氧基和环烷氧基被任选地取代，烷基、烷氧基、环烷基和环烷氧基被一个或多个选自O、N和S的杂原子任选地间隔。

炔基包含碳-碳三键。包含一个三键的未取代的炔基具有通式C_nH_2n-3。末端炔基是其中三键位于碳链的末端位置的炔基。任选地，炔基被一个或多个本文中进一步详细说明的取代基取代，和/或被选自氧、氮和硫的杂原子间隔。炔基的实例包括乙炔基、丙炔基、丁炔基、辛炔基等。

环炔基是环状炔基。包含一个三键的未取代的环炔基具有通式C_nH_2n-5。任选地，环炔基被一个或多个本文中进一步详细说明的取代基取代。环炔基的实例是环辛炔基。

杂环炔基是被选自氧、氮和硫的杂原子间隔的环炔基。任选地，杂环炔基被一个或多个本文中进一步详细说明的取代基取代。杂环炔基的实例是氮杂环辛炔基。

(杂)芳基包括芳基和杂芳基。烷基(杂)芳基包括烷基芳基和烷基杂芳基。(杂)芳基烷基包括芳基烷基和杂芳基烷基。(杂)炔基包括炔基和杂炔基。(杂)环炔基包括环炔基和杂环炔基。

本文中的(杂)环炔化合物定义为包含(杂)环炔基的化合物。

本说明书和权利要求书中公开的几种化合物可以描述为稠合(杂)环炔化合物，即其中第二个环结构是与(杂)环炔基稠合(即成环)的(杂)环炔化合物。例如在稠合(杂)环辛炔化合物中，环烷基(例如环丙基)或芳烃(例如苯)可以与(杂)环辛炔基成环。稠合(杂)环辛炔化合物中的(杂)环辛炔基的三键可以位于三个可能位置的任一个上，即在环辛炔部分的2、3或4位上(根据“IUPAC Nomenclature of OrganicChemistry”,Rule A31.2编号)。本说明书和权利要求书中对任何稠合(杂)环辛炔化合物的描述意指包括环辛炔部分的所有三种单独的区域异构体。

本文中的一般性术语“糖”用于表示单糖，例如葡萄糖(Glc)、半乳糖(Gal)、甘露糖(Man)和岩藻糖(Fuc)。本文中的术语“糖衍生物”用于表示单糖的衍生物，即包含取代基和/或官能团的单糖。糖衍生物的实例包括氨基糖和糖酸，例如葡糖胺(GlcNH₂)、半乳糖胺(GalNH₂)、N-乙酰葡糖胺(GlcNAc)、N-乙酰半乳糖胺(GalNAc)、唾液酸(Sia)(其也称为N-乙酰神经氨酸(NeuNAc))，以及N-乙酰胞壁酸(MurNAc)、葡糖醛酸(GlcA)和艾杜糖醛酸(IdoA)。

本文中的术语“核苷酸”以其通常的科学含义使用。术语“核苷酸”是指由核碱基、五碳糖(核糖或2-脱氧核糖)和一个、两个或三个磷酸基团组成的分子。没有磷酸基团，核碱基和糖组成核苷。因此，核苷酸也可以称为一磷酸核苷、二磷酸核苷或三磷酸核苷。核碱基可以是腺嘌呤、鸟嘌呤、胞嘧啶、尿嘧啶或胸腺嘧啶。核苷酸的实例包括尿苷二磷酸(UDP)、鸟苷二磷酸(GDP)、胸苷二磷酸(TDP)、胞苷二磷酸(CDP)和胞苷一磷酸(CMP)。

本文中的术语“蛋白”以其通常的科学含义使用。在本文中，包含约10个或更多个氨基酸的多肽被认为是蛋白。蛋白可以包含天然的氨基酸，但也包括非天然的氨基酸。

本文中的术语“糖蛋白”以其通常的科学含义使用，并且是指包含与蛋白共价键合的一个或多个单糖链或寡糖链(“聚糖”)的蛋白。聚糖可以连接到蛋白的羟基上(O-连接的聚糖)，例如，连接到丝氨酸、苏氨酸、酪氨酸、羟赖氨酸或羟脯氨酸的羟基上；或连接到蛋白的氮官能团上(N-糖蛋白)，例如天冬酰胺或精氨酸；或连接到蛋白的碳上(C-糖蛋白)，例如色氨酸。糖蛋白可以包含一个以上的聚糖，可以包含一个或多个单糖和一个或多个寡糖聚糖的组合，并且可以包含N-连接的、O-连接的和C-连接的聚糖的组合。据估计，超过50％的所有蛋白具有某种形式的糖基化，因此被认为是糖蛋白。糖蛋白的实例包括PSMA(前列腺特异性膜抗原)、CAL(南极假丝酵母脂肪酶)、gp41、gp120、EPO(促红细胞生成素)、抗冻蛋白和抗体。

本文中的术语“聚糖”以其通常的科学含义使用，并且是指与蛋白连接的单糖链或寡糖链。因此，术语聚糖是指糖蛋白的碳水化合物部分。聚糖经由一个糖的C-1碳连接至蛋白，所述糖可以不经进一步取代(单糖)或可以在其一个或多个羟基上被进一步取代(寡糖)。天然存在的聚糖通常包含1至约10个糖类部分。然而，当更长的糖链与蛋白连接时，所述糖链在本文中也被认为是聚糖。

糖蛋白的聚糖可以是单糖。通常，糖蛋白的单糖聚糖由与蛋白共价连接的单一的N-乙酰葡糖胺(GlcNAc)、葡萄糖(Glc)、甘露糖(Man)或岩藻糖(Fuc)组成。

聚糖也可以是寡糖。糖蛋白的寡糖链可以是直链或支链的。在寡糖中，直接连接至蛋白的糖称为核心糖。在寡糖中，不直接连接至蛋白并连接至至少两种其他糖的糖称为内部糖。在寡糖中，不直接连接至蛋白而是连接至单个其他糖的糖，即在其一个或多个其他羟基处不具有其他糖取代基的糖，称为末端糖。为了避免疑义，在糖蛋白的寡糖中可以存在多个末端糖，但是仅存在一个核心糖。

聚糖可以是O-连接的聚糖、N-连接的聚糖或C-连接的聚糖。在O-连接的聚糖中，单糖或寡糖聚糖通常经由丝氨酸(Ser)或苏氨酸(Thr)的羟基与蛋白的氨基酸中的O原子键合。在N-连接的聚糖中，单糖或寡糖聚糖经由蛋白的氨基酸中的N-原子，通常经由天冬酰胺(Asn)或精氨酸(Arg)侧链中的酰胺氮与蛋白键合。在C-连接的聚糖中，单糖或寡糖聚糖与蛋白的氨基酸中的C-原子键合，通常与色氨酸(Trp)的C-原子键合。

与蛋白直接连接的寡糖的末端称为聚糖的还原末端。寡糖的另一端称为聚糖的非还原端。

对于O-连接的聚糖，存在多种多样的链。天然存在的O-连接的聚糖的特征通常在于丝氨酸或苏氨酸连接的α-O-GalNAc部分，其进一步用另一个GalNAc、半乳糖、GlcNAc、唾液酸和/或岩藻糖取代。具有聚糖取代的羟基化氨基酸可以是蛋白中任何氨基酸序列的一部分。

对于N-连接的聚糖，存在多种多样的链。天然存在的N-连接的聚糖的特征通常在于天冬酰胺连接的β-N-GlcNAc部分，进而在其4-OH处用β-GlcNAc进一步取代，进而在其4-OH处用β-Man进一步取代，进而在其3-OH和6-OH处用α-Man进一步取代，得到聚糖戊多糖Man₃GlcNAc₂。核心GlcNAc部分可以在其6-OH处被α-Fuc进一步取代。戊多糖Man₃GlcNAc₂是几乎所有N-连接的糖蛋白的常见寡糖支架，并且可以携带多种其他取代基，包括但不限于Man、GlcNAc、Gal和唾液酸。在其侧链上用聚糖取代的天冬酰胺通常是序列Asn-X-Ser/Thr的一部分，其中X为除了脯氨酸以外的任何氨基酸，Ser/Thr是丝氨酸或苏氨酸。

本文中的术语“抗体”以其通常的科学含义使用。抗体是由免疫系统产生的能够识别和结合至特定抗原的蛋白。抗体是糖蛋白的一个实例。本文中的术语抗体以其最广泛的含义使用，并具体包括单克隆抗体、多克隆抗体、二聚体、多聚体、多特异性抗体(例如双特异性抗体)、抗体片段以及双链抗体和单链抗体。本文中的术语“抗体”还意指包括人抗体、人源化抗体、嵌合抗体和特异性结合癌抗原的抗体。术语“抗体”意指包括全抗体，但也包括抗体的片段，例如抗体Fab片段、F(ab’)₂、来自切割抗体的Fv片段或Fc片段、scFv-Fc片段、微抗体、双特异抗体或scFv。此外，该术语包括基因工程抗体和抗体的衍生物。抗体、抗体的片段和遗传工程抗体可以通过本领域已知的方法获得。合适的市售抗体主要包括阿昔单抗、利妥昔单抗、巴利昔单抗、帕利珠单抗、英夫利昔单抗、曲妥珠单抗、阿仑珠单抗、阿达木单抗、托西莫单抗-I131、西妥昔单抗、ibrituximab tiuxetan、奥马珠单抗、贝伐单抗、那他珠单抗、雷珠单抗、帕尼单抗、依库珠单抗、赛妥珠单抗(certolizumab pegol)、戈利木单抗、卡那奴单抗、卡妥索单抗、乌司奴单抗、托珠单抗、奥法木单抗、地舒单抗、贝利木单抗、伊匹木单抗和本妥昔单抗(brentuximab)。

同一性/相似性

在本发明的上下文中，蛋白或蛋白片段由氨基酸序列表示。

应理解，如本文中通过给定的序列身份号(SEQ ID NO)所确定的每个蛋白或蛋白片段或肽或衍生肽或多肽不限于所公开的这种特定序列。本文中的“序列同一性”定义为通过比较序列确定的两个或更多个氨基酸(多肽或蛋白)序列之间的关系。在本领域中，“同一性”还意指根据情况可通过这种序列的字符串之间的匹配确定的氨基酸序列之间的序列相似性程度。除非本文另有说明，与给定SEQ ID NO的同一性或相似性意指基于所述序列的全长(即在其整个长度上或作为整体)的同一性或相似性。

本发明包含的与由其SEQ ID NO所定义的具体指定序列具有小于100％序列同一性的任何酶优选具有为与由SEQ ID NO所定义的所述序列具有100％同一性的酶的酶活性的至少10％、20％、30％、40％、50％、60％、70％或优选至少80％或90％或至少100％的酶活性。

两个氨基酸序列之间的“相似性”通过将一个多肽的氨基酸序列和其保守氨基酸取代物与第二多肽的序列进行比较来确定。“同一性”和“相似性”可以通过已知方法容易地计算，包括但不限于在以下中描述的那些：Computational Molecular Biology,Lesk,A.M.编辑,牛津大学出版社,纽约,1988；Biocomputing:Informatics and Genome Projects,Smith,D.W.编辑,Academic Press,纽约,1993；Computer Analysis of Sequence Data,Part I,Griffin,A.M.,和Griffin,H.G.编辑,胡玛纳出版社,新泽西州,1994；SequenceAnalysis in Molecular Biology,von Heine,G.,AcademicPress,1987；以及SequenceAnalysis Primer,Gribskov,M.和Devereux,J.,eds.,M Stockton Press,纽约,1991以及Carillo,H.,和Lipman,D.,SIAM J.Applied Math.,48:1073(1988)。

设计确定同一性的优选方法以在测试的两个或更多个序列之间给出最大匹配。确定同一性和相似性的方法编码在可公开获得的计算机程序中。确定两个序列之间的同一性和相似性的优选计算机程序方法包括例如GCG程序包(Devereux,J.等人,Nucleic AcidsResearch 12(1):387(1984))、BestFit、BLASTP、BLASTN和FASTA(Altschul,S.F.等人,J.Mol.Biol.215:403-410(1990))。BLAST X程序可公开获自NCBI和其他来源(BLASTManual,Altschul,S.,等人,NCBI NLM NIH Bethesda,MD20894；Altschul,S.等人,J.Mol.Biol.215:403-410(1990))。众所周知的Smith Waterman算法也可用于确定同一性。

用于多肽序列比较的优选参数包括如下内容：算法：Needleman和Wunsch,J.Mol.Biol.48:443-453(1970)；比较矩阵：来自Hentikoff和Hentikoff的BLOSSUM62,Proc.Natl.Acad.Sci.USA.89:10915-10919(1992)；缺口罚分:12；以及缺口长度罚分:4。具有这些参数的有用的程序作为“Ogap”程序公开获自位于Madison，WI的GeneticsComputerGroup。上述参数是用于氨基酸比较的默认参数(以及对于末端缺口没有罚分)。

任选地，在确定氨基酸相似性程度时，技术人员还可以考虑所谓的“保守”氨基酸置换，这对技术人员将是清楚的。保守氨基酸置换是指具有相似侧链的残基的可互换性。例如，具有脂肪族侧链的氨基酸组是甘氨酸、丙氨酸、缬氨酸、亮氨酸和异亮氨酸；具有脂肪族-羟基侧链的氨基酸组是丝氨酸和苏氨酸；具有含酰胺侧链的氨基酸组是天冬酰胺和谷氨酰胺；具有芳族侧链的氨基酸组是苯丙氨酸、酪氨酸和色氨酸；具有碱性侧链的氨基酸组是赖氨酸、精氨酸和组氨酸；具有含硫侧链的氨基酸组是半胱氨酸和甲硫氨酸。优选的保守氨基酸置换基是：缬氨酸-亮氨酸-异亮氨酸、苯丙氨酸-酪氨酸、赖氨酸-精氨酸、丙氨酸-缬氨酸和天冬酰胺-谷氨酰胺。本文公开的氨基酸序列的置换变体是其中已经除去所公开序列中的至少一个残基并且在其位置插入不同残基的那些。优选地，氨基酸改变是保守的。每个天然存在的氨基酸的优选保守置换如下：Ala至Ser；Arg至Lys；Asn至Gln或His；Asp至Glu；Cys至Ser或Ala；Gln至Asn；Glu至Asp；Gly至Pro；His至Asn或Gln；Ile至Leu或Val；Leu至Ile或Val；Lys至Arg；Gln或Glu；Met至Leu或Ile；Phe至Met、Leu或Tyr；Ser至Thr；Thr至Ser；Trp至Tyr或His；Tyr至Trp或Phe；以及Val至Ile或Leu。

用于修饰糖蛋白的方法

本发明涉及用于在糖基转移酶的作用下修饰糖蛋白以获得经修饰的糖蛋白的方法，其中所述糖基转移酶为或衍生自β-(1,4)-N-乙酰半乳糖胺转移酶。优选地，所述方法是体外方法。

具体地，本发明涉及用于修饰糖蛋白的方法，所述方法包括以下步骤：在糖基转移酶的存在下，将糖蛋白与糖衍生物核苷酸Su(A)-Nuc接触，所述糖蛋白包含含有末端GlcNAc部分的聚糖，其中：

(ii)所述含有末端GlcNAc部分的聚糖如式(1)或(2)所示：

其中：

b为0或1；

d为0或1；

e为0或1；以及

G为单糖，或包含2至20个糖部分的直链或支链寡糖；以及

(iii)所述糖衍生物核苷酸Su(A)-Nuc如式(3)所示：

其中：

a为0或1；

f为0或1；g为0或1；

Nuc为核苷酸；

T为C₃-C₁₂(杂)亚芳基，其中(杂)亚芳基被任选地取代；

A选自：

(a)-N₃

(b)-C(O)R³

其中R³为任选取代的C₁-C₂₄烷基；

(c)(杂)环炔基或-(CH₂)_iC≡C-R⁴部分

其中i为0-10且R⁴为氢或任选取代的C₁-C₂₄烷基；

(d)-SH

(e)-SC(O)R⁸

其中R⁸为任选取代的C₁-C₂₄烷基或苯基；

(f)-SC(V)OR⁸

其中V为O或S，R⁸为任选取代的C₁-C₂₄烷基或苯基；

(g)-X

其中X选自F、Cl、Br和I；

(h)-OS(O)₂R⁵

(i)R¹²

(j)R¹³

其中R¹³为任选取代的末端C₃-C₂₄丙二烯基；以及

(k)N(R¹⁷)₂

其中R¹⁷独立地选自H和C₁-C₁₂烷基；

R¹⁴选自：

其中：

a、f、T、A和U如上所定义；

h为0或1；以及

在一个实施方案中，如式(3)所示的Su(A)-Nuc中的A选自如上所定义的选项(a)至(j)。在另一个实施方案中，如式(3)所示的Su(A)-Nuc中的A选自如上定义的选项(a)至(d)和(g)至(k)，更优选选自(a)至(d)和(g)至(j)。

如上所述，本发明用于修饰糖蛋白的方法提供了经修饰的糖蛋白。在本文中，经修饰的糖蛋白定义为包含式(4)或(5)的聚糖的糖蛋白：

其中：

b、d、e和G如上所定义；以及

Su(A)是式(6)的糖衍生物：

其中：

R¹⁴、Z、Y、U、T、A、g、f和a如上所定义。

在式(4)和(5)的经修饰的糖蛋白聚糖中，糖衍生物Su(A)的C1经由β-1,4-O-糖苷键连接至GlcNAc部分的C4。

用于修饰糖蛋白的方法可以进一步包括以下步骤：提供包含含有末端GlcNAc部分的聚糖的糖蛋白。因此，本发明还涉及用于修饰糖蛋白的方法，其包括以下步骤：

(1)提供包含含有末端GlcNAc部分的聚糖的糖蛋白，其中含有末端GlcNAc部分的聚糖如上文定义的式(1)或(2)所示；以及

(2)在糖基转移酶的存在下、更特别是在糖基转移酶的作用下，将所述糖蛋白与糖衍生物核苷酸Su(A)-Nuc接触，其中所述糖基转移酶为或衍生自β-(1,4)-N-乙酰半乳糖胺转移酶，并且其中Su(A)-Nuc如上文定义的式(3)所示。

下文更详细地描述了包含含有末端GlcNAc部分的聚糖的糖蛋白、糖衍生物核苷酸Su(A)-Nuc和经修饰的糖蛋白，及其优选的实施方案。

下文更详细地描述了为或衍生自β-(1,4)-N-乙酰半乳糖胺转移酶的糖基转移酶。

在本发明的方法的优选实施方案中，β-(1,4)-N-乙酰半乳糖胺转移酶为或衍生自选自SEQ ID NO:2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、25、26、27、28、29、30、31、32、33、34、46、47、49、50、51、52、53、54、55、56、57、58、59、71、72和73的序列。当R¹⁴为-NHC(O)CH₃、-NHC(O)-(W)_h-(U)_f-(T)_a-A或-N₃时，该实施方案是特别优选的。

在本发明的方法的另一个优选实施方案中，β-(1,4)-N-乙酰半乳糖胺转移酶为或衍生自SEQ ID NO:35、36、37、38、39、40、41、42、43、44、45、48、60、61、62、63、64、65、66、67、68、69、70和74。当R¹⁴为-OH时，该实施方案是特别优选的。

在本发明的方法的另一个优选实施方案中，β-(1,4)-N-乙酰半乳糖胺转移酶与选自SEQ ID NO:2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、25、26、27、28、29、30、31、32、33、34、46、47、49、50、51、52、53、54、55、56、57、58、59、71、72和73的序列具有至少50％的同一性。在该实施方案中进一步优选β-(1,4)-N-乙酰半乳糖胺转移酶与选自SEQ ID NO:2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、25、26、27、28、29、30、31、32、33、34、46、47、49、50、51、52、53、54、55、56、57、58、59、71、72和73的序列具有至少55％的序列同一性，优选至少60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。当R¹⁴为-NHC(O)CH₃、-NHC(O)-(W)_h-(U)_f-(T)_a-A或-N₃时，这些实施方案是特别优选的。

在本发明的方法的另一个优选实施方案中，β-(1,4)-N-乙酰半乳糖胺转移酶与选自SEQ ID NO:35、36、37、38、39、40、41、42、43、44、45、48、60、61、62、63、64、65、66、67、68、69、70和74的序列具有至少50％的同一性。在该实施方案中进一步优选β-(1,4)-N-乙酰半乳糖胺转移酶与选自SEQ ID NO:35、36、37、38、39、40、41、42、43、44、45、48、60、61、62、63、64、65、66、67、68、69、70和74的序列具有至少55％的序列同一性，优选至少60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。当R¹⁴为-OH时，这些实施方案是特别优选的。

糖蛋白

在本发明的方法中待修饰的糖蛋白包含聚糖，所述聚糖含有末端GlcNAc部分，即存在于聚糖的非还原端的GlcNAc部分。所述聚糖包含一个或多个糖部分，并且可以是直链的或支链的。含有末端GlcNAc部分的聚糖如式(1)或(2)所示：

其中：

b为0或1；

d为0或1；

e为0或1；以及

G为单糖，或包含2至20个糖部分的直链或支链寡糖。

所述待修饰的糖蛋白可包含多于一个含有末端GlcNAc部分的聚糖。当是这种情况时，两种或更多种聚糖可互不相同。所述糖蛋白还可以包含一种或多种不含有末端GlcNAc部分的其他聚糖。

核心GlcNAc部分(即连接至蛋白的GlcNAc部分)任选地被岩藻糖基化(b为0或1)。当核心GlcNAc部分被岩藻糖基化时，岩藻糖最通常地将α-1,6连接至所述GlcNAc部分的C6。

应注意，式(1)中b为1的聚糖的GlcNAc部分，即由岩藻糖基化的GlcNAc组成的聚糖中的GlcNAc部分，在本文中也被认为是末端GlcNAc部分。

在一个实施方案中，含有末端GlcNAc部分的聚糖由一个GlcNAc部分组成，并且所述聚糖是式(1)中b为0的聚糖。在另一个实施方案中，所述聚糖由岩藻糖基化的GlcNAc部分组成，并且所述聚糖是式(1)中b为1的聚糖。

在另一个实施方案中，所述聚糖是式(2)的聚糖，其中核心GlcNAc(如果存在)被任选地岩藻糖基化(b为0或1)。在式(2)的聚糖中，G表示单糖或包含1至20个，优选1至12个，更优选1至10个，甚至更优选1、2、3、4、5、6、7或8个，最优选1、2、3、4、5或6个糖部分的直链或支链寡糖。当G是支链寡糖时，G可以包含一个或多个末端GlcNAc部分。因此，式(2)的聚糖可包含一个以上的末端GlcNAc部分。在聚糖(2)中，优选当d为0时，e为1，以及当e为0时，d为1。更优选地，在聚糖(2)中d为1，甚至更优选d为1且e为1。

可存在于聚糖中的糖部分是本领域技术人员已知的，包括例如葡萄糖(Glc)、半乳糖(Gal)、甘露糖(Man)、岩藻糖(Fuc)、N-乙酰葡萄糖胺(GlcNAc)、N-乙酰半乳糖胺(GalNAc)、N-乙酰神经氨酸(NeuNAc)或唾液酸以及木糖(Xyl)。

在本发明的方法的一个优选的实施方案中，含有末端GlcNAc部分的聚糖如式(1)所示，如上所定义。在另一个优选的实施方案中，含有末端GlcNAc部分的聚糖如式(2)所示。进一步优选聚糖是N-连接的聚糖。当聚糖是如式(2)所示的N-连接的聚糖时，优选d为1。

当含有末端GlcNAc部分的聚糖如式(2)所示时，进一步优选如式(2)所示的聚糖是如式(9)、(10)、(11)、(12)、(13)或(14)所示的聚糖：

其中b为0或1。

在本发明的方法的一个优选的实施方案中，含有末端GlcNAc部分的聚糖是如式(1)、(9)、(10)、(11)、(12)、(13)或(14)所示的聚糖，更优选如式(1)、(9)、(10)、(11)、(12)、(13)或(14)所示的N-连接的聚糖。在其他优选的实施方案中，含有末端GlcNAc部分的聚糖是如式(1)、(9)、(10)或(11)所示的聚糖，更优选如式(1)、(9)、(10)或(11)所示的N-连接的聚糖。最优选地，含有末端GlcNAc部分的聚糖是如式(1)或(10)所示的聚糖，更优选如式(1)所示的N-连接的聚糖。

包含含有末端GlcNAc部分的聚糖的糖蛋白优选如式(7)、(8)或(8b)所示：

其中：

b、d、e和G及其优选的实施方案如上所定义；

y独立地为1至24的整数；以及

Pr为蛋白。

在本发明的方法中待修饰的糖蛋白包含一个或多个含有末端GlcNAc部分的聚糖(y为1至24)。优选地，y是1至12的整数，更优选地是1至10的整数。更优选地，y是1、2、3、4、5、6、7或8，还更优选地，y是1、2、3、4、5或6。甚至更优选地，y是1、2、3或4。当所述待修饰的糖蛋白包含多于一个聚糖时(y为2或更多)，所述聚糖可互不相同。如上文所述，糖蛋白还可以包含一个或多个不具有末端GlcNAc部分的聚糖。

当本发明的方法中待修饰的糖蛋白如式(7)、(8)或(8b)所示时，还优选含有末端GlcNAc部分的聚糖是如式(1)、(9)、(10)、(11)、(12)、(13)或(14)所示的聚糖，优选N-连接的聚糖，如上文所述，更优选如式(1)、(9)、(10)或(11)所示且甚至更优选如式(1)或(10)所示的聚糖，优选N-连接的聚糖。最优选地，含有末端GlcNAc部分的聚糖是如式(1)所示的N-连接的聚糖。

在本发明的方法的一个优选的实施方案中，包含含有末端GlcNAc部分的聚糖的糖蛋白是抗体，更优选如式(7)、(8)或(8b)所示的抗体，其中蛋白(Pr)是抗体(Ab)。并且，当待修饰的糖蛋白是抗体且所述抗体包含多于一个聚糖(y为2或更多)时，所述聚糖可互不相同。抗体还可以包含一个或多个不含有末端GlcNAc部分的聚糖。并且，当待修饰的糖蛋白是抗体时，优选含有末端GlcNAc部分的聚糖是如式(1)、(9)、(10)、(11)、(12)、(13)或(14)所示，更优选如式(1)、(9)、(10)或(11)所示，甚至更优选如式(1)或(10)所示的聚糖，如上文所述。在该实施方案中，进一步优选含有末端GlcNAc部分的聚糖是如式(1)、(9)、(10)、(11)、(12)、(13)或(14)所示的N-连接的聚糖，更优选如式(1)、(9)、(10)或(11)所示的N-连接的聚糖，最优选如式(1)或(10)所示的N-连接的聚糖。

当待修饰的糖蛋白是抗体时，优选y为1、2、3、4、5、6、7或8，更优选y为1、2、4、6或8，甚至更优选y是1、2或4，最优选y是1或2。

如上所定义，所述抗体可以是全抗体，但也可以是抗体片段。当抗体是全抗体时，所述抗体优选在每条重链上包含一个或多个，更优选一个末端非还原性GlcNAc聚糖。因此，所述全抗体优选包含2种或更多种，优选2种、4种、6种或8种所述聚糖，更优选2种或4种，最优选2种聚糖。换言之，当所述抗体是全抗体时，y优选为2、4、6或8，更优选y为2或4，最优选y为2。当所述抗体是抗体片段时，优选y为1、2、3或4，更优选y为1或2。

在一个优选的实施方案中，所述抗体是单克隆抗体(mAb)。优选地，所述抗体选自IgA、IgD、IgE、IgG和IgM抗体。更优选地，所述抗体是IgG1、IgG2、IgG3或IgG4抗体，最优选地，所述抗体是IgG1抗体。

在本发明的方法中，包含岩藻糖基化以及非岩藻糖基化的聚糖的糖蛋白混合物可以用作起始糖蛋白。所述混合物例如可以包含含有一个或多个岩藻糖基化的(b为1)聚糖(1)和/或(2)和/或一个或多个非岩藻糖基化的(b为0)聚糖(1)和/或(2)的糖蛋白。因此，在本发明的方法之前从岩藻糖基化的聚糖中除去岩藻糖不是必需的，而是任选的。

包含含有末端GlcNAc部分的聚糖的糖蛋白在本文中也称为“末端非还原性GlcNAc蛋白”，含有末端GlcNAc部分的聚糖在本文中也称为“末端非还原性GlcNAc聚糖”。应注意，术语“末端非还原性GlcNAc蛋白”包括其中b为1的式(7)的蛋白，术语“末端非还原性GlcNAc聚糖”包括其中b为1的式(1)的聚糖。

末端非还原性GlcNAc蛋白可以包含一个或多个直链和/或一个或多个支链的末端非还原性GlcNAc聚糖。聚糖经由聚糖核心糖部分的C1键合至蛋白，并且所述核心糖部分优选是核心GlcNAc部分。因此，当键合至蛋白的末端非还原性GlcNAc聚糖是如式(2)所示的聚糖时，优选d是1。更优选地，当聚糖如式(2)所示时，d为1且e为1。

在优选的实施方案中，末端非还原性GlcNAc聚糖的核心糖部分的C1经由N-糖苷键键合至蛋白，所述N-糖苷键键合至所述蛋白中的氨基酸残基中的氮原子，更优选键合至天冬酰胺(Asn)或精氨酸(Arg)氨基酸的侧链中的氮原子。然而，非还原性GlcNAc聚糖的核心糖部分的C1也可以经由O-糖苷键键合至蛋白，所述O-糖苷键键合至所述蛋白中的氨基酸残基中的氧原子，更优选键合至丝氨酸(Ser)或苏氨酸(Thr)氨基酸的侧链中的氧原子。在该实施方案中，优选所述聚糖的核心糖部分是GlcNAc部分或GalNAc部分，优选GlcNAc部分。非还原性GlcNAc聚糖的核心糖部分的C1也可以经由C-糖苷键键合至蛋白，所述C-糖苷键键合至蛋白上的碳原子，例如键合至色氨酸(Trp)。如上文所述，糖蛋白可以包含多于一个聚糖，并且可以包含N-连接的、O-连接的和/或C-连接的聚糖的组合。

末端非还原性GlcNAc聚糖可以存在于蛋白的天然糖基化位点，但也可以被引入蛋白的不同位点上。

当糖蛋白是抗体时，优选包含末端GlcNAc部分的聚糖连接至Fc片段中的区域290-305中的天冬酰胺处(通常在N297处)的保守N-糖基化位点。

可在本发明的方法中被修饰的末端非还原性GlcNAc蛋白的几个实例示于图1中。图1(A)示出了包含单个、任选地岩藻糖基化的GlcNAc部分的糖蛋白。该GlcNAc聚糖可以例如经由N-糖苷键或O-糖苷键连接至蛋白。图1(A)中的糖蛋白可以例如通过常规表达，然后用内切糖苷酶或内切糖苷酶的组合修剪(trimming)而获得。图1(B)示出了包含支链寡糖聚糖的糖蛋白，其中支链之一含有末端GlcNAc部分(该聚糖也称为GnM₅)。核心GlcNAc部分可任选地被岩藻糖基化。图1(B)中的糖蛋白可以例如通过在苦马豆素的存在下在哺乳动物系统中表达糖蛋白或通过在工程宿主生物体(例如LeC1CHO或毕赤酵母)中表达而获得。图1(C)示出了包含单个、任选地岩藻糖基化的GlcNAc部分的抗体。该GlcNAc聚糖优选地经由N-糖苷键连接至抗体。图1(C)中的糖蛋白可例如通过常规表达、接着用内切糖苷酶或内切糖苷酶的组合修剪来获得。图1(D)示出了包含支链寡糖聚糖的抗体，其中核心GlcNAc部分被任选地岩藻糖基化，并且其中所有支链含有末端GlcNAc部分。图1(D)中的糖蛋白可以例如通过在唾液酸酶和半乳糖苷酶的组合作用下修剪抗体糖型(G0、G1、G2、G0F、G1F和G2F)的常规混合物而获得。

在图2中示出了用于修饰糖蛋白的方法的实施方案，其中糖蛋白是抗体。在该实施方案中，在为或衍生自β-(1,4)-N-乙酰半乳糖胺转移酶的糖基转移酶的作用下，将糖衍生物Su(A)从Su(A)-Nuc转移至抗体聚糖的末端GlcNAc部分，以形成经修饰的抗体。

如上文所述，本发明的用于修饰糖蛋白的方法还可以包括以下步骤：提供包含含有末端GlcNAc部分的聚糖的糖蛋白，因此本发明还涉及用于修饰糖蛋白的方法，其包括以下步骤：

(1)提供包含含有末端GlcNAc部分的聚糖的糖蛋白，其中含有末端GlcNAc部分的聚糖如式(1)或(2)所示，如上文所定义；以及

(2)在糖基转移酶的存在下、更特别是在糖基转移酶的作用下，使所述糖蛋白与糖衍生物核苷酸Su(A)-Nuc接触，其中所述糖基转移酶为或衍生自β-(1,4)-N-乙酰半乳糖胺转移酶，其中Su(A)-Nuc如式(3)所示，如上所定义。

当例如在本发明的方法中待修饰的糖蛋白包含式(1)的聚糖时，在方法的步骤(1)中，待修饰的糖蛋白可以通过包括以下步骤的方法来提供：在合适的酶，优选内切糖苷酶的作用下修剪包含寡糖聚糖的糖蛋白。

在大量的聚糖中，第二GlcNAc残基与直接键合至糖蛋白的GlcNAc残基键合，也如图1(B)和(C)所示。可以修剪其中第二GlcNAc残基与直接键合至糖蛋白的GlcNAc残基键合的聚糖，以获得包含式(1)的聚糖的糖蛋白。修剪发生在所述两个GlcNAc残基之间。

“合适的酶”定义为待修剪的聚糖是其底物的酶。在本发明的方法的该具体实施方案的步骤(1)中待使用的酶的优选类型取决于被修剪的特定的聚糖。在本发明的方法的该具体实施方案的一个优选实施方案中，所述方法的该具体实施方案的步骤(1)中的酶选自内切糖苷酶。

内切糖苷酶能够切割聚糖结构中的内部糖苷键，这为重构和合成工作提供了益处。例如，当内切糖苷酶在保守的聚糖区域内的可预测位点切割时，可以用于使异源聚糖群体容易均化。在这方面，最重要的一类糖苷内切酶包括内-β-N-乙酰葡糖苷酶(EC3.2.1.96，通常称为Endo和ENGase)，一类通过水解N,N’-二乙酰基壳二糖核心中的β-1,4-糖苷键从糖蛋白中除去N-聚糖的水解酶(Wong等人Chem.Rev.2011,111,4259的综述，通过引用的方式纳入本文)，留下单核心N-连接的GlcNAc残基。发现内-β-N-乙酰葡糖苷酶以普通的化学酶变体广泛分布于自然界，所述化学酶变体包括对寡甘露糖特异的Endo D；对高甘露糖特异的Endo A和Endo H；范围从高甘露糖到双触角复合物的Endo F亚型；可以切割除藻糖基化聚糖以外的大多数N-聚糖结构(高甘露糖/复合型/杂合型)，并且对高甘露糖型寡糖的水解活性显著高于对复合型和杂合型寡糖的水解活性的EndoM。这些ENGase对远端N-聚糖结构而不是显示其的蛋白表现出特异性，使得它们可用于在天然条件下从糖蛋白切割大多数N-连接的聚糖。

内切糖苷酶F1、F2和F3最适合天然蛋白的去糖基化。endo F1、F2和F3的连接特异性表明可除去所有类别的N-连接的寡糖而不使蛋白变性的蛋白去糖基化的一般策略。双触角和三触角结构可以分别通过内切糖苷酶F2和F3立即除去。低聚甘露糖和杂合结构可以通过Endo F1除去。

Endo F3的独特之处在于其裂解对寡糖的肽键的状态以及核心岩藻糖基化的状态敏感。内切糖苷酶F3切割天冬酰胺连接的双触角和三触角复合寡糖。它将以缓慢的速率切割非岩藻糖基化的双触角和三触角结构，但仅当肽连接时。核心岩藻糖基化的双触角结构是Endo F3的有效底物，其活性最高达高400倍。对寡甘露糖和杂合分子没有活性。参见例如Tarentino等人Glycobiology 1995,5,599，通过引用的方式纳入本文。

Endo S是来自酿脓链球菌(Streptococcus pyogenes)的分泌的糖苷内切酶，并且也属于糖苷水解酶家族18，如由Collin等人(EMBO J.2001,20,3046，通过引用的方式纳入本文)所公开的。与上述ENGase相比，Endo S具有更明确的特异性，并且仅特异性用于切割人IgG的Fc结构域中的保守N-聚糖(迄今为止尚未鉴定到其他底物)，这表明酶和IgG之间的蛋白-蛋白相互作用提供了这种特异性。

Endo S49，也称为Endo S2，记载于WO 2013/037824(Genovis AB)中，其通过引用的方式纳入本文。Endo S49分离自酿脓链球菌NZ131，并且是Endo S的同源物。Endo S49对天然IgG具有特异性内切糖苷酶活性，并且比Endo S切割更多种类的Fc聚糖。

在一个优选的实施方案中，本实施方案步骤(1)中的酶是内-β-N-乙酰葡糖苷酶。在其他优选的实施方案中，内-β-N-乙酰葡糖苷酶选自Endo S、Endo S49、Endo F1、EndoF2、Endo F3、Endo H、Endo M和Endo A或其组合。

当待修剪的聚糖是复合型的双触角结构时，内-β-N-乙酰葡糖苷酶优选选自EndoS、Endo S49、Endo F1、Endo F2和Endo F3或其组合。

当糖蛋白是抗体并且待修剪的寡糖是复合型的双触角结构(即如图1(C)所示)，并且其存在于N297处的IgG保守的N-糖基化位点时，内-β-N-乙酰葡糖苷酶优选选自Endo S、Endo S49、Endo F1、Endo F2和Endo F3或其组合，更优选选自Endo S和Endo S49或其组合。

当糖蛋白是抗体并且待修剪的聚糖是复合型的双触角结构，并且其不存在于N297处的IgG保守的N-糖基化位点时，内-β-N-乙酰葡糖苷酶优选选自Endo F1、Endo F2和EndoF3或其组合。

当待修剪的聚糖为高甘露糖时，内-β-N-乙酰葡糖苷酶优选选自EndoH、Endo M、Endo A和Endo F1。

因此，当在本发明的方法中待修饰的糖蛋白包含式(1)的聚糖时，在所述方法的步骤(1)中，优选通过包括以下步骤的方法提供待修饰的糖蛋白：通过内-β-N-乙酰葡糖苷酶的作用修剪包含寡糖聚糖的糖蛋白的聚糖，以提供包含式(1)的聚糖的糖蛋白。

在其他优选的实施方案中，内-β-N-乙酰葡糖苷酶选自Endo S、EndoS49、Endo F1、Endo F2、Endo F3、Endo H、Endo M和Endo A及其任意组合。更优选地，内-β-N-乙酰葡糖苷酶选自Endo S、Endo S49、EndoH、Endo F1、Endo F2和Endo F3及其任意组合。甚至更优选地，内-β-N-乙酰葡糖苷酶为Endo S或Endo S49。最优选地，内-β-N-乙酰葡糖苷酶是Endo H或Endo S的组合。

通过用内切糖苷酶处理糖型G0、G1、G2、G0F、G1F和G2F的混合物来提供包含式(1)的聚糖的糖蛋白的方法示于图4中。图4示出了用内切糖苷酶处理包含糖型G0、G1、G2、G0F、G1F和G2F(所述糖型示于图3中)的混合物的糖蛋白(在这种情况下为抗体)，然后使用β-(1,4)-GalNAcT酶从UDP-GalNAz转移例如N-叠氮基乙酰半乳糖胺(GalNAz)，产生式(32)的经修饰的抗体。

当例如在本发明的方法中待修饰的糖蛋白包含式(9)的聚糖时，可以以多种方式提供包含所述聚糖的糖蛋白(也称为“GnM5”)。在该实施方案中，优选糖蛋白通过在苦马豆素存在下杂合的N-糖蛋白的表达来提供，例如在Kanda等人，Glycobiology 2006,17,104中所述的(通过引用的方式纳入本文)，并且如果必要的话随后进行唾液酸酶/半乳糖苷酶处理。替代方法包括对宿主生物体的基因工程。例如，LeC1CHO是缺乏表达Mns-II的基因的敲除CHO细胞系。因此，N-聚糖的生物合成不可避免地停止在聚糖(可从上清液中分离纯化)的GnM₅阶段。更大规模的方法需要工程改造不正常编程以产生杂合或复合N-聚糖的宿主生物体，例如酵母或昆虫细胞。然而，已经充分证明了这些非哺乳动物宿主细胞(例如Glycoswitch^TM)也可用于选择性表达特定N-糖蛋白的单一糖型，包括GnM₅型聚糖和M₅型聚糖。

因此，当在本发明的方法中待修饰的糖蛋白包含式(9)的聚糖时，在所述方法的步骤(1)中，包含式(9)的任选岩藻糖基化的聚糖的糖蛋白优选通过包括在苦马豆素存在下在宿主生物体中表达糖蛋白的方法来提供。优选地，所述宿主生物体是哺乳动物细胞系，例如HEK293或NS0或CHO细胞系。所得糖蛋白可作为包含以下聚糖的蛋白的混合物而获得：式(9)的聚糖(也称为GnM₅)、称为GalGnM5的聚糖、称为SiaGalGnM₅的唾液酸化聚糖和/或其混合物。可以通过用唾液酸酶(除去唾液酸部分)和/或β-半乳糖苷酶(除去半乳糖部分)处理糖蛋白来除去非还原性唾液酸和/或半乳糖部分(如果存在)，从而得到包含式(9)的聚糖的糖蛋白。优选地，用唾液酸酶和β-半乳糖苷酶的处理发生在(1b)中的单一步骤中。在该实施方案中，进一步优选在所述方法的步骤(1)中，通过包括以下步骤的方法提供待修饰的糖蛋白：

(1a)在苦马豆素存在下，在宿主生物体中表达糖蛋白；以及

(1b)用唾液酸酶和/或β-半乳糖苷酶处理所获得的糖蛋白，以获得包含式(9)的聚糖的糖蛋白。

当在本发明的方法中待修饰的糖蛋白包含式(10)的聚糖时，在所述方法的步骤(1)中，待修饰的糖蛋白可以例如通过包括以下步骤的方法提供：用唾液酸酶和半乳糖苷酶处理糖蛋白的糖型G0、G1、G2、G0F、G1F和G2F的混合物。在图3中，示出了包含双触角聚糖的抗体的糖型G0、G1、G2、G0F、G1F和G2F。

图4示出了提供包含式(10)的聚糖的糖蛋白(在这种情况下为抗体)的方法：用唾液酸酶和半乳糖苷酶处理糖型G0、G1、G2、G0F、G1F和G2F的混合物，然后在为β-(1,4)-GalNAcT或衍生自β-(1,4)-GalNAcT的糖基转移酶的作用下从糖衍生物核苷酸Su(A)-UDP(其中A是叠氮基，例如6-叠氮基-GalNAc-UDP)转移糖部分，得到式(33)的经修饰的抗体。

糖衍生物核苷酸Su(A)-Nuc

在本发明的修饰糖蛋白的方法中，包含式(1)或(2)的聚糖的糖蛋白在为β-(1,4)-GalNAcT或衍生自β-(1,4)-GalNAcT的糖基转移酶的作用下与糖衍生物核苷酸Su(A)-Nuc接触。糖衍生物核苷酸Su(A)-Nuc如式(3)所示：

其中Nuc、R¹⁴、a、f、g、U、T、A、Z和Y如上文所定义。

Nuc在本文中定义为核苷酸。Nuc优选选自核苷一磷酸和核苷二磷酸，更优选选自尿苷二磷酸(UDP)、鸟苷二磷酸(GDP)、胸苷二磷酸(TDP)、胞苷二磷酸(CDP)和胞苷一磷酸(CMP)，更优选选自尿苷二磷酸(UDP)、鸟苷二磷酸(GDP)和胞苷二磷酸(CDP)。最优选地，Nuc为尿苷二磷酸(UDP)。因此，在本发明的方法的一个优选的实施方案中，Su(A)-Nuc(3)是Su(A)-UDP(34)：

其中R¹⁴、a、f、g、U、T、A、Z和Y如上文所定义。

在一个实施方案中，A是叠氮基-N₃。

在另一个实施方案中，A是酮基-C(O)R³，其中R³是任选取代的C₁-C₂₄烷基，优选任选取代的C₁-C₁₂烷基，更优选任选取代的C₁-C₆烷基。甚至更优选地，R³是甲基、乙基、正丙基、异丙基、正丁基、仲丁基或叔丁基，最优选地，R³是甲基。

在另一个实施方案中，A是炔基。换言之，A是包含C≡C键的官能部分，优选(杂)环炔基或-(CH₂)_iC≡C-R⁴部分。在一个实施方案中，炔基是(杂)环炔基，优选(杂)环辛炔基。在一个优选的实施方案中，炔基是-(CH₂)_iC≡C-R⁴，其中i是0-10且R⁴是氢或任选取代的C₁-C₂₄烷基，优选氢或任选取代的C₁-C₁₂烷基，更优选氢或任选取代的C₁-C₆烷基。甚至更优选地，R⁴是氢、甲基、乙基、正丙基、异丙基、正丁基、仲丁基或叔丁基，更优选地，R⁴是氢或甲基。优选地，i是0、1、2、3、4、5或6，更优选地，i是0、1、2、3或4，甚至更优选地，i是0、1或2，还甚至更优选地，i是0或1，最优选地，i是1。更优选地，R⁴是氢、甲基、乙基、正丙基、异丙基、正丁基、仲丁基或叔丁基且i是0、1或2。甚至更优选地，R⁴是氢或甲基且i是0、1或2。在该实施方案中，进一步优选炔基是末端炔基，即R⁴最优选为氢。在特别优选的实施方案中，炔基是-CH₂-C≡CH或-C≡CH，最优选地，-CH₂-C≡CH。

在另一个实施方案中，A是巯基-SH。

在另一个实施方案中，A是巯基-SC(O)R⁸的前体，其中R⁸是任选取代的C₁-C₂₄烷基或苯基。优选地，R⁸是任选取代的C₁-C₁₂烷基或苯基，更优选R⁸是任选取代的C₁-C₆烷基或苯基，甚至更优选R⁸是甲基、乙基、正丙基、异丙基、正丁基、仲丁基、叔丁基或苯基。甚至更优选地，R⁸是甲基或苯基，最优选地，R⁸是甲基。在本发明的用于修饰糖蛋白的方法中，可以使用其中A是巯基前体的糖衍生物核苷酸。在该过程中，巯基前体转化为巯基。

在另一个实施方案中，A是-SC(V)OR⁸，其中V是O或S，R⁸是任选取代的C₁-C₂₄烷基或苯基。在一个优选的实施方案中，A是-SC(O)OR⁸。在另一个优选的实施方案中，A是-SC(S)OR⁸。当A是-SC(O)OR⁸以及当A是-SC(S)OR⁸时，R⁸优选是任选取代的C₁-C₁₂烷基或苯基，更优选R⁸是任选取代的C₁-C₆烷基或苯基，甚至更优选R⁸是甲基、乙基、正丙基、异丙基、正丁基、仲丁基、叔丁基或苯基。甚至更优选地，R⁸是甲基或苯基，最优选地，R⁸是甲基。

在另一个实施方案中，A是卤素X。X选自F、Cl、Br和I，优选选自Cl、Br和I，更优选选自Cl和Br。最优选地，X是Cl。

在另一个实施方案中，A是磺酰氧基-OS(O)₂R⁵，其中R⁵选自C₁-C₂₄烷基、C₆-C₂₄芳基、C₇-C₂₄烷基芳基和C₇-C₂₄芳基烷基，烷基、芳基、烷基芳基和芳基烷基被任选地取代。优选地，R⁵是C₁-C₁₂烷基、C₆-C₁₂芳基、C₇-C₁₂烷基芳基或C₇-C₁₂芳基烷基。更优选地，R⁵选自-CH₃、-C₂H₅、C₃直链或支链烷基、C₄直链或支链烷基、C₆-C₁₀芳基及C₇烷基芳基。甚至更优选地，R⁵是甲基、乙基、苯基或对甲苯基。最优选地，磺酰氧基为甲磺酸酯基(-OS(O)₂CH₃)、苯磺酸酯基(-OS(O)₂(C₆H₅))或甲苯磺酸酯基(-OS(O)₂C₆H₄CH₃)。

在另一个实施方案中，A是R¹²，其中R¹²选自任选取代的末端C₂-C₂₄烯基、C₃-C₅环烯基和C₄-C₈链二烯基。

术语“末端烯基”在本文中是指其中碳-碳双键位于烯基的末端的烯基。当R¹²是任选取代的末端C₂-C₂₄烯基时，末端C₂-C₂₄烯基优选以C＝CH₂部分、更优选以C(H)＝CH₂部分结束。优选地，R¹²是任选取代的末端C₂-C₁₂烯基，更优选任选取代的末端C₂-C₆烯基。更优选地，末端烯基是直链烯基，优选未取代的直链烯基。甚至更优选R¹²选自-C(H)＝CH₂、-CH₂-C(H)＝CH₂、-CH₂-CH₂-C(H)＝CH₂、-CH₂-CH₂-CH₂-C(H)＝CH₂和-CH₂-CH₂-CH₂-CH₂-C(H)＝CH₂。还甚至更优选地，R¹²选自-C(H)＝CH₂、-CH₂-C(H)＝CH₂和-CH₂-CH₂-C(H)＝CH₂。还甚至更优选地，R¹²为-C(H)＝CH₂或-CH₂-C(H)＝CH₂，最优选地，R¹²为-C(H)＝CH₂。

当R¹²是任选取代的末端C₃-C₅环烯基时，R¹²优选包含环丙烯基。更优选地，(任选取代的)C₃-C₅环烯基选自：

当R¹²是任选取代的C₄-C₈链二烯基时，优选C₄-C₈链二烯基以C＝CH₂部分、更优选C＝C(H)-C(H)＝CH₂部分结束。优选地，C₄-C₈链二烯基选自C(H)＝C(H)-C(H)＝CH₂、CH₂-C＝C(H)-C(H)＝CH₂和CH₂-CH₂-C＝C(H)-C(H)＝CH₂，更优选地选自C(H)＝C(H)-C(H)＝CH₂和CH₂-C＝C(H)-C(H)＝CH₂。当R¹²是任选取代的C₄-C₈链二烯基时，最优选R¹²是C(H)＝C(H)-C(H)＝CH₂。

在另一个实施方案中，A是R¹³，其中R¹³是任选取代的末端C₃-C₂₄丙二烯基。在本文中，术语“末端丙二烯基”是指其中C＝C＝C部分位于丙二烯基的末端的丙二烯基。末端C₃-C₂₄烯基优选以–C(H)＝C＝CH₂部分结束。优选地，R¹³是任选取代的末端C₃-C₁₂烯基，更优选任选取代的末端C₃-C₆烯基。更优选地，末端丙二烯基是直链丙二烯基，优选未取代的直链丙二烯基。甚至更优选地，R¹³选自-C(H)＝C＝CH₂、-CH₂-C(H)＝C＝CH₂、-CH₂-CH₂-C(H)＝C＝CH₂和-CH₂-CH₂-CH₂-C(H)＝C＝CH₂。还甚至更优选地，R¹³选自-C(H)＝C＝CH₂和-CH₂-C(H)＝C＝CH₂。最优选地，R¹³是-C(H)＝C＝CH₂。当A是R¹³时，特别优选在Su(A)-Nuc(3)中，U和T都不存在，即特别优选a是0且f是0。

在另一个实施方案中，A是N(R¹⁷)₂，其中R¹⁷独立地选自H、C₁-C₁₂烷基。在上下文中，优选的R¹⁷的烷基是C₁–C₆烷基，最优选C₁–C₄烷基。优选地，R¹⁷的至少一个为H且A为NHR¹⁷，最优选两个R¹⁷均为H且A为NH₂。当A为N(R¹⁷)₂时，优选在Su(A)-Nuc(3)中，Y不存在，即g为0，更优选U和T也都不存在，即特别优选g为0、a为0且f为0。

在本发明的方法的优选实施方案中，Su(A)-Nuc(3)中的A和下文更详细描述的(3)的优选实施方案选自-N₃、-C(O)R³、-SH、-(CH₂)_iC≡CR⁴和R¹²，其中i、R³、R⁴、R¹²及其优选实施方案如上文所定义。更优选地，A选自-N₃、-C(O)CH₃、-SH、-CH＝CH₂和-CH₂C≡CH。最优选A是N₃。

在糖衍生物核苷酸Su(A)-Nuc(3)及其优选实施方案(例如(34))中，R¹⁴选自：

其中W、h、a、f、T、A和U如上所定义。

在糖衍生物核苷酸Su(A)-Nuc(3)的优选实施方案中，R¹⁴选自：

其中W、h、a、f、T、A和U如上文所定义。

最优选R¹⁴是-NHAc。

当R¹⁴是-NHC(O)-(W)_h-(U)_f-(T)_a-A时，W、h、a、f、T、A和U如上文所定义。下文更详细地描述了W、h、a、f、T和U的优选实施方案。A的优选实施方案如上文更详细描述的。

在本发明的方法的优选实施方案中，Su(A)-Nuc(3)中的R¹⁴是-NHC(O)CH₃。在该实施方案中，糖衍生物核苷酸Su(A)-Nuc如式(3a)所示：

其中Nuc、Z、Y、U、T、A、g、f和a如上文所定义。

此外，当糖衍生物核苷酸Su(A)-Nuc如式(3a)所示或根据其优选实施方案时，优选Nuc为UDP。

此外，同样在Su(A)-Nuc(3a)中，A优选选自-N₃、-C(O)R³、-SH、-(CH₂)_iC≡CR⁴和R¹²，其中i、R³、R⁴、R¹²及其优选实施方案如上文所定义。更优选地，A选自-N₃、-C(O)CH₃、-SH、-CH＝CH₂和-CH₂C≡CH。最优选地，A是N₃。

在特别优选的实施方案中，在Su(A)-Nuc(3a)中Nuc是UDP，A选自-N₃、-C(O)R³、-SH、-(CH₂)_iC≡CR⁴和R¹²，其中i、R³、R⁴、R¹²及其优选实施方案如上文所定义。甚至更优选地，Nuc是UDP，A选自-N₃、-C(O)CH₃、-SH、-CH＝CH₂和-CH₂C≡CH。最优选地，Nuc是UDP，A是N₃。

在本发明的方法的另一个优选实施方案中，R¹⁴是-NHC(O)-(W)_h-(U)_f-(T)_a-A。在该实施方案中，糖衍生物核苷酸Su(A)-Nuc如式(3b)所示：

其中Nuc、Z、Y、U、T、A、W、h、g、f和a如上文所定义。

在糖衍生物核苷酸Su(A)-Nuc(3b)中，独立地选择A、T、U、a和f。换言之，(3b)的C2上的取代基中的A、T、U、a和f可以不同于(3b)的C6上的取代基中的A、T、U、a和f。

此外，当Su(A)-Nuc如式(3b)所示或根据其优选实施方案时，优选Nuc为UDP。

此外，同样在Su(A)-Nuc(3b)中，A优选选自-N₃、-C(O)R³、-SH、-(CH₂)_iC≡CR⁴和R¹²，其中i、R³、R⁴、R¹²及其优选实施方案如上文所定义。更优选地，A选自-N₃、-C(O)CH₃、-SH、-CH＝CH₂和-CH₂C≡CH。最优选地，A是N₃。

在特别优选的实施方案中，在Su(A)-Nuc(3b)中Nuc是UDP，A选自-N₃、-C(O)R³、-SH、-(CH₂)_iC≡CR⁴和R¹²，其中i、R³、R⁴、R¹²及其优选实施方案如上文所定义。甚至更优选地，Nuc是UDP，A选自-N₃、-C(O)CH₃、-SH、-CH＝CH₂和-CH₂C≡CH。最优选地，Nuc是UDP，A是N₃。

在本发明的方法的另一个优选实施方案中，R¹⁴是-OH。因此，在该实施方案中，糖衍生物核苷酸Su(A)-Nuc如式(3c)所示：

其中Nuc、Z、Y、U、T、A、g、f和a如上所定义。

此外，当糖衍生物核苷酸Su(A)-Nuc如式(3c)所示或根据其优选实施方案时，优选Nuc为UDP。

此外，同样在Su(A)-Nuc(3c)中，A优选选自-N₃、-C(O)R³、-SH、-(CH₂)_iC≡CR⁴和R¹²，其中i、R³、R⁴、R¹²及其优选实施方案如上文所定义。更优选地，A选自-N₃、-C(O)CH₃、-SH、-CH＝CH₂和-CH₂C≡CH。最优选地，A是N₃。

在特别优选的实施方案中，在Su(A)-Nuc(3c)中Nuc是UDP，A选自-N₃、-C(O)R³、-SH、-(CH₂)_iC≡CR⁴和R¹²，其中i、R³、R⁴、R¹²及其优选实施方案如上文所定义。甚至更优选地，Nuc是UDP，A选自-N₃、-C(O)CH₃、-SH、-CH＝CH₂和-CH₂C≡CH。最优选地，Nuc是UDP，A是N₃。

在本发明的方法的另一个优选实施方案中，R¹⁴是-N₃。因此，在该实施方案中，糖衍生物核苷酸Su(A)-Nuc如式(3d)所示：

其中Nuc、Z、Y、U、T、A、g、f和a如上文所定义。

此外，当糖衍生物核苷酸Su(A)-Nuc如式(3d)所示或根据其优选实施方案时，优选Nuc为UDP。

此外，同样在Su(A)-Nuc(3d)中，A优选选自-N₃、-C(O)R³、-SH、-(CH₂)_iC≡CR⁴和R¹²，其中i、R³、R⁴、R¹²及其优选实施方案如上所定义。更优选地，A选自-N₃、-C(O)CH₃、-SH、-CH＝CH₂和-CH₂C≡CH。最优选地，A是N₃。

在特别优选的实施方案中，在Su(A)-Nuc(3d)中Nuc是UDP，A选自-N₃、-C(O)R³、-SH、-(CH₂)_iC≡CR⁴和R¹²，其中i、R³、R⁴、R¹²及其优选实施方案如上文所定义。甚至更优选地，Nuc是UDP，A选自-N₃、-C(O)CH₃、-SH、-CH＝CH₂和-CH₂C≡CH。最优选地，Nuc是UDP，A是N₃。

在Su(A)-Nuc(3)及其优选实施方案(例如(34)、(3a)、(3b)、(3c)或(3d))中，T是C₃-C₁₂(杂)亚芳基，其中(杂)亚芳基被任选地取代。在一个优选的实施方案中，T不存在(a是0)。在另一个优选实施方案中，T存在(a是1)。当a为1时，(3)中的(杂)亚芳基T被A取代，其中A如上文所定义。

(杂)亚芳基T任选进一步被一个或多个取代基R²取代，其中R²独立地选自卤素(-F、-Cl、-Br、-I，优选-F、-Cl、-Br)、-CN、-NO₂、-C(O)R⁹、-C(O)OR⁹、-C(O)N(R¹⁰)₂、C₁-C₁₂烷基、C₂-C₁₂烯基、C₂-C₁₂炔基、C₃-C₁₂环烷基、C₅-C₁₂环烯基、C₈-C₁₂环炔基、C₁-C₁₂烷氧基、C₂-C₁₂烯氧基、C₂-C₁₂炔氧基、C₃-C₁₂环烷氧基、氨基(优选-N(R¹⁰)₂)、氧代基团和-Si(R⁷)₃基团，其中烷基、烯基、炔基、环烷基、环烯基、环炔基、烷氧基、烯氧基、炔氧基和环烷氧基被一个或多个选自O、N和S的杂原子任选地间隔，其中R⁷独立地选自C₁-C₁₂烷基、C₂-C₁₂烯基、C₂-C₁₂炔基、C₃-C₁₂环烷基、C₁-C₁₂烷氧基、C₂-C₁₂烯氧基、C₂-C₁₂炔氧基和C₃-C₁₂环烷氧基，其中烷基、烯基、炔基、环烷基、烷氧基、烯氧基、炔氧基和环烷氧基被任选地取代，其中R⁹是C₁-C₁₂烷基，其中R¹⁰独立地选自氢和C₁-C₁₂烷基。优选地，R⁹是C₁-C₆烷基，甚至更优选C₁-C₄烷基，最优选甲基、乙基、正丙基、异丙基、正丁基、仲丁基或叔丁基。优选地，R¹⁰是氢或C₁-C₆烷基，更优选氢或C₁-C₄烷基，最优选R¹⁰是氢、甲基、乙基、正丙基、异丙基、正丁基、仲丁基或叔丁基。

当R²是-Si(R⁷)₃基团时，优选R⁷独立地是C₁-C₁₂烷基，更优选独立地是C₁-C₆烷基，甚至更优选独立地是C₁-C₄烷基，最优选R⁷独立地是甲基、乙基、正丙基、异丙基、正丁基、仲丁基或叔丁基。

优选地，R²(存在时)独立地选自-F、-Cl、-Br、-I、-CN、-NO₂、-C(O)R⁹、-C(O)OR⁹、-C(O)N(R¹⁰)₂、C₁-C₁₂烷基、C₁-C₁₂烷氧基、氨基(-N(R¹⁰)₂)、氧代基团和-Si(R⁷)₃基团，其中R⁷、R⁹、R¹⁰以及R⁷、R⁹、R¹⁰的优选实施方案如上文所定义。

更优选地，R²(存在时)独立地选自-F、-Cl、-Br、-CN、-NO₂、-C(O)R⁹、-C(O)OR⁹、-C(O)N(R¹⁰)₂、C₁-C₆烷基、C₁-C₆烷氧基、氨基、氧代基团和-Si(R⁷)₃基团，其中R⁷、R⁹、R¹⁰以及R⁷、R⁹、R¹⁰的优选实施方案如上文所定义。

甚至更优选地，R²(存在时)独立地选自-F、-Cl、-Br、-CN、-NO₂、-C(O)R⁹、-C(O)OR⁹、-C(O)N(R¹⁰)₂、C₁-C₄烷基和C₁-C₄烷氧基，其中R⁹和R¹⁰以及R⁹和R¹⁰的优选实施方案如上文所定义。

还甚至更优选地，R²(存在时)独立地选自-F、-Cl、-Br、-CN、-NO₂、甲基、甲氧基、乙基、乙氧基、正丙基、正丙氧基、异丙基、异丙氧基、正丁基、正丁氧基、仲丁基、仲丁氧基、叔丁基和叔丁氧基。最优选地，R²(存在时)独立地选自-F、-Cl、-Br、-CN、-NO₂、甲基和甲氧基。

在一个优选的实施方案中，(3)中的(杂)亚芳基是未取代的。在另一个优选实施方案中，(3)中的(杂)亚芳基包含一个或多个取代基R²，其中R²和R²的优选实施方案如上文所定义。

术语“(杂)亚芳基”在本文中是指亚芳基以及杂亚芳基。术语“(杂)亚芳基”在本文中是指单环(杂)亚芳基以及双环(杂)亚芳基。Su(A)-Nuc(3)中的(杂)亚芳基可以是任何亚芳基或任何杂亚芳基。

在本发明的方法的一个优选实施方案中，(3)中的(杂)亚芳基T选自亚苯基、亚萘基、亚蒽基、亚吡咯基、亚吡咯鎓(pyrroliumylene)基、亚呋喃基、亚噻吩(thiophenylene)基(即亚噻吩(thiofuranylene)基)、亚吡唑基、亚咪唑基、亚嘧啶鎓(pyrimidiniumylene)基、亚咪唑鎓(imidazoliumylene)基、亚异噁唑基、亚噁唑基、亚噁唑鎓(oxazoliumylene)基、亚异噻唑基、亚噻唑基、1,2,3-亚三唑基、1,3,4-亚三唑基、亚二唑基、1-氧杂-2,3-亚二唑基、1-氧杂-2,4-亚二唑基、1-氧杂-2,5-亚二唑基、1-氧杂-3,4-亚二唑基、1-硫杂-2,3-亚二唑基、1-硫杂-2,4-亚二唑基、1-硫杂-2,5-亚二唑基、1-硫杂-3,4-亚二唑基、亚四唑基、亚吡啶基、亚哒嗪基、亚嘧啶基、亚吡嗪基、亚吡二嗪基、亚吡啶鎓(pyridiniumylene)基、亚嘧啶鎓(pyrimidiniumylene)基、亚苯并呋喃基、亚苯并噻吩基、亚苯并咪唑基、亚吲唑基、亚苯并三唑基、吡咯并[2,3-b]亚吡啶基、吡咯并[2,3-c]亚吡啶基、吡咯并[3,2-c]亚吡啶基、吡咯并[3,2-b]亚吡啶基、咪唑并[4,5-b]亚吡啶基、咪唑并[4,5-c]亚吡啶基、吡唑并[4,3-d]亚吡啶基、吡唑并[4,3-c]亚吡啶基、吡唑并[3,4-c]亚吡啶基、吡唑并[3,4-b]亚吡啶基、亚异吲哚基、亚吲唑基、亚嘌呤基、亚二氢吲哚基(indolininylene group)、咪唑并[1,2-a]亚吡啶基、咪唑并[1,5-a]亚吡啶基、吡唑并[1,5-a]亚吡啶基、吡咯并[1,2-b]亚哒嗪基、咪唑并[1,2-c]亚嘧啶基、亚喹啉基、亚异喹啉基、亚噌啉基、亚喹唑啉基、亚喹喔啉基、亚酞嗪基、1,6-亚萘啶基、1,7-亚萘啶基、1,8-亚萘啶基、1,5-亚萘啶基、2,6-亚萘啶基、2,7-亚萘啶基、吡啶并[3,2-d]亚嘧啶基、吡啶并[4,3-d]亚嘧啶基、吡啶并[3,4-d]亚嘧啶基、吡啶并[2,3-d]亚嘧啶基、吡啶并[2,3-b]亚吡嗪基、吡啶并[3,4-b]亚吡嗪基、嘧啶并[5,4-d]亚嘧啶基、吡嗪并[2,3-b]亚吡嗪基和嘧啶并[4,5-d]亚嘧啶基，所有的基团任选地用一个或多个取代基R²取代，其中R²和R²的优选实施方案如上文所定义。

在其他优选的实施方案中，(杂)亚芳基T选自亚苯基、亚吡啶基、亚吡啶鎓基、亚嘧啶基、亚嘧啶鎓基、亚吡嗪基、亚吡二嗪基、亚吡咯基、亚吡咯鎓基、亚呋喃基、亚噻吩基(即亚噻吩(thiofuranylene)基)、亚二唑基、亚喹啉基、亚咪唑基、亚嘧啶鎓基、亚咪唑鎓基、亚噁唑基和亚噁唑鎓基，所有的基团任选地用一个或多个取代基R²取代，其中R²和R²的优选实施方案如上文所定义。

甚至更优选地，(杂)亚芳基T选自亚苯基、亚吡啶基、亚吡啶鎓基、亚嘧啶基、亚嘧啶鎓基、亚咪唑基、亚嘧啶鎓基、亚咪唑鎓基、亚吡咯基、亚呋喃基和亚噻吩基，所有的基团任选地用一个或多个取代基R²取代，其中R²和R²的优选实施方案如上文所定义。

最优选地，(杂)芳基T选自亚苯基、亚咪唑基、亚咪唑鎓基、亚嘧啶鎓基、亚吡啶基、亚吡啶鎓基，所有的基团任选地用一个或多个取代基R²取代，其中R²和R²的优选实施方案如上文所定义。

在Su(A)-Nuc(3)及其优选实施方案(例如(34)、(3a)、(3b)、(3c)或(3d))中，U可以存在(f是1)或不存在(f是0)。存在时，U是[C(R¹)₂]_n，其中n是1至24的整数；或U是[C(R¹)₂]_p-O-[C(R¹)₂C(R¹)₂O]_o-[C(R¹)₂]_q，其中o是0至12的整数，p和q独立地为0、1或2，R¹独立地选自H、F、Cl、Br、I、OH和任选取代的C₁-C₂₄烷基。当U是[C(R¹)₂]_p-O-[C(R¹)₂C(R¹)₂O]_o-[C(R¹)₂]_q时，优选p、o和q中的至少一个不是0。

在优选的实施方案中，U不存在，即f是0。

在另一个优选的实施方案中，U存在，即f是1。

当U是[C(R¹)₂]_n时，n是1至24的整数，n优选1至12的整数。更优选n为1、2、3、4、5、6、7或8，甚至更优选n为1、2、3、4、5或6，还甚至更优选n为1、2、3或4，还甚至更优选n为1、2或3，最优选n为1或2。

R¹独立地选自H、F、Cl、Br、I和任选取代的C₁-C₂₄烷基，优选选自H、F、Cl、Br、I和任选取代的C₁-C₁₂烷基，更优选选自H、F、Cl、Br、I和任选取代的C₁-C₆烷基。甚至更优选地，R¹独立地选自H、F、Cl、Br、I、甲基、乙基、正丙基、异丙基、正丁基、仲丁基或叔丁基。甚至更优选地，R¹独立地选自H、F、Cl和甲基，最优选地，R¹独立地选自H和F。

当U为[C(R¹)₂]_n且n为1或2时，Su(A)-Nuc中的-[C(R¹)₂]_n-部分的优选实例包括-(CH₂)-、-(CF₂)-、-(CCl₂)-、-(CBr₂)-、-(CMe₂)-、-(CH₂CH₂)-、-(CH₂CF₂)-、-(CH₂CCl₂)-、-(CH₂CBr₂)-、-(CH₂CI₂)-、-(CH₂CMe₂)-、-(CF₂CF₂)-、-(CCl₂CCl₂)-、-(CBr₂CBr₂)-和-(CMe₂CMe₂)-，更优选地，-(CH₂)-、-(CF₂)-、-(CH₂CH₂)-、-(CH₂CF₂)-和-(CF₂CF₂)-。

当U为[C(R¹)₂]_n且n为3或更大时，Su(A)-Nuc中的-[C(R¹)₂]_n-部分的优选实例包括-(C_nH_2n)-、-(C_nF_2n)-、-(C_nCl_2n)-、-(C_nBr_2n)-、-(C_(n-1)H_2(n-1)CF₂)-、-(C_(n-1)H_2(n-1)CCl₂)-、-(C_(n-1)H_2(n-1)CBr₂)-和-(C_(n-1)H_2(n-1)CMe₂)-，例如-(C₃H₆)-、-(C₃F₆)-、-(C₃Cl₆)-、-(C₃Br₆)-、-(CH₂CH₂CF₂)-、-(CH₂CH₂CCl₂)-、-(CH₂CH₂CBr₂)-和-(C₄H₈)-。更优选的实例包括-(C_nH_2n)-、-(C_nF_2n)-，例如-(C₃H₆)-、-(C₄H₈)-、-(C₃F₆)-和-(C₄F₈)-。

当U为[C(R¹)₂]_p-O-[C(R¹)2C(R¹)₂O]o-[C(R¹)₂]_q时，o是0至12的整数，p和q独立地为0、1或2。优选地，o是1至10的整数，更优选地，o是1、2、3、4、5、6、7或8，甚至更优选地，o是1、2、3、4、5或6，还甚至更优选地，o是1、2、3或4，还甚至更优选地，o是1、2或3，还甚至更优选地，o是1或2，最优选地，o是1。在另一个优选的实施方案中，o为0。特别优选o为0、1或2。当o为0时，进一步优选当p为0时，q为1或2，当q为0时，p为1或2。

当U为[C(R¹)₂]_p-O-[C(R¹)₂C(R¹)₂O]o-[C(R¹)₂]_q且o和/或p和/或q为1或更大时，R¹独立地选自H、F、Cl、Br、I和任选取代的C₁-C₂₄烷基，优选选自H、F、Cl、Br、I和任选取代的C₁-C₁₂烷基，更优选选自H、F、Cl、Br、I和任选取代的C₁-C₆烷基。甚至更优选地，R¹独立地选自H、F、Cl、Br、I、甲基、乙基、正丙基、异丙基、正丁基、仲丁基或叔丁基。甚至更优选地，R¹独立地选自H、F、Cl和甲基。最优选地，R¹为H。

当U是[C(R¹)₂]_p-O-[C(R¹)₂C(R¹)₂O]o-[C(R¹)₂]_q时，Su(A)-Nuc中的-[C(R¹)₂]_p-O-[C(R¹)₂C(R¹)₂O]o-[C(R¹)₂]_q-部分的优选实例包括-CH₂-O-、-(CH₂)₂-O-、-O-CH₂-、-O-(CH₂)₂-、-CH₂-O-(CH₂CH₂O)_o-、-(CH₂)₂-O-(CH₂CH₂O)_o-、-O-(CH₂CH₂O)_o-、-O-(CH₂CH₂O)_o-CH₂-、-O-(CH₂CH₂O)_o-(CH₂)₂-、-CH₂-O-(CH₂CH₂O)_o-CH₂-、-CH₂-O-(CH₂CH₂O)_o-(CH₂)₂-、-(CH₂)₂-O-(CH₂CH₂O)_o-CH₂-和-(CH₂)₂-O-(CH₂CH₂O)_o-(CH₂)₂-，其中o是1、2、3、4、5或6，优选o是1、2、3或4，更优选o是1或2，最优选o是1。

在糖衍生物核苷酸Su(A)-Nuc(3)及其优选实施方案(例如(34)、(3a)、(3b)、(3c)或(3d))中，优选a和f不都为0。在另一个优选的实施方案中，a为0且f为1，或者a为1且f为0。在这些实施方案中，g可为0或1。

在本发明方法的优选实施方案中，a为0，f为1且U为[C(R¹)₂]_n。在该实施方案中，进一步优选a是0，f为1且n为1至12，更优选a为0，f为1且n为1、2、3、4、5、6、7或8，甚至更优选a为0，f为1且n为1、2、3、4、5或6，还甚至更优选a为0，f为1且n为1、2、3或4，还甚至更优选a为0，f为1且n为1或2，最优选a为0，f为1且n为1。[C(R¹)₂]_n的优选实例如上文更详细描述的。

在本发明的方法的另一个优选实施方案中，a为0，f为1且U为[C(R¹)₂]_p-O-[C(R¹)₂C(R¹)₂O]o-[C(R¹)₂]_q。更优选p、o和q不都为0，即o为1至12的整数和/或p为1或2和/或q为1或2。在该实施方案中，进一步优选a为0，f为1且o为1至12，更优选a为0，f为1且o为1至10，甚至更优选a为0，f为1且o为1、2，1、2、3、4、5、6、7或8，甚至更优选地，a为0，f为1且o为1、2、3、4、5或6，还甚至更优选地，a为0，f为1且o为1、2、3或4，还甚至更优选a为0，f为1且o为1或2，最优选a为0，f为1且o为1。同样在该实施方案中，p和q独立地为0、1或2。[C(R¹)₂]_p-O-[C(R¹)₂C(R¹)₂O]o-[C(R¹)₂]_q的优选实例如上文更详细描述的。

在另一个优选实施方案中，a为1，f为1且U为[C(R¹)₂]_n。在该实施方案中，进一步优选n为1至12，更优选n为1、2、3、4、5、6、7或8，甚至更优选n为1、2、3、4、5或6，还甚至更优选n为1、2、3或4，还甚至更优选n为1或2，最优选n为1。[C(R¹)₂]_n的优选实例如上文更详细描述的。

在另一个优选实施方案中，a为1，f为1且U为[C(R¹)₂]_p-O-[C(R¹)₂C(R¹)₂O]o-[C(R¹)₂]_q，o为1至12的整数，p和q独立地为0、1或2。在该实施方案中，进一步优选o为1至10，更优选o为1、2、3、4、5、6、7或8，甚至更优选o为1、2、3、4、5或6，还甚至更优选o为1、2、3或4，还甚至更优选o为1或2，最优选o为1。在该实施方案中，p和q独立地为0、1或2。[C(R¹)₂]_p-O-[C(R¹)₂C(R¹)₂O]o-[C(R¹)₂]_q的优选实例如上文更详细描述的。

如上文所定义，在Su(A)-Nuc(3)及其优选实施方案(例如(34)、(3a)、(3b)、(3C)或(3d))中，Z为CH₂、CF₂或C(O)；或Z为CHOH，条件是g为0、f为1且a为0或1。在优选的实施方案中，Z选自CH₂、CF₂和C(O)。在另一个优选的实施方案中，Z为CHOH，条件是g为0、f为1且a为0或1。

在Su(A)-Nuc(3)及其优选实施方案(例如(34)、(3a)、(3b)、(3C)或(3d))中，Y可以不存在(g为0)或存在(g为1)。当Y存在时，Y选自O、S、N(R¹⁵)、N(R¹⁵)C(O)、N(R¹⁵)C(O)N(R¹⁵)、N(R¹⁵)C(O)O、OC(O)N(R¹⁵)S(O)₂N(R¹⁵)和N(R¹⁵)C(O)N(R¹⁵)S(O)₂O，其中R¹⁵独立地选自H、C₁-C₁₂烷基和(U)_f-(T)_a-A，其中f、a、U、T和A如上所定义。优选地，Y选自O、S、N(R¹⁵)、NHC(O)、NHC(O)N(R¹⁵)、NHC(O)O，OC(O)NHS(O)₂NH和NHC(O)NHS(O)₂O，其中R¹⁵独立地选自H、C₁-C₁₂烷基和(U)_f-(T)_a-A，其中f、a、U、T和A如上文所定义。在这些实施方案中，进一步优选R¹⁵独立地选自H、C₁–C₆烷基和(U)_f-(T)_a-A，其中f、a、U、T和A如上文所定义。更优选地，R¹⁵独立地选自H、甲基、乙基、异丙基、正丙基和(U)_f-(T)_a-A，其中f、a、U、T和A如上文所定义。最优选地，R¹⁵选自H和甲基。

在优选的实施方案中，Z是CH₂且g是1。在该实施方案中，进一步优选Y选自O、S、N(R¹⁵)、N(R¹⁵)C(O)、N(R¹⁵)C(O)N(R¹⁵)和N(R¹⁵)C(O)O，更优选选自O、S、N(R¹⁵)、NHC(O)、NHC(O)N(R¹⁵)和NHC(O)O，其中R¹⁵和R¹⁵的优选实施方案如上文所定义。

在另一个优选的实施方案中，Z是C(O)，g是1。在该实施方案中，进一步优选Y是N(R¹⁵)，其中R¹⁵和R¹⁵的优选实施方案如上所定义。

因此，在本发明的方法的优选实施方案中，糖衍生物核苷酸Su(A)-Nuc如式(15)、(16)、(17)或(18)所示：

其中Nuc、a、f、R¹⁴、R¹⁵、A、U和T如上文所定义。

在(15)、(16)、(17)和(18)的优选实施方案中，R¹⁴是-OH。在另一个优选的实施方案中，R¹⁴是-N₃。在另一个优选的实施方案中，R¹⁴是-NHC(O)CH₃。在另一个优选的实施方案中，R¹⁴是-NHC(O)-(W)_h-(U)_f-(T)_a-A，其中W、U、T、A、h、f和a如上文所定义。在这些实施方案中，进一步优选Nuc是UDP。

(15)、(16)、(17)和(18)中的U、T、a和f的优选实施方案如上文所述。如上文所定义的A的优选实施方案也适用于(15)、(16)、(17)和(18)。

在(15)、(16)、(17)和(18)的特别优选的实施方案中，a是0，f是1，U是-CH₂CF₂-。在该实施方案中，进一步优选A为N₃。

在(15)、(16)、(17)和(18)的另一个特别优选的实施方案中，a是1，T优选为任选取代的苯基。如上所述，苯基任选被R²取代，优选地，R²选自H，F，Cl和Br，更优选地选自H、F和Cl，最优选地选自H和F。在该实施方案中，f为0或1，当f为1时，U优选为-CH₂-。在这些实施方案中，进一步优选A为N₃。优选地，A存在于任选取代的苯基的对位。

在本发明的方法的优选实施方案中，糖衍生物核苷酸Su(A)-Nuc如式(19)、(20)、(21)、(22)、(23)、(24)、(25)、(26)、(65)或(66)所示，优选地如(19)、(20)、(21)、(22)、(23)、(24)、(25)或(26)所示：

其中：

R¹⁴和R¹⁵如上所定义；以及

R¹⁶独立地选自H和F。

在本发明的方法的优选实施方案中，糖衍生物核苷酸Su(A)-Nuc如式(67)、(68)或(69)所示：

其中R¹⁴如上文所定义。

在其他优选的实施方案中，R¹⁵选自H和C₁-C₁₂烷基，优选选自H和C₁–C₆烷基，更优选选自H、甲基、乙基、异丙基、正丙基、正丁基、仲丁基和叔丁基，最优选选自H和甲基。在另一个优选的实施方案中，R¹⁵是(U)_f-(T)_a-A，其中f、a、U、T和A及其优选实施方案如上文所定义。当R¹⁵为(U)_f-(T)_a-A时，优选R¹⁵的(U)_f-(T)_a-A基团对应于源自Su(A)-Nuc(3)中的Z-(Y)_g-(U)_f-(T)_a-A部分的(U)_f-(T)_a-A基团。例如，当(24)中的R¹⁵为(U)_f-(T)_a-A时，优选R¹⁵为-(C₆H₄(N₃))，N₃在苯基的对位。在这些实施方案中，优选Nuc为UDP。

在如上所述的(19)、(20)、(21)、(22)、(23)、(24)、(25)、(26)、(65)、(66)、(67)、(68)和(69)及其优选实施方案的优选实施方案中，R¹⁴是-OH。在另一个优选的实施方案中，R¹⁴为-N₃。在另一个优选的实施方案中，R¹⁴是-NHC(O)CH₃。在另一个优选的实施方案中，R¹⁴是-NHC(O)-(W)_h-(U)_f-(T)_a-A，其中W、U、T、A、h、f和a如上文所定义。同样在这些实施方案中，还优选Nuc为UDP。

在优选的实施方案中，R¹⁴为-N₃。在本发明的方法的另一个优选实施方案中，R¹⁴选自：

其中a、f、h、T、A、U和W及其优选实施方案如上文所定义。

在本发明的方法的其他优选的实施方案中，糖衍生物核苷酸Su(A)-Nuc如式(27)、(28)、(29)、(30)或(31)所示，或如式(36)所示：

其中Nuc如上文所定义。

在本发明的方法进一步优选的实施方案中，其中R¹⁴是OH。在该实施方案中，进一步优选糖衍生物核苷酸Su(A)-Nuc如式(35)所示：

其中Nuc如上文所定义。

此外，当Su(A)-Nuc如式(27)、(28)、(29)、(30)、(31)、(35)或(36)所示时，优选Nuc是UDP。

酶

本发明的方法包括以下步骤：在糖基转移酶的存在下、更特别是在糖基转移酶的作用下，将包含含有末端GlcNAc部分的聚糖的糖蛋白与糖衍生物核苷酸Su(A)-Nuc接触，以提供经修饰的糖蛋白，其中所述糖基转移酶为或衍生自β-(1,4)-N-乙酰半乳糖胺转移酶。在本文中，β-(1,4)-N-乙酰半乳糖胺转移酶也称为β(1,4)-GalNAcT酶、或β-(1,4)-GalNAcT或GalNAcT。

β-(1,4)-N-乙酰半乳糖胺转移酶(β-(1,4)-GalNAcT)是本领域已知的。通常，β-(1,4)-GalNAcT是催化N-乙酰半乳糖胺(GalNAc)从尿苷二磷酸-GalNAc(UDP-GalNAc，也称为GalNAc-UDP)转移至糖蛋白聚糖的末端GlcNAc部分的酶，其中GalNAc部分的C1经由β-1,4-O-糖苷键连接至GlcNAc部分的C4。如上文更详细描述的，其中b是1的式(1)的聚糖中的GlcNAc部分，即由岩藻糖基化的GlcNAc组成的聚糖中的GlcNAc部分在本文中也被认为是末端GlcNAc部分。

在本发明的方法中，为或衍生自β-(1,4)-GalNAcT的糖基转移酶催化糖衍生物Su(A)从糖衍生物核苷酸Su(A)-Nuc转移至糖蛋白聚糖的末端GlcNAc部分，以提供经修饰的糖蛋白，其中Su(A)如式(6)所示、Su(A)-Nuc如式(3)所示、含有末端GlcNAc部分的聚糖如式(1)或(2)所示且经修饰的糖蛋白如式(4)或(5)所示，如上文所述。在该方法中，Su(A)部分的C1经由β-1,4-O-糖苷键连接至GlcNAc部分的C4。

优选地，本发明的方法中使用的β-(1,4)-GalNAcT酶为或衍生自无脊椎动物β-(1,4)-GalNAcT酶，即为或衍生自来源于无脊椎动物物种的β-(1,4)-GalNAcT。β-(1,4)-GalNAcT酶可以为或可以衍生自本领域技术人员已知的任何无脊椎动物β-(1,4)-GalNAcT酶。优选地，β-(1,4)-GalNAcT酶为或衍生自来源于线虫动物门(Nematoda)、优选来源于色矛纲(Chromadorea)或胞管肾纲(Secernentea)，或来源于节肢动物门(Arthropoda)，优选来源于昆虫纲(Insecta)的β-(1,4)-GalNAcT酶。优选地，β-(1,4)-GalNAcT酶为或衍生自来源于秀丽隐杆线虫(Caenorhabditis elegans)、腐生水果线虫(Caenorhabditisremanei)、Caenorhabditis briggsae、猪蛔虫(Ascaris suum)、粉纹夜蛾(Trichoplusiani)、黑腹果蝇(Drosophila melanogaster)、吴策线虫(Wuchereriabancrofti)、罗阿丝虫(Loa loa)、毕氏粗角猛蚁(Cerapachys biroi)、湿木白蚁(Zootermopsis nevadensis)、佛罗里达弓背蚁(Camponotusfloridanus)、长牡蛎(Crassostrea gigas)或大红斑蝶(Danaus plexippus)，优选来源于秀丽隐杆线虫、猪蛔虫、粉纹夜蛾或黑腹果蝇的β-(1,4)-GalNAcT酶。更优选地，β-(1,4)-GalNAcT酶为或衍生自来源于秀丽隐杆线虫、猪蛔虫或粉纹夜蛾的β-(1,4)-GalNAcT酶。在其他优选的实施方案中，β-(1,4)-GalNAcT酶为或衍生自来源于猪蛔虫的β-(1,4)-GalNAcT酶。在另一个优选的实施方案中，β-(1,4)-GalNAcT酶为或衍生自来源于粉纹夜蛾的β-(1,4)-GalNAcT酶。在另一个优选的实施方案中，β-(1,4)-GalNAcT酶为或衍生自来源于秀丽隐杆线虫的β-(1,4)-GalNAcT酶。

在本文中，秀丽隐杆线虫也称为Ce，猪蛔虫也称为As，粉纹夜蛾也称为Tn，黑腹果蝇也称为Dm。

优选地，用于本发明的方法的β-(1,4)-GalNAcT酶与选自SEQ ID NO:2-5和15-23的序列，更优选与选自SEQ ID NO:2-5的序列具有至少40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。换言之，优选用于本发明的方法的β-(1,4)-GalNAcT酶与选自SEQ IDNO:2、SEQ ID NO:3、SEQ ID NO:4和SEQ ID NO:5、SEQ ID NO:15、SEQ ID NO:16、SEQ IDNO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22和SEQID NO:23的序列，更优选与选自SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4和SEQ ID NO:5的序列，甚至更优选与选自SEQ ID NO:2、SEQ ID NO:3和SEQ ID NO:4的序列，甚至更优选与选自SEQ ID NO:3和SEQ ID NO:4的序列，最优选与SEQ ID NO:4具有至少40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。

优选地，用于本发明的方法的β-(1,4)-GalNAcT酶为或衍生自选自如下的任何天然存在的或野生型β-(1,4)-GalNAcT酶：本文中命名为CeGalNAcT的秀丽隐杆线虫β-(1,4)-GalNAcT(SEQ ID NO:2)、本文中命名为AsGalNAcT的猪蛔虫β-(1,4)-GalNAcT(SEQ ID NO:3)、本文中命名为TnGalNAcT的粉纹夜蛾β-(1,4)-GalNAcT(SEQ ID NO:4)、本文中命名为DmGalNAcT的黑腹果蝇β-(1,4)-GalNAcT(SEQ ID NO:5)、腐生水果线虫β-(1,4)-GalNAcT(SEQ ID NO:15)、Caenorhabditis briggsaeβ-(1,4)-GalNAcT(SEQ ID NO:16)、吴策线虫β-(1,4)-GalNAcT(SEQ ID NO:17)、罗阿丝虫β-(1,4)-GalNAcT(SEQ ID NO:18)、毕氏粗角猛蚁β-(1,4)-GalNAcT(SEQ ID NO:19)、湿木白蚁β-(1,4)-GalNAcT(SEQ ID NO:20)、佛罗里达弓背蚁β-(1,4)-GalNAcT(SEQ ID NO:21)、长牡蛎β-(1,4)-GalNAcT(SEQ ID NO:22)和大红斑蝶β-(1,4)-GalNAcT(SEQ ID NO:23)。

在优选的实施方案中，用于本发明的方法的β-(1,4)-GalNAcT酶为或衍生自选自如下的任何天然存在的或野生型β-(1,4)-GalNAcT酶：本文中命名为CeGalNAcT的秀丽隐杆线虫β-(1,4)-GalNAcT(SEQ ID NO:2)、本文中命名为AsGalNAcT的猪蛔虫β-(1,4)-GalNAcT(SEQ ID NO:3)、本文中命名为TnGalNAcT的粉纹夜蛾β-(1,4)-GalNAcT(SEQ ID NO:4)和本文中命名为DmGalNAcT的黑腹果蝇β-(1,4)-GalNAcT(SEQ ID NO:5)。

在另一个优选的实施方案中，用于本发明的方法的β-(1,4)-GalNAcT酶为或衍生自选自如下的任何天然存在的或野生型β-(1,4)-GalNAcT酶：本文中命名为CeGalNAcT的秀丽隐杆线虫β-(1,4)-GalNAcT(SEQ ID NO:2)、本文中命名为AsGalNAcT的猪蛔虫β-(1,4)-GalNAcT(SEQ ID NO:3)和本文中命名为TnGalNAcT的粉纹夜蛾β-(1,4)-GalNAcT(SEQ IDNO:4)。

在另一个优选的实施方案中，用于本发明的方法的β-(1,4)-GalNAcT酶为或衍生自选自如下的任何天然存在的或野生型β-(1,4)-GalNAcT酶：本文中命名为AsGalNAcT的猪蛔虫β-(1,4)-GalNAcT(SEQ ID NO:3)和本文中命名为TnGalNAcT的粉纹夜蛾β-(1,4)-GalNAcT(SEQ ID NO:4)。

在特别优选的实施方案中，用于本发明的方法的β-(1,4)-GalNAcT酶为或衍生自本文中命名为TnGalNAcT的粉纹夜蛾β-(1,4)-GalNAcT(SEQ ID NO:4)。

在另一个优选的实施方案中，用于本发明的方法的β-(1,4)-GalNAcT酶是β-(1,4)-GalNAcT酶，其为或衍生自来源于无脊椎动物物种的β-(1,4)-GalNAcT酶，所述无脊椎动物为线虫动物门、优选色矛纲(Chromadorea)、优选杆线虫目(Rhabditida)、优选小杆科(Rhabditidae)、优选新杆状线虫属(Caenorhabditis)。优选地，用于本发明的方法的β-(1,4)-GalNAcT酶与SEQ ID NO:2、15和16的序列具有至少40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。更优选地，所述无脊椎动物物种是秀丽隐杆线虫。优选地，用于本发明的方法的β-(1,4)-GalNAcT酶与SEQ ID NO:2具有至少40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。

在另一个优选的实施方案中，用于本发明的方法的β-(1,4)-GalNAcT酶为或衍生自来源于无脊椎动物物种的β-(1,4)-GalNAcT酶，所述无脊椎动物为线虫动物门、优选胞管肾纲(Secernentea)、优选蛔目(Ascaridida)、优选蛔虫科(Ascarididae)、优选蛔虫属(Ascaris)。更优选地，所述无脊椎动物物种是猪蛔虫(Ascaris Sum)。优选地，用于本发明的方法的β-(1,4)-GalNAcT酶与SEQ ID NO:3的序列具有至少40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。

在另一个优选的实施方案中，用于本发明的方法的β-(1,4)-GalNAcT酶为或衍生自来源于无脊椎动物物种的β-(1,4)-GalNAcT酶，所述无脊椎动物物种为节肢动物门(Anthropoda)、优选昆虫纲(Insecta)、优选鳞翅目(Lepidoptera)、优选夜蛾科(Noctuidae)、优选粉纹夜蛾属(Trichoplusia)。更优选地，所述无脊椎动物物种是粉纹夜蛾。粉纹夜蛾有时也可称为Phytometra brassicae、Plusia innata或甘蓝银纹夜蛾(cabbage looper)。优选地，用于本发明的方法的β-(1,4)-GalNAcT酶与SEQ ID NO:4的序列具有至少40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。

在另一个优选的实施方案中，用于本发明的方法的β-(1,4)-GalNAcT酶为或衍生自来源于无脊椎动物物种的β-(1,4)-GalNAcT酶，所述无脊椎动物物种为节肢动物门、优选昆虫纲(Insecta)、优选双翅目(Diptera)、优选果蝇科(Drosophilidae)、优选果蝇属(Drosophila)。更优选地，所述无脊椎动物物种是黑腹果蝇。优选地，用于本发明的方法的β-(1,4)-GalNAcT酶与SEQ ID NO:5的序列具有至少40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。

在本文中，“衍生自”β-(1,4)-GalNAcT酶应理解为具有分别通过置换、插入、缺失或添加一个或多个，优选1、2、3、4、5、6、7、8、9、10、12、14、16、18、20或更多个氨基酸而改变自天然存在的β-(1,4)-GalNAcT酶的氨基酸序列的β-(1,4)-GalNAcT酶。在本文中，衍生自β-(1,4)-GalNAcT酶的β-(1,4)-GalNAcT酶也称为衍生的β-(1,4)-GalNAcT酶或修饰的β-(1,4)-GalNAcT酶或β-(1,4)-GalNAcT突变酶或β-(1,4)-GalNAcT突变体。

衍生的酶是本领域已知的，包括已经经过氨基酸序列的常规和标准修饰的酶，例如去除跨膜结构域、包含标签(例如如本文所述的溶解性和/或纯化标签)。得到具有经修饰的氨基酸序列的酶的这些方法是本领域公知的，并且包括在本发明的方法中。

在一个实施方案中，衍生的酶——即与本文提及的天然存在的β-(1,4)-GalNAcT酶具有小于100％的序列同一性——优选具有天然存在的β-(1,4)-GalNAcT酶的酶活性的至少10％、20％、30％、40％、50％、60％、70％或优选至少80％或90％或至少100％的酶活性。在本文中，将活性方便地测定为将(修饰的)GalNAc残基掺入糖蛋白的末端GlcNAc残基上的功效。

所述酶不是半乳糖基转移酶。在一个实施方案中，所述酶不是归类为E.C.2.4.1.38或归类为E.C.2.4.1.133的酶，优选不是归类为E.C.2.4.1.22、归类为E.C.2.4.1.38、归类为E.C.2.4.1.90或归类为E.C.2.4.1.133的酶。

在一个实施方案中，所述酶是归类为E.C.2.4.1.41、归类为E.C.2.4.1.92、归类为E.C.2.4.1.174或归类为E.C.2.4.1.244的酶，优选归类为E.C.2.4.1.92或归类为E.C.2.4.1.244的酶。

优选地，通过添加额外的N-或C-末端氨基酸或化学部分，或通过缺失N-或C-末端氨基酸来修饰所述衍生的β-(1,4)-GalNAcT酶以增加稳定性、溶解性、活性和/或易于纯化。

优选地，通过缺失N-末端胞质结构域和跨膜结构域来修饰β-(1,4)-GalNAcT酶，其在本文中称为截短的酶。本领域已知这些结构域的缺失产生在水溶液中表现出增加的溶解度的酶。

例如，CeGalNAcT(30-383)在本文中应理解为由SEQ ID NO:2的第30-383位上的氨基酸表示的氨基酸序列组成的截短的秀丽隐杆线虫β-(1,4)-GalNAcT酶。类似地，AsGalNAcT(30-383)在本文中应理解为由SEQ ID NO:3的第30-383位上的氨基酸表示的氨基酸序列组成的截短的猪蛔虫β-(1,4)-GalNAcT酶，TnGalNAcT(33-421)在本文中应理解为由SEQ ID NO:4的第33-421位上的氨基酸表示的氨基酸序列组成的截短的粉纹夜蛾β-(1,4)-GalNAcT酶，DmGalNAcT(47-403)在本文中应理解为由SEQ ID NO:5的第47-403位上的氨基酸表示的氨基酸序列组成的截短的黑腹果蝇β-(1,4)-GalNAcT酶。

优选地，用于本发明的方法的β-(1,4)-GalNAcT酶与SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8或SEQ ID NO:9的任一序列，更优选与SEQ ID NO:6、SEQ ID NO:7或SEQ IDNO:8的序列，甚至更优选与SEQ ID NO:7或SEQ ID NO:8的序列，甚至更优选与序列SEQ IDNO:8具有至少40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选至少100％的序列同一性。

其中一个或多个氨基酸已被置换、添加或缺失的β-(1,4)-GalNAcT酶在本文中也称为衍生的β-(1,4)-GalNAcT酶。优选地，通过缺失N-末端胞质结构域和跨膜结构域来修饰，并通过置换一个或多个氨基酸来修饰β-(1,4)-GalNAcT酶。在本文中，一个或多个氨基酸的置换也称为突变。包含一个或多个置换的氨基酸的酶也称为突变酶。

在本发明的方法中，当糖基转移酶衍生自秀丽隐杆线虫β-(1,4)-GalNAcT酶或截短的β-(1,4)-GalNAcT酶时，优选所述酶还包含一个或多个突变。优选的突变包括在第257位由亮氨酸(Leu，也称为L)、甲硫氨酸(Met，也称为M)或丙氨酸(Ala，也称为A)置换异亮氨酸(Ile，也称为I)。优选的突变还包括在第312位由组氨酸(His，也称为H)置换甲硫氨酸(Met，也称为M)。因此，当糖基转移酶衍生自CeGalNAcT或CeGalNAcT(30-383)时，优选所述酶包含I257L、I257M或I257A突变，和/或M312H突变。

应注意，在本文中氨基酸位置的编号是基于野生型β-(1,4)-GalNAcT酶中氨基酸位置的编号。当β-(1,4)-GalNAcT酶是例如截短的酶时，本文中用来表示例如氨基酸置换的位置的数字对应于相应的野生型β-(1,4)-GalNAcT酶中的氨基酸位置的编号。

作为实例，在野生型CeGalNAcT(SEQ ID NO:2)中，异亮氨酸(Ile，I)存在于第257位氨基酸位置上。在CeGalNAcT(I257L)中，第257位的异亮氨酸氨基酸被亮氨酸氨基酸(Leu，L)置换。如上所述，CeGalNAcT(30-383)在本文中应理解为由SEQ ID NO:2的第30-383位的氨基酸表示的氨基酸序列组成的截短的CeGalNAcT酶，而CeGalNAcT(30-383)本身由SEQ ID NO:6表示。在CeGalNAcT(30-383；I257L)中，I257L中的数字“257”表示它是相应野生型CeGalNAcT中的第257位上的I氨基酸(即用L氨基酸置换的SEQ ID NO:2的数字257)。在SEQ ID NO:2的第257位的异亮氨酸氨基酸由SEQ ID NO:6的第228位的异亮氨酸氨基酸表示。

优选的截短的秀丽隐杆线虫β-(1,4)-GalNAcT突变酶包括CeGalNAcT(30-383；I257L)(SEQ ID NO:10)、CeGalNAcT(30-383；I257M)(SEQ ID NO:11)、CeGalNAcT(30-383；I257A)(SEQ ID NO:12)和CeGalNAcT(30-383；M312H)(SEQ ID NO:13)。

在本发明的方法中，当糖基转移酶衍生自粉纹夜蛾β-(1,4)-GalNAcT酶或截短的粉纹夜蛾β-(1,4)-GalNAcT酶时，优选所述酶还包含一个或多个突变。优选的突变包括在第336位由苯丙氨酸(Phe，也称为F)、组氨酸(His，也称为H)或缬氨酸(Val，也称为V)置换色氨酸(Trp，也称为W)。因此，当糖基转移酶衍生自TnGalNAcT或TnGalNAcT(33-421)时，优选所述酶包含W336F、W336H或W336V突变。TnGalNAcT或TnGalNAcT(33-421)的优选突变还包括在第339位由丙氨酸(Ala，也称为A)、甘氨酸(Gly，也称为G)、天冬氨酸(Asp，也称为D)或丝氨酸(Ser，也称为S)置换谷氨酸(Glu，也称为E)。因此，当糖基转移酶衍生自TnGalNAcT或TnGalNAcT(33-421)时，优选所述酶包含E339A、E339G、E339D或E339S突变。更优选地，当糖基转移酶衍生自TnGalNAcT或TnGalNAcT(33-421)时，第336位和第339位均如上所述突变。因此，当糖基转移酶衍生自TnGalNAcT或TnGalNAcT(33-421)时，优选所述酶包含W336F、W336H或W336V突变或E339A、E339G、E339D或E339S突变。

TnGalNAcT或TnGalNAcT(33-421)的优选突变还包括在第311位由酪氨酸(Tyr，也称为Y)置换异亮氨酸(Ile，也称为I)。因此，当糖基转移酶衍生自TnGalNAcT或TnGalNAcT(33-421)时，优选所述酶包含I311Y突变。

当糖基转移酶衍生自TnGalNAcT或TnGalNAcT(33-421)且包含I311Y突变时，所述酶还可以包含如上所述的第336位上的突变和/或如上所述的第339位上的突变。因此，当糖基转移酶衍生自包含I311Y突变的TnGalNAcT或TnGalNAcT(33-421)时，所述酶还可以包含W336F、W336H或W336V突变和/或E339A、E339G、E339D或E339S突变。

在本发明的方法的优选实施方案中，为或衍生自β-(1,4)-GalNAcT酶的糖基转移酶是选自以下的粉纹夜蛾β-(1,4)-GalNAcT酶：TnGalNAcT(33-421；W336F)(SEQ ID NO:25)、TnGalNAcT(33-421；W336H)(SEQ ID NO:26)、TnGalNAcT(33-421；W336V)(SEQ ID NO:27)、TnGalNAcT(33-421；E339A)(SEQ ID NO:28)、TnGalNAcT(33-421；E339G)(SEQ ID NO:29)、TnGalNAcT(33-421；E339D)(SEQ IDNO:30)和TnGalNAcT(33-421；E339S)(SEQ ID NO:31)。

在本发明的方法的另一个优选实施方案中，为或衍生自β-(1,4)-GalNAcT酶的糖基转移酶为选自TnGalNAcT(33-421；W336H、E339A)(SEQ ID NO:32)、TnGalNAcT(33-421；W336H、E339D)(SEQ ID NO:33)和TnGalNAcT(33-421；W336H、E339S)(SEQ IDNO:34)的粉纹夜蛾β-(1,4)-GalNAcT酶。

在本发明的方法的另一个优选实施方案中，为或衍生自β-(1,4)-GalNAcT酶的糖基转移酶为粉纹夜蛾β-(1,4)-GalNAcT酶TnGalNAcT(33-421；I311Y)(SEQ ID NO:35)。

在本发明的方法的另一个优选实施方案中，为或衍生自β-(1,4)-GalNAcT酶的糖基转移酶为选自TnGalNAcT(33-421；I311Y、W336F)(SEQ ID NO:36)、TnGalNAcT(33-421；I311Y、W336H)(SEQ ID NO:37)、TnGalNAcT(33-421；I311Y、W336V)(SEQ IDNO:38)、TnGalNAcT(33-421；I311Y、E339A)(SEQ ID NO:39)、TnGalNAcT(33-421；I311Y、E339G)(SEQID NO:40)、TnGalNAcT(33-421；I311Y、E339D)(SEQ ID NO:41)和TnGalNAcT(33-421；I311Y、E339S)(SEQ ID NO:42)的粉纹夜蛾β-(1,4)-GalNAcT酶。

在本发明的方法的另一个优选实施方案中，为或衍生自β-(1,4)-GalNAcT酶的糖基转移酶为选自TnGalNAcT(33-421；I311Y、W336H、E339A)(SEQ ID NO:43)、TnGalNAcT(33-421；I311Y、W336H、E339D)(SEQ ID NO:44)和TnGalNAcT(33-421；I311Y、W336H、E339S)(SEQID NO:45)的粉纹夜蛾β-(1,4)-GalNAcT酶。

在本发明的方法中，当糖基转移酶衍生自猪蛔虫β-(1,4)-GalNAcT酶或截短的猪蛔虫β-(1,4)-GalNAcT酶时，优选所述酶还包含一个或多个突变。优选的突变包括在第282位由组氨酸(His，也称为H)置换色氨酸(Trp，也称为W)，和/或在第285位由天冬氨酸(Asp，也称为D)置换谷氨酸(Glu，也称为E)，和/或在第257位由酪氨酸(Tyr，也称为Y)置换异亮氨酸(Ile，也称为I)。因此，当糖基转移酶衍生自AsGalNAcT或AsGalNAcT(30-383)时，优选所述酶包含W282H突变、E285D突变和/或I257Y突变。

在本发明的方法的一个优选实施方案中，为或衍生自β-(1,4)-GalNAcT酶的糖基转移酶是选自以下的猪蛔虫β-(1,4)-GalNAcT：AsGalNAcT(30-383；W282H)(SEQ ID NO:46)和AsGalNAcT(30-383；E285D)(SEQ ID NO:47)。

在本发明的方法的另一个优选实施方案中，为或衍生自β-(1,4)-GalNAcT酶的糖基转移酶是猪蛔虫β-(1,4)-GalNAcT：AsGalNAcT(30-383；I257Y)(SEQ ID NO:48)。

在本发明的方法的另一个优选实施方案中，为或衍生自β-(1,4)-GalNAcT酶的糖基转移酶是选自以下的猪蛔虫β-(1,4)-GalNAcT：AsGalNAcT(30-383；I257Y、W282H)和AsGalNAcT(30-383；I257Y、E285D)。

在本发明的方法的优选实施方案中，本文中定义的为或衍生自β-(1,4)-GalNAcT酶的糖基转移酶包含编码易于纯化的标签的序列。优选地，所述标签选自但不限于FLAG标签、聚(His)标签、HA标签、Myc标签、SUMO标签、GST标签、MBP标签或CBP标签，更优选所述标签为6xHis标签。其他优选的待被掺入酶中的标签为可溶性标签，例如AFV标签、SlyD标签、Tsf标签、SUMO标签、Bla标签、MBP标签和GST标签。在其他优选的实施方案中，所述标签共价连接至β-(1,4)-GalNAcT酶的C-末端。在另一个优选的实施方案中，所述标签共价连接至β-(1,4)-GalNAcT酶的N-末端。

当β-(1,4)-GalNAcT酶衍生自秀丽隐杆线虫β-(1,4)-GalNAcT时，His-标记的β-(1,4)-GalNAcT酶优选为CeGalNAcT(30-383)-His(SEQ ID NO:14)。

在本发明的方法的一个优选的实施方案中，当β-(1,4)-GalNAcT酶为或衍生自粉纹夜蛾β-(1,4)-GalNAcT时，His-标记的β-(1,4)-GalNAcT酶为或衍生自His-TnGalNAcT(33-421)(SEQ ID NO:49)。

在本发明的方法的另一个优选实施方案中，当β-(1,4)-GalNAcT酶为或衍生自粉纹夜蛾β-(1,4)-GalNAcT时，His-标记的β-(1,4)-GalNAcT酶为或衍生自His-TnGalNAcT(33-421；W336F)(SEQ ID NO:50)、His-TnGalNAcT(33-421；W336H)(SEQ ID NO:51)、His-TnGalNAcT(33-421；W336V)(SEQ ID NO:52)、His-TnGalNAcT(33-421；339A)(SEQ ID NO:53)、His-TnGalNAcT(33-421；E339G)(SEQ ID NO:54)、His-TnGalNAcT(33-421；E339D)(SEQID NO:55)、His-TnGalNAcT(33-421；E339S)(SEQ ID NO:56)、His-TnGalNAcT(33-421；W336H、E339A)(SEQ ID NO:57)、His-TnGalNAcT(33-421；W336H、E339D)(SEQ ID NO:58)或His-TnGalNAcT(33-421；W336H、E339S)(SEQ ID NO:59)。

在本发明的方法的另一个优选实施方案中，当β-(1,4)-GalNAcT酶为或衍生自粉纹夜蛾β-(1,4)-GalNAcT时，His-标记的β-(1,4)-GalNAcT酶为或衍生自His-TnGalNAcT(33-421；I311Y)(SEQ ID NO:60)。

在本发明的方法的另一个优选实施方案中，当β-(1,4)-GalNAcT酶为或衍生自粉纹夜蛾β-(1,4)-GalNAcT时，His-标记的β-(1,4)-GalNAcT酶为或衍生自His-TnGalNAcT(33-421；I311Y、W336F)(SEQ ID NO:61)、His-TnGalNAcT(33-421；I311Y、W336H)(SEQ IDNO:62)、His-TnGalNAcT(33-421；I311Y、W336V)(SEQ ID NO:63)、His-TnGalNAcT(33-421；I311Y、E339A)(SEQ ID NO:64)、His-TnGalNAcT(33-421；I311Y、E336G)(SEQ ID NO:65)、His-TnGalNAcT(33-421；I311Y、E339D)(SEQ ID NO:66)、His-TnGalNAcT(33-421；I311Y、E339S)(SEQ ID NO:67)、His-TnGalNAcT(33-421；I311Y、W336H、E339A)(SEQ ID NO:68)、His-TnGalNAcT(33-421；I311Y、W336H、E339D)(SEQ ID NO:69)或His-TnGalNAcT(33-421；I311Y、W336H、E339S)(SEQ ID NO:70)。

在本发明的方法的另一个优选实施方案中，当β-(1,4)-GalNAcT酶为或衍生自猪蛔虫β-(1,4)-GalNAcT时，His-标记的β-(1,4)-GalNAcT酶为或衍生自His-AsGalNAcT(30-383)(SEQ ID NO:71)。

在本发明的方法的另一个优选实施方案中，当β-(1,4)-GalNAcT酶为或衍生自猪蛔虫β-(1,4)-GalNAcT时，His-标记的β-(1,4)-GalNAcT酶为或衍生自His-AsGalNAcT(30-383；W282H)(SEQ ID NO:72)、His-AsGalNAcT(30-383；E285D)(SEQ ID NO:73)或His-AsGalNAcT(30-383；I257Y)(SEQ ID NO:74)。

在本发明的方法的优选实施方案中，用于所述方法的β-(1,4)-N-乙酰半乳糖胺转移酶为或衍生自选自SEQ ID NO:2-23和SEQ ID NO:25-74的序列。

在本发明的方法的优选实施方案中，用于所述方法的β-(1,4)-N-乙酰半乳糖胺转移酶为或衍生自选自SEQ ID NO:2-23的序列。换言之，在优选的实施方案中，用于本发明的方法的β-(1,4)-N-乙酰半乳糖胺转移酶为或衍生自选自以下的序列：SEQ ID NO:2、SEQ IDNO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ IDNO:21、SEQ ID NO:22和SEQ ID NO:23。

在本文中，术语“衍生自”包括例如截短的酶、突变酶和包含易于纯化的标签的酶，这些修饰在上文更详细地描述。术语“衍生自”还包括包含在上文更详细描述的修饰的组合的酶。

在另一个优选的实施方案中，用于本发明的方法的β-(1,4)-N-乙酰半乳糖胺转移酶与选自SEQ ID NO:2-23，即选自SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22和SEQ ID NO:23的序列具有至少50％的同一性，优选至少55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。

在本发明的方法的优选实施方案中，用于所述方法的β-(1,4)-N-乙酰半乳糖胺转移酶为或衍生自选自SEQ ID NO:2-9的序列。换言之，在优选的实施方案中，用于本发明的方法的β-(1,4)-N-乙酰半乳糖胺转移酶为或衍生自选自以下的序列：SEQ ID NO:2、SEQ IDNO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8和SEQ ID NO:9。

在另一个优选的实施方案中，用于本发明的方法的β-(1,4)-N-乙酰半乳糖胺转移酶与选自SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ IDNO:7、SEQ ID NO:8和SEQ ID NO:9的序列具有至少50％的同一性，优选至少55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。

在本发明的方法的另一个优选实施方案中，用于所述方法的β-(1,4)-N-乙酰半乳糖胺转移酶为或衍生自选自SEQ ID NO:25-45和SEQ ID NO:50-70的序列。换言之，在优选的实施方案中，用于本发明的方法的β-(1,4)-N-乙酰半乳糖胺转移酶为或衍生自选自以下的序列：SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQID NO:30、SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:33、SEQ ID NO:34、SEQ ID NO:35、SEQID NO:36、SEQ ID NO:37、SEQ ID NO:38、SEQ ID NO:39、SEQ ID NO:40、SEQ ID NO:41、SEQID NO:42、SEQ ID NO:43、SEQ ID NO:44、SEQ ID NO:45、SEQ ID NO:50、SEQ ID NO:51、SEQID NO:52、SEQ ID NO:53、SEQ ID NO:54、SEQ ID NO:55、SEQ ID NO:56、SEQ ID NO:57、SEQID NO:58、SEQ ID NO:59、SEQ ID NO:60、SEQ ID NO:61、SEQ ID NO:62、SEQ ID NO:63、SEQID NO:64、SEQ ID NO:65、SEQ ID NO:66、SEQ ID NO:67、SEQ ID NO:68、SEQ ID NO:69和SEQ ID NO:70。

在另一个优选的实施方案中，用于本发明的方法的β-(1,4)-N-乙酰半乳糖胺转移酶与选自SEQ ID NO:25-45和SEQ ID NO:50-70的序列，即与选自SEQ ID NO:25、SEQ IDNO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ IDNO:32、SEQ ID NO:33、SEQ ID NO:34、SEQ ID NO:35、SEQ ID NO:36、SEQ ID NO:37、SEQ IDNO:38、SEQ ID NO:39、SEQ ID NO:40、SEQ ID NO:41、SEQ ID NO:42、SEQ ID NO:43、SEQ IDNO:44、SEQ ID NO:45、SEQ ID NO:50、SEQ ID NO:51、SEQ ID NO:52、SEQ ID NO:53、SEQ IDNO:54、SEQ ID NO:55、SEQ ID NO:56、SEQ ID NO:57、SEQ ID NO:58、SEQ ID NO:59、SEQ IDNO:60、SEQ ID NO:61、SEQ ID NO:62、SEQ ID NO:63、SEQ ID NO:64、SEQ ID NO:65、SEQ IDNO:66、SEQ ID NO:67、SEQ ID NO:68、SEQ ID NO:69和SEQ ID NO:70的序列具有至少50％的同一性，优选至少55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。

在本发明的方法的另一个优选实施方案中，用于所述方法的β-(1,4)-N-乙酰半乳糖胺转移酶为或衍生自选自SEQ ID NO:46-49和SEQ ID NO:71-74的序列。换言之，在优选的实施方案中，用于本发明的方法的β-(1,4)-N-乙酰半乳糖胺转移酶为或衍生自选自以下的序列：SEQ ID NO:46、SEQ ID NO:47、SEQ ID NO:48、SEQ ID NO:49、SEQ ID NO:71、SEQID NO:72、SEQ ID NO:73和SEQ ID NO:74。

在另一个优选的实施方案中，用于本发明的方法的β-(1,4)-N-乙酰半乳糖胺转移酶与选自SEQ ID NO:46-49和SEQ ID NO:71-74的序列，即选自SEQ ID NO:46、SEQ ID NO:47、SEQ ID NO:48、SEQ ID NO:49、SEQ ID NO:71、SEQ ID NO:72、SEQ ID NO:73和SEQ IDNO:74的序列具有至少50％的序列同一性，优选至少55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。

在本发明的方法中，糖衍生物核苷酸Su(A)-Nuc如式(3)或其优选的实施方案所示，如上文中更详细描述的。R¹⁴选自：

其中W、h、a、f、T、A和U及其优选实施方案如上文所定义。

当R¹⁴为-NHC(O)CH₃时优选的糖基转移酶

在本发明的方法的优选实施方案中，R¹⁴是-NHC(O)CH₃。在该实施方案中，糖衍生物核苷酸Su(A)-Nuc如式(3a)所示，如上文所定义的。

当Su(A)-Nuc如式(3a)或如上文所述的(3a)的优选实施方案所示时，在所述方法的优选实施方案中，为或衍生自β-(1,4)-GalNAcT的糖基转移酶为或衍生自野生型β-(1,4)-GalNAcT，优选无脊椎动物β-(1,4)-GalNAcT。在所述方法的另一个优选实施方案中，糖基转移酶为或衍生自无脊椎动物β-(1,4)-GalNAcT。在另一个优选的实施方案中，糖基转移酶为或衍生自秀丽隐杆线虫β-(1,4)-GalNAcT(CeGalNAcT)、猪蛔虫β-(1,4)-GalNAcT(AsGalNAcT)或粉纹夜蛾β-(1,4)-GalNAcT(TnGalNAcT)。为或衍生自(CeGalNAcT)、(AsGalNAcT)或(TnGalNAcT)的β-(1,4)-GalNAcT如上文中更详细描述的。

当糖衍生物核苷酸Su(A)-Nuc中的R¹⁴为-NHC(O)CH₃时，特别优选用于所述方法的β-(1,4)-N-乙酰半乳糖胺转移酶为或衍生自选自SEQ ID NO:2-9，即选自SEQ ID NO:2、SEQID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8和SEQ IDNO:9的序列。更优选地，当R¹⁴为-NHC(O)CH₃时，用于所述方法的β-(1,4)-N-乙酰半乳糖胺转移酶为或衍生自选自SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8，甚至更优选选自SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8，甚至更优选选自SEQ ID NO:7和SEQ ID NO:8的序列。最优选地，用于所述方法的β-(1,4)-N-乙酰半乳糖胺转移酶为或衍生自SEQ ID NO:8。

在另一个特别优选的实施方案中，当糖衍生物核苷酸Su(A)-Nuc中的R¹⁴为-NHC(O)CH₃时，用于所述方法的β-(1,4)-N-乙酰半乳糖胺转移酶与选自SEQ ID NO:2-9，即选自SEQID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ IDNO:8和SEQ ID NO:9的序列具有至少50％的序列同一性，优选至少55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。更优选地，当R¹⁴为-NHC(O)CH₃时，用于所述方法的β-(1,4)-N-乙酰半乳糖胺转移酶与选自SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:7和SEQ IDNO:8，更优选选自SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8，甚至更优选选自SEQ ID NO:7和SEQ ID NO:8的序列具有至少50％的序列同一性，优选至少55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。最优选地，用于所述方法的β-(1,4)-N-乙酰半乳糖胺转移酶与SEQ ID NO:8具有至少50％的序列同一性，优选至少55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。

在其中R¹⁴为-NHC(O)CH₃的本发明的方法的另一个特别优选的实施方案中，糖基转移酶为或衍生自秀丽隐杆线虫β-(1,4)-GalNAcT(CeGalNAcT)。

在其中R¹⁴为-NHC(O)CH₃的方法的另一个特别优选的实施方案中，CeGalNAcT为或衍生自SEQ ID NO:2或SEQ ID NO:6。

在其中R¹⁴为-NHC(O)CH₃的方法的另一个特别优选的实施方案中，用于所述方法的CeGalNAcT为或衍生自SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13或SEQID NO:14。

在其中R¹⁴为-NHC(O)CH₃的方法的另一个特别优选的实施方案中，用于所述方法的CeGalNAcT与SEQ ID NO:2或SEQ ID NO:6具有至少50％的序列同一性，优选至少55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。

在其中R¹⁴为-NHC(O)CH₃的方法的另一个特别优选的实施方案中，用于所述方法的CeGalNAcT与序列SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13或SEQ IDNO:14具有至少50％的序列同一性，优选至少55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。

在其中R¹⁴为-NHC(O)CH₃的本发明的方法的另一个特别优选的实施方案中，糖基转移酶为或衍生自粉纹夜蛾β-(1,4)-GalNAcT(TnGalNAcT)。

在其中R¹⁴为-NHC(O)CH₃的方法的其他优选的实施方案中，TnGalNAcT为或衍生自SEQ ID NO:4或SEQ ID NO:8。

在其中R¹⁴为-NHC(O)CH₃的方法的另一个优选的实施方案中，用于所述方法的TnGalNAcT与SEQ ID NO:4或SEQ ID NO:8具有至少50％的序列同一性，优选至少55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。

在其中R¹⁴为-NHC(O)CH₃的方法的另一个优选实施方案中，用于所述方法的TnGalNAcT为或衍生自选自SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:33、SEQ ID NO:34、SEQ ID NO:49、SEQ ID NO:50、SEQ ID NO:51、SEQ ID NO:52、SEQ ID NO:53、SEQ IDNO:54、SEQ ID NO:55、SEQ ID NO:56、SEQ ID NO:57、SEQ ID NO:58和SEQ ID NO:59的序列。

在另一个优选的实施方案中，用于其中R¹⁴为-NHC(O)CH₃的方法的TnGalNAcT与选自SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:33、SEQ ID NO:34、SEQ ID NO:49、SEQ IDNO:50、SEQ ID NO:51、SEQ ID NO:52、SEQ ID NO:53、SEQ ID NO:54、SEQ ID NO:55、SEQ IDNO:56、SEQ ID NO:57、SEQ ID NO:58和SEQ ID NO:59的序列具有至少50％的序列同一性，优选至少55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。

在其中R¹⁴为-NHC(O)CH₃的本发明的方法的另一个特别优选的实施方案中，糖基转移酶为或衍生自猪蛔虫β-(1,4)-GalNAcT(AsGalNAcT)。

在其中R¹⁴为-NHC(O)CH₃的方法的该实施方案中，进一步优选AsGalNAcT为或衍生自SEQ ID NO:3或SEQ ID NO:7。

在其中R¹⁴为-NHC(O)CH₃的方法的另一个优选的实施方案中，用于所述方法的AsGalNAcT与SEQ ID NO:3或SEQ ID NO:7具有至少50％的序列同一性，优选至少55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。

在其中R¹⁴为-NHC(O)CH₃的方法的另一个优选的实施方案中，用于所述方法的AsGalNAcT为或衍生自选自SEQ ID NO:46、SEQ ID NO:47、SEQ ID NO:71、SEQ ID NO:72和SEQ ID NO:73的序列。

在其中R¹⁴为-NHC(O)CH₃的方法的另一个优选的实施方案中，用于所述方法的AsGalNAcT与选自SEQ ID NO:46、SEQ ID NO:47、SEQ ID NO:71、SEQ ID NO:72和SEQ IDNO:73的序列具有至少50％的序列同一性，优选至少55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。

在本文描述的其中R¹⁴为-NHC(O)CH₃的本发明的方法的优选实施方案以及如上文中所描述的糖基转移酶中，进一步优选糖衍生物核苷酸Su(A)-Nuc如上文所定义的式(15)、(16)、(17)或(18)所示，其中R¹⁴为-NHC(O)CH₃；或如上文所定义的式(19)、(20)、(21)、(22)、(23)、(24)、(25)、(26)、(65)、(66)、(67)、(68)或(69)所示，其中R¹⁴为-NHC(O)CH₃；或如上文所定义的式(27)所示。在这些特别优选的实施方案中，进一步优选的是Nuc为UDP。

当R¹⁴为-NHC(O)-(W)_h-(U)_f-(T)_a-A时优选的糖基转移酶

在本发明的方法的另一个优选实施方案中，R¹⁴是-NHC(O)-(W)_h-(U)_f-(T)_a-A。在该实施方案中，糖衍生物核苷酸Su(A)-Nuc如式(3b)所示，如上文所定义的。

当Su(A)-Nuc如式(3b)或如上文所述的(3b)的优选实施方案所示时，在所述方法的优选实施方案中，为或衍生自β-(1,4)-GalNAcT的糖基转移酶为或衍生自野生型β-(1,4)-GalNAcT，优选无脊椎动物β-(1,4)-GalNAcT。在所述方法的另一个优选实施方案中，糖基转移酶为或衍生自无脊椎动物β(1,4)-GalNAcT。在另一个优选的实施方案中，糖基转移酶为或衍生自秀丽隐杆线虫β-(1,4)-GalNAcT(CeGalNAcT)、猪蛔虫β-(1,4)-GalNAcT(AsGalNAcT)或粉纹夜蛾β-(1,4)-GalNAcT(TnGalNAcT)。为或衍生自(CeGalNAcT)、(AsGalNAcT)或(TnGalNAcT)的β-(1,4)-GalNAcT如上文中更详细描述的。

当糖衍生物核苷酸Su(A)-Nuc中的R¹⁴为-NHC(O)-(W)_h-(U)_f-(T)_a-A时，特别优选用于所述方法的β-(1,4)-N-乙酰半乳糖胺转移酶为或衍生自选自SEQ ID NO:2-9，即选自SEQID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ IDNO:8和SEQ ID NO:9的序列。更优选地，当R¹⁴为-NHC(O)-(W)_h-(U)_f-(T)_a-A时，用于所述方法的β-(1,4)-N-乙酰半乳糖胺转移酶为或衍生自选自SEQ ID NO:2、SEQ ID NO:3、SEQ IDNO:4、SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8，更优选选自SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8，甚至更优选选自SEQ ID NO:7和SEQ ID NO:8的序列。最优选地，用于所述方法的β-(1,4)-N-乙酰半乳糖胺转移酶为或衍生自SEQ ID NO:8。

在另一个特别优选的实施方案中，当糖衍生物核苷酸Su(A)-Nuc中的R¹⁴为-NHC(O)-(W)_h-(U)_f-(T)_a-A时，用于所述方法的β-(1,4)-N-乙酰半乳糖胺转移酶与选自SEQ IDNO:2-9，即选自SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQID NO:7、SEQ ID NO:8和SEQ ID NO:9的序列具有至少50％的序列同一性，优选至少55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。更优选地，当R¹⁴为-NHC(O)-(W)_h-(U)_f-(T)_a-A时，用于所述方法的β-(1,4)-N-乙酰半乳糖胺转移酶与选自SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8，更优选选自SEQ ID NO:6、SEQ ID NO:7和SEQID NO:8，甚至更优选选自SEQ ID NO:7和SEQ ID NO:8的序列具有至少50％的序列同一性，优选至少55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。最优选地，用于所述方法的β-(1,4)-N-乙酰半乳糖胺转移酶与SEQ ID NO:8具有至少50％的序列同一性，优选至少55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。

在其中R¹⁴为-NHC(O)-(W)_h-(U)_f-(T)_a-A的本发明的方法的另一个特别优选的实施方案中，糖基转移酶为或衍生自秀丽隐杆线虫β-(1,4)-GalNAcT(CeGalNAcT)。

在其中R¹⁴为-NHC(O)-(W)_h-(U)_f-(T)_a-A的方法的另一个特别优选的实施方案中，CeGalNAcT为或衍生自SEQ ID NO:2或SEQ ID NO:6。

在其中R¹⁴为-NHC(O)-(W)_h-(U)_f-(T)_a-A的方法的另一个特别优选的实施方案中，用于所述方法的CeGalNAcT为或衍生自SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQID NO:13或SEQ ID NO:14。

在其中R¹⁴为-NHC(O)-(W)_h-(U)_f-(T)_a-A的方法的另一个特别优选的实施方案中，用于所述方法的CeGalNAcT与SEQ ID NO:2或SEQ ID NO:6具有至少50％的序列同一性，优选至少55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。

在其中R¹⁴为-NHC(O)-(W)_h-(U)_f-(T)_a-A的方法的另一个特别优选的实施方案中，用于所述方法的CeGalNAcT与序列SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ IDNO:13或SEQ ID NO:14具有至少50％的序列同一性，优选至少55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。

在其中R¹⁴为-NHC(O)-(W)_h-(U)_f-(T)_a-A的本发明的方法的另一个特别优选的实施方案中，糖基转移酶为或衍生自粉纹夜蛾β-(1,4)-GalNAcT(TnGalNAcT)。

在其中R¹⁴为-NHC(O)-(W)_h-(U)_f-(T)_a-A的方法的其他优选的实施方案中，TnGalNAcT为或衍生自SEQ ID NO:4或SEQ ID NO:8。

在其中R¹⁴为-NHC(O)-(W)_h-(U)_f-(T)_a-A的方法的另一个优选的实施方案中，用于所述方法的TnGalNAcT与SEQ ID NO:4或SEQ ID NO:8具有至少50％的序列同一性，优选至少55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。

在其中R¹⁴为-NHC(O)-(W)_h-(U)_f-(T)_a-A的方法的另一个优选实施方案中，用于所述方法的TnGalNAcT为或衍生自选自SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ IDNO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:33、SEQ IDNO:34、SEQ ID NO:49、SEQ ID NO:50、SEQ ID NO:51、SEQ ID NO:52、SEQ ID NO:53、SEQ IDNO:54、SEQ ID NO:55、SEQ ID NO:56、SEQ ID NO:57、SEQ ID NO:58和SEQ ID NO:59的序列。

在另一个优选的实施方案中，用于其中R¹⁴为-NHC(O)-(W)_h-(U)_f-(T)_a-A的方法的TnGalNAcT与选自SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:33、SEQ ID NO:34、SEQ IDNO:49、SEQ ID NO:50、SEQ ID NO:51、SEQ ID NO:52、SEQ ID NO:53、SEQ ID NO:54、SEQ IDNO:55、SEQ ID NO:56、SEQ ID NO:57、SEQ ID NO:58和SEQ ID NO:59的序列具有至少50％的序列同一性，优选至少55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。

在其中R¹⁴为-NHC(O)-(W)_h-(U)_f-(T)_a-A的本发明的方法的另一个特别优选的实施方案中，糖基转移酶为或衍生自猪蛔虫β-(1,4)-GalNAcT(AsGalNAcT)。

在其中R¹⁴为-NHC(O)-(W)_h-(U)_f-(T)_a-A的方法的该实施方案中，进一步优选的是AsGalNAcT为或衍生自SEQ ID NO:3或SEQ ID NO:7。

在其中R¹⁴为-NHC(O)-(W)_h-(U)_f-(T)_a-A的方法的另一个优选的实施方案中，用于所述方法的AsGalNAcT与SEQ ID NO:3或SEQ ID NO:7具有至少50％的序列同一性，优选至少55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。

在其中R¹⁴为-NHC(O)-(W)_h-(U)_f-(T)_a-A的方法的另一个优选的实施方案中，用于所述方法的AsGalNAcT为或衍生自选自SEQ ID NO:46、SEQ ID NO:47、SEQ ID NO:71、SEQID NO:72和SEQ ID NO:73的序列。

在其中R¹⁴为-NHC(O)-(W)_h-(U)_f-(T)_a-A的方法的另一个优选的实施方案中，用于所述方法的AsGalNAcT与选自SEQ ID NO:46、SEQ ID NO:47、SEQ ID NO:71、SEQ ID NO:72和SEQ ID NO:73的序列具有至少50％的序列同一性，优选至少55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。

在本文描述的其中R¹⁴为-NHC(O)-(W)_h-(U)_f-(T)_a-A的本发明的方法的优选实施方案以及如上文中所描述的糖基转移酶中，进一步优选糖衍生物核苷酸Su(A)-Nuc如上文所定义的式(15)、(16)、(17)或(18)所示，其中R¹⁴为-NHC(O)-(W)_h-(U)_f-(T)_a-A；或如上文所定义的式(19)、(20)、(21)、(22)、(23)、(24)、(25)、(26)、(65)、(66)、(67)、(68)或(69)所示，其中R¹⁴为-NHC(O)-(W)_h-(U)_f-(T)_a-A；或如上文所定义的式(28)、(29)、(30)或(31)所示。在这些特别优选的实施方案中，进一步优选的是Nuc为UDP。

当R¹⁴为-OH时优选的糖基转移酶

在本发明的方法的优选实施方案中，R¹⁴是-OH。在该实施方案中，糖衍生物核苷酸Su(A)-Nuc如式(3c)所示，如上文所定义的。

当Su(A)-Nuc如式(3c)或如上文所述的(3c)的优选实施方案所示时，在所述方法的优选实施方案中，糖基转移酶衍生自野生型β-(1,4)-GalNAcT，优选无脊椎动物β-(1,4)-GalNAcT。在所述方法的另一个优选实施方案中，糖基转移酶衍生自无脊椎动物β-(1,4)-GalNAcT。在其他优选的实施方案中，糖基转移酶衍生自秀丽隐杆线虫β-(1,4)-GalNAcT(CeGalNAcT)、猪蛔虫β-(1,4)-GalNAcT(AsGalNAcT)或粉纹夜蛾β-(1,4)-GalNAcT(TnGalNAcT)。衍生自(CeGalNAcT)、(AsGalNAcT)或(TnGalNAcT)的β-(1,4)-GalNAcT如上文中更详细描述的。

在其中R¹⁴为-OH的本发明的方法的另一个特别优选的实施方案中，糖基转移酶衍生自秀丽隐杆线虫β-(1,4)-GalNAcT(CeGalNAcT)。

在其中R¹⁴为-OH的本发明的方法的另一个特别优选的实施方案中，糖基转移酶衍生自粉纹夜蛾β-(1,4)-GalNAcT(TnGalNAcT)。

在其中R¹⁴为-OH的方法的另一个优选的实施方案中，TnGalNAcT为或衍生自SEQ IDNO:35或SEQ ID NO:60。

在其中R¹⁴为-OH的方法的另一个优选的实施方案中，用于所述方法的TnGalNAcT与SEQ ID NO:35或SEQ ID NO:60具有至少50％的序列同一性，优选至少55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。

在其中R¹⁴为-OH的方法的另一个优选实施方案中，用于所述方法的TnGalNAcT为或衍生自选自SEQ ID NO:36、SEQ ID NO:37、SEQ ID NO:38、SEQ ID NO:39、SEQ ID NO:40、SEQ ID NO:41、SEQ ID NO:42、SEQ ID NO:43、SEQ ID NO:44、SEQ ID NO:45、SEQ ID NO:61、SEQ ID NO:62、SEQ ID NO:63、SEQ ID NO:64、SEQ ID NO:65、SEQ ID NO:66、SEQ IDNO:67、SEQ ID NO:68、SEQ ID NO:69和SEQ ID NO:70的序列。

在另一个优选的实施方案中，用于其中R¹⁴为-OH的方法的TnGalNAcT与选自SEQ IDNO:36、SEQ ID NO:37、SEQ ID NO:38、SEQ ID NO:39、SEQ ID NO:40、SEQ ID NO:41、SEQ IDNO:42、SEQ ID NO:43、SEQ ID NO:44、SEQ ID NO:45、SEQ ID NO:61、SEQ ID NO:62、SEQ IDNO:63、SEQ ID NO:64、SEQ ID NO:65、SEQ ID NO:66、SEQ ID NO:67、SEQ ID NO:68、SEQ IDNO:69和SEQ ID NO:70的序列具有至少50％的序列同一性，优选至少55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。

在其中R¹⁴为-OH的本发明的方法的另一个特别优选的实施方案中，糖基转移酶衍生自猪蛔虫β-(1,4)-GalNAcT(AsGalNAcT)。

在其中R¹⁴为-OH的方法的该实施方案中，进一步优选的是AsGalNAcT为或衍生自SEQ ID NO:48或SEQ ID NO:74。

在其中R¹⁴为-OH的方法的另一个优选的实施方案中，用于所述方法的AsGalNAcT与SEQ ID NO:48或SEQ ID NO:74具有至少50％的序列同一性，优选至少55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。

在本文描述的其中R¹⁴为-OH的本发明的方法的优选实施方案以及如上文中所描述的糖基转移酶中，进一步优选糖衍生物核苷酸Su(A)-Nuc如上文所定义的式(15)、(16)、(17)或(18)所示，其中R¹⁴为-OH；或如上文所定义的式(19)、(20)、(21)、(22)、(23)、(24)、(25)、(26)、(65)、(66)、(67)、(68)或(69)所示，其中R¹⁴为-OH；或如上文所定义的式(35)所示。在这些特别优选的实施方案中，进一步优选的是Nuc为UDP。

当R¹⁴为-N₃时优选的糖基转移酶

在本发明的方法的另一个优选实施方案中，R¹⁴是-N₃。在该实施方案中，糖衍生物核苷酸Su(A)-Nuc如式(3d)所示，如上文所定义的。

当Su(A)-Nuc如式(3d)或如上文所述的(3d)的优选实施方案所示时，在所述方法的优选实施方案中，为或衍生自β-(1,4)-GalNAcT的糖基转移酶为或衍生自野生型β-(1,4)-GalNAcT，优选无脊椎动物β-(1,4)-GalNAcT。在所述方法的另一个优选实施方案中，糖基转移酶为或衍生自无脊椎动物β-(1,4)-GalNAcT。在其他优选的实施方案中，糖基转移酶为或衍生自秀丽隐杆线虫β-(1,4)-GalNAcT(CeGalNAcT)、猪蛔虫β-(1,4)-GalNAcT(AsGalNAcT)或粉纹夜蛾β-(1,4)-GalNAcT(TnGalNAcT)。为或衍生自(CeGalNAcT)、(AsGalNAcT)或(TnGalNAcT)的β-(1,4)-GalNAcT如上文中更详细描述的。

当糖衍生物核苷酸Su(A)-Nuc中的R¹⁴为-N₃时，特别优选用于所述方法的β-(1,4)-N-乙酰半乳糖胺转移酶为或衍生自选自SEQ ID NO:2-9，即选自SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8和SEQ ID NO:9的序列。更优选地，当R¹⁴为-N₃时，用于所述方法的β-(1,4)-N-乙酰半乳糖胺转移酶为或衍生自选自SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8，更优选选自SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8，甚至更优选选自SEQ ID NO:7和SEQ ID NO:8的序列。最优选地，用于所述方法的β-(1,4)-N-乙酰半乳糖胺转移酶为或衍生自SEQ ID NO:8。

在另一个特别优选的实施方案中，当糖衍生物核苷酸Su(A)-Nuc中的R¹⁴为-N₃时，用于所述方法的β-(1,4)-N-乙酰半乳糖胺转移酶与选自SEQ ID NO:2-9，即选自SEQ IDNO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8和SEQ ID NO:9的序列具有至少50％的序列同一性，优选至少55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。更优选地，当R¹⁴为-N₃时，用于所述方法的β-(1,4)-N-乙酰半乳糖胺转移酶与选自SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8，更优选选自SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8，甚至更优选选自SEQ ID NO:7和SEQ IDNO:8的序列具有至少50％的序列同一性，优选至少55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。最优选地，用于所述方法的β-(1,4)-N-乙酰半乳糖胺转移酶与SEQ ID NO:8具有至少50％的序列同一性，优选至少55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。

在其中R¹⁴为-N₃的本发明的方法的另一个特别优选的实施方案中，糖基转移酶为或衍生自秀丽隐杆线虫β-(1,4)-GalNAcT(CeGalNAcT)。

在其中R¹⁴为-N₃的方法的另一个特别优选的实施方案中，CeGalNAcT为或衍生自SEQ ID NO:2或SEQ ID NO:6。

在其中R¹⁴为-N₃的方法的另一个特别优选的实施方案中，用于所述方法的CeGalNAcT为或衍生自SEQ ID NO:10、SEQ ID NO:11、SEQ IDNO:12、SEQ ID NO:13或SEQ IDNO:14。

在其中R¹⁴为-N₃的方法的另一个特别优选的实施方案中，用于所述方法的CeGalNAcT与SEQ ID NO:2或SEQ ID NO:6具有至少50％的序列同一性，优选至少55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。

在其中R¹⁴为-N₃的方法的另一个特别优选的实施方案中，用于所述方法的CeGalNAcT与序列SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13或SEQ IDNO:14具有至少50％的序列同一性，优选至少55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。

在其中R¹⁴为-N₃的本发明的方法的另一个特别优选的实施方案中，糖基转移酶为或衍生自粉纹夜蛾β-(1,4)-GalNAcT(TnGalNAcT)。

在其中R¹⁴为-N₃的方法的其他优选的实施方案中，TnGalNAcT为或衍生自SEQ IDNO:4或SEQ ID NO:8。

在其中R¹⁴为-N₃的方法的另一个优选的实施方案中，用于所述方法的TnGalNAcT与SEQ ID NO:4或SEQ ID NO:8具有至少50％的序列同一性，优选至少55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。

在其中R¹⁴为-N₃的方法的另一个优选实施方案中，用于所述方法的TnGalNAcT为或衍生自选自SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:33、SEQ ID NO:34、SEQ ID NO:49、SEQ ID NO:50、SEQ ID NO:51、SEQ ID NO:52、SEQ ID NO:53、SEQ ID NO:54、SEQ IDNO:55、SEQ ID NO:56、SEQ ID NO:57、SEQ ID NO:58和SEQ ID NO:59的序列。

在另一个优选的实施方案中，用于其中R¹⁴为-N₃的方法的TnGalNAcT与选自SEQ IDNO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ IDNO:31、SEQ ID NO:32、SEQ ID NO:33、SEQ ID NO:34、SEQ ID NO:49、SEQ ID NO:50、SEQ IDNO:51、SEQ ID NO:52、SEQ ID NO:53、SEQ ID NO:54、SEQ ID NO:55、SEQ ID NO:56、SEQ IDNO:57、SEQ ID NO:58和SEQ ID NO:59的序列具有至少50％的序列同一性，优选至少55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。

在其中R¹⁴为-N₃的本发明的方法的另一个特别优选的实施方案中，糖基转移酶为或衍生自猪蛔虫β-(1,4)-GalNAcT(AsGalNAcT)。

在其中R¹⁴为-N₃的方法的该实施方案中，进一步优选的是AsGalNAcT为或衍生自SEQ ID NO:3或SEQ ID NO:7。

在其中R¹⁴为-N₃的方法的另一个优选的实施方案中，用于所述方法的AsGalNAcT与SEQ ID NO:3或SEQ ID NO:7具有至少50％的序列同一性，优选至少55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。

在其中R¹⁴为-N₃的方法的另一个优选的实施方案中，用于所述方法的AsGalNAcT为或衍生自选自SEQ ID NO:46、SEQ ID NO:47、SEQ ID NO:71、SEQ ID NO:72和SEQ ID NO:73的序列。

在其中R¹⁴为-N₃的方法的另一个优选的实施方案中，用于所述方法的AsGalNAcT与选自SEQ ID NO:46、SEQ ID NO:47、SEQ ID NO:71、SEQ ID NO:72和SEQ ID NO:73的序列具有至少50％的序列同一性，优选至少55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。

在本文描述的其中R¹⁴为-N₃的本发明的方法的优选实施方案以及如上文中所描述的糖基转移酶中，进一步优选糖衍生物核苷酸Su(A)-Nuc如上文所定义的式(15)、(16)、(17)或(18)所示，其中R¹⁴为-N₃；或如上文所定义的式(19)、(20)、(21)、(22)、(23)、(24)、(25)、(26)、(65)、(66)、(67)、(68)或(69)所示，其中R¹⁴为-N₃；或如上文所定义的式(36)所示。在这些特别优选的实施方案中，进一步优选的是Nuc为UDP。

酶

在一个方面，本发明涉及如本文中所定义的酶，即为或衍生自β-(1,4)-GalNAcT的糖基转移酶，特别是衍生自β-(1,4)-GalNAcT的糖基转移酶，即衍生的β-(1,4)-GalNAcT酶。在一个实施方案中，所述酶衍生自无脊椎动物物种。在一个实施方案中，根据该方面的酶为分离形式。根据本方面，在本发明方法的上下文中，酶及其优选实施方案在上文中进一步定义，这同样适用于酶自身。

在一个实施方案中，根据本发明该方面的酶衍生自β-(1,4)-N-乙酰半乳糖胺转移酶，优选衍生自具有选自SEQ ID NO:2-23和SEQ ID NO:25-74，更优选选自SEQ ID NO:14和SEQ ID NO:25-74，最优选选自SEQ ID NO:10-13、SEQ ID NO:25-48、SEQ ID NO:50-70和SEQ ID NO:72-74的序列的β-(1,4)-N-乙酰半乳糖胺转移酶。根据该实施方案的酶通常为分离形式。

在一个实施方案中，根据本发明该方面的酶涉及与选自SEQ ID NO:2-23和SEQ IDNO:25-74的序列具有至少40％的序列同一性，优选至少45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性的β-(1,4)-N-乙酰半乳糖胺转移酶。根据该实施方案的酶通常为分离形式。优选地，本发明涉及与选自SEQ ID NO:10-14和SEQ ID NO:25-74，最优选选自SEQ ID NO:10-13、SEQ ID NO:25-48、SEQ ID NO:50-70和SEQ ID NO:72-74的序列具有至少40％的序列同一性，优选至少45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性的β-(1,4)-N-乙酰半乳糖胺转移酶。

在优选的实施方案中，根据本发明该方面的酶涉及与选自SEQ ID NO:6-14，即选自SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13和SEQ ID NO:14，优选选自SEQ ID NO:10-13，即选自SEQ IDNO:10、SEQ ID NO:11、SEQ ID NO:12和SEQ ID NO:13的序列具有至少40％的序列同一性，优选至少45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性的β-(1,4)-N-乙酰半乳糖胺转移酶。

在另一个优选的实施方案中，根据本发明该方面的酶涉及与选自SEQ ID NO:25-45和SEQ ID NO:50-70，即选自SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:33、SEQ IDNO:34、SEQ ID NO:35、SEQ ID NO:36、SEQ ID NO:37、SEQ ID NO:38、SEQ ID NO:39、SEQ IDNO:40、SEQ ID NO:41、SEQ ID NO:42、SEQ ID NO:43、SEQ ID NO:44、SEQ ID NO:45、SEQ IDNO:50、SEQ ID NO:51、SEQ ID NO:52、SEQ ID NO:53、SEQ ID NO:54、SEQ ID NO:55、SEQ IDNO:56、SEQ ID NO:57、SEQ ID NO:58、SEQ ID NO:59、SEQ ID NO:60、SEQ ID NO:61、SEQ IDNO:62、SEQ ID NO:63、SEQ ID NO:64、SEQ ID NO:65、SEQ ID NO:66、SEQ ID NO:67、SEQ IDNO:68、SEQ ID NO:69和SEQ ID NO:70的序列具有至少40％的序列同一性，优选至少45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性的β-(1,4)-N-乙酰半乳糖胺转移酶。

在另一个优选的实施方案中，根据本发明该方面的酶涉及与选自SEQ ID NO:46-48和SEQ ID NO:72-74，即选自SEQ ID NO:46、SEQ ID NO:47、SEQ ID NO:48、SEQ ID NO:72、SEQ ID NO:73和SEQ ID NO:74的序列具有至少40％的序列同一性，优选至少45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性的β-(1,4)-N-乙酰半乳糖胺转移酶。

本发明还涉及如上文所定义的本发明的酶在用于糖蛋白的修饰的方法中，优选在本发明的方法中的用途。所述方法包括以下步骤：在酶的存在下，使包含含有末端GlcNAc部分的聚糖的糖蛋白与糖衍生物核苷酸接触。在优选的实施方案中，所述糖蛋白如本文中所定义，最优选包含如本文中进一步定义的如式(1)或(2)所示的聚糖的糖蛋白。在优选的实施方案中，糖衍生物核苷酸是如本文中进一步定义的如式(3)所示的糖衍生物核苷酸Su(A)-Nuc。

经修饰的糖蛋白

本发明还涉及经修饰的糖蛋白，其通过本发明用于修饰糖蛋白的方法而获得。更特别地，本发明涉及包含如式(4)或(5)所示的聚糖的糖蛋白：

其中：

b为0或1；

d为0或1；

e为0或1；

G为单糖、或包含2至20个糖部分的直链或支链寡糖；以及

Su(A)如式(6)所示：

其中R¹⁴、Z、Y、U、T、A、g、f和a如上文针对(3)所定义的。

(6)中的R¹⁴、Z、Y、U、T、A、g、f和a的优选实施方案如上文中对于(3)和(3)的优选实施方案(例如(3a)、(3b)、(3c)和(3d))所更详细描述的。

在本发明的经修饰的糖蛋白中，Su(A)部分的C1经由β-1,4-O-糖苷键连接至GlcNAc部分的C4。

本发明的经修饰的糖蛋白可以包含多于一个如式(4)或(5)所示的聚糖。当为这种情况时，两种或更多种聚糖可互不相同。所述糖蛋白还可以包含一种或多种不包含Su(A)部分的另外的聚糖。

在优选的实施方案中，经修饰的糖蛋白包含如式(4)所示的聚糖，其中b为0。在另一个优选的实施方案中，经修饰的糖蛋白包含如式(4)所示的聚糖，其中b为1。

在另一个优选的实施方案中，经修饰的糖蛋白包含如式(5)所示的聚糖，其中b为0。在另一个优选的实施方案中，经修饰的糖蛋白包含如式(5)所示的聚糖，其中b为1。在如式(5)所示的聚糖中，G表示单糖或包含1至20，优选1至12，更优选1至10，甚至更优选1、2、3、4、5、6、7或8，最优选1、2、3、4、5或6个糖部分的直链或支链寡糖。在聚糖(5)中，优选当d为0时，e为1，当e为0时，d为1。更优选地，在聚糖(5)中，d为1，甚至更优选d为1且e为1。可存在于聚糖中的糖部分是本领域技术人员已知的，并且包括例如葡萄糖(Glc)、半乳糖(Gal)、甘露糖(Man)、岩藻糖(Fuc)、N-乙酰葡糖胺(GlcNAc)、N-乙酰半乳糖胺(GalNAc)、N-乙酰神经氨酸(NeuNAc)或唾液酸和木糖(Xyl)。当聚糖如式(5)所示时，进一步优选聚糖如式(37)、(38)、(39)、(40)、(41)或(42)所示：

其中b是0或1；以及

Su(A)如如上文所定义的式(6)所示。

在优选的实施方案中，本发明的经修饰的糖蛋白包含如式(4)、(37)、(38)、(39)、(40)、(41)或(42)所示的聚糖，更优选如式(4)、(37)、(38)、(39)、(40)、(41)或(42)所示的N-连接的聚糖。在其他优选的实施方案中，本发明的经修饰的糖蛋白包含如式(4)、(37)、(38)或(39)所示的聚糖，更优选如式(4)、(37)、(38)或(39)所示的N-连接的聚糖。最优选地，本发明的经修饰的糖蛋白包含如式(4)或(38)所示的聚糖，更优选如式(4)或(38)所示的N-连接的聚糖。

本发明的经修饰的糖蛋白优选如式(43)、(44)或(45)所示：

其中：

b、d、e和G及其优选实施方案如上文所定义；

Su(A)如上文所定义的式(6)所示；

y独立地为1至24的整数；以及

Pr为蛋白质。

经修饰的糖蛋白可以包含一种或多种聚糖(4)或(5)(y为1至24)。优选地，y为1至12的整数，更优选地为1至10的整数。更优选地，y为1、2、3、4、5、6、7或8，甚至更优选地，y为1、2、3、4、5或6。甚至更优选地，y为1、2、3或4。当y为2或更多时，聚糖可以互不相同。经修饰的糖蛋白还可以包含一种或多种聚糖(4)和一种或多种聚糖(5)的组合。如上文所述，糖蛋白还可以包含一个或多个不具有Su(A)部分的聚糖。

当本发明的经修饰的糖蛋白如式(43)、(44)或(45)所示时，还优选糖蛋白包含如上文所述的式(4)、(37)、(38)、(39)、(40)、(41)或(42)所示的聚糖，更优选如式(4)、(37)、(38)或(39)所示，甚至更优选如式(4)或(38)所示的聚糖，优选N连接的聚糖。最优选地，包含末端GlcNAc部分的聚糖是如式(4)或(38)所示的N-连接的聚糖。

在本发明的方法的优选实施方案中，包含含有末端GlcNAc部分的聚糖的糖蛋白是抗体，更优选如式(43)、(44)或(45)所示的抗体，其中蛋白质(Pr)是抗体(Ab)，或更具体地，Pr是抗体的多肽部分。此外，当待修饰的糖蛋白是抗体并且所述抗体包含多于一个聚糖(y为2或更多)时，聚糖可以互不相同。抗体还可以包含一个或多个不具有Su(A)部分的聚糖。此外，当经修饰的糖蛋白是抗体时，优选经修饰的抗体包含如上文所定义的式(4)、(37)、(38)、(39)、(40)、(41)或(42)所示，更优选如式(4)、(37)、(38)或(39)所示，甚至更优选如式(4)或(38)所示的聚糖。在该实施方案中，进一步优选的是，抗体包含如式(4)、(37)、(38)、(39)、(40)、(41)或(42)所示的N-连接的聚糖，更优选如式(4)、(37)、(38)或(39)所示的N-连接的聚糖，最优选如式(4)或(38)所示的N-连接的聚糖。

当经修饰的糖蛋白是抗体时，优选y为1、2、3、4、5、6、7或8，更优选y为1、2、4、6或8，甚至更优选y为1、2或4，最优选y为1或2。

如上文所定义的，所述抗体可以是全抗体，也可以是抗体片段。当抗体是全抗体时，所述抗体优选在每个重链上包含一个或多个，更优选一个聚糖。因此，所述全抗体优选包含2个或更多个，优选2、4、6或8个所述聚糖，更优选2或4个，最优选2个聚糖。换言之，当所述抗体为全抗体时，y优选为2、4、6或8，更优选y为2或4，最优选y为2。当所述抗体为抗体片段时，优选y为1、2、3或4，更优选y为1或2。

在优选的实施方案中，所述抗体为单克隆抗体(mAb)。优选地，所述抗体选自IgA、IgD、IgE、IgG和IgM抗体。更优选地，所述抗体是IgG1、IgG2、IgG3或IgG4抗体，最优选地，所述抗体是IgG1抗体。

在本发明的经修饰的糖蛋白中，如式(6)所示的Su(A)中的R¹⁴选自：

其中W、h、a、f、T、A和U如上文所定义。

在本发明的经修饰的糖蛋白的优选实施方案中，如式(6)所示的Su(A)中的R¹⁴选自：

其中W、h、a、f、T、A和U如上文所定义。

最优选地，如式(6)所示的Su(A)中的R¹⁴是-NHAc。

在其他优选的实施方案中，本发明的经修饰的糖蛋白包含如式(4)或(5)所示的聚糖，更优选N-连接的聚糖，其中Su(A)(6)中的R¹⁴为-OH。在该实施方案中，优选经修饰的糖蛋白如式(43)、(44)或(45)所示。

在另一个优选的实施方案中，本发明的经修饰的糖蛋白包含如式(4)或(5)所示的聚糖，更优选N-连接的聚糖，其中Su(A)(6)中的R¹⁴为-N₃。在该实施方案中，优选经修饰的糖蛋白如式(43)、(44)或(45)所示。

在另一个优选的实施方案中，本发明的经修饰的糖蛋白包含如式(4)或(5)所示的聚糖，更优选N-连接的聚糖，其中Su(A)(6)中的R¹⁴为-NHC(O)CH₃。在该实施方案中，优选经修饰的糖蛋白如式(43)、(44)或(45)所示。

在另一个优选的实施方案中，本发明的经修饰的糖蛋白包含如式(4)或(5)所示的聚糖，更优选N-连接的聚糖，其中Su(A)(6)中的R¹⁴为-NHC(O)-(W)_h-(U)_f-(T)_a-A，其中W、h、U、f、T、a和A及其优选的实施方案如上文中所更详细描述的。在该实施方案中，优选经修饰的糖蛋白如式(43)、(44)或(45)所示。

在另一个优选的实施方案中，本发明的经修饰的糖蛋白包含如式(37)、(38)、(39)、(40)、(41)或(42)所示的聚糖，更优选N-连接的聚糖，其中Su(A)(6)中的R¹⁴为-OH。在该实施方案中，优选经修饰的糖蛋白如式(43)、(44)或(45)所示。

在另一个优选的实施方案中，本发明的经修饰的糖蛋白包含如式(37)、(38)、(39)、(40)、(41)或(42)所示的聚糖，更优选N-连接的聚糖，其中Su(A)(6)中的R¹⁴为-N₃。在该实施方案中，优选经修饰的糖蛋白如式(43)、(44)或(45)所示。

在另一个优选的实施方案中，本发明的经修饰的糖蛋白包含如式(37)、(38)、(39)、(40)、(41)或(42)所示的聚糖，更优选N-连接的聚糖，其中Su(A)(6)中的R¹⁴为-NHC(O)CH₃。在该实施方案中，优选经修饰的糖蛋白如式(43)、(44)或(45)所示。

在另一个优选的实施方案中，本发明的经修饰的糖蛋白包含如式(37)、(38)、(39)、(40)、(41)或(42)所示的聚糖，更优选N-连接的聚糖，其中Su(A)(6)中的R¹⁴为-NHC(O)-(W)_h-(U)_f-(T)_a-A。在该实施方案中，优选经修饰的糖蛋白如式(43)、(44)或(45)所示。

在另一个优选的实施方案中，本发明的经修饰的糖蛋白包含如式(4)或(5)所示的聚糖，优选N-连接的聚糖，更优选如式(37)、(38)、(39)、(40)、(41)或(42)所示的聚糖，甚至更优选N-连接的聚糖，其中Su(A)(6)如式(46)、(47)、(48)或(49)所示：

其中a、f、R¹⁴、R¹⁵、A、U和T及其优选实施方案如上文针对(15)、(16)、(17)和(18)所定义的。

在其中Su(A)(6)如式(46)、(47)、(48)或(49)所示的这些实施方案中，在其他优选的实施方案中，R¹⁴是-OH。在另一个优选的实施方案中，R¹⁴是-N₃。在另一个优选的实施方案中，R¹⁴是-NHC(O)CH₃。在另一个优选的实施方案中，R¹⁴是-NHC(O)-(W)_h-(U)_f-(T)_a-A，其中W、h、U、f、T、a和A及其优选实施方案如上文更详细描述的。同样在这些实施方案中，优选经修饰的糖蛋白如式(43)、(44)或(45)所示。

在另一个优选的实施方案中，本发明的经修饰的糖蛋白包含如式(4)或(5)所示的聚糖，优选N-连接的聚糖，更优选如式(37)、(38)、(39)、(40)、(41)或(42)所示的聚糖，甚至更优选N-连接的聚糖，其中Su(A)(6)如式(50)、(51)、(52)、(53)、(54)、(55)、(56)、(57)、(70)或(71)所示，优选如式(50)、(51)、(52)、(53)、(54)、(55)、(56)或(57)所示：

其中R¹⁴、R¹⁵和R¹⁶及其优选实施方案如上文针对(19)、(20)、(21)、(22)、(23)、(24)、(25)、(26)、(65)、(66)、(67)、(68)和(69)所定义的。

在另一个优选的实施方案中，本发明的经修饰的糖蛋白包含如式(4)或(5)所示的聚糖，优选N-连接的聚糖，更优选如式(37)、(38)、(39)、(40)、(41)或(42)所示的聚糖，甚至更优选N-连接的聚糖，其中Su(A)(6)如(72)、(73)或(74)所示：

其中R¹⁴及其优选实施方案如上文针对(72)、(73)和(74)所定义的。

在其他优选的实施方案中，本发明的经修饰的糖蛋白包含如式(37)所示的聚糖，优选N-连接的聚糖，其中Su(A)(6)如(50)、(51)、(52)、(53)、(54)、(55)、(56)、(57)、(70)、(71)、(72)、(73)或(74)所示，优选如式(50)、(51)、(52)、(53)、(54)、(55)、(56)或(57)所示。在另一个优选的实施方案中，本发明的经修饰的糖蛋白包含如式(38)所示的聚糖，优选N-连接的聚糖，其中Su(A)(6)如(50)、(51)、(52)、(53)、(54)、(55)、(56)、(57)、(70)、(71)、(72)、(73)或(74)所示，优选如式(50)、(51)、(52)、(53)、(54)、(55)、(56)或(57)所示。在另一个优选的实施方案中，本发明的经修饰的糖蛋白包含如式(39)所示的聚糖，优选N-连接的聚糖，其中Su(A)(6)如(50)、(51)、(52)、(53)、(54)、(55)、(56)、(57)、(70)、(71)、(72)、(73)或(74)所示，优选如式(50)、(51)、(52)、(53)、(54)、(55)、(56)或(57)所示。在另一个优选的实施方案中，本发明的经修饰的糖蛋白包含如式(40)所示的聚糖，优选N-连接的聚糖，其中Su(A)(6)如(50)、(51)、(52)、(53)、(54)、(55)、(56)、(57)、(70)、(71)、(72)、(73)或(74)所示，优选如式(50)、(51)、(52)、(53)、(54)、(55)、(56)或(57)所示。在另一个进一步优选的实施方案中，本发明的经修饰的糖蛋白包含如式(41)所示的聚糖，优选N-连接的聚糖，其中Su(A)(6)如(50)、(51)、(52)、(53)、(54)、(55)、(56)、(57)、(70)、(71)、(72)、(73)或(74)所示，优选如式(50)、(51)、(52)、(53)、(54)、(55)、(56)或(57)所示。在另一个优选的实施方案中，本发明的经修饰的糖蛋白包含如式(42)所示的聚糖，优选N-连接的聚糖，其中Su(A)(6)如(50)、(51)、(52)、(53)、(54)、(55)、(56)、(57)、(70)、(71)、(72)、(73)或(74)所示，优选如式(50)、(51)、(52)、(53)、(54)、(55)、(56)或(57)所示。

在其中Su(A)(6)如式(50)、(51)、(52)、(53)、(54)、(55)、(56)、(57)、(70)、(71)、(72)、(73)或(74)所示，优选如(50)、(51)、(52)、(53)、(54)、(55)、(56)或(57)所示的这些实施方案中，在其他优选的实施方案中，R¹⁴是-OH。在另一个优选的实施方案中，R¹⁴是-N₃。在另一个优选的实施方案中，R¹⁴是-NHC(O)CH₃。在另一个优选的实施方案中，R¹⁴是-NHC(O)-(W)_h-(U)_f-(T)_a-A，其中W、h、U、f、T、a和A及其优选实施方案如上文更详细描述的。同样在这些实施方案中，优选经修饰的糖蛋白如式(43)、(44)或(45)所示。

在另一个优选的实施方案中，本发明的经修饰的糖蛋白包含如式(4)或(5)所示的聚糖，优选N-连接的聚糖，更优选如式(37)、(38)、(39)、(40)、(41)或(42)所示聚糖，甚至更优选N-连接的聚糖，其中Su(A)(6)如式(58)、(59)、(60)、(61)或(62)所示：

在其他优选的实施方案中，本发明的经修饰的糖蛋白包含如式(38)所示的聚糖，优选N-连接的聚糖，其中Su(A)(6)如式(58)、(59)、(60)、(61)或(62)所示。在另一个优选的实施方案中，本发明的经修饰的糖蛋白包含如式(39)所示的聚糖，优选N-连接的聚糖，其中Su(A)(6)如式(58)、(59)、(60)、(61)或(62)所示。在另一个优选的实施方案中，本发明的经修饰的糖蛋白包含如式(40)所示的聚糖，优选N-连接的聚糖，其中Su(A)(6)如式(58)、(59)、(60)、(61)或(62)所示。在另一个优选的实施方案中，本发明的经修饰的糖蛋白包含如式(41)所示的聚糖，优选N-连接的聚糖，其中Su(A)(6)如式(58)、(59)、(60)、(61)或(62)所示。在另一个优选的实施方案中，本发明的经修饰的糖蛋白包含如式(42)所示的聚糖，优选N-连接的聚糖，其中Su(A)(6)如式(58)、(59)、(60)、(61)或(62)所示。

在其中Su(A)(6)如式(58)、(59)、(60)、(61)或(62)所示的这些实施方案中，优选经修饰的糖蛋白如式(43)、(44)或(45)所示。

在另一个优选的实施方案中，本发明的经修饰的糖蛋白包含如式(4)或(5)所示的聚糖，优选N-连接的聚糖，更优选如式(37)、(38)、(39)、(40)、(41)或(42)所示聚糖，甚至更优选N-连接的聚糖，其中Su(A)(6)如式(63)或(64)所示：

在其他优选的实施方案中，本发明的经修饰的糖蛋白包含如式(38)所示的聚糖，优选N-连接的聚糖，其中Su(A)(6)如式(63)或(64)所示。在另一个优选的实施方案中，本发明的经修饰的糖蛋白包含如式(39)所示的聚糖，优选N-连接的聚糖，其中Su(A)(6)如式(63)或(64)所示。

在其中Su(A)(6)如式(63)或(64)所示的这些实施方案中，优选经修饰的糖蛋白如式(43)、(44)或(45)所示。

本发明还涉及如上文所定义的本发明的经修饰的糖蛋白在制备生物缀合物(优选本发明的生物缀合物)的方法中的用途。所述方法优选用于制备抗体-药物缀合物(ADC)。所述方法包括使经修饰的糖蛋白与接头缀合物接触。在优选的实施方案中，接头缀合物如本文中所定义。在优选的实施方案中，生物缀合物是如式(75)、(76)或(77)所示的生物缀合物，如下文进一步定义的。

生物缀合物

本发明还涉及通过将接头缀合物与本发明的经修饰的糖蛋白缀合而获得的生物缀合物。接头缀合物在本领域中已知作为生物缀合反应中的反应物之一，其中糖蛋白——例如本发明的经修饰的糖蛋白——是其他反应物。接头缀合物在本文中定义为其中靶分子经由接头与反应基团Q¹共价连接的化合物。反应基团Q¹能够与存在于本发明的经修饰的糖蛋白上的官能团A反应。接头缀合物可以包含多于一个反应基团Q¹和/或多于一个靶分子。合适的接头缀合物包括WO 2014/065661和WO 2016/053107(通过引用的方式纳入本文)中公开的那些。

生物缀合反应是抗体-缀合物如抗体-药物缀合物(ADC)领域中已知的，其中它们用于制备抗体与靶分子(通常为细胞毒素)的缀合物。在这种生物缀合反应中，本发明的经修饰的糖蛋白通过存在于经修饰的糖蛋白上的官能团A与存在于接头缀合物上的反应基团Q¹之间的反应与接头缀合物偶联或缀合。本发明的生物缀合物优选是抗体缀合物，其中抗体与靶分子缀合，最优选如抗体-药物缀合物，其中抗体与药物(通常为细胞毒素)缀合。

更具体地，本发明涉及如式(75)、(76)或(77)所示的生物缀合物：

其中：

Pr是蛋白质

y独立地如上文针对(43)所定义的；

b、d、e和G独立地如上文针对(5)所定义的；

CG是将Su连接至Sp或D的连接基团；

Sp是间隔基；

D是靶分子；

j独立地为1、2、3、4或5，优选j为1；

k独立地为1至10的整数，优选k为1、2、3或4，最优选k为1；

m为0或1，优选m为1。

Su如式(78)所示：

其中R¹⁴、Z、Y、U、T、g、f和a如上文针对(3)所定义的，并且Su经由β-1,4-O-糖苷键通过C1连接至GlcNAc部分的C4，并经由Z、Y、U或T连接至CG。

(75)、(76)或(77)中的Pr和y的优选实施方案如上文针对(43)、(44)和(45)更详细描述的。在优选的实施方案中，糖蛋白是抗体。生物缀合物——特别是抗体——可包含多于一个官能化聚糖(y为2或更多)，聚糖可以互不相同。抗体可以进一步包含一个或多个不具有Su-(CG-(Sp)_l-(D)_k)_j部分的聚糖。进一步优选的是官能化聚糖是N-连接的聚糖。当本发明的生物缀合物是抗体缀合物时，优选y是1、2、3、4、5、6、7或8，更优选y为1、2、4、6或8，甚至更优选y为1、2或4，最优选y为1或2。

如上文所定义的，所述抗体可以是全抗体，也可以是抗体片段。当抗体是全抗体时，所述抗体优选在每个重链上包含一个或多个，更优选一个聚糖。因此，所述全抗体优选包含2个或更多个，优选2、4、6或8个所述官能化聚糖，更优选2或4个，最优选2个官能化聚糖。换言之，当所述抗体为全抗体时，y优选为2、4、6或8，更优选y为2或4，最优选y为2。当抗体为抗体片段时，优选y为1、2、3或4，更优选y为1或2。

(75)、(76)或(77)中的聚糖链，特别是b、d、e和G的优选实施方案如上文针对(4)和(5)及其优选实施方案——例如(37)、(38)、(39)、(40)、(41)或(42)——所更详细描述的。

(78)中的R¹⁴、Z、Y、U、T、g、f和a的优选实施方案如上文针对(3)和(3)的优选实施方案——例如(3a)、(3b)、(3c)和(3d)——所更详细描述的。如式(78)所示的Su的优选实施方案对应于如式(46)至(64)和(70)至(74)中任一项所述的Su(A)及其优选实施方案，如上针对(6)所更详细描述的，除了A与Q¹反应生成CG。

在本发明的生物缀合物中，如式(78)所示的Su中的R¹⁴选自：

其中W、h、a、f、T、A和U如上文所定义。

在本发明的经修饰的糖蛋白的优选实施方案中，如式(78)所示的Su中的R¹⁴选自：

其中W、h、a、f、T、A和U如上文所定义。

最优选地，如式(78)所示的Su中的R¹⁴是-NHAc。

D是靶分子。在本文中，靶分子被定义为具有在缀合时赋予生物分子的所需性质的分子结构。靶分子D优选选自活性物质、报告分子、聚合物、固体表面、水凝胶、纳米颗粒、微粒和生物分子。最优选地，靶分子D是活性物质。

在本文中，术语“活性物质”涉及药理学和/或生物学物质，即具有生物学活性和/或药物活性的物质，例如药物、前药、诊断试剂、蛋白质、肽、多肽、肽标签、氨基酸、聚糖、脂质、维生素、类固醇、核苷酸、核苷、多核苷酸、RNA或DNA。肽标签的实例包括细胞穿透肽如人乳铁蛋白或聚精氨酸。聚糖的一个实例是寡甘露糖。氨基酸的实例是赖氨酸。当靶分子是活性物质时，活性物质优选选自药物和前药。更优选地，活性物质选自药物活性化合物，特别是低至中等分子量化合物(例如约200至约2500Da，优选约300至约1750Da)。在其他优选的实施方案中，活性物质选自细胞毒素，抗病毒剂、抗菌剂、肽和寡核苷酸。细胞毒素的实例包括秋水仙碱、长春花生物碱、蒽环类、喜树碱、多柔比星、柔红霉素、紫杉烷类、刺孢霉素、微管溶素、伊立替康、抑制肽、鹅膏蕈碱、deBouganin、多卡米星、美登素、auristatin或吡咯苯并二氮杂卓(PBD)。

在本文中，术语“报告分子”是指容易检测其存在的分子，例如诊断剂、染料、荧光团、放射性同位素标记、造影剂、磁共振成像剂或质量标签。多种荧光团，也称为荧光探针，是本领域技术人员已知的。在例如G.T.Hermanson,“Bioconjugate Techniques”,Elsevier,3^rd Ed.2013,Chapter 10:“Fluorescent probes”,p.395–463中更详细地描述了几种荧光团，该文献通过引用的方式纳入本文。荧光团的实例包括各种AlexaFluor(例如Alexa Fluor 555)、花青染料(例如Cy3或Cy5)和花青染料衍生物、香豆素衍生物、荧光素和荧光素衍生物、罗丹明和罗丹明衍生物、硼二吡咯亚甲基衍生物、芘衍生物、萘酰亚胺衍生物、藻胆蛋白衍生物(例如别藻蓝蛋白)、色霉素、镧系元素螯合物和量子点纳米晶体。放射性同位素标记的实例包括^99mTc、¹¹¹In、^114mIn、¹¹⁵In、¹⁸F、¹⁴C、⁶⁴Cu、¹³¹I、¹²⁵I、¹²³I、²¹²Bi、⁸⁸Y、⁹⁰Y、⁶⁷Cu、¹⁸⁶Rh、¹⁸⁸Rh、⁶⁶Ga、⁶⁷Ga和¹⁰B，其任选地经由螯合部分连接，所述螯合部分例如DTPA(二亚乙基三胺五乙酸酐)、DOTA(1,4,7,10-四氮杂环十二烷-N,N′,N″,N″′-四乙酸)、NOTA(1,4,7-三氮杂环壬烷N,N′,N″-三乙酸)、TETA(1,4,8,11-四氮杂环十四烷-N,N′,N″,N″′-四乙酸)、DTTA(N¹-(对异硫氰酸酯基苄基)-二亚乙基三胺-N¹,N²,N³,N³-四乙酸)、去铁胺或DFA(N'-[5-[[4-[[5-(乙酰基羟氨基)-戊基]氨基]-1,4-二氧代丁基]羟氨基]-N-(5-氨基戊基)-N-羟基丁二酰胺)或HYNIC(肼基-烟酰胺)。同位素标记技术是本领域技术人员已知的，并且在例如G.T.Hermanson,“Bioconjugate Techniques”,Elsevier,3^rd Ed.2013,第12章:“Isotopic labelling techniques”,p.507–534中更详细地进行了描述，该文献通过引用的方式纳入本文。

适合用作本发明的化合物中的靶分子D的聚合物是本领域技术人员已知的，并且在例如G.T.Hermanson,“Bioconjugate Techniques”,Elsevier,3^rd Ed.2013,Chapter 18:“PEGylation and synthetic polymer modification”,p.787–838中更详细地描述了几个实例，该文献通过引用的方式纳入本文。当靶分子D是聚合物时，靶分子D优选独立地选自聚(乙二醇)(PEG)、聚环氧乙烷(PEO)、聚丙二醇(PPG)、聚环氧丙烷(PPO)、1,x-二氨基烷烃聚合物(其中x是烷烃中的碳原子数，优选x为2至200，优选2至10的整数)、(聚)乙二醇二胺(例如，1,8-二氨基-3,6-二氧杂辛烷和含有较长的乙二醇链的等同物)、多糖(例如葡聚糖)、聚(氨基酸)(例如聚(L-赖氨酸))和聚(乙烯醇)、聚(2-噁唑啉)(PAOx)。

适合用作靶分子D的固体表面是本领域技术人员已知的。固体表面是例如功能性表面(例如纳米材料、碳纳米管、富勒烯或病毒壳体的表面)、金属表面(例如钛、金、银、铜、镍、锡、铑或锌表面)、金属合金表面(其中合金来自例如铝、铋、铬、钴、铜、镓、金、铟、铁、铅、镁、汞、镍、钾、钚、铑、钪、银、钠、钛、锡、铀、锌和/或锆)、聚合物表面(其中聚合物为例如聚苯乙烯、聚氯乙烯、聚乙烯、聚丙烯、聚(二甲基硅氧烷)或聚甲基丙烯酸甲酯、聚丙烯酰胺)、玻璃表面、硅氧烷表面、色谱载体表面(其中色谱载体为例如二氧化硅载体、琼脂糖载体、纤维素载体或氧化铝载体)等。当靶分子D是固体表面时，优选D独立地选自功能性表面或聚合物表面。

水凝胶是本领域技术人员已知的。水凝胶是由聚合物成分之间的交联形成的水溶胀网。参见例如A.S.Hoffman,Adv.Drug Delivery Rev.2012,64,18，其通过引用的方式纳入本文。当靶分子是水凝胶时，优选的是水凝胶由作为聚合物基体的聚乙二醇(PEG)组成。

适合用作靶分子D的微米颗粒和纳米颗粒是本领域技术人员已知的。各种合适的微米颗粒和纳米颗粒描述于例如G.T.Hermanson,“Bioconjugate Techniques”,Elsevier,3^rd Ed.2013,Chapter 14:“Microparticles and nanoparticles”,p.549–587中，其通过引用的方式纳入本文。微米颗粒或纳米颗粒可以是任何形状，例如球体、杆、管、立方体、三角形和锥体。优选地，微米颗粒或纳米颗粒是球体形状的。微米颗粒和纳米颗粒的化学组成可以不同。当靶分子D是微米颗粒或纳米颗粒时，微米颗粒或纳米颗粒例如是聚合物微米颗粒或纳米颗粒、二氧化硅微米颗粒或纳米颗粒或金微米颗粒或纳米颗粒。当颗粒是聚合物微米颗粒或纳米颗粒时，聚合物优选为聚苯乙烯或苯乙烯的共聚物(例如苯乙烯与二乙烯基苯、丁二烯、丙烯酸酯和/或乙烯基甲苯的共聚物)、聚甲基丙烯酸甲酯(PMMA)、聚乙烯基甲苯、聚(甲基丙烯酸羟乙酯)(pHEMA)或聚(二甲基丙烯酸乙二醇酯/2-甲基丙烯酸羟乙酯)[聚(EDGMA/HEMA)]。任选地，微米颗粒或纳米颗粒的表面是经修饰的，例如使用洗涤剂通过次级聚合物的接枝聚合或通过另一个聚合物的共价连接或间隔基部分的共价连接等来修饰。

靶分子D也可以是生物分子。当靶分子D是生物分子时，优选生物分子选自蛋白质(包括糖蛋白和抗体)、多肽、肽、聚糖、脂质、核酸、寡核苷酸、多糖、寡糖、酶、激素、氨基酸和单糖。

CG是连接基团。在本文中，术语“连接基团”是指连接化合物的一个部分和同一化合物的另一部分的结构元件。通常，生物缀合物通过存在于接头缀合物中的反应性基团Q¹与存在于本发明的经修饰的糖蛋白中的官能团A的反应来制备。CG是经反应性基团Q¹与官能部分A反应形成的部分。如本领域技术人员将理解的，CG的性质取决于用于建立本发明的经修饰的糖蛋白和接头缀合物之间的连接的有机反应的类型。换言之，CG的性质取决于接头缀合物上的反应性基团Q¹的性质和生物分子中官能团A的性质。由于存在大量不同的化学反应可用于建立经修饰的糖蛋白和接头缀合物之间的连接，因此CG具有大量的可能性。当包含Q¹的接头缀合物与包含互补官能团F¹的生物分子缀合时，将存在于生物缀合物中的F¹和Q¹的合适的组合的若干实例，以及连接基团Z³的若干实例如图5所示。

当A为例如硫醇基时，互补基团Q¹包括N-马来酰亚胺基和链烯基，相应的连接基团CG如图5所示。当A是硫醇基时，互补基团Q¹还包括丙二烯酰胺基(allenamide group)。

当A为例如氨基时，互补基团Q¹包括酮基、活化酯基和叠氮基，相应的连接基团CG如图5所示。

当A为例如酮基时，互补基团Q¹包括(O-烷基)羟氨基和肼基，相应的连接基团CG如图5所示。

当A为例如炔基时，互补基团Q¹包括叠氮基，相应的连接基团CG如图5所示。

当A为例如烯基时，互补基团Q¹包括硫醇、在Diels-Alder环加成中反应的二烯或异二烯基和四嗪基，相应的连接基团CG可以分别是硫醚、Diels-Alder加合物(环己烯或其类似物)或二氢哒嗪。

当A为例如叠氮基时，互补基团Q¹包括炔基，相应的连接基团CG如图5所示。

当A为例如环丙烯基、反式环辛烯基或环辛炔基时，互补基团Q¹包括四嗪基，相应的连接基团Z³如图5所示。在这些特定的情况下，Z³仅为中间体结构并将去掉N₂，由此产生二氢哒嗪(来自与烯烃的反应)或哒嗪(来自与炔的反应)。

当A为例如卤素(X)时，互补基团Q¹包括硫醇，相应的连接基团CG可以是硫醚。

当A为例如–OS(O)₂R⁵时，互补基团Q¹包括羟基和(伯和仲)胺基团，相应的连接基团CG可以是醚或(仲或叔)胺基团。

当A为例如丙二烯基时，互补基团Q¹包括硫醇，相应的连接基团CG可以是硫醚，通常是甲基取代的硫醚。

当A为例如–SC(O)R⁸或–SC(V)OR⁸时，A通常首先对硫醇反应，互补基团Q¹包括N-马来酰亚胺基、烯基、丙二烯酰胺基。A是硫醇的相应的连接基团CG可如图5所示。

A和Q¹的其他合适的组合，以及所得连接基团CG的性质是本领域技术人员已知的，例如描述于G.T.Hermanson,“Bioconjugate Techniques”,Elsevier,3^rd Ed.2013(ISBN:978-0-12-382239-0)，特别是在第3章，第229-258页，其通过引用的方式纳入本文。适用于生物缀合过程的互补反应性基团的列表公开于G.T.Hermanson,“BioconjugateTechniques”,Elsevier,3^rd Ed.2013(ISBN:978-0-12-382239-0)的第3章的表3.1，第230-232页，该表的内容明确地通过引用的方式纳入本文。

Sp是间隔基或接头。在本文中将接头定义为连接化合物的两个或更多个元素的部分。例如在生物缀合物中，生物分子和靶分子通过接头彼此共价连接；在接头缀合物中，反应性基团Q¹通过接头与靶分子共价连接。本领域已知的适合用于生物缀合物，特别是抗体缀合物的任何接头可用作Sp。这些间隔基部分是本领域技术人员已知的。合适的间隔基部分的实例包括(聚)乙二醇二胺(例如1,8-二氨基-3,6-二氧杂辛烷或包含更长乙二醇链的等同物)、聚乙二醇链或聚环氧乙烷链、聚丙二醇链或聚环氧丙烷链和1,x-二氨基烷烃，其中x是烷烃中的碳原子数。另一类合适的间隔基部分包括可切割的间隔基部分或可切割的接头。可切割的接头是本领域公知的。例如Shabat等人，Soft Matter 2012,6,1073(通过引用的方式纳入本文)公开了可切割的接头，其包含经生物学触发——例如，酶裂解或氧化事件——释放的自消性部分。合适的可切割的接头的一些实例是在还原时被切割的二硫化物接头，在通过蛋白酶——例如组织蛋白酶、纤溶酶或金属蛋白酶——特异性识别时被切割的肽接头，或在糖苷酶——例如葡萄糖醛酸酶——特异性识别时被切割的基于糖苷的接头，或在贫氧、缺氧区域中被还原的硝基芳族化合物。在本文中，合适的可切割间隔基部分还包括包含特定的、可切割的氨基酸序列的间隔基部分。实例包括例如包含Val-Ala(缬氨酸-丙氨酸)或Val-Cit(缬氨酸-瓜氨酸)部分的间隔基部分。

在优选的实施方案中，Sp选自直链或支链C₁-C₂₀₀亚烷基、C₂-C₂₀₀亚烯基、C₂-C₂₀₀亚炔基、C₃-C₂₀₀亚环烷基、C₅-C₂₀₀亚环烯基、C₈-C₂₀₀亚环炔基、C₇-C₂₀₀烷基亚芳基、C₇-C₂₀₀芳基亚烷基、C₈-C₂₀₀芳基亚烯基和C₉-C₂₀₀芳基亚炔基、亚烷基、亚烯基、亚炔基、亚环烷基、亚环烯基、亚环炔基、烷基亚芳基、芳基亚烷基、芳基亚烯基和芳基亚炔基，其被一个或多个选自O、S和NR¹⁹的杂原子任选地取代和任选地间隔，其中R¹⁹独立地选自任选地被取代的氢、C₁-C₂₄烷基、C₂-C₂₄烯基、C₂-C₂₄炔基和C₃-C₂₄环烷基，烷基、烯基、炔基和环烷基。当亚烷基、亚烯基、亚炔基、亚环烷基、亚环烯基、亚环炔基、烷基亚芳基、芳基亚烷基、芳基亚烯基和芳基亚炔基被一个或多个如上文所定义的杂原子间隔时，优选地所述基团被一个或多个O原子和/或被一个或多个S-S基团间隔。

更优选地，Sp选自直链或支链C₁-C₁₀₀亚烷基、C₂-C₁₀₀亚烯基、C₂-C₁₀₀亚炔基、C₃-C₁₀₀亚环烷基、C₅-C₁₀₀亚环烯基、C₈-C₁₀₀亚环炔基、C₇-C₁₀₀烷基亚芳基、C₇-C₁₀₀芳基亚烷基、C₈-C₁₀₀芳基亚烯基和C₉-C₁₀₀芳基亚炔基，亚烷基、亚烯基、亚炔基、亚环烷基、亚环烯基、亚环炔基、烷基亚芳基、芳基亚烷基、芳基亚烯基和芳基亚炔基，其被一个或多个选自O、S和NR¹⁹的杂原子任选地取代和任选地间隔，其中R¹⁹独立地选自任选地被取代的氢、C₁-C₂₄烷基、C₂-C₂₄烯基、C₂-C₂₄炔基和C₃-C₂₄环烷基，烷基、烯基、炔基和环烷基。

甚至更优选地，Sp选自直链或支链C₁-C₅₀亚烷基、C₂-C₅₀亚烯基、C₂-C₅₀亚炔基、C₃-C₅₀亚环烷基、C₅-C₅₀亚环烯基、C₈-C₅₀亚环炔基、C₇-C₅₀烷基亚芳基、C₇-C₅₀芳基亚烷基、C₈-C₅₀芳基亚烯基和C₉-C₅₀芳基亚炔基，亚烷基、亚烯基、亚炔基、亚环烷基、亚环烯基、亚环炔基、烷基亚芳基、芳基亚烷基、芳基亚烯基和芳基亚炔基，其被一个或多个选自O、S和NR¹⁹的杂原子任选地取代和任选地间隔，其中R¹⁹独立地选自任选地被取代的氢、C₁-C₂₄烷基、C₂-C₂₄烯基、C₂-C₂₄炔基和C₃-C₂₄环烷基，烷基、烯基、炔基和环烷基。

甚至更优选地，Sp选自直链或支链C₁-C₂₀亚烷基、C₂-C₂₀亚烯基、C₂-C₂₀亚炔基、C₃-C₂₀亚环烷基、C₅-C₂₀亚环烯基、C₈-C₂₀亚环炔基、C₇-C₂₀烷基亚芳基、C₇-C₂₀芳基亚烷基、C₈-C₂₀芳基亚烯基和C₉-C₂₀芳基亚炔基，亚烷基、亚烯基、亚炔基、亚环烷基、亚环烯基、亚环炔基、烷基亚芳基、芳基亚烷基、芳基亚烯基和芳基亚炔基，其被一个或多个选自O、S和NR¹⁹的杂原子任选地取代和任选地间隔，其中R¹⁹独立地选自任选地被取代的氢、C₁-C₂₄烷基、C₂-C₂₄烯基、C₂-C₂₄炔基和C₃-C₂₄环烷基，烷基、烯基、炔基和环烷基。

在这些优选的实施方案中，进一步优选亚烷基、亚烯基、亚炔基、亚环烷基、亚环烯基、亚环炔基、烷基亚芳基、芳基亚烷基、芳基亚烯基和芳基亚炔基是未被取代的并且任选地被一个或多个选自O、S和NR¹⁹，优选O的杂原子间隔，其中R¹⁹独立地选自氢和C₁-C₄烷基，优选氢或甲基。

最优选地，Sp选自直链或支链C₁-C₂₀亚烷基，亚烷基被一个或多个选自O、S和NR¹⁹的杂原子任选地取代和任选地间隔，其中R¹⁹独立地选自任选地被取代的氢、C₁-C₂₄烷基、C₂-C₂₄烯基、C₂-C₂₄炔基和C₃-C₂₄环烷基，烷基、烯基、炔基和环烷基。在该实施方案中，进一步优选亚烷基是未取代的且任选地被一个或多个选自O、S和NR¹⁹，优选O和/或S-S的杂原子间隔，其中R¹⁹独立地选自氢和C₁-C₄烷基，优选氢或甲基。

特别优选的Sp部分包括-(CH₂)_n-、-(CH₂CH₂)_n-、-(CH₂CH₂O)_n-、-(OCH₂CH₂)_n-、-(CH₂CH₂O)_nCH₂CH₂-、-CH₂CH₂(OCH₂CH₂)_n-、-(CH₂CH₂CH₂O)_n-、-(OCH₂CH₂CH₂)_n-、-(CH₂CH₂CH₂O)_nCH₂CH₂CH₂-和-CH₂CH₂CH₂(O-CH₂CH₂CH₂)_n-，其中n为1至50的整数，优选1至40，更优选1至30，甚至更优选1至20，甚至更优选1至15。更优选n为1、2、3、4、5、6、7、8、9或10，更优选为1、2、3、4、5、6、7或8，甚至更优选为1、2、3、4、5或6，甚至更优选为1、2、3或4。

实施例

实施例1.GalNAc转移酶的选择和设计

选择四个特异性序列用于初始评估，特别是Uniprot登录号：Q9GUM2(秀丽隐杆线虫；在本文中表示为SEQ ID NO:2)、U1MEV9(猪蛔虫；在本文中表示为SEQ ID NO:3)、Q6J4T9(粉纹夜蛾，在本文中表示为SEQ ID NO:4)和Q7KN92(黑腹果蝇；在本文中表示为SEQID NO:5)。

基于预测的胞质结构域和跨膜结构域的缺失来构建多肽。这些多肽包含预测的秀丽隐杆线虫(由SEQ ID NO:6表示的CeGalNAcT[30-383])、猪蛔虫(由SEQ ID NO:7表示的AsGalNAcT[30-383])、粉纹夜蛾(由SEQ ID NO:8表示的TnGalNAcT[33-421])和黑腹果蝇(由SEQ ID NO:9表示的DmGalNAcT[47-403])。

此外，针对AsGalNAcT[30-383](由SEQ ID NO:71表示的His-AsGalNAcT[30-383])和TnGalNAcT[33-421](由SEQ ID NO:49表示的His-TnGalNAcT[33-421])构建含有N-末端His-标签的多肽变体。

实施例2.设计粉纹夜蛾GalNAcT突变体和猪蛔虫GalNAcT突变体

基于与UDP-N-乙酰基-半乳糖胺(PDB条目1OQM)复合的牛β(1,4)-Gal-T1和由Qasba等人(J.Biol.Chem.2002,277:20833-20839，通过引用的方式纳入本文)报道的β(1,4)-Gal-T1(Y289L)突变体的晶体结构来设计TnGalNAcT和AsGalNAcT的突变体。基于TnGalNAcT和AsGalNAcT与牛β(1,4)Gal-T1的序列比对来设计TnGalNAcT和AsGalNAcT的突变体。这些蛋白之间的对应氨基酸残基示于表1中。表1.不同物种的GalNAcT/GalT中对应氨基酸的编号

TnGalNAcT	AsGalNAcT	牛β(1,4)-Gal-T1
			I311	I257	Y289
W336	W282	W314
			E339	E285	E317

实施例3.His-TnGalNAcT(33-421)突变体的定点诱变

从Genscript获得含有在NdeI-BamHI位点之间的密码子优化序列(其编码TnGalNAcT(由SEQ ID NO:8表示)的残基33-421)的pET15b载体，产生His-TnGalNAcT(33-421)(由SEQ ID NO:49表示)。使用一组重叠引物通过线性扩增PCR从上述构建体扩增TnGalNaCT突变基因。用于每个突变体的重叠引物组示于表2中。为了构建His-TnGalNAcT(33-421；W336F)(由SEQ ID NO:50表示)，用本文定义为SEQ ID NO:79和SEQ ID NO:80的一对引物扩增DNA片段。为了构建His-TnGalNAcT(33-421；W336H)(由SEQ ID NO:51表示)，用本文定义为SEQ ID NO:81和SEQ ID NO:82的一对引物扩增DNA片段。为了构建His-TnGalNAcT(33-421；W336V)(由SEQ ID NO:52表示)，用本文定义为SEQ ID NO:83和SEQ IDNO:84的一对引物扩增DNA片段。为了构建His-TnGalNAcT(33-421；E339A)(由SEQ ID NO:53表示)，用本文定义为SEQ ID NO:85和SEQ ID NO:86的一对引物扩增DNA片段。为了构建His-TnGalNAcT(33-421；E339G))(由SEQ ID NO:54表示)，用本文定义为SEQ ID NO:87和SEQ ID NO:88的一对引物扩增DNA片段。为了构建His-TnGalNAcT(33-421；E339D)(由SEQID NO:55表示)，用本文定义为SEQ ID NO:89和SEQ ID NO:90的一对引物扩增DNA片段。为了构建His-TnGalNAcT(33-421；I311Y)(由SEQ ID NO:60表示)，用本文定义为SEQ ID NO:91和SEQ ID NO:92的一对引物扩增DNA片段。在PCR扩增后，用DpnI处理反应混合物以消化模板DNA，随后转化到NEB 10-β感受态细胞(获自New England Biolabs)中。分离DNA并通过对于以下突变体的序列分析来确认序列：His-TnGalNAcT(33-421；W336F)(由SEQ ID NO:50表示)、His-TnGalNAcT(33-421；W336V)(由SEQ ID NO:52表示)、His-TnGalNAcT(33-421；E339A)(由SEQ ID NO:53表示)和His-TnGalNAcT(33-421；I311Y)(由SEQ ID NO:60表示)。

表2.所用引物的序列标识。对应于突变氨基酸的密码子以粗体显示。

实施例4.His-TnGalNAcT(33-421)、His-TnGalNAcT(33-421；W336F)、His-TnGalNAcT(33-421；W336V)和His-TnGalNAcT(33-421；E339A)在大肠杆菌中的表达和重折叠

从如实施例3中所述获得的相应的pET15b构建体表达His-TnGalNAcT(33-421)、His-TnGalNAcT(33-421；W336F)、His-TnGalNAcT(33-421；W336V)和His-TnGalNAcT(33-421；E339A)。根据由Qasba等人(Prot.Expr.Pur.2003,30,219-76229，通过引用的方式纳入本文)报道的过程进行表达、包涵体分离和重折叠。重折叠后，通过离心(以8000×g离心10分钟)除去不溶性蛋白，随后通过0.45μM孔径的过滤器过滤。使用HisTrap HP 5mL柱(GEHealthcare)纯化和浓缩可溶性蛋白。首先用缓冲液A(20mM Tris缓冲液、20mM咪唑、500mMNaCl，pH 7.5)洗涤柱。用缓冲液B(20mM Tris、500mM NaCl、250mM咪唑，pH 7.5，10mL)洗脱保留的蛋白。通过SDS-PAGE在聚丙烯酰胺凝胶(12％)上分析级分，合并含有纯化的靶蛋白的级分，并通过在4℃下透析过夜，相对于20mM Tris pH 7.5和150mM NaCl交换缓冲液。使用Amicon Ultra-0.5、Ultracel-10Membrane(Millipore)将纯化的蛋白浓缩至至少2mg/mL，并在进一步使用之前储存在-80℃下。

实施例5.GalNAcT和突变体在CHO中的瞬时表达

用Evitria(苏黎世，瑞士)以20mL的量在CHO K1细胞中瞬时表达蛋白。表达以下的GalNAcT变体：CeGalNAcT(30-383)(由SEQ ID NO:6表示)、AsGalNAcT(30-383)(由SEQ IDNO:7表示)、TnGalNAcT(33-421)(由SEQ ID NO:8表示)、DmGalNAcT(47-403)(由SEQ ID NO:9表示)和TnGalNAcT(33-421；E339A)(由SEQ ID NO:28表示)。在典型的纯化实验中，将含有表达的GalNAcT的CHO产生的上清液相对于20mM Tris缓冲液(pH 7.5)透析。将上清液(通常为25mL)通过0.45μm孔径过滤器过滤，随后经阳离子交换柱(HiTrap SP HP 5mL柱，GEHealthcare)进行纯化，所述阳离子交换柱在使用前用20mM Tris缓冲液(pH 7.5)平衡。在配备有外部级分收集器的AKTA Prime色谱系统上进行纯化。从系统泵A装载样品。通过用10倍柱体积(CV)的20mM Tris缓冲液(pH 7.5)洗涤柱来从柱上洗脱未结合的蛋白。用洗脱缓冲液(20mM Tris，1NaCl，pH 7.5；10mL)洗脱保留的蛋白。通过SDS-PAGE在聚丙烯酰胺凝胶(12％)上分析收集的级分，合并含有靶蛋白的级分并使用自旋过滤浓缩至0.5mL的体积。除了TnGalNAcT(33-421；E339A)之外，接下来使用AKTA purifier-10系统(UNICORN v6.3)在Superdex200 10/300GL尺寸排阻色谱柱(GEHealthcare)上纯化蛋白以获得纯的单体级分。通过SDS-PAGE分析级分，并在进一步使用之前将含有单体蛋白的级分储存在-80℃下。

IgG的质谱分析的一般方案

在质谱分析之前，将IgG用DTT处理，这使得能够分析轻链和重链，或用Fabricator^TM(可从Genovis，Lund，Sweden商购获得)处理，这使得能够分析Fc/2片段。为了分析轻链和重链，将20μg(经修饰的)IgG溶液用总体积4μL的100mM DTT在37℃下孵育5分钟。如果存在的话，在这些条件下将叠氮官能团还原成胺。为了分析Fc/2片段，将20μg(经修饰的)IgG溶液用在总体积10μL的磷酸盐缓冲盐水(PBS)pH 6.6中的Fabricator^TM(1.25U/μL)在37℃下孵育1小时。在还原或Fabricator消化后，使用Amicon Ultra-0.5、Ultracel-10Membrane(Millipore)将样品用milliQ洗涤两次，得到约40μL体积的最终样品。接下来，通过JEOL AccuTOF上的电喷雾离子化飞行时间(ESI-TOF)分析样品。使用Magtran软件获得去卷积的光谱。

实施例6.通过内切酶S处理制备经修剪的曲妥珠单抗。

用来自酿脓链球菌的内切酶S(可从Genovis，Lund，Sweden商购获得)进行曲妥珠单抗的聚糖修剪。因此，将曲妥珠单抗(10mg/mL)用于25mM Tris pH 8.0中的内切酶S(40U/mL)在37℃下孵育约16小时。将去糖基化的IgG浓缩，并使用Amicon Ultra-0.5,Ultracel-10Membrane(Millipore)用10mM MnCl₂和25mM Tris-HCl pH 8.0洗涤。在峰的去卷积后，质谱显示轻链的一个峰和重链的两个峰。重链的两个峰属于由核心GlcNAc(Fuc)取代的曲妥珠单抗产生的一种主要产物(49496Da，总重链的90％)和由经修剪的曲妥珠单抗产生的次要产物(49351Da，总重链的±10％)。

实施例7.在牛β(1,4)-Gal-T1的作用下，6-叠氮基-Gal-UDP糖基转移至经修剪的曲妥珠单抗

将通过如上文所述的曲妥珠单抗的内切酶S处理获得的经修剪的曲妥珠单抗(10mg/mL)用在10mM MnCl₂和25mM Tris-HCl pH 8.0中的6-叠氮基-Gal-UDP(1mM，可从GlycoHub商购获得)和0.1或0.5mg/mL牛β(1,4)-Gal-T1(可从Sigma Aldrich商购获得)在30℃下孵育过夜。经还原的样品的质谱分析表明，对于两种浓度的牛β(1,4)-Gal-T1均没有产物形成(主要重链峰49494Da，总重链的90％，由核心GlcNAc(Fuc)取代的曲妥珠单抗产生)。

实施例8.在牛β(1,4)-Gal-T1(130-402；Y289L，C342T)的作用下，6-叠氮基-N-乙酰半乳糖胺-UDP糖基转移至经修剪的曲妥珠单抗

使用衍生自牛β(1,4)-Gal-T1(由SEQ ID NO:1表示)的突变体，其含有Y289L和C342T突变且仅含有催化结构域(氨基酸残基130-402)。该牛β(1,4)-Gal-T1(130-402；Y289L，C342T)突变体由Qasba等人描述(J.Biol.Chem.2002,277,20833-20839，通过引用的方式纳入)，并且根据Qasba等人报道的方法(Prot.Expr.Pur.2003,30,219-76229，通过引用的方式纳入)表达、包涵体分离和重折叠。将通过如上文所述的曲妥珠单抗的内切酶S处理获得的经修剪的曲妥珠单抗(10mg/mL)用在10mM MnCl₂和25mM Tris-HCl pH7.5中的6-叠氮基-GalNAc-UDP(2.5mM，可从GlycoHub商购获得)和1mg/mLβ(1,4)-Gal-T1(130-402；Y289L，C342T)在37℃下孵育过夜。经还原的样品的质谱分析表明没有产物形成(主要重链峰49502Da，总重链的90％，由核心GlcNAc(Fuc)取代的曲妥珠单抗产生)。

实施例9.在GalNAcT的作用下，6-叠氮基-N-乙酰半乳糖胺-UDP糖基转移至经修剪的曲妥珠单抗

测试如实施例5中所述的进行表达和纯化的CeGalNAcT(30-383)(由SEQ ID NO:6表示)、AsGalNAcT(30-383)(由SEQ ID NO:7表示)、TnGalNAcT(33-421)(由SEQ ID NO:8表示)和DmGalNAcT(47-403)(由SEQ ID NO:9表示)的6-叠氮基GalNAc掺入。将通过如上文所述的曲妥珠单抗的内切酶S处理获得的经修剪的曲妥珠单抗(10mg/mL)用在10mM MnCl₂和25mM Tris-HCl pH 7.5以及0.2或0.5mg/mL的上述GalNAcT之一中的6-叠氮基-GalNAc-UDP(1mM，可从GlycoHub商购获得)在37℃下孵育过夜。

Fabricator^TM消化的样品的质谱分析表明，两种浓度的CeGalNAcT(30-383)和DmGalNAcT(47-403)均没有产物形成(主要Fc/2峰24139Da，总重链的90％，由核心GlcNAc(Fuc)取代的曲妥珠单抗产生)，而AsGalNAcT(30-383)和TnGalNAcT(33-421)均显示核心GlcNac(Fuc)取代的曲妥珠单抗(观察到的质量为24139Da)部分转化为产物(观察到的质量为24366Da)，由6-叠氮基-GalNAc转移至核心GlcNAc(Fuc)取代的曲妥珠单抗产生。获得的转化率示于表3中。

表3.通过不同酶浓度的GalNAcT将GlcNAc(Fuc)取代的曲妥珠单抗转化为6-叠氮基-GalNAc-GlcNAc(Fuc)取代的曲妥珠单抗的转化率(％)。

方案1：化合物88-94的合成以及经修饰的糖蛋白95-96的合成(实施例10-26)

实施例10.6-叠氮基-6-脱氧-GalNAc-1-单磷酸酯80的合成

可以根据Wang等人，Bioorg.Med.Chem.Lett.,2009,19,5433中的方法来制备乙酰化糖79。

向乙酰化糖79(4.9g，11.9mmol)在MeOH(15mL)中的悬浮液中加入25％的NH₄OH水溶液(60mL)。将反应在室温下搅拌，并用LCMS监测转化率。4h后，将混合物减压浓缩，并在-20℃下保存2天。然后将固体重新溶解在25％的NH₄OH水溶液(75mL)中，在室温下搅拌，3h后，MS显示完全转化。浓缩溶剂得到为黄色固体的粗产物。采用定量NMR，显示60重量％为产物80，产量为3.2g(83％)。

¹H-NMR(400MHz,D₂O):δ5.28(dd,J＝7.2,3.2Hz,1H),4.12(dd,J＝6.8,6.4Hz,1H),4.06(ddd,J＝10.8,3.2,2.0Hz,1H),3.92-3.81(m,2H),3.47(dd,J＝12.8,7.2Hz,1H),3.40(dd,J＝12.8Hz,6.4Hz,1H),1.88(s,3H)。C₈H₁₅N₄O₈P(M-H⁺)LRMS(ESI-)计算值325.06，实测值325.30。

实施例11.6-氨基-6-脱氧-GalNAc-1-单磷酸酯81的合成

向叠氮化物80(5.9mmol)在H₂O(30mL)和MeOH(30mL)中的溶液中加入Pd/C(400mg)，并将H₂鼓泡通过反应混合物1h。用TLC(7:3MeOH:MeCN)监测反应的转化率。将反应混合物通过硅藻土过滤，用MeOH和H₂O彻底冲洗，真空浓缩，得到产量为1.8g(99％)的粗产物81。

¹H-NMR(400MHz,D₂O):δ5.28(dd,J＝7.2,3.6Hz,1H),4.25(dd,J＝8.8,4.0Hz,1H),4.09-4.04(m,1H),3.90-3.79(m,2H),3.19-3.08(m,2H),1.85(s,3H)。C₈H₁₇N₂O₈P(M-H⁺)LRMS(ESI-)计算值299.06，实测值229.29。

实施例12.6-(2-氯乙酰氨基)-6-脱氧-GalNAc-1-单磷酸酯82的合成

根据Hosztafi等人，Helv.Chim.Acta,1996,79,133中的方法制备氯乙酸琥珀酰亚胺酯。

在氮气气氛下，向糖81(12mg，0.040mmol)的无水DMF(0.5mL)溶液中加入氯乙酸琥珀酰亚胺酯(9mg，0.044mmol)和Et₃N(6.7μL，0.048mmol)。将反应混合物在室温下搅拌并真空浓缩，得到粗产物82。

¹H-NMR(400MHz,D₂O):δ5.42-5.32(m,1H),4.13-4.02(m,4H),3.92-3.81(m,2H),3.53-3.46(m,1H),3.33-3.26(m,1H),1.94(s,3H)。C₁₀H₁₈ClN₂O₉P(M-H⁺)LRMS(ESI-)计算值375.68(100％),377.03(30％),实测值3.75.08(100％),377.19(25％)。

实施例13.6-(4-叠氮基苯甲酰氨基)-6-脱氧-GalNAc-1-单磷酸酯83的合成

根据Hartman等人，Chem.Comm.,2012,48,4755中的方法制备4-叠氮基苯甲酸琥珀酰亚胺酯。

在氮气气氛下，向糖81(38mg，0.127mmol)的无水DMF(1.5mL)溶液中加入Et₃N(21μL，0.152mmol)和4-叠氮基苯甲酸琥珀酰亚胺酯(36mg，0.139mmol)，在室温下搅拌反应混合物。加入另外的4-叠氮基苯甲酸琥珀酰亚胺酯(36mg，0.139mmol)和Et₃N(42μL，0.304mmol)，将反应物在室温下搅拌5天。用TLC和MS监测产物形成。6天后将反应混合物浓缩，得到粗产物83。

C₁₅H₂₀N₅O₉P(M-H⁺)LRMS(ESI-)计算值444.09，实测值444.20。

实施例14.6-(N-2-叠氮基-2,2-二氟乙基氨基甲酸酯)-6-脱氧-GalNAc-1-单磷酸酯84的合成

根据WO2015/112016中所述的方法制备2-叠氮基-2,2-二氟乙醇。

在氮气气氛下，将2-叠氮基-2,2-二氟乙醇(200mg，1.63mmol)溶于DCM(10mL)中，加入4-硝基苯基氯甲酸酯(295mg，1.46mmol)和Et₃N(226μL，1.63mmol)，将所得混合物在室温下搅拌1h。接下来，将糖81(122mg，0.41mmol)溶于H₂O(2mL)中，加入Et₃N(113μL，0.81mmol)和DMF(5mL)，将所得溶液加入到反应混合物中。将反应在室温下搅拌16h，当TLC和LCMS确认糖81完全消耗时。减压除去溶剂，得到粗产物。用离子交换色谱法(Q HITRAP，3×5mL和1×15mL柱)进行纯化。通过加载缓冲液A(10mM NH₄HCO₃)实现柱上的第一次结合，并用缓冲液A冲洗柱。接下来，进行至40％B(250mMNH₄HCO₃)的梯度来洗脱产物并用100％B冲洗柱以除去剩余的副产物。将含有产物的级分冻干，得到所需产物84(147mg，0.33mmol，80％)。

¹H-NMR(400MHz,D₂O):δ5.17(dd,J＝6.4,3.2Hz,1H),4.40-4.24(m,2H),4.07-3.93(m,2H),3.85-3.70(m,2H),3.28-3.13(m,2H),1.87(s,3H)。C₁₁H₁₈F₂N₅O₁₀P(M-H⁺)LRMS(ESI-)计算值448.07，实测值448.14。

实施例15.6-(N-1-(2-叠氮基乙基)脲)-6-脱氧-GalNAc-1-单磷酸酯85的合成

根据Zhang等人，J.Am.Chem.Soc.,2015,137,6000中所述的方法制备2-叠氮基乙胺。¹H-NMR(400MHz,CDCl₃):δ3.40-3.33(m,2H),2.91-2.81(m,2H)。

将羰基二咪唑(377mg，2.32mmol)溶于无水DMF(10mL)中，并在氮气气氛下搅拌。将2-叠氮基乙胺(200mg，2.32mmol)溶于无水DMF(5mL)中并滴加到CDI中。将所得溶液在室温下搅拌1h，然后加热至60℃。将糖81溶于H₂O(2mL)和DMF(5mL)中并加入到反应中。将所得悬浮液在60℃下搅拌16h。用LCMS监测所需产物的形成。搅拌16h后，加入H₂O(5mL)，然后加入在DCM(15mL)中的新活化的2-叠氮基乙胺。将所得混合物在60℃下再搅拌16h，并在减压下除去溶剂。然后将粗产物溶于MeOH(10mL)和H₂O(15mL)中，并用EtOAC(2×30mL)洗涤。将水相浓缩以得到粗产物，将该粗产物用离子交换色谱法纯化(Q-HITRAP，3x5mL和1x15mL色谱柱)。通过加载缓冲液A(10mM NH₄HCO₃)实现柱上的第一次结合，并用缓冲液A冲洗柱。接下来，进行至40％B(250mM NH₄HCO₃)的梯度来洗脱产物并用100％B冲洗柱以除去剩余的副产物。将含有产物的级分冻干，得到所需产物85(147mg，0.33mmol，80％)。

¹H-NMR(400MHz,D₂O):δ5.30(br s,1H),4.13-3.93(m,2H),3.91-3.76(m,2H),3.35-3.10(m,5H),1.92(s,3H)。C₁₁H₂₁N₆O₉P(M-H⁺)LRMS(ESI-)计算值411.10，实测值411.24。

实施例16.6-(N-(2-S-乙酰基)巯基乙酰氨基)-6-脱氧-GalNAc-1-单磷酸酯86的合成

将糖81(105mg，0.35mmol)溶于H₂O(1.7mL)中并在室温下搅拌。在单独的小瓶中，将S-乙酰基巯基乙醇酸五氟苯基酯(210mg，0.70mmol)溶于DMF(1.7mL)中，并与Et₃N(146μL，1.05mmol)一起加入到反应中。将所得混合物在室温下搅拌16h，当LCMS显示完全消耗糖81时。在减压下除去溶剂，将粗产物通过快速色谱法(6:2:1-4:2:1EtOAc:MeOH:H₂O)纯化，得到产物86(95mg，0.23mmol，65％)。

¹H-NMR(400MHz,D₂O):δ5.33(dd,J＝6.8,3.6Hz,1H),4.11-4.00(m,2H),3.90-3.80(m,2H),3.63-3.53(m,2H),3.44(dd,J＝14.0,5.2Hz,1H),3.23(dd,J＝14.0,8.0Hz,1H),2.31(s,3H),1.94(s,3H)。C₁₂H₂₁N₂O₁₀PS(M-H⁺)LRMS(ESI-)计算值415.06，实测值415.18。

实施例17.6-(N-2-叠氮基乙酰胺基)-6-脱氧-GalNAc-1-单磷酸酯87的合成

将叠氮基乙酸(101mg，1.0mmol)溶于DMF(2mL)中，加入EDC(192mg，1.0mmol)、NHS(115mg，1.0mmol)和DMAP(4mg，0.03mmol)。接下来，将糖81(100mg，0.33mmol)溶于H₂O(3mL)中，加入到反应中，在室温下搅拌16h。用LCMS监测所需产物的形成。将另一部分叠氮乙酸按如上所述活化，并加入到反应中。4h后，将反应物真空浓缩。用离子交换色谱法(Q-HITRAP，3×5mL和1×15mL柱)进行纯化。通过加载缓冲液A(10mM NH₄HCO₃)实现柱上的第一次结合，并用缓冲液A冲洗柱。接下来，进行至40％B(250mM NH₄HCO₃)的梯度来洗脱产物并用100％B冲洗柱以除去剩余的副产物。将含有产物的级分冻干，得到所需产物87(100mg，0.26mmol，79％)。

¹H-NMR(400MHz,D₂O):δ5.34(br s,1H),4.13-4.03(m,2H),3.93(s,2H),3.92-3.81(m,2H),3.48(dd,J＝14.0,4.0Hz,1H),3.29(dd,J＝14.0,8.0Hz,1H),1.95(s,3H)。C₁₀H₁₈N₅O₉P(M-H⁺)LRMS(ESI-)计算值382.08，实测值382.15。

实施例18.6-(2-氯乙酰胺基)-6-脱氧-GalNAc-UDP 88的合成

根据由Baisch等人Bioorg.Med.Chem.,1997,5,383描述的方法将单磷酸酯82与UMP偶联。

简言之，在氮气气氛下将尿苷-5'-单磷酸三丁基铵(31mg，0.06mmol)溶于无水DMF(0.5mL)中。加入羰基二咪唑(13mg，0.04mmol)，将反应混合物在室温下搅拌30min。接下来，加入无水MeOH(2.5μL)并搅拌15min以除去过量的CDI。在高真空下15min除去剩余的MeOH。随后，将单磷酸酯82(15mg，0.04mmol)溶于无水DMF(0.5mL)中，加入到反应混合物中，然后加入N-甲基咪唑、HCl盐(25mg，0.16mmol)。将反应在室温下搅拌过夜，然后真空浓缩。通过MS监测单磷酸盐中间体的消耗。用离子交换色谱法(Q-HITRAP，1×5mL柱)进行纯化。通过加载缓冲液A(10mM NH₄HCO₃)实现柱上的第一次结合，并用缓冲液A冲洗柱。接下来，进行至40％B(250mM NH₄HCO₃)的梯度来洗脱产物并用100％B冲洗柱以除去剩余的副产物。将含有产物的级分冻干，得到所需产物88(1mg，1.46μmol，4％)。

C₁₉H₂₉ClN₄O₁₇P₂(M-H⁺)LRMS(ESI-)计算值681.06(100％),683.06(32％)，实测值681.13(100％),683.15(40％)。

实施例19.6-(4-叠氮基苯甲酰氨基)-6-脱氧-GalNAc-UDP 89的合成

根据由Baisch等人Bioorg.Med.Chem.,1997,5,383描述的方法将单磷酸酯83与UMP偶联。

简言之，在氮气气氛下将尿苷-5'-单磷酸三丁基铵(77mg，0.15mmol)溶于无水DMF(1mL)中。加入羰基二咪唑(41mg，0.25mmol)，将反应混合物在室温下搅拌30min。接下来，加入无水MeOH(6.2μL)并搅拌15min以除去过量的CDI。在高真空下15min除去剩余的MeOH。随后，将单磷酸酯83(56mg，0.13mmol)溶于无水DMF(1mL)中，加入到反应混合物中，然后加入N-甲基咪唑、HCl盐(79mg，0.51mmol)。将反应在室温下搅拌过夜，然后真空浓缩。通过MS监测单磷酸盐中间体的消耗。用离子交换色谱法(Q-HITRAP，3×5mL柱，1×15mL柱)进行纯化。通过加载缓冲液A(10mM NH₄HCO₃)实现柱上的第一次结合，并用缓冲液A冲洗柱。接下来，进行至40％B(250mM NH₄HCO₃)的梯度来洗脱产物并用100％B冲洗柱以除去剩余的副产物。将含有产物的级分冻干，得到所需产物89(13mg，0.017mmol，14％)。

C₂₄H₃₁N₇O₁₇P₂(M-H⁺)LRMS(ESI-)计算值750.12，实测值750.33。

实施例20.6-(N-2-叠氮基-2,2-二氟乙基氨基甲酸酯)-6-脱氧-GalNAc-UDP 90的合成

根据由Baisch等人Bioorg.Med.Chem.,1997,5,383描述的方法将单磷酸酯84与UMP偶联。

简言之，在氮气气氛下将尿苷-5'-单磷酸三丁基铵(200mg，0.39mmol)溶于无水DMF(3mL)中。加入羰基二咪唑(106mg，0.65mmol)，将反应混合物在室温下搅拌30min。接下来，加入无水MeOH(16μL)并搅拌15min以除去过量的CDI。在高真空下15min除去剩余的MeOH。随后，将单磷酸酯84(147mg，0.33mmol)悬浮于无水DMF(3mL)中，加入到反应混合物中，然后加入N-甲基咪唑、HCl盐(204mg，1.31mmol)。通过MS监测单磷酸盐中间体的消耗。将反应在室温下搅拌3天。将另一部分的UMP如上所述地活化，并与1mL H₂O一起加入到反应中。搅拌过夜后，反应完成，减压除去溶剂。用离子交换色谱法(QHITRAP，3×5mL柱，1×15mL柱)进行纯化。通过加载缓冲液A(10mMNH₄HCO₃)实现柱上的第一次结合，并用缓冲液A冲洗柱。接下来，进行至40％B(250mM NH₄HCO₃)的梯度来洗脱产物并用100％B冲洗柱以除去剩余的副产物。将含有产物的级分冻干，得到所需产物90(122mg，0.16mmol，49％)。

C₂₀H₂₉F₂N₇O₁₈P₂(M-H⁺)LRMS(ESI-)计算值754.09，实测值754.16。

实施例21.6-(N-1-(2-叠氮基乙基)脲)-6-脱氧-GalNAc-UDP 91的合成

根据由Baisch等人Bioorg.Med.Chem.,1997,5,383描述的方法将单磷酸酯85与UMP偶联。

简言之，在氮气气氛下将尿苷-5'-单磷酸三丁基铵(126mg，0.25mmol)溶于无水DMF(2mL)中。加入羰基二咪唑(67mg，0.41mmol)，将反应混合物在室温下搅拌30min。接下来，加入无水MeOH(10μL)并搅拌15min以除去过量的CDI。在高真空下15min除去剩余的MeOH。随后，将单磷酸酯85(85mg，0.21mmol)溶于无水DMF(2mL)中，加入到反应混合物中，然后加入N-甲基咪唑、HCl盐(129mg，0.82mmol)。将反应在室温下搅拌2天，然后真空浓缩。通过MS监测单磷酸盐中间体的消耗。用离子交换色谱法(Q HITRAP，3×5mL柱，1×15mL柱)进行纯化。通过加载缓冲液A(10mM NH₄HCO₃)实现柱上的第一次结合，并用缓冲液A冲洗柱。接下来，进行至40％B(250mM NH₄HCO₃)的梯度来洗脱产物并用100％B冲洗柱以除去剩余的副产物。将含有产物的级分冻干，得到所需产物91(83mg，012mmol，56％)。

C₂₀H₃₂N₈O₁₇P₂(M-H⁺)LRMS(ESI-)计算值717.13，实测值717.27。

实施例22.6-(N-(2-S-乙酰基)-巯基乙酰胺基)-6-脱氧-GalNAc-UDP 92的合成

根据由Baisch等人Bioorg.Med.Chem.,1997,5,383描述的方法将单磷酸酯86与UMP偶联。

简言之，在氮气气氛下将尿苷-5'-单磷酸三丁基铵(139mg，0.27mmol)溶于无水DMF(2mL)中。加入羰基二咪唑(74mg，0.46mmol)，将反应混合物在室温下搅拌30min。接下来，加入无水MeOH(11μL)并搅拌15min以除去过量的CDI。在高真空下15min除去剩余的MeOH。随后，将单磷酸酯86(95mg，0.27mmol)溶于无水DMF(2mL)中，加入到反应混合物中，然后加入N-甲基咪唑、HCl盐(142mg，0.91mmol)。将反应在室温下搅拌3天，然后真空浓缩。通过MS监测单磷酸盐中间体的消耗。用快速色谱(7:2:1-4:2:1EtOAc:MeOH:H₂O)进行纯化，得到产物92(97mg，0.13mmol，49％)。

C₂₁H₃₂N₄O₁₈P₂S(M-H⁺)LRMS(ESI-)计算值721.08，实测值721.39。

实施例23.6-(2-叠氮基乙酰氨基)-6-脱氧-GalNAc-UDP 93的合成

根据由Baisch等人Bioorg.Med.Chem.,1997,5,383描述的方法将单磷酸酯87与UMP偶联。

简言之，在氮气气氛下将尿苷-5'-单磷酸三丁基铵(191mg，0.38mmol)溶于无水DMF(3mL)中。加入羰基二咪唑(102mg，0.63mmol)，将反应混合物在室温下搅拌30min。接下来，加入无水MeOH(16μL)并搅拌15min以除去过量的CDI。在高真空下15min除去剩余的MeOH。随后，将单磷酸酯87(120mg，0.31mmol)溶于无水DMF(3mL)中，加入到反应混合物中，然后加入N-甲基咪唑、HCl盐(195mg，1.25mmol)。通过MS监测单磷酸盐中间体的消耗。将反应在室温下搅拌16h。为了溶解反应物中的所有组分，加入1mL H₂O。搅拌3h后，减压除去溶剂。用离子交换色谱法(Q-HITRAP，3×5mL柱，1×15mL柱)进行纯化。通过加载缓冲液A(10mMNH₄HCO₃)实现柱上的第一次结合，并用缓冲液A冲洗柱。接下来，进行至40％B(250mMNH₄HCO₃)的梯度来洗脱产物并用100％B冲洗柱以除去剩余的副产物。将含有产物的级分冻干，得到所需产物93(10mg，0.015mmol，5％)。

C₁₉H₂₉N₇O₁₇P₂(M-H⁺)LRMS(ESI-)计算值688.10，实测值688.10。

实施例24.6-氨基-6-脱氧-GalNAc-UDP 94的合成

向6-叠氮基-GalNAc-UDP(25mg，0.04mmol)的H₂O(0.5mL)溶液中加入DTT(6mg，0.04mmol)，并加入几滴Et₃N。将反应在室温下搅拌2h，然后用LCMS监测反应。为了加速反应，加入额外的DTT(12mg，0.08mmol)，1h后反应完成，真空浓缩。用离子交换色谱法(Q-HITRAP，1×5mL柱)进行纯化。通过加载缓冲液A(10mMNH₄HCO₃)实现柱上的第一次结合，并用缓冲液A冲洗柱。接下来，进行至40％B(250mM NH₄HCO₃)的梯度来洗脱产物并用100％B冲洗柱以除去剩余的副产物。将含有产物的级分冻干，得到所需产物94(12mg，0.019mmol，51％)。

C₁₇H₂₈N₄O₁₆P₂(M-H⁺)LRMS(ESI-)计算值605.09，实测值605.11。

实施例25.本妥昔单抗–(6-氨基-6-脱氧-GalNAc)，95的制备

类似于实施例6中所述的对曲妥珠单抗的修剪来修剪本妥昔单抗。

将经修剪的本妥昔单抗(15mg/mL)用在10mM MnCl₂和25mMTris-HCl pH 8.0中的6-氨基-6-脱氧-GalNAc-UDP 94(5mM)和TnGalNAcT(1.5mg/mL)在30℃下孵育过夜。将反应混合物的样品(2μL)用总体积10μL的磷酸盐缓冲盐水(PBS)pH 6.6中的Fabricator^TM(1.25U/μL)在37℃下孵育1小时。该样品的质谱分析显示完全转化为产物本妥昔单抗-(6-氨基-GalNAc)(24307Da(70％)和24435(30％，C-末端赖氨酸变体))。

实施例26.本妥昔单抗-(6-(2-叠氮基乙酰氨基)-6-脱氧-GalNAc)，96的制备

将经修剪的本妥昔单抗(15mg/mL)用10mM MnCl₂和25mM Tris-HCl pH 8.0中的6-(2-叠氮基乙酰氨基)-6-脱氧-GalNAc 93(5mM)和TnGalNAcT(1.5mg/mL)在30℃下孵育过夜。将反应混合物的样品(2μL)用总体积10μL的磷酸盐缓冲盐水(PBS)pH6.6中的Fabricator^TM(1.25U/μL)在37℃下孵育1小时。该样品的质谱分析显示70％转化为产物本妥昔单抗-(6-(2-叠氮基乙酰氨基)-6-脱氧-GalNAc)(24391Da(70％)和24518(30％，C-末端赖氨酸变体))。

序列表

<110> 西纳福克斯股份有限公司

<120> 用为或衍生自β-(1,4)-N-乙酰半乳糖胺转移酶的糖基转移酶修饰糖蛋白的方法

<130> P6055617PCT

<150> EP15164864.9

<151> 2015-04-23

<160> 92

<170> SIPOSequenceListing 1.0

<210> 1

<211> 402

<212> PRT

<213> Bos taurus

<400> 1

Met Lys Phe Arg Glu Pro Leu Leu Gly Gly Ser Ala Ala Met Pro Gly

1 5 10 15

Ala Ser Leu Gln Arg Ala Cys Arg Leu Leu Val Ala Val Cys Ala Leu

20 25 30

His Leu Gly Val Thr Leu Val Tyr Tyr Leu Ala Gly Arg Asp Leu Arg

35 40 45

Arg Leu Pro Gln Leu Val Gly Val His Pro Pro Leu Gln Gly Ser Ser

50 55 60

His Gly Ala Ala Ala Ile Gly Gln Pro Ser Gly Glu Leu Arg Leu Arg

65 70 75 80

Gly Val Ala Pro Pro Pro Pro Leu Gln Asn Ser Ser Lys Pro Arg Ser

85 90 95

Arg Ala Pro Ser Asn Leu Asp Ala Tyr Ser His Pro Gly Pro Gly Pro

100 105 110

Gly Pro Gly Ser Asn Leu Thr Ser Ala Pro Val Pro Ser Thr Thr Thr

115 120 125

Arg Ser Leu Thr Ala Cys Pro Glu Glu Ser Pro Leu Leu Val Gly Pro

130 135 140

Met Leu Ile Glu Phe Asn Ile Pro Val Asp Leu Lys Leu Ile Glu Gln

145 150 155 160

Gln Asn Pro Lys Val Lys Leu Gly Gly Arg Tyr Thr Pro Met Asp Cys

165 170 175

Ile Ser Pro His Lys Val Ala Ile Ile Ile Leu Phe Arg Asn Arg Gln

180 185 190

Glu His Leu Lys Tyr Trp Leu Tyr Tyr Leu His Pro Met Val Gln Arg

195 200 205

Gln Gln Leu Asp Tyr Gly Ile Tyr Val Ile Asn Gln Ala Gly Glu Ser

210 215 220

Met Phe Asn Arg Ala Lys Leu Leu Asn Val Gly Phe Lys Glu Ala Leu

225 230 235 240

Lys Asp Tyr Asp Tyr Asn Cys Phe Val Phe Ser Asp Val Asp Leu Ile

245 250 255

Pro Met Asn Asp His Asn Thr Tyr Arg Cys Phe Ser Gln Pro Arg His

260 265 270

Ile Ser Val Ala Met Asp Lys Phe Gly Phe Ser Leu Pro Tyr Val Gln

275 280 285

Leu Phe Gly Gly Val Ser Ala Leu Ser Lys Gln Gln Phe Leu Ser Ile

290 295 300

Asn Gly Phe Pro Asn Asn Tyr Trp Gly Trp Gly Gly Glu Asp Asp Asp

305 310 315 320

Ile Tyr Asn Arg Leu Ala Phe Arg Gly Met Ser Val Ser Arg Pro Asn

325 330 335

Ala Val Ile Gly Lys Cys Arg Met Ile Arg His Ser Arg Asp Lys Lys

340 345 350

Asn Glu Pro Asn Pro Gln Arg Phe Asp Arg Ile Ala His Thr Lys Glu

355 360 365

Thr Met Leu Ser Asp Gly Leu Asn Ser Leu Thr Tyr Met Val Leu Glu

370 375 380

Val Gln Arg Tyr Pro Leu Tyr Thr Lys Ile Thr Val Asp Ile Gly Thr

385 390 395 400

Pro Ser

<210> 2

<211> 383

<212> PRT

<213> 秀丽隐杆线虫(Caenorhabditis elegans)

<400> 2

Met Ala Phe Arg His Leu Ala Val Ala Arg Leu Lys Ser Leu Leu Val

1 5 10 15

Leu Cys Ala Val Leu Leu Leu Val His Ala Met Ile Tyr Lys Ile Pro

20 25 30

Ser Leu Tyr Glu Asn Leu Thr Ile Gly Ser Ser Thr Leu Ile Ala Asp

35 40 45

Val Asp Ala Met Glu Ala Val Leu Gly Asn Thr Ala Ser Thr Ser Asp

50 55 60

Asp Leu Leu Asp Thr Trp Asn Ser Thr Phe Ser Pro Ile Ser Glu Val

65 70 75 80

Asn Gln Thr Ser Phe Met Glu Asp Ile Arg Pro Ile Leu Phe Pro Asp

85 90 95

Asn Gln Thr Leu Gln Phe Cys Asn Gln Thr Pro Pro His Leu Val Gly

100 105 110

Pro Ile Arg Val Phe Leu Asp Glu Pro Asp Phe Lys Thr Leu Glu Lys

115 120 125

Ile Tyr Pro Asp Thr His Ala Gly Gly His Gly Met Pro Lys Asp Cys

130 135 140

Val Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr Arg Asp Arg Glu

145 150 155 160

Ala His Leu Arg Ile Met Leu His Asn Leu His Ser Leu Leu Ala Lys

165 170 175

Gln Gln Leu Asp Tyr Ala Ile Phe Ile Val Glu Gln Val Ala Asn Gln

180 185 190

Thr Phe Asn Arg Gly Lys Leu Met Asn Val Gly Tyr Asp Val Ala Ser

195 200 205

Arg Leu Tyr Pro Trp Gln Cys Phe Ile Phe His Asp Val Asp Leu Leu

210 215 220

Pro Glu Asp Asp Arg Asn Leu Tyr Thr Cys Pro Ile Gln Pro Arg His

225 230 235 240

Met Ser Val Ala Ile Asp Lys Phe Asn Tyr Lys Leu Pro Tyr Ser Ala

245 250 255

Ile Phe Gly Gly Ile Ser Ala Leu Thr Lys Asp His Leu Lys Lys Ile

260 265 270

Asn Gly Phe Ser Asn Asp Phe Trp Gly Trp Gly Gly Glu Asp Asp Asp

275 280 285

Leu Ala Thr Arg Thr Ser Met Ala Gly Leu Lys Val Ser Arg Tyr Pro

290 295 300

Thr Gln Ile Ala Arg Tyr Lys Met Ile Lys His Ser Thr Glu Ala Thr

305 310 315 320

Asn Pro Val Asn Lys Cys Arg Tyr Lys Ile Met Gly Gln Thr Lys Arg

325 330 335

Arg Trp Thr Arg Asp Gly Leu Ser Asn Leu Lys Tyr Lys Leu Val Asn

340 345 350

Leu Glu Leu Lys Pro Leu Tyr Thr Arg Ala Val Val Asp Leu Leu Glu

355 360 365

Lys Asp Cys Arg Arg Glu Leu Arg Arg Asp Phe Pro Thr Cys Phe

370 375 380

<210> 3

<211> 383

<212> PRT

<213> 猪蛔虫(Ascaris suum)

<400> 3

Met Asn Ser Lys Leu Lys Leu Val Ile Val Leu Thr Leu Cys Val Ala

1 5 10 15

Ile Ile His Phe Leu Leu Ser Asp Cys Pro Ile Ser Pro Asp Tyr Ser

20 25 30

Phe Trp Ser Pro Ala Phe Ile Ile Ser Ala Pro Lys Thr Leu Thr Thr

35 40 45

Leu Gln Pro Phe Ser Gln Ser Thr Ser Thr Asn Asp Leu Ala Val Ser

50 55 60

Ala Leu Glu Ser Val Glu Phe Ser Met Leu Asp Asn Ser Ser Ile Leu

65 70 75 80

His Ala Ser Asp Asn Trp Thr Asn Asp Glu Leu Val Met Arg Ala Gln

85 90 95

Asn Glu Asn Leu Gln Leu Cys Pro Met Thr Pro Pro Ala Leu Val Gly

100 105 110

Pro Ile Lys Val Trp Met Asp Ala Pro Ser Phe Ala Glu Leu Glu Arg

115 120 125

Leu Tyr Pro Phe Leu Glu Pro Gly Gly His Gly Met Pro Thr Ala Cys

130 135 140

Arg Ala Arg His Arg Val Ala Ile Val Val Pro Tyr Arg Asp Arg Glu

145 150 155 160

Ser His Leu Arg Thr Phe Leu His Asn Leu His Ser Leu Leu Thr Lys

165 170 175

Gln Gln Leu Asp Tyr Ala Ile Phe Val Val Glu Gln Thr Ala Asn Glu

180 185 190

Thr Phe Asn Arg Ala Lys Leu Met Asn Val Gly Tyr Ala Glu Ala Ile

195 200 205

Arg Leu Tyr Asp Trp Arg Cys Phe Ile Phe His Asp Val Asp Leu Leu

210 215 220

Pro Glu Asp Asp Arg Asn Leu Tyr Ser Cys Pro Asp Glu Pro Arg His

225 230 235 240

Met Ser Val Ala Val Asp Lys Phe Asn Tyr Lys Leu Pro Tyr Gly Ser

245 250 255

Ile Phe Gly Gly Ile Ser Ala Leu Thr Arg Glu Gln Phe Glu Gly Ile

260 265 270

Asn Gly Phe Ser Asn Asp Tyr Trp Gly Trp Gly Gly Glu Asp Asp Asp

275 280 285

Leu Ser Thr Arg Val Thr Leu Ala Gly Tyr Lys Ile Ser Arg Tyr Pro

290 295 300

Ala Glu Ile Ala Arg Tyr Lys Met Ile Lys His Asn Ser Glu Lys Lys

305 310 315 320

Asn Pro Val Asn Arg Cys Arg Tyr Lys Leu Met Ser Ala Thr Lys Ser

325 330 335

Arg Trp Arg Asn Asp Gly Leu Ser Ser Leu Ser Tyr Asp Leu Ile Ser

340 345 350

Leu Gly Arg Leu Pro Leu Tyr Thr His Ile Lys Val Asp Leu Leu Glu

355 360 365

Lys Gln Ser Arg Arg Tyr Leu Arg Thr His Gly Phe Pro Thr Cys

370 375 380

<210> 4

<211> 421

<212> PRT

<213> 粉纹夜蛾(Trichoplusia ni)

<400> 4

Met Gly Gly Arg Ala Thr Arg Ala Leu Arg Leu Leu Leu Leu Leu Val

1 5 10 15

Leu Ala Leu Ala Ala Val Glu Tyr Leu Phe Gly Ser Ile Leu Asp Ala

20 25 30

Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu Tyr Asn Ala Thr Gln

35 40 45

Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala Asn Trp Pro Lys Lys

50 55 60

Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu Tyr Ser Ile Lys Asn

65 70 75 80

Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser Val Val His Pro Pro

85 90 95

Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp Lys Asn Met Thr Ile

100 105 110

Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr Pro Leu Leu Ile Thr

115 120 125

Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr Thr Glu Asp Gly Val

130 135 140

Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu Cys Asp Ser Met Pro

145 150 155 160

Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr Glu Leu Glu Leu Glu

165 170 175

Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp Gly Gly Arg Tyr Ser

180 185 190

Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr

195 200 205

Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu Asn His Met His Pro

210 215 220

Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile Phe Ile Val Glu Gln

225 230 235 240

Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu Met Asn Val Gly Phe

245 250 255

Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp Gln Cys Phe Val Phe

260 265 270

His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg Asn Leu Tyr Ser Cys

275 280 285

Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile Asp Lys Leu His Phe

290 295 300

Lys Leu Pro Tyr Glu Asp Ile Phe Gly Gly Val Ser Ala Met Thr Leu

305 310 315 320

Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn Lys Tyr Trp Gly Trp

325 330 335

Gly Gly Glu Asp Asp Asp Met Ser Tyr Arg Leu Lys Lys Ile Asn Tyr

340 345 350

His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg Tyr Ala Met Leu Asp

355 360 365

His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr Gln Leu Leu Ser Gln

370 375 380

Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser Thr Leu Glu Tyr Glu

385 390 395 400

Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr His Ile Leu Val Asn

405 410 415

Ile Asp Glu Arg Ser

420

<210> 5

<211> 403

<212> PRT

<213> 黑腹果蝇(Drosophila melanogaster)

<400> 5

Met Tyr Leu Phe Thr Lys Ala Asn Leu Ile Arg Phe Leu Ala Gly Ala

1 5 10 15

Ile Cys Leu Leu Leu Val Leu Asn Phe Val Gly Phe Arg Ser Asp Gly

20 25 30

Gly Ser Ala Thr Ser Leu Ser Lys Leu Ser Ile Arg Arg Val His Lys

35 40 45

Tyr Ala His Ile Tyr Gly Asn Ala Ser Ser Asp Gly Ala Gly Gly Ser

50 55 60

Glu Ala Ser Arg Leu Pro Ala Ser Pro Leu Ala Leu Ser Lys Asp Arg

65 70 75 80

Glu Arg Asp Gln Glu Leu Asn Gly Gly Pro Asn Ser Thr Ile Arg Thr

85 90 95

Val Ile Ala Thr Ala Asn Phe Thr Ser Ile Pro Gln Asp Leu Thr Arg

100 105 110

Phe Leu Leu Gly Thr Lys Lys Phe Leu Pro Pro Arg Gln Lys Ser Thr

115 120 125

Ser Ala Leu Leu Ala Asn Cys Thr Asp Pro Asp Pro Arg Asp Gly Gly

130 135 140

Pro Ile Thr Pro Asn Thr Thr Leu Glu Ser Leu Asp Val Ile Glu Ala

145 150 155 160

Glu Leu Gly Pro Leu Leu Arg Pro Gly Gly Ala Phe Glu Pro Glu Asn

165 170 175

Cys Asn Ala Gln His His Val Ala Ile Val Val Pro Phe Arg Asp Arg

180 185 190

Tyr Ala His Leu Leu Leu Phe Leu Arg Asn Ile His Pro Phe Leu Met

195 200 205

Lys Gln Arg Ile Ala Tyr Arg Ile Phe Ile Val Glu Gln Thr Asn Gly

210 215 220

Lys Pro Phe Asn Arg Ala Ala Met Met Asn Ile Gly Tyr Leu Glu Ala

225 230 235 240

Leu Lys Leu Tyr Gln Trp Asp Cys Phe Ile Phe His Asp Val Asp Leu

245 250 255

Leu Pro Leu Asp Asp Arg Asn Leu Tyr Asn Cys Pro Arg Gln Pro Arg

260 265 270

His Met Ser Val Ala Ile Asp Thr Leu Asn Phe Arg Leu Pro Tyr Arg

275 280 285

Ser Ile Phe Gly Gly Val Ser Ala Met Thr Arg Glu His Phe Gln Ala

290 295 300

Val Asn Gly Phe Ser Asn Ser Phe Phe Gly Trp Gly Gly Glu Asp Asp

305 310 315 320

Asp Met Ser Asn Arg Leu Lys His Ala Asn Leu Phe Ile Ser Arg Tyr

325 330 335

Pro Val Asn Ile Ala Arg Tyr Lys Met Leu Lys His Gln Lys Glu Lys

340 345 350

Ala Asn Pro Lys Arg Tyr Glu Asn Leu Gln Asn Gly Met Ser Lys Ile

355 360 365

Glu Gln Asp Gly Ile Asn Ser Ile Lys Tyr Ser Ile Tyr Ser Ile Lys

370 375 380

Gln Phe Pro Thr Phe Thr Trp Tyr Leu Ala Glu Leu Lys Asn Ser Glu

385 390 395 400

Arg Lys Ser

<210> 6

<211> 354

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 6

Lys Ile Pro Ser Leu Tyr Glu Asn Leu Thr Ile Gly Ser Ser Thr Leu

1 5 10 15

Ile Ala Asp Val Asp Ala Met Glu Ala Val Leu Gly Asn Thr Ala Ser

20 25 30

Thr Ser Asp Asp Leu Leu Asp Thr Trp Asn Ser Thr Phe Ser Pro Ile

35 40 45

Ser Glu Val Asn Gln Thr Ser Phe Met Glu Asp Ile Arg Pro Ile Leu

50 55 60

Phe Pro Asp Asn Gln Thr Leu Gln Phe Cys Asn Gln Thr Pro Pro His

65 70 75 80

Leu Val Gly Pro Ile Arg Val Phe Leu Asp Glu Pro Asp Phe Lys Thr

85 90 95

Leu Glu Lys Ile Tyr Pro Asp Thr His Ala Gly Gly His Gly Met Pro

100 105 110

Lys Asp Cys Val Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr Arg

115 120 125

Asp Arg Glu Ala His Leu Arg Ile Met Leu His Asn Leu His Ser Leu

130 135 140

Leu Ala Lys Gln Gln Leu Asp Tyr Ala Ile Phe Ile Val Glu Gln Val

145 150 155 160

Ala Asn Gln Thr Phe Asn Arg Gly Lys Leu Met Asn Val Gly Tyr Asp

165 170 175

Val Ala Ser Arg Leu Tyr Pro Trp Gln Cys Phe Ile Phe His Asp Val

180 185 190

Asp Leu Leu Pro Glu Asp Asp Arg Asn Leu Tyr Thr Cys Pro Ile Gln

195 200 205

Pro Arg His Met Ser Val Ala Ile Asp Lys Phe Asn Tyr Lys Leu Pro

210 215 220

Tyr Ser Ala Ile Phe Gly Gly Ile Ser Ala Leu Thr Lys Asp His Leu

225 230 235 240

Lys Lys Ile Asn Gly Phe Ser Asn Asp Phe Trp Gly Trp Gly Gly Glu

245 250 255

Asp Asp Asp Leu Ala Thr Arg Thr Ser Met Ala Gly Leu Lys Val Ser

260 265 270

Arg Tyr Pro Thr Gln Ile Ala Arg Tyr Lys Met Ile Lys His Ser Thr

275 280 285

Glu Ala Thr Asn Pro Val Asn Lys Cys Arg Tyr Lys Ile Met Gly Gln

290 295 300

Thr Lys Arg Arg Trp Thr Arg Asp Gly Leu Ser Asn Leu Lys Tyr Lys

305 310 315 320

Leu Val Asn Leu Glu Leu Lys Pro Leu Tyr Thr Arg Ala Val Val Asp

325 330 335

Leu Leu Glu Lys Asp Cys Arg Arg Glu Leu Arg Arg Asp Phe Pro Thr

340 345 350

Cys Phe

<210> 7

<211> 354

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 7

Asp Tyr Ser Phe Trp Ser Pro Ala Phe Ile Ile Ser Ala Pro Lys Thr

1 5 10 15

Leu Thr Thr Leu Gln Pro Phe Ser Gln Ser Thr Ser Thr Asn Asp Leu

20 25 30

Ala Val Ser Ala Leu Glu Ser Val Glu Phe Ser Met Leu Asp Asn Ser

35 40 45

Ser Ile Leu His Ala Ser Asp Asn Trp Thr Asn Asp Glu Leu Val Met

50 55 60

Arg Ala Gln Asn Glu Asn Leu Gln Leu Cys Pro Met Thr Pro Pro Ala

65 70 75 80

Leu Val Gly Pro Ile Lys Val Trp Met Asp Ala Pro Ser Phe Ala Glu

85 90 95

Leu Glu Arg Leu Tyr Pro Phe Leu Glu Pro Gly Gly His Gly Met Pro

100 105 110

Thr Ala Cys Arg Ala Arg His Arg Val Ala Ile Val Val Pro Tyr Arg

115 120 125

Asp Arg Glu Ser His Leu Arg Thr Phe Leu His Asn Leu His Ser Leu

130 135 140

Leu Thr Lys Gln Gln Leu Asp Tyr Ala Ile Phe Val Val Glu Gln Thr

145 150 155 160

Ala Asn Glu Thr Phe Asn Arg Ala Lys Leu Met Asn Val Gly Tyr Ala

165 170 175

Glu Ala Ile Arg Leu Tyr Asp Trp Arg Cys Phe Ile Phe His Asp Val

180 185 190

Asp Leu Leu Pro Glu Asp Asp Arg Asn Leu Tyr Ser Cys Pro Asp Glu

195 200 205

Pro Arg His Met Ser Val Ala Val Asp Lys Phe Asn Tyr Lys Leu Pro

210 215 220

Tyr Gly Ser Ile Phe Gly Gly Ile Ser Ala Leu Thr Arg Glu Gln Phe

225 230 235 240

Glu Gly Ile Asn Gly Phe Ser Asn Asp Tyr Trp Gly Trp Gly Gly Glu

245 250 255

Asp Asp Asp Leu Ser Thr Arg Val Thr Leu Ala Gly Tyr Lys Ile Ser

260 265 270

Arg Tyr Pro Ala Glu Ile Ala Arg Tyr Lys Met Ile Lys His Asn Ser

275 280 285

Glu Lys Lys Asn Pro Val Asn Arg Cys Arg Tyr Lys Leu Met Ser Ala

290 295 300

Thr Lys Ser Arg Trp Arg Asn Asp Gly Leu Ser Ser Leu Ser Tyr Asp

305 310 315 320

Leu Ile Ser Leu Gly Arg Leu Pro Leu Tyr Thr His Ile Lys Val Asp

325 330 335

Leu Leu Glu Lys Gln Ser Arg Arg Tyr Leu Arg Thr His Gly Phe Pro

340 345 350

Thr Cys

<210> 8

<211> 389

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 8

Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu Tyr Asn Ala Thr Gln

1 5 10 15

Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala Asn Trp Pro Lys Lys

20 25 30

Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu Tyr Ser Ile Lys Asn

35 40 45

Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser Val Val His Pro Pro

50 55 60

Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp Lys Asn Met Thr Ile

65 70 75 80

Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr Pro Leu Leu Ile Thr

85 90 95

Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr Thr Glu Asp Gly Val

100 105 110

Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu Cys Asp Ser Met Pro

115 120 125

Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr Glu Leu Glu Leu Glu

130 135 140

Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp Gly Gly Arg Tyr Ser

145 150 155 160

Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr

165 170 175

Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu Asn His Met His Pro

180 185 190

Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile Phe Ile Val Glu Gln

195 200 205

Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu Met Asn Val Gly Phe

210 215 220

Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp Gln Cys Phe Val Phe

225 230 235 240

His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg Asn Leu Tyr Ser Cys

245 250 255

Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile Asp Lys Leu His Phe

260 265 270

Lys Leu Pro Tyr Glu Asp Ile Phe Gly Gly Val Ser Ala Met Thr Leu

275 280 285

Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn Lys Tyr Trp Gly Trp

290 295 300

Gly Gly Glu Asp Asp Asp Met Ser Tyr Arg Leu Lys Lys Ile Asn Tyr

305 310 315 320

His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg Tyr Ala Met Leu Asp

325 330 335

His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr Gln Leu Leu Ser Gln

340 345 350

Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser Thr Leu Glu Tyr Glu

355 360 365

Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr His Ile Leu Val Asn

370 375 380

Ile Asp Glu Arg Ser

385

<210> 9

<211> 357

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 9

His Lys Tyr Ala His Ile Tyr Gly Asn Ala Ser Ser Asp Gly Ala Gly

1 5 10 15

Gly Ser Glu Ala Ser Arg Leu Pro Ala Ser Pro Leu Ala Leu Ser Lys

20 25 30

Asp Arg Glu Arg Asp Gln Glu Leu Asn Gly Gly Pro Asn Ser Thr Ile

35 40 45

Arg Thr Val Ile Ala Thr Ala Asn Phe Thr Ser Ile Pro Gln Asp Leu

50 55 60

Thr Arg Phe Leu Leu Gly Thr Lys Lys Phe Leu Pro Pro Arg Gln Lys

65 70 75 80

Ser Thr Ser Ala Leu Leu Ala Asn Cys Thr Asp Pro Asp Pro Arg Asp

85 90 95

Gly Gly Pro Ile Thr Pro Asn Thr Thr Leu Glu Ser Leu Asp Val Ile

100 105 110

Glu Ala Glu Leu Gly Pro Leu Leu Arg Pro Gly Gly Ala Phe Glu Pro

115 120 125

Glu Asn Cys Asn Ala Gln His His Val Ala Ile Val Val Pro Phe Arg

130 135 140

Asp Arg Tyr Ala His Leu Leu Leu Phe Leu Arg Asn Ile His Pro Phe

145 150 155 160

Leu Met Lys Gln Arg Ile Ala Tyr Arg Ile Phe Ile Val Glu Gln Thr

165 170 175

Asn Gly Lys Pro Phe Asn Arg Ala Ala Met Met Asn Ile Gly Tyr Leu

180 185 190

Glu Ala Leu Lys Leu Tyr Gln Trp Asp Cys Phe Ile Phe His Asp Val

195 200 205

Asp Leu Leu Pro Leu Asp Asp Arg Asn Leu Tyr Asn Cys Pro Arg Gln

210 215 220

Pro Arg His Met Ser Val Ala Ile Asp Thr Leu Asn Phe Arg Leu Pro

225 230 235 240

Tyr Arg Ser Ile Phe Gly Gly Val Ser Ala Met Thr Arg Glu His Phe

245 250 255

Gln Ala Val Asn Gly Phe Ser Asn Ser Phe Phe Gly Trp Gly Gly Glu

260 265 270

Asp Asp Asp Met Ser Asn Arg Leu Lys His Ala Asn Leu Phe Ile Ser

275 280 285

Arg Tyr Pro Val Asn Ile Ala Arg Tyr Lys Met Leu Lys His Gln Lys

290 295 300

Glu Lys Ala Asn Pro Lys Arg Tyr Glu Asn Leu Gln Asn Gly Met Ser

305 310 315 320

Lys Ile Glu Gln Asp Gly Ile Asn Ser Ile Lys Tyr Ser Ile Tyr Ser

325 330 335

Ile Lys Gln Phe Pro Thr Phe Thr Trp Tyr Leu Ala Glu Leu Lys Asn

340 345 350

Ser Glu Arg Lys Ser

355

<210> 10

<211> 354

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 10

Lys Ile Pro Ser Leu Tyr Glu Asn Leu Thr Ile Gly Ser Ser Thr Leu

1 5 10 15

Ile Ala Asp Val Asp Ala Met Glu Ala Val Leu Gly Asn Thr Ala Ser

20 25 30

Thr Ser Asp Asp Leu Leu Asp Thr Trp Asn Ser Thr Phe Ser Pro Ile

35 40 45

Ser Glu Val Asn Gln Thr Ser Phe Met Glu Asp Ile Arg Pro Ile Leu

50 55 60

Phe Pro Asp Asn Gln Thr Leu Gln Phe Cys Asn Gln Thr Pro Pro His

65 70 75 80

Leu Val Gly Pro Ile Arg Val Phe Leu Asp Glu Pro Asp Phe Lys Thr

85 90 95

Leu Glu Lys Ile Tyr Pro Asp Thr His Ala Gly Gly His Gly Met Pro

100 105 110

Lys Asp Cys Val Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr Arg

115 120 125

Asp Arg Glu Ala His Leu Arg Ile Met Leu His Asn Leu His Ser Leu

130 135 140

Leu Ala Lys Gln Gln Leu Asp Tyr Ala Ile Phe Ile Val Glu Gln Val

145 150 155 160

Ala Asn Gln Thr Phe Asn Arg Gly Lys Leu Met Asn Val Gly Tyr Asp

165 170 175

Val Ala Ser Arg Leu Tyr Pro Trp Gln Cys Phe Ile Phe His Asp Val

180 185 190

Asp Leu Leu Pro Glu Asp Asp Arg Asn Leu Tyr Thr Cys Pro Ile Gln

195 200 205

Pro Arg His Met Ser Val Ala Ile Asp Lys Phe Asn Tyr Lys Leu Pro

210 215 220

Tyr Ser Ala Leu Phe Gly Gly Ile Ser Ala Leu Thr Lys Asp His Leu

225 230 235 240

Lys Lys Ile Asn Gly Phe Ser Asn Asp Phe Trp Gly Trp Gly Gly Glu

245 250 255

Asp Asp Asp Leu Ala Thr Arg Thr Ser Met Ala Gly Leu Lys Val Ser

260 265 270

Arg Tyr Pro Thr Gln Ile Ala Arg Tyr Lys Met Ile Lys His Ser Thr

275 280 285

Glu Ala Thr Asn Pro Val Asn Lys Cys Arg Tyr Lys Ile Met Gly Gln

290 295 300

Thr Lys Arg Arg Trp Thr Arg Asp Gly Leu Ser Asn Leu Lys Tyr Lys

305 310 315 320

Leu Val Asn Leu Glu Leu Lys Pro Leu Tyr Thr Arg Ala Val Val Asp

325 330 335

Leu Leu Glu Lys Asp Cys Arg Arg Glu Leu Arg Arg Asp Phe Pro Thr

340 345 350

Cys Phe

<210> 11

<211> 354

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 11

Lys Ile Pro Ser Leu Tyr Glu Asn Leu Thr Ile Gly Ser Ser Thr Leu

1 5 10 15

Ile Ala Asp Val Asp Ala Met Glu Ala Val Leu Gly Asn Thr Ala Ser

20 25 30

Thr Ser Asp Asp Leu Leu Asp Thr Trp Asn Ser Thr Phe Ser Pro Ile

35 40 45

Ser Glu Val Asn Gln Thr Ser Phe Met Glu Asp Ile Arg Pro Ile Leu

50 55 60

Phe Pro Asp Asn Gln Thr Leu Gln Phe Cys Asn Gln Thr Pro Pro His

65 70 75 80

Leu Val Gly Pro Ile Arg Val Phe Leu Asp Glu Pro Asp Phe Lys Thr

85 90 95

Leu Glu Lys Ile Tyr Pro Asp Thr His Ala Gly Gly His Gly Met Pro

100 105 110

Lys Asp Cys Val Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr Arg

115 120 125

Asp Arg Glu Ala His Leu Arg Ile Met Leu His Asn Leu His Ser Leu

130 135 140

Leu Ala Lys Gln Gln Leu Asp Tyr Ala Ile Phe Ile Val Glu Gln Val

145 150 155 160

Ala Asn Gln Thr Phe Asn Arg Gly Lys Leu Met Asn Val Gly Tyr Asp

165 170 175

Val Ala Ser Arg Leu Tyr Pro Trp Gln Cys Phe Ile Phe His Asp Val

180 185 190

Asp Leu Leu Pro Glu Asp Asp Arg Asn Leu Tyr Thr Cys Pro Ile Gln

195 200 205

Pro Arg His Met Ser Val Ala Ile Asp Lys Phe Asn Tyr Lys Leu Pro

210 215 220

Tyr Ser Ala Met Phe Gly Gly Ile Ser Ala Leu Thr Lys Asp His Leu

225 230 235 240

Lys Lys Ile Asn Gly Phe Ser Asn Asp Phe Trp Gly Trp Gly Gly Glu

245 250 255

Asp Asp Asp Leu Ala Thr Arg Thr Ser Met Ala Gly Leu Lys Val Ser

260 265 270

Arg Tyr Pro Thr Gln Ile Ala Arg Tyr Lys Met Ile Lys His Ser Thr

275 280 285

Glu Ala Thr Asn Pro Val Asn Lys Cys Arg Tyr Lys Ile Met Gly Gln

290 295 300

Thr Lys Arg Arg Trp Thr Arg Asp Gly Leu Ser Asn Leu Lys Tyr Lys

305 310 315 320

Leu Val Asn Leu Glu Leu Lys Pro Leu Tyr Thr Arg Ala Val Val Asp

325 330 335

Leu Leu Glu Lys Asp Cys Arg Arg Glu Leu Arg Arg Asp Phe Pro Thr

340 345 350

Cys Phe

<210> 12

<211> 354

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 12

Lys Ile Pro Ser Leu Tyr Glu Asn Leu Thr Ile Gly Ser Ser Thr Leu

1 5 10 15

Ile Ala Asp Val Asp Ala Met Glu Ala Val Leu Gly Asn Thr Ala Ser

20 25 30

Thr Ser Asp Asp Leu Leu Asp Thr Trp Asn Ser Thr Phe Ser Pro Ile

35 40 45

Ser Glu Val Asn Gln Thr Ser Phe Met Glu Asp Ile Arg Pro Ile Leu

50 55 60

Phe Pro Asp Asn Gln Thr Leu Gln Phe Cys Asn Gln Thr Pro Pro His

65 70 75 80

Leu Val Gly Pro Ile Arg Val Phe Leu Asp Glu Pro Asp Phe Lys Thr

85 90 95

Leu Glu Lys Ile Tyr Pro Asp Thr His Ala Gly Gly His Gly Met Pro

100 105 110

Lys Asp Cys Val Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr Arg

115 120 125

Asp Arg Glu Ala His Leu Arg Ile Met Leu His Asn Leu His Ser Leu

130 135 140

Leu Ala Lys Gln Gln Leu Asp Tyr Ala Ile Phe Ile Val Glu Gln Val

145 150 155 160

Ala Asn Gln Thr Phe Asn Arg Gly Lys Leu Met Asn Val Gly Tyr Asp

165 170 175

Val Ala Ser Arg Leu Tyr Pro Trp Gln Cys Phe Ile Phe His Asp Val

180 185 190

Asp Leu Leu Pro Glu Asp Asp Arg Asn Leu Tyr Thr Cys Pro Ile Gln

195 200 205

Pro Arg His Met Ser Val Ala Ile Asp Lys Phe Asn Tyr Lys Leu Pro

210 215 220

Tyr Ser Ala Ala Phe Gly Gly Ile Ser Ala Leu Thr Lys Asp His Leu

225 230 235 240

Lys Lys Ile Asn Gly Phe Ser Asn Asp Phe Trp Gly Trp Gly Gly Glu

245 250 255

Asp Asp Asp Leu Ala Thr Arg Thr Ser Met Ala Gly Leu Lys Val Ser

260 265 270

Arg Tyr Pro Thr Gln Ile Ala Arg Tyr Lys Met Ile Lys His Ser Thr

275 280 285

Glu Ala Thr Asn Pro Val Asn Lys Cys Arg Tyr Lys Ile Met Gly Gln

290 295 300

Thr Lys Arg Arg Trp Thr Arg Asp Gly Leu Ser Asn Leu Lys Tyr Lys

305 310 315 320

Leu Val Asn Leu Glu Leu Lys Pro Leu Tyr Thr Arg Ala Val Val Asp

325 330 335

Leu Leu Glu Lys Asp Cys Arg Arg Glu Leu Arg Arg Asp Phe Pro Thr

340 345 350

Cys Phe

<210> 13

<211> 354

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 13

Lys Ile Pro Ser Leu Tyr Glu Asn Leu Thr Ile Gly Ser Ser Thr Leu

1 5 10 15

Ile Ala Asp Val Asp Ala Met Glu Ala Val Leu Gly Asn Thr Ala Ser

20 25 30

Thr Ser Asp Asp Leu Leu Asp Thr Trp Asn Ser Thr Phe Ser Pro Ile

35 40 45

Ser Glu Val Asn Gln Thr Ser Phe Met Glu Asp Ile Arg Pro Ile Leu

50 55 60

Phe Pro Asp Asn Gln Thr Leu Gln Phe Cys Asn Gln Thr Pro Pro His

65 70 75 80

Leu Val Gly Pro Ile Arg Val Phe Leu Asp Glu Pro Asp Phe Lys Thr

85 90 95

Leu Glu Lys Ile Tyr Pro Asp Thr His Ala Gly Gly His Gly Met Pro

100 105 110

Lys Asp Cys Val Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr Arg

115 120 125

Asp Arg Glu Ala His Leu Arg Ile Met Leu His Asn Leu His Ser Leu

130 135 140

Leu Ala Lys Gln Gln Leu Asp Tyr Ala Ile Phe Ile Val Glu Gln Val

145 150 155 160

Ala Asn Gln Thr Phe Asn Arg Gly Lys Leu Met Asn Val Gly Tyr Asp

165 170 175

Val Ala Ser Arg Leu Tyr Pro Trp Gln Cys Phe Ile Phe His Asp Val

180 185 190

Asp Leu Leu Pro Glu Asp Asp Arg Asn Leu Tyr Thr Cys Pro Ile Gln

195 200 205

Pro Arg His Met Ser Val Ala Ile Asp Lys Phe Asn Tyr Lys Leu Pro

210 215 220

Tyr Ser Ala Ile Phe Gly Gly Ile Ser Ala Leu Thr Lys Asp His Leu

225 230 235 240

Lys Lys Ile Asn Gly Phe Ser Asn Asp Phe Trp Gly Trp Gly Gly Glu

245 250 255

Asp Asp Asp Leu Ala Thr Arg Thr Ser Met Ala Gly Leu Lys Val Ser

260 265 270

Arg Tyr Pro Thr Gln Ile Ala Arg Tyr Lys His Ile Lys His Ser Thr

275 280 285

Glu Ala Thr Asn Pro Val Asn Lys Cys Arg Tyr Lys Ile Met Gly Gln

290 295 300

Thr Lys Arg Arg Trp Thr Arg Asp Gly Leu Ser Asn Leu Lys Tyr Lys

305 310 315 320

Leu Val Asn Leu Glu Leu Lys Pro Leu Tyr Thr Arg Ala Val Val Asp

325 330 335

Leu Leu Glu Lys Asp Cys Arg Arg Glu Leu Arg Arg Asp Phe Pro Thr

340 345 350

Cys Phe

<210> 14

<211> 360

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 14

Lys Ile Pro Ser Leu Tyr Glu Asn Leu Thr Ile Gly Ser Ser Thr Leu

1 5 10 15

Ile Ala Asp Val Asp Ala Met Glu Ala Val Leu Gly Asn Thr Ala Ser

20 25 30

Thr Ser Asp Asp Leu Leu Asp Thr Trp Asn Ser Thr Phe Ser Pro Ile

35 40 45

Ser Glu Val Asn Gln Thr Ser Phe Met Glu Asp Ile Arg Pro Ile Leu

50 55 60

Phe Pro Asp Asn Gln Thr Leu Gln Phe Cys Asn Gln Thr Pro Pro His

65 70 75 80

Leu Val Gly Pro Ile Arg Val Phe Leu Asp Glu Pro Asp Phe Lys Thr

85 90 95

Leu Glu Lys Ile Tyr Pro Asp Thr His Ala Gly Gly His Gly Met Pro

100 105 110

Lys Asp Cys Val Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr Arg

115 120 125

Asp Arg Glu Ala His Leu Arg Ile Met Leu His Asn Leu His Ser Leu

130 135 140

Leu Ala Lys Gln Gln Leu Asp Tyr Ala Ile Phe Ile Val Glu Gln Val

145 150 155 160

Ala Asn Gln Thr Phe Asn Arg Gly Lys Leu Met Asn Val Gly Tyr Asp

165 170 175

Val Ala Ser Arg Leu Tyr Pro Trp Gln Cys Phe Ile Phe His Asp Val

180 185 190

Asp Leu Leu Pro Glu Asp Asp Arg Asn Leu Tyr Thr Cys Pro Ile Gln

195 200 205

Pro Arg His Met Ser Val Ala Ile Asp Lys Phe Asn Tyr Lys Leu Pro

210 215 220

Tyr Ser Ala Ile Phe Gly Gly Ile Ser Ala Leu Thr Lys Asp His Leu

225 230 235 240

Lys Lys Ile Asn Gly Phe Ser Asn Asp Phe Trp Gly Trp Gly Gly Glu

245 250 255

Asp Asp Asp Leu Ala Thr Arg Thr Ser Met Ala Gly Leu Lys Val Ser

260 265 270

Arg Tyr Pro Thr Gln Ile Ala Arg Tyr Lys Met Ile Lys His Ser Thr

275 280 285

Glu Ala Thr Asn Pro Val Asn Lys Cys Arg Tyr Lys Ile Met Gly Gln

290 295 300

Thr Lys Arg Arg Trp Thr Arg Asp Gly Leu Ser Asn Leu Lys Tyr Lys

305 310 315 320

Leu Val Asn Leu Glu Leu Lys Pro Leu Tyr Thr Arg Ala Val Val Asp

325 330 335

Leu Leu Glu Lys Asp Cys Arg Arg Glu Leu Arg Arg Asp Phe Pro Thr

340 345 350

Cys Phe His His His His His His

355 360

<210> 15

<211> 383

<212> PRT

<213> 腐生水果线虫(Caenorhabditis remanei)

<400> 15

Met Ala Leu Arg His Leu Ala Val Ala Lys Leu Lys Thr Phe Phe Val

1 5 10 15

Leu Cys Ala Ala Leu Leu Leu Val His Thr Met Ile Tyr Lys Ala Pro

20 25 30

Ser Leu Tyr Glu Asn Phe Ser Ile Gly Ser Ser Thr Leu Ile Ala Asp

35 40 45

Val Asp Ala Met Glu Ala Val Leu Gly Asn Thr Ala Ser Thr Ser Tyr

50 55 60

Asp Leu Leu Asp Thr Trp Asn Ser Thr Phe Ser Pro Ile Ser Glu Val

65 70 75 80

Asn Gln Thr Ser Phe Leu Glu Asp Val Arg Pro Ile Leu Phe Thr Asp

85 90 95

Asn Gln Thr Lys Pro Phe Cys Asn Gln Thr Pro Pro His Leu Val Gly

100 105 110

Pro Ile Arg Val Phe Leu Asp Glu Pro Asp Phe Ala Thr Leu Glu Lys

115 120 125

Ile Tyr Pro Asp Val His Thr Gly Gly His Gly Ile Pro Asp Glu Cys

130 135 140

Ile Ala Arg His Arg Val Ala Val Ile Val Pro Tyr Arg Asp Arg Glu

145 150 155 160

Ala His Leu Arg Ile Met Leu His Asn Leu His Ser Leu Leu Ala Lys

165 170 175

Gln Gln Leu Asp Tyr Ala Ile Ile Val Val Glu Gln Ile Val Asn Gln

180 185 190

Thr Phe Asn Arg Gly Lys Leu Met Asn Val Gly Tyr Asp Val Ala Ser

195 200 205

Arg Leu Tyr Pro Trp Gln Cys Phe Ile Phe His Asp Val Asp Leu Leu

210 215 220

Pro Glu Asp Asp Arg Asn Leu Tyr Thr Cys Pro Ile Gln Pro Arg His

225 230 235 240

Met Ser Val Ala Ile Asp Lys Phe Asp Tyr Lys Leu Pro Tyr Ser Thr

245 250 255

Ile Phe Gly Gly Ile Ser Ala Leu Thr Gln Glu His Val Lys Lys Ile

260 265 270

Asn Gly Phe Ser Asn Asp Phe Trp Gly Trp Gly Gly Glu Asp Asp Asp

275 280 285

Leu Ala Thr Arg Thr Ser Met Ala Gly Leu Lys Val Ser Arg Tyr Pro

290 295 300

Ala Gln Ile Ala Arg Tyr Lys Met Ile Lys His Ser Thr Glu Ala Thr

305 310 315 320

Asn Pro Val Asn Lys Cys Arg Tyr Lys Ile Met Gly Gln Thr Lys Arg

325 330 335

Arg Trp Thr Arg Asp Gly Leu Ser Ser Leu Lys Tyr Lys Leu Val Lys

340 345 350

Leu Asp Leu Lys Pro Leu Tyr Thr Arg Ala Val Val Asp Leu Leu Glu

355 360 365

Lys Asp Cys Arg Arg Glu Leu Arg Lys Asp Phe Pro Thr Cys Phe

370 375 380

<210> 16

<211> 384

<212> PRT

<213> Caenorhabditis briggsae

<400> 16

Met Ala Phe Arg His Leu Ala Ser Ala Lys Leu Lys Thr Phe Phe Val

1 5 10 15

Leu Cys Ala Ala Leu Leu Leu Val His Ala Met Ile Tyr Lys Val Pro

20 25 30

Ser Leu Tyr Glu Asn Phe Ser Ile Gly Ser Ser Thr Leu Ile Ala Asp

35 40 45

Val Asp Ala Met Glu Ala Val Leu Gly Asn Thr Ala Ser Thr Ser Asp

50 55 60

Asp Pro Phe Asp Val Trp Asn Ser Thr Phe Ser Pro Ile Ser Glu Val

65 70 75 80

Asn Gln Thr Ala Phe Met Glu Asp Ile Arg Pro Ile Leu Phe Gly Asp

85 90 95

Ala Asn Glu Thr Arg Pro His Cys Asn Gln Thr Pro Pro His Leu Val

100 105 110

Gly Pro Ile Arg Val Phe Leu Asp Glu Pro Asp Phe Ala Thr Leu Glu

115 120 125

Lys Ile Tyr Pro Glu Thr His Pro Gly Gly His Gly Ile Pro Thr Glu

130 135 140

Cys Val Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr Arg Asp Arg

145 150 155 160

Glu Ala His Leu Arg Ile Met Leu His Asn Leu His Ser Leu Leu Ala

165 170 175

Lys Gln Gln Leu Asp Tyr Ala Ile Phe Val Val Glu Gln Val Ala Asn

180 185 190

Gln Thr Phe Asn Arg Gly Lys Leu Met Asn Val Gly Tyr Asp Val Ala

195 200 205

Ser Arg Leu Tyr Pro Trp Gln Cys Phe Ile Phe His Asp Val Asp Leu

210 215 220

Leu Pro Glu Asp Asp Arg Asn Leu Tyr Thr Cys Pro Ile Gln Pro Arg

225 230 235 240

His Met Ser Val Ala Ile Asp Lys Phe His Tyr Lys Leu Pro Tyr Ser

245 250 255

Ala Ile Phe Gly Gly Ile Ser Ala Leu Thr Gln Glu His Val Lys Ala

260 265 270

Ile Asn Gly Phe Ser Asn Asp Phe Trp Gly Trp Gly Gly Glu Asp Asp

275 280 285

Asp Leu Ala Thr Arg Thr Ser Gln Ala Gly Leu Lys Val Ser Arg Tyr

290 295 300

Pro Ala Gln Ile Ala Arg Tyr Lys Met Ile Lys His Ser Thr Glu Ala

305 310 315 320

Thr Asn Pro Val Asn Lys Cys Arg Tyr Lys Ile Met Gly Gln Thr Lys

325 330 335

Arg Arg Trp Lys Thr Asp Gly Leu Ser Ser Leu Lys Tyr Lys Leu Val

340 345 350

Lys Leu Glu Leu Lys Pro Leu Tyr Thr Arg Ala Val Val Asp Leu Leu

355 360 365

Glu Lys Glu Cys Arg Arg Glu Leu Arg Arg Asp Phe Pro Thr Cys Phe

370 375 380

<210> 17

<211> 464

<212> PRT

<213> 吴策线虫(Wuchereria bancrofti)

<400> 17

Met Pro Ala Ala Gly Arg Phe Val Ile Ile Leu Leu Ile Phe Gly Ala

1 5 10 15

Ala Ala His Ile Phe Leu Gly Gly Gly Leu Ser Phe Ile Ser Asp Tyr

20 25 30

His Ile Trp Arg Pro Val Val Glu Ser Ser Arg Gln Glu Ile Val Leu

35 40 45

Val His Asn Ile Asp Asn Asn Ser Asp Gln Asn Ala Glu Lys Ile Ile

50 55 60

Ser Asn Asn Glu Thr Lys Phe His Leu Thr Ser Ala Thr Pro Ile Asp

65 70 75 80

Asn Leu Val Ser Ile His Ser Asn Phe Tyr Glu Leu Phe Ile Asn Gly

85 90 95

Leu Arg Phe Gly Lys Leu Thr Thr Val Tyr Pro Ile Ile Asn Gln Ser

100 105 110

Ile Asn Asn Gly Ser Thr Thr Asp Lys Ser Thr Glu Thr Tyr Ala Glu

115 120 125

Ser Val Tyr Phe Leu Lys Thr Asp Gly Asn Ile His Ser Asn Thr Leu

130 135 140

Leu Ser Thr Ile Thr Asp Ala Gln Ser Thr Arg Gln Leu Phe Gly Asn

145 150 155 160

Glu Thr Leu Ser Ala Cys Asn Val Ile Pro Ser Phe Gln Met Met His

165 170 175

Gln Asn Leu Ser Leu Val Asn Cys Pro Val Thr Pro Pro Gly Leu Val

180 185 190

Gly Pro Ile Lys Val Trp Tyr Asp Glu Pro Thr Phe Glu Glu Ile Glu

195 200 205

Arg Leu Asn Pro Asn Leu Glu Ala Gly Gly His Gly Lys Pro Glu Asn

210 215 220

Cys Leu Ser Arg His Arg Val Ala Val Ile Val Pro Tyr Arg Asp Arg

225 230 235 240

Glu Ala His Leu Arg Ile Leu Leu His Asn Leu His Ser Leu Leu Thr

245 250 255

Lys Gln Gln Leu Asp Tyr Gly Ile Phe Val Ile Glu Gln His Glu Asn

260 265 270

Glu Thr Phe Asn Arg Ala Lys Leu Met Asn Val Gly Tyr Val Glu Ala

275 280 285

Leu Lys Leu Tyr Asp Trp Gln Cys Phe Val Phe His Asp Val Asp Leu

290 295 300

Leu Ala Glu Asp Asp Arg Asn Ile Tyr Ser Cys Pro Asp Gln Pro Arg

305 310 315 320

His Met Ser Val Ala Val Asn Lys Phe Lys Tyr Lys Leu Pro Tyr Gly

325 330 335

Ser Ile Phe Gly Gly Val Ser Ala Ile Arg Thr Glu Gln Phe Ala Thr

340 345 350

Leu Asn Gly Phe Ser Asn Ser Tyr Trp Gly Trp Gly Gly Glu Asp Asp

355 360 365

Asp Leu Ser Met Arg Val Thr Ser Ala Gly Tyr Lys Ile Met Arg Tyr

370 375 380

Pro Ser Glu Ile Ala Arg Tyr Gln Met Val Gln His Lys Ser Glu Met

385 390 395 400

Lys Asn Pro Ile Asn Arg Cys Arg Tyr Asp Leu Leu Ala Lys Thr Lys

405 410 415

Val Arg Gln Gln Thr Asp Gly Ile Ser Ser Leu Lys Tyr Glu Cys Tyr

420 425 430

Asp Leu Gln Phe Phe Thr Leu Phe Thr His Ile Lys Val Lys Leu Phe

435 440 445

Glu Gln Glu Ser Lys Ala Gln Leu Arg Glu Glu Gly Phe Lys Arg Cys

450 455 460

<210> 18

<211> 291

<212> PRT

<213> 罗阿丝虫(Loa loa)

<400> 18

Met Glu Arg Gln Asn Leu Ser Leu Val Asp Cys Pro Ile Ile Pro Pro

1 5 10 15

Gly Leu Val Gly Pro Ile Lys Val Trp Tyr Asp Glu Pro Thr Phe Glu

20 25 30

Glu Ile Glu Arg Leu Asn Pro Tyr Leu Glu Leu Gly Gly His Gly Lys

35 40 45

Pro Gly Ser Cys Leu Ser Arg His Arg Val Ala Ile Ile Val Pro Tyr

50 55 60

Arg Asp Arg Glu Ala His Leu Arg Ile Leu Leu His Asn Leu His Ser

65 70 75 80

Leu Leu Thr Lys Gln Gln Leu Asp Tyr Ala Ile Phe Val Ile Glu Gln

85 90 95

His Glu Asn Glu Thr Phe Asn Arg Ala Lys Leu Met Asn Val Gly Tyr

100 105 110

Thr Glu Ala Met Lys Leu Tyr Asp Trp Gln Cys Phe Ile Phe His Asp

115 120 125

Val Asp Leu Leu Ala Glu Asp Asp Arg Asn Ile Tyr Ser Cys Pro Asp

130 135 140

Gln Pro Arg His Met Ser Val Ala Ile Asn Lys Phe Lys Tyr Arg Leu

145 150 155 160

Pro Tyr Gly Ser Ile Phe Gly Gly Val Ser Ala Ile Arg Thr Glu Gln

165 170 175

Phe Leu Lys Met Asn Gly Phe Ser Asn Ser Tyr Trp Gly Trp Gly Gly

180 185 190

Glu Asp Asp Asp Leu Ser Ile Arg Val Thr Ser Leu Gly Tyr Lys Ile

195 200 205

Met Arg Tyr Pro Leu Glu Ile Ala Arg Tyr Gln Met Val Lys His Glu

210 215 220

Ser Glu Thr Lys Asn Pro Ile Asn Arg Cys Arg Tyr Asp Leu Leu Ala

225 230 235 240

Lys Thr Lys Val Arg Gln Gln Met Asp Gly Ile Ser Ser Leu Lys Tyr

245 250 255

Glu Cys Tyr Asp Leu His Phe Leu Pro Leu Phe Thr His Ile Lys Val

260 265 270

Lys Leu Phe Glu Gln Glu Ser Lys Ala Gln Leu Arg Glu Glu Gly Phe

275 280 285

Lys Lys Cys

290

<210> 19

<211> 296

<212> PRT

<213> 毕氏粗角猛蚁(Cerapachys biroi)

<400> 19

Met Pro Ile Arg Asn Leu Ala Gly Asn Gly Gly Thr Ala Arg Glu Leu

1 5 10 15

Pro Val Ala Asn Thr Thr Ser Asn Ala Thr Ile Pro Arg Cys Pro Leu

20 25 30

Ile Pro Pro Asn Leu Val Gly Pro Val Ala Val Ser Lys Ser Pro Pro

35 40 45

Pro Leu Ser Glu Met Glu Arg Ser Phe Val Glu Val Lys Ala Gly Gly

50 55 60

Lys Gly Arg Pro Ala Asp Cys Val Ala Arg His Arg Val Ala Ile Ile

65 70 75 80

Ile Pro Phe Arg Asp Arg Pro Gln His Leu Gln Thr Leu Leu Tyr Asn

85 90 95

Leu His Pro Ile Leu Leu Arg Gln Gln Ile Asp Tyr Gln Ile Phe Val

100 105 110

Ile Glu Gln Glu Gly Thr Gly Thr Phe Asn Arg Ala Met Leu Met Asn

115 120 125

Val Gly Tyr Val Glu Ala Leu Lys Glu Arg Ile Phe Asp Cys Phe Ile

130 135 140

Phe His Asp Val Asp Leu Leu Pro Glu Asp Asp Arg Asn Leu Tyr Thr

145 150 155 160

Cys Pro Glu Gln Pro Arg His Met Ser Val Ala Val Asp Lys Phe Lys

165 170 175

Tyr Arg Leu Pro Tyr Ala Asp Leu Phe Gly Gly Val Ser Ala Met Ser

180 185 190

Arg Glu His Phe Gln Leu Val Asn Gly Phe Ser Asn Val Phe Trp Gly

195 200 205

Trp Gly Gly Glu Asp Asp Asp Met Ala Asn Arg Ile Lys Ala His Gly

210 215 220

Leu His Ile Ser Arg Tyr Pro Ala Asn Val Ala Arg Tyr Lys Met Leu

225 230 235 240

Thr His Lys Lys Glu Lys Ala Asn Pro Lys Arg Tyr Glu Phe Leu Lys

245 250 255

Thr Gly Lys Lys Arg Phe Ser Thr Asp Gly Leu Ala Asn Leu Gln Tyr

260 265 270

Glu Leu Cys Asp Lys Arg Lys Pro Lys Leu Tyr Thr Trp Leu Leu Val

275 280 285

Arg Leu Thr Pro Pro Gln Pro Ser

290 295

<210> 20

<211> 422

<212> PRT

<213> 湿木白蚁(Zootermopsis nevadensis)

<400> 20

Met Arg Cys Arg Cys Leu Ser Ala Trp Ser Arg Ile Thr Gln His Val

1 5 10 15

Pro Arg Gln Pro Cys Leu His Ile His Ser His Leu Cys Lys Val Val

20 25 30

Ile Val Leu Ala Val Leu Ile Ala Leu Gln Phe Leu Leu Thr Thr Ile

35 40 45

Phe Glu Ala Arg Gln Ile Glu Pro Leu Phe Thr Val Asn Phe Thr Tyr

50 55 60

Ser Gly Arg Arg Ser Arg Trp Gly Leu Ile Ser His Ser Arg Gly Leu

65 70 75 80

Leu Ser Pro Ser His Asn Ser Ser Phe Asn Gly Ser Met Arg Val Ser

85 90 95

Val Glu Arg Thr Leu Ser Pro Val Glu Asn Ile Ser Gly Glu Thr Lys

100 105 110

Asn Leu Ser Phe Leu His Thr His Glu Asn Ala Val Arg Asn Ala Ser

115 120 125

Ser Leu Val Leu Asn Ile Ser Leu Pro Ser Asp Leu Asn Pro Thr Thr

130 135 140

Ser Pro Ser Leu Thr Val Pro Phe Thr Gly Lys Ser Leu Cys Pro Pro

145 150 155 160

Ile Pro Pro Asn Leu Asn Gly Pro Ile Lys Val Leu Lys Asp Ser Pro

165 170 175

Ser Leu Glu Glu Leu Glu Lys Met Phe Pro Leu Leu Glu Pro Gly Gly

180 185 190

His Tyr His Pro Glu Glu Cys Gln Ala Arg Asp Arg Val Ala Ile Ile

195 200 205

Val Pro Tyr Arg Asp Arg Ala Glu His Leu Ser Thr Phe Leu Leu Asn

210 215 220

Leu His Pro Leu Leu Gln Arg Gln Gln Leu Asp Tyr Gly Met Phe Val

225 230 235 240

Ile Glu Gln Gly Gly Asp Gly Pro Phe Asn Arg Ala Met Leu Met Asn

245 250 255

Val Gly Phe Val Glu Ala Leu Lys Leu Tyr Ser Tyr Asp Cys Phe Ile

260 265 270

Phe His Asp Val Asp Leu Leu Pro Glu Asp Asp Arg Asn Leu Tyr Thr

275 280 285

Cys Pro Glu Gln Pro Arg His Met Ser Val Ala Val Asp Val Leu Lys

290 295 300

Tyr Lys Leu Pro Tyr Gln Ala Ile Phe Gly Gly Val Ser Ala Met Thr

305 310 315 320

Lys Thr Gln Phe Gln Lys Val Asn Gly Phe Ser Asn Leu Phe Trp Gly

325 330 335

Trp Gly Gly Glu Asp Asp Asp Met Ser Asn Arg Val Arg His His Gly

340 345 350

Tyr His Ile Ser Arg Tyr Pro Ala Asn Ile Ala Arg Tyr Lys Met Leu

355 360 365

Ala His Arg Lys Gln His Ala Asn Pro Lys Arg Tyr Glu Phe Leu Asn

370 375 380

Thr Gly Arg Lys Arg Phe Lys Thr Asp Gly Leu Ser Asn Leu Gln Tyr

385 390 395 400

Asp Arg Lys Glu Leu Asn Leu Gly Lys Leu Tyr Thr Arg Val Leu Val

405 410 415

Glu Leu Ala Thr Pro Ser

420

<210> 21

<211> 295

<212> PRT

<213> 佛罗里达弓背蚁(Camponotus floridanus)

<400> 21

Met Pro Thr Arg Asn Leu Val Gly Gly Gly Thr Ala Arg Glu Leu Pro

1 5 10 15

Val Ala Asn Ala Thr Asn Asn Thr Thr Met Pro Arg Cys Pro Leu Ile

20 25 30

Pro Pro Asn Leu Val Gly Pro Met Val Val Ser Lys Ser Pro Pro Pro

35 40 45

Leu Ser Glu Met Glu Arg Ser Phe Val Glu Val Asn Ala Gly Gly Arg

50 55 60

Gly Arg Pro Ala Asp Cys Val Ala Arg His Arg Val Ala Ile Ile Ile

65 70 75 80

Pro Phe Arg Asp Arg Pro Gln His Leu Gln Thr Leu Leu Tyr Asn Leu

85 90 95

His Pro Ile Leu Leu Arg Gln Gln Ile Glu Tyr Gln Ile Phe Val Ile

100 105 110

Glu Gln Glu Gly Thr Gly Ala Phe Asn Arg Ala Met Leu Met Asn Val

115 120 125

Gly Tyr Val Glu Ala Leu Lys Glu Arg Thr Phe Asp Cys Phe Ile Phe

130 135 140

His Asp Val Asp Leu Leu Pro Glu Asp Asp Arg Asn Leu Tyr Thr Cys

145 150 155 160

Pro Glu Gln Pro Arg His Met Ser Val Ala Val Asp Lys Phe Lys Tyr

165 170 175

Arg Leu Pro Tyr Thr Asp Leu Phe Gly Gly Val Ser Ala Met Ser Arg

180 185 190

Glu His Phe Gln Leu Val Asn Gly Phe Ser Asn Val Phe Trp Gly Trp

195 200 205

Gly Gly Glu Asp Asp Asp Met Ala Asn Arg Ile Lys Ala His Gly Leu

210 215 220

His Ile Ser Arg Tyr Pro Ala Asn Val Ala Arg Tyr Lys Met Leu Thr

225 230 235 240

His Lys Lys Glu Lys Ala Asn Pro Lys Arg Tyr Glu Phe Leu Lys Thr

245 250 255

Gly Lys Lys Arg Phe Ser Thr Asp Gly Leu Ala Asn Leu Gln Tyr Glu

260 265 270

Leu Ser Asp Lys Arg Lys Pro Lys Leu Tyr Thr Trp Leu Leu Val Arg

275 280 285

Leu Thr Pro Pro Gln Pro Ser

290 295

<210> 22

<211> 310

<212> PRT

<213> 长牡蛎(Crassostrea gigas)

<400> 22

Met Asp Arg Gly Cys Lys Pro Met Arg Val Cys Ser Ser Ser Pro Ser

1 5 10 15

Asp Leu Val Gly Ser Leu Ala Thr Tyr Lys Glu Ala Pro Ser Tyr Lys

20 25 30

Glu Met Ile Lys Ile Tyr Pro Leu Val Arg Pro Gly Gly Leu Tyr Thr

35 40 45

Pro Pro Asp Cys Ile Ala Arg Glu Arg Val Ala Ile Ile Ile Pro Phe

50 55 60

Arg Asp Arg Glu Glu His Leu Arg Ile Leu Leu His Asn Leu His Pro

65 70 75 80

Met Leu Gln Arg Gln Gln Leu Asp Tyr Gly Ile Tyr Val Val Glu Gln

85 90 95

Glu Asn Gly Thr Gln Phe Asn Arg Ala Met Leu Met Asn Ile Gly Tyr

100 105 110

Ala Glu Ser Ile Lys Leu Tyr Asn Tyr Thr Cys Phe Ile Phe His Asp

115 120 125

Val Asp Leu Ile Pro Glu Asn Asp Arg Ile Met Tyr Asp Cys Arg Asp

130 135 140

Ser Pro Arg His Leu Ser Ser Ala Val Asp Lys Phe Lys Tyr Lys Leu

145 150 155 160

Pro Tyr Pro Gln Leu Phe Gly Gly Val Thr Ala Ile Lys Arg Ala His

165 170 175

Phe Glu Lys Val Asn Gly His Ser Asn Lys Phe Phe Gly Trp Gly Gly

180 185 190

Glu Asp Asp Asp Met Phe Arg Arg Leu Val Asn Asn Gly Phe Lys Ile

195 200 205

Ser Arg Tyr Gln Ala Ser Leu Ser Lys Tyr Lys Met Ile Lys His Leu

210 215 220

His Asp Ala Gly Asn Lys Ala Asn Lys Arg Arg His His Leu Ile Lys

225 230 235 240

Thr Gly Lys Gly Arg Tyr Arg Arg Asp Gly Ile Asn Asn Leu His Tyr

245 250 255

Lys Lys Leu Gly Ile Glu Tyr Gln Tyr Leu His Thr Arg Ile Leu Val

260 265 270

Ser Ile Asn Glu Thr Lys Val Met Thr Val Ser Leu Leu Tyr Met Tyr

275 280 285

Ser Ser Thr Thr Val Tyr Ile Ile Val Asn Ile Tyr Thr Ile Tyr Cys

290 295 300

Lys Ser Arg Asn Ile Arg

305 310

<210> 23

<211> 338

<212> PRT

<213> 大红斑蝶(Danaus plexippus)

<400> 23

Met Ala Lys Lys Leu Leu Thr Gln Gly Thr Glu Ser Val Thr Asn Tyr

1 5 10 15

Thr His Thr Thr Asn Ser Ser Asn Lys Asn Pro Ala Lys Glu Thr Phe

20 25 30

Asn Met Thr Lys Pro Asn Leu Ser Asp Asp Thr Ser Thr Pro Leu Leu

35 40 45

Ile Thr Lys Ile Met Glu Ser Ile Lys Asn Leu Val Thr Thr Glu Glu

50 55 60

Asp Phe Arg Asp Glu Pro Ser Leu Pro Leu Cys Asp Glu Met Pro Pro

65 70 75 80

Asp Leu Gly Pro Ile Ser Val Asn Lys Thr Glu Ile Glu Leu Asp Trp

85 90 95

Val Glu Lys Arg Tyr Pro Glu Val Arg Ser Gly Gly Ile Tyr Ser Ser

100 105 110

Ser Asn Cys Thr Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr Arg

115 120 125

Asp Arg Gln Gln His Leu Ala Ile Phe Leu Asn His Met His Pro Phe

130 135 140

Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile Tyr Ile Ile Glu Gln Glu

145 150 155 160

Gly Thr Ser Glu Phe Asn Arg Ala Lys Leu Met Asn Val Gly Phe Val

165 170 175

Glu Ser Gln Arg Gln Arg Ser Trp Gln Cys Phe Ile Phe His Asp Ile

180 185 190

Asp Leu Leu Pro Leu Asp Ser Arg Asn Met Tyr Ser Cys Pro Lys Gln

195 200 205

Pro Arg His Met Ser Ala Ser Ile Asp Lys Leu Asn Phe Arg Leu Pro

210 215 220

Tyr Glu Asp Ile Phe Gly Gly Val Ser Ala Met Thr Leu Glu Gln Phe

225 230 235 240

Thr Lys Val Asn Gly Phe Ser Asn Lys Tyr Trp Gly Trp Gly Gly Glu

245 250 255

Asp Asp Asp Met Phe Tyr Arg Leu Lys Lys Met Asn Tyr His Ile Ala

260 265 270

Arg Tyr Lys Met Ser Ile Ala Arg Tyr Ala Met Leu Asp His Lys Lys

275 280 285

Ser Ala Pro Asn Pro Lys Arg Tyr Gln Leu Leu Ser Gln Thr Ser Lys

290 295 300

Thr Phe Gln Lys Asp Gly Leu Ser Thr Leu Glu Tyr Glu Val Ile Lys

305 310 315 320

Val Thr Ala Asn His Leu Tyr Thr His Ile Leu Val Asn Ile Asp Glu

325 330 335

Arg Ser

<210> 24

<211> 941

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 24

Arg Tyr Gly Ser Trp Arg Glu Leu Ala Lys Ala Leu Ala Ser Arg Asn

1 5 10 15

Ile Pro Ala Val Asp Pro His Leu Gln Phe Tyr His Pro Gln Arg Leu

20 25 30

Ser Leu Glu Asp His Asp Ile Asp Gln Gly Val Ser Ser Asn Ser Ser

35 40 45

Tyr Leu Lys Trp Asn Lys Pro Val Pro Trp Leu Ser Glu Phe Arg Gly

50 55 60

Arg Ala Asn Leu His Val Phe Glu Asp Trp Cys Gly Ser Ser Ile Gln

65 70 75 80

Gln Leu Arg Arg Asn Leu His Phe Pro Leu Tyr Pro His Ile Arg Thr

85 90 95

Thr Leu Arg Lys Leu Ala Val Ser Pro Lys Trp Thr Asn Tyr Gly Leu

100 105 110

Arg Ile Phe Gly Tyr Leu His Pro Phe Thr Asp Gly Lys Ile Gln Phe

115 120 125

Ala Ile Ala Ala Asp Asp Asn Ala Glu Phe Trp Leu Ser Leu Asp Asp

130 135 140

Gln Val Ser Gly Leu Gln Leu Leu Ala Ser Val Gly Lys Thr Gly Lys

145 150 155 160

Glu Trp Thr Ala Pro Gly Glu Phe Gly Lys Phe Arg Ser Gln Ile Ser

165 170 175

Lys Pro Val Ser Leu Ser Ala Ser His Arg Tyr Tyr Phe Glu Val Leu

180 185 190

His Lys Gln Asn Glu Glu Gly Thr Asp His Val Glu Val Ala Trp Arg

195 200 205

Arg Asn Asp Pro Gly Ala Lys Phe Thr Ile Ile Asp Ser Leu Ser Leu

210 215 220

Ser Leu Phe Thr Asn Glu Thr Phe Leu Gln Met Asp Glu Val Gly His

225 230 235 240

Ile Pro Gln Thr Ala Ala Ser His Val Asp Ser Ser Asn Ala Leu Pro

245 250 255

Arg Asp Glu Gln Pro Pro Ala Asp Met Leu Arg Pro Asp Pro Arg Asp

260 265 270

Thr Leu Tyr Arg Val Pro Leu Ile Pro Lys Ser His Leu Arg His Val

275 280 285

Leu Pro Asp Cys Pro Tyr Lys Pro Ser Tyr Leu Val Asp Gly Leu Pro

290 295 300

Leu Gln Arg Tyr Gln Gly Leu Arg Phe Val His Leu Ser Phe Val Tyr

305 310 315 320

Pro Asn Asp Tyr Thr Arg Leu Ser His Met Glu Thr His Asn Lys Cys

325 330 335

Phe Tyr Gln Glu Asn Ala Tyr Tyr Gln Asp Arg Phe Ser Phe Gln Glu

340 345 350

Tyr Ile Lys Ile Asp Gln Pro Glu Lys Gln Gly Leu Glu Gln Pro Gly

355 360 365

Phe Glu Glu Asn Leu Leu Glu Glu Ser Gln Tyr Gly Glu Val Ala Glu

370 375 380

Glu Thr Pro Ala Ser Asn Asn Gln Asn Ala Arg Met Leu Glu Gly Arg

385 390 395 400

Gln Thr Pro Ala Ser Thr Leu Glu Gln Asp Ala Thr Asp Tyr Arg Leu

405 410 415

Arg Ser Leu Arg Lys Leu Leu Ala Gln Pro Arg Glu Gly Leu Leu Ala

420 425 430

Pro Phe Ser Lys Arg Asn Ser Thr Ala Ser Phe Pro Gly Arg Thr Ser

435 440 445

His Ile Pro Val Gln Gln Pro Glu Lys Arg Lys Gln Lys Pro Ser Pro

450 455 460

Glu Pro Ser Gln Asp Ser Pro His Ser Asp Lys Trp Pro Pro Gly His

465 470 475 480

Pro Val Lys Asn Leu Pro Gln Met Arg Gly Pro Arg Pro Arg Pro Ala

485 490 495

Gly Asp Ser Pro Arg Lys Thr Gln Trp Leu Asn Gln Val Glu Ser Tyr

500 505 510

Ile Ala Glu Gln Arg Arg Gly Asp Arg Met Arg Pro Gln Ala Pro Gly

515 520 525

Arg Gly Trp His Gly Glu Glu Glu Val Val Ala Ala Ala Gly Gln Glu

530 535 540

Gly Gln Val Glu Gly Glu Glu Glu Gly Glu Glu Glu Glu Glu Glu Glu

545 550 555 560

Asp Met Ser Glu Val Phe Glu Tyr Val Pro Val Phe Asp Pro Val Val

565 570 575

Asn Trp Asp Gln Thr Phe Ser Ala Arg Asn Leu Asp Phe Gln Ala Leu

580 585 590

Arg Thr Asp Trp Ile Asp Leu Ser Cys Asn Thr Ser Gly Asn Leu Leu

595 600 605

Leu Pro Glu Gln Glu Ala Leu Glu Val Thr Arg Val Phe Leu Lys Lys

610 615 620

Leu Asn Gln Arg Ser Arg Gly Arg Tyr Gln Leu Gln Arg Ile Val Asn

625 630 635 640

Val Glu Lys Arg Gln Asp Gln Leu Arg Gly Gly Arg Tyr Leu Leu Glu

645 650 655

Leu Glu Leu Leu Glu Gln Gly Gln Arg Val Val Arg Leu Ser Glu Tyr

660 665 670

Val Ser Ala Arg Gly Trp Gln Gly Ile Asp Pro Ala Gly Gly Glu Glu

675 680 685

Val Glu Ala Arg Asn Leu Gln Gly Leu Val Trp Asp Pro His Asn Arg

690 695 700

Arg Arg Gln Val Leu Asn Thr Arg Ala Gln Glu Pro Lys Leu Cys Trp

705 710 715 720

Pro Gln Gly Phe Ser Trp Ser His Arg Ala Val Val His Phe Val Val

725 730 735

Pro Val Lys Asn Gln Ala Arg Trp Val Gln Gln Phe Ile Lys Asp Met

740 745 750

Glu Asn Leu Phe Gln Val Thr Gly Asp Pro His Phe Asn Ile Val Ile

755 760 765

Thr Asp Tyr Ser Ser Glu Asp Met Asp Val Glu Met Ala Leu Lys Arg

770 775 780

Ser Lys Leu Arg Ser Tyr Gln Tyr Val Lys Leu Ser Gly Asn Phe Glu

785 790 795 800

Arg Ser Ala Gly Leu Gln Ala Gly Ile Asp Leu Val Lys Asp Pro His

805 810 815

Ser Ile Ile Phe Leu Cys Asp Leu His Ile His Phe Pro Ala Gly Val

820 825 830

Ile Asp Ala Ile Arg Lys His Cys Val Glu Gly Lys Met Ala Phe Ala

835 840 845

Pro Met Val Met Arg Leu His Cys Gly Ala Thr Pro Gln Trp Pro Glu

850 855 860

Gly Tyr Trp Glu Val Asn Gly Phe Gly Leu Leu Gly Ile Tyr Lys Ser

865 870 875 880

Asp Leu Asp Arg Ile Gly Gly Met Asn Thr Lys Glu Phe Arg Asp Arg

885 890 895

Trp Gly Gly Glu Asp Trp Glu Leu Leu Asp Arg Ile Leu Gln Gly Leu

900 905 910

Asp Val Glu Arg Leu Ser Leu Arg Asn Phe Phe His His Phe His Ser

915 920 925

Lys Arg Gly Met Trp Ser Arg Arg Gln Met Lys Thr Leu

930 935 940

<210> 25

<211> 389

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 25

Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu Tyr Asn Ala Thr Gln

1 5 10 15

Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala Asn Trp Pro Lys Lys

20 25 30

Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu Tyr Ser Ile Lys Asn

35 40 45

Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser Val Val His Pro Pro

50 55 60

Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp Lys Asn Met Thr Ile

65 70 75 80

Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr Pro Leu Leu Ile Thr

85 90 95

Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr Thr Glu Asp Gly Val

100 105 110

Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu Cys Asp Ser Met Pro

115 120 125

Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr Glu Leu Glu Leu Glu

130 135 140

Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp Gly Gly Arg Tyr Ser

145 150 155 160

Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr

165 170 175

Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu Asn His Met His Pro

180 185 190

Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile Phe Ile Val Glu Gln

195 200 205

Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu Met Asn Val Gly Phe

210 215 220

Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp Gln Cys Phe Val Phe

225 230 235 240

His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg Asn Leu Tyr Ser Cys

245 250 255

Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile Asp Lys Leu His Phe

260 265 270

Lys Leu Pro Tyr Glu Asp Ile Phe Gly Gly Val Ser Ala Met Thr Leu

275 280 285

Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn Lys Tyr Trp Gly Phe

290 295 300

Gly Gly Glu Asp Asp Asp Met Ser Tyr Arg Leu Lys Lys Ile Asn Tyr

305 310 315 320

His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg Tyr Ala Met Leu Asp

325 330 335

His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr Gln Leu Leu Ser Gln

340 345 350

Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser Thr Leu Glu Tyr Glu

355 360 365

Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr His Ile Leu Val Asn

370 375 380

Ile Asp Glu Arg Ser

385

<210> 26

<211> 389

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 26

Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu Tyr Asn Ala Thr Gln

1 5 10 15

Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala Asn Trp Pro Lys Lys

20 25 30

Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu Tyr Ser Ile Lys Asn

35 40 45

Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser Val Val His Pro Pro

50 55 60

Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp Lys Asn Met Thr Ile

65 70 75 80

Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr Pro Leu Leu Ile Thr

85 90 95

Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr Thr Glu Asp Gly Val

100 105 110

Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu Cys Asp Ser Met Pro

115 120 125

Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr Glu Leu Glu Leu Glu

130 135 140

Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp Gly Gly Arg Tyr Ser

145 150 155 160

Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr

165 170 175

Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu Asn His Met His Pro

180 185 190

Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile Phe Ile Val Glu Gln

195 200 205

Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu Met Asn Val Gly Phe

210 215 220

Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp Gln Cys Phe Val Phe

225 230 235 240

His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg Asn Leu Tyr Ser Cys

245 250 255

Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile Asp Lys Leu His Phe

260 265 270

Lys Leu Pro Tyr Glu Asp Ile Phe Gly Gly Val Ser Ala Met Thr Leu

275 280 285

Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn Lys Tyr Trp Gly His

290 295 300

Gly Gly Glu Asp Asp Asp Met Ser Tyr Arg Leu Lys Lys Ile Asn Tyr

305 310 315 320

His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg Tyr Ala Met Leu Asp

325 330 335

His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr Gln Leu Leu Ser Gln

340 345 350

Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser Thr Leu Glu Tyr Glu

355 360 365

Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr His Ile Leu Val Asn

370 375 380

Ile Asp Glu Arg Ser

385

<210> 27

<211> 389

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 27

Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu Tyr Asn Ala Thr Gln

1 5 10 15

Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala Asn Trp Pro Lys Lys

20 25 30

Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu Tyr Ser Ile Lys Asn

35 40 45

Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser Val Val His Pro Pro

50 55 60

Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp Lys Asn Met Thr Ile

65 70 75 80

Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr Pro Leu Leu Ile Thr

85 90 95

Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr Thr Glu Asp Gly Val

100 105 110

Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu Cys Asp Ser Met Pro

115 120 125

Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr Glu Leu Glu Leu Glu

130 135 140

Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp Gly Gly Arg Tyr Ser

145 150 155 160

Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr

165 170 175

Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu Asn His Met His Pro

180 185 190

Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile Phe Ile Val Glu Gln

195 200 205

Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu Met Asn Val Gly Phe

210 215 220

Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp Gln Cys Phe Val Phe

225 230 235 240

His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg Asn Leu Tyr Ser Cys

245 250 255

Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile Asp Lys Leu His Phe

260 265 270

Lys Leu Pro Tyr Glu Asp Ile Phe Gly Gly Val Ser Ala Met Thr Leu

275 280 285

Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn Lys Tyr Trp Gly Val

290 295 300

Gly Gly Glu Asp Asp Asp Met Ser Tyr Arg Leu Lys Lys Ile Asn Tyr

305 310 315 320

His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg Tyr Ala Met Leu Asp

325 330 335

His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr Gln Leu Leu Ser Gln

340 345 350

Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser Thr Leu Glu Tyr Glu

355 360 365

Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr His Ile Leu Val Asn

370 375 380

Ile Asp Glu Arg Ser

385

<210> 28

<211> 389

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 28

Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu Tyr Asn Ala Thr Gln

1 5 10 15

Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala Asn Trp Pro Lys Lys

20 25 30

Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu Tyr Ser Ile Lys Asn

35 40 45

Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser Val Val His Pro Pro

50 55 60

Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp Lys Asn Met Thr Ile

65 70 75 80

Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr Pro Leu Leu Ile Thr

85 90 95

Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr Thr Glu Asp Gly Val

100 105 110

Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu Cys Asp Ser Met Pro

115 120 125

Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr Glu Leu Glu Leu Glu

130 135 140

Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp Gly Gly Arg Tyr Ser

145 150 155 160

Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr

165 170 175

Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu Asn His Met His Pro

180 185 190

Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile Phe Ile Val Glu Gln

195 200 205

Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu Met Asn Val Gly Phe

210 215 220

Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp Gln Cys Phe Val Phe

225 230 235 240

His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg Asn Leu Tyr Ser Cys

245 250 255

Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile Asp Lys Leu His Phe

260 265 270

Lys Leu Pro Tyr Glu Asp Ile Phe Gly Gly Val Ser Ala Met Thr Leu

275 280 285

Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn Lys Tyr Trp Gly Trp

290 295 300

Gly Gly Ala Asp Asp Asp Met Ser Tyr Arg Leu Lys Lys Ile Asn Tyr

305 310 315 320

His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg Tyr Ala Met Leu Asp

325 330 335

His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr Gln Leu Leu Ser Gln

340 345 350

Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser Thr Leu Glu Tyr Glu

355 360 365

Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr His Ile Leu Val Asn

370 375 380

Ile Asp Glu Arg Ser

385

<210> 29

<211> 389

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 29

Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu Tyr Asn Ala Thr Gln

1 5 10 15

Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala Asn Trp Pro Lys Lys

20 25 30

Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu Tyr Ser Ile Lys Asn

35 40 45

Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser Val Val His Pro Pro

50 55 60

Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp Lys Asn Met Thr Ile

65 70 75 80

Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr Pro Leu Leu Ile Thr

85 90 95

Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr Thr Glu Asp Gly Val

100 105 110

Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu Cys Asp Ser Met Pro

115 120 125

Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr Glu Leu Glu Leu Glu

130 135 140

Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp Gly Gly Arg Tyr Ser

145 150 155 160

Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr

165 170 175

Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu Asn His Met His Pro

180 185 190

Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile Phe Ile Val Glu Gln

195 200 205

Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu Met Asn Val Gly Phe

210 215 220

Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp Gln Cys Phe Val Phe

225 230 235 240

His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg Asn Leu Tyr Ser Cys

245 250 255

Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile Asp Lys Leu His Phe

260 265 270

Lys Leu Pro Tyr Glu Asp Ile Phe Gly Gly Val Ser Ala Met Thr Leu

275 280 285

Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn Lys Tyr Trp Gly Trp

290 295 300

Gly Gly Gly Asp Asp Asp Met Ser Tyr Arg Leu Lys Lys Ile Asn Tyr

305 310 315 320

His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg Tyr Ala Met Leu Asp

325 330 335

His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr Gln Leu Leu Ser Gln

340 345 350

Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser Thr Leu Glu Tyr Glu

355 360 365

Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr His Ile Leu Val Asn

370 375 380

Ile Asp Glu Arg Ser

385

<210> 30

<211> 389

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 30

Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu Tyr Asn Ala Thr Gln

1 5 10 15

Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala Asn Trp Pro Lys Lys

20 25 30

Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu Tyr Ser Ile Lys Asn

35 40 45

Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser Val Val His Pro Pro

50 55 60

Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp Lys Asn Met Thr Ile

65 70 75 80

Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr Pro Leu Leu Ile Thr

85 90 95

Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr Thr Glu Asp Gly Val

100 105 110

Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu Cys Asp Ser Met Pro

115 120 125

Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr Glu Leu Glu Leu Glu

130 135 140

Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp Gly Gly Arg Tyr Ser

145 150 155 160

Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr

165 170 175

Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu Asn His Met His Pro

180 185 190

Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile Phe Ile Val Glu Gln

195 200 205

Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu Met Asn Val Gly Phe

210 215 220

Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp Gln Cys Phe Val Phe

225 230 235 240

His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg Asn Leu Tyr Ser Cys

245 250 255

Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile Asp Lys Leu His Phe

260 265 270

Lys Leu Pro Tyr Glu Asp Ile Phe Gly Gly Val Ser Ala Met Thr Leu

275 280 285

Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn Lys Tyr Trp Gly Trp

290 295 300

Gly Gly Asp Asp Asp Asp Met Ser Tyr Arg Leu Lys Lys Ile Asn Tyr

305 310 315 320

His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg Tyr Ala Met Leu Asp

325 330 335

His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr Gln Leu Leu Ser Gln

340 345 350

Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser Thr Leu Glu Tyr Glu

355 360 365

Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr His Ile Leu Val Asn

370 375 380

Ile Asp Glu Arg Ser

385

<210> 31

<211> 389

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 31

Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu Tyr Asn Ala Thr Gln

1 5 10 15

Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala Asn Trp Pro Lys Lys

20 25 30

Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu Tyr Ser Ile Lys Asn

35 40 45

Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser Val Val His Pro Pro

50 55 60

Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp Lys Asn Met Thr Ile

65 70 75 80

Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr Pro Leu Leu Ile Thr

85 90 95

Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr Thr Glu Asp Gly Val

100 105 110

Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu Cys Asp Ser Met Pro

115 120 125

Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr Glu Leu Glu Leu Glu

130 135 140

Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp Gly Gly Arg Tyr Ser

145 150 155 160

Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr

165 170 175

Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu Asn His Met His Pro

180 185 190

Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile Phe Ile Val Glu Gln

195 200 205

Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu Met Asn Val Gly Phe

210 215 220

Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp Gln Cys Phe Val Phe

225 230 235 240

His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg Asn Leu Tyr Ser Cys

245 250 255

Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile Asp Lys Leu His Phe

260 265 270

Lys Leu Pro Tyr Glu Asp Ile Phe Gly Gly Val Ser Ala Met Thr Leu

275 280 285

Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn Lys Tyr Trp Gly Trp

290 295 300

Gly Gly Ser Asp Asp Asp Met Ser Tyr Arg Leu Lys Lys Ile Asn Tyr

305 310 315 320

His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg Tyr Ala Met Leu Asp

325 330 335

His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr Gln Leu Leu Ser Gln

340 345 350

Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser Thr Leu Glu Tyr Glu

355 360 365

Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr His Ile Leu Val Asn

370 375 380

Ile Asp Glu Arg Ser

385

<210> 32

<211> 389

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 32

Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu Tyr Asn Ala Thr Gln

1 5 10 15

Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala Asn Trp Pro Lys Lys

20 25 30

Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu Tyr Ser Ile Lys Asn

35 40 45

Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser Val Val His Pro Pro

50 55 60

Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp Lys Asn Met Thr Ile

65 70 75 80

Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr Pro Leu Leu Ile Thr

85 90 95

Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr Thr Glu Asp Gly Val

100 105 110

Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu Cys Asp Ser Met Pro

115 120 125

Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr Glu Leu Glu Leu Glu

130 135 140

Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp Gly Gly Arg Tyr Ser

145 150 155 160

Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr

165 170 175

Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu Asn His Met His Pro

180 185 190

Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile Phe Ile Val Glu Gln

195 200 205

Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu Met Asn Val Gly Phe

210 215 220

Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp Gln Cys Phe Val Phe

225 230 235 240

His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg Asn Leu Tyr Ser Cys

245 250 255

Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile Asp Lys Leu His Phe

260 265 270

Lys Leu Pro Tyr Glu Asp Ile Phe Gly Gly Val Ser Ala Met Thr Leu

275 280 285

Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn Lys Tyr Trp Gly His

290 295 300

Gly Gly Ala Asp Asp Asp Met Ser Tyr Arg Leu Lys Lys Ile Asn Tyr

305 310 315 320

His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg Tyr Ala Met Leu Asp

325 330 335

His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr Gln Leu Leu Ser Gln

340 345 350

Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser Thr Leu Glu Tyr Glu

355 360 365

Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr His Ile Leu Val Asn

370 375 380

Ile Asp Glu Arg Ser

385

<210> 33

<211> 389

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 33

Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu Tyr Asn Ala Thr Gln

1 5 10 15

Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala Asn Trp Pro Lys Lys

20 25 30

Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu Tyr Ser Ile Lys Asn

35 40 45

Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser Val Val His Pro Pro

50 55 60

Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp Lys Asn Met Thr Ile

65 70 75 80

Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr Pro Leu Leu Ile Thr

85 90 95

Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr Thr Glu Asp Gly Val

100 105 110

Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu Cys Asp Ser Met Pro

115 120 125

Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr Glu Leu Glu Leu Glu

130 135 140

Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp Gly Gly Arg Tyr Ser

145 150 155 160

Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr

165 170 175

Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu Asn His Met His Pro

180 185 190

Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile Phe Ile Val Glu Gln

195 200 205

Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu Met Asn Val Gly Phe

210 215 220

Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp Gln Cys Phe Val Phe

225 230 235 240

His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg Asn Leu Tyr Ser Cys

245 250 255

Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile Asp Lys Leu His Phe

260 265 270

Lys Leu Pro Tyr Glu Asp Ile Phe Gly Gly Val Ser Ala Met Thr Leu

275 280 285

Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn Lys Tyr Trp Gly His

290 295 300

Gly Gly Asp Asp Asp Asp Met Ser Tyr Arg Leu Lys Lys Ile Asn Tyr

305 310 315 320

His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg Tyr Ala Met Leu Asp

325 330 335

His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr Gln Leu Leu Ser Gln

340 345 350

Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser Thr Leu Glu Tyr Glu

355 360 365

Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr His Ile Leu Val Asn

370 375 380

Ile Asp Glu Arg Ser

385

<210> 34

<211> 389

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 34

Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu Tyr Asn Ala Thr Gln

1 5 10 15

Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala Asn Trp Pro Lys Lys

20 25 30

Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu Tyr Ser Ile Lys Asn

35 40 45

Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser Val Val His Pro Pro

50 55 60

Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp Lys Asn Met Thr Ile

65 70 75 80

Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr Pro Leu Leu Ile Thr

85 90 95

Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr Thr Glu Asp Gly Val

100 105 110

Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu Cys Asp Ser Met Pro

115 120 125

Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr Glu Leu Glu Leu Glu

130 135 140

Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp Gly Gly Arg Tyr Ser

145 150 155 160

Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr

165 170 175

Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu Asn His Met His Pro

180 185 190

Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile Phe Ile Val Glu Gln

195 200 205

Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu Met Asn Val Gly Phe

210 215 220

Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp Gln Cys Phe Val Phe

225 230 235 240

His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg Asn Leu Tyr Ser Cys

245 250 255

Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile Asp Lys Leu His Phe

260 265 270

Lys Leu Pro Tyr Glu Asp Ile Phe Gly Gly Val Ser Ala Met Thr Leu

275 280 285

Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn Lys Tyr Trp Gly His

290 295 300

Gly Gly Ser Asp Asp Asp Met Ser Tyr Arg Leu Lys Lys Ile Asn Tyr

305 310 315 320

His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg Tyr Ala Met Leu Asp

325 330 335

His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr Gln Leu Leu Ser Gln

340 345 350

Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser Thr Leu Glu Tyr Glu

355 360 365

Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr His Ile Leu Val Asn

370 375 380

Ile Asp Glu Arg Ser

385

<210> 35

<211> 389

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 35

Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu Tyr Asn Ala Thr Gln

1 5 10 15

Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala Asn Trp Pro Lys Lys

20 25 30

Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu Tyr Ser Ile Lys Asn

35 40 45

Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser Val Val His Pro Pro

50 55 60

Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp Lys Asn Met Thr Ile

65 70 75 80

Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr Pro Leu Leu Ile Thr

85 90 95

Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr Thr Glu Asp Gly Val

100 105 110

Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu Cys Asp Ser Met Pro

115 120 125

Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr Glu Leu Glu Leu Glu

130 135 140

Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp Gly Gly Arg Tyr Ser

145 150 155 160

Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr

165 170 175

Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu Asn His Met His Pro

180 185 190

Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile Phe Ile Val Glu Gln

195 200 205

Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu Met Asn Val Gly Phe

210 215 220

Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp Gln Cys Phe Val Phe

225 230 235 240

His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg Asn Leu Tyr Ser Cys

245 250 255

Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile Asp Lys Leu His Phe

260 265 270

Lys Leu Pro Tyr Glu Asp Tyr Phe Gly Gly Val Ser Ala Met Thr Leu

275 280 285

Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn Lys Tyr Trp Gly Trp

290 295 300

Gly Gly Glu Asp Asp Asp Met Ser Tyr Arg Leu Lys Lys Ile Asn Tyr

305 310 315 320

His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg Tyr Ala Met Leu Asp

325 330 335

His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr Gln Leu Leu Ser Gln

340 345 350

Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser Thr Leu Glu Tyr Glu

355 360 365

Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr His Ile Leu Val Asn

370 375 380

Ile Asp Glu Arg Ser

385

<210> 36

<211> 389

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 36

Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu Tyr Asn Ala Thr Gln

1 5 10 15

Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala Asn Trp Pro Lys Lys

20 25 30

Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu Tyr Ser Ile Lys Asn

35 40 45

Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser Val Val His Pro Pro

50 55 60

Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp Lys Asn Met Thr Ile

65 70 75 80

Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr Pro Leu Leu Ile Thr

85 90 95

Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr Thr Glu Asp Gly Val

100 105 110

Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu Cys Asp Ser Met Pro

115 120 125

Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr Glu Leu Glu Leu Glu

130 135 140

Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp Gly Gly Arg Tyr Ser

145 150 155 160

Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr

165 170 175

Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu Asn His Met His Pro

180 185 190

Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile Phe Ile Val Glu Gln

195 200 205

Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu Met Asn Val Gly Phe

210 215 220

Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp Gln Cys Phe Val Phe

225 230 235 240

His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg Asn Leu Tyr Ser Cys

245 250 255

Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile Asp Lys Leu His Phe

260 265 270

Lys Leu Pro Tyr Glu Asp Tyr Phe Gly Gly Val Ser Ala Met Thr Leu

275 280 285

Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn Lys Tyr Trp Gly Phe

290 295 300

Gly Gly Glu Asp Asp Asp Met Ser Tyr Arg Leu Lys Lys Ile Asn Tyr

305 310 315 320

His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg Tyr Ala Met Leu Asp

325 330 335

His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr Gln Leu Leu Ser Gln

340 345 350

Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser Thr Leu Glu Tyr Glu

355 360 365

Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr His Ile Leu Val Asn

370 375 380

Ile Asp Glu Arg Ser

385

<210> 37

<211> 389

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 37

Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu Tyr Asn Ala Thr Gln

1 5 10 15

Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala Asn Trp Pro Lys Lys

20 25 30

Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu Tyr Ser Ile Lys Asn

35 40 45

Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser Val Val His Pro Pro

50 55 60

Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp Lys Asn Met Thr Ile

65 70 75 80

Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr Pro Leu Leu Ile Thr

85 90 95

Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr Thr Glu Asp Gly Val

100 105 110

Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu Cys Asp Ser Met Pro

115 120 125

Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr Glu Leu Glu Leu Glu

130 135 140

Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp Gly Gly Arg Tyr Ser

145 150 155 160

Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr

165 170 175

Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu Asn His Met His Pro

180 185 190

Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile Phe Ile Val Glu Gln

195 200 205

Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu Met Asn Val Gly Phe

210 215 220

Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp Gln Cys Phe Val Phe

225 230 235 240

His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg Asn Leu Tyr Ser Cys

245 250 255

Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile Asp Lys Leu His Phe

260 265 270

Lys Leu Pro Tyr Glu Asp Tyr Phe Gly Gly Val Ser Ala Met Thr Leu

275 280 285

Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn Lys Tyr Trp Gly His

290 295 300

Gly Gly Glu Asp Asp Asp Met Ser Tyr Arg Leu Lys Lys Ile Asn Tyr

305 310 315 320

His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg Tyr Ala Met Leu Asp

325 330 335

His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr Gln Leu Leu Ser Gln

340 345 350

Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser Thr Leu Glu Tyr Glu

355 360 365

Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr His Ile Leu Val Asn

370 375 380

Ile Asp Glu Arg Ser

385

<210> 38

<211> 389

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 38

Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu Tyr Asn Ala Thr Gln

1 5 10 15

Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala Asn Trp Pro Lys Lys

20 25 30

Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu Tyr Ser Ile Lys Asn

35 40 45

Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser Val Val His Pro Pro

50 55 60

Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp Lys Asn Met Thr Ile

65 70 75 80

Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr Pro Leu Leu Ile Thr

85 90 95

Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr Thr Glu Asp Gly Val

100 105 110

Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu Cys Asp Ser Met Pro

115 120 125

Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr Glu Leu Glu Leu Glu

130 135 140

Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp Gly Gly Arg Tyr Ser

145 150 155 160

Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr

165 170 175

Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu Asn His Met His Pro

180 185 190

Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile Phe Ile Val Glu Gln

195 200 205

Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu Met Asn Val Gly Phe

210 215 220

Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp Gln Cys Phe Val Phe

225 230 235 240

His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg Asn Leu Tyr Ser Cys

245 250 255

Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile Asp Lys Leu His Phe

260 265 270

Lys Leu Pro Tyr Glu Asp Tyr Phe Gly Gly Val Ser Ala Met Thr Leu

275 280 285

Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn Lys Tyr Trp Gly Val

290 295 300

Gly Gly Glu Asp Asp Asp Met Ser Tyr Arg Leu Lys Lys Ile Asn Tyr

305 310 315 320

His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg Tyr Ala Met Leu Asp

325 330 335

His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr Gln Leu Leu Ser Gln

340 345 350

Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser Thr Leu Glu Tyr Glu

355 360 365

Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr His Ile Leu Val Asn

370 375 380

Ile Asp Glu Arg Ser

385

<210> 39

<211> 389

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 39

Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu Tyr Asn Ala Thr Gln

1 5 10 15

Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala Asn Trp Pro Lys Lys

20 25 30

Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu Tyr Ser Ile Lys Asn

35 40 45

Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser Val Val His Pro Pro

50 55 60

Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp Lys Asn Met Thr Ile

65 70 75 80

Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr Pro Leu Leu Ile Thr

85 90 95

Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr Thr Glu Asp Gly Val

100 105 110

Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu Cys Asp Ser Met Pro

115 120 125

Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr Glu Leu Glu Leu Glu

130 135 140

Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp Gly Gly Arg Tyr Ser

145 150 155 160

Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr

165 170 175

Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu Asn His Met His Pro

180 185 190

Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile Phe Ile Val Glu Gln

195 200 205

Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu Met Asn Val Gly Phe

210 215 220

Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp Gln Cys Phe Val Phe

225 230 235 240

His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg Asn Leu Tyr Ser Cys

245 250 255

Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile Asp Lys Leu His Phe

260 265 270

Lys Leu Pro Tyr Glu Asp Tyr Phe Gly Gly Val Ser Ala Met Thr Leu

275 280 285

Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn Lys Tyr Trp Gly Trp

290 295 300

Gly Gly Ala Asp Asp Asp Met Ser Tyr Arg Leu Lys Lys Ile Asn Tyr

305 310 315 320

His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg Tyr Ala Met Leu Asp

325 330 335

His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr Gln Leu Leu Ser Gln

340 345 350

Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser Thr Leu Glu Tyr Glu

355 360 365

Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr His Ile Leu Val Asn

370 375 380

Ile Asp Glu Arg Ser

385

<210> 40

<211> 389

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 40

Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu Tyr Asn Ala Thr Gln

1 5 10 15

Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala Asn Trp Pro Lys Lys

20 25 30

Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu Tyr Ser Ile Lys Asn

35 40 45

Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser Val Val His Pro Pro

50 55 60

Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp Lys Asn Met Thr Ile

65 70 75 80

Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr Pro Leu Leu Ile Thr

85 90 95

Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr Thr Glu Asp Gly Val

100 105 110

Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu Cys Asp Ser Met Pro

115 120 125

Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr Glu Leu Glu Leu Glu

130 135 140

Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp Gly Gly Arg Tyr Ser

145 150 155 160

Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr

165 170 175

Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu Asn His Met His Pro

180 185 190

Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile Phe Ile Val Glu Gln

195 200 205

Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu Met Asn Val Gly Phe

210 215 220

Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp Gln Cys Phe Val Phe

225 230 235 240

His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg Asn Leu Tyr Ser Cys

245 250 255

Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile Asp Lys Leu His Phe

260 265 270

Lys Leu Pro Tyr Glu Asp Tyr Phe Gly Gly Val Ser Ala Met Thr Leu

275 280 285

Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn Lys Tyr Trp Gly Trp

290 295 300

Gly Gly Gly Asp Asp Asp Met Ser Tyr Arg Leu Lys Lys Ile Asn Tyr

305 310 315 320

His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg Tyr Ala Met Leu Asp

325 330 335

His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr Gln Leu Leu Ser Gln

340 345 350

Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser Thr Leu Glu Tyr Glu

355 360 365

Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr His Ile Leu Val Asn

370 375 380

Ile Asp Glu Arg Ser

385

<210> 41

<211> 389

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 41

Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu Tyr Asn Ala Thr Gln

1 5 10 15

Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala Asn Trp Pro Lys Lys

20 25 30

Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu Tyr Ser Ile Lys Asn

35 40 45

Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser Val Val His Pro Pro

50 55 60

Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp Lys Asn Met Thr Ile

65 70 75 80

Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr Pro Leu Leu Ile Thr

85 90 95

Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr Thr Glu Asp Gly Val

100 105 110

Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu Cys Asp Ser Met Pro

115 120 125

Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr Glu Leu Glu Leu Glu

130 135 140

Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp Gly Gly Arg Tyr Ser

145 150 155 160

Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr

165 170 175

Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu Asn His Met His Pro

180 185 190

Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile Phe Ile Val Glu Gln

195 200 205

Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu Met Asn Val Gly Phe

210 215 220

Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp Gln Cys Phe Val Phe

225 230 235 240

His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg Asn Leu Tyr Ser Cys

245 250 255

Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile Asp Lys Leu His Phe

260 265 270

Lys Leu Pro Tyr Glu Asp Tyr Phe Gly Gly Val Ser Ala Met Thr Leu

275 280 285

Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn Lys Tyr Trp Gly Trp

290 295 300

Gly Gly Asp Asp Asp Asp Met Ser Tyr Arg Leu Lys Lys Ile Asn Tyr

305 310 315 320

His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg Tyr Ala Met Leu Asp

325 330 335

His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr Gln Leu Leu Ser Gln

340 345 350

Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser Thr Leu Glu Tyr Glu

355 360 365

Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr His Ile Leu Val Asn

370 375 380

Ile Asp Glu Arg Ser

385

<210> 42

<211> 389

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 42

Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu Tyr Asn Ala Thr Gln

1 5 10 15

Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala Asn Trp Pro Lys Lys

20 25 30

Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu Tyr Ser Ile Lys Asn

35 40 45

Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser Val Val His Pro Pro

50 55 60

Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp Lys Asn Met Thr Ile

65 70 75 80

Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr Pro Leu Leu Ile Thr

85 90 95

Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr Thr Glu Asp Gly Val

100 105 110

Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu Cys Asp Ser Met Pro

115 120 125

Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr Glu Leu Glu Leu Glu

130 135 140

Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp Gly Gly Arg Tyr Ser

145 150 155 160

Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr

165 170 175

Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu Asn His Met His Pro

180 185 190

Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile Phe Ile Val Glu Gln

195 200 205

Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu Met Asn Val Gly Phe

210 215 220

Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp Gln Cys Phe Val Phe

225 230 235 240

His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg Asn Leu Tyr Ser Cys

245 250 255

Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile Asp Lys Leu His Phe

260 265 270

Lys Leu Pro Tyr Glu Asp Tyr Phe Gly Gly Val Ser Ala Met Thr Leu

275 280 285

Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn Lys Tyr Trp Gly Trp

290 295 300

Gly Gly Ser Asp Asp Asp Met Ser Tyr Arg Leu Lys Lys Ile Asn Tyr

305 310 315 320

His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg Tyr Ala Met Leu Asp

325 330 335

His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr Gln Leu Leu Ser Gln

340 345 350

Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser Thr Leu Glu Tyr Glu

355 360 365

Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr His Ile Leu Val Asn

370 375 380

Ile Asp Glu Arg Ser

385

<210> 43

<211> 389

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 43

Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu Tyr Asn Ala Thr Gln

1 5 10 15

Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala Asn Trp Pro Lys Lys

20 25 30

Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu Tyr Ser Ile Lys Asn

35 40 45

Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser Val Val His Pro Pro

50 55 60

Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp Lys Asn Met Thr Ile

65 70 75 80

Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr Pro Leu Leu Ile Thr

85 90 95

Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr Thr Glu Asp Gly Val

100 105 110

Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu Cys Asp Ser Met Pro

115 120 125

Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr Glu Leu Glu Leu Glu

130 135 140

Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp Gly Gly Arg Tyr Ser

145 150 155 160

Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr

165 170 175

Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu Asn His Met His Pro

180 185 190

Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile Phe Ile Val Glu Gln

195 200 205

Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu Met Asn Val Gly Phe

210 215 220

Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp Gln Cys Phe Val Phe

225 230 235 240

His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg Asn Leu Tyr Ser Cys

245 250 255

Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile Asp Lys Leu His Phe

260 265 270

Lys Leu Pro Tyr Glu Asp Tyr Phe Gly Gly Val Ser Ala Met Thr Leu

275 280 285

Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn Lys Tyr Trp Gly His

290 295 300

Gly Gly Ala Asp Asp Asp Met Ser Tyr Arg Leu Lys Lys Ile Asn Tyr

305 310 315 320

His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg Tyr Ala Met Leu Asp

325 330 335

His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr Gln Leu Leu Ser Gln

340 345 350

Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser Thr Leu Glu Tyr Glu

355 360 365

Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr His Ile Leu Val Asn

370 375 380

Ile Asp Glu Arg Ser

385

<210> 44

<211> 389

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 44

Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu Tyr Asn Ala Thr Gln

1 5 10 15

Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala Asn Trp Pro Lys Lys

20 25 30

Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu Tyr Ser Ile Lys Asn

35 40 45

Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser Val Val His Pro Pro

50 55 60

Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp Lys Asn Met Thr Ile

65 70 75 80

Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr Pro Leu Leu Ile Thr

85 90 95

Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr Thr Glu Asp Gly Val

100 105 110

Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu Cys Asp Ser Met Pro

115 120 125

Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr Glu Leu Glu Leu Glu

130 135 140

Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp Gly Gly Arg Tyr Ser

145 150 155 160

Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr

165 170 175

Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu Asn His Met His Pro

180 185 190

Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile Phe Ile Val Glu Gln

195 200 205

Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu Met Asn Val Gly Phe

210 215 220

Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp Gln Cys Phe Val Phe

225 230 235 240

His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg Asn Leu Tyr Ser Cys

245 250 255

Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile Asp Lys Leu His Phe

260 265 270

Lys Leu Pro Tyr Glu Asp Tyr Phe Gly Gly Val Ser Ala Met Thr Leu

275 280 285

Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn Lys Tyr Trp Gly His

290 295 300

Gly Gly Asp Asp Asp Asp Met Ser Tyr Arg Leu Lys Lys Ile Asn Tyr

305 310 315 320

His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg Tyr Ala Met Leu Asp

325 330 335

His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr Gln Leu Leu Ser Gln

340 345 350

Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser Thr Leu Glu Tyr Glu

355 360 365

Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr His Ile Leu Val Asn

370 375 380

Ile Asp Glu Arg Ser

385

<210> 45

<211> 389

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 45

Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu Tyr Asn Ala Thr Gln

1 5 10 15

Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala Asn Trp Pro Lys Lys

20 25 30

Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu Tyr Ser Ile Lys Asn

35 40 45

Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser Val Val His Pro Pro

50 55 60

Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp Lys Asn Met Thr Ile

65 70 75 80

Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr Pro Leu Leu Ile Thr

85 90 95

Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr Thr Glu Asp Gly Val

100 105 110

Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu Cys Asp Ser Met Pro

115 120 125

Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr Glu Leu Glu Leu Glu

130 135 140

Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp Gly Gly Arg Tyr Ser

145 150 155 160

Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala Ile Ile Val Pro Tyr

165 170 175

Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu Asn His Met His Pro

180 185 190

Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile Phe Ile Val Glu Gln

195 200 205

Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu Met Asn Val Gly Phe

210 215 220

Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp Gln Cys Phe Val Phe

225 230 235 240

His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg Asn Leu Tyr Ser Cys

245 250 255

Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile Asp Lys Leu His Phe

260 265 270

Lys Leu Pro Tyr Glu Asp Tyr Phe Gly Gly Val Ser Ala Met Thr Leu

275 280 285

Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn Lys Tyr Trp Gly His

290 295 300

Gly Gly Ser Asp Asp Asp Met Ser Tyr Arg Leu Lys Lys Ile Asn Tyr

305 310 315 320

His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg Tyr Ala Met Leu Asp

325 330 335

His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr Gln Leu Leu Ser Gln

340 345 350

Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser Thr Leu Glu Tyr Glu

355 360 365

Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr His Ile Leu Val Asn

370 375 380

Ile Asp Glu Arg Ser

385

<210> 46

<211> 354

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 46

Asp Tyr Ser Phe Trp Ser Pro Ala Phe Ile Ile Ser Ala Pro Lys Thr

1 5 10 15

Leu Thr Thr Leu Gln Pro Phe Ser Gln Ser Thr Ser Thr Asn Asp Leu

20 25 30

Ala Val Ser Ala Leu Glu Ser Val Glu Phe Ser Met Leu Asp Asn Ser

35 40 45

Ser Ile Leu His Ala Ser Asp Asn Trp Thr Asn Asp Glu Leu Val Met

50 55 60

Arg Ala Gln Asn Glu Asn Leu Gln Leu Cys Pro Met Thr Pro Pro Ala

65 70 75 80

Leu Val Gly Pro Ile Lys Val Trp Met Asp Ala Pro Ser Phe Ala Glu

85 90 95

Leu Glu Arg Leu Tyr Pro Phe Leu Glu Pro Gly Gly His Gly Met Pro

100 105 110

Thr Ala Cys Arg Ala Arg His Arg Val Ala Ile Val Val Pro Tyr Arg

115 120 125

Asp Arg Glu Ser His Leu Arg Thr Phe Leu His Asn Leu His Ser Leu

130 135 140

Leu Thr Lys Gln Gln Leu Asp Tyr Ala Ile Phe Val Val Glu Gln Thr

145 150 155 160

Ala Asn Glu Thr Phe Asn Arg Ala Lys Leu Met Asn Val Gly Tyr Ala

165 170 175

Glu Ala Ile Arg Leu Tyr Asp Trp Arg Cys Phe Ile Phe His Asp Val

180 185 190

Asp Leu Leu Pro Glu Asp Asp Arg Asn Leu Tyr Ser Cys Pro Asp Glu

195 200 205

Pro Arg His Met Ser Val Ala Val Asp Lys Phe Asn Tyr Lys Leu Pro

210 215 220

Tyr Gly Ser Ile Phe Gly Gly Ile Ser Ala Leu Thr Arg Glu Gln Phe

225 230 235 240

Glu Gly Ile Asn Gly Phe Ser Asn Asp Tyr Trp Gly His Gly Gly Glu

245 250 255

Asp Asp Asp Leu Ser Thr Arg Val Thr Leu Ala Gly Tyr Lys Ile Ser

260 265 270

Arg Tyr Pro Ala Glu Ile Ala Arg Tyr Lys Met Ile Lys His Asn Ser

275 280 285

Glu Lys Lys Asn Pro Val Asn Arg Cys Arg Tyr Lys Leu Met Ser Ala

290 295 300

Thr Lys Ser Arg Trp Arg Asn Asp Gly Leu Ser Ser Leu Ser Tyr Asp

305 310 315 320

Leu Ile Ser Leu Gly Arg Leu Pro Leu Tyr Thr His Ile Lys Val Asp

325 330 335

Leu Leu Glu Lys Gln Ser Arg Arg Tyr Leu Arg Thr His Gly Phe Pro

340 345 350

Thr Cys

<210> 47

<211> 354

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 47

Asp Tyr Ser Phe Trp Ser Pro Ala Phe Ile Ile Ser Ala Pro Lys Thr

1 5 10 15

Leu Thr Thr Leu Gln Pro Phe Ser Gln Ser Thr Ser Thr Asn Asp Leu

20 25 30

Ala Val Ser Ala Leu Glu Ser Val Glu Phe Ser Met Leu Asp Asn Ser

35 40 45

Ser Ile Leu His Ala Ser Asp Asn Trp Thr Asn Asp Glu Leu Val Met

50 55 60

Arg Ala Gln Asn Glu Asn Leu Gln Leu Cys Pro Met Thr Pro Pro Ala

65 70 75 80

Leu Val Gly Pro Ile Lys Val Trp Met Asp Ala Pro Ser Phe Ala Glu

85 90 95

Leu Glu Arg Leu Tyr Pro Phe Leu Glu Pro Gly Gly His Gly Met Pro

100 105 110

Thr Ala Cys Arg Ala Arg His Arg Val Ala Ile Val Val Pro Tyr Arg

115 120 125

Asp Arg Glu Ser His Leu Arg Thr Phe Leu His Asn Leu His Ser Leu

130 135 140

Leu Thr Lys Gln Gln Leu Asp Tyr Ala Ile Phe Val Val Glu Gln Thr

145 150 155 160

Ala Asn Glu Thr Phe Asn Arg Ala Lys Leu Met Asn Val Gly Tyr Ala

165 170 175

Glu Ala Ile Arg Leu Tyr Asp Trp Arg Cys Phe Ile Phe His Asp Val

180 185 190

Asp Leu Leu Pro Glu Asp Asp Arg Asn Leu Tyr Ser Cys Pro Asp Glu

195 200 205

Pro Arg His Met Ser Val Ala Val Asp Lys Phe Asn Tyr Lys Leu Pro

210 215 220

Tyr Gly Ser Ile Phe Gly Gly Ile Ser Ala Leu Thr Arg Glu Gln Phe

225 230 235 240

Glu Gly Ile Asn Gly Phe Ser Asn Asp Tyr Trp Gly Trp Gly Gly Asp

245 250 255

Asp Asp Asp Leu Ser Thr Arg Val Thr Leu Ala Gly Tyr Lys Ile Ser

260 265 270

Arg Tyr Pro Ala Glu Ile Ala Arg Tyr Lys Met Ile Lys His Asn Ser

275 280 285

Glu Lys Lys Asn Pro Val Asn Arg Cys Arg Tyr Lys Leu Met Ser Ala

290 295 300

Thr Lys Ser Arg Trp Arg Asn Asp Gly Leu Ser Ser Leu Ser Tyr Asp

305 310 315 320

Leu Ile Ser Leu Gly Arg Leu Pro Leu Tyr Thr His Ile Lys Val Asp

325 330 335

Leu Leu Glu Lys Gln Ser Arg Arg Tyr Leu Arg Thr His Gly Phe Pro

340 345 350

Thr Cys

<210> 48

<211> 354

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 48

Asp Tyr Ser Phe Trp Ser Pro Ala Phe Ile Ile Ser Ala Pro Lys Thr

1 5 10 15

Leu Thr Thr Leu Gln Pro Phe Ser Gln Ser Thr Ser Thr Asn Asp Leu

20 25 30

Ala Val Ser Ala Leu Glu Ser Val Glu Phe Ser Met Leu Asp Asn Ser

35 40 45

Ser Ile Leu His Ala Ser Asp Asn Trp Thr Asn Asp Glu Leu Val Met

50 55 60

Arg Ala Gln Asn Glu Asn Leu Gln Leu Cys Pro Met Thr Pro Pro Ala

65 70 75 80

Leu Val Gly Pro Ile Lys Val Trp Met Asp Ala Pro Ser Phe Ala Glu

85 90 95

Leu Glu Arg Leu Tyr Pro Phe Leu Glu Pro Gly Gly His Gly Met Pro

100 105 110

Thr Ala Cys Arg Ala Arg His Arg Val Ala Ile Val Val Pro Tyr Arg

115 120 125

Asp Arg Glu Ser His Leu Arg Thr Phe Leu His Asn Leu His Ser Leu

130 135 140

Leu Thr Lys Gln Gln Leu Asp Tyr Ala Ile Phe Val Val Glu Gln Thr

145 150 155 160

Ala Asn Glu Thr Phe Asn Arg Ala Lys Leu Met Asn Val Gly Tyr Ala

165 170 175

Glu Ala Ile Arg Leu Tyr Asp Trp Arg Cys Phe Ile Phe His Asp Val

180 185 190

Asp Leu Leu Pro Glu Asp Asp Arg Asn Leu Tyr Ser Cys Pro Asp Glu

195 200 205

Pro Arg His Met Ser Val Ala Val Asp Lys Phe Asn Tyr Lys Leu Pro

210 215 220

Tyr Gly Ser Tyr Phe Gly Gly Ile Ser Ala Leu Thr Arg Glu Gln Phe

225 230 235 240

Glu Gly Ile Asn Gly Phe Ser Asn Asp Tyr Trp Gly Trp Gly Gly Glu

245 250 255

Asp Asp Asp Leu Ser Thr Arg Val Thr Leu Ala Gly Tyr Lys Ile Ser

260 265 270

Arg Tyr Pro Ala Glu Ile Ala Arg Tyr Lys Met Ile Lys His Asn Ser

275 280 285

Glu Lys Lys Asn Pro Val Asn Arg Cys Arg Tyr Lys Leu Met Ser Ala

290 295 300

Thr Lys Ser Arg Trp Arg Asn Asp Gly Leu Ser Ser Leu Ser Tyr Asp

305 310 315 320

Leu Ile Ser Leu Gly Arg Leu Pro Leu Tyr Thr His Ile Lys Val Asp

325 330 335

Leu Leu Glu Lys Gln Ser Arg Arg Tyr Leu Arg Thr His Gly Phe Pro

340 345 350

Thr Cys

<210> 49

<211> 410

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 49

Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro

1 5 10 15

Arg Gly Ser His Met Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu

20 25 30

Tyr Asn Ala Thr Gln Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala

35 40 45

Asn Trp Pro Lys Lys Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu

50 55 60

Tyr Ser Ile Lys Asn Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser

65 70 75 80

Val Val His Pro Pro Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp

85 90 95

Lys Asn Met Thr Ile Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr

100 105 110

Pro Leu Leu Ile Thr Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr

115 120 125

Thr Glu Asp Gly Val Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu

130 135 140

Cys Asp Ser Met Pro Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr

145 150 155 160

Glu Leu Glu Leu Glu Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp

165 170 175

Gly Gly Arg Tyr Ser Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala

180 185 190

Ile Ile Val Pro Tyr Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu

195 200 205

Asn His Met His Pro Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile

210 215 220

Phe Ile Val Glu Gln Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu

225 230 235 240

Met Asn Val Gly Phe Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp

245 250 255

Gln Cys Phe Val Phe His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg

260 265 270

Asn Leu Tyr Ser Cys Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile

275 280 285

Asp Lys Leu His Phe Lys Leu Pro Tyr Glu Asp Ile Phe Gly Gly Val

290 295 300

Ser Ala Met Thr Leu Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn

305 310 315 320

Lys Tyr Trp Gly Trp Gly Gly Glu Asp Asp Asp Met Ser Tyr Arg Leu

325 330 335

Lys Lys Ile Asn Tyr His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg

340 345 350

Tyr Ala Met Leu Asp His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr

355 360 365

Gln Leu Leu Ser Gln Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser

370 375 380

Thr Leu Glu Tyr Glu Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr

385 390 395 400

His Ile Leu Val Asn Ile Asp Glu Arg Ser

405 410

<210> 50

<211> 410

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 50

Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro

1 5 10 15

Arg Gly Ser His Met Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu

20 25 30

Tyr Asn Ala Thr Gln Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala

35 40 45

Asn Trp Pro Lys Lys Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu

50 55 60

Tyr Ser Ile Lys Asn Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser

65 70 75 80

Val Val His Pro Pro Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp

85 90 95

Lys Asn Met Thr Ile Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr

100 105 110

Pro Leu Leu Ile Thr Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr

115 120 125

Thr Glu Asp Gly Val Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu

130 135 140

Cys Asp Ser Met Pro Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr

145 150 155 160

Glu Leu Glu Leu Glu Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp

165 170 175

Gly Gly Arg Tyr Ser Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala

180 185 190

Ile Ile Val Pro Tyr Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu

195 200 205

Asn His Met His Pro Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile

210 215 220

Phe Ile Val Glu Gln Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu

225 230 235 240

Met Asn Val Gly Phe Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp

245 250 255

Gln Cys Phe Val Phe His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg

260 265 270

Asn Leu Tyr Ser Cys Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile

275 280 285

Asp Lys Leu His Phe Lys Leu Pro Tyr Glu Asp Ile Phe Gly Gly Val

290 295 300

Ser Ala Met Thr Leu Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn

305 310 315 320

Lys Tyr Trp Gly Phe Gly Gly Glu Asp Asp Asp Met Ser Tyr Arg Leu

325 330 335

Lys Lys Ile Asn Tyr His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg

340 345 350

Tyr Ala Met Leu Asp His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr

355 360 365

Gln Leu Leu Ser Gln Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser

370 375 380

Thr Leu Glu Tyr Glu Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr

385 390 395 400

His Ile Leu Val Asn Ile Asp Glu Arg Ser

405 410

<210> 51

<211> 410

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 51

Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro

1 5 10 15

Arg Gly Ser His Met Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu

20 25 30

Tyr Asn Ala Thr Gln Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala

35 40 45

Asn Trp Pro Lys Lys Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu

50 55 60

Tyr Ser Ile Lys Asn Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser

65 70 75 80

Val Val His Pro Pro Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp

85 90 95

Lys Asn Met Thr Ile Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr

100 105 110

Pro Leu Leu Ile Thr Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr

115 120 125

Thr Glu Asp Gly Val Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu

130 135 140

Cys Asp Ser Met Pro Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr

145 150 155 160

Glu Leu Glu Leu Glu Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp

165 170 175

Gly Gly Arg Tyr Ser Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala

180 185 190

Ile Ile Val Pro Tyr Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu

195 200 205

Asn His Met His Pro Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile

210 215 220

Phe Ile Val Glu Gln Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu

225 230 235 240

Met Asn Val Gly Phe Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp

245 250 255

Gln Cys Phe Val Phe His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg

260 265 270

Asn Leu Tyr Ser Cys Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile

275 280 285

Asp Lys Leu His Phe Lys Leu Pro Tyr Glu Asp Ile Phe Gly Gly Val

290 295 300

Ser Ala Met Thr Leu Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn

305 310 315 320

Lys Tyr Trp Gly His Gly Gly Glu Asp Asp Asp Met Ser Tyr Arg Leu

325 330 335

Lys Lys Ile Asn Tyr His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg

340 345 350

Tyr Ala Met Leu Asp His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr

355 360 365

Gln Leu Leu Ser Gln Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser

370 375 380

Thr Leu Glu Tyr Glu Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr

385 390 395 400

His Ile Leu Val Asn Ile Asp Glu Arg Ser

405 410

<210> 52

<211> 410

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 52

Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro

1 5 10 15

Arg Gly Ser His Met Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu

20 25 30

Tyr Asn Ala Thr Gln Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala

35 40 45

Asn Trp Pro Lys Lys Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu

50 55 60

Tyr Ser Ile Lys Asn Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser

65 70 75 80

Val Val His Pro Pro Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp

85 90 95

Lys Asn Met Thr Ile Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr

100 105 110

Pro Leu Leu Ile Thr Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr

115 120 125

Thr Glu Asp Gly Val Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu

130 135 140

Cys Asp Ser Met Pro Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr

145 150 155 160

Glu Leu Glu Leu Glu Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp

165 170 175

Gly Gly Arg Tyr Ser Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala

180 185 190

Ile Ile Val Pro Tyr Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu

195 200 205

Asn His Met His Pro Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile

210 215 220

Phe Ile Val Glu Gln Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu

225 230 235 240

Met Asn Val Gly Phe Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp

245 250 255

Gln Cys Phe Val Phe His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg

260 265 270

Asn Leu Tyr Ser Cys Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile

275 280 285

Asp Lys Leu His Phe Lys Leu Pro Tyr Glu Asp Ile Phe Gly Gly Val

290 295 300

Ser Ala Met Thr Leu Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn

305 310 315 320

Lys Tyr Trp Gly Val Gly Gly Glu Asp Asp Asp Met Ser Tyr Arg Leu

325 330 335

Lys Lys Ile Asn Tyr His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg

340 345 350

Tyr Ala Met Leu Asp His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr

355 360 365

Gln Leu Leu Ser Gln Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser

370 375 380

Thr Leu Glu Tyr Glu Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr

385 390 395 400

His Ile Leu Val Asn Ile Asp Glu Arg Ser

405 410

<210> 53

<211> 410

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 53

Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro

1 5 10 15

Arg Gly Ser His Met Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu

20 25 30

Tyr Asn Ala Thr Gln Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala

35 40 45

Asn Trp Pro Lys Lys Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu

50 55 60

Tyr Ser Ile Lys Asn Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser

65 70 75 80

Val Val His Pro Pro Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp

85 90 95

Lys Asn Met Thr Ile Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr

100 105 110

Pro Leu Leu Ile Thr Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr

115 120 125

Thr Glu Asp Gly Val Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu

130 135 140

Cys Asp Ser Met Pro Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr

145 150 155 160

Glu Leu Glu Leu Glu Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp

165 170 175

Gly Gly Arg Tyr Ser Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala

180 185 190

Ile Ile Val Pro Tyr Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu

195 200 205

Asn His Met His Pro Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile

210 215 220

Phe Ile Val Glu Gln Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu

225 230 235 240

Met Asn Val Gly Phe Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp

245 250 255

Gln Cys Phe Val Phe His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg

260 265 270

Asn Leu Tyr Ser Cys Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile

275 280 285

Asp Lys Leu His Phe Lys Leu Pro Tyr Glu Asp Ile Phe Gly Gly Val

290 295 300

Ser Ala Met Thr Leu Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn

305 310 315 320

Lys Tyr Trp Gly Trp Gly Gly Ala Asp Asp Asp Met Ser Tyr Arg Leu

325 330 335

Lys Lys Ile Asn Tyr His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg

340 345 350

Tyr Ala Met Leu Asp His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr

355 360 365

Gln Leu Leu Ser Gln Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser

370 375 380

Thr Leu Glu Tyr Glu Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr

385 390 395 400

His Ile Leu Val Asn Ile Asp Glu Arg Ser

405 410

<210> 54

<211> 410

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 54

Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro

1 5 10 15

Arg Gly Ser His Met Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu

20 25 30

Tyr Asn Ala Thr Gln Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala

35 40 45

Asn Trp Pro Lys Lys Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu

50 55 60

Tyr Ser Ile Lys Asn Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser

65 70 75 80

Val Val His Pro Pro Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp

85 90 95

Lys Asn Met Thr Ile Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr

100 105 110

Pro Leu Leu Ile Thr Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr

115 120 125

Thr Glu Asp Gly Val Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu

130 135 140

Cys Asp Ser Met Pro Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr

145 150 155 160

Glu Leu Glu Leu Glu Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp

165 170 175

Gly Gly Arg Tyr Ser Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala

180 185 190

Ile Ile Val Pro Tyr Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu

195 200 205

Asn His Met His Pro Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile

210 215 220

Phe Ile Val Glu Gln Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu

225 230 235 240

Met Asn Val Gly Phe Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp

245 250 255

Gln Cys Phe Val Phe His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg

260 265 270

Asn Leu Tyr Ser Cys Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile

275 280 285

Asp Lys Leu His Phe Lys Leu Pro Tyr Glu Asp Ile Phe Gly Gly Val

290 295 300

Ser Ala Met Thr Leu Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn

305 310 315 320

Lys Tyr Trp Gly Trp Gly Gly Gly Asp Asp Asp Met Ser Tyr Arg Leu

325 330 335

Lys Lys Ile Asn Tyr His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg

340 345 350

Tyr Ala Met Leu Asp His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr

355 360 365

Gln Leu Leu Ser Gln Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser

370 375 380

Thr Leu Glu Tyr Glu Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr

385 390 395 400

His Ile Leu Val Asn Ile Asp Glu Arg Ser

405 410

<210> 55

<211> 410

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 55

Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro

1 5 10 15

Arg Gly Ser His Met Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu

20 25 30

Tyr Asn Ala Thr Gln Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala

35 40 45

Asn Trp Pro Lys Lys Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu

50 55 60

Tyr Ser Ile Lys Asn Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser

65 70 75 80

Val Val His Pro Pro Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp

85 90 95

Lys Asn Met Thr Ile Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr

100 105 110

Pro Leu Leu Ile Thr Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr

115 120 125

Thr Glu Asp Gly Val Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu

130 135 140

Cys Asp Ser Met Pro Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr

145 150 155 160

Glu Leu Glu Leu Glu Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp

165 170 175

Gly Gly Arg Tyr Ser Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala

180 185 190

Ile Ile Val Pro Tyr Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu

195 200 205

Asn His Met His Pro Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile

210 215 220

Phe Ile Val Glu Gln Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu

225 230 235 240

Met Asn Val Gly Phe Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp

245 250 255

Gln Cys Phe Val Phe His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg

260 265 270

Asn Leu Tyr Ser Cys Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile

275 280 285

Asp Lys Leu His Phe Lys Leu Pro Tyr Glu Asp Ile Phe Gly Gly Val

290 295 300

Ser Ala Met Thr Leu Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn

305 310 315 320

Lys Tyr Trp Gly Trp Gly Gly Asp Asp Asp Asp Met Ser Tyr Arg Leu

325 330 335

Lys Lys Ile Asn Tyr His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg

340 345 350

Tyr Ala Met Leu Asp His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr

355 360 365

Gln Leu Leu Ser Gln Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser

370 375 380

Thr Leu Glu Tyr Glu Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr

385 390 395 400

His Ile Leu Val Asn Ile Asp Glu Arg Ser

405 410

<210> 56

<211> 410

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 56

Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro

1 5 10 15

Arg Gly Ser His Met Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu

20 25 30

Tyr Asn Ala Thr Gln Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala

35 40 45

Asn Trp Pro Lys Lys Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu

50 55 60

Tyr Ser Ile Lys Asn Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser

65 70 75 80

Val Val His Pro Pro Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp

85 90 95

Lys Asn Met Thr Ile Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr

100 105 110

Pro Leu Leu Ile Thr Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr

115 120 125

Thr Glu Asp Gly Val Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu

130 135 140

Cys Asp Ser Met Pro Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr

145 150 155 160

Glu Leu Glu Leu Glu Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp

165 170 175

Gly Gly Arg Tyr Ser Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala

180 185 190

Ile Ile Val Pro Tyr Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu

195 200 205

Asn His Met His Pro Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile

210 215 220

Phe Ile Val Glu Gln Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu

225 230 235 240

Met Asn Val Gly Phe Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp

245 250 255

Gln Cys Phe Val Phe His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg

260 265 270

Asn Leu Tyr Ser Cys Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile

275 280 285

Asp Lys Leu His Phe Lys Leu Pro Tyr Glu Asp Ile Phe Gly Gly Val

290 295 300

Ser Ala Met Thr Leu Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn

305 310 315 320

Lys Tyr Trp Gly Trp Gly Gly Ser Asp Asp Asp Met Ser Tyr Arg Leu

325 330 335

Lys Lys Ile Asn Tyr His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg

340 345 350

Tyr Ala Met Leu Asp His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr

355 360 365

Gln Leu Leu Ser Gln Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser

370 375 380

Thr Leu Glu Tyr Glu Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr

385 390 395 400

His Ile Leu Val Asn Ile Asp Glu Arg Ser

405 410

<210> 57

<211> 410

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 57

Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro

1 5 10 15

Arg Gly Ser His Met Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu

20 25 30

Tyr Asn Ala Thr Gln Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala

35 40 45

Asn Trp Pro Lys Lys Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu

50 55 60

Tyr Ser Ile Lys Asn Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser

65 70 75 80

Val Val His Pro Pro Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp

85 90 95

Lys Asn Met Thr Ile Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr

100 105 110

Pro Leu Leu Ile Thr Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr

115 120 125

Thr Glu Asp Gly Val Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu

130 135 140

Cys Asp Ser Met Pro Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr

145 150 155 160

Glu Leu Glu Leu Glu Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp

165 170 175

Gly Gly Arg Tyr Ser Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala

180 185 190

Ile Ile Val Pro Tyr Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu

195 200 205

Asn His Met His Pro Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile

210 215 220

Phe Ile Val Glu Gln Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu

225 230 235 240

Met Asn Val Gly Phe Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp

245 250 255

Gln Cys Phe Val Phe His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg

260 265 270

Asn Leu Tyr Ser Cys Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile

275 280 285

Asp Lys Leu His Phe Lys Leu Pro Tyr Glu Asp Ile Phe Gly Gly Val

290 295 300

Ser Ala Met Thr Leu Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn

305 310 315 320

Lys Tyr Trp Gly His Gly Gly Ala Asp Asp Asp Met Ser Tyr Arg Leu

325 330 335

Lys Lys Ile Asn Tyr His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg

340 345 350

Tyr Ala Met Leu Asp His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr

355 360 365

Gln Leu Leu Ser Gln Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser

370 375 380

Thr Leu Glu Tyr Glu Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr

385 390 395 400

His Ile Leu Val Asn Ile Asp Glu Arg Ser

405 410

<210> 58

<211> 410

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 58

Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro

1 5 10 15

Arg Gly Ser His Met Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu

20 25 30

Tyr Asn Ala Thr Gln Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala

35 40 45

Asn Trp Pro Lys Lys Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu

50 55 60

Tyr Ser Ile Lys Asn Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser

65 70 75 80

Val Val His Pro Pro Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp

85 90 95

Lys Asn Met Thr Ile Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr

100 105 110

Pro Leu Leu Ile Thr Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr

115 120 125

Thr Glu Asp Gly Val Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu

130 135 140

Cys Asp Ser Met Pro Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr

145 150 155 160

Glu Leu Glu Leu Glu Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp

165 170 175

Gly Gly Arg Tyr Ser Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala

180 185 190

Ile Ile Val Pro Tyr Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu

195 200 205

Asn His Met His Pro Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile

210 215 220

Phe Ile Val Glu Gln Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu

225 230 235 240

Met Asn Val Gly Phe Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp

245 250 255

Gln Cys Phe Val Phe His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg

260 265 270

Asn Leu Tyr Ser Cys Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile

275 280 285

Asp Lys Leu His Phe Lys Leu Pro Tyr Glu Asp Ile Phe Gly Gly Val

290 295 300

Ser Ala Met Thr Leu Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn

305 310 315 320

Lys Tyr Trp Gly His Gly Gly Asp Asp Asp Asp Met Ser Tyr Arg Leu

325 330 335

Lys Lys Ile Asn Tyr His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg

340 345 350

Tyr Ala Met Leu Asp His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr

355 360 365

Gln Leu Leu Ser Gln Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser

370 375 380

Thr Leu Glu Tyr Glu Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr

385 390 395 400

His Ile Leu Val Asn Ile Asp Glu Arg Ser

405 410

<210> 59

<211> 410

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 59

Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro

1 5 10 15

Arg Gly Ser His Met Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu

20 25 30

Tyr Asn Ala Thr Gln Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala

35 40 45

Asn Trp Pro Lys Lys Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu

50 55 60

Tyr Ser Ile Lys Asn Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser

65 70 75 80

Val Val His Pro Pro Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp

85 90 95

Lys Asn Met Thr Ile Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr

100 105 110

Pro Leu Leu Ile Thr Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr

115 120 125

Thr Glu Asp Gly Val Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu

130 135 140

Cys Asp Ser Met Pro Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr

145 150 155 160

Glu Leu Glu Leu Glu Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp

165 170 175

Gly Gly Arg Tyr Ser Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala

180 185 190

Ile Ile Val Pro Tyr Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu

195 200 205

Asn His Met His Pro Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile

210 215 220

Phe Ile Val Glu Gln Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu

225 230 235 240

Met Asn Val Gly Phe Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp

245 250 255

Gln Cys Phe Val Phe His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg

260 265 270

Asn Leu Tyr Ser Cys Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile

275 280 285

Asp Lys Leu His Phe Lys Leu Pro Tyr Glu Asp Ile Phe Gly Gly Val

290 295 300

Ser Ala Met Thr Leu Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn

305 310 315 320

Lys Tyr Trp Gly His Gly Gly Ser Asp Asp Asp Met Ser Tyr Arg Leu

325 330 335

Lys Lys Ile Asn Tyr His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg

340 345 350

Tyr Ala Met Leu Asp His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr

355 360 365

Gln Leu Leu Ser Gln Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser

370 375 380

Thr Leu Glu Tyr Glu Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr

385 390 395 400

His Ile Leu Val Asn Ile Asp Glu Arg Ser

405 410

<210> 60

<211> 410

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 60

Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro

1 5 10 15

Arg Gly Ser His Met Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu

20 25 30

Tyr Asn Ala Thr Gln Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala

35 40 45

Asn Trp Pro Lys Lys Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu

50 55 60

Tyr Ser Ile Lys Asn Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser

65 70 75 80

Val Val His Pro Pro Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp

85 90 95

Lys Asn Met Thr Ile Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr

100 105 110

Pro Leu Leu Ile Thr Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr

115 120 125

Thr Glu Asp Gly Val Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu

130 135 140

Cys Asp Ser Met Pro Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr

145 150 155 160

Glu Leu Glu Leu Glu Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp

165 170 175

Gly Gly Arg Tyr Ser Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala

180 185 190

Ile Ile Val Pro Tyr Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu

195 200 205

Asn His Met His Pro Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile

210 215 220

Phe Ile Val Glu Gln Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu

225 230 235 240

Met Asn Val Gly Phe Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp

245 250 255

Gln Cys Phe Val Phe His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg

260 265 270

Asn Leu Tyr Ser Cys Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile

275 280 285

Asp Lys Leu His Phe Lys Leu Pro Tyr Glu Asp Tyr Phe Gly Gly Val

290 295 300

Ser Ala Met Thr Leu Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn

305 310 315 320

Lys Tyr Trp Gly Trp Gly Gly Glu Asp Asp Asp Met Ser Tyr Arg Leu

325 330 335

Lys Lys Ile Asn Tyr His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg

340 345 350

Tyr Ala Met Leu Asp His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr

355 360 365

Gln Leu Leu Ser Gln Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser

370 375 380

Thr Leu Glu Tyr Glu Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr

385 390 395 400

His Ile Leu Val Asn Ile Asp Glu Arg Ser

405 410

<210> 61

<211> 410

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 61

Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro

1 5 10 15

Arg Gly Ser His Met Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu

20 25 30

Tyr Asn Ala Thr Gln Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala

35 40 45

Asn Trp Pro Lys Lys Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu

50 55 60

Tyr Ser Ile Lys Asn Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser

65 70 75 80

Val Val His Pro Pro Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp

85 90 95

Lys Asn Met Thr Ile Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr

100 105 110

Pro Leu Leu Ile Thr Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr

115 120 125

Thr Glu Asp Gly Val Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu

130 135 140

Cys Asp Ser Met Pro Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr

145 150 155 160

Glu Leu Glu Leu Glu Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp

165 170 175

Gly Gly Arg Tyr Ser Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala

180 185 190

Ile Ile Val Pro Tyr Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu

195 200 205

Asn His Met His Pro Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile

210 215 220

Phe Ile Val Glu Gln Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu

225 230 235 240

Met Asn Val Gly Phe Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp

245 250 255

Gln Cys Phe Val Phe His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg

260 265 270

Asn Leu Tyr Ser Cys Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile

275 280 285

Asp Lys Leu His Phe Lys Leu Pro Tyr Glu Asp Tyr Phe Gly Gly Val

290 295 300

Ser Ala Met Thr Leu Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn

305 310 315 320

Lys Tyr Trp Gly Phe Gly Gly Glu Asp Asp Asp Met Ser Tyr Arg Leu

325 330 335

Lys Lys Ile Asn Tyr His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg

340 345 350

Tyr Ala Met Leu Asp His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr

355 360 365

Gln Leu Leu Ser Gln Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser

370 375 380

Thr Leu Glu Tyr Glu Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr

385 390 395 400

His Ile Leu Val Asn Ile Asp Glu Arg Ser

405 410

<210> 62

<211> 410

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 62

Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro

1 5 10 15

Arg Gly Ser His Met Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu

20 25 30

Tyr Asn Ala Thr Gln Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala

35 40 45

Asn Trp Pro Lys Lys Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu

50 55 60

Tyr Ser Ile Lys Asn Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser

65 70 75 80

Val Val His Pro Pro Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp

85 90 95

Lys Asn Met Thr Ile Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr

100 105 110

Pro Leu Leu Ile Thr Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr

115 120 125

Thr Glu Asp Gly Val Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu

130 135 140

Cys Asp Ser Met Pro Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr

145 150 155 160

Glu Leu Glu Leu Glu Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp

165 170 175

Gly Gly Arg Tyr Ser Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala

180 185 190

Ile Ile Val Pro Tyr Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu

195 200 205

Asn His Met His Pro Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile

210 215 220

Phe Ile Val Glu Gln Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu

225 230 235 240

Met Asn Val Gly Phe Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp

245 250 255

Gln Cys Phe Val Phe His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg

260 265 270

Asn Leu Tyr Ser Cys Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile

275 280 285

Asp Lys Leu His Phe Lys Leu Pro Tyr Glu Asp Tyr Phe Gly Gly Val

290 295 300

Ser Ala Met Thr Leu Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn

305 310 315 320

Lys Tyr Trp Gly His Gly Gly Glu Asp Asp Asp Met Ser Tyr Arg Leu

325 330 335

Lys Lys Ile Asn Tyr His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg

340 345 350

Tyr Ala Met Leu Asp His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr

355 360 365

Gln Leu Leu Ser Gln Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser

370 375 380

Thr Leu Glu Tyr Glu Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr

385 390 395 400

His Ile Leu Val Asn Ile Asp Glu Arg Ser

405 410

<210> 63

<211> 409

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 63

Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro Arg

1 5 10 15

Gly Ser His Met Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu Tyr

20 25 30

Asn Ala Thr Gln Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala Asn

35 40 45

Trp Pro Lys Lys Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu Tyr

50 55 60

Ser Ile Lys Asn Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser Val

65 70 75 80

Val His Pro Pro Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp Lys

85 90 95

Asn Met Thr Ile Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr Pro

100 105 110

Leu Leu Ile Thr Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr Thr

115 120 125

Glu Asp Gly Val Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu Cys

130 135 140

Asp Ser Met Pro Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr Glu

145 150 155 160

Leu Glu Leu Glu Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp Gly

165 170 175

Gly Arg Tyr Ser Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala Ile

180 185 190

Ile Val Pro Tyr Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu Asn

195 200 205

His Met His Pro Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile Phe

210 215 220

Ile Val Glu Gln Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu Met

225 230 235 240

Asn Val Gly Phe Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp Gln

245 250 255

Cys Phe Val Phe His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg Asn

260 265 270

Leu Tyr Ser Cys Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile Asp

275 280 285

Lys Leu His Phe Lys Leu Pro Tyr Glu Asp Tyr Phe Gly Gly Val Ser

290 295 300

Ala Met Thr Leu Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn Lys

305 310 315 320

Tyr Trp Gly Val Gly Gly Glu Asp Asp Asp Met Ser Tyr Arg Leu Lys

325 330 335

Lys Ile Asn Tyr His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg Tyr

340 345 350

Ala Met Leu Asp His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr Gln

355 360 365

Leu Leu Ser Gln Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser Thr

370 375 380

Leu Glu Tyr Glu Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr His

385 390 395 400

Ile Leu Val Asn Ile Asp Glu Arg Ser

405

<210> 64

<211> 410

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 64

Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro

1 5 10 15

Arg Gly Ser His Met Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu

20 25 30

Tyr Asn Ala Thr Gln Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala

35 40 45

Asn Trp Pro Lys Lys Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu

50 55 60

Tyr Ser Ile Lys Asn Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser

65 70 75 80

Val Val His Pro Pro Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp

85 90 95

Lys Asn Met Thr Ile Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr

100 105 110

Pro Leu Leu Ile Thr Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr

115 120 125

Thr Glu Asp Gly Val Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu

130 135 140

Cys Asp Ser Met Pro Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr

145 150 155 160

Glu Leu Glu Leu Glu Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp

165 170 175

Gly Gly Arg Tyr Ser Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala

180 185 190

Ile Ile Val Pro Tyr Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu

195 200 205

Asn His Met His Pro Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile

210 215 220

Phe Ile Val Glu Gln Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu

225 230 235 240

Met Asn Val Gly Phe Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp

245 250 255

Gln Cys Phe Val Phe His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg

260 265 270

Asn Leu Tyr Ser Cys Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile

275 280 285

Asp Lys Leu His Phe Lys Leu Pro Tyr Glu Asp Tyr Phe Gly Gly Val

290 295 300

Ser Ala Met Thr Leu Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn

305 310 315 320

Lys Tyr Trp Gly Trp Gly Gly Ala Asp Asp Asp Met Ser Tyr Arg Leu

325 330 335

Lys Lys Ile Asn Tyr His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg

340 345 350

Tyr Ala Met Leu Asp His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr

355 360 365

Gln Leu Leu Ser Gln Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser

370 375 380

Thr Leu Glu Tyr Glu Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr

385 390 395 400

His Ile Leu Val Asn Ile Asp Glu Arg Ser

405 410

<210> 65

<211> 410

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 65

Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro

1 5 10 15

Arg Gly Ser His Met Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu

20 25 30

Tyr Asn Ala Thr Gln Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala

35 40 45

Asn Trp Pro Lys Lys Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu

50 55 60

Tyr Ser Ile Lys Asn Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser

65 70 75 80

Val Val His Pro Pro Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp

85 90 95

Lys Asn Met Thr Ile Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr

100 105 110

Pro Leu Leu Ile Thr Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr

115 120 125

Thr Glu Asp Gly Val Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu

130 135 140

Cys Asp Ser Met Pro Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr

145 150 155 160

Glu Leu Glu Leu Glu Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp

165 170 175

Gly Gly Arg Tyr Ser Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala

180 185 190

Ile Ile Val Pro Tyr Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu

195 200 205

Asn His Met His Pro Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile

210 215 220

Phe Ile Val Glu Gln Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu

225 230 235 240

Met Asn Val Gly Phe Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp

245 250 255

Gln Cys Phe Val Phe His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg

260 265 270

Asn Leu Tyr Ser Cys Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile

275 280 285

Asp Lys Leu His Phe Lys Leu Pro Tyr Glu Asp Tyr Phe Gly Gly Val

290 295 300

Ser Ala Met Thr Leu Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn

305 310 315 320

Lys Tyr Trp Gly Trp Gly Gly Gly Asp Asp Asp Met Ser Tyr Arg Leu

325 330 335

Lys Lys Ile Asn Tyr His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg

340 345 350

Tyr Ala Met Leu Asp His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr

355 360 365

Gln Leu Leu Ser Gln Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser

370 375 380

Thr Leu Glu Tyr Glu Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr

385 390 395 400

His Ile Leu Val Asn Ile Asp Glu Arg Ser

405 410

<210> 66

<211> 410

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 66

Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro

1 5 10 15

Arg Gly Ser His Met Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu

20 25 30

Tyr Asn Ala Thr Gln Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala

35 40 45

Asn Trp Pro Lys Lys Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu

50 55 60

Tyr Ser Ile Lys Asn Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser

65 70 75 80

Val Val His Pro Pro Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp

85 90 95

Lys Asn Met Thr Ile Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr

100 105 110

Pro Leu Leu Ile Thr Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr

115 120 125

Thr Glu Asp Gly Val Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu

130 135 140

Cys Asp Ser Met Pro Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr

145 150 155 160

Glu Leu Glu Leu Glu Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp

165 170 175

Gly Gly Arg Tyr Ser Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala

180 185 190

Ile Ile Val Pro Tyr Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu

195 200 205

Asn His Met His Pro Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile

210 215 220

Phe Ile Val Glu Gln Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu

225 230 235 240

Met Asn Val Gly Phe Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp

245 250 255

Gln Cys Phe Val Phe His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg

260 265 270

Asn Leu Tyr Ser Cys Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile

275 280 285

Asp Lys Leu His Phe Lys Leu Pro Tyr Glu Asp Tyr Phe Gly Gly Val

290 295 300

Ser Ala Met Thr Leu Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn

305 310 315 320

Lys Tyr Trp Gly Trp Gly Gly Asp Asp Asp Asp Met Ser Tyr Arg Leu

325 330 335

Lys Lys Ile Asn Tyr His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg

340 345 350

Tyr Ala Met Leu Asp His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr

355 360 365

Gln Leu Leu Ser Gln Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser

370 375 380

Thr Leu Glu Tyr Glu Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr

385 390 395 400

His Ile Leu Val Asn Ile Asp Glu Arg Ser

405 410

<210> 67

<211> 410

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 67

Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro

1 5 10 15

Arg Gly Ser His Met Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu

20 25 30

Tyr Asn Ala Thr Gln Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala

35 40 45

Asn Trp Pro Lys Lys Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu

50 55 60

Tyr Ser Ile Lys Asn Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser

65 70 75 80

Val Val His Pro Pro Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp

85 90 95

Lys Asn Met Thr Ile Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr

100 105 110

Pro Leu Leu Ile Thr Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr

115 120 125

Thr Glu Asp Gly Val Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu

130 135 140

Cys Asp Ser Met Pro Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr

145 150 155 160

Glu Leu Glu Leu Glu Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp

165 170 175

Gly Gly Arg Tyr Ser Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala

180 185 190

Ile Ile Val Pro Tyr Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu

195 200 205

Asn His Met His Pro Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile

210 215 220

Phe Ile Val Glu Gln Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu

225 230 235 240

Met Asn Val Gly Phe Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp

245 250 255

Gln Cys Phe Val Phe His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg

260 265 270

Asn Leu Tyr Ser Cys Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile

275 280 285

Asp Lys Leu His Phe Lys Leu Pro Tyr Glu Asp Tyr Phe Gly Gly Val

290 295 300

Ser Ala Met Thr Leu Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn

305 310 315 320

Lys Tyr Trp Gly Trp Gly Gly Ser Asp Asp Asp Met Ser Tyr Arg Leu

325 330 335

Lys Lys Ile Asn Tyr His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg

340 345 350

Tyr Ala Met Leu Asp His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr

355 360 365

Gln Leu Leu Ser Gln Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser

370 375 380

Thr Leu Glu Tyr Glu Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr

385 390 395 400

His Ile Leu Val Asn Ile Asp Glu Arg Ser

405 410

<210> 68

<211> 410

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 68

Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro

1 5 10 15

Arg Gly Ser His Met Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu

20 25 30

Tyr Asn Ala Thr Gln Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala

35 40 45

Asn Trp Pro Lys Lys Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu

50 55 60

Tyr Ser Ile Lys Asn Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser

65 70 75 80

Val Val His Pro Pro Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp

85 90 95

Lys Asn Met Thr Ile Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr

100 105 110

Pro Leu Leu Ile Thr Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr

115 120 125

Thr Glu Asp Gly Val Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu

130 135 140

Cys Asp Ser Met Pro Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr

145 150 155 160

Glu Leu Glu Leu Glu Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp

165 170 175

Gly Gly Arg Tyr Ser Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala

180 185 190

Ile Ile Val Pro Tyr Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu

195 200 205

Asn His Met His Pro Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile

210 215 220

Phe Ile Val Glu Gln Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu

225 230 235 240

Met Asn Val Gly Phe Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp

245 250 255

Gln Cys Phe Val Phe His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg

260 265 270

Asn Leu Tyr Ser Cys Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile

275 280 285

Asp Lys Leu His Phe Lys Leu Pro Tyr Glu Asp Tyr Phe Gly Gly Val

290 295 300

Ser Ala Met Thr Leu Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn

305 310 315 320

Lys Tyr Trp Gly His Gly Gly Ala Asp Asp Asp Met Ser Tyr Arg Leu

325 330 335

Lys Lys Ile Asn Tyr His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg

340 345 350

Tyr Ala Met Leu Asp His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr

355 360 365

Gln Leu Leu Ser Gln Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser

370 375 380

Thr Leu Glu Tyr Glu Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr

385 390 395 400

His Ile Leu Val Asn Ile Asp Glu Arg Ser

405 410

<210> 69

<211> 410

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 69

Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro

1 5 10 15

Arg Gly Ser His Met Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu

20 25 30

Tyr Asn Ala Thr Gln Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala

35 40 45

Asn Trp Pro Lys Lys Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu

50 55 60

Tyr Ser Ile Lys Asn Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser

65 70 75 80

Val Val His Pro Pro Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp

85 90 95

Lys Asn Met Thr Ile Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr

100 105 110

Pro Leu Leu Ile Thr Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr

115 120 125

Thr Glu Asp Gly Val Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu

130 135 140

Cys Asp Ser Met Pro Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr

145 150 155 160

Glu Leu Glu Leu Glu Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp

165 170 175

Gly Gly Arg Tyr Ser Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala

180 185 190

Ile Ile Val Pro Tyr Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu

195 200 205

Asn His Met His Pro Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile

210 215 220

Phe Ile Val Glu Gln Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu

225 230 235 240

Met Asn Val Gly Phe Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp

245 250 255

Gln Cys Phe Val Phe His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg

260 265 270

Asn Leu Tyr Ser Cys Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile

275 280 285

Asp Lys Leu His Phe Lys Leu Pro Tyr Glu Asp Tyr Phe Gly Gly Val

290 295 300

Ser Ala Met Thr Leu Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn

305 310 315 320

Lys Tyr Trp Gly His Gly Gly Asp Asp Asp Asp Met Ser Tyr Arg Leu

325 330 335

Lys Lys Ile Asn Tyr His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg

340 345 350

Tyr Ala Met Leu Asp His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr

355 360 365

Gln Leu Leu Ser Gln Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser

370 375 380

Thr Leu Glu Tyr Glu Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr

385 390 395 400

His Ile Leu Val Asn Ile Asp Glu Arg Ser

405 410

<210> 70

<211> 410

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 70

Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro

1 5 10 15

Arg Gly Ser His Met Ser Pro Leu Arg Thr Tyr Leu Tyr Thr Pro Leu

20 25 30

Tyr Asn Ala Thr Gln Pro Thr Leu Arg Asn Val Glu Arg Leu Ala Ala

35 40 45

Asn Trp Pro Lys Lys Ile Pro Ser Asn Tyr Ile Glu Asp Ser Glu Glu

50 55 60

Tyr Ser Ile Lys Asn Ile Ser Leu Ser Asn His Thr Thr Arg Ala Ser

65 70 75 80

Val Val His Pro Pro Ser Ser Ile Thr Glu Thr Ala Ser Lys Leu Asp

85 90 95

Lys Asn Met Thr Ile Gln Asp Gly Ala Phe Ala Met Ile Ser Pro Thr

100 105 110

Pro Leu Leu Ile Thr Lys Leu Met Asp Ser Ile Lys Ser Tyr Val Thr

115 120 125

Thr Glu Asp Gly Val Lys Lys Ala Glu Ala Val Val Thr Leu Pro Leu

130 135 140

Cys Asp Ser Met Pro Pro Asp Leu Gly Pro Ile Thr Leu Asn Lys Thr

145 150 155 160

Glu Leu Glu Leu Glu Trp Val Glu Lys Lys Phe Pro Glu Val Glu Trp

165 170 175

Gly Gly Arg Tyr Ser Pro Pro Asn Cys Thr Ala Arg His Arg Val Ala

180 185 190

Ile Ile Val Pro Tyr Arg Asp Arg Gln Gln His Leu Ala Ile Phe Leu

195 200 205

Asn His Met His Pro Phe Leu Met Lys Gln Gln Ile Glu Tyr Gly Ile

210 215 220

Phe Ile Val Glu Gln Glu Gly Asn Lys Asp Phe Asn Arg Ala Lys Leu

225 230 235 240

Met Asn Val Gly Phe Val Glu Ser Gln Lys Leu Val Ala Glu Gly Trp

245 250 255

Gln Cys Phe Val Phe His Asp Ile Asp Leu Leu Pro Leu Asp Thr Arg

260 265 270

Asn Leu Tyr Ser Cys Pro Arg Gln Pro Arg His Met Ser Ala Ser Ile

275 280 285

Asp Lys Leu His Phe Lys Leu Pro Tyr Glu Asp Tyr Phe Gly Gly Val

290 295 300

Ser Ala Met Thr Leu Glu Gln Phe Thr Arg Val Asn Gly Phe Ser Asn

305 310 315 320

Lys Tyr Trp Gly His Gly Gly Ser Asp Asp Asp Met Ser Tyr Arg Leu

325 330 335

Lys Lys Ile Asn Tyr His Ile Ala Arg Tyr Lys Met Ser Ile Ala Arg

340 345 350

Tyr Ala Met Leu Asp His Lys Lys Ser Thr Pro Asn Pro Lys Arg Tyr

355 360 365

Gln Leu Leu Ser Gln Thr Ser Lys Thr Phe Gln Lys Asp Gly Leu Ser

370 375 380

Thr Leu Glu Tyr Glu Leu Val Gln Val Val Gln Tyr His Leu Tyr Thr

385 390 395 400

His Ile Leu Val Asn Ile Asp Glu Arg Ser

405 410

<210> 71

<211> 375

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 71

Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro

1 5 10 15

Arg Gly Ser His Met Asp Tyr Ser Phe Trp Ser Pro Ala Phe Ile Ile

20 25 30

Ser Ala Pro Lys Thr Leu Thr Thr Leu Gln Pro Phe Ser Gln Ser Thr

35 40 45

Ser Thr Asn Asp Leu Ala Val Ser Ala Leu Glu Ser Val Glu Phe Ser

50 55 60

Met Leu Asp Asn Ser Ser Ile Leu His Ala Ser Asp Asn Trp Thr Asn

65 70 75 80

Asp Glu Leu Val Met Arg Ala Gln Asn Glu Asn Leu Gln Leu Cys Pro

85 90 95

Met Thr Pro Pro Ala Leu Val Gly Pro Ile Lys Val Trp Met Asp Ala

100 105 110

Pro Ser Phe Ala Glu Leu Glu Arg Leu Tyr Pro Phe Leu Glu Pro Gly

115 120 125

Gly His Gly Met Pro Thr Ala Cys Arg Ala Arg His Arg Val Ala Ile

130 135 140

Val Val Pro Tyr Arg Asp Arg Glu Ser His Leu Arg Thr Phe Leu His

145 150 155 160

Asn Leu His Ser Leu Leu Thr Lys Gln Gln Leu Asp Tyr Ala Ile Phe

165 170 175

Val Val Glu Gln Thr Ala Asn Glu Thr Phe Asn Arg Ala Lys Leu Met

180 185 190

Asn Val Gly Tyr Ala Glu Ala Ile Arg Leu Tyr Asp Trp Arg Cys Phe

195 200 205

Ile Phe His Asp Val Asp Leu Leu Pro Glu Asp Asp Arg Asn Leu Tyr

210 215 220

Ser Cys Pro Asp Glu Pro Arg His Met Ser Val Ala Val Asp Lys Phe

225 230 235 240

Asn Tyr Lys Leu Pro Tyr Gly Ser Ile Phe Gly Gly Ile Ser Ala Leu

245 250 255

Thr Arg Glu Gln Phe Glu Gly Ile Asn Gly Phe Ser Asn Asp Tyr Trp

260 265 270

Gly Trp Gly Gly Glu Asp Asp Asp Leu Ser Thr Arg Val Thr Leu Ala

275 280 285

Gly Tyr Lys Ile Ser Arg Tyr Pro Ala Glu Ile Ala Arg Tyr Lys Met

290 295 300

Ile Lys His Asn Ser Glu Lys Lys Asn Pro Val Asn Arg Cys Arg Tyr

305 310 315 320

Lys Leu Met Ser Ala Thr Lys Ser Arg Trp Arg Asn Asp Gly Leu Ser

325 330 335

Ser Leu Ser Tyr Asp Leu Ile Ser Leu Gly Arg Leu Pro Leu Tyr Thr

340 345 350

His Ile Lys Val Asp Leu Leu Glu Lys Gln Ser Arg Arg Tyr Leu Arg

355 360 365

Thr His Gly Phe Pro Thr Cys

370 375

<210> 72

<211> 375

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 72

Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro

1 5 10 15

Arg Gly Ser His Met Asp Tyr Ser Phe Trp Ser Pro Ala Phe Ile Ile

20 25 30

Ser Ala Pro Lys Thr Leu Thr Thr Leu Gln Pro Phe Ser Gln Ser Thr

35 40 45

Ser Thr Asn Asp Leu Ala Val Ser Ala Leu Glu Ser Val Glu Phe Ser

50 55 60

Met Leu Asp Asn Ser Ser Ile Leu His Ala Ser Asp Asn Trp Thr Asn

65 70 75 80

Asp Glu Leu Val Met Arg Ala Gln Asn Glu Asn Leu Gln Leu Cys Pro

85 90 95

Met Thr Pro Pro Ala Leu Val Gly Pro Ile Lys Val Trp Met Asp Ala

100 105 110

Pro Ser Phe Ala Glu Leu Glu Arg Leu Tyr Pro Phe Leu Glu Pro Gly

115 120 125

Gly His Gly Met Pro Thr Ala Cys Arg Ala Arg His Arg Val Ala Ile

130 135 140

Val Val Pro Tyr Arg Asp Arg Glu Ser His Leu Arg Thr Phe Leu His

145 150 155 160

Asn Leu His Ser Leu Leu Thr Lys Gln Gln Leu Asp Tyr Ala Ile Phe

165 170 175

Val Val Glu Gln Thr Ala Asn Glu Thr Phe Asn Arg Ala Lys Leu Met

180 185 190

Asn Val Gly Tyr Ala Glu Ala Ile Arg Leu Tyr Asp Trp Arg Cys Phe

195 200 205

Ile Phe His Asp Val Asp Leu Leu Pro Glu Asp Asp Arg Asn Leu Tyr

210 215 220

Ser Cys Pro Asp Glu Pro Arg His Met Ser Val Ala Val Asp Lys Phe

225 230 235 240

Asn Tyr Lys Leu Pro Tyr Gly Ser Ile Phe Gly Gly Ile Ser Ala Leu

245 250 255

Thr Arg Glu Gln Phe Glu Gly Ile Asn Gly Phe Ser Asn Asp Tyr Trp

260 265 270

Gly His Gly Gly Glu Asp Asp Asp Leu Ser Thr Arg Val Thr Leu Ala

275 280 285

Gly Tyr Lys Ile Ser Arg Tyr Pro Ala Glu Ile Ala Arg Tyr Lys Met

290 295 300

Ile Lys His Asn Ser Glu Lys Lys Asn Pro Val Asn Arg Cys Arg Tyr

305 310 315 320

Lys Leu Met Ser Ala Thr Lys Ser Arg Trp Arg Asn Asp Gly Leu Ser

325 330 335

Ser Leu Ser Tyr Asp Leu Ile Ser Leu Gly Arg Leu Pro Leu Tyr Thr

340 345 350

His Ile Lys Val Asp Leu Leu Glu Lys Gln Ser Arg Arg Tyr Leu Arg

355 360 365

Thr His Gly Phe Pro Thr Cys

370 375

<210> 73

<211> 375

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 73

Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro

1 5 10 15

Arg Gly Ser His Met Asp Tyr Ser Phe Trp Ser Pro Ala Phe Ile Ile

20 25 30

Ser Ala Pro Lys Thr Leu Thr Thr Leu Gln Pro Phe Ser Gln Ser Thr

35 40 45

Ser Thr Asn Asp Leu Ala Val Ser Ala Leu Glu Ser Val Glu Phe Ser

50 55 60

Met Leu Asp Asn Ser Ser Ile Leu His Ala Ser Asp Asn Trp Thr Asn

65 70 75 80

Asp Glu Leu Val Met Arg Ala Gln Asn Glu Asn Leu Gln Leu Cys Pro

85 90 95

Met Thr Pro Pro Ala Leu Val Gly Pro Ile Lys Val Trp Met Asp Ala

100 105 110

Pro Ser Phe Ala Glu Leu Glu Arg Leu Tyr Pro Phe Leu Glu Pro Gly

115 120 125

Gly His Gly Met Pro Thr Ala Cys Arg Ala Arg His Arg Val Ala Ile

130 135 140

Val Val Pro Tyr Arg Asp Arg Glu Ser His Leu Arg Thr Phe Leu His

145 150 155 160

Asn Leu His Ser Leu Leu Thr Lys Gln Gln Leu Asp Tyr Ala Ile Phe

165 170 175

Val Val Glu Gln Thr Ala Asn Glu Thr Phe Asn Arg Ala Lys Leu Met

180 185 190

Asn Val Gly Tyr Ala Glu Ala Ile Arg Leu Tyr Asp Trp Arg Cys Phe

195 200 205

Ile Phe His Asp Val Asp Leu Leu Pro Glu Asp Asp Arg Asn Leu Tyr

210 215 220

Ser Cys Pro Asp Glu Pro Arg His Met Ser Val Ala Val Asp Lys Phe

225 230 235 240

Asn Tyr Lys Leu Pro Tyr Gly Ser Ile Phe Gly Gly Ile Ser Ala Leu

245 250 255

Thr Arg Glu Gln Phe Glu Gly Ile Asn Gly Phe Ser Asn Asp Tyr Trp

260 265 270

Gly Trp Gly Gly Asp Asp Asp Asp Leu Ser Thr Arg Val Thr Leu Ala

275 280 285

Gly Tyr Lys Ile Ser Arg Tyr Pro Ala Glu Ile Ala Arg Tyr Lys Met

290 295 300

Ile Lys His Asn Ser Glu Lys Lys Asn Pro Val Asn Arg Cys Arg Tyr

305 310 315 320

Lys Leu Met Ser Ala Thr Lys Ser Arg Trp Arg Asn Asp Gly Leu Ser

325 330 335

Ser Leu Ser Tyr Asp Leu Ile Ser Leu Gly Arg Leu Pro Leu Tyr Thr

340 345 350

His Ile Lys Val Asp Leu Leu Glu Lys Gln Ser Arg Arg Tyr Leu Arg

355 360 365

Thr His Gly Phe Pro Thr Cys

370 375

<210> 74

<211> 375

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 74

Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro

1 5 10 15

Arg Gly Ser His Met Asp Tyr Ser Phe Trp Ser Pro Ala Phe Ile Ile

20 25 30

Ser Ala Pro Lys Thr Leu Thr Thr Leu Gln Pro Phe Ser Gln Ser Thr

35 40 45

Ser Thr Asn Asp Leu Ala Val Ser Ala Leu Glu Ser Val Glu Phe Ser

50 55 60

Met Leu Asp Asn Ser Ser Ile Leu His Ala Ser Asp Asn Trp Thr Asn

65 70 75 80

Asp Glu Leu Val Met Arg Ala Gln Asn Glu Asn Leu Gln Leu Cys Pro

85 90 95

Met Thr Pro Pro Ala Leu Val Gly Pro Ile Lys Val Trp Met Asp Ala

100 105 110

Pro Ser Phe Ala Glu Leu Glu Arg Leu Tyr Pro Phe Leu Glu Pro Gly

115 120 125

Gly His Gly Met Pro Thr Ala Cys Arg Ala Arg His Arg Val Ala Ile

130 135 140

Val Val Pro Tyr Arg Asp Arg Glu Ser His Leu Arg Thr Phe Leu His

145 150 155 160

Asn Leu His Ser Leu Leu Thr Lys Gln Gln Leu Asp Tyr Ala Ile Phe

165 170 175

Val Val Glu Gln Thr Ala Asn Glu Thr Phe Asn Arg Ala Lys Leu Met

180 185 190

Asn Val Gly Tyr Ala Glu Ala Ile Arg Leu Tyr Asp Trp Arg Cys Phe

195 200 205

Ile Phe His Asp Val Asp Leu Leu Pro Glu Asp Asp Arg Asn Leu Tyr

210 215 220

Ser Cys Pro Asp Glu Pro Arg His Met Ser Val Ala Val Asp Lys Phe

225 230 235 240

Asn Tyr Lys Leu Pro Tyr Gly Ser Tyr Phe Gly Gly Ile Ser Ala Leu

245 250 255

Thr Arg Glu Gln Phe Glu Gly Ile Asn Gly Phe Ser Asn Asp Tyr Trp

260 265 270

Gly Trp Gly Gly Glu Asp Asp Asp Leu Ser Thr Arg Val Thr Leu Ala

275 280 285

Gly Tyr Lys Ile Ser Arg Tyr Pro Ala Glu Ile Ala Arg Tyr Lys Met

290 295 300

Ile Lys His Asn Ser Glu Lys Lys Asn Pro Val Asn Arg Cys Arg Tyr

305 310 315 320

Lys Leu Met Ser Ala Thr Lys Ser Arg Trp Arg Asn Asp Gly Leu Ser

325 330 335

Ser Leu Ser Tyr Asp Leu Ile Ser Leu Gly Arg Leu Pro Leu Tyr Thr

340 345 350

His Ile Lys Val Asp Leu Leu Glu Lys Gln Ser Arg Arg Tyr Leu Arg

355 360 365

Thr His Gly Phe Pro Thr Cys

370 375

<210> 75

<211> 1173

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 75

atgtcaccgc tgcgtaccta cctgtatacc ccgctgtata atgccaccca accgaccctg 60

cgtaatgtgg aacgtctggc tgcgaactgg ccgaagaaaa ttccgagcaa ctatatcgaa 120

gattcagaag aatactcgat caaaaacatc agtctgtcca atcataccac gcgtgcgagt 180

gtggttcacc cgccgagctc tatcaccgaa acggcctcca aactggacaa aaatatgacc 240

attcaggatg gcgcgttcgc catgattagc ccgaccccgc tgctgatcac gaaactgatg 300

gacagcatta aatcttatgt caccacggaa gatggcgtga agaaagcgga agctgtcgtt 360

accctgccgc tgtgtgactc catgccgcca gatctgggtc cgattaccct gaacaaaacg 420

gaactggaac tggaatgggt tgagaaaaaa tttccggaag tcgaatgggg cggtcgctat 480

agtccgccga actgtaccgc acgtcatcgc gtggctatta tcgttccgta ccgtgaccgc 540

cagcaacacc tggcaatctt tctgaatcac atgcacccgt tcctgatgaa acagcaaatt 600

gaatacggca tttttatcgt ggaacaggaa ggtaataaag atttcaatcg tgcaaaactg 660

atgaacgttg gctttgtcga atctcagaaa ctggtggctg aaggttggca atgctttgtt 720

ttccatgaca tcgatctgct gccgctggat acccgcaatc tgtatagttg tccgcgccag 780

ccgcgtcaca tgtcagccag catcgacaaa ctgcacttta aactgccgta cgaagatatt 840

ttcggcggtg tctcagccat gaccctggaa caatttacgc gtgttaacgg cttctcgaat 900

aaatattggg gttggggcgg tgaagatgac gatatgagct accgcctgaa gaaaattaac 960

tatcatatcg cccgttacaa aatgagcatt gcgcgctatg ccatgctgga ccacaaaaaa 1020

tctaccccga atccgaaacg ttaccagctg ctgagtcaaa ccagcaaaac gtttcagaaa 1080

gatggtctgt ctacgctgga atatgaactg gtccaagttg tgcagtatca tctgtacacg 1140

catattctgg tgaacattga cgaacgctct tga 1173

<210> 76

<211> 1233

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 76

atgggcagca gccatcatca tcatcatcac agcagcggcc tggtgccgcg cggcagccat 60

atgtcaccgc tgcgtaccta cctgtatacc ccgctgtata atgccaccca accgaccctg 120

cgtaatgtgg aacgtctggc tgcgaactgg ccgaagaaaa ttccgagcaa ctatatcgaa 180

gattcagaag aatactcgat caaaaacatc agtctgtcca atcataccac gcgtgcgagt 240

gtggttcacc cgccgagctc tatcaccgaa acggcctcca aactggacaa aaatatgacc 300

attcaggatg gcgcgttcgc catgattagc ccgaccccgc tgctgatcac gaaactgatg 360

gacagcatta aatcttatgt caccacggaa gatggcgtga agaaagcgga agctgtcgtt 420

accctgccgc tgtgtgactc catgccgcca gatctgggtc cgattaccct gaacaaaacg 480

gaactggaac tggaatgggt tgagaaaaaa tttccggaag tcgaatgggg cggtcgctat 540

agtccgccga actgtaccgc acgtcatcgc gtggctatta tcgttccgta ccgtgaccgc 600

cagcaacacc tggcaatctt tctgaatcac atgcacccgt tcctgatgaa acagcaaatt 660

gaatacggca tttttatcgt ggaacaggaa ggtaataaag atttcaatcg tgcaaaactg 720

atgaacgttg gctttgtcga atctcagaaa ctggtggctg aaggttggca atgctttgtt 780

ttccatgaca tcgatctgct gccgctggat acccgcaatc tgtatagttg tccgcgccag 840

ccgcgtcaca tgtcagccag catcgacaaa ctgcacttta aactgccgta cgaagatatt 900

ttcggcggtg tctcagccat gaccctggaa caatttacgc gtgttaacgg cttctcgaat 960

aaatattggg gttggggcgg tgaagatgac gatatgagct accgcctgaa gaaaattaac 1020

tatcatatcg cccgttacaa aatgagcatt gcgcgctatg ccatgctgga ccacaaaaaa 1080

tctaccccga atccgaaacg ttaccagctg ctgagtcaaa ccagcaaaac gtttcagaaa 1140

gatggtctgt ctacgctgga atatgaactg gtccaagttg tgcagtatca tctgtacacg 1200

catattctgg tgaacattga cgaacgctct tga 1233

<210> 77

<211> 1068

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 77

atggattact cattctggag cccggcgttc atcatctctg ccccgaaaac cctgaccacc 60

ctgcaaccgt tctctcagtc tacctctacc aacgacctgg cagtctcagc tctggaatcg 120

gtggaattta gcatgctgga taatagctct attctgcatg cgtctgacaa ctggaccaat 180

gatgaactgg tgatgcgcgc ccagaacgaa aatctgcaac tgtgtccgat gacgccgccg 240

gcgctggttg gcccgatcaa agtttggatg gatgcgccga gctttgccga actggaacgt 300

ctgtatccgt tcctggaacc gggcggtcat ggtatgccga ccgcctgtcg tgcacgtcac 360

cgtgttgcca ttgtggttcc gtatcgcgac cgtgaatccc acctgcgcac cttcctgcat 420

aacctgcact cactgctgac gaaacagcaa ctggattacg caatctttgt cgtggaacag 480

accgcaaacg aaacgttcaa tcgtgctaaa ctgatgaatg ttggctatgc ggaagccatt 540

cgcctgtacg attggcgttg ctttatcttc catgacgtcg atctgctgcc ggaagatgac 600

cgcaacctgt attcttgtcc ggacgaaccg cgtcacatga gtgttgcagt cgataaattc 660

aactacaaac tgccgtacgg ttcgattttc ggcggtatca gcgctctgac ccgcgaacaa 720

tttgaaggca ttaacggttt cagcaatgat tactggggct ggggcggtga agatgacgat 780

ctgtcgaccc gtgtgacgct ggcgggttat aaaatcagcc gctacccggc agaaatcgct 840

cgttacaaaa tgatcaaaca taacagtgaa aagaaaaacc cggttaatcg ctgccgttac 900

aaactgatgt ctgccaccaa aagtcgctgg cgtaatgacg gcctgagttc cctgtcctat 960

gatctgattt cactgggtcg cctgccgctg tacacgcaca tcaaagttga cctgctggaa 1020

aaacaatctc gccgctatct gcgtacccac ggcttcccga cctgctga 1068

<210> 78

<211> 1128

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 78

atgggcagca gccatcatca tcatcatcac agcagcggcc tggtgccgcg cggcagccat 60

atggattact cattctggag cccggcgttc atcatctctg ccccgaaaac cctgaccacc 120

ctgcaaccgt tctctcagtc tacctctacc aacgacctgg cagtctcagc tctggaatcg 180

gtggaattta gcatgctgga taatagctct attctgcatg cgtctgacaa ctggaccaat 240

gatgaactgg tgatgcgcgc ccagaacgaa aatctgcaac tgtgtccgat gacgccgccg 300

gcgctggttg gcccgatcaa agtttggatg gatgcgccga gctttgccga actggaacgt 360

ctgtatccgt tcctggaacc gggcggtcat ggtatgccga ccgcctgtcg tgcacgtcac 420

cgtgttgcca ttgtggttcc gtatcgcgac cgtgaatccc acctgcgcac cttcctgcat 480

aacctgcact cactgctgac gaaacagcaa ctggattacg caatctttgt cgtggaacag 540

accgcaaacg aaacgttcaa tcgtgctaaa ctgatgaatg ttggctatgc ggaagccatt 600

cgcctgtacg attggcgttg ctttatcttc catgacgtcg atctgctgcc ggaagatgac 660

cgcaacctgt attcttgtcc ggacgaaccg cgtcacatga gtgttgcagt cgataaattc 720

aactacaaac tgccgtacgg ttcgattttc ggcggtatca gcgctctgac ccgcgaacaa 780

tttgaaggca ttaacggttt cagcaatgat tactggggct ggggcggtga agatgacgat 840

ctgtcgaccc gtgtgacgct ggcgggttat aaaatcagcc gctacccggc agaaatcgct 900

cgttacaaaa tgatcaaaca taacagtgaa aagaaaaacc cggttaatcg ctgccgttac 960

aaactgatgt ctgccaccaa aagtcgctgg cgtaatgacg gcctgagttc cctgtcctat 1020

gatctgattt cactgggtcg cctgccgctg tacacgcaca tcaaagttga cctgctggaa 1080

aaacaatctc gccgctatct gcgtacccac ggcttcccga cctgctga 1128

<210> 79

<211> 43

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 79

ctcgaataaa tattggggtt ttggcggtga agatgacgat atg 43

<210> 80

<211> 43

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 80

catatcgtca tcttcaccgc caaaacccca atatttattc gag 43

<210> 81

<211> 36

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 81

cgaataaata ttggggtcac ggcggtgaag atgacg 36

<210> 82

<211> 36

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 82

cgtcatcttc accgccgtga ccccaatatt tattcg 36

<210> 83

<211> 36

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 83

cgaataaata ttggggtgtg ggcggtgaag atgacg 36

<210> 84

<211> 36

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 84

cgtcatcttc accgcccaca ccccaatatt tattcg 36

<210> 85

<211> 31

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 85

gggttggggc ggtgcggatg acgatatgag c 31

<210> 86

<211> 31

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 86

gctcatatcg tcatccgcac cgccccaacc c 31

<210> 87

<211> 30

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 87

gggttggggc ggtggagatg acgatatgag 30

<210> 88

<211> 30

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 88

ctcatatcgt catctccacc gccccaaccc 30

<210> 89

<211> 31

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 89

gggttggggc ggtgatgatg acgatatgag c 31

<210> 90

<211> 31

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 90

gctcatatcg tcatcatcac cgccccaacc c 31

<210> 91

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 91

gccgtacgaa gattatttcg gcggtgtctc ag 32

<210> 92

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 92

ctgagacacc gccgaaataa tcttcgtacg gc 32

Claims

1.修饰糖蛋白的方法，所述方法包括以下步骤：在糖基转移酶的存在下，使包含含有末端GlcNAc部分的聚糖的糖蛋白与糖衍生物核苷酸Su(A)-Nuc接触，其中：

(ii)所述含有末端GlcNAc部分的聚糖如式(1)或(2)所示：

其中：

b为0或1；

d为0或1；

e为0或1；以及

G为单糖，或包含2至20个糖部分的直链或支链寡糖；以及

(iii)所述糖衍生物核苷酸Su(A)-Nuc如式(3)所示：

其中：

a为0或1；

f为0或1；

g为0或1；

Nuc为核苷酸；

T为C₃-C₁₂(杂)亚芳基，其中(杂)亚芳基被任选地取代；

A选自：

(a)-N₃

(b)-C(O)R³

其中R³为任选取代的C₁-C₂₄烷基；

(c)(杂)环炔基或-(CH₂)_iC≡C-R⁴部分

其中i为0-10且R⁴为氢或任选取代的C₁-C₂₄烷基；

(d)-SH

(e)-SC(O)R⁸

其中R⁸为任选取代的C₁-C₂₄烷基或苯基；

(f)-SC(V)OR⁸

其中V为O或S，R⁸为任选取代的C₁-C₂₄烷基或苯基；

(g)-X

其中X选自F、Cl、Br和I；

(h)-OS(O)₂R⁵

(i)R¹²

(j)R¹³

其中R¹³为任选取代的末端C₃-C₂₄丙二烯基；以及

(k)N(R¹⁷)₂

其中R¹⁷独立地选自H和C₁-C₁₂烷基；

Z为CH₂、CF₂或C(O)；或Z为CHOH，条件是g为0、f为1且a为0或1；

Y选自O、S、N(R¹⁵)、N(R¹⁵)C(O)、N(R¹⁵)C(O)N(R¹⁵)、N(R¹⁵)C(O)O、OC(O)N(R¹⁵)S(O)₂N(R¹⁵)和N(R¹⁵)C(O)N(R¹⁵)S(O)₂O，其中R¹⁵独立地选自H、C₁-C₁₂烷基和(U)_f-(T)_a-A，其中f、a、U、T和A如上文所定义；以及

R¹⁴独立地选自：

其中：

a、f、T、A和U如上文所定义；

h为0或1；以及

W选自O、S、NR¹⁵、NHS(O)₂O和NHS(O)₂NR¹⁵，其中R¹⁵如上文所定义。

2.权利要求1的方法，其中所述β-(1,4)-N-乙酰半乳糖胺转移酶为或衍生自无脊椎动物β-(1,4)-GalNAcT酶。

3.前述权利要求中任一项的方法，其中所述β-(1,4)-N-乙酰半乳糖胺转移酶为或衍生自选自SEQ ID NO:2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、25、26、27、28、29、30、31、32、33、34、46、47、49、50、51、52、53、54、55、56、57、58、59、71、72和73，或选自SEQ ID NO:35、36、37、38、39、40、41、42、43、44、45、48、60、61、62、63、64、65、66、67、68、69、70和74的序列。

4.前述权利要求中任一项的方法，其中所述β-(1,4)-N-乙酰半乳糖胺转移酶与选自SEQ ID NO:2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、25、26、27、28、29、30、31、32、33、34、46、47、49、50、51、52、53、54、55、56、57、58、59、71、72和73，或选自SEQ ID NO：35、36、37、38、39、40、41、42、43、44、45、48、60、61、62、63、64、65、66、67、68、69、70和74的序列具有至少50％的序列同一性。

5.前述权利要求中任一项的方法，其中A选自-N₃、-C(O)CH₃、-SH、-CH＝CH₂和-CH₂C≡CH。

6.前述权利要求中任一项的方法，其中糖衍生物核苷酸Su(A)-Nuc如式(15)、(16)、(17)或(18)所示：

其中Nuc、a、f、R¹⁴、R¹⁵、A、U和T如权利要求1中所定义。

7.前述权利要求中任一项的方法，其中糖衍生物核苷酸Su(A)-Nuc如式(19)、(20)、(21)、(22)、(23)、(24)、(25)、(26)、(65)、(66)、(67)、(68)或(69)所示：

其中：

R¹⁴和R¹⁵如权利要求1中所定义；和

R¹⁶独立地选自H和F。

8.前述权利要求中任一项的方法，其中R¹⁴是-N₃，或R¹⁴选自：

其中a、f、h、T、A、U和W如权利要求1中所定义。

9.权利要求8的方法，其中糖衍生物核苷酸Su(A)-Nuc如式(27)、(28)、(29)、(30)或(31)所示，或如式(36)所示：

其中Nuc如权利要求1中所定义。

10.权利要求1-7中任一项的方法，其中R¹⁴是OH。

11.权利要求10的方法，其中糖衍生物核苷酸Su(A)-Nuc如式(35)所示：

其中Nuc如权利要求1中所定义。

12.前述权利要求中任一项的方法，其中糖衍生物核苷酸Su(A)-Nuc中的核苷酸是UDP。

13.前述权利要求中任一项的方法，其中包含末端GlcNAc部分的聚糖如式(1)、(9)、(10)或(11)所示：

其中b如权利要求1中所定义。

14.前述权利要求中任一项的方法，其中包含含有末端GlcNAc部分的聚糖的糖蛋白如式(7)、(8)或(8b)所示:

其中：

b、d、e和G如权利要求1中所定义；

y独立地为1至24的整数；以及

Pr为蛋白。

15.前述权利要求中任一项的方法，其中所述包含含有末端GlcNAc部分的聚糖的糖蛋白是抗体。

16.通过权利要求1-15中任一项的方法可获得的糖蛋白。

17.权利要求16的糖蛋白，其中所述糖蛋白是抗体。

18.权利要求16或17的糖蛋白，其中R¹⁴是-NHCOMe。

19.如式(75)、(76)或(77)所示的生物缀合物：

其中：

Pr为蛋白；

y独立地为1至24的整数；

CG是将Su连接到Sp或D的连接基团；

Sp是间隔基；

D是靶分子；

j独立地为1、2、3、4或5；

k独立地为1至10的整数；

m为0或1；

Su如式(78)所示：

其中b、d、e、G、R¹⁴、Z、Y、U、T、g、f和a如权利要求1中所定义，Su经由β-(1,4)-O-糖苷键经C1连接至GlcNAc部分的C4，并且经由Z、Y、U或T连接至CG。

20.权利要求19的生物缀合物，其中R¹⁴是-NHCOMe。

21.权利要求19或20的生物缀合物，其中D是细胞毒素。

22.权利要求19-21中任一项的生物缀合物，其是抗体-药物缀合物。

23.β-(1,4)-N-乙酰半乳糖胺转移酶，其与选自SEQ ID NO:10-14和SEQ ID NO:25-74，优选选自SEQ ID NO:10-13、SEQ ID NO:25-48、SEQ ID NO:50-70和SEQ ID NO:72-74的序列具有至少40％的序列同一性。