CN115960981A

CN115960981A - 用为或衍生自β-(1,4)-N-乙酰半乳糖胺转移酶的糖基转移酶修饰糖蛋白的方法

Info

Publication number: CN115960981A
Application number: CN202211121609.5A
Authority: CN
Inventors: S·S·范博凯尔; R·范吉尔; M·A·维基德文; F·L·范代尔夫特
Original assignee: Synaffix BV
Current assignee: Synaffix BV
Priority date: 2015-04-23
Filing date: 2016-04-25
Publication date: 2023-04-14
Also published as: NO3134520T3; US20180245119A1; HRP20180439T1; ES2659816T3; US20230100074A1; WO2016170186A1; DK3134520T3; US20170130256A1; EP3134520A1; CN107810273A; CN107810273B; JP2018518149A; EP3354726A1; EP3134520B1; PL3134520T3; US9988661B2; PT3134520T; JP6966162B2; HUE038511T2; US11299759B2

Abstract

本发明涉及一种酶法修饰糖蛋白的方法。所述方法包括以下步骤：在为或衍生自β‑(1,4)‑N‑乙酰半乳糖胺转移酶的糖基转移酶的存在下，使包含含有末端GlcNAc部分的聚糖的糖蛋白与非天然的糖衍生物核苷酸接触。所述非天然的糖衍生物核苷酸如式(3)所示：

其中A选自‑N₃、‑C(O)R³、‑(CH₂)_iC≡C‑R⁴、‑SH、‑SC(O)R⁸、‑SC(O)OR⁸、‑SC(S)OR⁸、‑F、‑Cl、‑Br、‑I、‑OS(O)₂R⁵、末端C₂‑C₂₄烯基、C₃‑C₅环烯基、C₄‑C₈链二烯基、末端C₃‑C₂₄丙二烯基和氨基。本发明还涉及一种通过本发明的方法可获得的糖蛋白，涉及一种可通过将糖蛋白与接头缀合物缀合而获得的生物缀合物，并且涉及可用于制备本发明的糖蛋白的β‑(1,4)‑N‑乙酰半乳糖胺转移酶。

Description

用为或衍生自β-(1,4)-N-乙酰半乳糖胺转移酶的糖基转移酶修饰糖蛋白的方法

本申请是2016年4月25日提交的申请号为201680036546.X、发明名称为“用为或衍生自β-(1,4)-N-乙酰半乳糖胺转移酶的糖基转移酶修饰糖蛋白的方法”的中国发明专利申请的分案申请。

技术领域

本发明涉及酶法修饰糖蛋白的方法。更具体地，本发明涉及使用为或衍生自β-(1,4)-N-乙酰半乳糖胺转移酶的糖基转移酶，用糖衍生物核苷酸修饰糖蛋白的方法。本发明还涉及通过所述方法可获得的糖蛋白，涉及可通过将糖蛋白与接头缀合物缀合而获得的生物缀合物，并且涉及可用于制备本发明的糖蛋白的β-(1,4)-N-乙酰半乳糖胺转移酶。

背景技术

糖基转移酶构成参与糖蛋白和糖脂上存在的复合碳水化合物的合成的酶的超家族。糖基转移酶的基本作用是将核苷酸衍生物的糖基部分转移至特定的糖受体。β-1,4-半乳糖基转移酶(β4Gal-T)(EC 2.4.1.38)组成糖基转移酶超家族的亚家族之一，所述亚家族至少包含Gal-T1至Gal-T7七个成员，其催化半乳糖(Gal)从UDP-Gal转移至不同的糖受体。半乳糖转移酶在末端GlcNAc残基上产生的共有基序是乳糖胺序列Galβ4GlcNAc-R(LacNAc或LN)，其随后通过添加其他糖和硫酸根基团以多种方式修饰。膜糖缀合物的最常见和最重要的糖结构是聚-N-乙酰乳糖胺(聚-LN)，其连接至蛋白(或脂质)，在细胞通讯、黏附和信号传导中起重要作用，并且是免疫应答调节中的重要分子。

在脊椎动物和无脊椎动物糖缀合物中存在的另一个共有的末端基序是GalNAcβ4GlcNAc-R(LaCdiNAc或LDN)序列。LDN基序存在于哺乳动物垂体糖蛋白激素中，其中末端GalNAc残基是4-O-硫酸化的，并且作为内皮细胞Man/S4GGnM受体清除的识别标志物发挥作用。然而，非垂体哺乳动物糖蛋白还含有LDN决定簇。此外，LDN和LDN序列的修饰是许多寄生线虫和吸虫中的常见抗原决定簇。LDN的生物合成涉及将GalNAc转移至末端GlcNAc，这是由高度特异性GalNAc转移酶执行的过程。例如由Miller等人在J.Biol.Chem.2008,283，第1985页(通过引用的方式纳入本文)中报道，认为两个密切相关的β1,4-N-乙酰半乳糖胺转移酶——β4GalNAc-T3和β4GalNAc-T4——引起β1,4连接的GalNAc至许多糖蛋白(包括糖蛋白促黄体激素(LH)和碳酸酐酶-6(CA6))上的Asn-连接的寡糖的蛋白特异性的添加。

已经在一系列生物体中鉴定了β-(1,4)-乙酰半乳糖胺转移酶(β-(1,4)-GalNAcT)，所述生物体包括人、秀丽隐杆线虫(Caenorhabditis elegans)(Kawar等人，J.Biol.Chem.2002,277,34924，通过引用纳入本文)、黑腹果蝇(Drosophilamelanogaster)(Hoskins等人，Science 2007,316,1625，通过引用的方式纳入本文)和粉纹夜蛾(Trichoplusia ni)(Vadaie等人，J.Biol.Chem.2004,279,33501，通过引用的方式纳入本文)。

最后，除了参与N-糖蛋白修饰的GalT和GalNAcT之外，称为UDP-N-乙酰半乳糖胺:多肽N-乙酰半乳糖胺转移酶(也称为ppGalNAcT)的非相关类别的酶负责粘蛋白型连接(GalNAc-α-1-O-Ser/Thr)的生物合成。这些酶将GalNAc从糖供体UDP-GalNAc转移至丝氨酸和苏氨酸残基，形成O-糖蛋白中典型的α端基异构键。尽管ppGalNAcT催化功能看似简单，但是基于计算机分析估计仅有24种独特的ppGalNAcT人类基因。因为O-连接的糖基化逐步进行，将GalNAc添加到至丝氨酸或苏氨酸中代表粘蛋白生物合成中的第一个关键步骤。尽管这看似简单，但多个ppGalNAcT家族成员对于其蛋白底物的完全糖基化似乎是必需的。

已经表明，半乳糖基转移酶类除了转移天然底物UDP-Gal之外，还能够将一系列非天然半乳糖衍生物转移至受体GlcNAc底物。例如，Elling等人在ChemBioChem 2001,2,884(通过引用的方式纳入本文)中表明，通过在一系列半乳糖基转移酶的作用下从UDP-糖转移6-修饰的半乳糖，可以将含末端GlcNAc的蛋白质生物素化。类似地，Pannecoucke等人在Tetrahedron Lett.2008,49,2294(通过引用的方式纳入本文)中证实，在经受牛β1,4-半乳糖基转移酶之后，6-叠氮基-6-脱氧半乳糖可以(在一定程度上)从对应的UDP-糖转移至小分子GlcNAc底物上。在US2008/0108557(WO 2006/035057，Novo Nordisk A/S)中早先也报道了用于修饰的半乳糖衍生物的糖基转移酶的用途，其中要求在C-6处修饰的广泛范围的半乳糖衍生物(例如硫醇、叠氮化物、O-炔丙基、醛)可以在(牛或人)β1,4-半乳糖基转移酶的作用下，使用2-10当量的UDP-糖转移至GlcNAc底物上。然而，提供的用于支持这样的权利要求的数据仅涉及半乳糖的6-O-炔丙基和6-醛基变体。在C2处具有化学柄的许多GalNAc衍生物也被要求为糖基转移酶的底物，但没有提供实施例。

特别地，如由Ramakrishnan等人J.Biol.Chem.2002,23,20833(通过引用的方式纳入本文)所报道的，牛β4Gal-T1中Tyr-289残基至Leu-289的突变产生了酶的催化口袋，其可以有助于在C2处携带化学柄的UDP-Gal分子，例如2-酮基-Gal。通过包括首先转移非天然半乳糖部分，接着将肟连接到C-2柄上的两步过程，该突变型酶β4GalT(Y289L)已经用于体外检测蛋白上的O-GlcNAc残基或正常和恶性肿瘤组织的细胞表面聚糖上的末端GlcNAc部分的存在。

例如Khidekel等人，J.Am.Chem.Soc.2003,125,16162(通过引用的方式纳入本文)公开了非天然酮官能团到具有β4GalT(Y289L)的O-GlcNAc修饰的蛋白的化学选择性安装。酮部分充当独特标记物以使用肟连接用生物素来“标记”O-GlcNAc糖基化蛋白。一旦被生物素化，可以使用与辣根过氧化物酶(HRP)缀合的链霉亲和素通过化学发光来容易地检测糖缀合物。

例如WO 2007/095506、WO 2008/029281(均为Invitrogen Corporation的)、WO2014/065661(SynAffix B.V.)和Clark等人J.Am.Chem.Soc.2008,130,11576(均通过引用的方式纳入本文)报道了类似的方法，其使用β4GalT(Y289L)和半乳糖胺的叠氮乙酰基变体，取得了类似的成功。

例如US 8697061(Glykos)(通过引用的方式纳入本文)报道了一种类似的方法，其使用β4GalT(Y289L)和2-修饰的糖，获得类似的成功。

最近，突变体β4GalT(Y289L)也以制备方式应用于对抗体的重链聚糖进行位点选择性放射性标记，如Zeglis等人在Bioconj.Chem.2013,24,1057(通过引用的方式纳入本文)中所报道的。特别地，将叠氮化物修饰的N-乙酰半乳糖胺单糖(GalNAz)掺入至抗体的聚糖允许在合适的螯合剂的点击化学引入之后用⁸⁹Zr进行受控标记。

Ramakrishnan等人在Biochemistry 2004,43,12513(通过引用的方式纳入本文)中描述了双突变体β4GalT(Y289L、M344H)失去其Mn²⁺依赖性活性的98％，但是在Mg²⁺存在下表现出25-30％的活性，包括转移C-2修饰的半乳糖底物的能力。发现双突变体β4GalT(Y289L、M344H)可用于体外半乳糖苷化测定，因为已知5-10mM Mn²⁺的典型需求对细胞具有潜在的细胞毒性作用。

Mercer等人，Bioconjugate.Chem.2013,24,144(通过引用的方式纳入本文)描述了在Mg²⁺的存在下，双突变体Y289L-M344H-β4Gal-T1酶将GalNAc和类似物糖转移至受体GlcNAc。

使用野生型β-(1,4)-N-乙酰半乳糖胺转移酶(在本文也称为β-(1,4)-GalNAcT)来转移C-2修饰的GalNAc的尝试迄今已获得了小小的成功。

Bertozzi等人在ACS Chem.Biol.2009,4,1068(通过引用的方式纳入本文)中将生物正交化学报告技术应用于粘蛋白型O-聚糖在活的秀丽隐杆线虫中的分子成像。将蠕虫用N-乙酰半乳糖胺(GalNAz)的叠氮基-糖变体处理，使得能够体内掺入这种非天然糖。虽然观察到GalNAz代谢性掺入到糖蛋白中，但是对秀丽隐杆线虫溶解产物的软骨素酶ABC和肽N-糖苷酶F(PNGase F)消化，随后使用膦-Flag标签进行的施陶丁格连接(Staudingerligation)以及随后通过使用α-Flag抗体的Western印迹对糖蛋白的探测，表明糖蛋白上的大多数GalNAz残基位于除N-聚糖外的其他类型的聚糖中。此外，没有观察到叠氮化物标记的糖蛋白与N-聚糖特异性凝集素伴刀豆球蛋白A(ConA)的可检测的结合，这与绝大多数标记的聚糖是O-连接的而非N-连接的假说一致。基于这些观察结果，可以得出结论，GalNAz不会在该生物体中代谢性地掺入到N-GlcNAc化蛋白上。

最近，由Burnham-Marusich等人在Plos One 2012,7,e49020(通过引用的方式纳入本文)中得出了类似的结论，其中还观察到在PNGAse处理时缺乏信号减少——表明GalNAz在N-糖蛋白中没有明显掺入。Burnham-Marusich等人描述了使用末端炔烃探针与叠氮基标记的糖蛋白的Cu(I)-催化的叠氮化物-炔烃环化加成反应来检测代谢标记的糖蛋白的研究。结果表明大多数GalNAz标记掺入至对pNGase F不敏感、因此不是N-糖蛋白的聚糖类。

β-(1,4)-GalNAcT对UDP-GalNAc的高底物特异性从对UDP-GlcNAc、UDP-Glc和UDP-Gal的差的识别中变得显而易见，对UDP-GlcNAc、UDP-Glc和UDP-Gal分别仅有0.7％、0.2％和1％的转移酶活性残留，如Kawar等人，J.Biol.Chem.2002,277,34924(通过引用的方式纳入本文)中所报道的。

综上，没有通过非天然GalNAc衍生物(如2-酮基或2-叠氮乙酰基衍生物)的GalNAc转移酶的方式来修饰糖蛋白的体外方法的报道是不足为奇的。

同时，已由Qasba等人，J.Mol.Biol.2007,365,570(通过引用的方式纳入本文)报道，无脊椎动物GalNAcT中的Ile或Leu活性位点残基——对应于人β4Gal-T1同源酶(ortholog enzyme)中的Tyr-289残基——到Tyr残基的置换，通过将N-乙酰半乳糖胺基转移酶活性降低近1000倍，同时将其半乳糖基转移酶活性提高80倍，将酶转化为β(1,4)半乳糖基转移酶。

Taron等人，Carbohydr.Res.2012,362,62(通过引用的方式纳入本文)描述了GalNAz在GPI锚中的体内代谢掺入。

发明内容

本发明涉及一种修饰糖蛋白的方法，所述方法包括以下步骤：在糖基转移酶的存在下，使糖蛋白与糖衍生物核苷酸Su(A)-Nuc接触，所述糖蛋白包含含有末端GlcNAc部分的聚糖，其中：

(i)所述糖基转移酶为或衍生自β-(1,4)-N-乙酰半乳糖胺转移酶；

(ii)所述含有末端GlcNAc部分的聚糖如式(1)或(2)所示：

其中：

b为0或1；

d为0或1；

e为0或1；以及

G为单糖、或包含2至20个糖部分的直链或支链寡糖；以及

(iii)所述糖衍生物核苷酸Su(A)-Nuc如式(3)所示：

其中：

a为0或1；

f为0或1；

g为0或1；

Nuc为核苷酸；

U为[C(R¹)₂]_n或[C(R¹)₂]_p-O-[C(R¹)₂C(R¹)₂O]_o-[C(R¹)₂]_q，其中n为1至24的整数；o为0至12的整数；p和q独立地为0、1或2；R¹独立地选自H、F、Cl、Br、I、OH和任选取代的C₁-C₂₄烷基；

T为C₃-C₁₂(杂)亚芳基，其中(杂)亚芳基被任选地取代；

A选自：

(a)-N₃

(b)-C(O)R³

其中R³为任选取代的C₁-C₂₄烷基；

(c)(杂)环炔基或-(CH₂)_iC≡C-R⁴部分

其中i为0-10且R⁴为氢或任选取代的C₁-C₂₄烷基；

(d)-SH

(e)-SC(O)R⁸

其中R⁸为任选取代的C₁-C₂₄烷基或苯基；

(f)-SC(V)OR⁸

其中V为O或S，R⁸为任选取代的C₁-C₂₄烷基或苯基；

(g)-X

其中X选自F、Cl、Br和I；

(h)-OS(O)₂R⁵

其中R⁵选自C₁-C₂₄烷基、C₆-C₂₄芳基、C₇-C₂₄烷基芳基和C₇-C₂₄芳基烷基，所述烷基、芳基、烷基芳基和芳基烷基被任选地取代；

(i)R¹²

其中R¹²选自任选取代的末端C₂-C₂₄烯基、C₃-C₅环烯基和C₄-C₈链二烯基；以及

(j)R¹³

其中R¹³为任选取代的末端C₃-C₂₄丙二烯基；以及

(k)N(R¹⁷)₂

其中R¹⁷独立地选自H和C₁-C₁₂烷基；

Z为CH₂、CF₂或C(O)；或Z为CHOH，条件是当Z为CHOH时，g为0、f为1且a为0或1；

Y选自O、S、N(R¹⁵)、N(R¹⁵)C(O)、N(R¹⁵)C(O)N(R¹⁵)、N(R¹⁵)C(O)O、OC(O)N(R¹⁵)S(O)₂N(R¹⁵)和N(R¹⁵)C(O)N(R¹⁵)S(O)₂O，其中R¹⁵独立地选自H、C₁-C₁₂烷基和(U)_f-(T)_a-A，其中f、a、U、T和A如上所定义；以及

R¹⁴独立地选自：

其中：

a、f、T、A和U如上所定义；

h为0或1；以及

W选自O、S、NR¹⁵、NHS(O)₂O和NHS(O)₂NR¹⁵，其中R¹⁵如上所定义。

本发明还涉及通过本发明的方法可获得的糖蛋白。

附图说明

在图1中示出了可通过本发明的方法修饰的糖蛋白的几个实例，所述糖蛋白包含含有末端GlcNAc部分的聚糖。

在图2中示出了修饰糖蛋白的方法的实施方案，其中所述糖蛋白是抗体。在该实施方案中，糖衍生物Su(A)-Nuc在糖基转移酶(其中糖基转移酶为或衍生自β-(1,4)-N-乙酰半乳糖胺转移酶)的作用下连接到抗体聚糖的末端GlcNAc部分，形成经修饰的抗体。

图3示出了抗体聚糖G0、G1、G2、G0F、G1F和G2F的不同糖型。

图4示出了一种通过用唾液酸酶和半乳糖苷酶处理糖型G0、G1、G2、G0F、G1F和G2F的混合物来提供包含式(10)的聚糖的糖蛋白的方法，以及通过用内切糖苷酶处理糖型G0、G1、G2、G0F、G1F和G2F的混合物来提供包含式(1)的聚糖的糖蛋白的方法。包含式(10)或(1)的聚糖的糖蛋白与叠氮基修饰的UDP-GalNAc衍生物(例如6-叠氮基GalNAc)的孵育分别得到叠氮基修饰的糖蛋白(33)或(32)。

图5示出了在本发明的经修饰的糖蛋白中的代表性的一组官能团(A)，其经与反应性基团Q¹的反应得到连接基团CG和官能化的糖蛋白。

图6示出了根据式(3)的糖衍生物核苷酸Su(A)-Nuc。

具体实施方式

定义

如本说明书和权利要求书中使用的动词“包含”及其变化形式以其非限制性意义使用，意指包括该词之后的项目，但不排除未具体提及的项目。

另外，通过不定冠词“一(a)”或“一个(an)”提及要素不排除存在多于一个要素的可能性，除非上下文清楚地要求存在一个且仅存在一个该要素。因此，不定冠词“一”或“一个”通常意指“至少一个”。

未取代的烷基具有通式C_nH_2n+1，并且可以是直链的或支链的。未取代的烷基还可以含有环状部分，因此具有随之而来的通式C_nH_2n-1。任选地，烷基被本文中进一步详细说明的一个或多个取代基取代。烷基的实例包括甲基、乙基、丙基、2-丙基、叔丁基、1-己基、1-十二烷基等。

芳基包含6至12个碳原子并且可以包括单环结构和双环结构。任选地，芳基可以被本文中进一步详细说明的一个或多个取代基取代。芳基的实例是苯基和萘基。

芳基烷基和烷基芳基包含至少七个碳原子，并且可以包括单环结构和双环结构。任选地，芳基烷基和烷基芳基可以被本文中进一步详细说明的一个或多个取代基取代。芳基烷基为例如苄基。烷基芳基为例如4-叔丁基苯基。

杂芳基包含至少两个碳原子(即至少C₂)和一个或多个杂原子N、O、P或S。杂芳基可具有单环结构或双环结构。任选地，杂芳基可以被本文中进一步详细说明的一个或多个取代基取代。合适的杂芳基的实例包括吡啶基、喹啉基、嘧啶基、吡嗪基、吡唑基、咪唑基、噻唑基、吡咯基、呋喃基、三唑基、苯并呋喃基、吲哚基、嘌呤基、苯并噁唑基、噻吩基、磷酰基和噁唑基。

杂芳基烷基和烷基杂芳基包含至少三个碳原子(即至少C₃)，并且可以包括单环结构和双环结构。任选地，杂芳基可以被本文中进一步详细说明的一个或多个取代基取代。

当芳基被表示为(杂)芳基时，该表示意指包括芳基和杂芳基。类似地，烷基(杂)芳基意指包括烷基芳基和烷基杂芳基，并且(杂)芳基烷基意指包括芳基烷基和杂芳基烷基。因此，C₂-C₂₄(杂)芳基被解释为包括C₂-C₂₄杂芳基和C₆-C₂₄芳基。类似地，C₃-C₂₄烷基(杂)芳基意指包括C₇-C₂₄烷基芳基和C₃-C₂₄烷基杂芳基，并且C₃-C₂₄(杂)芳基烷基意指包括C₇-C₂₄芳基烷基和C₃-C₂₄杂芳基烷基。

除非另有说明，烷基、烯基、烯烃、炔烃、(杂)芳基、(杂)芳基烷基、烷基(杂)芳基、亚烷基、亚烯基、环亚烷基、(杂)亚芳基、烷基(杂)亚芳基、(杂)芳基亚烷基、烯基、炔基、环烷基、烷氧基、烯氧基、(杂)芳氧基、炔氧基和环烷氧基可以被一个或多个独立地选自以下的取代基取代：C₁-C₁₂烷基、C₂-C₁₂烯基、C₂-C₁₂炔基、C₃-C₁₂环烷基、C₅-C₁₂环烯基、C₈-C₁₂环炔基、C₁-C₁₂烷氧基、C₂-C₁₂烯氧基、C₂-C₁₂炔氧基、C₃-C₁₂环烷氧基、卤素、氨基、氧代和甲硅烷基，其中甲硅烷基可以由式(R²)₃Si-表示，其中R²独立地选自C₁-C₁₂烷基、C₂-C₁₂烯基、C₂-C₁₂炔基、C₃-C₁₂环烷基、C₁-C₁₂烷氧基、C₂-C₁₂烯氧基、C₂-C₁₂炔氧基和C₃-C₁₂环烷氧基，其中烷基、烯基、炔基、环烷基、烷氧基、烯氧基、炔氧基和环烷氧基被任选地取代，烷基、烷氧基、环烷基和环烷氧基被一个或多个选自O、N和S的杂原子任选地间隔。

炔基包含碳-碳三键。包含一个三键的未取代的炔基具有通式C_nH_2n-3。末端炔基是其中三键位于碳链的末端位置的炔基。任选地，炔基被一个或多个本文中进一步详细说明的取代基取代，和/或被选自氧、氮和硫的杂原子间隔。炔基的实例包括乙炔基、丙炔基、丁炔基、辛炔基等。

环炔基是环状炔基。包含一个三键的未取代的环炔基具有通式C_nH_2n-5。任选地，环炔基被一个或多个本文中进一步详细说明的取代基取代。环炔基的实例是环辛炔基。

杂环炔基是被选自氧、氮和硫的杂原子间隔的环炔基。任选地，杂环炔基被一个或多个本文中进一步详细说明的取代基取代。杂环炔基的实例是氮杂环辛炔基。

(杂)芳基包括芳基和杂芳基。烷基(杂)芳基包括烷基芳基和烷基杂芳基。(杂)芳基烷基包括芳基烷基和杂芳基烷基。(杂)炔基包括炔基和杂炔基。(杂)环炔基包括环炔基和杂环炔基。

本文中的(杂)环炔化合物定义为包含(杂)环炔基的化合物。

本说明书和权利要求书中公开的几种化合物可以描述为稠合(杂)环炔化合物，即其中第二个环结构是与(杂)环炔基稠合(即成环)的(杂)环炔化合物。例如在稠合(杂)环辛炔化合物中，环烷基(例如环丙基)或芳烃(例如苯)可以与(杂)环辛炔基成环。稠合(杂)环辛炔化合物中的(杂)环辛炔基的三键可以位于三个可能位置的任一个上，即在环辛炔部分的2、3或4位上(根据“IUPAC Nomenclature of Organic Chemistry”,Rule A31.2编号)。本说明书和权利要求书中对任何稠合(杂)环辛炔化合物的描述意指包括环辛炔部分的所有三种单独的区域异构体。

本文中的一般性术语“糖”用于表示单糖，例如葡萄糖(Glc)、半乳糖(Gal)、甘露糖(Man)和岩藻糖(Fuc)。本文中的术语“糖衍生物”用于表示单糖的衍生物，即包含取代基和/或官能团的单糖。糖衍生物的实例包括氨基糖和糖酸，例如葡糖胺(GlcNH₂)、半乳糖胺(GalNH₂)、N-乙酰葡糖胺(GlcNAc)、N-乙酰半乳糖胺(GalNAc)、唾液酸(Sia)(其也称为N-乙酰神经氨酸(NeuNAc))，以及N-乙酰胞壁酸(MurNAc)、葡糖醛酸(GlcA)和艾杜糖醛酸(IdoA)。

本文中的术语“核苷酸”以其通常的科学含义使用。术语“核苷酸”是指由核碱基、五碳糖(核糖或2-脱氧核糖)和一个、两个或三个磷酸基团组成的分子。没有磷酸基团，核碱基和糖组成核苷。因此，核苷酸也可以称为一磷酸核苷、二磷酸核苷或三磷酸核苷。核碱基可以是腺嘌呤、鸟嘌呤、胞嘧啶、尿嘧啶或胸腺嘧啶。核苷酸的实例包括尿苷二磷酸(UDP)、鸟苷二磷酸(GDP)、胸苷二磷酸(TDP)、胞苷二磷酸(CDP)和胞苷一磷酸(CMP)。

本文中的术语“蛋白”以其通常的科学含义使用。在本文中，包含约10个或更多个氨基酸的多肽被认为是蛋白。蛋白可以包含天然的氨基酸，但也包括非天然的氨基酸。

本文中的术语“糖蛋白”以其通常的科学含义使用，并且是指包含与蛋白共价键合的一个或多个单糖链或寡糖链(“聚糖”)的蛋白。聚糖可以连接到蛋白的羟基上(O-连接的聚糖)，例如，连接到丝氨酸、苏氨酸、酪氨酸、羟赖氨酸或羟脯氨酸的羟基上；或连接到蛋白的氮官能团上(N-糖蛋白)，例如天冬酰胺或精氨酸；或连接到蛋白的碳上(C-糖蛋白)，例如色氨酸。糖蛋白可以包含一个以上的聚糖，可以包含一个或多个单糖和一个或多个寡糖聚糖的组合，并且可以包含N-连接的、O-连接的和C-连接的聚糖的组合。据估计，超过50％的所有蛋白具有某种形式的糖基化，因此被认为是糖蛋白。糖蛋白的实例包括PSMA(前列腺特异性膜抗原)、CAL(南极假丝酵母脂肪酶)、gp41、gp120、EPO(促红细胞生成素)、抗冻蛋白和抗体。

本文中的术语“聚糖”以其通常的科学含义使用，并且是指与蛋白连接的单糖链或寡糖链。因此，术语聚糖是指糖蛋白的碳水化合物部分。聚糖经由一个糖的C-1碳连接至蛋白，所述糖可以不经进一步取代(单糖)或可以在其一个或多个羟基上被进一步取代(寡糖)。天然存在的聚糖通常包含1至约10个糖类部分。然而，当更长的糖链与蛋白连接时，所述糖链在本文中也被认为是聚糖。

糖蛋白的聚糖可以是单糖。通常，糖蛋白的单糖聚糖由与蛋白共价连接的单一的N-乙酰葡糖胺(GlcNAc)、葡萄糖(Glc)、甘露糖(Man)或岩藻糖(Fuc)组成。

聚糖也可以是寡糖。糖蛋白的寡糖链可以是直链或支链的。在寡糖中，直接连接至蛋白的糖称为核心糖。在寡糖中，不直接连接至蛋白并连接至至少两种其他糖的糖称为内部糖。在寡糖中，不直接连接至蛋白而是连接至单个其他糖的糖，即在其一个或多个其他羟基处不具有其他糖取代基的糖，称为末端糖。为了避免疑义，在糖蛋白的寡糖中可以存在多个末端糖，但是仅存在一个核心糖。

聚糖可以是O-连接的聚糖、N-连接的聚糖或C-连接的聚糖。在O-连接的聚糖中，单糖或寡糖聚糖通常经由丝氨酸(Ser)或苏氨酸(Thr)的羟基与蛋白的氨基酸中的O原子键合。在N-连接的聚糖中，单糖或寡糖聚糖经由蛋白的氨基酸中的N-原子，通常经由天冬酰胺(Asn)或精氨酸(Arg)侧链中的酰胺氮与蛋白键合。在C-连接的聚糖中，单糖或寡糖聚糖与蛋白的氨基酸中的C-原子键合，通常与色氨酸(Trp)的C-原子键合。

与蛋白直接连接的寡糖的末端称为聚糖的还原末端。寡糖的另一端称为聚糖的非还原端。

对于O-连接的聚糖，存在多种多样的链。天然存在的O-连接的聚糖的特征通常在于丝氨酸或苏氨酸连接的α-O-GalNAc部分，其进一步用另一个GalNAc、半乳糖、GlcNAc、唾液酸和/或岩藻糖取代。具有聚糖取代的羟基化氨基酸可以是蛋白中任何氨基酸序列的一部分。

对于N-连接的聚糖，存在多种多样的链。天然存在的N-连接的聚糖的特征通常在于天冬酰胺连接的β-N-GlcNAc部分，进而在其4-OH处用β-GlcNAc进一步取代，进而在其4-OH处用β-Man进一步取代，进而在其3-OH和6-OH处用α-Man进一步取代，得到聚糖戊多糖Man₃GlcNAc₂。核心GlcNAc部分可以在其6-OH处被α-Fuc进一步取代。戊多糖Man₃GlcNAc₂是几乎所有N-连接的糖蛋白的常见寡糖支架，并且可以携带多种其他取代基，包括但不限于Man、GlcNAc、Gal和唾液酸。在其侧链上用聚糖取代的天冬酰胺通常是序列Asn-X-Ser/Thr的一部分，其中X为除了脯氨酸以外的任何氨基酸，Ser/Thr是丝氨酸或苏氨酸。

本文中的术语“抗体”以其通常的科学含义使用。抗体是由免疫系统产生的能够识别和结合至特定抗原的蛋白。抗体是糖蛋白的一个实例。本文中的术语抗体以其最广泛的含义使用，并具体包括单克隆抗体、多克隆抗体、二聚体、多聚体、多特异性抗体(例如双特异性抗体)、抗体片段以及双链抗体和单链抗体。本文中的术语“抗体”还意指包括人抗体、人源化抗体、嵌合抗体和特异性结合癌抗原的抗体。术语“抗体”意指包括全抗体，但也包括抗体的片段，例如抗体Fab片段、F(ab’)₂、来自切割抗体的Fv片段或Fc片段、scFv-Fc片段、微抗体、双特异抗体或scFv。此外，该术语包括基因工程抗体和抗体的衍生物。抗体、抗体的片段和遗传工程抗体可以通过本领域已知的方法获得。合适的市售抗体主要包括阿昔单抗、利妥昔单抗、巴利昔单抗、帕利珠单抗、英夫利昔单抗、曲妥珠单抗、阿仑珠单抗、阿达木单抗、托西莫单抗-I131、西妥昔单抗、ibrituximab tiuxetan、奥马珠单抗、贝伐单抗、那他珠单抗、雷珠单抗、帕尼单抗、依库珠单抗、赛妥珠单抗(certolizumab pegol)、戈利木单抗、卡那奴单抗、卡妥索单抗、乌司奴单抗、托珠单抗、奥法木单抗、地舒单抗、贝利木单抗、伊匹木单抗和本妥昔单抗(brentuximab)。

同一性/相似性

在本发明的上下文中，蛋白或蛋白片段由氨基酸序列表示。

应理解，如本文中通过给定的序列身份号(SEQ ID NO)所确定的每个蛋白或蛋白片段或肽或衍生肽或多肽不限于所公开的这种特定序列。本文中的“序列同一性”定义为通过比较序列确定的两个或更多个氨基酸(多肽或蛋白)序列之间的关系。在本领域中，“同一性”还意指根据情况可通过这种序列的字符串之间的匹配确定的氨基酸序列之间的序列相似性程度。除非本文另有说明，与给定SEQ ID NO的同一性或相似性意指基于所述序列的全长(即在其整个长度上或作为整体)的同一性或相似性。

本发明包含的与由其SEQ ID NO所定义的具体指定序列具有小于100％序列同一性的任何酶优选具有为与由SEQ ID NO所定义的所述序列具有100％同一性的酶的酶活性的至少10％、20％、30％、40％、50％、60％、70％或优选至少80％或90％或至少100％的酶活性。

两个氨基酸序列之间的“相似性”通过将一个多肽的氨基酸序列和其保守氨基酸取代物与第二多肽的序列进行比较来确定。“同一性”和“相似性”可以通过已知方法容易地计算，包括但不限于在以下中描述的那些：Computational Molecular Biology,Lesk,A.M.编辑,牛津大学出版社,纽约,1988；Biocomputing:Informatics and Genome Projects,Smith,D.W.编辑,Academic Press,纽约,1993；Computer Analysis of Sequence Data,Part I,Griffin,A.M.,和Griffin,H.G.编辑,胡玛纳出版社,新泽西州,1994；SequenceAnalysis in Molecular Biology,von Heine,G.,Academic Press,1987；以及SequenceAnalysis Primer,Gribskov,M.和Devereux,J.,eds.,M Stockton Press,纽约,1991以及Carillo,H.,和Lipman,D.,SIAM J.Applied Math.,48:1073(1988)。

设计确定同一性的优选方法以在测试的两个或更多个序列之间给出最大匹配。确定同一性和相似性的方法编码在可公开获得的计算机程序中。确定两个序列之间的同一性和相似性的优选计算机程序方法包括例如GCG程序包(Devereux,J.等人,Nucleic AcidsResearch 12(1):387(1984))、BestFit、BLASTP、BLASTN和FASTA(Altschul,S.F.等人,J.Mol.Biol.215:403-410(1990))。BLAST X程序可公开获自NCBI和其他来源(BLASTManual,Altschul,S.,等人,NCBI NLM NIH Bethesda,MD20894；Altschul,S.等人,J.Mol.Biol.215:403-410(1990))。众所周知的Smith Waterman算法也可用于确定同一性。

用于多肽序列比较的优选参数包括如下内容：算法：Needleman和Wunsch,J.Mol.Biol.48:443-453(1970)；比较矩阵：来自Hentikoff和Hentikoff的BLOSSUM62,Proc.Natl.Acad.Sci.USA.89:10915-10919(1992)；缺口罚分:12；以及缺口长度罚分:4。具有这些参数的有用的程序作为“Ogap”程序公开获自位于Madison，WI的Genetics ComputerGroup。上述参数是用于氨基酸比较的默认参数(以及对于末端缺口没有罚分)。

任选地，在确定氨基酸相似性程度时，技术人员还可以考虑所谓的“保守”氨基酸置换，这对技术人员将是清楚的。保守氨基酸置换是指具有相似侧链的残基的可互换性。例如，具有脂肪族侧链的氨基酸组是甘氨酸、丙氨酸、缬氨酸、亮氨酸和异亮氨酸；具有脂肪族-羟基侧链的氨基酸组是丝氨酸和苏氨酸；具有含酰胺侧链的氨基酸组是天冬酰胺和谷氨酰胺；具有芳族侧链的氨基酸组是苯丙氨酸、酪氨酸和色氨酸；具有碱性侧链的氨基酸组是赖氨酸、精氨酸和组氨酸；具有含硫侧链的氨基酸组是半胱氨酸和甲硫氨酸。优选的保守氨基酸置换基是：缬氨酸-亮氨酸-异亮氨酸、苯丙氨酸-酪氨酸、赖氨酸-精氨酸、丙氨酸-缬氨酸和天冬酰胺-谷氨酰胺。本文公开的氨基酸序列的置换变体是其中已经除去所公开序列中的至少一个残基并且在其位置插入不同残基的那些。优选地，氨基酸改变是保守的。每个天然存在的氨基酸的优选保守置换如下：Ala至Ser；Arg至Lys；Asn至Gln或His；Asp至Glu；Cys至Ser或Ala；Gln至Asn；Glu至Asp；Gly至Pro；His至Asn或Gln；Ile至Leu或Val；Leu至Ile或Val；Lys至Arg；Gln或Glu；Met至Leu或Ile；Phe至Met、Leu或Tyr；Ser至Thr；Thr至Ser；Trp至Tyr或His；Tyr至Trp或Phe；以及Val至Ile或Leu。

用于修饰糖蛋白的方法

本发明涉及用于在糖基转移酶的作用下修饰糖蛋白以获得经修饰的糖蛋白的方法，其中所述糖基转移酶为或衍生自β-(1,4)-N-乙酰半乳糖胺转移酶。优选地，所述方法是体外方法。

具体地，本发明涉及用于修饰糖蛋白的方法，所述方法包括以下步骤：在糖基转移酶的存在下，将糖蛋白与糖衍生物核苷酸Su(A)-Nuc接触，所述糖蛋白包含含有末端GlcNAc部分的聚糖，其中：

(ii)所述含有末端GlcNAc部分的聚糖如式(1)或(2)所示：

其中：

b为0或1；

d为0或1；

e为0或1；以及

G为单糖，或包含2至20个糖部分的直链或支链寡糖；以及

(iii)所述糖衍生物核苷酸Su(A)-Nuc如式(3)所示：

其中：

a为0或1；

f为0或1；g为0或1；

Nuc为核苷酸；

T为C₃-C₁₂(杂)亚芳基，其中(杂)亚芳基被任选地取代；

A选自：

(a)-N₃

(b)-C(O)R³

其中R³为任选取代的C₁-C₂₄烷基；

(c)(杂)环炔基或-(CH₂)_iC≡C-R⁴部分

其中i为0-10且R⁴为氢或任选取代的C₁-C₂₄烷基；

(d)-SH

(e)-SC(O)R⁸

其中R⁸为任选取代的C₁-C₂₄烷基或苯基；

(f)-SC(V)OR⁸

其中V为O或S，R⁸为任选取代的C₁-C₂₄烷基或苯基；

(g)-X

其中X选自F、Cl、Br和I；

(h)-OS(O)₂R⁵

(i)R¹²

(j)R¹³

其中R¹³为任选取代的末端C₃-C₂₄丙二烯基；以及

(k)N(R¹⁷)₂

其中R¹⁷独立地选自H和C₁-C₁₂烷基；

R¹⁴选自：

其中：

a、f、T、A和U如上所定义；

h为0或1；以及

在一个实施方案中，如式(3)所示的Su(A)-Nuc中的A选自如上所定义的选项(a)至(j)。在另一个实施方案中，如式(3)所示的Su(A)-Nuc中的A选自如上定义的选项(a)至(d)和(g)至(k)，更优选选自(a)至(d)和(g)至(j)。

如上所述，本发明用于修饰糖蛋白的方法提供了经修饰的糖蛋白。在本文中，经修饰的糖蛋白定义为包含式(4)或(5)的聚糖的糖蛋白：

其中：

b、d、e和G如上所定义；以及

Su(A)是式(6)的糖衍生物：

其中：

R¹⁴、Z、Y、U、T、A、g、f和a如上所定义。

在式(4)和(5)的经修饰的糖蛋白聚糖中，糖衍生物Su(A)的C1经由β-1,4-O-糖苷键连接至GlcNAc部分的C4。

用于修饰糖蛋白的方法可以进一步包括以下步骤：提供包含含有末端GlcNAc部分的聚糖的糖蛋白。因此，本发明还涉及用于修饰糖蛋白的方法，其包括以下步骤：

(1)提供包含含有末端GlcNAc部分的聚糖的糖蛋白，其中含有末端GlcNAc部分的聚糖如上文定义的式(1)或(2)所示；以及

(2)在糖基转移酶的存在下、更特别是在糖基转移酶的作用下，将所述糖蛋白与糖衍生物核苷酸Su(A)-Nuc接触，其中所述糖基转移酶为或衍生自β-(1,4)-N-乙酰半乳糖胺转移酶，并且其中Su(A)-Nuc如上文定义的式(3)所示。

下文更详细地描述了包含含有末端GlcNAc部分的聚糖的糖蛋白、糖衍生物核苷酸Su(A)-Nuc和经修饰的糖蛋白，及其优选的实施方案。

下文更详细地描述了为或衍生自β-(1,4)-N-乙酰半乳糖胺转移酶的糖基转移酶。

在本发明的方法的优选实施方案中，β-(1,4)-N-乙酰半乳糖胺转移酶为或衍生自选自SEQ ID NO:2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、25、26、27、28、29、30、31、32、33、34、46、47、49、50、51、52、53、54、55、56、57、58、59、71、72和73的序列。当R¹⁴为-NHC(O)CH₃、-NHC(O)-(W)_h-(U)_f-(T)_a-A或-N₃时，该实施方案是特别优选的。

在本发明的方法的另一个优选实施方案中，β-(1,4)-N-乙酰半乳糖胺转移酶为或衍生自SEQ ID NO:35、36、37、38、39、40、41、42、43、44、45、48、60、61、62、63、64、65、66、67、68、69、70和74。当R¹⁴为-OH时，该实施方案是特别优选的。

在本发明的方法的另一个优选实施方案中，β-(1,4)-N-乙酰半乳糖胺转移酶与选自SEQ ID NO:2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、25、26、27、28、29、30、31、32、33、34、46、47、49、50、51、52、53、54、55、56、57、58、59、71、72和73的序列具有至少50％的同一性。在该实施方案中进一步优选β-(1,4)-N-乙酰半乳糖胺转移酶与选自SEQ ID NO:2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、25、26、27、28、29、30、31、32、33、34、46、47、49、50、51、52、53、54、55、56、57、58、59、71、72和73的序列具有至少55％的序列同一性，优选至少60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。当R¹⁴为-NHC(O)CH₃、-NHC(O)-(W)_h-(U)_f-(T)_a-A或-N₃时，这些实施方案是特别优选的。

在本发明的方法的另一个优选实施方案中，β-(1,4)-N-乙酰半乳糖胺转移酶与选自SEQ ID NO:35、36、37、38、39、40、41、42、43、44、45、48、60、61、62、63、64、65、66、67、68、69、70和74的序列具有至少50％的同一性。在该实施方案中进一步优选β-(1,4)-N-乙酰半乳糖胺转移酶与选自SEQ ID NO:35、36、37、38、39、40、41、42、43、44、45、48、60、61、62、63、64、65、66、67、68、69、70和74的序列具有至少55％的序列同一性，优选至少60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。当R¹⁴为-OH时，这些实施方案是特别优选的。

糖蛋白

在本发明的方法中待修饰的糖蛋白包含聚糖，所述聚糖含有末端GlcNAc部分，即存在于聚糖的非还原端的GlcNAc部分。所述聚糖包含一个或多个糖部分，并且可以是直链的或支链的。含有末端GlcNAc部分的聚糖如式(1)或(2)所示：

其中：

b为0或1；

d为0或1；

e为0或1；以及

G为单糖，或包含2至20个糖部分的直链或支链寡糖。

所述待修饰的糖蛋白可包含多于一个含有末端GlcNAc部分的聚糖。当是这种情况时，两种或更多种聚糖可互不相同。所述糖蛋白还可以包含一种或多种不含有末端GlcNAc部分的其他聚糖。

核心GlcNAc部分(即连接至蛋白的GlcNAc部分)任选地被岩藻糖基化(b为0或1)。当核心GlcNAc部分被岩藻糖基化时，岩藻糖最通常地将α-1,6连接至所述GlcNAc部分的C6。

应注意，式(1)中b为1的聚糖的GlcNAc部分，即由岩藻糖基化的GlcNAc组成的聚糖中的GlcNAc部分，在本文中也被认为是末端GlcNAc部分。

在一个实施方案中，含有末端GlcNAc部分的聚糖由一个GlcNAc部分组成，并且所述聚糖是式(1)中b为0的聚糖。在另一个实施方案中，所述聚糖由岩藻糖基化的GlcNAc部分组成，并且所述聚糖是式(1)中b为1的聚糖。

在另一个实施方案中，所述聚糖是式(2)的聚糖，其中核心GlcNAc(如果存在)被任选地岩藻糖基化(b为0或1)。在式(2)的聚糖中，G表示单糖或包含1至20个，优选1至12个，更优选1至10个，甚至更优选1、2、3、4、5、6、7或8个，最优选1、2、3、4、5或6个糖部分的直链或支链寡糖。当G是支链寡糖时，G可以包含一个或多个末端GlcNAc部分。因此，式(2)的聚糖可包含一个以上的末端GlcNAc部分。在聚糖(2)中，优选当d为0时，e为1，以及当e为0时，d为1。更优选地，在聚糖(2)中d为1，甚至更优选d为1且e为1。

可存在于聚糖中的糖部分是本领域技术人员已知的，包括例如葡萄糖(Glc)、半乳糖(Gal)、甘露糖(Man)、岩藻糖(Fuc)、N-乙酰葡萄糖胺(GlcNAc)、N-乙酰半乳糖胺(GalNAc)、N-乙酰神经氨酸(NeuNAc)或唾液酸以及木糖(Xyl)。

在本发明的方法的一个优选的实施方案中，含有末端GlcNAc部分的聚糖如式(1)所示，如上所定义。在另一个优选的实施方案中，含有末端GlcNAc部分的聚糖如式(2)所示。进一步优选聚糖是N-连接的聚糖。当聚糖是如式(2)所示的N-连接的聚糖时，优选d为1。

当含有末端GlcNAc部分的聚糖如式(2)所示时，进一步优选如式(2)所示的聚糖是如式(9)、(10)、(11)、(12)、(13)或(14)所示的聚糖：

其中b为0或1。

在本发明的方法的一个优选的实施方案中，含有末端GlcNAc部分的聚糖是如式(1)、(9)、(10)、(11)、(12)、(13)或(14)所示的聚糖，更优选如式(1)、(9)、(10)、(11)、(12)、(13)或(14)所示的N-连接的聚糖。在其他优选的实施方案中，含有末端GlcNAc部分的聚糖是如式(1)、(9)、(10)或(11)所示的聚糖，更优选如式(1)、(9)、(10)或(11)所示的N-连接的聚糖。最优选地，含有末端GlcNAc部分的聚糖是如式(1)或(10)所示的聚糖，更优选如式(1)所示的N-连接的聚糖。

包含含有末端GlcNAc部分的聚糖的糖蛋白优选如式(7)、(8)或(8b)所示：

其中：

b、d、e和G及其优选的实施方案如上所定义；

y独立地为1至24的整数；以及

Pr为蛋白。

在本发明的方法中待修饰的糖蛋白包含一个或多个含有末端GlcNAc部分的聚糖(y为1至24)。优选地，y是1至12的整数，更优选地是1至10的整数。更优选地，y是1、2、3、4、5、6、7或8，还更优选地，y是1、2、3、4、5或6。甚至更优选地，y是1、2、3或4。当所述待修饰的糖蛋白包含多于一个聚糖时(y为2或更多)，所述聚糖可互不相同。如上文所述，糖蛋白还可以包含一个或多个不具有末端GlcNAc部分的聚糖。

当本发明的方法中待修饰的糖蛋白如式(7)、(8)或(8b)所示时，还优选含有末端GlcNAc部分的聚糖是如式(1)、(9)、(10)、(11)、(12)、(13)或(14)所示的聚糖，优选N-连接的聚糖，如上文所述，更优选如式(1)、(9)、(10)或(11)所示且甚至更优选如式(1)或(10)所示的聚糖，优选N-连接的聚糖。最优选地，含有末端GlcNAc部分的聚糖是如式(1)所示的N-连接的聚糖。

在本发明的方法的一个优选的实施方案中，包含含有末端GlcNAc部分的聚糖的糖蛋白是抗体，更优选如式(7)、(8)或(8b)所示的抗体，其中蛋白(Pr)是抗体(Ab)。并且，当待修饰的糖蛋白是抗体且所述抗体包含多于一个聚糖(y为2或更多)时，所述聚糖可互不相同。抗体还可以包含一个或多个不含有末端GlcNAc部分的聚糖。并且，当待修饰的糖蛋白是抗体时，优选含有末端GlcNAc部分的聚糖是如式(1)、(9)、(10)、(11)、(12)、(13)或(14)所示，更优选如式(1)、(9)、(10)或(11)所示，甚至更优选如式(1)或(10)所示的聚糖，如上文所述。在该实施方案中，进一步优选含有末端GlcNAc部分的聚糖是如式(1)、(9)、(10)、(11)、(12)、(13)或(14)所示的N-连接的聚糖，更优选如式(1)、(9)、(10)或(11)所示的N-连接的聚糖，最优选如式(1)或(10)所示的N-连接的聚糖。

当待修饰的糖蛋白是抗体时，优选y为1、2、3、4、5、6、7或8，更优选y为1、2、4、6或8，甚至更优选y是1、2或4，最优选y是1或2。

如上所定义，所述抗体可以是全抗体，但也可以是抗体片段。当抗体是全抗体时，所述抗体优选在每条重链上包含一个或多个，更优选一个末端非还原性GlcNAc聚糖。因此，所述全抗体优选包含2种或更多种，优选2种、4种、6种或8种所述聚糖，更优选2种或4种，最优选2种聚糖。换言之，当所述抗体是全抗体时，y优选为2、4、6或8，更优选y为2或4，最优选y为2。当所述抗体是抗体片段时，优选y为1、2、3或4，更优选y为1或2。

在一个优选的实施方案中，所述抗体是单克隆抗体(mAb)。优选地，所述抗体选自IgA、IgD、IgE、IgG和IgM抗体。更优选地，所述抗体是IgG1、IgG2、IgG3或IgG4抗体，最优选地，所述抗体是IgG1抗体。

在本发明的方法中，包含岩藻糖基化以及非岩藻糖基化的聚糖的糖蛋白混合物可以用作起始糖蛋白。所述混合物例如可以包含含有一个或多个岩藻糖基化的(b为1)聚糖(1)和/或(2)和/或一个或多个非岩藻糖基化的(b为0)聚糖(1)和/或(2)的糖蛋白。因此，在本发明的方法之前从岩藻糖基化的聚糖中除去岩藻糖不是必需的，而是任选的。

包含含有末端GlcNAc部分的聚糖的糖蛋白在本文中也称为“末端非还原性GlcNAc蛋白”，含有末端GlcNAc部分的聚糖在本文中也称为“末端非还原性GlcNAc聚糖”。应注意，术语“末端非还原性GlcNAc蛋白”包括其中b为1的式(7)的蛋白，术语“末端非还原性GlcNAc聚糖”包括其中b为1的式(1)的聚糖。

末端非还原性GlcNAc蛋白可以包含一个或多个直链和/或一个或多个支链的末端非还原性GlcNAc聚糖。聚糖经由聚糖核心糖部分的C1键合至蛋白，并且所述核心糖部分优选是核心GlcNAc部分。因此，当键合至蛋白的末端非还原性GlcNAc聚糖是如式(2)所示的聚糖时，优选d是1。更优选地，当聚糖如式(2)所示时，d为1且e为1。

在优选的实施方案中，末端非还原性GlcNAc聚糖的核心糖部分的C1经由N-糖苷键键合至蛋白，所述N-糖苷键键合至所述蛋白中的氨基酸残基中的氮原子，更优选键合至天冬酰胺(Asn)或精氨酸(Arg)氨基酸的侧链中的氮原子。然而，非还原性GlcNAc聚糖的核心糖部分的C1也可以经由O-糖苷键键合至蛋白，所述O-糖苷键键合至所述蛋白中的氨基酸残基中的氧原子，更优选键合至丝氨酸(Ser)或苏氨酸(Thr)氨基酸的侧链中的氧原子。在该实施方案中，优选所述聚糖的核心糖部分是GlcNAc部分或GalNAc部分，优选GlcNAc部分。非还原性GlcNAc聚糖的核心糖部分的C1也可以经由C-糖苷键键合至蛋白，所述C-糖苷键键合至蛋白上的碳原子，例如键合至色氨酸(Trp)。如上文所述，糖蛋白可以包含多于一个聚糖，并且可以包含N-连接的、O-连接的和/或C-连接的聚糖的组合。

末端非还原性GlcNAc聚糖可以存在于蛋白的天然糖基化位点，但也可以被引入蛋白的不同位点上。

当糖蛋白是抗体时，优选包含末端GlcNAc部分的聚糖连接至Fc片段中的区域290-305中的天冬酰胺处(通常在N297处)的保守N-糖基化位点。

可在本发明的方法中被修饰的末端非还原性GlcNAc蛋白的几个实例示于图1中。图1(A)示出了包含单个、任选地岩藻糖基化的GlcNAc部分的糖蛋白。该GlcNAc聚糖可以例如经由N-糖苷键或O-糖苷键连接至蛋白。图1(A)中的糖蛋白可以例如通过常规表达，然后用内切糖苷酶或内切糖苷酶的组合修剪(trimming)而获得。图1(B)示出了包含支链寡糖聚糖的糖蛋白，其中支链之一含有末端GlcNAc部分(该聚糖也称为GnM₅)。核心GlcNAc部分可任选地被岩藻糖基化。图1(B)中的糖蛋白可以例如通过在苦马豆素的存在下在哺乳动物系统中表达糖蛋白或通过在工程宿主生物体(例如LeC1 CHO或毕赤酵母)中表达而获得。图1(C)示出了包含单个、任选地岩藻糖基化的GlcNAc部分的抗体。该GlcNAc聚糖优选地经由N-糖苷键连接至抗体。图1(C)中的糖蛋白可例如通过常规表达、接着用内切糖苷酶或内切糖苷酶的组合修剪来获得。图1(D)示出了包含支链寡糖聚糖的抗体，其中核心GlcNAc部分被任选地岩藻糖基化，并且其中所有支链含有末端GlcNAc部分。图1(D)中的糖蛋白可以例如通过在唾液酸酶和半乳糖苷酶的组合作用下修剪抗体糖型(G0、G1、G2、G0F、G1F和G2F)的常规混合物而获得。

在图2中示出了用于修饰糖蛋白的方法的实施方案，其中糖蛋白是抗体。在该实施方案中，在为或衍生自β-(1,4)-N-乙酰半乳糖胺转移酶的糖基转移酶的作用下，将糖衍生物Su(A)从Su(A)-Nuc转移至抗体聚糖的末端GlcNAc部分，以形成经修饰的抗体。

如上文所述，本发明的用于修饰糖蛋白的方法还可以包括以下步骤：提供包含含有末端GlcNAc部分的聚糖的糖蛋白，因此本发明还涉及用于修饰糖蛋白的方法，其包括以下步骤：

(1)提供包含含有末端GlcNAc部分的聚糖的糖蛋白，其中含有末端GlcNAc部分的聚糖如式(1)或(2)所示，如上文所定义；以及

(2)在糖基转移酶的存在下、更特别是在糖基转移酶的作用下，使所述糖蛋白与糖衍生物核苷酸Su(A)-Nuc接触，其中所述糖基转移酶为或衍生自β-(1,4)-N-乙酰半乳糖胺转移酶，其中Su(A)-Nuc如式(3)所示，如上所定义。

当例如在本发明的方法中待修饰的糖蛋白包含式(1)的聚糖时，在方法的步骤(1)中，待修饰的糖蛋白可以通过包括以下步骤的方法来提供：在合适的酶，优选内切糖苷酶的作用下修剪包含寡糖聚糖的糖蛋白。

在大量的聚糖中，第二GlcNAc残基与直接键合至糖蛋白的GlcNAc残基键合，也如图1(B)和(C)所示。可以修剪其中第二GlcNAc残基与直接键合至糖蛋白的GlcNAc残基键合的聚糖，以获得包含式(1)的聚糖的糖蛋白。修剪发生在所述两个GlcNAc残基之间。

“合适的酶”定义为待修剪的聚糖是其底物的酶。在本发明的方法的该具体实施方案的步骤(1)中待使用的酶的优选类型取决于被修剪的特定的聚糖。在本发明的方法的该具体实施方案的一个优选实施方案中，所述方法的该具体实施方案的步骤(1)中的酶选自内切糖苷酶。

内切糖苷酶能够切割聚糖结构中的内部糖苷键，这为重构和合成工作提供了益处。例如，当内切糖苷酶在保守的聚糖区域内的可预测位点切割时，可以用于使异源聚糖群体容易均化。在这方面，最重要的一类糖苷内切酶包括内-β-N-乙酰葡糖苷酶(EC3.2.1.96，通常称为Endo和ENGase)，一类通过水解N,N’-二乙酰基壳二糖核心中的β-1,4-糖苷键从糖蛋白中除去N-聚糖的水解酶(Wong等人Chem.Rev.2011,111,4259的综述，通过引用的方式纳入本文)，留下单核心N-连接的GlcNAc残基。发现内-β-N-乙酰葡糖苷酶以普通的化学酶变体广泛分布于自然界，所述化学酶变体包括对寡甘露糖特异的Endo D；对高甘露糖特异的Endo A和Endo H；范围从高甘露糖到双触角复合物的Endo F亚型；可以切割除藻糖基化聚糖以外的大多数N-聚糖结构(高甘露糖/复合型/杂合型)，并且对高甘露糖型寡糖的水解活性显著高于对复合型和杂合型寡糖的水解活性的Endo M。这些ENGase对远端N-聚糖结构而不是显示其的蛋白表现出特异性，使得它们可用于在天然条件下从糖蛋白切割大多数N-连接的聚糖。

内切糖苷酶F1、F2和F3最适合天然蛋白的去糖基化。endo F1、F2和F3的连接特异性表明可除去所有类别的N-连接的寡糖而不使蛋白变性的蛋白去糖基化的一般策略。双触角和三触角结构可以分别通过内切糖苷酶F2和F3立即除去。低聚甘露糖和杂合结构可以通过Endo F1除去。

Endo F3的独特之处在于其裂解对寡糖的肽键的状态以及核心岩藻糖基化的状态敏感。内切糖苷酶F3切割天冬酰胺连接的双触角和三触角复合寡糖。它将以缓慢的速率切割非岩藻糖基化的双触角和三触角结构，但仅当肽连接时。核心岩藻糖基化的双触角结构是Endo F3的有效底物，其活性最高达高400倍。对寡甘露糖和杂合分子没有活性。参见例如Tarentino等人Glycobiology 1995,5,599，通过引用的方式纳入本文。

Endo S是来自酿脓链球菌(Streptococcus pyogenes)的分泌的糖苷内切酶，并且也属于糖苷水解酶家族18，如由Collin等人(EMBO J.2001,20,3046，通过引用的方式纳入本文)所公开的。与上述ENGase相比，Endo S具有更明确的特异性，并且仅特异性用于切割人IgG的Fc结构域中的保守N-聚糖(迄今为止尚未鉴定到其他底物)，这表明酶和IgG之间的蛋白-蛋白相互作用提供了这种特异性。

Endo S49，也称为Endo S2，记载于WO 2013/037824(Genovis AB)中，其通过引用的方式纳入本文。Endo S49分离自酿脓链球菌NZ131，并且是Endo S的同源物。Endo S49对天然IgG具有特异性内切糖苷酶活性，并且比Endo S切割更多种类的Fc聚糖。

在一个优选的实施方案中，本实施方案步骤(1)中的酶是内-β-N-乙酰葡糖苷酶。在其他优选的实施方案中，内-β-N-乙酰葡糖苷酶选自Endo S、Endo S49、Endo F1、EndoF2、Endo F3、Endo H、Endo M和Endo A或其组合。

当待修剪的聚糖是复合型的双触角结构时，内-β-N-乙酰葡糖苷酶优选选自EndoS、Endo S49、Endo F1、Endo F2和Endo F3或其组合。

当糖蛋白是抗体并且待修剪的寡糖是复合型的双触角结构(即如图1(C)所示)，并且其存在于N297处的IgG保守的N-糖基化位点时，内-β-N-乙酰葡糖苷酶优选选自Endo S、Endo S49、Endo F1、Endo F2和Endo F3或其组合，更优选选自Endo S和Endo S49或其组合。

当糖蛋白是抗体并且待修剪的聚糖是复合型的双触角结构，并且其不存在于N297处的IgG保守的N-糖基化位点时，内-β-N-乙酰葡糖苷酶优选选自Endo F1、Endo F2和EndoF3或其组合。

当待修剪的聚糖为高甘露糖时，内-β-N-乙酰葡糖苷酶优选选自Endo H、Endo M、Endo A和Endo F1。

因此，当在本发明的方法中待修饰的糖蛋白包含式(1)的聚糖时，在所述方法的步骤(1)中，优选通过包括以下步骤的方法提供待修饰的糖蛋白：通过内-β-N-乙酰葡糖苷酶的作用修剪包含寡糖聚糖的糖蛋白的聚糖，以提供包含式(1)的聚糖的糖蛋白。

在其他优选的实施方案中，内-β-N-乙酰葡糖苷酶选自Endo S、Endo S49、EndoF1、Endo F2、Endo F3、Endo H、Endo M和Endo A及其任意组合。更优选地，内-β-N-乙酰葡糖苷酶选自Endo S、Endo S49、Endo H、Endo F1、Endo F2和Endo F3及其任意组合。甚至更优选地，内-β-N-乙酰葡糖苷酶为Endo S或Endo S49。最优选地，内-β-N-乙酰葡糖苷酶是EndoH或Endo S的组合。

通过用内切糖苷酶处理糖型G0、G1、G2、G0F、G1F和G2F的混合物来提供包含式(1)的聚糖的糖蛋白的方法示于图4中。图4示出了用内切糖苷酶处理包含糖型G0、G1、G2、G0F、G1F和G2F(所述糖型示于图3中)的混合物的糖蛋白(在这种情况下为抗体)，然后使用β-(1,4)-GalNAcT酶从UDP-GalNAz转移例如N-叠氮基乙酰半乳糖胺(GalNAz)，产生式(32)的经修饰的抗体。

当例如在本发明的方法中待修饰的糖蛋白包含式(9)的聚糖时，可以以多种方式提供包含所述聚糖的糖蛋白(也称为“GnM5”)。在该实施方案中，优选糖蛋白通过在苦马豆素存在下杂合的N-糖蛋白的表达来提供，例如在Kanda等人，Glycobiology 2006,17,104中所述的(通过引用的方式纳入本文)，并且如果必要的话随后进行唾液酸酶/半乳糖苷酶处理。替代方法包括对宿主生物体的基因工程。例如，LeC1CHO是缺乏表达Mns-II的基因的敲除CHO细胞系。因此，N-聚糖的生物合成不可避免地停止在聚糖(可从上清液中分离纯化)的GnM₅阶段。更大规模的方法需要工程改造不正常编程以产生杂合或复合N-聚糖的宿主生物体，例如酵母或昆虫细胞。然而，已经充分证明了这些非哺乳动物宿主细胞(例如Glycoswitch^TM)也可用于选择性表达特定N-糖蛋白的单一糖型，包括GnM₅型聚糖和M₅型聚糖。

因此，当在本发明的方法中待修饰的糖蛋白包含式(9)的聚糖时，在所述方法的步骤(1)中，包含式(9)的任选岩藻糖基化的聚糖的糖蛋白优选通过包括在苦马豆素存在下在宿主生物体中表达糖蛋白的方法来提供。优选地，所述宿主生物体是哺乳动物细胞系，例如HEK293或NS0或CHO细胞系。所得糖蛋白可作为包含以下聚糖的蛋白的混合物而获得：式(9)的聚糖(也称为GnM₅)、称为GalGnM5的聚糖、称为SiaGalGnM₅的唾液酸化聚糖和/或其混合物。可以通过用唾液酸酶(除去唾液酸部分)和/或β-半乳糖苷酶(除去半乳糖部分)处理糖蛋白来除去非还原性唾液酸和/或半乳糖部分(如果存在)，从而得到包含式(9)的聚糖的糖蛋白。优选地，用唾液酸酶和β-半乳糖苷酶的处理发生在(1b)中的单一步骤中。在该实施方案中，进一步优选在所述方法的步骤(1)中，通过包括以下步骤的方法提供待修饰的糖蛋白：

(1a)在苦马豆素存在下，在宿主生物体中表达糖蛋白；以及

(1b)用唾液酸酶和/或β-半乳糖苷酶处理所获得的糖蛋白，以获得包含式(9)的聚糖的糖蛋白。

当在本发明的方法中待修饰的糖蛋白包含式(10)的聚糖时，在所述方法的步骤(1)中，待修饰的糖蛋白可以例如通过包括以下步骤的方法提供：用唾液酸酶和半乳糖苷酶处理糖蛋白的糖型G0、G1、G2、G0F、G1F和G2F的混合物。在图3中，示出了包含双触角聚糖的抗体的糖型G0、G1、G2、G0F、G1F和G2F。

图4示出了提供包含式(10)的聚糖的糖蛋白(在这种情况下为抗体)的方法：用唾液酸酶和半乳糖苷酶处理糖型G0、G1、G2、G0F、G1F和G2F的混合物，然后在为β-(1,4)-GalNAcT或衍生自β-(1,4)-GalNAcT的糖基转移酶的作用下从糖衍生物核苷酸Su(A)-UDP(其中A是叠氮基，例如6-叠氮基-GalNAc-UDP)转移糖部分，得到式(33)的经修饰的抗体。

糖衍生物核苷酸Su(A)-Nuc

在本发明的修饰糖蛋白的方法中，包含式(1)或(2)的聚糖的糖蛋白在为β-(1,4)-GalNAcT或衍生自β-(1,4)-GalNAcT的糖基转移酶的作用下与糖衍生物核苷酸Su(A)-Nuc接触。糖衍生物核苷酸Su(A)-Nuc如式(3)所示：

其中Nuc、R¹⁴、a、f、g、U、T、A、Z和Y如上文所定义。

Nuc在本文中定义为核苷酸。Nuc优选选自核苷一磷酸和核苷二磷酸，更优选选自尿苷二磷酸(UDP)、鸟苷二磷酸(GDP)、胸苷二磷酸(TDP)、胞苷二磷酸(CDP)和胞苷一磷酸(CMP)，更优选选自尿苷二磷酸(UDP)、鸟苷二磷酸(GDP)和胞苷二磷酸(CDP)。最优选地，Nuc为尿苷二磷酸(UDP)。因此，在本发明的方法的一个优选的实施方案中，Su(A)-Nuc(3)是Su(A)-UDP(34)：

其中R¹⁴、a、f、g、U、T、A、Z和Y如上文所定义。

在一个实施方案中，A是叠氮基-N₃。

在另一个实施方案中，A是酮基-C(O)R³，其中R³是任选取代的C₁-C₂₄烷基，优选任选取代的C₁-C₁₂烷基，更优选任选取代的C₁-C₆烷基。甚至更优选地，R³是甲基、乙基、正丙基、异丙基、正丁基、仲丁基或叔丁基，最优选地，R³是甲基。

在另一个实施方案中，A是炔基。换言之，A是包含C≡C键的官能部分，优选(杂)环炔基或-(CH₂)_iC≡C-R⁴部分。在一个实施方案中，炔基是(杂)环炔基，优选(杂)环辛炔基。在一个优选的实施方案中，炔基是-(CH₂)_iC≡C-R⁴，其中i是0-10且R⁴是氢或任选取代的C₁-C₂₄烷基，优选氢或任选取代的C₁-C₁₂烷基，更优选氢或任选取代的C₁-C₆烷基。甚至更优选地，R⁴是氢、甲基、乙基、正丙基、异丙基、正丁基、仲丁基或叔丁基，更优选地，R⁴是氢或甲基。优选地，i是0、1、2、3、4、5或6，更优选地，i是0、1、2、3或4，甚至更优选地，i是0、1或2，还甚至更优选地，i是0或1，最优选地，i是1。更优选地，R⁴是氢、甲基、乙基、正丙基、异丙基、正丁基、仲丁基或叔丁基且i是0、1或2。甚至更优选地，R⁴是氢或甲基且i是0、1或2。在该实施方案中，进一步优选炔基是末端炔基，即R⁴最优选为氢。在特别优选的实施方案中，炔基是-CH₂-C≡CH或-C≡CH，最优选地，-CH₂-C≡CH。

在另一个实施方案中，A是巯基-SH。

在另一个实施方案中，A是巯基-SC(O)R⁸的前体，其中R⁸是任选取代的C₁-C₂₄烷基或苯基。优选地，R⁸是任选取代的C₁-C₁₂烷基或苯基，更优选R⁸是任选取代的C₁-C₆烷基或苯基，甚至更优选R⁸是甲基、乙基、正丙基、异丙基、正丁基、仲丁基、叔丁基或苯基。甚至更优选地，R⁸是甲基或苯基，最优选地，R⁸是甲基。在本发明的用于修饰糖蛋白的方法中，可以使用其中A是巯基前体的糖衍生物核苷酸。在该过程中，巯基前体转化为巯基。

在另一个实施方案中，A是-SC(V)OR⁸，其中V是O或S，R⁸是任选取代的C₁-C₂₄烷基或苯基。在一个优选的实施方案中，A是-SC(O)OR⁸。在另一个优选的实施方案中，A是-SC(S)OR⁸。当A是-SC(O)OR⁸以及当A是-SC(S)OR⁸时，R⁸优选是任选取代的C₁-C₁₂烷基或苯基，更优选R⁸是任选取代的C₁-C₆烷基或苯基，甚至更优选R⁸是甲基、乙基、正丙基、异丙基、正丁基、仲丁基、叔丁基或苯基。甚至更优选地，R⁸是甲基或苯基，最优选地，R⁸是甲基。

在另一个实施方案中，A是卤素X。X选自F、Cl、Br和I，优选选自Cl、Br和I，更优选选自Cl和Br。最优选地，X是Cl。

在另一个实施方案中，A是磺酰氧基-OS(O)₂R⁵，其中R⁵选自C₁-C₂₄烷基、C₆-C₂₄芳基、C₇-C₂₄烷基芳基和C₇-C₂₄芳基烷基，烷基、芳基、烷基芳基和芳基烷基被任选地取代。优选地，R⁵是C₁-C₁₂烷基、C₆-C₁₂芳基、C₇-C₁₂烷基芳基或C₇-C₁₂芳基烷基。更优选地，R⁵选自-CH₃、-C₂H₅、C₃直链或支链烷基、C₄直链或支链烷基、C₆-C₁₀芳基及C₇烷基芳基。甚至更优选地，R⁵是甲基、乙基、苯基或对甲苯基。最优选地，磺酰氧基为甲磺酸酯基(-OS(O)₂CH₃)、苯磺酸酯基(-OS(O)₂(C₆H₅))或甲苯磺酸酯基(-OS(O)₂C₆H₄CH₃)。

在另一个实施方案中，A是R¹²，其中R¹²选自任选取代的末端C₂-C₂₄烯基、C₃-C₅环烯基和C₄-C₈链二烯基。

术语“末端烯基”在本文中是指其中碳-碳双键位于烯基的末端的烯基。当R¹²是任选取代的末端C₂-C₂₄烯基时，末端C₂-C₂₄烯基优选以C＝CH₂部分、更优选以C(H)＝CH₂部分结束。优选地，R¹²是任选取代的末端C₂-C₁₂烯基，更优选任选取代的末端C₂-C₆烯基。更优选地，末端烯基是直链烯基，优选未取代的直链烯基。甚至更优选R¹²选自-C(H)＝CH₂、-CH₂-C(H)＝CH₂、-CH₂-CH₂-C(H)＝CH₂、-CH₂-CH₂-CH₂-C(H)＝CH₂和-CH₂-CH₂-CH₂-CH₂-C(H)＝CH₂。还甚至更优选地，R¹²选自-C(H)＝CH₂、-CH₂-C(H)＝CH₂和-CH₂-CH₂-C(H)＝CH₂。还甚至更优选地，R¹²为-C(H)＝CH₂或-CH₂-C(H)＝CH₂，最优选地，R¹²为-C(H)＝CH₂。

当R¹²是任选取代的末端C₃-C₅环烯基时，R¹²优选包含环丙烯基。更优选地，(任选取代的)C₃-C₅环烯基选自：

当R¹²是任选取代的C₄-C₈链二烯基时，优选C₄-C₈链二烯基以C＝CH₂部分、更优选C＝C(H)-C(H)＝CH₂部分结束。优选地，C₄-C₈链二烯基选自C(H)＝C(H)-C(H)＝CH₂、CH₂-C＝C(H)-C(H)＝CH₂和CH₂-CH₂-C＝C(H)-C(H)＝CH₂，更优选地选自C(H)＝C(H)-C(H)＝CH₂和CH₂-C＝C(H)-C(H)＝CH₂。当R¹²是任选取代的C₄-C₈链二烯基时，最优选R¹²是C(H)＝C(H)-C(H)＝CH₂。

在另一个实施方案中，A是R¹³，其中R¹³是任选取代的末端C₃-C₂₄丙二烯基。在本文中，术语“末端丙二烯基”是指其中C＝C＝C部分位于丙二烯基的末端的丙二烯基。末端C₃-C₂₄烯基优选以–C(H)＝C＝CH₂部分结束。优选地，R¹³是任选取代的末端C₃-C₁₂烯基，更优选任选取代的末端C₃-C₆烯基。更优选地，末端丙二烯基是直链丙二烯基，优选未取代的直链丙二烯基。甚至更优选地，R¹³选自-C(H)＝C＝CH₂、-CH₂-C(H)＝C＝CH₂、-CH₂-CH₂-C(H)＝C＝CH₂和-CH₂-CH₂-CH₂-C(H)＝C＝CH₂。还甚至更优选地，R¹³选自-C(H)＝C＝CH₂和-CH₂-C(H)＝C＝CH₂。最优选地，R¹³是-C(H)＝C＝CH₂。当A是R¹³时，特别优选在Su(A)-Nuc(3)中，U和T都不存在，即特别优选a是0且f是0。

在另一个实施方案中，A是N(R¹⁷)₂，其中R¹⁷独立地选自H、C₁-C₁₂烷基。在上下文中，优选的R¹⁷的烷基是C₁–C₆烷基，最优选C₁–C₄烷基。优选地，R¹⁷的至少一个为H且A为NHR¹⁷，最优选两个R¹⁷均为H且A为NH₂。当A为N(R¹⁷)₂时，优选在Su(A)-Nuc(3)中，Y不存在，即g为0，更优选U和T也都不存在，即特别优选g为0、a为0且f为0。

在本发明的方法的优选实施方案中，Su(A)-Nuc(3)中的A和下文更详细描述的(3)的优选实施方案选自-N₃、-C(O)R³、-SH、-(CH₂)_iC≡CR⁴和R¹²，其中i、R³、R⁴、R¹²及其优选实施方案如上文所定义。更优选地，A选自-N₃、-C(O)CH₃、-SH、-CH＝CH₂和-CH₂C≡CH。最优选A是N₃。

在糖衍生物核苷酸Su(A)-Nuc(3)及其优选实施方案(例如(34))中，R¹⁴选自：

其中W、h、a、f、T、A和U如上所定义。

在糖衍生物核苷酸Su(A)-Nuc(3)的优选实施方案中，R¹⁴选自：

其中W、h、a、f、T、A和U如上文所定义。

最优选R¹⁴是-NHAc。

当R¹⁴是-NHC(O)-(W)_h-(U)_f-(T)_a-A时，W、h、a、f、T、A和U如上文所定义。下文更详细地描述了W、h、a、f、T和U的优选实施方案。A的优选实施方案如上文更详细描述的。

在本发明的方法的优选实施方案中，Su(A)-Nuc(3)中的R¹⁴是-NHC(O)CH₃。在该实施方案中，糖衍生物核苷酸Su(A)-Nuc如式(3a)所示：

其中Nuc、Z、Y、U、T、A、g、f和a如上文所定义。

此外，当糖衍生物核苷酸Su(A)-Nuc如式(3a)所示或根据其优选实施方案时，优选Nuc为UDP。

此外，同样在Su(A)-Nuc(3a)中，A优选选自-N₃、-C(O)R³、-SH、-(CH₂)_iC≡CR⁴和R¹²，其中i、R³、R⁴、R¹²及其优选实施方案如上文所定义。更优选地，A选自-N₃、-C(O)CH₃、-SH、-CH＝CH₂和-CH₂C≡CH。最优选地，A是N₃。

在特别优选的实施方案中，在Su(A)-Nuc(3a)中Nuc是UDP，A选自-N₃、-C(O)R³、-SH、-(CH₂)_iC≡CR⁴和R¹²，其中i、R³、R⁴、R¹²及其优选实施方案如上文所定义。甚至更优选地，Nuc是UDP，A选自-N₃、-C(O)CH₃、-SH、-CH＝CH₂和-CH₂C≡CH。最优选地，Nuc是UDP，A是N₃。

在本发明的方法的另一个优选实施方案中，R¹⁴是-NHC(O)-(W)_h-(U)_f-(T)_a-A。在该实施方案中，糖衍生物核苷酸Su(A)-Nuc如式(3b)所示：

其中Nuc、Z、Y、U、T、A、W、h、g、f和a如上文所定义。

在糖衍生物核苷酸Su(A)-Nuc(3b)中，独立地选择A、T、U、a和f。换言之，(3b)的C2上的取代基中的A、T、U、a和f可以不同于(3b)的C6上的取代基中的A、T、U、a和f。

此外，当Su(A)-Nuc如式(3b)所示或根据其优选实施方案时，优选Nuc为UDP。

此外，同样在Su(A)-Nuc(3b)中，A优选选自-N₃、-C(O)R³、-SH、-(CH₂)_iC≡CR⁴和R¹²，其中i、R³、R⁴、R¹²及其优选实施方案如上文所定义。更优选地，A选自-N₃、-C(O)CH₃、-SH、-CH＝CH₂和-CH₂C≡CH。最优选地，A是N₃。

在特别优选的实施方案中，在Su(A)-Nuc(3b)中Nuc是UDP，A选自-N₃、-C(O)R³、-SH、-(CH₂)_iC≡CR⁴和R¹²，其中i、R³、R⁴、R¹²及其优选实施方案如上文所定义。甚至更优选地，Nuc是UDP，A选自-N₃、-C(O)CH₃、-SH、-CH＝CH₂和-CH₂C≡CH。最优选地，Nuc是UDP，A是N₃。

在本发明的方法的另一个优选实施方案中，R¹⁴是-OH。因此，在该实施方案中，糖衍生物核苷酸Su(A)-Nuc如式(3c)所示：

其中Nuc、Z、Y、U、T、A、g、f和a如上所定义。

此外，当糖衍生物核苷酸Su(A)-Nuc如式(3c)所示或根据其优选实施方案时，优选Nuc为UDP。

此外，同样在Su(A)-Nuc(3c)中，A优选选自-N₃、-C(O)R³、-SH、-(CH₂)_iC≡CR⁴和R¹²，其中i、R³、R⁴、R¹²及其优选实施方案如上文所定义。更优选地，A选自-N₃、-C(O)CH₃、-SH、-CH＝CH₂和-CH₂C≡CH。最优选地，A是N₃。

在特别优选的实施方案中，在Su(A)-Nuc(3c)中Nuc是UDP，A选自-N₃、-C(O)R³、-SH、-(CH₂)_iC≡CR⁴和R¹²，其中i、R³、R⁴、R¹²及其优选实施方案如上文所定义。甚至更优选地，Nuc是UDP，A选自-N₃、-C(O)CH₃、-SH、-CH＝CH₂和-CH₂C≡CH。最优选地，Nuc是UDP，A是N₃。

在本发明的方法的另一个优选实施方案中，R¹⁴是-N₃。因此，在该实施方案中，糖衍生物核苷酸Su(A)-Nuc如式(3d)所示：

其中Nuc、Z、Y、U、T、A、g、f和a如上文所定义。

此外，当糖衍生物核苷酸Su(A)-Nuc如式(3d)所示或根据其优选实施方案时，优选Nuc为UDP。

此外，同样在Su(A)-Nuc(3d)中，A优选选自-N₃、-C(O)R³、-SH、-(CH₂)_iC≡CR⁴和R¹²，其中i、R³、R⁴、R¹²及其优选实施方案如上所定义。更优选地，A选自-N₃、-C(O)CH₃、-SH、-CH＝CH₂和-CH₂C≡CH。最优选地，A是N₃。

在特别优选的实施方案中，在Su(A)-Nuc(3d)中Nuc是UDP，A选自-N₃、-C(O)R³、-SH、-(CH₂)_iC≡CR⁴和R¹²，其中i、R³、R⁴、R¹²及其优选实施方案如上文所定义。甚至更优选地，Nuc是UDP，A选自-N₃、-C(O)CH₃、-SH、-CH＝CH₂和-CH₂C≡CH。最优选地，Nuc是UDP，A是N₃。

在Su(A)-Nuc(3)及其优选实施方案(例如(34)、(3a)、(3b)、(3c)或(3d))中，T是C₃-C₁₂(杂)亚芳基，其中(杂)亚芳基被任选地取代。在一个优选的实施方案中，T不存在(a是0)。在另一个优选实施方案中，T存在(a是1)。当a为1时，(3)中的(杂)亚芳基T被A取代，其中A如上文所定义。

(杂)亚芳基T任选进一步被一个或多个取代基R²取代，其中R²独立地选自卤素(-F、-Cl、-Br、-I，优选-F、-Cl、-Br)、-CN、-NO₂、-C(O)R⁹、-C(O)OR⁹、-C(O)N(R¹⁰)₂、C₁-C₁₂烷基、C₂-C₁₂烯基、C₂-C₁₂炔基、C₃-C₁₂环烷基、C₅-C₁₂环烯基、C₈-C₁₂环炔基、C₁-C₁₂烷氧基、C₂-C₁₂烯氧基、C₂-C₁₂炔氧基、C₃-C₁₂环烷氧基、氨基(优选-N(R¹⁰)₂)、氧代基团和-Si(R⁷)₃基团，其中烷基、烯基、炔基、环烷基、环烯基、环炔基、烷氧基、烯氧基、炔氧基和环烷氧基被一个或多个选自O、N和S的杂原子任选地间隔，其中R⁷独立地选自C₁-C₁₂烷基、C₂-C₁₂烯基、C₂-C₁₂炔基、C₃-C₁₂环烷基、C₁-C₁₂烷氧基、C₂-C₁₂烯氧基、C₂-C₁₂炔氧基和C₃-C₁₂环烷氧基，其中烷基、烯基、炔基、环烷基、烷氧基、烯氧基、炔氧基和环烷氧基被任选地取代，其中R⁹是C₁-C₁₂烷基，其中R¹⁰独立地选自氢和C₁-C₁₂烷基。优选地，R⁹是C₁-C₆烷基，甚至更优选C₁-C₄烷基，最优选甲基、乙基、正丙基、异丙基、正丁基、仲丁基或叔丁基。优选地，R¹⁰是氢或C₁-C₆烷基，更优选氢或C₁-C₄烷基，最优选R¹⁰是氢、甲基、乙基、正丙基、异丙基、正丁基、仲丁基或叔丁基。

当R²是-Si(R⁷)₃基团时，优选R⁷独立地是C₁-C₁₂烷基，更优选独立地是C₁-C₆烷基，甚至更优选独立地是C₁-C₄烷基，最优选R⁷独立地是甲基、乙基、正丙基、异丙基、正丁基、仲丁基或叔丁基。

优选地，R²(存在时)独立地选自-F、-Cl、-Br、-I、-CN、-NO₂、-C(O)R⁹、-C(O)OR⁹、-C(O)N(R¹⁰)₂、C₁-C₁₂烷基、C₁-C₁₂烷氧基、氨基(-N(R¹⁰)₂)、氧代基团和-Si(R⁷)₃基团，其中R⁷、R⁹、R¹⁰以及R⁷、R⁹、R¹⁰的优选实施方案如上文所定义。

更优选地，R²(存在时)独立地选自-F、-Cl、-Br、-CN、-NO₂、-C(O)R⁹、-C(O)OR⁹、-C(O)N(R¹⁰)₂、C₁-C₆烷基、C₁-C₆烷氧基、氨基、氧代基团和-Si(R⁷)₃基团，其中R⁷、R⁹、R¹⁰以及R⁷、R⁹、R¹⁰的优选实施方案如上文所定义。

甚至更优选地，R²(存在时)独立地选自-F、-Cl、-Br、-CN、-NO₂、-C(O)R⁹、-C(O)OR⁹、-C(O)N(R¹⁰)₂、C₁-C₄烷基和C₁-C₄烷氧基，其中R⁹和R¹⁰以及R⁹和R¹⁰的优选实施方案如上文所定义。

还甚至更优选地，R²(存在时)独立地选自-F、-Cl、-Br、-CN、-NO₂、甲基、甲氧基、乙基、乙氧基、正丙基、正丙氧基、异丙基、异丙氧基、正丁基、正丁氧基、仲丁基、仲丁氧基、叔丁基和叔丁氧基。最优选地，R²(存在时)独立地选自-F、-Cl、-Br、-CN、-NO₂、甲基和甲氧基。

在一个优选的实施方案中，(3)中的(杂)亚芳基是未取代的。在另一个优选实施方案中，(3)中的(杂)亚芳基包含一个或多个取代基R²，其中R²和R²的优选实施方案如上文所定义。

术语“(杂)亚芳基”在本文中是指亚芳基以及杂亚芳基。术语“(杂)亚芳基”在本文中是指单环(杂)亚芳基以及双环(杂)亚芳基。Su(A)-Nuc(3)中的(杂)亚芳基可以是任何亚芳基或任何杂亚芳基。

在本发明的方法的一个优选实施方案中，(3)中的(杂)亚芳基T选自亚苯基、亚萘基、亚蒽基、亚吡咯基、亚吡咯鎓(pyrroliumylene)基、亚呋喃基、亚噻吩(thiophenylene)基(即亚噻吩(thiofuranylene)基)、亚吡唑基、亚咪唑基、亚嘧啶鎓(pyrimidiniumylene)基、亚咪唑鎓(imidazoliumylene)基、亚异噁唑基、亚噁唑基、亚噁唑鎓(oxazoliumylene)基、亚异噻唑基、亚噻唑基、1,2,3-亚三唑基、1,3,4-亚三唑基、亚二唑基、1-氧杂-2,3-亚二唑基、1-氧杂-2,4-亚二唑基、1-氧杂-2,5-亚二唑基、1-氧杂-3,4-亚二唑基、1-硫杂-2,3-亚二唑基、1-硫杂-2,4-亚二唑基、1-硫杂-2,5-亚二唑基、1-硫杂-3,4-亚二唑基、亚四唑基、亚吡啶基、亚哒嗪基、亚嘧啶基、亚吡嗪基、亚吡二嗪基、亚吡啶鎓(pyridiniumylene)基、亚嘧啶鎓(pyrimidiniumylene)基、亚苯并呋喃基、亚苯并噻吩基、亚苯并咪唑基、亚吲唑基、亚苯并三唑基、吡咯并[2,3-b]亚吡啶基、吡咯并[2,3-c]亚吡啶基、吡咯并[3,2-c]亚吡啶基、吡咯并[3,2-b]亚吡啶基、咪唑并[4,5-b]亚吡啶基、咪唑并[4,5-c]亚吡啶基、吡唑并[4,3-d]亚吡啶基、吡唑并[4,3-c]亚吡啶基、吡唑并[3,4-c]亚吡啶基、吡唑并[3,4-b]亚吡啶基、亚异吲哚基、亚吲唑基、亚嘌呤基、亚二氢吲哚基(indolininylene group)、咪唑并[1,2-a]亚吡啶基、咪唑并[1,5-a]亚吡啶基、吡唑并[1,5-a]亚吡啶基、吡咯并[1,2-b]亚哒嗪基、咪唑并[1,2-c]亚嘧啶基、亚喹啉基、亚异喹啉基、亚噌啉基、亚喹唑啉基、亚喹喔啉基、亚酞嗪基、1,6-亚萘啶基、1,7-亚萘啶基、1,8-亚萘啶基、1,5-亚萘啶基、2,6-亚萘啶基、2,7-亚萘啶基、吡啶并[3,2-d]亚嘧啶基、吡啶并[4,3-d]亚嘧啶基、吡啶并[3,4-d]亚嘧啶基、吡啶并[2,3-d]亚嘧啶基、吡啶并[2,3-b]亚吡嗪基、吡啶并[3,4-b]亚吡嗪基、嘧啶并[5,4-d]亚嘧啶基、吡嗪并[2,3-b]亚吡嗪基和嘧啶并[4,5-d]亚嘧啶基，所有的基团任选地用一个或多个取代基R²取代，其中R²和R²的优选实施方案如上文所定义。

在其他优选的实施方案中，(杂)亚芳基T选自亚苯基、亚吡啶基、亚吡啶鎓基、亚嘧啶基、亚嘧啶鎓基、亚吡嗪基、亚吡二嗪基、亚吡咯基、亚吡咯鎓基、亚呋喃基、亚噻吩基(即亚噻吩(thiofuranylene)基)、亚二唑基、亚喹啉基、亚咪唑基、亚嘧啶鎓基、亚咪唑鎓基、亚噁唑基和亚噁唑鎓基，所有的基团任选地用一个或多个取代基R²取代，其中R²和R²的优选实施方案如上文所定义。

甚至更优选地，(杂)亚芳基T选自亚苯基、亚吡啶基、亚吡啶鎓基、亚嘧啶基、亚嘧啶鎓基、亚咪唑基、亚嘧啶鎓基、亚咪唑鎓基、亚吡咯基、亚呋喃基和亚噻吩基，所有的基团任选地用一个或多个取代基R²取代，其中R²和R²的优选实施方案如上文所定义。

最优选地，(杂)芳基T选自亚苯基、亚咪唑基、亚咪唑鎓基、亚嘧啶鎓基、亚吡啶基、亚吡啶鎓基，所有的基团任选地用一个或多个取代基R²取代，其中R²和R²的优选实施方案如上文所定义。

在Su(A)-Nuc(3)及其优选实施方案(例如(34)、(3a)、(3b)、(3c)或(3d))中，U可以存在(f是1)或不存在(f是0)。存在时，U是[C(R¹)₂]_n，其中n是1至24的整数；或U是[C(R¹)₂]_p-O-[C(R¹)₂C(R¹)₂O]_o-[C(R¹)₂]_q，其中o是0至12的整数，p和q独立地为0、1或2，R¹独立地选自H、F、Cl、Br、I、OH和任选取代的C₁-C₂₄烷基。当U是[C(R¹)₂]_p-O-[C(R¹)₂C(R¹)₂O]_o-[C(R¹)₂]_q时，优选p、o和q中的至少一个不是0。

在优选的实施方案中，U不存在，即f是0。

在另一个优选的实施方案中，U存在，即f是1。

当U是[C(R¹)₂]_n时，n是1至24的整数，n优选1至12的整数。更优选n为1、2、3、4、5、6、7或8，甚至更优选n为1、2、3、4、5或6，还甚至更优选n为1、2、3或4，还甚至更优选n为1、2或3，最优选n为1或2。

R¹独立地选自H、F、Cl、Br、I和任选取代的C₁-C₂₄烷基，优选选自H、F、Cl、Br、I和任选取代的C₁-C₁₂烷基，更优选选自H、F、Cl、Br、I和任选取代的C₁-C₆烷基。甚至更优选地，R¹独立地选自H、F、Cl、Br、I、甲基、乙基、正丙基、异丙基、正丁基、仲丁基或叔丁基。甚至更优选地，R¹独立地选自H、F、Cl和甲基，最优选地，R¹独立地选自H和F。

当U为[C(R¹)₂]_n且n为1或2时，Su(A)-Nuc中的-[C(R¹)₂]_n-部分的优选实例包括-(CH₂)-、-(CF₂)-、-(CCl₂)-、-(CBr₂)-、-(CMe₂)-、-(CH₂CH₂)-、-(CH₂CF₂)-、-(CH₂CCl₂)-、-(CH₂CBr₂)-、-(CH₂CI₂)-、-(CH₂CMe₂)-、-(CF₂CF₂)-、-(CCl₂CCl₂)-、-(CBr₂CBr₂)-和-(CMe₂CMe₂)-，更优选地，-(CH₂)-、-(CF₂)-、-(CH₂CH₂)-、-(CH₂CF₂)-和-(CF₂CF₂)-。

当U为[C(R¹)₂]_n且n为3或更大时，Su(A)-Nuc中的-[C(R¹)₂]_n-部分的优选实例包括-(C_nH_2n)-、-(C_nF_2n)-、-(C_nCl_2n)-、-(C_nBr_2n)-、-(C_(n-1)H_2(n-1)CF₂)-、-(C_(n-1)H_2(n-1)CCl₂)-、-(C_(n-1)H_2(n-1)CBr₂)-和-(C_(n-1)H_2(n-1)CMe₂)-，例如-(C₃H₆)-、-(C₃F₆)-、-(C₃Cl₆)-、-(C₃Br₆)-、-(CH₂CH₂CF₂)-、-(CH₂CH₂CCl₂)-、-(CH₂CH₂CBr₂)-和-(C₄H₈)-。更优选的实例包括-(C_nH_2n)-、-(C_nF_2n)-，例如-(C₃H₆)-、-(C₄H₈)-、-(C₃F₆)-和-(C₄F₈)-。

当U为[C(R¹)₂]_p-O-[C(R¹)₂C(R¹)₂O]_o-[C(R¹)₂]_q时，o是0至12的整数，p和q独立地为0、1或2。优选地，o是1至10的整数，更优选地，o是1、2、3、4、5、6、7或8，甚至更优选地，o是1、2、3、4、5或6，还甚至更优选地，o是1、2、3或4，还甚至更优选地，o是1、2或3，还甚至更优选地，o是1或2，最优选地，o是1。在另一个优选的实施方案中，o为0。特别优选o为0、1或2。当o为0时，进一步优选当p为0时，q为1或2，当q为0时，p为1或2。

当U为[C(R¹)₂]_p-O-[C(R¹)₂C(R¹)₂O]_o-[C(R¹)₂]_q且o和/或p和/或q为1或更大时，R¹独立地选自H、F、Cl、Br、I和任选取代的C₁-C₂₄烷基，优选选自H、F、Cl、Br、I和任选取代的C₁-C₁₂烷基，更优选选自H、F、Cl、Br、I和任选取代的C₁-C₆烷基。甚至更优选地，R¹独立地选自H、F、Cl、Br、I、甲基、乙基、正丙基、异丙基、正丁基、仲丁基或叔丁基。甚至更优选地，R¹独立地选自H、F、Cl和甲基。最优选地，R¹为H。

当U是[C(R¹)₂]_p-O-[C(R¹)₂C(R¹)₂O]_o-[C(R¹)₂]_q时，Su(A)-Nuc中的-[C(R¹)₂]_p-O-[C(R¹)₂C(R¹)₂O]_o-[C(R¹)₂]_q-部分的优选实例包括-CH₂-O-、-(CH₂)₂-O-、-O-CH₂-、-O-(CH₂)₂-、-CH₂-O-(CH₂CH₂O)_o-、-(CH₂)₂-O-(CH₂CH₂O)_o-、-O-(CH₂CH₂O)_o-、-O-(CH₂CH₂O)_o-CH₂-、-O-(CH₂CH₂O)_o-(CH₂)₂-、-CH₂-O-(CH₂CH₂O)_o-CH₂-、-CH₂-O-(CH₂CH₂O)_o-(CH₂)₂-、-(CH₂)₂-O-(CH₂CH₂O)_o-CH₂-和-(CH₂)₂-O-(CH₂CH₂O)_o-(CH₂)₂-，其中o是1、2、3、4、5或6，优选o是1、2、3或4，更优选o是1或2，最优选o是1。

在糖衍生物核苷酸Su(A)-Nuc(3)及其优选实施方案(例如(34)、(3a)、(3b)、(3c)或(3d))中，优选a和f不都为0。在另一个优选的实施方案中，a为0且f为1，或者a为1且f为0。在这些实施方案中，g可为0或1。

在本发明方法的优选实施方案中，a为0，f为1且U为[C(R¹)₂]_n。在该实施方案中，进一步优选a是0，f为1且n为1至12，更优选a为0，f为1且n为1、2、3、4、5、6、7或8，甚至更优选a为0，f为1且n为1、2、3、4、5或6，还甚至更优选a为0，f为1且n为1、2、3或4，还甚至更优选a为0，f为1且n为1或2，最优选a为0，f为1且n为1。[C(R¹)₂]_n的优选实例如上文更详细描述的。

在本发明的方法的另一个优选实施方案中，a为0，f为1且U为[C(R¹)₂]_p-O-[C(R¹)₂C(R¹)₂O]_o-[C(R¹)₂]_q。更优选p、o和q不都为0，即o为1至12的整数和/或p为1或2和/或q为1或2。在该实施方案中，进一步优选a为0，f为1且o为1至12，更优选a为0，f为1且o为1至10，甚至更优选a为0，f为1且o为1、2，1、2、3、4、5、6、7或8，甚至更优选地，a为0，f为1且o为1、2、3、4、5或6，还甚至更优选地，a为0，f为1且o为1、2、3或4，还甚至更优选a为0，f为1且o为1或2，最优选a为0，f为1且o为1。同样在该实施方案中，p和q独立地为0、1或2。[C(R¹)₂]_p-O-[C(R¹)₂C(R¹)₂O]_o-[C(R¹)₂]_q的优选实例如上文更详细描述的。

在另一个优选实施方案中，a为1，f为1且U为[C(R¹)₂]_n。在该实施方案中，进一步优选n为1至12，更优选n为1、2、3、4、5、6、7或8，甚至更优选n为1、2、3、4、5或6，还甚至更优选n为1、2、3或4，还甚至更优选n为1或2，最优选n为1。[C(R¹)₂]_n的优选实例如上文更详细描述的。

在另一个优选实施方案中，a为1，f为1且U为[C(R¹)₂]_p-O-[C(R¹)₂C(R¹)₂O]_o-[C(R¹)₂]_q，o为1至12的整数，p和q独立地为0、1或2。在该实施方案中，进一步优选o为1至10，更优选o为1、2、3、4、5、6、7或8，甚至更优选o为1、2、3、4、5或6，还甚至更优选o为1、2、3或4，还甚至更优选o为1或2，最优选o为1。在该实施方案中，p和q独立地为0、1或2。[C(R¹)₂]_p-O-[C(R¹)₂C(R¹)₂O]_o-[C(R¹)₂]_q的优选实例如上文更详细描述的。

如上文所定义，在Su(A)-Nuc(3)及其优选实施方案(例如(34)、(3a)、(3b)、(3C)或(3d))中，Z为CH₂、CF₂或C(O)；或Z为CHOH，条件是g为0、f为1且a为0或1。在优选的实施方案中，Z选自CH₂、CF₂和C(O)。在另一个优选的实施方案中，Z为CHOH，条件是g为0、f为1且a为0或1。

在Su(A)-Nuc(3)及其优选实施方案(例如(34)、(3a)、(3b)、(3C)或(3d))中，Y可以不存在(g为0)或存在(g为1)。当Y存在时，Y选自O、S、N(R¹⁵)、N(R¹⁵)C(O)、N(R¹⁵)C(O)N(R¹⁵)、N(R¹⁵)C(O)O、OC(O)N(R¹⁵)S(O)₂N(R¹⁵)和N(R¹⁵)C(O)N(R¹⁵)S(O)₂O，其中R¹⁵独立地选自H、C₁-C₁₂烷基和(U)_f-(T)_a-A，其中f、a、U、T和A如上所定义。优选地，Y选自O、S、N(R¹⁵)、NHC(O)、NHC(O)N(R¹⁵)、NHC(O)O，OC(O)NHS(O)₂NH和NHC(O)NHS(O)₂O，其中R¹⁵独立地选自H、C₁-C₁₂烷基和(U)_f-(T)_a-A，其中f、a、U、T和A如上文所定义。在这些实施方案中，进一步优选R¹⁵独立地选自H、C₁–C₆烷基和(U)_f-(T)_a-A，其中f、a、U、T和A如上文所定义。更优选地，R¹⁵独立地选自H、甲基、乙基、异丙基、正丙基和(U)_f-(T)_a-A，其中f、a、U、T和A如上文所定义。最优选地，R¹⁵选自H和甲基。

在优选的实施方案中，Z是CH₂且g是1。在该实施方案中，进一步优选Y选自O、S、N(R¹⁵)、N(R¹⁵)C(O)、N(R¹⁵)C(O)N(R¹⁵)和N(R¹⁵)C(O)O，更优选选自O、S、N(R¹⁵)、NHC(O)、NHC(O)N(R¹⁵)和NHC(O)O，其中R¹⁵和R¹⁵的优选实施方案如上文所定义。

在另一个优选的实施方案中，Z是C(O)，g是1。在该实施方案中，进一步优选Y是N(R¹⁵)，其中R¹⁵和R¹⁵的优选实施方案如上所定义。

因此，在本发明的方法的优选实施方案中，糖衍生物核苷酸Su(A)-Nuc如式(15)、(16)、(17)或(18)所示：

其中Nuc、a、f、R¹⁴、R¹⁵、A、U和T如上文所定义。

在(15)、(16)、(17)和(18)的优选实施方案中，R¹⁴是-OH。在另一个优选的实施方案中，R¹⁴是-N₃。在另一个优选的实施方案中，R¹⁴是-NHC(O)CH₃。在另一个优选的实施方案中，R¹⁴是-NHC(O)-(W)_h-(U)_f-(T)_a-A，其中W、U、T、A、h、f和a如上文所定义。在这些实施方案中，进一步优选Nuc是UDP。

(15)、(16)、(17)和(18)中的U、T、a和f的优选实施方案如上文所述。如上文所定义的A的优选实施方案也适用于(15)、(16)、(17)和(18)。

在(15)、(16)、(17)和(18)的特别优选的实施方案中，a是0，f是1，U是-CH₂CF₂-。在该实施方案中，进一步优选A为N₃。

在(15)、(16)、(17)和(18)的另一个特别优选的实施方案中，a是1，T优选为任选取代的苯基。如上所述，苯基任选被R²取代，优选地，R²选自H，F，Cl和Br，更优选地选自H、F和Cl，最优选地选自H和F。在该实施方案中，f为0或1，当f为1时，U优选为-CH₂-。在这些实施方案中，进一步优选A为N₃。优选地，A存在于任选取代的苯基的对位。

在本发明的方法的优选实施方案中，糖衍生物核苷酸Su(A)-Nuc如式(19)、(20)、(21)、(22)、(23)、(24)、(25)、(26)、(65)或(66)所示，优选地如(19)、(20)、(21)、(22)、(23)、(24)、(25)或(26)所示：

其中：

R¹⁴和R¹⁵如上所定义；以及

R¹⁶独立地选自H和F。

在本发明的方法的优选实施方案中，糖衍生物核苷酸Su(A)-Nuc如式(67)、(68)或(69)所示：

其中R¹⁴如上文所定义。

在其他优选的实施方案中，R¹⁵选自H和C₁-C₁₂烷基，优选选自H和C₁–C₆烷基，更优选选自H、甲基、乙基、异丙基、正丙基、正丁基、仲丁基和叔丁基，最优选选自H和甲基。在另一个优选的实施方案中，R¹⁵是(U)_f-(T)_a-A，其中f、a、U、T和A及其优选实施方案如上文所定义。当R¹⁵为(U)_f-(T)_a-A时，优选R¹⁵的(U)_f-(T)_a-A基团对应于源自Su(A)-Nuc(3)中的Z-(Y)_g-(U)_f-(T)_a-A部分的(U)_f-(T)_a-A基团。例如，当(24)中的R¹⁵为(U)_f-(T)_a-A时，优选R¹⁵为-(C₆H₄(N₃))，N₃在苯基的对位。在这些实施方案中，优选Nuc为UDP。

在如上所述的(19)、(20)、(21)、(22)、(23)、(24)、(25)、(26)、(65)、(66)、(67)、(68)和(69)及其优选实施方案的优选实施方案中，R¹⁴是-OH。在另一个优选的实施方案中，R¹⁴为-N₃。在另一个优选的实施方案中，R¹⁴是-NHC(O)CH₃。在另一个优选的实施方案中，R¹⁴是-NHC(O)-(W)_h-(U)_f-(T)_a-A，其中W、U、T、A、h、f和a如上文所定义。同样在这些实施方案中，还优选Nuc为UDP。

在优选的实施方案中，R¹⁴为-N₃。在本发明的方法的另一个优选实施方案中，R¹⁴选自：

其中a、f、h、T、A、U和W及其优选实施方案如上文所定义。

在本发明的方法的其他优选的实施方案中，糖衍生物核苷酸Su(A)-Nuc如式(27)、(28)、(29)、(30)或(31)所示，或如式(36)所示：

其中Nuc如上文所定义。

在本发明的方法进一步优选的实施方案中，其中R¹⁴是OH。在该实施方案中，进一步优选糖衍生物核苷酸Su(A)-Nuc如式(35)所示：

其中Nuc如上文所定义。

此外，当Su(A)-Nuc如式(27)、(28)、(29)、(30)、(31)、(35)或(36)所示时，优选Nuc是UDP。

酶

本发明的方法包括以下步骤：在糖基转移酶的存在下、更特别是在糖基转移酶的作用下，将包含含有末端GlcNAc部分的聚糖的糖蛋白与糖衍生物核苷酸Su(A)-Nuc接触，以提供经修饰的糖蛋白，其中所述糖基转移酶为或衍生自β-(1,4)-N-乙酰半乳糖胺转移酶。在本文中，β-(1,4)-N-乙酰半乳糖胺转移酶也称为β(1,4)-GalNAcT酶、或β-(1,4)-GalNAcT或GalNAcT。

β-(1,4)-N-乙酰半乳糖胺转移酶(β-(1,4)-GalNAcT)是本领域已知的。通常，β-(1,4)-GalNAcT是催化N-乙酰半乳糖胺(GalNAc)从尿苷二磷酸-GalNAc(UDP-GalNAc，也称为GalNAc-UDP)转移至糖蛋白聚糖的末端GlcNAc部分的酶，其中GalNAc部分的C1经由β-1,4-O-糖苷键连接至GlcNAc部分的C4。如上文更详细描述的，其中b是1的式(1)的聚糖中的GlcNAc部分，即由岩藻糖基化的GlcNAc组成的聚糖中的GlcNAc部分在本文中也被认为是末端GlcNAc部分。

在本发明的方法中，为或衍生自β-(1,4)-GalNAcT的糖基转移酶催化糖衍生物Su(A)从糖衍生物核苷酸Su(A)-Nuc转移至糖蛋白聚糖的末端GlcNAc部分，以提供经修饰的糖蛋白，其中Su(A)如式(6)所示、Su(A)-Nuc如式(3)所示、含有末端GlcNAc部分的聚糖如式(1)或(2)所示且经修饰的糖蛋白如式(4)或(5)所示，如上文所述。在该方法中，Su(A)部分的C1经由β-1,4-O-糖苷键连接至GlcNAc部分的C4。

优选地，本发明的方法中使用的β-(1,4)-GalNAcT酶为或衍生自无脊椎动物β-(1,4)-GalNAcT酶，即为或衍生自来源于无脊椎动物物种的β-(1,4)-GalNAcT。β-(1,4)-GalNAcT酶可以为或可以衍生自本领域技术人员已知的任何无脊椎动物β-(1,4)-GalNAcT酶。优选地，β-(1,4)-GalNAcT酶为或衍生自来源于线虫动物门(Nematoda)、优选来源于色矛纲(Chromadorea)或胞管肾纲(Secernentea)，或来源于节肢动物门(Arthropoda)，优选来源于昆虫纲(Insecta)的β-(1,4)-GalNAcT酶。优选地，β-(1,4)-GalNAcT酶为或衍生自来源于秀丽隐杆线虫(Caenorhabditis elegans)、腐生水果线虫(Caenorhabditisremanei)、Caenorhabditis briggsae、猪蛔虫(Ascaris suum)、粉纹夜蛾(Trichoplusiani)、黑腹果蝇(Drosophila melanogaster)、吴策线虫(Wuchereria bancrofti)、罗阿丝虫(Loa loa)、毕氏粗角猛蚁(Cerapachys biroi)、湿木白蚁(Zootermopsis nevadensis)、佛罗里达弓背蚁(Camponotus floridanus)、长牡蛎(Crassostrea gigas)或大红斑蝶(Danaus plexippus)，优选来源于秀丽隐杆线虫、猪蛔虫、粉纹夜蛾或黑腹果蝇的β-(1,4)-GalNAcT酶。更优选地，β-(1,4)-GalNAcT酶为或衍生自来源于秀丽隐杆线虫、猪蛔虫或粉纹夜蛾的β-(1,4)-GalNAcT酶。在其他优选的实施方案中，β-(1,4)-GalNAcT酶为或衍生自来源于猪蛔虫的β-(1,4)-GalNAcT酶。在另一个优选的实施方案中，β-(1,4)-GalNAcT酶为或衍生自来源于粉纹夜蛾的β-(1,4)-GalNAcT酶。在另一个优选的实施方案中，β-(1,4)-GalNAcT酶为或衍生自来源于秀丽隐杆线虫的β-(1,4)-GalNAcT酶。

在本文中，秀丽隐杆线虫也称为Ce，猪蛔虫也称为As，粉纹夜蛾也称为Tn，黑腹果蝇也称为Dm。

优选地，用于本发明的方法的β-(1,4)-GalNAcT酶与选自SEQ ID NO:2-5和15-23的序列，更优选与选自SEQ ID NO:2-5的序列具有至少40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。换言之，优选用于本发明的方法的β-(1,4)-GalNAcT酶与选自SEQ IDNO:2、SEQ ID NO:3、SEQ ID NO:4和SEQ ID NO:5、SEQ IDNO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22和SEQ IDNO:23的序列，更优选与选自SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4和SEQ ID NO:5的序列，甚至更优选与选自SEQ ID NO:2、SEQ ID NO:3和SEQ ID NO:4的序列，甚至更优选与选自SEQ ID NO:3和SEQ IDNO:4的序列，最优选与SEQ ID NO:4具有至少40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。

优选地，用于本发明的方法的β-(1,4)-GalNAcT酶为或衍生自选自如下的任何天然存在的或野生型β-(1,4)-GalNAcT酶：本文中命名为CeGalNAcT的秀丽隐杆线虫β-(1,4)-GalNAcT(SEQ ID NO:2)、本文中命名为AsGalNAcT的猪蛔虫β-(1,4)-GalNAcT(SEQ ID NO:3)、本文中命名为TnGalNAcT的粉纹夜蛾β-(1,4)-GalNAcT(SEQ ID NO:4)、本文中命名为DmGalNAcT的黑腹果蝇β-(1,4)-GalNAcT(SEQ ID NO:5)、腐生水果线虫β-(1,4)-GalNAcT(SEQ ID NO:15)、Caenorhabditis briggsaeβ-(1,4)-GalNAcT(SEQ ID NO:16)、吴策线虫β-(1,4)-GalNAcT(SEQ IDNO:17)、罗阿丝虫β-(1,4)-GalNAcT(SEQ ID NO:18)、毕氏粗角猛蚁β-(1,4)-GalNAcT(SEQ ID NO:19)、湿木白蚁β-(1,4)-GalNAcT(SEQ ID NO:20)、佛罗里达弓背蚁β-(1,4)-GalNAcT(SEQ ID NO:21)、长牡蛎β-(1,4)-GalNAcT(SEQ ID NO:22)和大红斑蝶β-(1,4)-GalNAcT(SEQ ID NO:23)。

在优选的实施方案中，用于本发明的方法的β-(1,4)-GalNAcT酶为或衍生自选自如下的任何天然存在的或野生型β-(1,4)-GalNAcT酶：本文中命名为CeGalNAcT的秀丽隐杆线虫β-(1,4)-GalNAcT(SEQ ID NO:2)、本文中命名为AsGalNAcT的猪蛔虫β-(1,4)-GalNAcT(SEQ ID NO:3)、本文中命名为TnGalNAcT的粉纹夜蛾β-(1,4)-GalNAcT(SEQ ID NO:4)和本文中命名为DmGalNAcT的黑腹果蝇β-(1,4)-GalNAcT(SEQ ID NO:5)。

在另一个优选的实施方案中，用于本发明的方法的β-(1,4)-GalNAcT酶为或衍生自选自如下的任何天然存在的或野生型β-(1,4)-GalNAcT酶：本文中命名为CeGalNAcT的秀丽隐杆线虫β-(1,4)-GalNAcT(SEQ ID NO:2)、本文中命名为AsGalNAcT的猪蛔虫β-(1,4)-GalNAcT(SEQ ID NO:3)和本文中命名为TnGalNAcT的粉纹夜蛾β-(1,4)-GalNAcT(SEQ IDNO:4)。

在另一个优选的实施方案中，用于本发明的方法的β-(1,4)-GalNAcT酶为或衍生自选自如下的任何天然存在的或野生型β-(1,4)-GalNAcT酶：本文中命名为AsGalNAcT的猪蛔虫β-(1,4)-GalNAcT(SEQ ID NO:3)和本文中命名为TnGalNAcT的粉纹夜蛾β-(1,4)-GalNAcT(SEQ ID NO:4)。

在特别优选的实施方案中，用于本发明的方法的β-(1,4)-GalNAcT酶为或衍生自本文中命名为TnGalNAcT的粉纹夜蛾β-(1,4)-GalNAcT(SEQ ID NO:4)。

在另一个优选的实施方案中，用于本发明的方法的β-(1,4)-GalNAcT酶是β-(1,4)-GalNAcT酶，其为或衍生自来源于无脊椎动物物种的β-(1,4)-GalNAcT酶，所述无脊椎动物为线虫动物门、优选色矛纲(Chromadorea)、优选杆线虫目(Rhabditida)、优选小杆科(Rhabditidae)、优选新杆状线虫属(Caenorhabditis)。优选地，用于本发明的方法的β-(1,4)-GalNAcT酶与SEQ ID NO:2、15和16的序列具有至少40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。更优选地，所述无脊椎动物物种是秀丽隐杆线虫。优选地，用于本发明的方法的β-(1,4)-GalNAcT酶与SEQ ID NO:2具有至少40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。

在另一个优选的实施方案中，用于本发明的方法的β-(1,4)-GalNAcT酶为或衍生自来源于无脊椎动物物种的β-(1,4)-GalNAcT酶，所述无脊椎动物为线虫动物门、优选胞管肾纲(Secernentea)、优选蛔目(Ascaridida)、优选蛔虫科(Ascarididae)、优选蛔虫属(Ascaris)。更优选地，所述无脊椎动物物种是猪蛔虫(Ascaris Sum)。优选地，用于本发明的方法的β-(1,4)-GalNAcT酶与SEQ ID NO:3的序列具有至少40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。

在另一个优选的实施方案中，用于本发明的方法的β-(1,4)-GalNAcT酶为或衍生自来源于无脊椎动物物种的β-(1,4)-GalNAcT酶，所述无脊椎动物物种为节肢动物门(Anthropoda)、优选昆虫纲(Insecta)、优选鳞翅目(Lepidoptera)、优选夜蛾科(Noctuidae)、优选粉纹夜蛾属(Trichoplusia)。更优选地，所述无脊椎动物物种是粉纹夜蛾。粉纹夜蛾有时也可称为Phytometra brassicae、Plusia innata或甘蓝银纹夜蛾(cabbage looper)。优选地，用于本发明的方法的β-(1,4)-GalNAcT酶与SEQ ID NO:4的序列具有至少40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。

在另一个优选的实施方案中，用于本发明的方法的β-(1,4)-GalNAcT酶为或衍生自来源于无脊椎动物物种的β-(1,4)-GalNAcT酶，所述无脊椎动物物种为节肢动物门、优选昆虫纲(Insecta)、优选双翅目(Diptera)、优选果蝇科(Drosophilidae)、优选果蝇属(Drosophila)。更优选地，所述无脊椎动物物种是黑腹果蝇。优选地，用于本发明的方法的β-(1,4)-GalNAcT酶与SEQ ID NO:5的序列具有至少40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。

在本文中，“衍生自”β-(1,4)-GalNAcT酶应理解为具有分别通过置换、插入、缺失或添加一个或多个，优选1、2、3、4、5、6、7、8、9、10、12、14、16、18、20或更多个氨基酸而改变自天然存在的β-(1,4)-GalNAcT酶的氨基酸序列的β-(1,4)-GalNAcT酶。在本文中，衍生自β-(1,4)-GalNAcT酶的β-(1,4)-GalNAcT酶也称为衍生的β-(1,4)-GalNAcT酶或修饰的β-(1,4)-GalNAcT酶或β-(1,4)-GalNAcT突变酶或β-(1,4)-GalNAcT突变体。

衍生的酶是本领域已知的，包括已经经过氨基酸序列的常规和标准修饰的酶，例如去除跨膜结构域、包含标签(例如如本文所述的溶解性和/或纯化标签)。得到具有经修饰的氨基酸序列的酶的这些方法是本领域公知的，并且包括在本发明的方法中。

在一个实施方案中，衍生的酶——即与本文提及的天然存在的β-(1,4)-GalNAcT酶具有小于100％的序列同一性——优选具有天然存在的β-(1,4)-GalNAcT酶的酶活性的至少10％、20％、30％、40％、50％、60％、70％或优选至少80％或90％或至少100％的酶活性。在本文中，将活性方便地测定为将(修饰的)GalNAc残基掺入糖蛋白的末端GlcNAc残基上的功效。

所述酶不是半乳糖基转移酶。在一个实施方案中，所述酶不是归类为E.C.2.4.1.38或归类为E.C.2.4.1.133的酶，优选不是归类为E.C.2.4.1.22、归类为E.C.2.4.1.38、归类为E.C.2.4.1.90或归类为E.C.2.4.1.133的酶。

在一个实施方案中，所述酶是归类为E.C.2.4.1.41、归类为E.C.2.4.1.92、归类为E.C.2.4.1.174或归类为E.C.2.4.1.244的酶，优选归类为E.C.2.4.1.92或归类为E.C.2.4.1.244的酶。

优选地，通过添加额外的N-或C-末端氨基酸或化学部分，或通过缺失N-或C-末端氨基酸来修饰所述衍生的β-(1,4)-GalNAcT酶以增加稳定性、溶解性、活性和/或易于纯化。

优选地，通过缺失N-末端胞质结构域和跨膜结构域来修饰β-(1,4)-GalNAcT酶，其在本文中称为截短的酶。本领域已知这些结构域的缺失产生在水溶液中表现出增加的溶解度的酶。

例如，CeGalNAcT(30-383)在本文中应理解为由SEQ ID NO:2的第30-383位上的氨基酸表示的氨基酸序列组成的截短的秀丽隐杆线虫β-(1,4)-GalNAcT酶。类似地，AsGalNAcT(30-383)在本文中应理解为由SEQ ID NO:3的第30-383位上的氨基酸表示的氨基酸序列组成的截短的猪蛔虫β-(1,4)-GalNAcT酶，TnGalNAcT(33-421)在本文中应理解为由SEQ ID NO:4的第33-421位上的氨基酸表示的氨基酸序列组成的截短的粉纹夜蛾β-(1,4)-GalNAcT酶，DmGalNAcT(47-403)在本文中应理解为由SEQ ID NO:5的第47-403位上的氨基酸表示的氨基酸序列组成的截短的黑腹果蝇β-(1,4)-GalNAcT酶。

优选地，用于本发明的方法的β-(1,4)-GalNAcT酶与SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8或SEQ ID NO:9的任一序列，更优选与SEQ ID NO:6、SEQ ID NO:7或SEQ IDNO:8的序列，甚至更优选与SEQ ID NO:7或SEQ ID NO:8的序列，甚至更优选与序列SEQ IDNO:8具有至少40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选至少100％的序列同一性。

其中一个或多个氨基酸已被置换、添加或缺失的β-(1,4)-GalNAcT酶在本文中也称为衍生的β-(1,4)-GalNAcT酶。优选地，通过缺失N-末端胞质结构域和跨膜结构域来修饰，并通过置换一个或多个氨基酸来修饰β-(1,4)-GalNAcT酶。在本文中，一个或多个氨基酸的置换也称为突变。包含一个或多个置换的氨基酸的酶也称为突变酶。

在本发明的方法中，当糖基转移酶衍生自秀丽隐杆线虫β-(1,4)-GalNAcT酶或截短的β-(1,4)-GalNAcT酶时，优选所述酶还包含一个或多个突变。优选的突变包括在第257位由亮氨酸(Leu，也称为L)、甲硫氨酸(Met，也称为M)或丙氨酸(Ala，也称为A)置换异亮氨酸(Ile，也称为I)。优选的突变还包括在第312位由组氨酸(His，也称为H)置换甲硫氨酸(Met，也称为M)。因此，当糖基转移酶衍生自CeGalNAcT或CeGalNAcT(30-383)时，优选所述酶包含I257L、I257M或I257A突变，和/或M312H突变。

应注意，在本文中氨基酸位置的编号是基于野生型β-(1,4)-GalNAcT酶中氨基酸位置的编号。当β-(1,4)-GalNAcT酶是例如截短的酶时，本文中用来表示例如氨基酸置换的位置的数字对应于相应的野生型β-(1,4)-GalNAcT酶中的氨基酸位置的编号。

作为实例，在野生型CeGalNAcT(SEQ ID NO:2)中，异亮氨酸(Ile，I)存在于第257位氨基酸位置上。在CeGalNAcT(I257L)中，第257位的异亮氨酸氨基酸被亮氨酸氨基酸(Leu，L)置换。如上所述，CeGalNAcT(30-383)在本文中应理解为由SEQ ID NO:2的第30-383位的氨基酸表示的氨基酸序列组成的截短的CeGalNAcT酶，而CeGalNAcT(30-383)本身由SEQ ID NO:6表示。在CeGalNAcT(30-383；I257L)中，I257L中的数字“257”表示它是相应野生型CeGalNAcT中的第257位上的I氨基酸(即用L氨基酸置换的SEQ ID NO:2的数字257)。在SEQ ID NO:2的第257位的异亮氨酸氨基酸由SEQ ID NO:6的第228位的异亮氨酸氨基酸表示。

优选的截短的秀丽隐杆线虫β-(1,4)-GalNAcT突变酶包括CeGalNAcT(30-383；I257L)(SEQ ID NO:10)、CeGalNAcT(30-383；I257M)(SEQ ID NO:11)、CeGalNAcT(30-383；I257A)(SEQ ID NO:12)和CeGalNAcT(30-383；M312H)(SEQ ID NO:13)。

在本发明的方法中，当糖基转移酶衍生自粉纹夜蛾β-(1,4)-GalNAcT酶或截短的粉纹夜蛾β-(1,4)-GalNAcT酶时，优选所述酶还包含一个或多个突变。优选的突变包括在第336位由苯丙氨酸(Phe，也称为F)、组氨酸(His，也称为H)或缬氨酸(Val，也称为V)置换色氨酸(Trp，也称为W)。因此，当糖基转移酶衍生自TnGalNAcT或TnGalNAcT(33-421)时，优选所述酶包含W336F、W336H或W336V突变。TnGalNAcT或TnGalNAcT(33-421)的优选突变还包括在第339位由丙氨酸(Ala，也称为A)、甘氨酸(Gly，也称为G)、天冬氨酸(Asp，也称为D)或丝氨酸(Ser，也称为S)置换谷氨酸(Glu，也称为E)。因此，当糖基转移酶衍生自TnGalNAcT或TnGalNAcT(33-421)时，优选所述酶包含E339A、E339G、E339D或E339S突变。更优选地，当糖基转移酶衍生自TnGalNAcT或TnGalNAcT(33-421)时，第336位和第339位均如上所述突变。因此，当糖基转移酶衍生自TnGalNAcT或TnGalNAcT(33-421)时，优选所述酶包含W336F、W336H或W336V突变或E339A、E339G、E339D或E339S突变。

TnGalNAcT或TnGalNAcT(33-421)的优选突变还包括在第311位由酪氨酸(Tyr，也称为Y)置换异亮氨酸(Ile，也称为I)。因此，当糖基转移酶衍生自TnGalNAcT或TnGalNAcT(33-421)时，优选所述酶包含I311Y突变。

当糖基转移酶衍生自TnGalNAcT或TnGalNAcT(33-421)且包含I311Y突变时，所述酶还可以包含如上所述的第336位上的突变和/或如上所述的第339位上的突变。因此，当糖基转移酶衍生自包含I311Y突变的TnGalNAcT或TnGalNAcT(33-421)时，所述酶还可以包含W336F、W336H或W336V突变和/或E339A、E339G、E339D或E339S突变。

在本发明的方法的优选实施方案中，为或衍生自β-(1,4)-GalNAcT酶的糖基转移酶是选自以下的粉纹夜蛾β-(1,4)-GalNAcT酶：TnGalNAcT(33-421；W336F)(SEQ ID NO:25)、TnGalNAcT(33-421；W336H)(SEQ ID NO:26)、TnGalNAcT(33-421；W336V)(SEQ ID NO:27)、TnGalNAcT(33-421；E339A)(SEQ ID NO:28)、TnGalNAcT(33-421；E339G)(SEQ ID NO:29)、TnGalNAcT(33-421；E339D)(SEQ IDNO:30)和TnGalNAcT(33-421；E339S)(SEQ ID NO:31)。

在本发明的方法的另一个优选实施方案中，为或衍生自β-(1,4)-GalNAcT酶的糖基转移酶为选自TnGalNAcT(33-421；W336H、E339A)(SEQ ID NO:32)、TnGalNAcT(33-421；W336H、E339D)(SEQ ID NO:33)和TnGalNAcT(33-421；W336H、E339S)(SEQ IDNO:34)的粉纹夜蛾β-(1,4)-GalNAcT酶。

在本发明的方法的另一个优选实施方案中，为或衍生自β-(1,4)-GalNAcT酶的糖基转移酶为粉纹夜蛾β-(1,4)-GalNAcT酶TnGalNAcT(33-421；I311Y)(SEQ ID NO:35)。

在本发明的方法的另一个优选实施方案中，为或衍生自β-(1,4)-GalNAcT酶的糖基转移酶为选自TnGalNAcT(33-421；I311Y、W336F)(SEQ ID NO:36)、TnGalNAcT(33-421；I311Y、W336H)(SEQ ID NO:37)、TnGalNAcT(33-421；I311Y、W336V)(SEQ IDNO:38)、TnGalNAcT(33-421；I311Y、E339A)(SEQ ID NO:39)、TnGalNAcT(33-421；I311Y、E339G)(SEQID NO:40)、TnGalNAcT(33-421；I311Y、E339D)(SEQ ID NO:41)和TnGalNAcT(33-421；I311Y、E339S)(SEQ ID NO:42)的粉纹夜蛾β-(1,4)-GalNAcT酶。

在本发明的方法的另一个优选实施方案中，为或衍生自β-(1,4)-GalNAcT酶的糖基转移酶为选自TnGalNAcT(33-421；I311Y、W336H、E339A)(SEQ ID NO:43)、TnGalNAcT(33-421；I311Y、W336H、E339D)(SEQ ID NO:44)和TnGalNAcT(33-421；I311Y、W336H、E339S)(SEQID NO:45)的粉纹夜蛾β-(1,4)-GalNAcT酶。

在本发明的方法中，当糖基转移酶衍生自猪蛔虫β-(1,4)-GalNAcT酶或截短的猪蛔虫β-(1,4)-GalNAcT酶时，优选所述酶还包含一个或多个突变。优选的突变包括在第282位由组氨酸(His，也称为H)置换色氨酸(Trp，也称为W)，和/或在第285位由天冬氨酸(Asp，也称为D)置换谷氨酸(Glu，也称为E)，和/或在第257位由酪氨酸(Tyr，也称为Y)置换异亮氨酸(Ile，也称为I)。因此，当糖基转移酶衍生自AsGalNAcT或AsGalNAcT(30-383)时，优选所述酶包含W282H突变、E285D突变和/或I257Y突变。

在本发明的方法的一个优选实施方案中，为或衍生自β-(1,4)-GalNAcT酶的糖基转移酶是选自以下的猪蛔虫β-(1,4)-GalNAcT：AsGalNAcT(30-383；W282H)(SEQ ID NO:46)和AsGalNAcT(30-383；E285D)(SEQ ID NO:47)。

在本发明的方法的另一个优选实施方案中，为或衍生自β-(1,4)-GalNAcT酶的糖基转移酶是猪蛔虫β-(1,4)-GalNAcT：AsGalNAcT(30-383；I257Y)(SEQ ID NO:48)。

在本发明的方法的另一个优选实施方案中，为或衍生自β-(1,4)-GalNAcT酶的糖基转移酶是选自以下的猪蛔虫β-(1,4)-GalNAcT：AsGalNAcT(30-383；I257Y、W282H)和AsGalNAcT(30-383；I257Y、E285D)。

在本发明的方法的优选实施方案中，本文中定义的为或衍生自β-(1,4)-GalNAcT酶的糖基转移酶包含编码易于纯化的标签的序列。优选地，所述标签选自但不限于FLAG标签、聚(His)标签、HA标签、Myc标签、SUMO标签、GST标签、MBP标签或CBP标签，更优选所述标签为6xHis标签。其他优选的待被掺入酶中的标签为可溶性标签，例如AFV标签、SlyD标签、Tsf标签、SUMO标签、Bla标签、MBP标签和GST标签。在其他优选的实施方案中，所述标签共价连接至β-(1,4)-GalNAcT酶的C-末端。在另一个优选的实施方案中，所述标签共价连接至β-(1,4)-GalNAcT酶的N-末端。

当β-(1,4)-GalNAcT酶衍生自秀丽隐杆线虫β-(1,4)-GalNAcT时，His-标记的β-(1,4)-GalNAcT酶优选为CeGalNAcT(30-383)-His(SEQ ID NO:14)。

在本发明的方法的一个优选的实施方案中，当β-(1,4)-GalNAcT酶为或衍生自粉纹夜蛾β-(1,4)-GalNAcT时，His-标记的β-(1,4)-GalNAcT酶为或衍生自His-TnGalNAcT(33-421)(SEQ ID NO:49)。

在本发明的方法的另一个优选实施方案中，当β-(1,4)-GalNAcT酶为或衍生自粉纹夜蛾β-(1,4)-GalNAcT时，His-标记的β-(1,4)-GalNAcT酶为或衍生自His-TnGalNAcT(33-421；W336F)(SEQ ID NO:50)、His-TnGalNAcT(33-421；W336H)(SEQ ID NO:51)、His-TnGalNAcT(33-421；W336V)(SEQ ID NO:52)、His-TnGalNAcT(33-421；339A)(SEQ ID NO:53)、His-TnGalNAcT(33-421；E339G)(SEQ ID NO:54)、His-TnGalNAcT(33-421；E339D)(SEQID NO:55)、His-TnGalNAcT(33-421；E339S)(SEQ ID NO:56)、His-TnGalNAcT(33-421；W336H、E339A)(SEQ ID NO:57)、His-TnGalNAcT(33-421；W336H、E339D)(SEQ ID NO:58)或His-TnGalNAcT(33-421；W336H、E339S)(SEQ ID NO:59)。

在本发明的方法的另一个优选实施方案中，当β-(1,4)-GalNAcT酶为或衍生自粉纹夜蛾β-(1,4)-GalNAcT时，His-标记的β-(1,4)-GalNAcT酶为或衍生自His-TnGalNAcT(33-421；I311Y)(SEQ ID NO:60)。

在本发明的方法的另一个优选实施方案中，当β-(1,4)-GalNAcT酶为或衍生自粉纹夜蛾β-(1,4)-GalNAcT时，His-标记的β-(1,4)-GalNAcT酶为或衍生自His-TnGalNAcT(33-421；I311Y、W336F)(SEQ ID NO:61)、His-TnGalNAcT(33-421；I311Y、W336H)(SEQ IDNO:62)、His-TnGalNAcT(33-421；I311Y、W336V)(SEQ ID NO:63)、His-TnGalNAcT(33-421；I311Y、E339A)(SEQ ID NO:64)、His-TnGalNAcT(33-421；I311Y、E336G)(SEQ ID NO:65)、His-TnGalNAcT(33-421；I311Y、E339D)(SEQ ID NO:66)、His-TnGalNAcT(33-421；I311Y、E339S)(SEQ ID NO:67)、His-TnGalNAcT(33-421；I311Y、W336H、E339A)(SEQ ID NO:68)、His-TnGalNAcT(33-421；I311Y、W336H、E339D)(SEQ ID NO:69)或His-TnGalNAcT(33-421；I311Y、W336H、E339S)(SEQ ID NO:70)。

在本发明的方法的另一个优选实施方案中，当β-(1,4)-GalNAcT酶为或衍生自猪蛔虫β-(1,4)-GalNAcT时，His-标记的β-(1,4)-GalNAcT酶为或衍生自His-AsGalNAcT(30-383)(SEQ ID NO:71)。

在本发明的方法的另一个优选实施方案中，当β-(1,4)-GalNAcT酶为或衍生自猪蛔虫β-(1,4)-GalNAcT时，His-标记的β-(1,4)-GalNAcT酶为或衍生自His-AsGalNAcT(30-383；W282H)(SEQ ID NO:72)、His-AsGalNAcT(30-383；E285D)(SEQ ID NO:73)或His-AsGalNAcT(30-383；I257Y)(SEQ ID NO:74)。

在本发明的方法的优选实施方案中，用于所述方法的β-(1,4)-N-乙酰半乳糖胺转移酶为或衍生自选自SEQ ID NO:2-23和SEQ ID NO:25-74的序列。

在本发明的方法的优选实施方案中，用于所述方法的β-(1,4)-N-乙酰半乳糖胺转移酶为或衍生自选自SEQ ID NO:2-23的序列。换言之，在优选的实施方案中，用于本发明的方法的β-(1,4)-N-乙酰半乳糖胺转移酶为或衍生自选自以下的序列：SEQ ID NO:2、SEQ IDNO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ IDNO:21、SEQ ID NO:22和SEQ ID NO:23。

在本文中，术语“衍生自”包括例如截短的酶、突变酶和包含易于纯化的标签的酶，这些修饰在上文更详细地描述。术语“衍生自”还包括包含在上文更详细描述的修饰的组合的酶。

在另一个优选的实施方案中，用于本发明的方法的β-(1,4)-N-乙酰半乳糖胺转移酶与选自SEQ ID NO:2-23，即选自SEQ ID NO:2、SEQ IDNO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ IDNO:16、SEQ ID NO:17、SEQID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22和SEQ ID NO:23的序列具有至少50％的同一性，优选至少55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。

在本发明的方法的优选实施方案中，用于所述方法的β-(1,4)-N-乙酰半乳糖胺转移酶为或衍生自选自SEQ ID NO:2-9的序列。换言之，在优选的实施方案中，用于本发明的方法的β-(1,4)-N-乙酰半乳糖胺转移酶为或衍生自选自以下的序列：SEQ ID NO:2、SEQ IDNO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8和SEQ ID NO:9。

在另一个优选的实施方案中，用于本发明的方法的β-(1,4)-N-乙酰半乳糖胺转移酶与选自SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ IDNO:7、SEQ ID NO:8和SEQ ID NO:9的序列具有至少50％的同一性，优选至少55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。

在本发明的方法的另一个优选实施方案中，用于所述方法的β-(1,4)-N-乙酰半乳糖胺转移酶为或衍生自选自SEQ ID NO:25-45和SEQ ID NO:50-70的序列。换言之，在优选的实施方案中，用于本发明的方法的β-(1,4)-N-乙酰半乳糖胺转移酶为或衍生自选自以下的序列：SEQ IDNO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ IDNO:30、SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:33、SEQ ID NO:34、SEQ ID NO:35、SEQ IDNO:36、SEQ ID NO:37、SEQ ID NO:38、SEQ ID NO:39、SEQ ID NO:40、SEQ ID NO:41、SEQIDNO:42、SEQ ID NO:43、SEQ ID NO:44、SEQ ID NO:45、SEQ ID NO:50、SEQ ID NO:51、SEQID NO:52、SEQ ID NO:53、SEQ ID NO:54、SEQ ID NO:55、SEQ ID NO:56、SEQ ID NO:57、SEQID NO:58、SEQ ID NO:59、SEQ ID NO:60、SEQ ID NO:61、SEQ ID NO:62、SEQ IDNO:63、SEQID NO:64、SEQ ID NO:65、SEQ ID NO:66、SEQ ID NO:67、SEQ ID NO:68、SEQ ID NO:69和SEQ ID NO:70。

在另一个优选的实施方案中，用于本发明的方法的β-(1,4)-N-乙酰半乳糖胺转移酶与选自SEQ ID NO:25-45和SEQ ID NO:50-70的序列，即与选自SEQ ID NO:25、SEQ IDNO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ IDNO:32、SEQ ID NO:33、SEQ ID NO:34、SEQ ID NO:35、SEQ ID NO:36、SEQ ID NO:37、SEQ IDNO:38、SEQ ID NO:39、SEQ ID NO:40、SEQ IDNO:41、SEQ ID NO:42、SEQ ID NO:43、SEQ IDNO:44、SEQ ID NO:45、SEQ ID NO:50、SEQ ID NO:51、SEQ ID NO:52、SEQ ID NO:53、SEQ IDNO:54、SEQ ID NO:55、SEQ ID NO:56、SEQ ID NO:57、SEQ ID NO:58、SEQ ID NO:59、SEQ IDNO:60、SEQ ID NO:61、SEQ IDNO:62、SEQ ID NO:63、SEQ ID NO:64、SEQ ID NO:65、SEQ IDNO:66、SEQ ID NO:67、SEQ ID NO:68、SEQ ID NO:69和SEQ ID NO:70的序列具有至少50％的同一性，优选至少55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。

在本发明的方法的另一个优选实施方案中，用于所述方法的β-(1,4)-N-乙酰半乳糖胺转移酶为或衍生自选自SEQ ID NO:46-49和SEQ ID NO:71-74的序列。换言之，在优选的实施方案中，用于本发明的方法的β-(1,4)-N-乙酰半乳糖胺转移酶为或衍生自选自以下的序列：SEQ IDNO:46、SEQ ID NO:47、SEQ ID NO:48、SEQ ID NO:49、SEQ ID NO:71、SEQ IDNO:72、SEQ ID NO:73和SEQ ID NO:74。

在另一个优选的实施方案中，用于本发明的方法的β-(1,4)-N-乙酰半乳糖胺转移酶与选自SEQ ID NO:46-49和SEQ ID NO:71-74的序列，即选自SEQ ID NO:46、SEQ ID NO:47、SEQ ID NO:48、SEQ ID NO:49、SEQ ID NO:71、SEQ ID NO:72、SEQ ID NO:73和SEQ IDNO:74的序列具有至少50％的序列同一性，优选至少55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。

在本发明的方法中，糖衍生物核苷酸Su(A)-Nuc如式(3)或其优选的实施方案所示，如上文中更详细描述的。R¹⁴选自：

其中W、h、a、f、T、A和U及其优选实施方案如上文所定义。

当R¹⁴为-NHC(O)CH₃时优选的糖基转移酶

在本发明的方法的优选实施方案中，R¹⁴是-NHC(O)CH₃。在该实施方案中，糖衍生物核苷酸Su(A)-Nuc如式(3a)所示，如上文所定义的。

当Su(A)-Nuc如式(3a)或如上文所述的(3a)的优选实施方案所示时，在所述方法的优选实施方案中，为或衍生自β-(1,4)-GalNAcT的糖基转移酶为或衍生自野生型β-(1,4)-GalNAcT，优选无脊椎动物β-(1,4)-GalNAcT。在所述方法的另一个优选实施方案中，糖基转移酶为或衍生自无脊椎动物β-(1,4)-GalNAcT。在另一个优选的实施方案中，糖基转移酶为或衍生自秀丽隐杆线虫β-(1,4)-GalNAcT(CeGalNAcT)、猪蛔虫β-(1,4)-GalNAcT(AsGalNAcT)或粉纹夜蛾β-(1,4)-GalNAcT(TnGalNAcT)。为或衍生自(CeGalNAcT)、(AsGalNAcT)或(TnGalNAcT)的β-(1,4)-GalNAcT如上文中更详细描述的。

当糖衍生物核苷酸Su(A)-Nuc中的R¹⁴为-NHC(O)CH₃时，特别优选用于所述方法的β-(1,4)-N-乙酰半乳糖胺转移酶为或衍生自选自SEQ IDNO:2-9，即选自SEQ ID NO:2、SEQID NO:3、SEQ ID NO:4、SEQ IDNO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8和SEQ IDNO:9的序列。更优选地，当R¹⁴为-NHC(O)CH₃时，用于所述方法的β-(1,4)-N-乙酰半乳糖胺转移酶为或衍生自选自SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8，甚至更优选选自SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8，甚至更优选选自SEQ ID NO:7和SEQ ID NO:8的序列。最优选地，用于所述方法的β-(1,4)-N-乙酰半乳糖胺转移酶为或衍生自SEQ ID NO:8。

在另一个特别优选的实施方案中，当糖衍生物核苷酸Su(A)-Nuc中的R¹⁴为-NHC(O)CH₃时，用于所述方法的β-(1,4)-N-乙酰半乳糖胺转移酶与选自SEQ ID NO:2-9，即选自SEQID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ IDNO:8和SEQ ID NO:9的序列具有至少50％的序列同一性，优选至少55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。更优选地，当R¹⁴为-NHC(O)CH₃时，用于所述方法的β-(1,4)-N-乙酰半乳糖胺转移酶与选自SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:6、SEQ IDNO:7和SEQ IDNO:8，更优选选自SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8，甚至更优选选自SEQ ID NO:7和SEQ ID NO:8的序列具有至少50％的序列同一性，优选至少55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。最优选地，用于所述方法的β-(1,4)-N-乙酰半乳糖胺转移酶与SEQ ID NO:8具有至少50％的序列同一性，优选至少55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。

在其中R¹⁴为-NHC(O)CH₃的本发明的方法的另一个特别优选的实施方案中，糖基转移酶为或衍生自秀丽隐杆线虫β-(1,4)-GalNAcT(CeGalNAcT)。

在其中R¹⁴为-NHC(O)CH₃的方法的另一个特别优选的实施方案中，CeGalNAcT为或衍生自SEQ ID NO:2或SEQ ID NO:6。

在其中R¹⁴为-NHC(O)CH₃的方法的另一个特别优选的实施方案中，用于所述方法的CeGalNAcT为或衍生自SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13或SEQID NO:14。

在其中R¹⁴为-NHC(O)CH₃的方法的另一个特别优选的实施方案中，用于所述方法的CeGalNAcT与SEQ ID NO:2或SEQ ID NO:6具有至少50％的序列同一性，优选至少55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。

在其中R¹⁴为-NHC(O)CH₃的方法的另一个特别优选的实施方案中，用于所述方法的CeGalNAcT与序列SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13或SEQ IDNO:14具有至少50％的序列同一性，优选至少55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。

在其中R¹⁴为-NHC(O)CH₃的本发明的方法的另一个特别优选的实施方案中，糖基转移酶为或衍生自粉纹夜蛾β-(1,4)-GalNAcT(TnGalNAcT)。

在其中R¹⁴为-NHC(O)CH₃的方法的其他优选的实施方案中，TnGalNAcT为或衍生自SEQ ID NO:4或SEQ ID NO:8。

在其中R¹⁴为-NHC(O)CH₃的方法的另一个优选的实施方案中，用于所述方法的TnGalNAcT与SEQ ID NO:4或SEQ ID NO:8具有至少50％的序列同一性，优选至少55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。

在其中R¹⁴为-NHC(O)CH₃的方法的另一个优选实施方案中，用于所述方法的TnGalNAcT为或衍生自选自SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:33、SEQ ID NO:34、SEQ IDNO:49、SEQ ID NO:50、SEQ ID NO:51、SEQ ID NO:52、SEQ ID NO:53、SEQ ID NO:54、SEQ ID NO:55、SEQ ID NO:56、SEQ ID NO:57、SEQ ID NO:58和SEQ ID NO:59的序列。

在另一个优选的实施方案中，用于其中R¹⁴为-NHC(O)CH₃的方法的TnGalNAcT与选自SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:33、SEQ ID NO:34、SEQ ID NO:49、SEQ IDNO:50、SEQ ID NO:51、SEQ ID NO:52、SEQ ID NO:53、SEQ ID NO:54、SEQ ID NO:55、SEQ IDNO:56、SEQ ID NO:57、SEQ ID NO:58和SEQ ID NO:59的序列具有至少50％的序列同一性，优选至少55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。

在其中R¹⁴为-NHC(O)CH₃的本发明的方法的另一个特别优选的实施方案中，糖基转移酶为或衍生自猪蛔虫β-(1,4)-GalNAcT(AsGalNAcT)。

在其中R¹⁴为-NHC(O)CH₃的方法的该实施方案中，进一步优选AsGalNAcT为或衍生自SEQ ID NO:3或SEQ ID NO:7。

在其中R¹⁴为-NHC(O)CH₃的方法的另一个优选的实施方案中，用于所述方法的AsGalNAcT与SEQ ID NO:3或SEQ ID NO:7具有至少50％的序列同一性，优选至少55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。

在其中R¹⁴为-NHC(O)CH₃的方法的另一个优选的实施方案中，用于所述方法的AsGalNAcT为或衍生自选自SEQ ID NO:46、SEQ ID NO:47、SEQ ID NO:71、SEQ ID NO:72和SEQ ID NO:73的序列。

在其中R¹⁴为-NHC(O)CH₃的方法的另一个优选的实施方案中，用于所述方法的AsGalNAcT与选自SEQ ID NO:46、SEQ ID NO:47、SEQ ID NO:71、SEQ ID NO:72和SEQ IDNO:73的序列具有至少50％的序列同一性，优选至少55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。

在本文描述的其中R¹⁴为-NHC(O)CH₃的本发明的方法的优选实施方案以及如上文中所描述的糖基转移酶中，进一步优选糖衍生物核苷酸Su(A)-Nuc如上文所定义的式(15)、(16)、(17)或(18)所示，其中R¹⁴为-NHC(O)CH₃；或如上文所定义的式(19)、(20)、(21)、(22)、(23)、(24)、(25)、(26)、(65)、(66)、(67)、(68)或(69)所示，其中R¹⁴为-NHC(O)CH₃；或如上文所定义的式(27)所示。在这些特别优选的实施方案中，进一步优选的是Nuc为UDP。

当R¹⁴为-NHC(O)-(W)_h-(U)_f-(T)_a-A时优选的糖基转移酶

在本发明的方法的另一个优选实施方案中，R¹⁴是-NHC(O)-(W)_h-(U)_f-(T)_a-A。在该实施方案中，糖衍生物核苷酸Su(A)-Nuc如式(3b)所示，如上文所定义的。

当Su(A)-Nuc如式(3b)或如上文所述的(3b)的优选实施方案所示时，在所述方法的优选实施方案中，为或衍生自β-(1,4)-GalNAcT的糖基转移酶为或衍生自野生型β-(1,4)-GalNAcT，优选无脊椎动物β-(1,4)-GalNAcT。在所述方法的另一个优选实施方案中，糖基转移酶为或衍生自无脊椎动物β(1,4)-GalNAcT。在另一个优选的实施方案中，糖基转移酶为或衍生自秀丽隐杆线虫β-(1,4)-GalNAcT(CeGalNAcT)、猪蛔虫β-(1,4)-GalNAcT(AsGalNAcT)或粉纹夜蛾β-(1,4)-GalNAcT(TnGalNAcT)。为或衍生自(CeGalNAcT)、(AsGalNAcT)或(TnGalNAcT)的β-(1,4)-GalNAcT如上文中更详细描述的。

当糖衍生物核苷酸Su(A)-Nuc中的R¹⁴为-NHC(O)-(W)_h-(U)_f-(T)_a-A时，特别优选用于所述方法的β-(1,4)-N-乙酰半乳糖胺转移酶为或衍生自选自SEQ ID NO:2-9，即选自SEQID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ IDNO:8和SEQ ID NO:9的序列。更优选地，当R¹⁴为-NHC(O)-(W)_h-(U)_f-(T)_a-A时，用于所述方法的β-(1,4)-N-乙酰半乳糖胺转移酶为或衍生自选自SEQ ID NO:2、SEQ ID NO:3、SEQ IDNO:4、SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8，更优选选自SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8，甚至更优选选自SEQ ID NO:7和SEQ ID NO:8的序列。最优选地，用于所述方法的β-(1,4)-N-乙酰半乳糖胺转移酶为或衍生自SEQ ID NO:8。

在另一个特别优选的实施方案中，当糖衍生物核苷酸Su(A)-Nuc中的R¹⁴为-NHC(O)-(W)_h-(U)_f-(T)_a-A时，用于所述方法的β-(1,4)-N-乙酰半乳糖胺转移酶与选自SEQ IDNO:2-9，即选自SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQID NO:7、SEQ ID NO:8和SEQ ID NO:9的序列具有至少50％的序列同一性，优选至少55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。更优选地，当R¹⁴为-NHC(O)-(W)_h-(U)_f-(T)_a-A时，用于所述方法的β-(1,4)-N-乙酰半乳糖胺转移酶与选自SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8，更优选选自SEQ ID NO:6、SEQ ID NO:7和SEQID NO:8，甚至更优选选自SEQ ID NO:7和SEQ ID NO:8的序列具有至少50％的序列同一性，优选至少55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。最优选地，用于所述方法的β-(1,4)-N-乙酰半乳糖胺转移酶与SEQ ID NO:8具有至少50％的序列同一性，优选至少55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。

在其中R¹⁴为-NHC(O)-(W)_h-(U)_f-(T)_a-A的本发明的方法的另一个特别优选的实施方案中，糖基转移酶为或衍生自秀丽隐杆线虫β-(1,4)-GalNAcT(CeGalNAcT)。

在其中R¹⁴为-NHC(O)-(W)_h-(U)_f-(T)_a-A的方法的另一个特别优选的实施方案中，CeGalNAcT为或衍生自SEQ ID NO:2或SEQ ID NO:6。

在其中R¹⁴为-NHC(O)-(W)_h-(U)_f-(T)_a-A的方法的另一个特别优选的实施方案中，用于所述方法的CeGalNAcT为或衍生自SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQID NO:13或SEQ ID NO:14。

在其中R¹⁴为-NHC(O)-(W)_h-(U)_f-(T)_a-A的方法的另一个特别优选的实施方案中，用于所述方法的CeGalNAcT与SEQ ID NO:2或SEQ IDNO:6具有至少50％的序列同一性，优选至少55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。

在其中R¹⁴为-NHC(O)-(W)_h-(U)_f-(T)_a-A的方法的另一个特别优选的实施方案中，用于所述方法的CeGalNAcT与序列SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ IDNO:13或SEQ ID NO:14具有至少50％的序列同一性，优选至少55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。

在其中R¹⁴为-NHC(O)-(W)_h-(U)_f-(T)_a-A的本发明的方法的另一个特别优选的实施方案中，糖基转移酶为或衍生自粉纹夜蛾β-(1,4)-GalNAcT(TnGalNAcT)。

在其中R¹⁴为-NHC(O)-(W)_h-(U)_f-(T)_a-A的方法的其他优选的实施方案中，TnGalNAcT为或衍生自SEQ ID NO:4或SEQ ID NO:8。

在其中R¹⁴为-NHC(O)-(W)_h-(U)_f-(T)_a-A的方法的另一个优选的实施方案中，用于所述方法的TnGalNAcT与SEQ ID NO:4或SEQ ID NO:8具有至少50％的序列同一性，优选至少55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。

在其中R¹⁴为-NHC(O)-(W)_h-(U)_f-(T)_a-A的方法的另一个优选实施方案中，用于所述方法的TnGalNAcT为或衍生自选自SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ IDNO:28、SEQ ID NO:29、SEQ IDNO:30、SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:33、SEQ IDNO:34、SEQ ID NO:49、SEQ ID NO:50、SEQ ID NO:51、SEQ ID NO:52、SEQ ID NO:53、SEQ IDNO:54、SEQ ID NO:55、SEQ ID NO:56、SEQ ID NO:57、SEQ ID NO:58和SEQ ID NO:59的序列。

在另一个优选的实施方案中，用于其中R¹⁴为-NHC(O)-(W)_h-(U)_f-(T)_a-A的方法的TnGalNAcT与选自SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:33、SEQ IDNO:34、SEQ ID NO:49、SEQ ID NO:50、SEQ ID NO:51、SEQ ID NO:52、SEQ ID NO:53、SEQ ID NO:54、SEQ IDNO:55、SEQ ID NO:56、SEQ ID NO:57、SEQ ID NO:58和SEQ ID NO:59的序列具有至少50％的序列同一性，优选至少55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。

在其中R¹⁴为-NHC(O)-(W)_h-(U)_f-(T)_a-A的本发明的方法的另一个特别优选的实施方案中，糖基转移酶为或衍生自猪蛔虫β-(1,4)-GalNAcT(AsGalNAcT)。

在其中R¹⁴为-NHC(O)-(W)_h-(U)_f-(T)_a-A的方法的该实施方案中，进一步优选的是AsGalNAcT为或衍生自SEQ ID NO:3或SEQ ID NO:7。

在其中R¹⁴为-NHC(O)-(W)_h-(U)_f-(T)_a-A的方法的另一个优选的实施方案中，用于所述方法的AsGalNAcT与SEQ ID NO:3或SEQ ID NO:7具有至少50％的序列同一性，优选至少55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。

在其中R¹⁴为-NHC(O)-(W)_h-(U)_f-(T)_a-A的方法的另一个优选的实施方案中，用于所述方法的AsGalNAcT为或衍生自选自SEQ ID NO:46、SEQ ID NO:47、SEQ ID NO:71、SEQID NO:72和SEQ ID NO:73的序列。

在其中R¹⁴为-NHC(O)-(W)_h-(U)_f-(T)_a-A的方法的另一个优选的实施方案中，用于所述方法的AsGalNAcT与选自SEQ ID NO:46、SEQ ID NO:47、SEQ ID NO:71、SEQ ID NO:72和SEQ ID NO:73的序列具有至少50％的序列同一性，优选至少55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。

在本文描述的其中R¹⁴为-NHC(O)-(W)_h-(U)_f-(T)_a-A的本发明的方法的优选实施方案以及如上文中所描述的糖基转移酶中，进一步优选糖衍生物核苷酸Su(A)-Nuc如上文所定义的式(15)、(16)、(17)或(18)所示，其中R¹⁴为-NHC(O)-(W)_h-(U)_f-(T)_a-A；或如上文所定义的式(19)、(20)、(21)、(22)、(23)、(24)、(25)、(26)、(65)、(66)、(67)、(68)或(69)所示，其中R¹⁴为-NHC(O)-(W)_h-(U)_f-(T)_a-A；或如上文所定义的式(28)、(29)、(30)或(31)所示。在这些特别优选的实施方案中，进一步优选的是Nuc为UDP。

当R¹⁴为-OH时优选的糖基转移酶

在本发明的方法的优选实施方案中，R¹⁴是-OH。在该实施方案中，糖衍生物核苷酸Su(A)-Nuc如式(3c)所示，如上文所定义的。

当Su(A)-Nuc如式(3c)或如上文所述的(3c)的优选实施方案所示时，在所述方法的优选实施方案中，糖基转移酶衍生自野生型β-(1,4)-GalNAcT，优选无脊椎动物β-(1,4)-GalNAcT。在所述方法的另一个优选实施方案中，糖基转移酶衍生自无脊椎动物β-(1,4)-GalNAcT。在其他优选的实施方案中，糖基转移酶衍生自秀丽隐杆线虫β-(1,4)-GalNAcT(CeGalNAcT)、猪蛔虫β-(1,4)-GalNAcT(AsGalNAcT)或粉纹夜蛾β-(1,4)-GalNAcT(TnGalNAcT)。衍生自(CeGalNAcT)、(AsGalNAcT)或(TnGalNAcT)的β-(1,4)-GalNAcT如上文中更详细描述的。

在其中R¹⁴为-OH的本发明的方法的另一个特别优选的实施方案中，糖基转移酶衍生自秀丽隐杆线虫β-(1,4)-GalNAcT(CeGalNAcT)。

在其中R¹⁴为-OH的本发明的方法的另一个特别优选的实施方案中，糖基转移酶衍生自粉纹夜蛾β-(1,4)-GalNAcT(TnGalNAcT)。

在其中R¹⁴为-OH的方法的另一个优选的实施方案中，TnGalNAcT为或衍生自SEQ IDNO:35或SEQ ID NO:60。

在其中R¹⁴为-OH的方法的另一个优选的实施方案中，用于所述方法的TnGalNAcT与SEQ ID NO:35或SEQ ID NO:60具有至少50％的序列同一性，优选至少55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。

在其中R¹⁴为-OH的方法的另一个优选实施方案中，用于所述方法的TnGalNAcT为或衍生自选自SEQ ID NO:36、SEQ ID NO:37、SEQ IDNO:38、SEQ ID NO:39、SEQ ID NO:40、SEQID NO:41、SEQ ID NO:42、SEQ ID NO:43、SEQ ID NO:44、SEQ ID NO:45、SEQ ID NO:61、SEQID NO:62、SEQ ID NO:63、SEQ ID NO:64、SEQ ID NO:65、SEQ ID NO:66、SEQ ID NO:67、SEQID NO:68、SEQ ID NO:69和SEQ IDNO:70的序列。

在另一个优选的实施方案中，用于其中R¹⁴为-OH的方法的TnGalNAcT与选自SEQ IDNO:36、SEQ ID NO:37、SEQ ID NO:38、SEQ ID NO:39、SEQ ID NO:40、SEQ ID NO:41、SEQ IDNO:42、SEQ ID NO:43、SEQ ID NO:44、SEQ ID NO:45、SEQ ID NO:61、SEQ IDNO:62、SEQ IDNO:63、SEQ ID NO:64、SEQ ID NO:65、SEQ ID NO:66、SEQ ID NO:67、SEQ ID NO:68、SEQ IDNO:69和SEQ ID NO:70的序列具有至少50％的序列同一性，优选至少55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。

在其中R¹⁴为-OH的本发明的方法的另一个特别优选的实施方案中，糖基转移酶衍生自猪蛔虫β-(1,4)-GalNAcT(AsGalNAcT)。

在其中R¹⁴为-OH的方法的该实施方案中，进一步优选的是AsGalNAcT为或衍生自SEQ ID NO:48或SEQ ID NO:74。

在其中R¹⁴为-OH的方法的另一个优选的实施方案中，用于所述方法的AsGalNAcT与SEQ ID NO:48或SEQ ID NO:74具有至少50％的序列同一性，优选至少55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。

在本文描述的其中R¹⁴为-OH的本发明的方法的优选实施方案以及如上文中所描述的糖基转移酶中，进一步优选糖衍生物核苷酸Su(A)-Nuc如上文所定义的式(15)、(16)、(17)或(18)所示，其中R¹⁴为-OH；或如上文所定义的式(19)、(20)、(21)、(22)、(23)、(24)、(25)、(26)、(65)、(66)、(67)、(68)或(69)所示，其中R¹⁴为-OH；或如上文所定义的式(35)所示。在这些特别优选的实施方案中，进一步优选的是Nuc为UDP。

当R¹⁴为-N₃时优选的糖基转移酶

在本发明的方法的另一个优选实施方案中，R¹⁴是-N₃。在该实施方案中，糖衍生物核苷酸Su(A)-Nuc如式(3d)所示，如上文所定义的。

当Su(A)-Nuc如式(3d)或如上文所述的(3d)的优选实施方案所示时，在所述方法的优选实施方案中，为或衍生自β-(1,4)-GalNAcT的糖基转移酶为或衍生自野生型β-(1,4)-GalNAcT，优选无脊椎动物β-(1,4)-GalNAcT。在所述方法的另一个优选实施方案中，糖基转移酶为或衍生自无脊椎动物β-(1,4)-GalNAcT。在其他优选的实施方案中，糖基转移酶为或衍生自秀丽隐杆线虫β-(1,4)-GalNAcT(CeGalNAcT)、猪蛔虫β-(1,4)-GalNAcT(AsGalNAcT)或粉纹夜蛾β-(1,4)-GalNAcT(TnGalNAcT)。为或衍生自(CeGalNAcT)、(AsGalNAcT)或(TnGalNAcT)的β-(1,4)-GalNAcT如上文中更详细描述的。

当糖衍生物核苷酸Su(A)-Nuc中的R¹⁴为-N₃时，特别优选用于所述方法的β-(1,4)-N-乙酰半乳糖胺转移酶为或衍生自选自SEQ ID NO:2-9，即选自SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8和SEQ ID NO:9的序列。更优选地，当R¹⁴为-N₃时，用于所述方法的β-(1,4)-N-乙酰半乳糖胺转移酶为或衍生自选自SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8，更优选选自SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8，甚至更优选选自SEQ ID NO:7和SEQ ID NO:8的序列。最优选地，用于所述方法的β-(1,4)-N-乙酰半乳糖胺转移酶为或衍生自SEQ ID NO:8。

在另一个特别优选的实施方案中，当糖衍生物核苷酸Su(A)-Nuc中的R¹⁴为-N₃时，用于所述方法的β-(1,4)-N-乙酰半乳糖胺转移酶与选自SEQ ID NO:2-9，即选自SEQ IDNO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8和SEQ ID NO:9的序列具有至少50％的序列同一性，优选至少55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。更优选地，当R¹⁴为-N₃时，用于所述方法的β-(1,4)-N-乙酰半乳糖胺转移酶与选自SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8，更优选选自SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8，甚至更优选选自SEQ ID NO:7和SEQ IDNO:8的序列具有至少50％的序列同一性，优选至少55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。最优选地，用于所述方法的β-(1,4)-N-乙酰半乳糖胺转移酶与SEQ ID NO:8具有至少50％的序列同一性，优选至少55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。

在其中R¹⁴为-N₃的本发明的方法的另一个特别优选的实施方案中，糖基转移酶为或衍生自秀丽隐杆线虫β-(1,4)-GalNAcT(CeGalNAcT)。

在其中R¹⁴为-N₃的方法的另一个特别优选的实施方案中，CeGalNAcT为或衍生自SEQ ID NO:2或SEQ ID NO:6。

在其中R¹⁴为-N₃的方法的另一个特别优选的实施方案中，用于所述方法的CeGalNAcT为或衍生自SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13或SEQID NO:14。

在其中R¹⁴为-N₃的方法的另一个特别优选的实施方案中，用于所述方法的CeGalNAcT与SEQ ID NO:2或SEQ ID NO:6具有至少50％的序列同一性，优选至少55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。

在其中R¹⁴为-N₃的方法的另一个特别优选的实施方案中，用于所述方法的CeGalNAcT与序列SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13或SEQ IDNO:14具有至少50％的序列同一性，优选至少55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。

在其中R¹⁴为-N₃的本发明的方法的另一个特别优选的实施方案中，糖基转移酶为或衍生自粉纹夜蛾β-(1,4)-GalNAcT(TnGalNAcT)。

在其中R¹⁴为-N₃的方法的其他优选的实施方案中，TnGalNAcT为或衍生自SEQ IDNO:4或SEQ ID NO:8。

在其中R¹⁴为-N₃的方法的另一个优选的实施方案中，用于所述方法的TnGalNAcT与SEQ ID NO:4或SEQ ID NO:8具有至少50％的序列同一性，优选至少55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。

在其中R¹⁴为-N₃的方法的另一个优选实施方案中，用于所述方法的TnGalNAcT为或衍生自选自SEQ ID NO:25、SEQ ID NO:26、SEQ IDNO:27、SEQ ID NO:28、SEQ ID NO:29、SEQID NO:30、SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:33、SEQ ID NO:34、SEQ ID NO:49、SEQID NO:50、SEQ ID NO:51、SEQ ID NO:52、SEQ ID NO:53、SEQ ID NO:54、SEQ ID NO:55、SEQID NO:56、SEQ ID NO:57、SEQ IDNO:58和SEQ ID NO:59的序列。

在另一个优选的实施方案中，用于其中R¹⁴为-N₃的方法的TnGalNAcT与选自SEQ IDNO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ IDNO:31、SEQ ID NO:32、SEQ ID NO:33、SEQ ID NO:34、SEQ ID NO:49、SEQ IDNO:50、SEQ IDNO:51、SEQ ID NO:52、SEQ ID NO:53、SEQ ID NO:54、SEQ ID NO:55、SEQ ID NO:56、SEQ IDNO:57、SEQ ID NO:58和SEQ ID NO:59的序列具有至少50％的序列同一性，优选至少55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。

在其中R¹⁴为-N₃的本发明的方法的另一个特别优选的实施方案中，糖基转移酶为或衍生自猪蛔虫β-(1,4)-GalNAcT(AsGalNAcT)。

在其中R¹⁴为-N₃的方法的该实施方案中，进一步优选的是AsGalNAcT为或衍生自SEQ ID NO:3或SEQ ID NO:7。

在其中R¹⁴为-N₃的方法的另一个优选的实施方案中，用于所述方法的AsGalNAcT与SEQ ID NO:3或SEQ ID NO:7具有至少50％的序列同一性，优选至少55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。

在其中R¹⁴为-N₃的方法的另一个优选的实施方案中，用于所述方法的AsGalNAcT为或衍生自选自SEQ ID NO:46、SEQ ID NO:47、SEQ IDNO:71、SEQ ID NO:72和SEQ ID NO:73的序列。

在其中R¹⁴为-N₃的方法的另一个优选的实施方案中，用于所述方法的AsGalNAcT与选自SEQ ID NO:46、SEQ ID NO:47、SEQ ID NO:71、SEQ ID NO:72和SEQ ID NO:73的序列具有至少50％的序列同一性，优选至少55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性。

在本文描述的其中R¹⁴为-N₃的本发明的方法的优选实施方案以及如上文中所描述的糖基转移酶中，进一步优选糖衍生物核苷酸Su(A)-Nuc如上文所定义的式(15)、(16)、(17)或(18)所示，其中R¹⁴为-N₃；或如上文所定义的式(19)、(20)、(21)、(22)、(23)、(24)、(25)、(26)、(65)、(66)、(67)、(68)或(69)所示，其中R¹⁴为-N₃；或如上文所定义的式(36)所示。在这些特别优选的实施方案中，进一步优选的是Nuc为UDP。

酶

在一个方面，本发明涉及如本文中所定义的酶，即为或衍生自β-(1,4)-GalNAcT的糖基转移酶，特别是衍生自β-(1,4)-GalNAcT的糖基转移酶，即衍生的β-(1,4)-GalNAcT酶。在一个实施方案中，所述酶衍生自无脊椎动物物种。在一个实施方案中，根据该方面的酶为分离形式。根据本方面，在本发明方法的上下文中，酶及其优选实施方案在上文中进一步定义，这同样适用于酶自身。

在一个实施方案中，根据本发明该方面的酶衍生自β-(1,4)-N-乙酰半乳糖胺转移酶，优选衍生自具有选自SEQ ID NO:2-23和SEQ ID NO:25-74，更优选选自SEQ ID NO:14和SEQ ID NO:25-74，最优选选自SEQ ID NO:10-13、SEQ ID NO:25-48、SEQ ID NO:50-70和SEQ ID NO:72-74的序列的β-(1,4)-N-乙酰半乳糖胺转移酶。根据该实施方案的酶通常为分离形式。

在一个实施方案中，根据本发明该方面的酶涉及与选自SEQ ID NO:2-23和SEQ IDNO:25-74的序列具有至少40％的序列同一性，优选至少45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性的β-(1,4)-N-乙酰半乳糖胺转移酶。根据该实施方案的酶通常为分离形式。优选地，本发明涉及与选自SEQ ID NO:10-14和SEQ ID NO:25-74，最优选选自SEQ ID NO:10-13、SEQ ID NO:25-48、SEQ ID NO:50-70和SEQ ID NO:72-74的序列具有至少40％的序列同一性，优选至少45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性的β-(1,4)-N-乙酰半乳糖胺转移酶。

在优选的实施方案中，根据本发明该方面的酶涉及与选自SEQ ID NO:6-14，即选自SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13和SEQ ID NO:14，优选选自SEQ ID NO:10-13，即选自SEQ IDNO:10、SEQ ID NO:11、SEQ ID NO:12和SEQ ID NO:13的序列具有至少40％的序列同一性，优选至少45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性的β-(1,4)-N-乙酰半乳糖胺转移酶。

在另一个优选的实施方案中，根据本发明该方面的酶涉及与选自SEQ ID NO:25-45和SEQ ID NO:50-70，即选自SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:33、SEQ IDNO:34、SEQ ID NO:35、SEQ ID NO:36、SEQ ID NO:37、SEQ ID NO:38、SEQ ID NO:39、SEQ IDNO:40、SEQ ID NO:41、SEQ ID NO:42、SEQ IDNO:43、SEQ ID NO:44、SEQ ID NO:45、SEQ IDNO:50、SEQ ID NO:51、SEQ ID NO:52、SEQ ID NO:53、SEQ ID NO:54、SEQ ID NO:55、SEQ IDNO:56、SEQ ID NO:57、SEQ ID NO:58、SEQ ID NO:59、SEQ ID NO:60、SEQ ID NO:61、SEQ IDNO:62、SEQ ID NO:63、SEQ ID NO:64、SEQ ID NO:65、SEQ ID NO:66、SEQ ID NO:67、SEQ IDNO:68、SEQ ID NO:69和SEQ ID NO:70的序列具有至少40％的序列同一性，优选至少45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性的β-(1,4)-N-乙酰半乳糖胺转移酶。

在另一个优选的实施方案中，根据本发明该方面的酶涉及与选自SEQ ID NO:46-48和SEQ ID NO:72-74，即选自SEQ ID NO:46、SEQ ID NO:47、SEQ ID NO:48、SEQ ID NO:72、SEQ ID NO:73和SEQ ID NO:74的序列具有至少40％的序列同一性，优选至少45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或优选100％的序列同一性的β-(1,4)-N-乙酰半乳糖胺转移酶。

本发明还涉及如上文所定义的本发明的酶在用于糖蛋白的修饰的方法中，优选在本发明的方法中的用途。所述方法包括以下步骤：在酶的存在下，使包含含有末端GlcNAc部分的聚糖的糖蛋白与糖衍生物核苷酸接触。在优选的实施方案中，所述糖蛋白如本文中所定义，最优选包含如本文中进一步定义的如式(1)或(2)所示的聚糖的糖蛋白。在优选的实施方案中，糖衍生物核苷酸是如本文中进一步定义的如式(3)所示的糖衍生物核苷酸Su(A)-Nuc。

经修饰的糖蛋白

本发明还涉及经修饰的糖蛋白，其通过本发明用于修饰糖蛋白的方法而获得。更特别地，本发明涉及包含如式(4)或(5)所示的聚糖的糖蛋白：

其中：

b为0或1；

d为0或1；

e为0或1；

G为单糖、或包含2至20个糖部分的直链或支链寡糖；以及

Su(A)如式(6)所示：

其中R¹⁴、Z、Y、U、T、A、g、f和a如上文针对(3)所定义的。

(6)中的R¹⁴、Z、Y、U、T、A、g、f和a的优选实施方案如上文中对于(3)和(3)的优选实施方案(例如(3a)、(3b)、(3c)和(3d))所更详细描述的。

在本发明的经修饰的糖蛋白中，Su(A)部分的C1经由β-1,4-O-糖苷键连接至GlcNAc部分的C4。

本发明的经修饰的糖蛋白可以包含多于一个如式(4)或(5)所示的聚糖。当为这种情况时，两种或更多种聚糖可互不相同。所述糖蛋白还可以包含一种或多种不包含Su(A)部分的另外的聚糖。

在优选的实施方案中，经修饰的糖蛋白包含如式(4)所示的聚糖，其中b为0。在另一个优选的实施方案中，经修饰的糖蛋白包含如式(4)所示的聚糖，其中b为1。

在另一个优选的实施方案中，经修饰的糖蛋白包含如式(5)所示的聚糖，其中b为0。在另一个优选的实施方案中，经修饰的糖蛋白包含如式(5)所示的聚糖，其中b为1。在如式(5)所示的聚糖中，G表示单糖或包含1至20，优选1至12，更优选1至10，甚至更优选1、2、3、4、5、6、7或8，最优选1、2、3、4、5或6个糖部分的直链或支链寡糖。在聚糖(5)中，优选当d为0时，e为1，当e为0时，d为1。更优选地，在聚糖(5)中，d为1，甚至更优选d为1且e为1。可存在于聚糖中的糖部分是本领域技术人员已知的，并且包括例如葡萄糖(Glc)、半乳糖(Gal)、甘露糖(Man)、岩藻糖(Fuc)、N-乙酰葡糖胺(GlcNAc)、N-乙酰半乳糖胺(GalNAc)、N-乙酰神经氨酸(NeuNAc)或唾液酸和木糖(Xyl)。当聚糖如式(5)所示时，进一步优选聚糖如式(37)、(38)、(39)、(40)、(41)或(42)所示：

其中b是0或1；以及

Su(A)如如上文所定义的式(6)所示。

在优选的实施方案中，本发明的经修饰的糖蛋白包含如式(4)、(37)、(38)、(39)、(40)、(41)或(42)所示的聚糖，更优选如式(4)、(37)、(38)、(39)、(40)、(41)或(42)所示的N-连接的聚糖。在其他优选的实施方案中，本发明的经修饰的糖蛋白包含如式(4)、(37)、(38)或(39)所示的聚糖，更优选如式(4)、(37)、(38)或(39)所示的N-连接的聚糖。最优选地，本发明的经修饰的糖蛋白包含如式(4)或(38)所示的聚糖，更优选如式(4)或(38)所示的N-连接的聚糖。

本发明的经修饰的糖蛋白优选如式(43)、(44)或(45)所示：

其中：

b、d、e和G及其优选实施方案如上文所定义；

Su(A)如上文所定义的式(6)所示；

y独立地为1至24的整数；以及

Pr为蛋白质。

经修饰的糖蛋白可以包含一种或多种聚糖(4)或(5)(y为1至24)。优选地，y为1至12的整数，更优选地为1至10的整数。更优选地，y为1、2、3、4、5、6、7或8，甚至更优选地，y为1、2、3、4、5或6。甚至更优选地，y为1、2、3或4。当y为2或更多时，聚糖可以互不相同。经修饰的糖蛋白还可以包含一种或多种聚糖(4)和一种或多种聚糖(5)的组合。如上文所述，糖蛋白还可以包含一个或多个不具有Su(A)部分的聚糖。

当本发明的经修饰的糖蛋白如式(43)、(44)或(45)所示时，还优选糖蛋白包含如上文所述的式(4)、(37)、(38)、(39)、(40)、(41)或(42)所示的聚糖，更优选如式(4)、(37)、(38)或(39)所示，甚至更优选如式(4)或(38)所示的聚糖，优选N连接的聚糖。最优选地，包含末端GlcNAc部分的聚糖是如式(4)或(38)所示的N-连接的聚糖。

在本发明的方法的优选实施方案中，包含含有末端GlcNAc部分的聚糖的糖蛋白是抗体，更优选如式(43)、(44)或(45)所示的抗体，其中蛋白质(Pr)是抗体(Ab)，或更具体地，Pr是抗体的多肽部分。此外，当待修饰的糖蛋白是抗体并且所述抗体包含多于一个聚糖(y为2或更多)时，聚糖可以互不相同。抗体还可以包含一个或多个不具有Su(A)部分的聚糖。此外，当经修饰的糖蛋白是抗体时，优选经修饰的抗体包含如上文所定义的式(4)、(37)、(38)、(39)、(40)、(41)或(42)所示，更优选如式(4)、(37)、(38)或(39)所示，甚至更优选如式(4)或(38)所示的聚糖。在该实施方案中，进一步优选的是，抗体包含如式(4)、(37)、(38)、(39)、(40)、(41)或(42)所示的N-连接的聚糖，更优选如式(4)、(37)、(38)或(39)所示的N-连接的聚糖，最优选如式(4)或(38)所示的N-连接的聚糖。

当经修饰的糖蛋白是抗体时，优选y为1、2、3、4、5、6、7或8，更优选y为1、2、4、6或8，甚至更优选y为1、2或4，最优选y为1或2。

如上文所定义的，所述抗体可以是全抗体，也可以是抗体片段。当抗体是全抗体时，所述抗体优选在每个重链上包含一个或多个，更优选一个聚糖。因此，所述全抗体优选包含2个或更多个，优选2、4、6或8个所述聚糖，更优选2或4个，最优选2个聚糖。换言之，当所述抗体为全抗体时，y优选为2、4、6或8，更优选y为2或4，最优选y为2。当所述抗体为抗体片段时，优选y为1、2、3或4，更优选y为1或2。

在优选的实施方案中，所述抗体为单克隆抗体(mAb)。优选地，所述抗体选自IgA、IgD、IgE、IgG和IgM抗体。更优选地，所述抗体是IgG1、IgG2、IgG3或IgG4抗体，最优选地，所述抗体是IgG1抗体。

在本发明的经修饰的糖蛋白中，如式(6)所示的Su(A)中的R¹⁴选自：

其中W、h、a、f、T、A和U如上文所定义。

在本发明的经修饰的糖蛋白的优选实施方案中，如式(6)所示的Su(A)中的R¹⁴选自：

其中W、h、a、f、T、A和U如上文所定义。

最优选地，如式(6)所示的Su(A)中的R¹⁴是-NHAc。

在其他优选的实施方案中，本发明的经修饰的糖蛋白包含如式(4)或(5)所示的聚糖，更优选N-连接的聚糖，其中Su(A)(6)中的R¹⁴为-OH。在该实施方案中，优选经修饰的糖蛋白如式(43)、(44)或(45)所示。

在另一个优选的实施方案中，本发明的经修饰的糖蛋白包含如式(4)或(5)所示的聚糖，更优选N-连接的聚糖，其中Su(A)(6)中的R¹⁴为-N₃。在该实施方案中，优选经修饰的糖蛋白如式(43)、(44)或(45)所示。

在另一个优选的实施方案中，本发明的经修饰的糖蛋白包含如式(4)或(5)所示的聚糖，更优选N-连接的聚糖，其中Su(A)(6)中的R¹⁴为-NHC(O)CH₃。在该实施方案中，优选经修饰的糖蛋白如式(43)、(44)或(45)所示。

在另一个优选的实施方案中，本发明的经修饰的糖蛋白包含如式(4)或(5)所示的聚糖，更优选N-连接的聚糖，其中Su(A)(6)中的R¹⁴为-NHC(O)-(W)_h-(U)_f-(T)_a-A，其中W、h、U、f、T、a和A及其优选的实施方案如上文中所更详细描述的。在该实施方案中，优选经修饰的糖蛋白如式(43)、(44)或(45)所示。

在另一个优选的实施方案中，本发明的经修饰的糖蛋白包含如式(37)、(38)、(39)、(40)、(41)或(42)所示的聚糖，更优选N-连接的聚糖，其中Su(A)(6)中的R¹⁴为-OH。在该实施方案中，优选经修饰的糖蛋白如式(43)、(44)或(45)所示。

在另一个优选的实施方案中，本发明的经修饰的糖蛋白包含如式(37)、(38)、(39)、(40)、(41)或(42)所示的聚糖，更优选N-连接的聚糖，其中Su(A)(6)中的R¹⁴为-N₃。在该实施方案中，优选经修饰的糖蛋白如式(43)、(44)或(45)所示。

在另一个优选的实施方案中，本发明的经修饰的糖蛋白包含如式(37)、(38)、(39)、(40)、(41)或(42)所示的聚糖，更优选N-连接的聚糖，其中Su(A)(6)中的R¹⁴为-NHC(O)CH₃。在该实施方案中，优选经修饰的糖蛋白如式(43)、(44)或(45)所示。

在另一个优选的实施方案中，本发明的经修饰的糖蛋白包含如式(37)、(38)、(39)、(40)、(41)或(42)所示的聚糖，更优选N-连接的聚糖，其中Su(A)(6)中的R¹⁴为-NHC(O)-(W)_h-(U)_f-(T)_a-A。在该实施方案中，优选经修饰的糖蛋白如式(43)、(44)或(45)所示。

在另一个优选的实施方案中，本发明的经修饰的糖蛋白包含如式(4)或(5)所示的聚糖，优选N-连接的聚糖，更优选如式(37)、(38)、(39)、(40)、(41)或(42)所示的聚糖，甚至更优选N-连接的聚糖，其中Su(A)(6)如式(46)、(47)、(48)或(49)所示：

其中a、f、R¹⁴、R¹⁵、A、U和T及其优选实施方案如上文针对(15)、(16)、(17)和(18)所定义的。

在其中Su(A)(6)如式(46)、(47)、(48)或(49)所示的这些实施方案中，在其他优选的实施方案中，R¹⁴是-OH。在另一个优选的实施方案中，R¹⁴是-N₃。在另一个优选的实施方案中，R¹⁴是-NHC(O)CH₃。在另一个优选的实施方案中，R¹⁴是-NHC(O)-(W)_h-(U)_f-(T)_a-A，其中W、h、U、f、T、a和A及其优选实施方案如上文更详细描述的。同样在这些实施方案中，优选经修饰的糖蛋白如式(43)、(44)或(45)所示。

在另一个优选的实施方案中，本发明的经修饰的糖蛋白包含如式(4)或(5)所示的聚糖，优选N-连接的聚糖，更优选如式(37)、(38)、(39)、(40)、(41)或(42)所示的聚糖，甚至更优选N-连接的聚糖，其中Su(A)(6)如式(50)、(51)、(52)、(53)、(54)、(55)、(56)、(57)、(70)或(71)所示，优选如式(50)、(51)、(52)、(53)、(54)、(55)、(56)或(57)所示：

其中R¹⁴、R¹⁵和R¹⁶及其优选实施方案如上文针对(19)、(20)、(21)、(22)、(23)、(24)、(25)、(26)、(65)、(66)、(67)、(68)和(69)所定义的。

在另一个优选的实施方案中，本发明的经修饰的糖蛋白包含如式(4)或(5)所示的聚糖，优选N-连接的聚糖，更优选如式(37)、(38)、(39)、(40)、(41)或(42)所示的聚糖，甚至更优选N-连接的聚糖，其中Su(A)(6)如(72)、(73)或(74)所示：

其中R¹⁴及其优选实施方案如上文针对(72)、(73)和(74)所定义的。

在其他优选的实施方案中，本发明的经修饰的糖蛋白包含如式(37)所示的聚糖，优选N-连接的聚糖，其中Su(A)(6)如(50)、(51)、(52)、(53)、(54)、(55)、(56)、(57)、(70)、(71)、(72)、(73)或(74)所示，优选如式(50)、(51)、(52)、(53)、(54)、(55)、(56)或(57)所示。在另一个优选的实施方案中，本发明的经修饰的糖蛋白包含如式(38)所示的聚糖，优选N-连接的聚糖，其中Su(A)(6)如(50)、(51)、(52)、(53)、(54)、(55)、(56)、(57)、(70)、(71)、(72)、(73)或(74)所示，优选如式(50)、(51)、(52)、(53)、(54)、(55)、(56)或(57)所示。在另一个优选的实施方案中，本发明的经修饰的糖蛋白包含如式(39)所示的聚糖，优选N-连接的聚糖，其中Su(A)(6)如(50)、(51)、(52)、(53)、(54)、(55)、(56)、(57)、(70)、(71)、(72)、(73)或(74)所示，优选如式(50)、(51)、(52)、(53)、(54)、(55)、(56)或(57)所示。在另一个优选的实施方案中，本发明的经修饰的糖蛋白包含如式(40)所示的聚糖，优选N-连接的聚糖，其中Su(A)(6)如(50)、(51)、(52)、(53)、(54)、(55)、(56)、(57)、(70)、(71)、(72)、(73)或(74)所示，优选如式(50)、(51)、(52)、(53)、(54)、(55)、(56)或(57)所示。在另一个进一步优选的实施方案中，本发明的经修饰的糖蛋白包含如式(41)所示的聚糖，优选N-连接的聚糖，其中Su(A)(6)如(50)、(51)、(52)、(53)、(54)、(55)、(56)、(57)、(70)、(71)、(72)、(73)或(74)所示，优选如式(50)、(51)、(52)、(53)、(54)、(55)、(56)或(57)所示。在另一个优选的实施方案中，本发明的经修饰的糖蛋白包含如式(42)所示的聚糖，优选N-连接的聚糖，其中Su(A)(6)如(50)、(51)、(52)、(53)、(54)、(55)、(56)、(57)、(70)、(71)、(72)、(73)或(74)所示，优选如式(50)、(51)、(52)、(53)、(54)、(55)、(56)或(57)所示。

在其中Su(A)(6)如式(50)、(51)、(52)、(53)、(54)、(55)、(56)、(57)、(70)、(71)、(72)、(73)或(74)所示，优选如(50)、(51)、(52)、(53)、(54)、(55)、(56)或(57)所示的这些实施方案中，在其他优选的实施方案中，R¹⁴是-OH。在另一个优选的实施方案中，R¹⁴是-N₃。在另一个优选的实施方案中，R¹⁴是-NHC(O)CH₃。在另一个优选的实施方案中，R¹⁴是-NHC(O)-(W)_h-(U)_f-(T)_a-A，其中W、h、U、f、T、a和A及其优选实施方案如上文更详细描述的。同样在这些实施方案中，优选经修饰的糖蛋白如式(43)、(44)或(45)所示。

在另一个优选的实施方案中，本发明的经修饰的糖蛋白包含如式(4)或(5)所示的聚糖，优选N-连接的聚糖，更优选如式(37)、(38)、(39)、(40)、(41)或(42)所示聚糖，甚至更优选N-连接的聚糖，其中Su(A)(6)如式(58)、(59)、(60)、(61)或(62)所示：

在其他优选的实施方案中，本发明的经修饰的糖蛋白包含如式(38)所示的聚糖，优选N-连接的聚糖，其中Su(A)(6)如式(58)、(59)、(60)、(61)或(62)所示。在另一个优选的实施方案中，本发明的经修饰的糖蛋白包含如式(39)所示的聚糖，优选N-连接的聚糖，其中Su(A)(6)如式(58)、(59)、(60)、(61)或(62)所示。在另一个优选的实施方案中，本发明的经修饰的糖蛋白包含如式(40)所示的聚糖，优选N-连接的聚糖，其中Su(A)(6)如式(58)、(59)、(60)、(61)或(62)所示。在另一个优选的实施方案中，本发明的经修饰的糖蛋白包含如式(41)所示的聚糖，优选N-连接的聚糖，其中Su(A)(6)如式(58)、(59)、(60)、(61)或(62)所示。在另一个优选的实施方案中，本发明的经修饰的糖蛋白包含如式(42)所示的聚糖，优选N-连接的聚糖，其中Su(A)(6)如式(58)、(59)、(60)、(61)或(62)所示。

在其中Su(A)(6)如式(58)、(59)、(60)、(61)或(62)所示的这些实施方案中，优选经修饰的糖蛋白如式(43)、(44)或(45)所示。

在另一个优选的实施方案中，本发明的经修饰的糖蛋白包含如式(4)或(5)所示的聚糖，优选N-连接的聚糖，更优选如式(37)、(38)、(39)、(40)、(41)或(42)所示聚糖，甚至更优选N-连接的聚糖，其中Su(A)(6)如式(63)或(64)所示：

在其他优选的实施方案中，本发明的经修饰的糖蛋白包含如式(38)所示的聚糖，优选N-连接的聚糖，其中Su(A)(6)如式(63)或(64)所示。在另一个优选的实施方案中，本发明的经修饰的糖蛋白包含如式(39)所示的聚糖，优选N-连接的聚糖，其中Su(A)(6)如式(63)或(64)所示。

在其中Su(A)(6)如式(63)或(64)所示的这些实施方案中，优选经修饰的糖蛋白如式(43)、(44)或(45)所示。

本发明还涉及如上文所定义的本发明的经修饰的糖蛋白在制备生物缀合物(优选本发明的生物缀合物)的方法中的用途。所述方法优选用于制备抗体-药物缀合物(ADC)。所述方法包括使经修饰的糖蛋白与接头缀合物接触。在优选的实施方案中，接头缀合物如本文中所定义。在优选的实施方案中，生物缀合物是如式(75)、(76)或(77)所示的生物缀合物，如下文进一步定义的。

生物缀合物

本发明还涉及通过将接头缀合物与本发明的经修饰的糖蛋白缀合而获得的生物缀合物。接头缀合物在本领域中已知作为生物缀合反应中的反应物之一，其中糖蛋白——例如本发明的经修饰的糖蛋白——是其他反应物。接头缀合物在本文中定义为其中靶分子经由接头与反应基团Q¹共价连接的化合物。反应基团Q¹能够与存在于本发明的经修饰的糖蛋白上的官能团A反应。接头缀合物可以包含多于一个反应基团Q¹和/或多于一个靶分子。合适的接头缀合物包括WO 2014/065661和WO 2016/053107(通过引用的方式纳入本文)中公开的那些。

生物缀合反应是抗体-缀合物如抗体-药物缀合物(ADC)领域中已知的，其中它们用于制备抗体与靶分子(通常为细胞毒素)的缀合物。在这种生物缀合反应中，本发明的经修饰的糖蛋白通过存在于经修饰的糖蛋白上的官能团A与存在于接头缀合物上的反应基团Q¹之间的反应与接头缀合物偶联或缀合。本发明的生物缀合物优选是抗体缀合物，其中抗体与靶分子缀合，最优选如抗体-药物缀合物，其中抗体与药物(通常为细胞毒素)缀合。

更具体地，本发明涉及如式(75)、(76)或(77)所示的生物缀合物：

其中：

Pr是蛋白质

y独立地如上文针对(43)所定义的；

b、d、e和G独立地如上文针对(5)所定义的；

CG是将Su连接至Sp或D的连接基团；

Sp是间隔基；

D是靶分子；

j独立地为1、2、3、4或5，优选j为1；

k独立地为1至10的整数，优选k为1、2、3或4，最优选k为1；

m为0或1，优选m为1。

Su如式(78)所示：

其中R¹⁴、Z、Y、U、T、g、f和a如上文针对(3)所定义的，并且Su经由β-1,4-O-糖苷键通过C1连接至GlcNAc部分的C4，并经由Z、Y、U或T连接至CG。

(75)、(76)或(77)中的Pr和y的优选实施方案如上文针对(43)、(44)和(45)更详细描述的。在优选的实施方案中，糖蛋白是抗体。生物缀合物——特别是抗体——可包含多于一个官能化聚糖(y为2或更多)，聚糖可以互不相同。抗体可以进一步包含一个或多个不具有Su-(CG-(Sp)_l-(D)_k)_j部分的聚糖。进一步优选的是官能化聚糖是N-连接的聚糖。当本发明的生物缀合物是抗体缀合物时，优选y是1、2、3、4、5、6、7或8，更优选y为1、2、4、6或8，甚至更优选y为1、2或4，最优选y为1或2。

如上文所定义的，所述抗体可以是全抗体，也可以是抗体片段。当抗体是全抗体时，所述抗体优选在每个重链上包含一个或多个，更优选一个聚糖。因此，所述全抗体优选包含2个或更多个，优选2、4、6或8个所述官能化聚糖，更优选2或4个，最优选2个官能化聚糖。换言之，当所述抗体为全抗体时，y优选为2、4、6或8，更优选y为2或4，最优选y为2。当抗体为抗体片段时，优选y为1、2、3或4，更优选y为1或2。

(75)、(76)或(77)中的聚糖链，特别是b、d、e和G的优选实施方案如上文针对(4)和(5)及其优选实施方案——例如(37)、(38)、(39)、(40)、(41)或(42)——所更详细描述的。

(78)中的R¹⁴、Z、Y、U、T、g、f和a的优选实施方案如上文针对(3)和(3)的优选实施方案——例如(3a)、(3b)、(3c)和(3d)——所更详细描述的。如式(78)所示的Su的优选实施方案对应于如式(46)至(64)和(70)至(74)中任一项所述的Su(A)及其优选实施方案，如上针对(6)所更详细描述的，除了A与Q¹反应生成CG。

在本发明的生物缀合物中，如式(78)所示的Su中的R¹⁴选自：

其中W、h、a、f、T、A和U如上文所定义。

在本发明的经修饰的糖蛋白的优选实施方案中，如式(78)所示的Su中的R¹⁴选自：

其中W、h、a、f、T、A和U如上文所定义。

最优选地，如式(78)所示的Su中的R¹⁴是-NHAc。

D是靶分子。在本文中，靶分子被定义为具有在缀合时赋予生物分子的所需性质的分子结构。靶分子D优选选自活性物质、报告分子、聚合物、固体表面、水凝胶、纳米颗粒、微粒和生物分子。最优选地，靶分子D是活性物质。

在本文中，术语“活性物质”涉及药理学和/或生物学物质，即具有生物学活性和/或药物活性的物质，例如药物、前药、诊断试剂、蛋白质、肽、多肽、肽标签、氨基酸、聚糖、脂质、维生素、类固醇、核苷酸、核苷、多核苷酸、RNA或DNA。肽标签的实例包括细胞穿透肽如人乳铁蛋白或聚精氨酸。聚糖的一个实例是寡甘露糖。氨基酸的实例是赖氨酸。当靶分子是活性物质时，活性物质优选选自药物和前药。更优选地，活性物质选自药物活性化合物，特别是低至中等分子量化合物(例如约200至约2500Da，优选约300至约1750Da)。在其他优选的实施方案中，活性物质选自细胞毒素，抗病毒剂、抗菌剂、肽和寡核苷酸。细胞毒素的实例包括秋水仙碱、长春花生物碱、蒽环类、喜树碱、多柔比星、柔红霉素、紫杉烷类、刺孢霉素、微管溶素、伊立替康、抑制肽、鹅膏蕈碱、deBouganin、多卡米星、美登素、auristatin或吡咯苯并二氮杂卓(PBD)。

在本文中，术语“报告分子”是指容易检测其存在的分子，例如诊断剂、染料、荧光团、放射性同位素标记、造影剂、磁共振成像剂或质量标签。多种荧光团，也称为荧光探针，是本领域技术人员已知的。在例如G.T.Hermanson,“Bioconjugate Techniques”,Elsevier,3^rd Ed.2013,Chapter 10:“Fluorescent probes”,p.395–463中更详细地描述了几种荧光团，该文献通过引用的方式纳入本文。荧光团的实例包括各种Alexa Fluor(例如Alexa Fluor 555)、花青染料(例如Cy3或Cy5)和花青染料衍生物、香豆素衍生物、荧光素和荧光素衍生物、罗丹明和罗丹明衍生物、硼二吡咯亚甲基衍生物、芘衍生物、萘酰亚胺衍生物、藻胆蛋白衍生物(例如别藻蓝蛋白)、色霉素、镧系元素螯合物和量子点纳米晶体。放射性同位素标记的实例包括^99mTc、¹¹¹In、^114mIn、¹¹⁵In、¹⁸F、¹⁴C、⁶⁴Cu、¹³¹I、¹²⁵I、¹²³I、²¹²Bi、⁸⁸Y、⁹⁰Y、⁶⁷Cu、¹⁸⁶Rh、¹⁸⁸Rh、⁶⁶Ga、⁶⁷Ga和¹⁰B，其任选地经由螯合部分连接，所述螯合部分例如DTPA(二亚乙基三胺五乙酸酐)、DOTA(1,4,7,10-四氮杂环十二烷-N,N′,N″,N″′-四乙酸)、NOTA(1,4,7-三氮杂环壬烷N,N′,N″-三乙酸)、TETA(1,4,8,11-四氮杂环十四烷-N,N′,N″,N″′-四乙酸)、DTTA(N¹-(对异硫氰酸酯基苄基)-二亚乙基三胺-N¹,N²,N³,N³-四乙酸)、去铁胺或DFA(N'-[5-[[4-[[5-(乙酰基羟氨基)-戊基]氨基]-1,4-二氧代丁基]羟氨基]-N-(5-氨基戊基)-N-羟基丁二酰胺)或HYNIC(肼基-烟酰胺)。同位素标记技术是本领域技术人员已知的，并且在例如G.T.Hermanson,“Bioconjugate Techniques”,Elsevier,3^rd Ed.2013,第12章:“Isotopic labelling techniques”,p.507–534中更详细地进行了描述，该文献通过引用的方式纳入本文。

适合用作本发明的化合物中的靶分子D的聚合物是本领域技术人员已知的，并且在例如G.T.Hermanson,“Bioconjugate Techniques”,Elsevier,3^rd Ed.2013,Chapter 18:“PEGylation and synthetic polymer modification”,p.787–838中更详细地描述了几个实例，该文献通过引用的方式纳入本文。当靶分子D是聚合物时，靶分子D优选独立地选自聚(乙二醇)(PEG)、聚环氧乙烷(PEO)、聚丙二醇(PPG)、聚环氧丙烷(PPO)、1,x-二氨基烷烃聚合物(其中x是烷烃中的碳原子数，优选x为2至200，优选2至10的整数)、(聚)乙二醇二胺(例如，1,8-二氨基-3,6-二氧杂辛烷和含有较长的乙二醇链的等同物)、多糖(例如葡聚糖)、聚(氨基酸)(例如聚(L-赖氨酸))和聚(乙烯醇)、聚(2-噁唑啉)(PAOx)。

适合用作靶分子D的固体表面是本领域技术人员已知的。固体表面是例如功能性表面(例如纳米材料、碳纳米管、富勒烯或病毒壳体的表面)、金属表面(例如钛、金、银、铜、镍、锡、铑或锌表面)、金属合金表面(其中合金来自例如铝、铋、铬、钴、铜、镓、金、铟、铁、铅、镁、汞、镍、钾、钚、铑、钪、银、钠、钛、锡、铀、锌和/或锆)、聚合物表面(其中聚合物为例如聚苯乙烯、聚氯乙烯、聚乙烯、聚丙烯、聚(二甲基硅氧烷)或聚甲基丙烯酸甲酯、聚丙烯酰胺)、玻璃表面、硅氧烷表面、色谱载体表面(其中色谱载体为例如二氧化硅载体、琼脂糖载体、纤维素载体或氧化铝载体)等。当靶分子D是固体表面时，优选D独立地选自功能性表面或聚合物表面。

水凝胶是本领域技术人员已知的。水凝胶是由聚合物成分之间的交联形成的水溶胀网。参见例如A.S.Hoffman,Adv.Drug Delivery Rev.2012,64,18，其通过引用的方式纳入本文。当靶分子是水凝胶时，优选的是水凝胶由作为聚合物基体的聚乙二醇(PEG)组成。

适合用作靶分子D的微米颗粒和纳米颗粒是本领域技术人员已知的。各种合适的微米颗粒和纳米颗粒描述于例如G.T.Hermanson,“Bioconjugate Techniques”,Elsevier,3^rd Ed.2013,Chapter 14:“Microparticles and nanoparticles”,p.549–587中，其通过引用的方式纳入本文。微米颗粒或纳米颗粒可以是任何形状，例如球体、杆、管、立方体、三角形和锥体。优选地，微米颗粒或纳米颗粒是球体形状的。微米颗粒和纳米颗粒的化学组成可以不同。当靶分子D是微米颗粒或纳米颗粒时，微米颗粒或纳米颗粒例如是聚合物微米颗粒或纳米颗粒、二氧化硅微米颗粒或纳米颗粒或金微米颗粒或纳米颗粒。当颗粒是聚合物微米颗粒或纳米颗粒时，聚合物优选为聚苯乙烯或苯乙烯的共聚物(例如苯乙烯与二乙烯基苯、丁二烯、丙烯酸酯和/或乙烯基甲苯的共聚物)、聚甲基丙烯酸甲酯(PMMA)、聚乙烯基甲苯、聚(甲基丙烯酸羟乙酯)(pHEMA)或聚(二甲基丙烯酸乙二醇酯/2-甲基丙烯酸羟乙酯)[聚(EDGMA/HEMA)]。任选地，微米颗粒或纳米颗粒的表面是经修饰的，例如使用洗涤剂通过次级聚合物的接枝聚合或通过另一个聚合物的共价连接或间隔基部分的共价连接等来修饰。

靶分子D也可以是生物分子。当靶分子D是生物分子时，优选生物分子选自蛋白质(包括糖蛋白和抗体)、多肽、肽、聚糖、脂质、核酸、寡核苷酸、多糖、寡糖、酶、激素、氨基酸和单糖。

CG是连接基团。在本文中，术语“连接基团”是指连接化合物的一个部分和同一化合物的另一部分的结构元件。通常，生物缀合物通过存在于接头缀合物中的反应性基团Q¹与存在于本发明的经修饰的糖蛋白中的官能团A的反应来制备。CG是经反应性基团Q¹与官能部分A反应形成的部分。如本领域技术人员将理解的，CG的性质取决于用于建立本发明的经修饰的糖蛋白和接头缀合物之间的连接的有机反应的类型。换言之，CG的性质取决于接头缀合物上的反应性基团Q¹的性质和生物分子中官能团A的性质。由于存在大量不同的化学反应可用于建立经修饰的糖蛋白和接头缀合物之间的连接，因此CG具有大量的可能性。当包含Q¹的接头缀合物与包含互补官能团F¹的生物分子缀合时，将存在于生物缀合物中的F¹和Q¹的合适的组合的若干实例，以及连接基团Z³的若干实例如图5所示。

当A为例如硫醇基时，互补基团Q¹包括N-马来酰亚胺基和链烯基，相应的连接基团CG如图5所示。当A是硫醇基时，互补基团Q¹还包括丙二烯酰胺基(allenamide group)。

当A为例如氨基时，互补基团Q¹包括酮基、活化酯基和叠氮基，相应的连接基团CG如图5所示。

当A为例如酮基时，互补基团Q¹包括(O-烷基)羟氨基和肼基，相应的连接基团CG如图5所示。

当A为例如炔基时，互补基团Q¹包括叠氮基，相应的连接基团CG如图5所示。

当A为例如烯基时，互补基团Q¹包括硫醇、在Diels-Alder环加成中反应的二烯或异二烯基和四嗪基，相应的连接基团CG可以分别是硫醚、Diels-Alder加合物(环己烯或其类似物)或二氢哒嗪。

当A为例如叠氮基时，互补基团Q¹包括炔基，相应的连接基团CG如图5所示。

当A为例如环丙烯基、反式环辛烯基或环辛炔基时，互补基团Q¹包括四嗪基，相应的连接基团Z³如图5所示。在这些特定的情况下，Z³仅为中间体结构并将去掉N₂，由此产生二氢哒嗪(来自与烯烃的反应)或哒嗪(来自与炔的反应)。

当A为例如卤素(X)时，互补基团Q¹包括硫醇，相应的连接基团CG可以是硫醚。

当A为例如–OS(O)₂R⁵时，互补基团Q¹包括羟基和(伯和仲)胺基团，相应的连接基团CG可以是醚或(仲或叔)胺基团。

当A为例如丙二烯基时，互补基团Q¹包括硫醇，相应的连接基团CG可以是硫醚，通常是甲基取代的硫醚。

当A为例如–SC(O)R⁸或–SC(V)OR⁸时，A通常首先对硫醇反应，互补基团Q¹包括N-马来酰亚胺基、烯基、丙二烯酰胺基。A是硫醇的相应的连接基团CG可如图5所示。

A和Q¹的其他合适的组合，以及所得连接基团CG的性质是本领域技术人员已知的，例如描述于G.T.Hermanson,“Bioconjugate Techniques”,Elsevier,3^rd Ed.2013(ISBN:978-0-12-382239-0)，特别是在第3章，第229-258页，其通过引用的方式纳入本文。适用于生物缀合过程的互补反应性基团的列表公开于G.T.Hermanson,“BioconjugateTechniques”,Elsevier,3^rd Ed.2013(ISBN:978-0-12-382239-0)的第3章的表3.1，第230-232页，该表的内容明确地通过引用的方式纳入本文。

Sp是间隔基或接头。在本文中将接头定义为连接化合物的两个或更多个元素的部分。例如在生物缀合物中，生物分子和靶分子通过接头彼此共价连接；在接头缀合物中，反应性基团Q¹通过接头与靶分子共价连接。本领域已知的适合用于生物缀合物，特别是抗体缀合物的任何接头可用作Sp。这些间隔基部分是本领域技术人员已知的。合适的间隔基部分的实例包括(聚)乙二醇二胺(例如1,8-二氨基-3,6-二氧杂辛烷或包含更长乙二醇链的等同物)、聚乙二醇链或聚环氧乙烷链、聚丙二醇链或聚环氧丙烷链和1,x-二氨基烷烃，其中x是烷烃中的碳原子数。另一类合适的间隔基部分包括可切割的间隔基部分或可切割的接头。可切割的接头是本领域公知的。例如Shabat等人，Soft Matter 2012,6,1073(通过引用的方式纳入本文)公开了可切割的接头，其包含经生物学触发——例如，酶裂解或氧化事件——释放的自消性部分。合适的可切割的接头的一些实例是在还原时被切割的二硫化物接头，在通过蛋白酶——例如组织蛋白酶、纤溶酶或金属蛋白酶——特异性识别时被切割的肽接头，或在糖苷酶——例如葡萄糖醛酸酶——特异性识别时被切割的基于糖苷的接头，或在贫氧、缺氧区域中被还原的硝基芳族化合物。在本文中，合适的可切割间隔基部分还包括包含特定的、可切割的氨基酸序列的间隔基部分。实例包括例如包含Val-Ala(缬氨酸-丙氨酸)或Val-Cit(缬氨酸-瓜氨酸)部分的间隔基部分。

在优选的实施方案中，Sp选自直链或支链C₁-C₂₀₀亚烷基、C₂-C₂₀₀亚烯基、C₂-C₂₀₀亚炔基、C₃-C₂₀₀亚环烷基、C₅-C₂₀₀亚环烯基、C₈-C₂₀₀亚环炔基、C₇-C₂₀₀烷基亚芳基、C₇-C₂₀₀芳基亚烷基、C₈-C₂₀₀芳基亚烯基和C₉-C₂₀₀芳基亚炔基、亚烷基、亚烯基、亚炔基、亚环烷基、亚环烯基、亚环炔基、烷基亚芳基、芳基亚烷基、芳基亚烯基和芳基亚炔基，其被一个或多个选自O、S和NR¹⁹的杂原子任选地取代和任选地间隔，其中R¹⁹独立地选自任选地被取代的氢、C₁-C₂₄烷基、C₂-C₂₄烯基、C₂-C₂₄炔基和C₃-C₂₄环烷基，烷基、烯基、炔基和环烷基。当亚烷基、亚烯基、亚炔基、亚环烷基、亚环烯基、亚环炔基、烷基亚芳基、芳基亚烷基、芳基亚烯基和芳基亚炔基被一个或多个如上文所定义的杂原子间隔时，优选地所述基团被一个或多个O原子和/或被一个或多个S-S基团间隔。

更优选地，Sp选自直链或支链C₁-C₁₀₀亚烷基、C₂-C₁₀₀亚烯基、C₂-C₁₀₀亚炔基、C₃-C₁₀₀亚环烷基、C₅-C₁₀₀亚环烯基、C₈-C₁₀₀亚环炔基、C₇-C₁₀₀烷基亚芳基、C₇-C₁₀₀芳基亚烷基、C₈-C₁₀₀芳基亚烯基和C₉-C₁₀₀芳基亚炔基，亚烷基、亚烯基、亚炔基、亚环烷基、亚环烯基、亚环炔基、烷基亚芳基、芳基亚烷基、芳基亚烯基和芳基亚炔基，其被一个或多个选自O、S和NR¹⁹的杂原子任选地取代和任选地间隔，其中R¹⁹独立地选自任选地被取代的氢、C₁-C₂₄烷基、C₂-C₂₄烯基、C₂-C₂₄炔基和C₃-C₂₄环烷基，烷基、烯基、炔基和环烷基。

甚至更优选地，Sp选自直链或支链C₁-C₅₀亚烷基、C₂-C₅₀亚烯基、C₂-C₅₀亚炔基、C₃-C₅₀亚环烷基、C₅-C₅₀亚环烯基、C₈-C₅₀亚环炔基、C₇-C₅₀烷基亚芳基、C₇-C₅₀芳基亚烷基、C₈-C₅₀芳基亚烯基和C₉-C₅₀芳基亚炔基，亚烷基、亚烯基、亚炔基、亚环烷基、亚环烯基、亚环炔基、烷基亚芳基、芳基亚烷基、芳基亚烯基和芳基亚炔基，其被一个或多个选自O、S和NR¹⁹的杂原子任选地取代和任选地间隔，其中R¹⁹独立地选自任选地被取代的氢、C₁-C₂₄烷基、C₂-C₂₄烯基、C₂-C₂₄炔基和C₃-C₂₄环烷基，烷基、烯基、炔基和环烷基。

甚至更优选地，Sp选自直链或支链C₁-C₂₀亚烷基、C₂-C₂₀亚烯基、C₂-C₂₀亚炔基、C₃-C₂₀亚环烷基、C₅-C₂₀亚环烯基、C₈-C₂₀亚环炔基、C₇-C₂₀烷基亚芳基、C₇-C₂₀芳基亚烷基、C₈-C₂₀芳基亚烯基和C₉-C₂₀芳基亚炔基，亚烷基、亚烯基、亚炔基、亚环烷基、亚环烯基、亚环炔基、烷基亚芳基、芳基亚烷基、芳基亚烯基和芳基亚炔基，其被一个或多个选自O、S和NR¹⁹的杂原子任选地取代和任选地间隔，其中R¹⁹独立地选自任选地被取代的氢、C₁-C₂₄烷基、C₂-C₂₄烯基、C₂-C₂₄炔基和C₃-C₂₄环烷基，烷基、烯基、炔基和环烷基。

在这些优选的实施方案中，进一步优选亚烷基、亚烯基、亚炔基、亚环烷基、亚环烯基、亚环炔基、烷基亚芳基、芳基亚烷基、芳基亚烯基和芳基亚炔基是未被取代的并且任选地被一个或多个选自O、S和NR¹⁹，优选O的杂原子间隔，其中R¹⁹独立地选自氢和C₁-C₄烷基，优选氢或甲基。

最优选地，Sp选自直链或支链C₁-C₂₀亚烷基，亚烷基被一个或多个选自O、S和NR¹⁹的杂原子任选地取代和任选地间隔，其中R¹⁹独立地选自任选地被取代的氢、C₁-C₂₄烷基、C₂-C₂₄烯基、C₂-C₂₄炔基和C₃-C₂₄环烷基，烷基、烯基、炔基和环烷基。在该实施方案中，进一步优选亚烷基是未取代的且任选地被一个或多个选自O、S和NR¹⁹，优选O和/或S-S的杂原子间隔，其中R¹⁹独立地选自氢和C₁-C₄烷基，优选氢或甲基。

特别优选的Sp部分包括-(CH₂)_n-、-(CH₂CH₂)_n-、-(CH₂CH₂O)_n-、-(OCH₂CH₂)_n-、-(CH₂CH₂O)_nC H₂CH₂-、-CH₂CH₂(OCH₂CH₂)_n-、-(CH₂CH₂CH₂O)_n-、-(OCH₂CH₂CH₂)_n-、-(CH₂CH₂CH₂O)_nCH₂CH₂CH₂-和-CH₂CH₂CH₂(O-CH₂CH₂CH₂)_n-，其中n为1至50的整数，优选1至40，更优选1至30，甚至更优选1至20，甚至更优选1至15。更优选n为1、2、3、4、5、6、7、8、9或10，更优选为1、2、3、4、5、6、7或8，甚至更优选为1、2、3、4、5或6，甚至更优选为1、2、3或4。

实施例

实施例1.GalNAc转移酶的选择和设计

选择四个特异性序列用于初始评估，特别是Uniprot登录号：Q9GUM2(秀丽隐杆线虫；在本文中表示为SEQ ID NO:2)、U1MEV9(猪蛔虫；在本文中表示为SEQ ID NO:3)、Q6J4T9(粉纹夜蛾，在本文中表示为SEQ ID NO:4)和Q7KN92(黑腹果蝇；在本文中表示为SEQ IDNO:5)。

基于预测的胞质结构域和跨膜结构域的缺失来构建多肽。这些多肽包含预测的秀丽隐杆线虫(由SEQ ID NO:6表示的CeGalNAcT[30-383])、猪蛔虫(由SEQ ID NO:7表示的AsGalNAcT[30-383])、粉纹夜蛾(由SEQ ID NO:8表示的TnGalNAcT[33-421])和黑腹果蝇(由SEQ ID NO:9表示的DmGalNAcT[47-403])。

此外，针对AsGalNAcT[30-383](由SEQ ID NO:71表示的His-AsGalNAcT[30-383])和TnGalNAcT[33-421](由SEQ ID NO:49表示的His-TnGalNAcT[33-421])构建含有N-末端His-标签的多肽变体。

实施例2.设计粉纹夜蛾GalNAcT突变体和猪蛔虫GalNAcT突变体

基于与UDP-N-乙酰基-半乳糖胺(PDB条目1OQM)复合的牛β(1,4)-Gal-T1和由Qasba等人(J.Biol.Chem.2002,277:20833-20839，通过引用的方式纳入本文)报道的β(1,4)-Gal-T1(Y289L)突变体的晶体结构来设计TnGalNAcT和AsGalNAcT的突变体。基于TnGalNAcT和AsGalNAcT与牛β(1,4)Gal-T1的序列比对来设计TnGalNAcT和AsGalNAcT的突变体。这些蛋白之间的对应氨基酸残基示于表1中。

表1.不同物种的GalNAcT/GalT中对应氨基酸的编号

TnGalNAcT	AsGalNAcT	牛β(1,4)-Gal-T1
			I311	I257	Y289
W336	W282	W314
			E339	E285	E317

实施例3.His-TnGalNAcT(33-421)突变体的定点诱变

从Genscript获得含有在NdeI-BamHI位点之间的密码子优化序列(其编码TnGalNAcT(由SEQ ID NO:8表示)的残基33-421)的pET15b载体，产生His-TnGalNAcT(33-421)(由SEQ ID NO:49表示)。使用一组重叠引物通过线性扩增PCR从上述构建体扩增TnGalNaCT突变基因。用于每个突变体的重叠引物组示于表2中。为了构建His-TnGalNAcT(33-421；W336F)(由SEQ ID NO:50表示)，用本文定义为SEQ ID NO:79和SEQ ID NO:80的一对引物扩增DNA片段。为了构建His-TnGalNAcT(33-421；W336H)(由SEQ ID NO:51表示)，用本文定义为SEQ ID NO:81和SEQ ID NO:82的一对引物扩增DNA片段。为了构建His-TnGalNAcT(33-421；W336V)(由SEQ ID NO:52表示)，用本文定义为SEQ ID NO:83和SEQ IDNO:84的一对引物扩增DNA片段。为了构建His-TnGalNAcT(33-421；E339A)(由SEQ ID NO:53表示)，用本文定义为SEQ ID NO:85和SEQ ID NO:86的一对引物扩增DNA片段。为了构建His-TnGalNAcT(33-421；E339G))(由SEQ IDNO:54表示)，用本文定义为SEQ ID NO:87和SEQID NO:88的一对引物扩增DNA片段。为了构建His-TnGalNAcT(33-421；E339D)(由SEQ IDNO:55表示)，用本文定义为SEQ ID NO:89和SEQ ID NO:90的一对引物扩增DNA片段。为了构建His-TnGalNAcT(33-421；I311Y)(由SEQ ID NO:60表示)，用本文定义为SEQ ID NO:91和SEQ ID NO:92的一对引物扩增DNA片段。在PCR扩增后，用DpnI处理反应混合物以消化模板DNA，随后转化到NEB 10-β感受态细胞(获自New England Biolabs)中。分离DNA并通过对于以下突变体的序列分析来确认序列：His-TnGalNAcT(33-421；W336F)(由SEQ ID NO:50表示)、His-TnGalNAcT(33-421；W336V)(由SEQ ID NO:52表示)、His-TnGalNAcT(33-421；E339A)(由SEQ ID NO:53表示)和His-TnGalNAcT(33-421；I311Y)(由SEQ ID NO:60表示)。

表2.所用引物的序列标识。对应于突变氨基酸的密码子以粗体显示。

实施例4.His-TnGalNAcT(33-421)、His-TnGalNAcT(33-421；W336F)、His-TnGalNAcT(33-421；W336V)和His-TnGalNAcT(33-421；E339A)在大肠杆菌中的表达和重折叠

从如实施例3中所述获得的相应的pET15b构建体表达His-TnGalNAcT(33-421)、His-TnGalNAcT(33-421；W336F)、His-TnGalNAcT(33-421；W336V)和His-TnGalNAcT(33-421；E339A)。根据由Qasba等人(Prot.Expr.Pur.2003,30,219-76229，通过引用的方式纳入本文)报道的过程进行表达、包涵体分离和重折叠。重折叠后，通过离心(以8000×g离心10分钟)除去不溶性蛋白，随后通过0.45μM孔径的过滤器过滤。使用HisTrap HP 5mL柱(GEHealthcare)纯化和浓缩可溶性蛋白。首先用缓冲液A(20mM Tris缓冲液、20mM咪唑、500mMNaCl，pH 7.5)洗涤柱。用缓冲液B(20mM Tris、500mM NaCl、250mM咪唑，pH 7.5，10mL)洗脱保留的蛋白。通过SDS-PAGE在聚丙烯酰胺凝胶(12％)上分析级分，合并含有纯化的靶蛋白的级分，并通过在4℃下透析过夜，相对于20mM Tris pH 7.5和150mM NaCl交换缓冲液。使用Amicon Ultra-0.5、Ultracel-10Membrane(Millipore)将纯化的蛋白浓缩至至少2mg/mL，并在进一步使用之前储存在-80℃下。

实施例5.GalNAcT和突变体在CHO中的瞬时表达

用Evitria(苏黎世，瑞士)以20mL的量在CHO K1细胞中瞬时表达蛋白。表达以下的GalNAcT变体：CeGalNAcT(30-383)(由SEQ ID NO:6表示)、AsGalNAcT(30-383)(由SEQ IDNO:7表示)、TnGalNAcT(33-421)(由SEQ ID NO:8表示)、DmGalNAcT(47-403)(由SEQ ID NO:9表示)和TnGalNAcT(33-421；E339A)(由SEQ ID NO:28表示)。在典型的纯化实验中，将含有表达的GalNAcT的CHO产生的上清液相对于20mM Tris缓冲液(pH 7.5)透析。将上清液(通常为25mL)通过0.45μm孔径过滤器过滤，随后经阳离子交换柱(HiTrap SP HP 5mL柱，GEHealthcare)进行纯化，所述阳离子交换柱在使用前用20mM Tris缓冲液(pH 7.5)平衡。在配备有外部级分收集器的AKTA Prime色谱系统上进行纯化。从系统泵A装载样品。通过用10倍柱体积(CV)的20mM Tris缓冲液(pH 7.5)洗涤柱来从柱上洗脱未结合的蛋白。用洗脱缓冲液(20mM Tris，1NaCl，pH 7.5；10mL)洗脱保留的蛋白。通过SDS-PAGE在聚丙烯酰胺凝胶(12％)上分析收集的级分，合并含有靶蛋白的级分并使用自旋过滤浓缩至0.5mL的体积。除了TnGalNAcT(33-421；E339A)之外，接下来使用AKTA purifier-10系统(UNICORN v6.3)在Superdex200 10/300GL尺寸排阻色谱柱(GE Healthcare)上纯化蛋白以获得纯的单体级分。通过SDS-PAGE分析级分，并在进一步使用之前将含有单体蛋白的级分储存在-80℃下。

IgG的质谱分析的一般方案

在质谱分析之前，将IgG用DTT处理，这使得能够分析轻链和重链，或用Fabricator^TM(可从Genovis，Lund，Sweden商购获得)处理，这使得能够分析Fc/2片段。为了分析轻链和重链，将20μg(经修饰的)IgG溶液用总体积4μL的100mM DTT在37℃下孵育5分钟。如果存在的话，在这些条件下将叠氮官能团还原成胺。为了分析Fc/2片段，将20μg(经修饰的)IgG溶液用在总体积10μL的磷酸盐缓冲盐水(PBS)pH 6.6中的Fabricator^TM(1.25U/μL)在37℃下孵育1小时。在还原或Fabricator消化后，使用Amicon Ultra-0.5、Ultracel-10Membrane(Millipore)将样品用milliQ洗涤两次，得到约40μL体积的最终样品。接下来，通过JEOL AccuTOF上的电喷雾离子化飞行时间(ESI-TOF)分析样品。使用Magtran软件获得去卷积的光谱。

实施例6.通过内切酶S处理制备经修剪的曲妥珠单抗。

用来自酿脓链球菌的内切酶S(可从Genovis，Lund，Sweden商购获得)进行曲妥珠单抗的聚糖修剪。因此，将曲妥珠单抗(10mg/mL)用于25mM Tris pH 8.0中的内切酶S(40U/mL)在37℃下孵育约16小时。将去糖基化的IgG浓缩，并使用Amicon Ultra-0.5,Ultracel-10Membrane(Millipore)用10mM MnCl₂和25mM Tris-HCl pH 8.0洗涤。在峰的去卷积后，质谱显示轻链的一个峰和重链的两个峰。重链的两个峰属于由核心GlcNAc(Fuc)取代的曲妥珠单抗产生的一种主要产物(49496Da，总重链的90％)和由经修剪的曲妥珠单抗产生的次要产物(49351Da，总重链的±10％)。

实施例7.在牛β(1,4)-Gal-T1的作用下，6-叠氮基-Gal-UDP糖基转移至经修剪的曲妥珠单抗

将通过如上文所述的曲妥珠单抗的内切酶S处理获得的经修剪的曲妥珠单抗(10mg/mL)用在10mM MnCl₂和25mM Tris-HCl pH 8.0中的6-叠氮基-Gal-UDP(1mM，可从GlycoHub商购获得)和0.1或0.5mg/mL牛β(1,4)-Gal-T1(可从Sigma Aldrich商购获得)在30℃下孵育过夜。经还原的样品的质谱分析表明，对于两种浓度的牛β(1,4)-Gal-T1均没有产物形成(主要重链峰49494Da，总重链的90％，由核心GlcNAc(Fuc)取代的曲妥珠单抗产生)。

实施例8.在牛β(1,4)-Gal-T1(130-402；Y289L，C342T)的作用下，6-叠氮基-N-乙酰半乳糖胺-UDP糖基转移至经修剪的曲妥珠单抗

使用衍生自牛β(1,4)-Gal-T1(由SEQ ID NO:1表示)的突变体，其含有Y289L和C342T突变且仅含有催化结构域(氨基酸残基130-402)。该牛β(1,4)-Gal-T1(130-402；Y289L，C342T)突变体由Qasba等人描述(J.Biol.Chem.2002,277,20833-20839，通过引用的方式纳入)，并且根据Qasba等人报道的方法(Prot.Expr.Pur.2003,30,219-76229，通过引用的方式纳入)表达、包涵体分离和重折叠。将通过如上文所述的曲妥珠单抗的内切酶S处理获得的经修剪的曲妥珠单抗(10mg/mL)用在10mM MnCl₂和25mM Tris-HCl pH7.5中的6-叠氮基-GalNAc-UDP(2.5mM，可从GlycoHub商购获得)和1mg/mLβ(1,4)-Gal-T1(130-402；Y289L，C342T)在37℃下孵育过夜。经还原的样品的质谱分析表明没有产物形成(主要重链峰49502Da，总重链的90％，由核心GlcNAc(Fuc)取代的曲妥珠单抗产生)。

实施例9.在GalNAcT的作用下，6-叠氮基-N-乙酰半乳糖胺-UDP糖基转移至经修剪的曲妥珠单抗

测试如实施例5中所述的进行表达和纯化的CeGalNAcT(30-383)(由SEQ ID NO:6表示)、AsGalNAcT(30-383)(由SEQ ID NO:7表示)、TnGalNAcT(33-421)(由SEQ ID NO:8表示)和DmGalNAcT(47-403)(由SEQ ID NO:9表示)的6-叠氮基GalNAc掺入。将通过如上文所述的曲妥珠单抗的内切酶S处理获得的经修剪的曲妥珠单抗(10mg/mL)用在10mM MnCl₂和25mM Tris-HCl pH 7.5以及0.2或0.5mg/mL的上述GalNAcT之一中的6-叠氮基-GalNAc-UDP(1mM，可从GlycoHub商购获得)在37℃下孵育过夜。

Fabricator^TM消化的样品的质谱分析表明，两种浓度的CeGalNAcT(30-383)和DmGalNAcT(47-403)均没有产物形成(主要Fc/2峰24139Da，总重链的90％，由核心GlcNAc(Fuc)取代的曲妥珠单抗产生)，而AsGalNAcT(30-383)和TnGalNAcT(33-421)均显示核心GlcNac(Fuc)取代的曲妥珠单抗(观察到的质量为24139Da)部分转化为产物(观察到的质量为24366Da)，由6-叠氮基-GalNAc转移至核心GlcNAc(Fuc)取代的曲妥珠单抗产生。获得的转化率示于表3中。

表3.通过不同酶浓度的GalNAcT将GlcNAc(Fuc)取代的曲妥珠单抗转化为6-叠氮基-GalNAc-GlcNAc(Fuc)取代的曲妥珠单抗的转化率(％)。

方案1：化合物88-94的合成以及经修饰的糖蛋白95-96的合成(实施例10-26)

实施例10. 6-叠氮基-6-脱氧-GalNAc-1-单磷酸酯80的合成

可以根据Wang等人，Bioorg.Med.Chem.Lett.,2009,19,5433中的方法来制备乙酰化糖79。

向乙酰化糖79(4.9g，11.9mmol)在MeOH(15mL)中的悬浮液中加入25％的NH₄OH水溶液(60mL)。将反应在室温下搅拌，并用LCMS监测转化率。4h后，将混合物减压浓缩，并在-20℃下保存2天。然后将固体重新溶解在25％的NH₄OH水溶液(75mL)中，在室温下搅拌，3h后，MS显示完全转化。浓缩溶剂得到为黄色固体的粗产物。采用定量NMR，显示60重量％为产物80，产量为3.2g(83％)。

¹H-NMR(400MHz,D₂O):δ5.28(dd,J＝7.2,3.2Hz,1H),4.12(dd,J＝6.8,6.4Hz,1H),4.06(ddd,J＝10.8,3.2,2.0Hz,1H),3.92-3.81(m,2H),3.47(dd,J＝12.8,7.2Hz,1H),3.40(dd,J＝12.8Hz,6.4Hz,1H),1.88(s,3H)。C₈H₁₅N₄O₈P(M-H⁺)LRMS(ESI-)计算值325.06，实测值325.30。

实施例11. 6-氨基-6-脱氧-GalNAc-1-单磷酸酯81的合成

向叠氮化物80(5.9mmol)在H₂O(30mL)和MeOH(30mL)中的溶液中加入Pd/C(400mg)，并将H₂鼓泡通过反应混合物1h。用TLC(7:3MeOH:MeCN)监测反应的转化率。将反应混合物通过硅藻土过滤，用MeOH和H₂O彻底冲洗，真空浓缩，得到产量为1.8g(99％)的粗产物81。

¹H-NMR(400MHz,D₂O):δ5.28(dd,J＝7.2,3.6Hz,1H),4.25(dd,J＝8.8,4.0Hz,1H),4.09-4.04(m,1H),3.90-3.79(m,2H),3.19-3.08(m,2H),1.85(s,3H)。C₈H₁₇N₂O₈P(M-H⁺)LRMS(ESI-)计算值299.06，实测值229.29。

实施例12. 6-(2-氯乙酰氨基)-6-脱氧-GalNAc-1-单磷酸酯82的合成

根据Hosztafi等人，Helv.Chim.Acta,1996,79,133中的方法制备氯乙酸琥珀酰亚胺酯。

在氮气气氛下，向糖81(12mg，0.040mmol)的无水DMF(0.5mL)溶液中加入氯乙酸琥珀酰亚胺酯(9mg，0.044mmol)和Et₃N(6.7μL，0.048mmol)。将反应混合物在室温下搅拌并真空浓缩，得到粗产物82。

¹H-NMR(400MHz,D₂O):δ5.42-5.32(m,1H),4.13-4.02(m,4H),3.92-3.81(m,2H),3.53-3.46(m,1H),3.33-3.26(m,1H),1.94(s,3H)。C₁₀H₁₈ClN₂O₉P(M-H⁺)LRMS(ESI-)计算值375.68(100％),377.03(30％),实测值3.75.08(100％),377.19(25％)。

实施例13. 6-(4-叠氮基苯甲酰氨基)-6-脱氧-GalNAc-1-单磷酸酯83的合成

根据Hartman等人，Chem.Comm.,2012,48,4755中的方法制备4-叠氮基苯甲酸琥珀酰亚胺酯。

在氮气气氛下，向糖81(38mg，0.127mmol)的无水DMF(1.5mL)溶液中加入Et₃N(21μL，0.152mmol)和4-叠氮基苯甲酸琥珀酰亚胺酯(36mg，0.139mmol)，在室温下搅拌反应混合物。加入另外的4-叠氮基苯甲酸琥珀酰亚胺酯(36mg，0.139mmol)和Et₃N(42μL，0.304mmol)，将反应物在室温下搅拌5天。用TLC和MS监测产物形成。6天后将反应混合物浓缩，得到粗产物83。

C₁₅H₂₀N₅O₉P(M-H⁺)LRMS(ESI-)计算值444.09，实测值444.20。

实施例14. 6-(N-2-叠氮基-2,2-二氟乙基氨基甲酸酯)-6-脱氧-GalNAc-1-单磷酸酯84的合成

根据WO2015/112016中所述的方法制备2-叠氮基-2,2-二氟乙醇。

在氮气气氛下，将2-叠氮基-2,2-二氟乙醇(200mg，1.63mmol)溶于DCM(10mL)中，加入4-硝基苯基氯甲酸酯(295mg，1.46mmol)和Et₃N(226μL，1.63mmol)，将所得混合物在室温下搅拌1h。接下来，将糖81(122mg，0.41mmol)溶于H₂O(2mL)中，加入Et₃N(113μL，0.81mmol)和DMF(5mL)，将所得溶液加入到反应混合物中。将反应在室温下搅拌16h，当TLC和LCMS确认糖81完全消耗时。减压除去溶剂，得到粗产物。用离子交换色谱法(Q HITRAP，3×5mL和1×15mL柱)进行纯化。通过加载缓冲液A(10mM NH₄HCO₃)实现柱上的第一次结合，并用缓冲液A冲洗柱。接下来，进行至40％ B(250mM NH₄HCO₃)的梯度来洗脱产物并用100％ B冲洗柱以除去剩余的副产物。将含有产物的级分冻干，得到所需产物84(147mg，0.33mmol，80％)。

¹H-NMR(400MHz,D₂O):δ5.17(dd,J＝6.4,3.2Hz,1H),4.40-4.24(m,2H),4.07-3.93(m,2H),3.85-3.70(m,2H),3.28-3.13(m,2H),1.87(s,3H)。C₁₁H₁₈F₂N₅O₁₀P(M-H⁺)LRMS(ESI-)计算值448.07，实测值448.14。

实施例15. 6-(N-1-(2-叠氮基乙基)脲)-6-脱氧-GalNAc-1-单磷酸酯85的合成

根据Zhang等人，J.Am.Chem.Soc.,2015,137,6000中所述的方法制备2-叠氮基乙胺。¹H-NMR(400MHz,CDCl₃):δ3.40-3.33(m,2H),2.91-2.81(m,2H)。

将羰基二咪唑(377mg，2.32mmol)溶于无水DMF(10mL)中，并在氮气气氛下搅拌。将2-叠氮基乙胺(200mg，2.32mmol)溶于无水DMF(5mL)中并滴加到CDI中。将所得溶液在室温下搅拌1h，然后加热至60℃。将糖81溶于H₂O(2mL)和DMF(5mL)中并加入到反应中。将所得悬浮液在60℃下搅拌16h。用LCMS监测所需产物的形成。搅拌16h后，加入H₂O(5mL)，然后加入在DCM(15mL)中的新活化的2-叠氮基乙胺。将所得混合物在60℃下再搅拌16h，并在减压下除去溶剂。然后将粗产物溶于MeOH(10mL)和H₂O(15mL)中，并用EtOAC(2×30mL)洗涤。将水相浓缩以得到粗产物，将该粗产物用离子交换色谱法纯化(Q-HITRAP，3x5 mL和1x15 mL色谱柱)。通过加载缓冲液A(10mM NH₄HCO₃)实现柱上的第一次结合，并用缓冲液A冲洗柱。接下来，进行至40％ B(250mM NH₄HCO₃)的梯度来洗脱产物并用100％ B冲洗柱以除去剩余的副产物。将含有产物的级分冻干，得到所需产物85(147mg，0.33mmol，80％)。

¹H-NMR(400MHz,D₂O):δ5.30(br s,1H),4.13-3.93(m,2H),3.91-3.76(m,2H),3.35-3.10(m,5H),1.92(s,3H)。C₁₁H₂₁N₆O₉P(M-H⁺)LRMS(ESI-)计算值411.10，实测值411.24。

实施例16. 6-(N-(2-S-乙酰基)巯基乙酰氨基)-6-脱氧-GalNAc-1-单磷酸酯86的合成

将糖81(105mg，0.35mmol)溶于H₂O(1.7mL)中并在室温下搅拌。在单独的小瓶中，将S-乙酰基巯基乙醇酸五氟苯基酯(210mg，0.70mmol)溶于DMF(1.7mL)中，并与Et₃N(146μL，1.05mmol)一起加入到反应中。将所得混合物在室温下搅拌16h，当LCMS显示完全消耗糖81时。在减压下除去溶剂，将粗产物通过快速色谱法(6:2:1-4:2:1EtOAc:MeOH:H₂O)纯化，得到产物86(95mg，0.23mmol，65％)。

¹H-NMR(400MHz,D₂O):δ5.33(dd,J＝6.8,3.6Hz,1H),4.11-4.00(m,2H),3.90-3.80(m,2H),3.63-3.53(m,2H),3.44(dd,J＝14.0,5.2Hz,1H),3.23(dd,J＝14.0,8.0Hz,1H),2.31(s,3H),1.94(s,3H)。C₁₂H₂₁N₂O₁₀PS(M-H⁺)LRMS(ESI-)计算值415.06，实测值415.18。

实施例17. 6-(N-2-叠氮基乙酰胺基)-6-脱氧-GalNAc-1-单磷酸酯87的合成

将叠氮基乙酸(101mg，1.0mmol)溶于DMF(2mL)中，加入EDC(192mg，1.0mmol)、NHS(115mg，1.0mmol)和DMAP(4mg，0.03mmol)。接下来，将糖81(100mg，0.33mmol)溶于H₂O(3mL)中，加入到反应中，在室温下搅拌16h。用LCMS监测所需产物的形成。将另一部分叠氮乙酸按如上所述活化，并加入到反应中。4h后，将反应物真空浓缩。用离子交换色谱法(Q-HITRAP，3×5mL和1×15mL柱)进行纯化。通过加载缓冲液A(10mM NH₄HCO₃)实现柱上的第一次结合，并用缓冲液A冲洗柱。接下来，进行至40％ B(250mM NH₄HCO₃)的梯度来洗脱产物并用100％ B冲洗柱以除去剩余的副产物。将含有产物的级分冻干，得到所需产物87(100mg，0.26mmol，79％)。

¹H-NMR(400MHz,D₂O):δ5.34(br s,1H),4.13-4.03(m,2H),3.93(s,2H),3.92-3.81(m,2H),3.48(dd,J＝14.0,4.0Hz,1H),3.29(dd,J＝14.0,8.0Hz,1H),1.95(s,3H)。C₁₀H₁₈N₅O₉P(M-H⁺)LRMS(ESI-)计算值382.08，实测值382.15。

实施例18. 6-(2-氯乙酰胺基)-6-脱氧-GalNAc-UDP 88的合成

根据由Baisch等人Bioorg.Med.Chem.,1997,5,383描述的方法将单磷酸酯82与UMP偶联。

简言之，在氮气气氛下将尿苷-5'-单磷酸三丁基铵(31mg，0.06mmol)溶于无水DMF(0.5mL)中。加入羰基二咪唑(13mg，0.04mmol)，将反应混合物在室温下搅拌30min。接下来，加入无水MeOH(2.5μL)并搅拌15min以除去过量的CDI。在高真空下15min除去剩余的MeOH。随后，将单磷酸酯82(15mg，0.04mmol)溶于无水DMF(0.5mL)中，加入到反应混合物中，然后加入N-甲基咪唑、HCl盐(25mg，0.16mmol)。将反应在室温下搅拌过夜，然后真空浓缩。通过MS监测单磷酸盐中间体的消耗。用离子交换色谱法(Q-HITRAP，1×5mL柱)进行纯化。通过加载缓冲液A(10mM NH₄HCO₃)实现柱上的第一次结合，并用缓冲液A冲洗柱。接下来，进行至40％ B(250mM NH₄HCO₃)的梯度来洗脱产物并用100％ B冲洗柱以除去剩余的副产物。将含有产物的级分冻干，得到所需产物88(1mg，1.46μmol，4％)。

C₁₉H₂₉ClN₄O₁₇P₂(M-H⁺)LRMS(ESI-)计算值681.06(100％),683.06(32％)，实测值681.13(100％),683.15(40％)。

实施例19. 6-(4-叠氮基苯甲酰氨基)-6-脱氧-GalNAc-UDP 89的合成

根据由Baisch等人Bioorg.Med.Chem.,1997,5,383描述的方法将单磷酸酯83与UMP偶联。

简言之，在氮气气氛下将尿苷-5'-单磷酸三丁基铵(77mg，0.15mmol)溶于无水DMF(1mL)中。加入羰基二咪唑(41mg，0.25mmol)，将反应混合物在室温下搅拌30min。接下来，加入无水MeOH(6.2μL)并搅拌15min以除去过量的CDI。在高真空下15min除去剩余的MeOH。随后，将单磷酸酯83(56mg，0.13mmol)溶于无水DMF(1mL)中，加入到反应混合物中，然后加入N-甲基咪唑、HCl盐(79mg，0.51mmol)。将反应在室温下搅拌过夜，然后真空浓缩。通过MS监测单磷酸盐中间体的消耗。用离子交换色谱法(Q-HITRAP，3×5mL柱，1×15mL柱)进行纯化。通过加载缓冲液A(10mM NH₄HCO₃)实现柱上的第一次结合，并用缓冲液A冲洗柱。接下来，进行至40％ B(250mM NH₄HCO₃)的梯度来洗脱产物并用100％ B冲洗柱以除去剩余的副产物。将含有产物的级分冻干，得到所需产物89(13mg，0.017mmol，14％)。

C₂₄H₃₁N₇O₁₇P₂(M-H⁺)LRMS(ESI-)计算值750.12，实测值750.33。

实施例20. 6-(N-2-叠氮基-2,2-二氟乙基氨基甲酸酯)-6-脱氧-GalNAc-UDP 90的合成

根据由Baisch等人Bioorg.Med.Chem.,1997,5,383描述的方法将单磷酸酯84与UMP偶联。

简言之，在氮气气氛下将尿苷-5'-单磷酸三丁基铵(200mg，0.39mmol)溶于无水DMF(3mL)中。加入羰基二咪唑(106mg，0.65mmol)，将反应混合物在室温下搅拌30min。接下来，加入无水MeOH(16μL)并搅拌15min以除去过量的CDI。在高真空下15min除去剩余的MeOH。随后，将单磷酸酯84(147mg，0.33mmol)悬浮于无水DMF(3mL)中，加入到反应混合物中，然后加入N-甲基咪唑、HCl盐(204mg，1.31mmol)。通过MS监测单磷酸盐中间体的消耗。将反应在室温下搅拌3天。将另一部分的UMP如上所述地活化，并与1mL H₂O一起加入到反应中。搅拌过夜后，反应完成，减压除去溶剂。用离子交换色谱法(QHITRAP，3×5mL柱，1×15mL柱)进行纯化。通过加载缓冲液A(10mM NH₄HCO₃)实现柱上的第一次结合，并用缓冲液A冲洗柱。接下来，进行至40％ B(250mM NH₄HCO₃)的梯度来洗脱产物并用100％ B冲洗柱以除去剩余的副产物。将含有产物的级分冻干，得到所需产物90(122mg，0.16mmol，49％)。

C₂₀H₂₉F₂N₇O₁₈P₂(M-H⁺)LRMS(ESI-)计算值754.09，实测值754.16。

实施例21. 6-(N-1-(2-叠氮基乙基)脲)-6-脱氧-GalNAc-UDP 91的合成

根据由Baisch等人Bioorg.Med.Chem.,1997,5,383描述的方法将单磷酸酯85与UMP偶联。

简言之，在氮气气氛下将尿苷-5'-单磷酸三丁基铵(126mg，0.25mmol)溶于无水DMF(2mL)中。加入羰基二咪唑(67mg，0.41mmol)，将反应混合物在室温下搅拌30min。接下来，加入无水MeOH(10μL)并搅拌15min以除去过量的CDI。在高真空下15min除去剩余的MeOH。随后，将单磷酸酯85(85mg，0.21mmol)溶于无水DMF(2mL)中，加入到反应混合物中，然后加入N-甲基咪唑、HCl盐(129mg，0.82mmol)。将反应在室温下搅拌2天，然后真空浓缩。通过MS监测单磷酸盐中间体的消耗。用离子交换色谱法(Q HITRAP，3×5mL柱，1×15mL柱)进行纯化。通过加载缓冲液A(10mM NH₄HCO₃)实现柱上的第一次结合，并用缓冲液A冲洗柱。接下来，进行至40％ B(250mM NH₄HCO₃)的梯度来洗脱产物并用100％ B冲洗柱以除去剩余的副产物。将含有产物的级分冻干，得到所需产物91(83mg，012mmol，56％)。

C₂₀H₃₂N₈O₁₇P₂(M-H⁺)LRMS(ESI-)计算值717.13，实测值717.27。

实施例22. 6-(N-(2-S-乙酰基)-巯基乙酰胺基)-6-脱氧-GalNAc-UDP 92的合成

根据由Baisch等人Bioorg.Med.Chem.,1997,5,383描述的方法将单磷酸酯86与UMP偶联。

简言之，在氮气气氛下将尿苷-5'-单磷酸三丁基铵(139mg，0.27mmol)溶于无水DMF(2mL)中。加入羰基二咪唑(74mg，0.46mmol)，将反应混合物在室温下搅拌30min。接下来，加入无水MeOH(11μL)并搅拌15min以除去过量的CDI。在高真空下15min除去剩余的MeOH。随后，将单磷酸酯86(95mg，0.27mmol)溶于无水DMF(2mL)中，加入到反应混合物中，然后加入N-甲基咪唑、HCl盐(142mg，0.91mmol)。将反应在室温下搅拌3天，然后真空浓缩。通过MS监测单磷酸盐中间体的消耗。用快速色谱(7:2:1-4:2:1EtOAc:MeOH:H₂O)进行纯化，得到产物92(97mg，0.13mmol，49％)。

C₂₁H₃₂N₄O₁₈P₂S(M-H⁺)LRMS(ESI-)计算值721.08，实测值721.39。

实施例23. 6-(2-叠氮基乙酰氨基)-6-脱氧-GalNAc-UDP 93的合成

根据由Baisch等人Bioorg.Med.Chem.,1997,5,383描述的方法将单磷酸酯87与UMP偶联。

简言之，在氮气气氛下将尿苷-5'-单磷酸三丁基铵(191mg，0.38mmol)溶于无水DMF(3mL)中。加入羰基二咪唑(102mg，0.63mmol)，将反应混合物在室温下搅拌30min。接下来，加入无水MeOH(16μL)并搅拌15min以除去过量的CDI。在高真空下15min除去剩余的MeOH。随后，将单磷酸酯87(120mg，0.31mmol)溶于无水DMF(3mL)中，加入到反应混合物中，然后加入N-甲基咪唑、HCl盐(195mg，1.25mmol)。通过MS监测单磷酸盐中间体的消耗。将反应在室温下搅拌16h。为了溶解反应物中的所有组分，加入1mL H₂O。搅拌3h后，减压除去溶剂。用离子交换色谱法(Q-HITRAP，3×5mL柱，1×15mL柱)进行纯化。通过加载缓冲液A(10mMNH₄HCO₃)实现柱上的第一次结合，并用缓冲液A冲洗柱。接下来，进行至40％ B(250mMNH₄HCO₃)的梯度来洗脱产物并用100％ B冲洗柱以除去剩余的副产物。将含有产物的级分冻干，得到所需产物93(10mg，0.015mmol，5％)。

C₁₉H₂₉N₇O₁₇P₂(M-H⁺)LRMS(ESI-)计算值688.10，实测值688.10。

实施例24. 6-氨基-6-脱氧-GalNAc-UDP 94的合成

向6-叠氮基-GalNAc-UDP(25mg，0.04mmol)的H₂O(0.5mL)溶液中加入DTT(6mg，0.04mmol)，并加入几滴Et₃N。将反应在室温下搅拌2h，然后用LCMS监测反应。为了加速反应，加入额外的DTT(12mg，0.08mmol)，1h后反应完成，真空浓缩。用离子交换色谱法(Q-HITRAP，1×5mL柱)进行纯化。通过加载缓冲液A(10mM NH₄HCO₃)实现柱上的第一次结合，并用缓冲液A冲洗柱。接下来，进行至40％ B(250mM NH₄HCO₃)的梯度来洗脱产物并用100％ B冲洗柱以除去剩余的副产物。将含有产物的级分冻干，得到所需产物94(12mg，0.019mmol，51％)。

C₁₇H₂₈N₄O₁₆P₂(M-H⁺)LRMS(ESI-)计算值605.09，实测值605.11。

实施例25.本妥昔单抗–(6-氨基-6-脱氧-GalNAc)，95的制备

类似于实施例6中所述的对曲妥珠单抗的修剪来修剪本妥昔单抗。

将经修剪的本妥昔单抗(15mg/mL)用在10mM MnCl₂和25mM Tris-HCl pH 8.0中的6-氨基-6-脱氧-GalNAc-UDP 94(5mM)和TnGalNAcT(1.5mg/mL)在30℃下孵育过夜。将反应混合物的样品(2μL)用总体积10μL的磷酸盐缓冲盐水(PBS)pH 6.6中的Fabricator^TM(1.25U/μL)在37℃下孵育1小时。该样品的质谱分析显示完全转化为产物本妥昔单抗-(6-氨基-GalNAc)(24307Da(70％)和24435(30％，C-末端赖氨酸变体))。

实施例26.本妥昔单抗-(6-(2-叠氮基乙酰氨基)-6-脱氧-GalNAc)，96的制备

将经修剪的本妥昔单抗(15mg/mL)用10mM MnCl₂和25mM Tris-HCl pH 8.0中的6-(2-叠氮基乙酰氨基)-6-脱氧-GalNAc 93(5mM)和TnGalNAcT(1.5mg/mL)在30℃下孵育过夜。将反应混合物的样品(2μL)用总体积10μL的磷酸盐缓冲盐水(PBS)pH6.6中的Fabricator^TM(1.25U/μL)在37℃下孵育1小时。该样品的质谱分析显示70％转化为产物本妥昔单抗-(6-(2-叠氮基乙酰氨基)-6-脱氧-GalNAc)(24391Da(70％)和24518(30％，C-末端赖氨酸变体))。

Claims

1.修饰糖蛋白的方法，所述方法包括以下步骤：在糖基转移酶的存在下，使包含含有末端GlcNAc部分的聚糖的糖蛋白与糖衍生物核苷酸Su(A)-Nuc接触，其中：

(ii)所述含有末端GlcNAc部分的聚糖如式(1)或(2)所示：

其中：

b为0或1；

d为0或1；

e为0或1；以及

G为单糖，或包含2至20个糖部分的直链或支链寡糖；以及

(iii)所述糖衍生物核苷酸Su(A)-Nuc如式(3)所示：

其中：

a为0或1；

f为0或1；

g为0或1；

Nuc为核苷酸；

T为C₃-C₁₂(杂)亚芳基，其中(杂)亚芳基被任选地取代；

A选自：

(a)-N₃

(b)-C(O)R³

其中R³为任选取代的C₁-C₂₄烷基；

(c)(杂)环炔基或-(CH₂)_iC≡C-R⁴部分

其中i为0-10且R⁴为氢或任选取代的C₁-C₂₄烷基；

(d)-SH

(e)-SC(O)R⁸

其中R⁸为任选取代的C₁-C₂₄烷基或苯基；

(f)-SC(V)OR⁸

其中V为O或S，R⁸为任选取代的C₁-C₂₄烷基或苯基；

(g)-X

其中X选自F、Cl、Br和I；

(h)-OS(O)₂R⁵

(i)R¹²

(j)R¹³

其中R¹³为任选取代的末端C₃-C₂₄丙二烯基；以及

(k)N(R¹⁷)₂

其中R¹⁷独立地选自H和C₁-C₁₂烷基；

Z为CH₂、CF₂或C(O)；或Z为CHOH，条件是g为0、f为1且a为0或1；

Y选自O、S、N(R¹⁵)、N(R¹⁵)C(O)、N(R¹⁵)C(O)N(R¹⁵)、N(R¹⁵)C(O)O、OC(O)N(R¹⁵)S(O)₂N(R¹⁵)和N(R¹⁵)C(O)N(R¹⁵)S(O)₂O，其中R¹⁵独立地选自H、C₁-C₁₂烷基和(U)_f-(T)_a-A，其中f、a、U、T和A如上文所定义；以及

R¹⁴独立地选自：

其中：

a、f、T、A和U如上文所定义；

h为0或1；以及

W选自O、S、NR¹⁵、NHS(O)₂O和NHS(O)₂NR¹⁵，其中R¹⁵如上文所定义。

2.权利要求1的方法，其中所述β-(1,4)-N-乙酰半乳糖胺转移酶为或衍生自无脊椎动物β-(1,4)-GalNAcT酶。

3.前述权利要求中任一项的方法，其中所述β-(1,4)-N-乙酰半乳糖胺转移酶为或衍生自选自SEQ ID NO:2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、25、26、27、28、29、30、31、32、33、34、46、47、49、50、51、52、53、54、55、56、57、58、59、71、72和73，或选自SEQ ID NO:35、36、37、38、39、40、41、42、43、44、45、48、60、61、62、63、64、65、66、67、68、69、70和74的序列。

4.前述权利要求中任一项的方法，其中所述β-(1,4)-N-乙酰半乳糖胺转移酶与选自SEQ ID NO:2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、25、26、27、28、29、30、31、32、33、34、46、47、49、50、51、52、53、54、55、56、57、58、59、71、72和73，或选自SEQ ID NO：35、36、37、38、39、40、41、42、43、44、45、48、60、61、62、63、64、65、66、67、68、69、70和74的序列具有至少50％的序列同一性。

5.前述权利要求中任一项的方法，其中A选自-N₃、-C(O)CH₃、-SH、-CH＝CH₂和-CH₂C≡CH。

6.前述权利要求中任一项的方法，其中糖衍生物核苷酸Su(A)-Nuc如式(15)、(16)、(17)或(18)所示：