CN101151367B - 哺乳动物糖基转移酶的重折叠方法 - Google Patents

哺乳动物糖基转移酶的重折叠方法 Download PDF

Info

Publication number
CN101151367B
CN101151367B CN200580010602.4A CN200580010602A CN101151367B CN 101151367 B CN101151367 B CN 101151367B CN 200580010602 A CN200580010602 A CN 200580010602A CN 101151367 B CN101151367 B CN 101151367B
Authority
CN
China
Prior art keywords
glycosyltransferase
refolding
albumen
eucaryon
mbp
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN200580010602.4A
Other languages
English (en)
Other versions
CN101151367A (zh
Inventor
S·萨里巴斯
D·黑克斯
S·威利特
K·F·约翰逊
D·J·贝兹拉
S·德弗里斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Novo Nordisk AS
Original Assignee
Novo Nordisk AS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Novo Nordisk AS filed Critical Novo Nordisk AS
Priority claimed from PCT/US2005/003856 external-priority patent/WO2005089102A2/en
Publication of CN101151367A publication Critical patent/CN101151367A/zh
Application granted granted Critical
Publication of CN101151367B publication Critical patent/CN101151367B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本发明提供了重折叠细菌细胞中产生的哺乳动物糖基转移酶的方法,和这种重折叠糖基转移酶,包括重折叠能力增强的糖基转移酶突变体的应用方法。本发明也提供在一个容器中重折叠一种以上糖基转移酶的方法,和这些重折叠糖基转移酶的应用方法,以及包含这种重折叠糖基转移酶的反应混合物。

Description

哺乳动物糖基转移酶的重折叠方法
相关申请的交叉参考 
本申请要求2004年2月4日提交的美国临时申请号60/542,210、2004年8月6日提交的美国临时申请号60/599,406和2004年11月12日提交的美国临时申请号60/627,406的优先权;各自纳入本文作为参考用于所有目的。 
发明领域
本发明提供了重折叠细菌细胞中产生的哺乳动物糖基转移酶的方法,包括具有增强的重折叠能力的糖基转移酶突变体和这种重折叠糖基转移酶的应用方法。本发明也提供在一个容器中重折叠一种以上糖基转移酶的方法,这种重折叠糖基转移酶的应用方法,和包含这种重折叠糖基转移酶的反应混合物。 
发明背景 
真核生物能合成具有商业和治疗用途的寡糖结构或糖偶联物,如糖脂或糖蛋白。可用重组真核糖基转移酶体外合成寡糖或糖偶联物。产生用于寡糖合成的重组真核糖基转移酶的最有效方法是在细菌中表达该蛋白质。然而在细菌中,许多真核糖基转移酶表达为细菌包含体中的不溶性蛋白质,从包含体中得到活性蛋白质的产率可能非常低。因此,需要在细菌中产生真核糖基转移酶的改进方法。本发明解决了这个需要和其它需要。 
发明概述 
本发明提供了重折叠包含麦芽糖结合蛋白结构域(MBD)的不溶性、重组、真核糖基转移酶的方法。将此不溶性、重组、真核糖基转移酶溶解于增溶缓冲液中,然后与含有氧化还原对的重折叠缓冲液接触,该重折叠真核糖基转移酶能催化使糖基从供体物质转移到受体物质上。在一个实施方式中,截短该真核糖基转移酶以去除该蛋白的全部或部分主干区。在另一实施方式中,用非半胱氨酸氨基酸取代去除真核糖基转移酶中未配对的半胱氨酸,在另一实施方式中,用非半胱氨酸氨基酸取代 去除真核糖基转移酶中未配对的半胱氨酸和截短真核糖基转移酶以去除该蛋白的全部或部分主干区。 
在一个实施方式中,该真核糖基转移酶选自GnT1、GalT1、StIII Gal3、St3GalI、St6GalNAcTI、Core GalITI、GalNAcT2。 
在一个实施方式中,该真核糖基转移酶还包含纯化结构域,如淀粉结合域(SBD)、硫氧还蛋白结构域、SUMO结构域、聚His结构域、myc表位结构域和谷胱甘肽-S-转移酶结构域。 
在一个实施方式中,该真核糖基转移酶还包含自身切割结构域。 
在一个实施方式中,该真核糖基转移酶在细菌宿主细胞中表达为不溶性包含体。 
在一个实施方式中,用第一种真核糖基转移酶重折叠第二种不溶性重组真核糖基转移酶。在又一实施方式中,用第一种真核糖基转移酶和第二种真核糖基转移酶重折叠第三种不溶性重组真核糖基转移酶。还可根据用户需要加入不溶性重组真核糖基转移酶一起重折叠如,使4、5、6、7、8、9或10种糖基转移酶一起重折叠。 
在一个实施方式中,所述氧化还原对选自还原性谷胱甘肽/氧化性谷胱甘肽(GSH/GSSG)和半胱氨酸/胱胺。 
在一个实施方式中,受体物质选自蛋白质、肽、糖蛋白和糖肽。 
在一个实施方式中,该真核糖基转移酶是唾液酸转移酶。唾液酸转移酶可包括例如:StIII Gal3、St3GalI、St6GalNAcTI。在另一方面,供体底物是CMP-唾液酸PEG分子,受体底物选自蛋白质、肽、糖蛋白和糖肽。 
本发明也提供重组真核糖基转移酶,其中该蛋白缺失主干锚定区和跨膜结构域,其中糖基转移酶在阅读框中与麦芽糖结合蛋白(MBP)结构域融合。在一个实施方式中,该重组真核糖基转移酶和MBP结构域的融合体在细菌如大肠杆菌(E.Coli)中表达为不溶性包含体。 
在一个实施方式中,该重组真核糖基转移酶的全部或部分主干区缺失。在另一实施方式中,用非半胱氨酸氨基酸取代去除重组真核糖基转移酶中未配对的半胱氨酸。 
在又一实施方式中,该重组真核糖基转移酶是以下的一种:GnT1蛋白、GalT1蛋白质、StIII GaB蛋白、St3GalI蛋白、St6GalNAcTI蛋白、Core GalITI蛋白或GalNAcT2蛋白。 
在一个实施方式中,该重组真核糖基转移酶是GnT1蛋白,在一个方面,GnT1蛋白是截短的人GnT1蛋白,选自GnT1Δ35和GnT1Δ103。在另一方面,GnT1蛋白 是包含选自CYS121ALA、CYS121ASP和ARG120ALA、CYS121HIS的未配对半胱氨酸取代的人GnT1蛋白。在另一方面,GnT1蛋白是截短的和通过取代突变去除了未配对的半胱氨酸残基。 
在一个实施方式中,该重组真核糖基转移酶是GalT1蛋白。在一个方面,GalT1蛋白是截短的牛GalT1蛋白,选自GalT1Δ70和GalT1Δ129。在另一方面,GalT1蛋白是包含未配对半胱氨酸取代CYS342THR的牛GalT1蛋白。在另一方面,GalT1蛋白是截短的和通过取代突变去除了未配对的半胱氨酸残基。 
在一个实施方式中,该重组真核糖基转移酶是ST3GalIII蛋白,在一个方面,ST3GalIII蛋白是截短的大鼠ST3GalIII蛋白,选自ST3GalIIIΔ28、ST3GalIIIΔ73、ST3GalIIIΔ85和ST3GalIIIΔ86。在另一方面,ST3GalIII蛋白包含未配对半胱氨酸残基的氨基酸取代,在另一方面,ST3GalIII蛋白是截短的和通过取代突变去除了未配对的半胱氨酸残基。 
在一个实施方式中,如权利要求15所述的重组真核糖基转移酶中的糖基转移酶是Corel GalT1蛋白,在一个方面,Corel GalT1蛋白是截短的果蝇蛋白或截短的人蛋白,在另一方面,果蝇或人Corel GalT1蛋白包含未配对半胱氨酸残基的氨基酸取代,在另一方面,果蝇或人Corel GalT1蛋白是截短的和通过取代突变去除了未配对的半胱氨酸残基。 
在一个实施方式中,重组真核糖基转移酶是ST3Gal1蛋白。在一个方面,ST3Gal1蛋白是截短的人蛋白,选自ST3GallΔ29、ST3Gal1Δ45和ST3Gal1Δ56。在另一方面,ST3Gal1蛋白包含未配对半胱氨酸残基的氨基酸取代,在另一方面,ST3Gal1蛋白是截短的和通过取代突变去除了未配对的半胱氨酸残基。 
在一个实施方式中,重组真核糖基转移酶是ST6GalNAc1蛋白。在一个方面,ST6GalNAc1蛋白是截短的小鼠蛋白、截短的鸡蛋白或截短的人蛋白,如表14所列截短蛋白之一。在另一方面,小鼠、鸡或人ST6GalNAc1蛋白包含未配对半胱氨酸残基的氨基酸取代。在另一方面,小鼠、鸡或人ST6GalNAc1蛋白是截短的和通过取代突变去除了未配对的半胱氨酸残基。 
在一个实施方式中,如权利要求15所述的重组真核糖基转移酶中的糖基转移酶是GalNAcT2蛋白,在一个方面,GalNAcT2蛋白是截短的人蛋白,选自GalNAcT2Δ40、GalNAcT2Δ51、GalNAcT2Δ74和GalNAcT2Δ95。在另一方面,人GalNAcT2蛋白包含未配对半胱氨酸残基的氨基酸取代。在另一方面,人GalNAcT2蛋白是截短的和通过取代突变去除了未配对的半胱氨酸残基。
本发明也提供了用上述重组真核糖基转移酶在重折叠蛋白质后具有酶活后的蛋白质、肽、糖蛋白或糖肽的方法。 
本发明提供了将不溶性真核糖基转移酶重折叠成活性形式的改进方法,也提供了具有增强的重折叠性能的糖基转移酶,如N-乙酰葡糖胺鸡转移酶I(GnTI)。 
在一个方面,本发明提供了重组真核N-乙酰葡糖胺鸡转移酶I(GnTI),该酶经突变用能促进不溶性沉淀如细菌包含体中此酶重折叠的氨基酸,取代了未配对半胱氨酸残基。GnTI酶至少包含GnTI酶的催化结构域。GnTI酶有生物学活性,即能够能催化使供体底物转移到受体底物。 
在一个实施方式中,GnTI酶是人蛋白。人GnT1中CYS121残基的一些突变可促进重折叠。这些突变体包括例如:CYS121SER突变、CYS121ALA突变、CYS121ASP突变,和双突变ARG120ALA、CYS121HIS。GnT1突变体的代表性序列见图7-11。在其它真核生物中,例如,未配对半胱氨酸残基CYS123的类似突变促进了GnT1酶的重折叠。 
在另一实施方式中,GnTI酶也包括氨基酸标记,如麦芽糖结合蛋白(MBP)、聚组氨酸标记、谷胱甘肽S转移酶(GST)、淀粉结合蛋白(SBP)和myc表位。 
在另一方面,本发明提供编码重组真核GnTI酶的核酸,该酶经突变用能促进不溶性沉淀如细菌包含体中此酶重折叠的氨基酸,取代了未配对半胱氨酸残基。如上所述,编码的GnT1酶至少包括GnTI酶的催化结构域,而且有生物学活性,即能够能催化使供体底物转移到受体底物。 
在一个实施方式中,所述核酸编码人GnTI酶。人GnT1中CYS121残基的一些突变能促进重折叠。这些突变体包括例如:CYS121SER突变、CYS121ALA突变、CYS121ASP突变,和双突变ARG120ALA、CYS121HIS。GnT1突变蛋白和核酸的代表性核酸序列见图7-11。在其它真核生物中,例如,未配对半胱氨酸残基CYS123的类似突变促进了GnT1酶的重折叠。 
在另一实施方式中,编码的GnTI酶也包括氨基酸标记,如麦芽糖结合蛋白(MBP)、聚组氨酸标记、谷胱甘肽转移酶(GST)、淀粉结合蛋白(SBP)和myc表位。 
本发明也包括含有突变的GnT1核酸的表达载体、包含GnT1表达载体的宿主细胞和用该宿主/表达载体系统产生突变的GnT1酶的方法。 
在另一实施方式中,本发明提供了通过使受体分子与活化的N-乙酰葡糖胺分子接触将N-乙酰葡糖胺残基加在具有末端甘露糖残基的受体分子上以促进其重折叠来突变真核GnTI酶的方法。受体分子可以是(例如)多糖、寡糖、糖脂或糖蛋白。
在另一方面,本发明提供在一个容器中通过使糖基转移酶与含有氧化还原对的重折叠缓冲液接触,来重折叠至少两种不溶性重组真核糖基转移酶蛋白的方法。重折叠后,至少两种重折叠的糖基转移酶具有生物学活性,如能够能催化使供体底物转移到受体底物。 
所述重折叠缓冲液也可包含去污剂、离液剂、精氨酸或PEG。在一些实施方式中,重折叠缓冲液的pH为6.0-10.0。在一个实施方式中,重折叠缓冲液的pH为6.5-8.0。在另一实施方式中,重折叠缓冲液的pH为8.0-9.0。 
在另一实施方式中,所述糖基转移酶包括氨基酸标记,如麦芽糖结合蛋白(MBP)、聚组氨酸标记、谷胱甘肽转移酶(GST)、淀粉结合蛋白(SBP)和myc表位。 
在一个实施方式中,将N-连接的聚糖生物合成途径的一种以上糖基转移酶一起重折叠。 
在一个实施方式中,用本发明方法将唾液酸转移酶与另一种糖基转移酶一起重折叠。 
在一个实施方式中,用本发明方法将N-乙酰葡糖胺基转移酶与另一种糖基转移酶一起重折叠。 
在一个实施方式中,用本发明方法将半乳糖基转移酶与另一种糖基转移酶一起重折叠。 
在另一实施方式中,用本发明方法在一个容器中将唾液酸转移酶、N-乙酰葡糖胺基转移酶和半乳糖基转移酶一起重折叠。 
在一个实施方式中,将O-连接的聚糖生物合成途径的一种以上糖基转移酶一起重折叠。在另一实施方式中,第一种酶是N-乙酰半乳糖胺基转移酶。在优选实施方式中,第一种酶是N-乙酰葡糖胺基转移酶2(GalNAcT2)。 
本发明也提供包含重组真核GnTI酶和可在同一容器中重折叠的至少一种其它糖基转移酶的反应混合物,该重组真核GnTI酶经突变用能促进来自不溶性沉淀如细菌包含体的酶重折叠的氨基酸取代了未配对的半胱氨酸残基。第二种糖基转移酶可以是(例如)唾液酸转移酶或半乳糖基转移酶。在一个实施方式中,该反应混合物包括突变的真核GnT1酶、唾液酸转移酶和半乳糖基转移酶。该反应混合物可与含有供体糖的受体分子一起使用,以产生(例如)多糖、寡糖、糖脂或糖蛋白。 
在另一方面,本发明提供重折叠不溶性重组真核唾液酸转移酶的方法,即(a)溶解唾液酸转移酶;然后(b)使可溶性唾液酸转移酶与含氧化还原对的重折叠缓冲液接触。此种重折叠的唾液酸转移酶具有生物学活性能催化使唾液酸从供体底物转移到 受体底物。在一个实施方式中,透析或渗滤该重折叠唾液酸转移酶。 
重折叠缓冲液也可包含去污剂、离液剂或精氨酸。在一些实施方式中,重折叠缓冲液的pH为6.0-10.0。在一个实施方式中,重折叠缓冲液的pH为6.5-8.0。在另一实施方式中,重折叠缓冲液的pH为8.0-9.0。在另一实施方式中,重折叠缓冲液的pH为7.5-8.5。 
在一个实施方式中,重折叠缓冲液中的氧化还原对是还原性谷胱甘肽/氧化性谷胱甘肽(GSH/GSSG)对。在另一实施方式中,GSH/GSSG的摩尔比为100:1-1:10。在优选实施方式中,GSH/GSSG的摩尔比为10:1。在又一实施方式中,重折叠缓冲液含约0.02-10mM GSH、0.005-10mM GSSG、0.005-10mM十二烷基麦芽糖苷、50-250mM NaCl、2-10mM KCl、0.01-0.05%PEG3350和150-550mM L-精氨酸。 
在另一实施方式中,唾液酸转移酶含有氨基酸标记,如麦芽糖结合蛋白(MBP)、聚组氨酸标记、谷胱甘肽转移酶(GST)、淀粉结合蛋白(SBP)和myc表位。在另一实施方式中,利用能结合氨基酸标记的标记结合分子来纯化唾液酸转移酶。例如,所述氨基酸标记可以是MBP,标记结合分子可以是直链淀粉、麦芽糖或环式糊精。 
在另一实施方式中,重折叠的唾液酸转移酶能催化使唾液酸从CMP-唾液酸转移到糖蛋白。 
在另一实施方式中,重折叠唾液酸转移酶能催化使10K PEG或20K PEG从CMP-SA-PEG(10kDa)或CMP-SA-PEG(20kDa)转移到糖蛋白。 
在另一实施方式中,唾液酸转移酶是大鼠肝ST3GalIII。 
在另一方面,本发明提供了通过使含有CMP-唾液酸的糖蛋白与用本文所述方法重折叠的重折叠哺乳动物唾液酸转移酶接触,将唾液酸分子加到该糖蛋白上的方法。 
在另一方面,本发明提供将PEG分子加到糖蛋白上的方法,该方法包括使糖蛋白与CMP-SA-PEG(10kDa)或CMP-SA-PEG(20kDa)和用本文所述方法重折叠的重折叠哺乳动物唾液酸转移酶相接触。 
在另一方面,本发明提供了重折叠不溶性重组真核N-乙酰半乳糖胺基转移酶2(GalNAcT2)的方法,即将GalNAcT2溶解于增溶缓冲液中;然后使可溶性GalNAcT2与含氧化还原对的重折叠缓冲液接触来重折叠GalNAcT2。重折叠后,该重折叠的GalNAcT2能催化使N-乙酰半乳糖胺从供体底物转移到受体底物。该方法可任选地包括透析或渗滤重折叠的GalNAcT2或进一步纯化重折叠GalNAcT2的步骤。 
在一些实施方式中,重折叠缓冲液的氧化还原对是还原性谷胱甘肽/氧化性谷胱甘肽(GSH/GSSG)对或半胱氨酸/胱胺对。重折叠缓冲液也可包含以下物质:去污剂、离液剂或精氨酸。在一些实施方式中,重折叠缓冲液的pH为6.0-10.0。在一个优选实施方式中,重折叠缓冲液的pH约为8.0。 
在优选实施方式中,增溶缓冲液的pH为6.0-10.0。在更优选的实施方式中,增溶缓冲液的pH约为8.0。 
重组表达的GalNAcT2可包含氨基酸标记。所述氨基酸标记可以是(例如)麦芽糖结合蛋白(MBP)、聚组氨酸标记、谷胱甘肽转移酶(GST)、淀粉结合蛋白(SBP)或myc表位。可利用标记结合分子来纯化重折叠的GalNAcT2。当氨基酸标记是MBP时,标记结合分子通常为以下物质之一:直链淀粉、麦芽糖或环式糊精。 
在优选实施方式中,重折叠GalNAcT2能催化使N-乙酰半乳糖胺从供体底物转移到肽、蛋白质、糖肽或糖蛋白。 
附图简要说明 
图1提供了重折叠细菌包含体的MBP-ST3GalIII的经测试的缓冲液条件。也提供了重折叠酶的活性。 
图2提供了重折叠的经透析的MBP-ST3GalIII从直链淀粉柱上的洗脱图。 
图3提供了直链淀粉柱洗脱组分的ST3GalIII活性。 
图4提供了用纯化的重折叠MBP-ST3GalIII使转铁蛋白糖基PEG化的试验结果。各泳道如下:(1)MW标记[250、148、98、64、50kD];(2)无酶的脱唾液酸转铁蛋白对照,用实线箭头表示;(3)用组分#5产生的转铁蛋白-SA-PEG(20kDa),用箭头表示产物;(4)用组分#6产生的转铁蛋白-SA-PEG(20kDa),用箭头表示产物;(5)纯化的重折叠MBP-ST3GalIII组分#6,用虚线箭头表示;(6)MW标记;(7)与2相同;(8)用组分#4产生的转铁蛋白-SA-PEG(10kDa),用括号表示产物;和(9)用组分#5产生的转铁蛋白-SA-PEG(10kDa),用括号表示产物。 
图5提供了用重折叠的SuperGlycoMix糖基PEG化EPO的试验结果。各泳道如下:(1)MW标记,SeeBlue2 Invitrogen(250、148、98、64、50、36、22、16、6kD);(2)含有EPO、+NSO表达的GalT1、BV GnT1、曲霉ST3GalIII和含糖核苷酸的阳性对照;(3)阴性对照,与2相同但没有UDP-GIcNAc;(4)EPO、纯化并分别重折叠的MBP-GalT1(Δ129)C342T、重折叠的MBP-GnT1(Δ103)和黑曲霉(Aspergillus niger)表达的ST3 GalIII;(5)EPO,SuperGlycoMix(MBP-ST3 GalIII、MBP-GalT1(Δ129)C342T、MBP-GnT1(Δ103)C123A和含糖核苷酸的混合物)。 
图6提供了人GnT1氨基酸序列(上面一行,NP_002397;SEQ ID NO:1)和兔 GnT1氨基酸序列(下面一行,P27115;SEQ ID NO:2)的比对。保守的未配对半胱氨酸用下划线和粗体表示。 
图7提供了GnT1 Cys121Ser突变体的氨基酸序列(SEQ ID NO:3)和编码该突变GnT1蛋白的核酸序列(SEQ ID NO:4)。所述氨基酸序列从全长人蛋白的氨基酸残基104开始,代表哺乳动物GnT1蛋白,具有以下未配对的半胱氨酸突变:...stvrrsldkllh....(SEQ ID NO:5),其中粗体残基是野生型半胱氨酸的突变残基。 
图8提供了GnT1 Cys121Asp突变体的氨基酸序列(SEQ ID NO:6)和编码该突变GnT1蛋白的核酸序列(SEQ ID NO:7)。所述氨基酸序列从全长人蛋白的氨基酸残基104开始,代表哺乳动物GnT1蛋白,具有以下未配对的半胱氨酸突变:...stvrrdldkllh...(SEQ ID NO:8),其中粗体残基是野生型半胱氨酸的突变残基。 
图9提供了GnT1 Cys121Thr突变体的氨基酸序列(SEQ ID NO:9)和编码该突变GnT1蛋白的核酸序列(SEQ ID NO:10)。所述氨基酸序列从全长人蛋白的氨基酸残基104开始,代表哺乳动物GnT1蛋白,具有以下未配对的半胱氨酸突变:...stvrrtldkllh...(SEQ ID NO:11),其中粗体残基是野生型半胱氨酸的突变残基。 
图10提供了GnT1 Cys121Ala突变体的氨基酸序列(SEQ ID NO:12)和编码该突变GnT1蛋白的核酸序列(SEQ ID NO:13)。所述氨基酸序列从全长人蛋白的氨基酸残基104开始,代表哺乳动物GnT1蛋白,具有以下未配对的半胱氨酸突变:...stvrraldkllh...(SEQ ID NO:14),其中粗体残基是野生型半胱氨酸的突变残基。 
图11提供了GnT1 Arg120Ala、Cys121His突变体的氨基酸序列(SEQ ID NO:15)和编码该突变GnT1蛋白的核酸序列(SEQ ID NO:16)。所述氨基酸序列从全长人蛋白的氨基酸残基104开始,代表哺乳动物GnT1蛋白,具有以下未配对的半胱氨酸突变:...stvrahldkllh...(SEQ ID NO:17),其中粗体残基是野生型半胱氨酸的突变残基。 
图12提供了大鼠肝ST3GalIII的氨基酸序列(SEQ ID NO:18)。下划线和斜体序列的缺失产生了Δ28缺失。 
图13A和13B提供了UDP-N-乙酰半乳糖胺基转移酶2(GalNAcT2)的全长核酸(SEQ ID NO:20)和氨基酸(SEQ ID NO:19)序列。此核酸和蛋白质的登录号为NM004481。 
图14A和14B提供了Δ51GalNAcT2的核酸和氨基酸序列。编号根据图13A和B所示全长氨基酸(SEQ ID NO:21)和核酸(SEQ ID NO:22)序列。 
图15提供了在pH 6.5或pH 8.0溶解和在pH 6.5或pH 8.0重折叠后测定的重折叠MBP-GalNAcT2(D51)蛋白浓度。测定的pH值表示为溶解pH-重折叠pH。重折叠 后(浅灰色柱)、透析后(深灰色柱)和浓缩后(白色柱)立即测定的蛋白浓度。 
图16提供了在pH 6.5或pH 8.0溶解和在pH 6.5或pH 8.0重折叠后测定的重折叠MBP-GalNAcT2(D51)的酶活性。测定的pH值表示为溶解pH-重折叠pH。透析后(浅灰色柱)和浓缩后(深灰色柱)测定活性。 
图17提供了在pH 6.5或pH 8.0溶解和在pH 6.5或pH 8.0重折叠后测定的重折叠MBP-GalNAcT2(D51)的特异性活性。测定的pH值表示为溶解pH-重折叠pH。透析后(白色柱)和浓缩后(深灰色柱)测定特异性活性。 
图18A和18B提供了在pH 6.5或pH 8.0溶解和在pH 6.5或pH 8.0重折叠后用重折叠的MBP-GalNAcT2(D51)重建重组粒细胞集落刺激因子(GCSF)的结果。图18A显示了用纯化的MBP-GalNAcT2(D51)对照、缺少底物的阴性对照或在pH 6.5溶解和在pH 6.5重折叠的细菌表达的MBP-GalNAcT2(D51)得到的结果。图18B显示了试验结果。 
图19提供了重折叠MBP-GalNAcT2(D51)蛋白从Q琼脂糖XL(QXL)柱(Amersham Biosciences,Piscataway,NJ)上的洗脱图。该图上方显示了说明MBP-GalNAcT2(D51)从QXL柱上洗脱的色谱图。X轴表示组分编号,Y轴表示各组分的相对吸光度。该图下方显示所观察的诸洗脱组分的两种凝胶电泳图像。凝胶上各泳道的内容见图中所述。 
图20提供了图19所示得自QXL柱的特定柱组分的GalNAcT2活性。将活性最高的组分施加到I型羟基磷灰石(80μm)(BioRad,Hercules,CA)柱上。 
图21提供了重折叠的MBP-GalNAcT2(D51)蛋白从I型HA柱上的洗脱图。该图上方显示了说明MBP-GalNAcT2(D51)从I型HA柱上洗脱的色谱图。X轴表示组分编号,Y轴表示各组分的相对吸光度。该图下方显示所观察的诸洗脱组分的凝胶电泳图像。凝胶上各泳道的内容见图中所述。 
图22提供了I型HA洗脱组分的GalNAcT2活性。 
图23提供了融合于MBP标记或MBP-SBD标记的ST3Gal3蛋白的纯化和活性比较。 
图24提供了MBP-ST3Gal1融合蛋白(A)(SEQ ID NO:23)和MBP-SBD-ST3Gal1融合蛋白(B)(SEQ ID NO:24)的氨基酸序列。 
图25提供了MBP-ST3Gal3融合蛋白和MBP-SBD-ST3Gal3融合蛋白的唾液酸转移酶活性,也显示了阳性和阴性对照。 
图26提供了融合于MBP的小鼠和人ST6GalNAcI蛋白的氨基酸序列。A部分显示了小鼠截短融合物MBP-mST6GalNAcI S127的序列(SEQ ID NO:25)。B部分显示了人截短融合物MBP-hST6GalNAcI K36的序列(SEQ ID NO:26)。 
图27提供了O-连接的糖基转移酶的SDS-PAGE凝胶(图像):(A)同时重折叠后的浓度,(B)同时重折叠后酶试验的结果。MBP-GalNAcT2和MBP-ST3GalI一起同时重折叠。加入Core I GalT1酶后测定的酶活性。底物是IFα-2b和20K-Peg-CMP-NAN。 
图28提供了显示用IPTG诱导前后大肠杆菌(E.coli)中天然SiaA蛋白表达的SDS-PAGE凝胶(图像)。 
图29提供了显示用IPTG诱导前后大肠杆菌中MBP-SiaA融合蛋白表达的SDS-PAGE凝胶(图像)。 
图30提供了全长牛GalT1蛋白的氨基酸序列(SEQ ID NO:27)。 
图31是GalT1突变体以及对照蛋白GalT1(40)(S96A+C342T)的示意图。 
图32提供了重折叠和纯化的MBP-GalT1(D70)蛋白的酶试验结果。该试验用UDP-Gal(尿苷5′-二磷酸半乳糖)作为供体底物测定了LNT2(乳糖-N-丙糖-2)转变为LNnT(乳糖-N-新丁糖)。 
图33提供了MBP-GalT1(D70)和对照蛋白GalT1(40)(S96A+C342T)(也称为Qasba′s GalT1)的RNA酶B重建试验。 
图34提供了用重折叠和纯化的MBP-GalT1(D70)蛋白或在哺乳动物细胞体系中表达的牛GalT1蛋白的可溶形式NSO GalT1糖基化RNA酶B的动力学。 
图35提供了MBP-GnT1融合蛋白的示意图,描述了截短蛋白,如Δ103或Δ35,以及Cys121Ser突变(上方)。该图下方提供了全长人GnT1蛋白(SEQ ID NO:1)。 
图36右侧提供了显示重折叠的MBP-GnT1融合蛋白MBP-GnT1(D35)C121A、MBP-GnT1(D103)R120A+C121H和MBP-GnT1(D103)C121A的SDS-PAGE凝胶(图像)。左侧显示两批(A1和A2)不同的重折叠MBP-GnT1(D35)C121A在不同时间点的GnT1活性。 
图37提供了猪ST3Gal1的全长序列(SEQ ID NO:28)。 
图38提供了A)人ST6GalNAcI(SEQ ID NO:29)和B)鸡ST6GalNAcI(SEQ ID NO:30)的全长氨基酸序列,以及C)始于天然小鼠蛋白残基32的小鼠ST6GalNAcI蛋白的序列(SEQ ID NO:31)。 
图39提供了许多优选的人ST6GalNAcI截短突变体的示意图。 
图40显示了包含人ST6GalNAcI截短突变体的MBP融合蛋白的示意图。 
图41提供了人Core 1 GalT1蛋白的全长序列(SEQ ID NO:32)。 
图42提供了两种果蝇Core 1 GalT1蛋白的序列(SEQ ID NO:33和34)。 
图43提供了可融合于糖基转移酶以促进重折叠的示范性细菌MBP蛋白的序列。A.耶尔森氏菌(Yersinia)MBP(SEQ ID NO:35);B.大肠杆菌MBP(SEQ ID NO:36);C.激烈火球菌(Pyrococcus furiosus)MBP(SEQ ID NO:37);D.嗜热球菌(Thermococcus litoralis)MBP(SEQ ID NO:38);E.海栖热袍菌(Thermatogamaritime)MBP(SEQ ID NO:39);和F.霍乱弧菌(Vibrio cholerae)MBP(SEQ ID NO:40)。 
图44提供了人GalNAcT1(SEQ ID NO:41)和GalNAcT2(SEQ ID NO:19)蛋白的比对。因为该排列比对程序考虑了序列中的插入或缺失,所以半胱氨酸残基的编号与上文和公开序列不同。在hGalNAc-T2半胱氨酸227(公开)对应于比对序列的位置235时,半胱氨酸229(公开)是该比对序列中的237。hGalNAc-T1半胱氨酸是212(公开)(对应于半胱氨酸235(比对序列))和214(公开)(对应于半胱氨酸237(比对序列))。用较大字体表示相关的半胱氨酸残基。共有序列肽=SEQ ID NO:42-65。 
图45显示了人ST6GalNAcI蛋白中配对和未配对半胱氨酸残基的位置。也显示了单个半胱氨酸取代和两个半胱氨酸取代,如C280S、C362S、C362T、(C280S+C362S)和(C280S+C362T)。 
定义 
本发明重组糖基转移酶蛋白可用于将糖从供体底物转移到受体底物。该加成反应通常发生在生物分子的寡糖或糖部分的非还原末端。本文所述生物分子包括但不限于生物学重要的分子如糖、蛋白质(如糖蛋白)和脂质(如糖脂、磷脂、鞘脂和神经节苷脂)。 
本文中使用了以下缩写: 
Ara=阿拉伯糖基; 
Fru=果糖基; 
Fuc=岩藻糖基; 
Gal=半乳糖基; 
GalNAc=N-乙酰半乳糖基氨基; 
Glc=葡糖基; 
GlcNAc=N-乙酰葡糖基氨基; 
Man=甘露糖基;和 
NeuAc=唾液酸(N-乙酰神经胺基) 
FT或FucT=岩藻糖基转移酶* 
ST=唾液酸转移酶* 
GalT=半乳糖基转移酶* 
根据本领域所用命名惯例,阿拉伯数字或罗马数字可互换使用说明同一特异性糖基转移酶(如FTVII和FT7指相同的岩藻糖基转移酶)。 
认为寡糖具有还原末端和非还原末端,无论该糖的还原末端是否是还原糖。根据接受的命名法,本文所述的寡糖的非还原末端在左、还原末端在右。 
本文所述所有的寡糖用非还原性糖的名称或缩写表示(如Gal)、然后是糖苷键(α或β)构型、环键、涉及该键的还原糖的环位置、然后是还原糖的名称或缩写(如GlcNAc)。两个糖之间的连接可表示为(例如)2,3、2→3或(2,3)。糖各自是吡喃糖或呋喃糖。 
术语“唾液酸”指九碳羧化糖家族的任何成员。唾液酸家族中最常见的成员是N-乙酰神经氨酸(2-酮-5-乙酰胺基-3,5-双脱氧-D-丙三基-D-半乳糖壬酮糖吡喃糖-1-酸,常常缩写为Neu5Ac、NeuAc或NANA)。第二个家族成员是N-乙醇酰基-神经氨酸(Neu5Gc或NeuGc),其中NeuAc的N-乙酰基是羟化的。第三个唾液酸家族成员是2-酮-3-脱氧-壬酮糖酸(KDN)(Nadano等(1986)J.Biol.Chem.261:11550-11557;Kmamori等,J.Biol.Chem.265:21811-21819(1990))。也包括9-取代的唾液酸如9-O-C1-C6酰基-Neu5Ac样9-O-乳酰基-Neu5Ac或9-O-乙酰基-Neu5Ac、9-脱氧-9-氟-Neu5Ac和9-叠氮-9-脱氧-Neu5Ac。唾液酸家族的综述参见例如Varki,Glycobiology2:25-40(1992);唾液酸:化学、代谢和功能(Sialic Acid:Chemistry,Metabolism andFunction),R.Schauer编(Springer-Verlag,New York(1992))。1992年10月1日公开的国际申请WO92/16640中描述了唾液酸化过程中唾液酸化合物的合成和应用。 
糖基转移酶的“受体底物”是可用作特定糖基转移酶的受体的寡糖部分。当受体底物与相应的糖基转移酶和糖供体底物,以及其它必需的反应混合物组分接触,培育反应混合物足够的时间时,糖基转移酶将糖残基从糖供体底物转移到受体底物。不同类型的特定糖基转移酶的受体底物常常不同。例如,哺乳动物半乳糖苷2-L-岩藻糖基转移酶(α1,2-岩藻糖基转移酶)的受体底物包括寡糖的非还原末端上的Galβ1、4-GlcNAc-R;岩藻糖基转移酶通过α1,2连接将岩藻糖残基连接于Gal。末端的Galβ1,4-GlcNAc-R和Galβ1,3-GlcNAc-R及其唾液酸化类似物分别是α1,3和α1,4-岩藻糖基转移酶的受体底物。然而,这些酶将岩藻糖残基连接于受体底物的GlcNAc残基。因此,术语“受体底物”是根据具体应用中感兴趣的具体糖基转移酶选择的。本文描述了其它糖基转移酶的受体底物。受体底物还包括(例如)肽、蛋白质、糖肽和糖蛋白。 
糖基转移酶的“供体底物”是活化的核苷酸糖。所述活化糖通常由糖的单磷酸尿苷、鸟苷和胞苷衍生物(分别为UMP、GMP和CMP)或糖的二磷酸尿苷、鸟苷和胞 苷衍生物(分别为UDP、GDP和CDP)组成,其中单磷酸核苷或二磷酸核苷作用是离去基团。例如,岩藻糖基转移酶的供体底物是GDP-岩藻糖。唾液酸转移酶的供体底物(例如)是含所需唾液酸的活化糖核苷酸。例如,以NeuAc为例,其活化糖是CMP-NeuAc。其它供体底物包括例如:GDP甘露糖、UDP-半乳糖、UDP-N-乙酰半乳糖胺、CMP-NeuAc-PEG(也称为CMP-唾液酸-PEG)、UDP-N-乙酰葡糖胺、UDP-葡萄糖、UDP-葡糖醛酸(glucorionic acid)和UDP-木糖。糖包括例如:NeuAc、甘露糖、半乳糖、N-乙酰半乳糖胺、N-乙酰葡糖胺、葡萄糖、葡糖醛酸和木糖。细菌、植物和真菌体系有时可利用其它活化的核苷酸糖。 
本文所用“重建蛋白质、肽、糖蛋白或糖肽的方法”指用糖基转移酶将糖残基加在蛋白质、肽、糖蛋白或糖肽上。在优选实施方式中,该糖残基与PEG分子共价连接。 
本文所用“真核糖基转移酶”指一种酶,它衍生自真核生物能催化使糖残基从供体底物即活化的核苷酸糖转移到受体底物,如寡糖、糖脂、肽、蛋白质、糖肽或糖蛋白上,在优选实施方式中,真核糖基转移酶可将糖从供体底物转移到肽、蛋白质、糖肽或糖蛋白,在另一优选实施方式中,真核糖基转移酶是II型跨膜糖基转移酶。真核糖基转移酶可衍生自真核生物,如多细胞真核生物、植物、无脊椎动物如果蝇或秀丽隐杆线虫(C.elegans)、脊椎动物、两栖动物或爬行动物,哺乳动物、啮齿动物、灵长动物、人、兔、大鼠、小鼠、牛、猪等。 
本文所用“真核N-乙酰葡糖胺基转移酶I(GnTI或GNTI)”指分离自真核生物的β-1,2-N-乙酰葡糖胺基转移酶I。该酶能催化使N-乙酰葡糖胺(GlcNAc)从UDP-GlcNAc供体转移到含有甘露糖的受体分子。如其它真核糖基转移酶那样,GnTI具有跨膜结构域、主干区和催化结构域。真核GnT1蛋白包括例如人,登录号NP_002397;中国仓鼠,登录号AAK61868;兔,登录号AAA31493;大鼠,登录号NP_110488;金黄田鼠,登录号AAD04130;小鼠,登录号P27808;斑马鱼,登录号AAH58297;爪蟾(Xenopus),登录号CAC51119;果蝇,登录号NP_525117;疟蚊(Anopheles),登录号XP_315359;秀丽隐杆线虫,登录号NP_497719;小立碗藓(Physcomitrellapatens),登录号CAD22107;马铃薯(Solanum tuberosum),登录号CAC80697;烟草(Nicotianatabacum),登录号CAC80702;水稻(Oryza sativa),登录号CAD30022;本塞姆氏烟草(Nicotiana benthamiana),登录号CAC82507;和拟南芥(Arabidopsis thaliana),登录号NP_195537,各自纳入本文作为参考。 
本文所用“真核N-乙酰半乳糖胺基转移酶(GalNAcT)”指分离自真核生物的N- 乙酰半乳糖胺基转移酶。该酶能催化使N-乙酰半乳糖胺(GalNAc)从UDP-GalNAc供体转移到受体分子。如其它真核糖基转移酶那样,GalNAcT酶具有跨膜结构域、主干区和催化结构域。已经分离并表征了许多GalNAcT酶,例如:GalNAcT1,登录号X85018;GalNAcT2,登录号X85019(均参见White等,J.Biol.Chem.270:24156-24165(1995));和GalNAcT3,登录号X92689(参见Bennett等,J.Biol.Chem.271:17006-17012(1996),各自纳入本文作为参考)。 
本文所用“真核β-1,4-半乳糖基转移酶(GalT1)指分离自真核生物的β-1,4-半乳糖基转移酶。该酶能催化使半乳糖从UDP-Gal供体转移到受体分子。如其它真核糖基转移酶那样,GalT1酶具有跨膜结构域、主干区和催化结构域。已经分离并表征了许多GalT1酶,例如:全长牛序列,D′Agostaro等,Eur.J.Biochem.183:211-217(1989),登录号CAA32695,各自纳入本文作为参考。 
本文所用“真核α(2,3)唾液酸转移酶(ST3Gal3)”指分离自真核生物的α(2,3)唾液酸转移酶。该酶能催化使唾液酸转移到Galβ1,3GlcNAc、Galβ1,3GalNAc或Galβ1,4GlcNAc苷的Gal(参见例如,Wen等(1992)J.Biol.Chem.267:21011;Van denEijnden等(1991)J.Biol.Chem.256:3159)。通过在两个糖之间形成α-连接将唾液酸连接于Gal。这两个糖之间的键(连接)是在NeuAc的2位和Gal的3位之间。如其它真核糖基转移酶那样,ST3GalIII酶具有跨膜结构域、主干区和催化结构域。可从大鼠肝中分离此酶(Weinstein等(1982)J.Biol.Chem.257:13845);人cDNA(Sasaki等(1993)J.Biol.Chem.268:22782-22787;Kitagawa和Paulson(1994)J.Biol.Chem.269:1394-1401)和基因组(Kitagawa等(1996)J.Biol.Chem.271:931-938)DNA序列是已知的,这有助于重组表达生产此酶。已克隆了大鼠ST3GalIII,其序列已知。参见例如,Wen等,J.Biol.Chem.267:21011-21019(1992),登录号M97754,各自纳入本文作为参考。 
本文所用“真核α-N-乙酰氨基半乳糖苷α-2,6-唾液酸转移酶I(ST6GalNAcT1)”指分离自真核生物的α(2,6)唾液酸转移酶。该酶能催化使唾液酸从CMP-唾液酸供体转移到受体分子。此种转移是使α2,6-连接于N-乙酰半乳糖胺-O-Thr/Ser。如其它真核糖基转移酶那样,ST6GalNAcT1酶具有跨膜结构域、主干区和催化结构域。已经分离并表征了许多ST6GalNAcT1酶,如全长小鼠序列,Kurosawa等,J.Biochem.127:845-854(2000),登录号JC7248,各自纳入本文作为参考。其它示范性ST6GalNAcT1氨基酸序列见图38。
本文所用“真核galβ1,3GalNAcα2,3-唾液酸转移酶(ST3GalI)”指分离自真核生物的galβ1,3GalNAcα2,3-唾液酸转移酶。该酶能催化使唾液酸从CMP-唾液酸供体转移到受体分子。此种转移是使α2,3-连接于N-乙酰半乳糖胺-O-Thr/Ser。如其它真核糖基转移酶那样,ST3GalI酶具有跨膜结构域、主干区和催化结构域。已经分离并表征了许多ST3GalI酶,如全长猪序列,Gillespie等,J.Biol.Chem.267:21004-21010(1992),登录号A45073,各自纳入本文作为参考。 
本文所用“真核Core I半乳糖基转移酶(Core1GalT1)”指具有Core1β1,3-半乳糖基转移酶活性的蛋白。如其它真核糖基转移酶那样,Core1GalT1酶具有跨膜结构域、主干区和催化结构域。已经分离并表征了许多Core1GalT1酶,如图41和42的果蝇序列和人序列。Ju等,J Biol.Chem.277(1),178-186(2002)中表征了该人蛋白,将其纳入本文作为参考用于所有目的。 
本文所用“未配对的半胱氨酸残基”指正确折叠的蛋白质(即具有生物学活性的蛋白)中的半胱氨酸残基不与另一半胱氨酸残基形成二硫键。 
“不溶性糖基转移酶”指在细菌包含体中表达的糖基转移酶。一般用(例如)去污剂或离液剂或一些组合溶解或变性不溶性糖基转移酶。“重折叠”指将具有生物学活性的糖基转移酶的结构恢复为溶解或复性糖基转移酶的过程。因此,重折叠缓冲液指能促进或加速糖基转移酶的重折叠的缓冲液。 
“氧化还原对”指还原性和氧化性硫醇试剂的混合物,包括还原性和氧化性谷胱甘肽(GSH/GSSG)、半胱氨酸/胱氨酸、半胱胺/胱胺、DTT/GSSG和DTE/GSSG(参见例如,Clark,Cur.Op.Biotech.12:202-207(2001))。 
本文中术语“接触”可与以下术语互换使用:组合、加入、混合、通过、孵育、流过等。 
术语“PEG”指聚(乙二醇)。PEG是能偶联于肽的示范性聚合物。用PEG衍生肽治疗已被证明能降低肽的免疫原性并延长肽在循环系统的清除时间。例如,美国专利号4,179,337(Davis等)关于非免疫原性肽,如偶联于聚乙二醇(PEG)或聚丙二醇的酶和肽激素。每摩尔肽采用10-100摩尔聚合物,保持了至少15%的生理活性。 
本文术语“特异性活性”指酶如本发明的重组糖基转移酶融合蛋白的催化活性,可用活性单位表示。在本文中,1个活性单位催化在给定温度(如37℃)和pH值(如pH7.5)下每分钟催化形成1μmol产物。因此,10单位酶是在温度如37℃和pH值如7.5下在1分钟内将10μmol底物转化为10μmol产物的酶催化量。
“N-连接的”寡糖是经天冬酰胺-N-乙酰葡糖胺连接键通过天冬酰胺连接于肽主链的寡糖。N-连接的寡糖也称为“N-聚糖”。所有N-连接的寡糖都具有共同的五糖核心Man3GlcNAc2。它们的不同之处在于外周糖(如N-乙酰葡糖胺、半乳糖、N-乙酰半乳糖胺、岩藻糖和唾液酸)分支(也称为天线)的存在和数量。此结构也可任选地包含核心岩藻糖分子和/或木糖分子。 
“O连接的”寡糖是寡糖通过苏氨酸、丝氨酸、羟基脯氨酸、酪氨酸或其它含羟基氨基酸连接于肽主链的寡糖。 
当提到糖蛋白种类时,“基本均一的糖形式”或“基本均一的糖基化模式”指由感兴趣的糖基转移酶(如岩藻糖基转移酶)糖基化的受体底物的百分比。本领域技术人员将理解,原材料可含有糖基化的受体底物。因此,糖基化的计算量将包括用本发明方法糖基化的受体底物,以及在原材料中已经糖基化的受体底物。 
术语“生物学活性”指蛋白质的酶活。例如,唾液酸转移酶的生物学活性指将唾液酸部分从供体分子转移到受体分子的活性。GalNAcT2的生物学活性指将N-乙酰半乳糖胺部分从供体分子转移到受体分子的活性。对于GalNAcT2蛋白而言,受体分子可以是蛋白质、肽、糖蛋白或糖肽。GnT1蛋白的生物学活性指将N-乙酰葡糖胺部分从供体分子转移到受体分子的活性。半乳糖基转移酶的生物学活性指将半乳糖部分从供体分子转移到受体分子的活性。 
“商品化规模”指在一个反应中产生克级的产物糖。在优选实施方式中,商品化规模指约50、75、80、90或100、125、150、175或200克以上的产量。 
在上述定义术语“基本均一”中的“基本”通常指用具体糖基转移酶糖基化的受体底物占至少约60%、至少约70%、至少约80%、或更优选至少约90%、更优选至少约95%。 
术语“氨基酸”指天然产生的氨基酸和合成氨基酸,以及作用方式类似于天然产生的氨基酸的氨基酸类似物和氨基酸模拟物。天然产生的氨基酸是由遗传密码子编码的氨基酸,以及后来修饰的氨基酸,如羟基脯氨酸、γ-羧基谷氨酸和O-磷酸丝氨酸。氨基酸类似物指与天然产生的氨基酸具有相同的基本化学结构的化合物,即α碳结合于氢、羧基、氨基和R基团的化合物,如高丝氨酸、正亮氨酸、甲硫氨酸亚砜、甲硫氨酸甲基锍。这些类似物具有修饰的R基团(如正亮氨酸)或修饰的肽主链,但保留了与天然产生的氨基酸相同的基本化学结构。氨基酸模拟物指结构不同于氨基酸的通用化学结构,但作用方式类似于天然产生的氨基酸的化合物。
“蛋白质”、“多肽”或“肽”指氨基酸单体通过酰胺键连接在一起形成的聚合物,也称为多肽。当氨基酸是α-氨基酸时,可采用其L-光学异构体或D-光学异构体。此外,也包括非天然氨基酸,如β-丙氨酸、苯基甘氨酸和高精氨酸。本发明中可采用不是由基因编码的氨基酸。而且,经修饰而含有反应基团的氨基酸也可用于本发明。本发明所用的所有氨基酸可以是D-异构体或L-异构体。通常优选L-异构体。此外,其它肽模拟物也可用于本发明。全面的综述可参见Spatola,A.F.,《氨基酸、肽和蛋白质的化学和生物化学》(CHEMISTRY AND BIOCHEMISTRY OF AMINO ACIDS,PEPTIDESAND PROTEIN S,B.Weinstein编,Marcel Dekker,New York,267页(1983)。 
提及细胞时所用的术语“重组”指该细胞复制了异源核酸,或表达了异源核酸编码的肽或蛋白质。重组细胞可含有在该细胞的天然(非重组)形式中没发现的基因。重组细胞也可含有在该细胞的天然形式中发现的、通过人工手段修饰并将其重新引入该细胞的基因。该术语也包括含有不除去细胞核酸的修饰的内源性核酸的细胞;这些修饰包括通过基因置换、定点突变和相关技术获得的修饰。“重组蛋白”是重组细胞产生的蛋白。在优选实施方式中,重组真核糖基转移酶由重组细菌细胞产生。 
“融合蛋白”指包含有加入的、替代的、少于和/或不同于编码原先或天然全长蛋白或其子序列的氨基酸序列的蛋白质。 
融合蛋白的组分包括“辅酶”和/或“纯化标记”。“辅酶”本文指参与催化(例如)形成糖基转移酶底物的反应的酶。辅酶可以(例如)催化形成被糖基转移酶用作供体部分的核苷酸糖。辅酶也可以是用于产生形成核苷酸糖所必需的三磷酸核苷或产生将糖掺入核苷酸糖中的酶。可构建本发明的重组融合蛋白并表达为一端含有分子“纯化标记”的融合蛋白,该标记有助于蛋白质的纯化。此种标记也可用于在糖基化反应期间固定感兴趣的蛋白质。合适的标记包括“表位标记”,它是抗体特异性识别的蛋白序列。通常将表位标记掺入融合蛋白中以使得能够用易于得到的抗体明确地检测或分离该融合蛋白。“FLAG标记”是一种常用的表位标记,为单克隆抗FLAG抗体特异性识别,它由序列AspTyrLysAspAspAspAspLys(SEQ ID NO:66)或其基本相同的变体组成。其它合适标记是本领域技术人员已知的,包括例如:亲和标记如六组氨酸肽(SEQ ID NO:67),它能结合金属离子如镍或钴离子。可用能结合该纯化标记的结合伴侣,如针对该纯化标记的抗体、镍或钴离子或树脂以及直链淀粉、麦芽糖或环式糊精纯化含有该纯化标记的蛋白。纯化标记还包括淀粉结合域、大肠杆菌硫氧还蛋白结构域(例如,Santa Cruz Biotechnology,Inc.和Alpha DiagnosticInternational,Inc.出售的载体和抗体)和SUMO蛋白的羧基末端一半(例如,LifeSensors Inc.出售的载体和抗体)。优选采用麦芽糖结合域,因为它们能够促进不溶性真核糖基转移酶的重折叠,但它们也可用于帮助纯化融合蛋白。麦芽糖结合域蛋白的纯化(方法)是本领域技术人员已知的。WO99/15636中描述了淀粉结合域,将其纳入本文作为参考。2003年5月5日提交的USSN60/468,374中描述了用β环式糊精(BCD)-衍生的树脂亲和纯化包含淀粉结合域的融合蛋白,将其全文纳入本文作为参考。 
提及糖基转移酶的结构域时,术语“功能域”指能赋予或调节酶活性,如受体底物特异性、催化活性、结合亲和力、在高尔基体内的定位、锚定细胞膜或其它生物学或生物化学活性的糖基转移酶的结构域。糖基转移酶功能域的例子包括但不限于:催化结构域、主干区和信号锚定结构域。 
提及蛋白质时,术语“表达水平”指细胞产生的蛋白质量。可用本文所述或本领域技术人员已知的试验和活性单位衡量细胞产生的蛋白质量。本领域技术人员知道如何用各种试验和单位分别测定和描述细胞产生的蛋白质量。因此,蛋白质如糖基转移酶的表达水平的定量和定量描述不限于用于测定活性的试验或用于描述活性的单位。可用已知的标准试验,例如Bradford(1976)蛋白质试验、Pierce(Rockford,Illinois)的二辛可宁酸蛋白质试验试剂盒或如美国专利号5,641,668所述测定细胞产生的蛋白质量。 
术语“酶活性”指酶的活性,可通过本文所述或本领域技术人员已知的试验和单位测定。糖基转移酶活性的例子包括但不限于:与该酶功能域相关的活性,如受体底物特异性、催化活性、结合亲和力、在高尔基体中的定位、锚定于细胞膜或其它生物学或生物化学活性。 
提及糖基转移酶时,“主干区”指在天然糖基转移酶中位于跨膜结构域附近的蛋白结构域或其子序列,据报道,其功能是将糖基转移酶保留在高尔基体中的保留信号和作为蛋白水解切割的位点。主干区通常始于第一个亲水性氨基酸,然后是疏水性跨膜结构域,终止于催化结构域,或者在一些情况下,第一个半胱氨酸残基后面是跨膜结构域。示范性主干区包括但不限于:岩藻糖基转移酶VI主干区,氨基酸残基40-54;哺乳动物GnT1主干区,氨基酸残基约36-103(参见例如,人酶);哺乳动物GalT1主干区,氨基酸残基约71-129(参见例如,牛酶);哺乳动物ST3GalIII主干区,氨基酸残基约29-84(参见例如,大鼠酶);无脊椎动物Core1GalT1的主干区,氨基酸残基约36-102(参见例如,果蝇酶);哺乳动物Core1GalT1主干区,氨基酸残基约32-90(参见例如,人酶);哺乳动物ST3Gal1主干区,氨基酸残基约28-61(参见例如,猪酶)或人酶的氨基酸残基约18-58;哺乳动物ST6GalNAcI主干区,氨基酸残 基约30-207(参见例如,鼠酶),人酶的氨基酸35-278或鸡酶的氨基酸37-253;哺乳动物GalNAcT2主干区,氨基酸残基约71-129(参见例如,大鼠酶)。 
“催化结构域”指能催化该酶进行酶反应的蛋白结构域或其子序列。例如,唾液酸转移酶的催化结构域包括足以使唾液酸残基从供体转移到受体糖的唾液酸转移酶子序列。催化结构域可包括整个酶、其子序列,或可包括在天然状态下未连接于该酶的其它氨基酸序列或其子序列。示范性催化区是(但不限于)岩藻糖基转移酶VII催化结构域,氨基酸残基39-342;哺乳动物GnT1催化结构域,氨基酸残基约104-445(参见例如,人酶);哺乳动物GalT1催化结构域,氨基酸残基约130-402(参见例如,牛酶);和哺乳动物ST3GalIII催化结构域,氨基酸残基约85-374(参见例如,大鼠酶)。2004年6月3日提交的USSN60/576,530中描述了GalNAcT2蛋白的催化结构域和截短突变体;2004年8月3日提交的美国临时专利申请律师案卷号040853-01-5149-P1;将它们纳入本文作为参考用于所有目的。也可通过与已知的糖基转移酶进行比对来鉴定催化结构域。 
“子序列”指分别包含较长的核酸或氨基酸(如蛋白质)序列的一部分的核酸或氨基酸序列。 
“糖基转移酶截短物”或“截短的糖基转移酶”或语法上的变体指比天然产生的糖基转移酶少几个氨基酸残基、但保持了酶活的糖基转移酶。截短的糖基转移酶包括例如:截短的GnT1酶、截短的GalT1酶、截短的ST3GalIII酶、截短的GalNAcT2酶、截短的CorelGalT1酶、氨基酸残基约32-90(参见例如、人酶);截短的ST3Gal1酶、截短的ST6GalNAcI酶和截短的GalNAcT2酶。可缺失任意数量的氨基酸残基,只要酶保持活性。在一些实施方式中,可缺失诸结构域或部分结构域,如可缺失信号锚定结构域使截短物含有主干区和催化结构域;可缺失信号锚定结构域和一部分主干区使截短物含有剩余的主干区和催化结构域;或可缺失信号锚定结构域和主干区使截短物含有催化结构域。 
术语“核酸”指单链或双链形式的脱氧核糖核苷酸或核糖核苷酸聚合物,除非另有限制,“核酸”包括能以类似于天然产生的核酸的方式与核酸杂交的已知的天然核苷酸类似物。除非另有说明,具体核酸序列包括其互补序列。 
“重组表达盒”或简称“表达盒”是用重组或合成方法产生的核酸构建物,它含有能影响结构基因在与所述序列相容性宿主中表达的核酸元件。表达盒至少包括启动子和任选的转录终止信号。重组表达盒一般包括待转录核酸(如编码所需多肽的核酸)和启动子。对影响表达是必需的或有帮助的其它因素也可用于本发明。例如,表达 盒也可包括编码能指导宿主细胞分泌表达蛋白质的信号序列的核苷酸序列。表达盒也可包括能影响基因表达的转录终止信号、增强子和其它核酸序列。在优选实施方式中,在细菌宿主细胞中表达编码包含真核糖基转移酶的氨基酸序列的重组表达盒。 
本文所用“异源序列”或“异源核酸”是来源于特定宿主细胞以外的,或者,如果来自相同来源,是对其原来形式进行修饰的核酸。因此,真核宿主细胞中的异源糖蛋白基因包括经修饰的特定宿主细胞的内源性糖蛋白编码基因。可(例如)通过用限制性酶处理DNA产生能够操作性连接于启动子的DNA片段修饰异源序列。例如定点诱变等技术也可用于修饰异源序列。 
术语“分离”指基本不含干扰酶活性组分的材料。对于本发明的糖、蛋白质或核酸而言,术语“分离”指此材料基本不含在天然状态下通常伴随该材料的组分。经银染凝胶上条带的强度或测定纯度的其它方法测定,本发明的分离的糖、蛋白质或核酸纯度一般至少约80%,通常至少约90%,优选至少约95%。可用本领域熟知的多种方法测定纯度或均一性。例如,可用聚丙烯酰胺凝胶电泳分析样品中的蛋白质或核酸,然后可通过染色观察蛋白质或核酸。对于某些目的,可能需要高分辨分析蛋白质或核酸,可采用HPLC或类似的纯化方法。 
术语“操作性连接”指核酸表达控制序列(如启动子、信号序列或转录因子结合位点)和第二种核酸序列之间的功能性连接,其中使表达控制序列能影响对应于第二种序列核酸的转录和/或翻译。 
在提及两个或多个核酸或蛋白质序列时,术语“相同性”或“相同性”百分数指当比较和比对最大一致性时,经以下序列比较算法之一测定或目测,两个或多个序列或子序列相同的氨基酸残基或核苷酸的具体百分数。 
在提及两种核酸或蛋白质时,术语“基本相同”指当比较和比对最大一致性时,经以下序列比较算法之一测定或目测,两个或多个序列或子序列至少大于约60%的核酸或氨基酸序列相同,65%、70%、75%、80%、85%、90%,优选91%、92%、93%、94%、95%、96%、97%、98%或99%的核苷酸或氨基酸残基相同。优选地,;两序列在至少长约50个残基的区域,更优选至少长约100个残基的区域上基本相同,最优选在至少约150个残基的区域两序列基本相同。在最优选的实施方式中,两序列在整个编码区长度上基本相同。 
对于序列比较,一般将一个序列作为参比序列,将测试序列与其作比较。进行序列比较算法时,将测试和参比序列输入计算机,如果需要,指定子序列坐标 (coordinate),并设定序列算法程序参数。然后,序列比较算法根据设定的程序参数计算出测试序列相对于参比序列的序列相同性百分数。 
可通过以下方法对比较序列进行最佳比对,例如:Smith&Waterman,Adv.Appl.Math.2:482(1981)的局部同源性算法,Needleman&Wunsch,J.Mol.Biol.48:443(1970)的同源比对算法,Pearson&Lipman,Proc.Nat’l.Acad.Sci.USA85:2444(1988)的搜索相似性方法,以下算法的计算机执行(Wisconsin遗传学软件包中的GAP、BESTFIT、FASTA和TFASTA,Genetics Computer Group,575Science Dr.Madison,WI)或目测(常可参见《新编分子生物学实验指南》(Current Protocols in Molecular Biology),F.M.Ausubel等编,Current Protocols,Greene Publishing Associates,Inc.与John Wiley&Sons,Inc.的合资公司(1995增刊)(Ausubel))。 
适合测定序列相同性百分数和序列相似性算法的例子是BLAST和BLAST2.0算法,它们的描述分别参见Altschul等(1990)J.Mol.Biol.215:403-410和Altschuel等(1977)Nuclear Acids Res.25:3389-3402。公众可通过国家生物技术信息中心(www.ncbi.nlm.nih.gov/)获得进行BLAST分析的软件。此算法包括,首先通过鉴定查询序列中长度W的短字鉴定高评分序列对(HSP),当与数据库序列中相同长度的字比对时,查询序列匹配或满足一些正评价的阈值评分T。T称为相邻字评分阈值(Altschul等,同上)。这些起始邻近字命中(word hit)用作启动搜索寻找含有它们的更长HSP的种子。然后沿各序列的两个方向上延伸字命中,以尽量增加累积对比评分。对于核苷酸序列,用参数M(匹配残基对的奖励分数;总是>0)和N(错配残基的罚分;总是<0)计算累积评分。对于氨基酸序列,用评分矩阵计算累积分数。当:累积对比评分通过来自其最大获得值参数X降低时;由于一种或多种负得分残基对比使累积分数达到零或零以下;或达到各序列的末端时,停止延伸各方向上的字命中。BLAST算法的参数W、T和X确定了对比的灵敏度和速度。BLASTN程序(用于核苷酸序列)采用的默认设置为字长(W)11、期望值(E)10、截断值100、M=5、N=-4和两条链的比较。对于氨基酸序列,BLASTP程序采用的默认设置为字长(W)3、期望值(E)10,和BLOSUM62评分矩阵(参见Henikoff和Henikoff,Proc.Natl.Acad.Sci.USA89:10915(1989))。 
除了计算序列相同性百分数之外,BLAST算法也对两序列之间的相似性进行统计分析(参见,例如,Karlin和Altschul,Proc.Nat′l.Acad.Sci.USA90:5873-5787(1993))。BLAST算法提供的一种测量相似性的方法是最小秩和概率(P(N)), 提供了对两种核苷酸或氨基酸序列之间偶然发生匹配的概率说明。例如,如果在测试核酸和参比核酸的比较中最小秩和概率低于约0.1、更优选低于约0.01、最优选低于约0.001,则认为核酸与参比序列相似。 
另外,能说明两个核酸序列或蛋白质基本相同的是,第一种核酸编码的蛋白质与第二种核酸编码的蛋白质在免疫学上能交叉反应,见如下所述。因此,(例如)当二肽的区别仅在于保守取代时,第一种蛋白一般与第二种蛋白基本相同。另外能说明两个核酸序列基本相同的是这两种分子在严谨条件下能互相杂交,见如下所述。 
术语“特异性杂交”指一序列存在于复杂混合物(如全细胞)DNA或RNA中时,在严谨条件下该分子仅与特定核苷酸序列结合、形成双链体或杂交。 
术语“严谨条件”指探针与其靶序列杂交,但不与其它序列杂交的条件。严谨条件是序列依赖的,在不同情况下不同。较长序列在较高温度下能特异性杂交。通常选择的严谨条件比在确定的离子强度和pH下特定序列的热解链点(Tm)低约15℃。Tm是与靶序列互补的50%探针与靶序列杂交达到平衡时的温度(在确定的离子强度、pH和核酸浓度下)。(由于通常靶序列过量,在Tm下,达到平衡时50%探针与靶序列杂交)。严谨条件一般是盐浓度低于约1.0M Na离子,一般约0.01-1.0M Na离子浓度(或其它盐),pH7.0-8.3,对于短探针(如10-50个核苷酸)温度至少约30℃和对于长探针(如多于50个核苷酸)温度至少约60℃的条件。也可通过加入去稳定剂如甲酰胺获得严谨条件。对于选择性或特异性杂交,阳性信号一般至少是背景的两倍,优选为背景杂交的10倍。示范性严谨杂交条件如下:50%甲酰胺、5×SSC和1%SDS,42℃孵育,或者5×SSC、1%SDS,65℃孵育,用0.2×SSC和0.1%SDS在65℃洗涤。对于PCR,低严谨扩增的温度一般约为36℃,但退火温度根据引物长度在32-48℃之间变化。就高严谨PCR扩增而言,一般温度约为62℃,但根据引物长度和特异性高严谨退火温度范围约为50℃-65℃。低严谨和高严谨扩增的循环条件一般包括:变性阶段90-95℃30-120秒,退火阶段持续30-120秒,延伸阶段约72℃1-2分钟。可获得低严谨和高严谨的扩增反应的方法和指南,如Innis等,(1990)《PCR方法:方法和应用指南》(PCR Protocols:A Guide to Methods and Applications)Academic Press,N.Y所述。 
提及抗体时,术语“与蛋白质特异性结合”或“特异性免疫反应”指在蛋白质和其它生物物质异质群体存在下测定某蛋白质存在的结合反应。因此,在指定的免疫试验条件下,特定抗体优选结合特定蛋白质,而不大量结合样品中存在的其它蛋白质。在这种条件下与蛋白质特异性结合需要选择采用对该特定蛋白质具有特异性的抗 体。可用各种免疫试验方法选择能与特定蛋白质发生特异性免疫反应的抗体。例如,通常用固相ELISA免疫试验来选择能与某蛋白质发生特异性免疫反应的单克隆抗体。参见Harlow和Lane(1988)《抗体,实验室手册》(Antibodies,A Laboratory Manual),Cold Spring Harbor Publication,New York,其中描述了可用于测定特异性免疫反应性的免疫试验方法和条件。 
具体多核苷酸序列的“保守性修饰变异”指编码相同或基本相同的氨基酸序列的多核苷酸,或当该多核苷酸不编码氨基酸序列时,指基本相同的序列。由于遗传密码的简并性,许多功能上相同的核酸可编码一个给定的蛋白质。例如,密码子CGU、CGC、CGA、CGG、AGA和AGG都编码氨基酸精氨酸。因此,在由某密码子确定精氨酸的每个位置上,可将该密码子改变为所述相应密码子中的任何一个,而不会改变编码的蛋白质。这种核酸变异是“沉默变异”,是“保守性修饰变异”的一种。本文所述编码蛋白质的每个多核苷酸序列也描述了每一种可能的沉默变异,除非另有说明。本领域技术人员将认识到,可用标准技术修饰核酸中各密码子(除AUG和UGG外,AUG通常是甲硫氨酸的唯一密码子,UGG通常是色氨酸的唯一密码子),而产生功能相同的分子。因此,所述各序列中暗含编码蛋白质的核酸的各“沉默变异”。 
而且,本领域技术人员将认识到,改变、加入或缺失编码序列中的一个氨基酸或小百分数(一般少于5%,更通常少于1%)氨基酸的单取代、缺失或添加是“保守性修饰变异”,这些改变导致用化学性质上相似的氨基酸取代某氨基酸。提供功能上相似的氨基酸保守取代列表是本领域熟知的。 
本领域技术人员将理解,蛋白质如糖基转移酶和编码蛋白质的核酸的许多保守变体能产生基本上相同的产物。例如,由于遗传密码子的简并性,暗示“沉默取代”(即不导致编码蛋白质改变的核酸序列取代)是每个编码氨基酸的核酸序列的特征。如本文所述,宜优化用于产生嵌合性糖基转移酶(如酵母、人等)的序列在特定宿主细胞中表达。相似地,“保守性氨基酸取代”是用具有高度相似性能的不同氨基酸取代氨基酸序列中一个或几个氨基酸(参见定义章节,同上),也不难鉴定与特定氨基酸序列或与编码氨基酸的特定核酸序列高度相似的序列。这种特定序列的保守性取代变体是本发明的一个特征。也参见Creighton(1984)《蛋白质》(Proteins),W.H.Freeman andCompany。此外,改变、加入或缺失编码序列中的一个氨基酸或小百分数氨基酸的单取代、缺失或加入也是“保守性修饰变异”。 
本发明的实施可包括构建重组核酸和在宿主细胞,优选细菌宿主细胞中表达基因。实现这些目的的分子克隆技术是本领域已知的。本领域技术人员熟知适合构建 重组核酸如表达载体的各种克隆方法和体外扩增方法。这些技术的例子和足以指导本领域技术人员进行许多克隆实践的说明见Berger和Kimmel,《分子克隆技术指南,酶学方法》(Guide to Molecular Cloning Techniques,Methods in Enzymology),第152卷,Academic Press,Inc.,San Diego,CA(Berger);和《新编分子生物学实验指南》(Current Protocols in Molecular Biology),F.M.Ausubel等编,Current Protocols,GreenePublishing Associates,Inc.与John Wiley&Sons,Inc.的合资公司,(1999增刊)(Ausubel)。本领域技术人员知道可表达重组多肽的合适宿主细胞,包括例如:原核细胞如大肠杆菌(E.coli),和真核细胞,包括昆虫、哺乳动物和真菌细胞(如黑曲霉(Aspergillus niger))。 
足以指导本领域技术人员进行体外扩增方法的例子,包括聚合酶链反应(PCR)、连接酶链反应(LCR)、Qβ-复制酶扩增和其它RNA聚合酶介导的技术见Berger,Sambrook和Ausubel,以及Mullis等(1987),美国专利号4,683,202;《PCR方法,方法和应用指南》(PCR Protocols A Guide to Methods and Application)(Innis等编),Academic Press Inc.San Diego,CA(1990)(Innis);Arnheim&Levinson(1990年10月1日)C&EN36-47;The Journal Of NIH Research(1991)3:81-94;(Kwoh等(1989)Proc.Natl.Acad.Sci.USA86:1173;Guatelli等(1990)Proc.Natl.Acad Sci.USA87:1874;Lomell等(1989)J.Clin.Chem.35:1826;Landegren等(1988)Science241:1077-1080;Van Brunt(1990)Biotechnology8:291-294;Wu和Wallace(1989)Gene4:560;和Barringer等(1990)Gene89:117。克隆体外扩增的核酸的改进方法见Wallace等,美国专利号5,426,039。 
发明详述
I.导言 
本发明提供重折叠在细菌包含体中表达为不溶性蛋白质的真核糖基转移酶的条件。采用含有氧化还原对的重折叠缓冲液促进不溶性真核糖基转移酶的重折叠。也可通过将麦芽糖结合域融合于不溶性真核糖基转移酶来促进重折叠。对于一些不溶性真核糖基转移酶,也可通过定点诱变去除未配对的半胱氨酸来促进重折叠。可提供的其它重折叠增强方法是截短真核糖基转移酶以去除(例如)信号锚定域、跨膜域和/或蛋白质的所有或部分主干区。本发明也提供在一个容器中重折叠一种以上糖基转移酶,从而促进这些蛋白质的重折叠并提高蛋白质生产效率的方法。可利用真核糖基转移酶的重折叠来产生或重建多糖、寡糖、糖脂、蛋白质、肽、糖肽和糖蛋白。 也可利用重折叠的真核糖基转移酶来糖基PEG化蛋白质、肽、糖肽或糖蛋白,如PCT/US02/32263所述,将其纳入本文作为参考用于所有目的。 
II.重折叠不溶性糖基转移酶 
细菌表达的许多重组蛋白质在细菌包含体中表达为不溶性凝聚物。包含体是在细菌的胞质和周质间隙中发现的蛋白质沉积物。(参见例如,Clark,Cur.Op.Biotech.12:202-207(2001))。真核糖基转移酶常常在细菌包含体中表达。在只表达蛋白质的催化结构域时,一些真核糖基转移酶在细菌中可溶,即不产生于包含体中。然而,即使只表达催化结构域,有许多真核糖基转移酶仍不溶,而表达于细菌包含体中,本文提供了重折叠这些蛋白质以产生活性糖基转移酶的方法。 
A.重折叠活性糖基转移酶的条件 
为在细菌细胞中产生活性真核糖基转移酶,先在细菌包含体中表达真核糖基转移酶,收获、破碎细菌,分离和洗涤包含体。然后溶解包含体中的蛋白质。可用变性剂,如氯化胍或尿素;极端pH,如酸性或碱性条件;或去污剂进行溶解。 
溶解后,去除糖基转移酶混合物中的变性剂有各种方法,包括稀释于重折叠缓冲液中或缓冲液交换法。缓冲液交换法包括透析、渗滤、凝胶过滤和将蛋白质固定在固体支持物上。(参见例如,Clark,Cur.Op.Biotech.12:202-207(2001))。可组合上述方法以去除变性剂。 
加入含有氧化还原对的重折叠缓冲液以促进真核糖基转移酶中形成二硫键。氧化还原对包括还原性和氧化性谷胱甘肽(GSH/GSSG)、半胱氨酸/胱氨酸、半胱胺/胱胺、DTT/GSSG和DTE/GSSG。(参见例如,Clark,Cur.Op.Biotech.12:202-207(2001),将其纳入本文作为参考用于所有目的)。在一些实施方式中,以特定比率的还原组分:氧化组分,如1/20、20/1、1/4、4/1、1/10、10/1、1/2、2/1、1/5、5/1或5/5加入氧化还原对。 
可在pH范围(例如)6.0-10.0的缓冲液中进行重折叠。重折叠缓冲液可包括其它添加剂以促进重折叠,如L-精氨酸(0.4-1M);PEG;低浓度的变性剂,如尿素(1-2M)和氯化胍(0.5-1.5M);和去污剂(如Chaps、SDS、CTAB、十二烷基麦芽糖苷和TritonX-100)。 
持续重折叠给定时间,如1-48小时或过夜。可在约4℃-40℃,包括室温下进行重折叠。
在细菌包含体中表达含有催化结构域的真核糖基转移酶蛋白,然后用上述方法重折叠。含所有或一部分主干区和催化结构域的真核糖基转移酶也可采用本文所述方法,如含有融合于MBP蛋白催化结构域的真核糖基转移酶可采用本文所述方法。 
本领域技术人员将认识到,当重折叠的某蛋白质具有可检测的生物学活性时,表明该蛋白质已正确地重折叠。对于糖基转移酶,生物学活性是能催化使供体底物转移到受体底物,如重折叠的ST3GalIII能将唾液酸转移到受体底物。生物学活性包括例如:至少为1、2、5、7或10单位活性的特异性活性。单位定义如下:一个活性单位的酶每分钟在给定温度(如37℃)和pH值(如pH7.5)时催化形成1μmol产物。因此,10单位酶是在温度如37℃和pH值如7.5下在1分钟内将10μmol底物转化为10μmol产物的酶催化量。 
在一个实施方式中,使真核ST3GalIII在细菌包含体中表达,溶解,在含有氧化还原对如GSH/GSSG或胱胺/半胱氨酸的缓冲液中重折叠。 
在一个实施方式中,使真核GnT1在细菌包含体中表达,溶解,在含有氧化还原对如GSH/GSSG或胱胺/半胱氨酸的缓冲液中重折叠。 
在一个实施方式中,使真核GalT1在细菌包含体中表达,溶解,在含有氧化还原对如GSH/GSSG或胱胺/半胱氨酸的缓冲液中重折叠。 
在一个实施方式中,使真核St3GalI在细菌包含体中表达,溶解,在含有氧化还原对如GSH/GSSG或胱胺/半胱氨酸的缓冲液中重折叠。 
在一个实施方式中,使真核St6GalNAcTI在细菌包含体中表达,溶解,在含有氧化还原对如GSH/GSSG或胱胺/半胱氨酸的缓冲液中重折叠。 
在一个实施方式中,使真核Core GalITI在细菌包含体中表达,溶解,在含有氧化还原对如GSH/GSSG或胱胺/半胱氨酸的缓冲液中重折叠。 
在一个实施方式中,使真核GalNAcT2在细菌包含体中表达,溶解,在含有氧化还原对如GSH/GSSG或胱胺/半胱氨酸的缓冲液中重折叠。 
B.将真核糖基转移酶与麦芽糖结合蛋白结构域融合以促进重折叠 
一般将麦芽糖结合蛋白(MBP)结构域融合于蛋白质以提高细胞中该蛋白的溶解性。参见例如,Kapust和Waugh Pro.Sci.8:1668-1674(1999)。然而,许多真核糖基转移酶,包括截短的真核糖基转移酶即使融合了MBP结构域在细菌中表达时仍不溶。然而,本申请公开了MBP结构域可促进(例如)包含体蛋白质溶解后不溶性真核糖基转移酶的重折叠。各种细菌来源的MBP结构域均可用于本发明,例如耶尔森菌(Yersinia)、大肠杆菌(E.coli)、激烈火球菌(Pyrococcus furiosus)、海滨热球菌 (Thermococcus litoralis)、海栖热袍菌(Thermatoga maritime)和霍乱弧菌(Vibriocholerae),参见例如图43。在优选实施方式中,将大肠杆菌MBP蛋白融合于真核糖基转移酶。可将氨基酸接头置于MBP结构域和糖基转移酶之间。在另一优选实施方式中,将MBP结构域融合于糖基转移酶蛋白的氨基末端。上述方法可用于重折叠MBP糖基转移酶融合蛋白。 
在一个实施方式中,将真核ST3GalIII蛋白融合于MBP结构域,在细菌包含体中表达,溶解,在含有氧化还原对如GSH/GSSG或胱胺/半胱氨酸的缓冲液中重折叠。 
在一个实施方式中,将真核GnT1蛋白融合于MBP结构域,在细菌包含体中表达,溶解,在含有氧化还原对如GSH/GSSG或胱胺/半胱氨酸的缓冲液中重折叠。 
在一个实施方式中,将真核GalT1蛋白融合于MBP结构域,在细菌包含体中表达,溶解,在含有氧化还原对如GSH/GSSG或胱胺/半胱氨酸的缓冲液中重折叠。 
在一个实施方式中,将真核St3GalI蛋白融合于MBP结构域,在细菌包含体中表达,溶解,在含有氧化还原对如GSH/GSSG或胱胺/半胱氨酸的缓冲液中重折叠。 
在一个实施方式中,将真核St6GalNAcTI蛋白融合于MBP结构域,在细菌包含体中表达,溶解,在含有氧化还原对如GSH/GSSG或胱胺/半胱氨酸的缓冲液中重折叠。 
在一个实施方式中,将真核Core GalITI蛋白融合于MBP结构域,在细菌包含体中表达,溶解,在含有氧化还原对如GSH/GSSG或胱胺/半胱氨酸的缓冲液中重折叠。 
在一个实施方式中,将真核GalNAcT2蛋白融合于MBP结构域,在细菌包含体中表达,溶解,在含有氧化还原对如GSH/GSSG或胱胺/半胱氨酸的缓冲液中重折叠。 
可将其它氨基酸标记加入MBP-糖基转移酶融合物中。例如,可加入纯化标记以促进重折叠蛋白质的纯化。纯化标记包括例如:多聚组氨酸标记、谷胱甘肽S转移酶(GST)、淀粉结合蛋白(SBP)、大肠杆菌硫氧还蛋白结构域、SUMO蛋白的羧基端一半、FLAG表位和myc表位。还可利用能结合纯化标记的结合伴侣来纯化重折叠的糖基转移酶。在优选实施方式中,将MBP标记融合于真核糖基转移酶以促进其重折叠。可将纯化标记融合于MBP糖基转移酶融合蛋白,包括例如:GnT1、GalT1、StIII Gal3、St3GalI、St6GalNAcTI、Core GalITI或GalNAcT2。 
在另一实施方式中,将MBP结构域加入蛋白质可提高该蛋白的表达。参见例如实施例12,其中将SiaA蛋白融合于MBP结构域提高了该蛋白的表达。融合于MBP 后表达增强的其它蛋白包括例如:GnT1、GalT1、StIII Gal3、St3GalI、St6GalAcTI、Core GalITI或GalNAcT2。 
在另一实施方式中,将可自身切割的蛋白标记如内含肽(intein)位于MPB结构域和糖基转移酶之间,以帮助在融合蛋白重折叠后去除MBP结构域。内含肽及其应用试剂盒可购得,如New England Biolabs的产品。 
C.诱变糖基转移酶以促进重折叠 
也可通过诱变糖基转移酶的氨基酸序列来促进糖基转移酶的重折叠。在一个实施方式中,鉴定并突变未配对的半胱氨酸残基,以促进糖基转移酶的重折叠。在另一实施方式中,截短糖基转移酶的氨基末端以去除跨膜结构域,或去除该蛋白的跨膜结构域和所有或一部分主干区。在又一实施方式中,突变糖基转移酶,以去除至少一个未配对的半胱氨酸残基并截短该蛋白的氨基末端,以去除跨膜结构域,或去除该蛋白的跨膜结构域和所有或一部分主干区。一旦分离得到糖基转移酶核酸序列后,可用标准分子生物学方法以本文所述方式改变其核酸序列和编码的氨基酸序列。 
1.诱变糖基转移酶中未配对的半胱氨酸以促进重折叠 
发生重折叠时,变性蛋白质中的半胱氨酸残基可形成有助于再生活性蛋白结构的二硫键。而半胱氨酸残基的不正确配对可导致蛋白质错误折叠。含有未配对的半胱氨酸残基的蛋白质易于错误折叠,因为通常未配对的半胱氨酸可与正常配对的半胱氨酸形成二硫键,从而使得不可能形成正确的半胱氨酸配对和蛋白质重折叠。因此,促进特定糖基转移酶重折叠的一种方法是鉴定出未配对的半胱氨酸残基并去除它们。 
可通过测定感兴趣糖基转移酶的结构来鉴定未配对的半胱氨酸残基。可根据该感兴趣糖基转移酶的实际数据,如圆二色谱、NMR和X线晶体图确定蛋白质结构。也可用计算机建模确定蛋白结构。计算机建模是可用来根据同源分子的已知三维结构建立相关结构模型的技术。可购得其标准软件。(参见例如,从www.accelrys.com可获得多种进行计算机建模的软件)。鉴定到未配对半胱氨酸残基后,可用标准的分子生物学技术突变编码感兴趣糖基转移酶的DNA,通过缺失或用另一氨基酸残基取代来去除未配对的半胱氨酸。再用计算机建模选择大小、形状和电荷相适合的取代氨基酸。也可通过肽图确定未配对的半胱氨酸。突变感兴趣的糖基转移酶后,在细菌包含体中表达该蛋白,测定其重折叠能力。正确重折叠的糖基转移酶将具有生物学活性。
在优选实施方式中,可用以下氨基酸残基取代真核糖基转移酶中的未配对半胱氨酸残基以促进重折叠:Ala、Ser、Thr、Asp、Ile或Val。如果未配对的半胱氨酸不在螺旋结构中,也可用Gly。 
人N-乙酰葡糖胺基转移酶I(GnTI,登录号NP_002397)是诱变未配对的半胱氨酸后显示重折叠增强的糖基转移酶的例子。(参见例如,实施例2,见下)。人GNTI与以下多种生物的真核GNTI蛋白密切相关,如中国仓鼠,登录号AAK61868;兔,登录号AAA31493;大鼠,登录号NP_110488;金黄地鼠,登录号AAD04130;小鼠,登录号P27808;斑马鱼,登录号AAH58297;爪蟾,登录号CAC51119;果蝇,登录号NP525117;疟蚊,登录号XP_315359;秀丽新小杆线虫(C.elegans),登录号NP_497719;小立碗藓(Physcomitrella patens),登录号CAD22107;马铃薯(Solanumtuberosum),登录号CAC80697;烟草(Nicotiana tabacum),登录号CAC80702;水稻(Oryza sativa),登录号CAD30022;本塞姆氏烟草(Nicotiana benthamiana),登录号CAC82507;和拟南芥(Arabidopsis thaliana),登录号NP_195537。 
已测定了兔N-乙酰葡糖胺基转移酶I(GnTI)蛋白的结构,显示CYS123未配对。(氨基酸残基编号指全长蛋白质序列,即使GNTI蛋白被截短)。用基于兔GnTI的计算机建模测定了人GnTI蛋白的结构。它们的比对见图6。在人GnTI蛋白中,CYS121未配对。在人GnTI中进行了CYS121取代。CYS121SER突变体和CYS121ALA突变体有活性。相反,没有检测到CYS121THR突变体的活性,而CYS121ASP突变体活性低。根据秀丽新小杆线虫GNT1蛋白的预测结构构建了双突变体ARG120ALA、CYS121HIS,它们有活性。 
可根据计算机建模利用上述真核GnTI蛋白的氨基酸序列测定蛋白质结构,兔GnTI蛋白的CYS123和人GnTI蛋白的CYS121功能保守。据此分析,残基123是以下蛋白中的未配对半胱氨酸:中国仓鼠GnTI、兔GnTI、大鼠GnTI、金黄地鼠GnTI和小鼠GnTI。因此,可在各种GnTI酶中将CYS123突变为丝氨酸、丙氨酸或精氨酸,以产生重折叠活性增强的活性蛋白质。上述蛋白的以下双突变体ARG122ALACYS123HIS也显示重折叠增强。 
在一个实施方式中,突变上述真核GnT1蛋白之一以去除未配对的半胱氨酸残基,如CYS121SER、CYS121ALA、CYS121ASP或双突变ARG120ALA CYS121HIS,在细菌包含体中表达,溶解,在含有氧化还原对如GSH/GSSG或胱胺/半胱氨酸的缓冲液中重折叠。
突变未配对的半胱氨酸后显示重折叠增强的另一糖基转移酶是GalT1。将牛GalT1中的半胱氨酸342突变为苏氨酸残基,突变的酶溶解后显示重折叠增强。参见例如,Ramakrishnan等,J.Biol.Chem.276:37666-37671(2001)。令人感兴趣的是,GnTI酶中未配对的半胱氨酸突变为苏氨酸会消除其活性。 
在一个实施方式中,突变GalT1蛋白质以去除未配对的半胱氨酸残基,如CYS342THR,在细菌包含体中表达,溶解,在含有氧化还原对如GSH/GSSG或胱胺/半胱氨酸的缓冲液中重折叠。 
突变未配对的半胱氨酸后显示重折叠增强的另一糖基转移酶是GalNAc T2。GalNAc T2蛋白与GalNAc T1蛋白之间共有许多相同的氨基酸残基。当COS细胞表达时,两个半胱氨酸残基CYS212和CYS214突变后,人GalNAc T1蛋白保持活性。参见例如,Tenno等,Eur.J.Biochem.269:4308-4316(2002)。活性突变包括CYS212ALA、CYS214ALA、CYS212SER、CYS214SER和双突变CYS212SERCYS214SER。人GalNAc T1蛋白中的半胱氨酸残基CYS212和CYS214残基在人GalNAc T2蛋白中保守,即残基CYS227和CYS229。参见例如图44。因此,可用含有以下突变之一的GalNAc T2蛋白来促进不溶性蛋白质的重折叠:CYS227ALA、CYS229ALA、CYS227SER、CYS229SER和双突变CYS227SER CYS229SER。残基编号指人GalNAc T2蛋白,但可在其它真核GalNAc T2蛋白如小鼠、大鼠、兔、猪中鉴定到保守性半胱氨酸残基CYS227和CYS229,将其突变以促进重折叠。 
在一个实施方式中,突变GalNAc T2蛋白以去除未配对的半胱氨酸残基,如CYS227ALA、CYS229ALA、CYS227SER、CYS229SER或双突变CYS227SERCYS229SER,在细菌包含体中表达,溶解,在含有氧化还原对如GSH/GSSG或胱胺/半胱氨酸的缓冲液中重折叠。 
突变未配对的半胱氨酸后显示重折叠增强的另一糖基转移酶是Corel GalT1。在一个实施方式中,突变果蝇Corel GalT1。在另一实施方式中,突变人CorelGalT1。果蝇Corel GalT1蛋白含有7个半胱氨酸残基。将各半胱氨酸残基分别突变为丝氨酸或丙氨酸。在大肠杆菌包含体中表达该突变的果蝇Corel GalT1蛋白,溶解,重折叠。测定重折叠果蝇Corel GalT1突变体的酶活,与野生型重折叠果蝇CorelGalT1的活性作比较。与野生型蛋白相比,突变的果蝇Corel GalT1的酶活提高表明重折叠增强。 
在一个实施方式中,突变Corel GalT1蛋白以去除未配对的半胱氨酸残基,如果蝇蛋白或人蛋白,在细菌包含体中表达,溶解,在含有氧化还原对如GSH/GSSG或胱胺/半胱氨酸的缓冲液中重折叠。果蝇Core1 GalT1中优选进行取代的半胱氨酸残基是C103、C127、C208、C246、C261、C315和C316。 
2.截短糖基转移酶以促进重折叠 
真核糖基转移酶通常包括以下结构域:催化结构域、主干区、跨膜结构域和信号锚定结构域。在细菌中表达时,信号锚定结构域和跨膜结构域一般缺失。用于本发明方法的真核糖基转移酶可包括所有或一部分主干区和催化结构域。在一些实施方式中,该真核糖基转移酶仅包含催化结构域。 
可鉴定糖基转移酶结构域以进行缺失诱变。例如,本领域技术人员可鉴定真核糖基转移酶中的主干区,并一个一个地去除主干区氨基酸以鉴定重折叠后具有高活性的截短的真核糖基转移酶蛋白。 
本申请中的缺失突变体以两种方式表示:Δ或D,后面是天然全长氨基酸序列氨基末端缺失的残基数目,或从天然全长氨基酸序列翻译的第一个氨基酸残基的符号和残基编号。例如,ST6GalNAcIΔ或D35和ST6GalNAcI K36,都指人ST6GalNAcI蛋白的同一截短物。 
例如,大鼠ST3GalIII蛋白含有主干区的氨基酸残基29-84。该蛋白的催化结构域含有氨基酸残基85-374。因此,截短的大鼠ST3GalIII蛋白在氨基末端可缺失约(例如)29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84或85个残基。 
也可在GnT1蛋白中进行缺失突变。例如,人GnT1蛋白含有主干区氨基酸残基31-112。因此,截短的人GnT1蛋白在氨基末端可缺失约(例如)30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110或111个残基。 
也可在GalT1蛋白中进行缺失突变。例如,牛GalT1蛋白含有主干区氨基酸残基71-129。因此,截短的牛GalT1蛋白在氨基末端可缺失约(例如)70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、 108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127或128个残基。 
也可在Core1 GalT1蛋白中进行缺失突变。例如,果蝇Core1 GalT1蛋白含有主干区氨基酸残基36-102。因此,截短的果蝇Core1 GalT1蛋白在氨基末端可缺失约(例如)35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101或102个残基。作为另一个例子,人Core1 GalT1蛋白含有主干区氨基酸残基32-90。因此,截短的人Core1 GalT1蛋白在氨基末端可缺失约(例如)32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89或90个残基。 
也可在ST3Gal1蛋白中进行缺失突变。例如,人ST3Gal1蛋白含有主干区氨基酸残基18-58。因此,截短的人ST3Gal1蛋白在氨基末端可缺失约(例如)18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、56、57或58个残基。作为另一个例子,猪ST3Gal1蛋白含有主干区氨基酸残基28-61。因此,截短的猪ST3Gal1蛋白在氨基末端可缺失约(例如)28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、56、57、58、59、60或61个残基。 
也可在GalNAcT2蛋白中进行缺失突变。例如,大鼠GalNAcT2蛋白含有主干区氨基酸残基40-95。因此,截短的大鼠GalNAcT2蛋白在氨基末端可缺失约(例如)40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94或95个残基。 
也可在ST6GalNAcI蛋白中进行缺失突变。例如,小鼠ST6GalNAcI蛋白含有主干区氨基酸残基30-207。因此,截短的小鼠ST6GalNAcI蛋白在氨基末端可缺失约(例如)30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、56、57、58、59、60、61、62、63、64、65、66、 67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、202、203、204、205、206或207个残基。作为另一个例子,人ST6GalNAcI蛋白含有主干区氨基酸残基35-278。因此,截短的人ST6GalNAcI蛋白在氨基末端可缺失约(例如)34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、202、203、204、205、206、207、208、209、210、211、212、213、214、215、216、217、218、219、220、221、222、223、224、225、226、227、228、229、230、231、232、233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、250、251、252、253、254、256、257、258、259、260、261、262、263、264、265、266、267、268、269、270、271、272、273、274、275、276、277或278个残基。作为另一个例子,鸡ST6GalNAcI蛋白含有主干区氨基酸残基37-253。因此,截短的鸡ST6GalNAcI蛋白在氨基末端可缺失约(例如)36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、 98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、202、203、204、205、206、207、208、209、210、211、212、213、214、215、216、217、218、219、220、221、222、223、224、225、226、227、228、229、230、231、232、233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、250、251、252或253个残基。 
D.糖基转移酶的单罐(one pot)重折叠 
本发明的这些实施方式基于以下惊人的发现:可在一个容器中重折叠细菌包含体中表达的多种真核糖基转移酶,即单罐法。用此方法,可一起折叠至少两种糖基转移酶,从而节约了时间和材料。重折叠条件如上所述。优化了糖基转移酶混合物重折叠条件,因此,对于混合物中的特定酶来说,条件可能不是最优的。然而,因为优化了糖基转移酶组合的重折叠,在最终产物中可检测到重折叠糖基转移酶各自的生物学活性。生物学活性指重折叠酶的酶活,可表示为特异性活性。生物学活性包括例如,至少0.1、0.5、1、2、5、7或10单位活性的特异性活性。单位定义如下:一个活性单位的酶每分钟在给定温度(如37℃)和pH值(如pH 7.5)可催化形成1μmol产物。因此,10单位酶是在温度如37℃和pH值如7.5下在1分钟内能将10μmol底物转化为10μmol产物的酶催化量。然后,可用含有重折叠糖基转移酶的反应混合物来合成寡糖、合成糖脂、重建糖蛋白和糖基PEG化糖蛋白。 
在一些实施方式中,将包含体的糖基转移酶分别溶解,然后在适合重折叠的条件下混合。在其它实施方式中,将含有糖基转移酶的包含体混合、溶解,然后在合适条件下重折叠。 
重折叠缓冲液一般含有氧化还原对。可在pH范围(例如)6.0-10.0的缓冲液中进行重折叠。重折叠缓冲液可包括其它添加剂以促进重折叠,如L-精氨酸(0.4-1M);PEG;低浓度的变性剂,如尿素(1-2M)和氯化胍(0.5-1.5M);和去污剂(如Chaps、SDS、CTAB和Triton X-100)。 
在一些实施方式中,在静置容器中,即不混合、不搅拌、不振荡也不移动反应混合物的情况下进行重折叠。 
重折叠酶的组合可包括构建具有特定寡糖结构的酶。一旦鉴定到所需终产物,本领域技术人员能鉴定到适合于包含在混合物中的糖基转移酶。 
重折叠酶的反应混合物可包含经突变增强了重折叠的糖基转移酶,如上述GnTI酶。 
在优选实施方式中,使进行N-连接的糖基化步骤的酶在一个容器中一起重折叠。例如,可在细菌包含体中表达N-乙酰葡糖胺基转移酶I(GnTI)、β-1,4半乳糖基转移酶I(Gal TI)和N-乙酰氨基乳糖苷(N-acetyllactosaminide)α-2,3-唾液酸转移酶(ST3GalIII),溶解,在一个容器中一起重折叠。终产物具有所有三种蛋白的活性,表明它们都正确地重折叠。也可以在GnTI和Gal TI一起重折叠时使ST3GalIII不重折叠。实施例3中详细描述了这些试验。 
在另一优选实施方式中,用本发明公开的细菌表达的重折叠糖基转移酶来完成肽或蛋白质的O-连接糖基化。例如,可用重折叠的MBP-GalNAcT2(D51)酶将GalNAc加到多肽上。例如,实施例4证明了可用重折叠的MBP-GalNAcT2(D51)将GalNAc加到GCSF蛋白上。可用O-连接的糖基转移酶的组合来重建(例如)蛋白质、肽、糖蛋白或糖肽。这些组合包括例如:GalNAc-T2和ST6GalNAc1;或GalNAc-T2、corelGalT1和ST3Gal1或ST3GalT2。 
III.糖基转移酶 
用于实施本发明的糖基转移酶是真核糖基转移酶。这种糖基转移酶的例子包括但不限于Staudacher,E.(1996)Trends in Glycoscience and Glycotechnology,8:391-408,afmb.cnrs-mrs.fr/~pedro/CAZY/gtf.html和www.vei.co.uk/TGN/gtguide.htm所述的酶。 
真核糖基转移酶
一些真核糖基转移酶在其氨基末端具有对催化活性不需要的拓扑结构域(参见美国专利号5,032,519)。在目前已表征的糖基转移酶中,“胞质结构域”的长度最常为约1-10个氨基酸,大多数是氨基-末端结构域;称为“信号锚定结构域”的相邻结构域的长度通常为约10-26个氨基酸;与信号锚定结构域相邻的“主干区”长度通常为约20-60个氨基酸,已知其功能是将糖基转移酶保持在高尔基体中的保留信号;主干区的羧基侧是催化结构域。
已克隆并表达了许多哺乳动物的糖基转移酶,就供体和受体底物特异性表征了这些重组蛋白,也通过尝试确定参与供体或受体底物特异性的残基或结构域的定点诱变研究了它们(Aoki等(1990)EMBO.J.9:3171-3178;Harduin-Lepers等(1995)Glycobiology5(8):741-758;Natsuka和Lowe(1994)Current Opinion in StructuralBiology4:683-691;Zu等(1995)Biochem.Biophys.Res.Comm.206(1):362-369;Seto等(1995)Eur.J.Biochem.234:323-328;Seto等(1997)J.Biol.Chem.272:14133-141388)。 
在一组实施方式中,本发明重组糖基转移酶蛋白的功能域获自已知的唾液酸转移酶。适合用于本发明的唾液酸转移酶的例子包括但不限于:ST3GalIII、ST3Gal IV、ST3Gal I、ST6Gal I、ST3Gal V、ST6Gal II、ST6GalNAc I、ST6GalNAc II和ST6GalNAcIII(本文所用的唾液酸转移酶命名法见Tsuji等(1996)Glycobiology6:v-xiv)。示范性α2,3-唾液酸转移酶(EC2.4.99.6)能将唾液酸转移到Galβ1→4GlcNAc二糖或糖苷的非还原末端Gal。参见Van den Eijnden等,J.Biol.Chem.,256:159(1981),Weinstein等,J.Biol.Chem.,257:13845(1982)和Wen等,J.Biol.Chem.,267:21011(1992)。另一示范性α2,3-唾液酸转移酶(EC2.4.99.4)能将唾液酸转移到Galβ1→3GalNAc二糖或糖苷的非还原性末端Gal。参见Rearick等,J.Biol.Chem.,254:4444(1979)和Gillespie等,J.Biol.Chem.,267:21004(1992)。示范性酶还包括Gal-β-1,4-GlcNAcα-2,6唾液酸转移酶(参见Kurosawa等,Eur.J.Biochem.219:375-381(1994))。唾液酸转移酶命名法见Tsuji,S.等,(1996)Glycobiology6:v-vii。 
用于要求权利的方法的唾液酸转移酶的例子是ST3GalIII,也称为α(2,3)唾液酸转移酶(EC2.4.99.6)。该酶能催化使唾液酸转移到Galβ1,3GlcNAc、Galβ1,3GalNAc或Galβ1,4GlcNAc糖苷的Gal(参见例如,Wen等(1992)J.Biol.Chem.267:21011;Van den Eijnden等(1991)J.Biol.Chem.256:3159)。通过在两个糖之间形成α-连接将唾液酸连接于Gal。两个糖之间的键(连接)是在NeuAc的2位和Gal的3位之间。此特定酶可从大鼠肝中分离得到(Weinstein等(1982)J.Biol.Chem.257:13845);人cDNA(Sasaki等(1993)J.Biol.Chem.268:22782-22787;Kitagawa&Paulson(1994)J.Biol.Chem.269:1394-1401)和基因组(Kitagawa等(1996)J.Biol.Chem.271:931-938)DNA序列已知,可帮助通过重组表达产生此酶。在优选实施方式中,要求权利的唾液酸化方法采用大鼠ST3GalIII。已克隆了大鼠ST3GalIII,其序列已知。参见例如,Wen等,J.Biol.Chem.267:21011-21019(1992),登录号M97754。
在另一组实施方式中,本发明重组糖基转移酶蛋白的功能域获自岩藻糖基转移酶。本领域技术人员知道许多岩藻糖基转移酶。简要说,岩藻糖基转移酶包括能将L-岩藻糖从GDP-岩藻糖转移到受体糖的羟基位置上的任何一种酶。在一些实施方式中,例如,受体糖是寡糖糖苷Galβ(1→4)GlcNAc基团中的GlcNAc。适合此反应的岩藻糖基转移酶包括获自人乳汁的Galβ(1→3,4)GlcNAcα(1→3,4)岩藻糖基转移酶(FTIII,E.C.号2.4.1.65)(参见Palcic等,Carbohydrate Res.190:1-11(1989);Prieels等,J.Biol.Chem.256:10456-10463(1981);和Nunez等,Can.J.Chem.59:2086-2095(1981))以及在人血清中发现的Galβ(1→4)GlcNAcα(1→3)岩藻糖基转移酶(FTIV、FTV和FTVI,E.C.号2.4.1.65)和NeuAcα(23)βGa1(1→4)βGlcNAcα(1→3)岩藻糖基转移酶(FTVII)。还可用α1,3岩藻糖基转移酶IX(人和小鼠FTIX的核苷酸序列),如Kaneko等(1999)FEBS Lett.452:237-242所述。此外,可用Galβ(1→3,4)GlcNAcα(1→3,4)岩藻糖基转移酶的重组形式(参见Dumas等,Bioorg.Med.Letters1:425-428(1991)和Kukowska-Latallo等,Genes and Development4:1288-1303(1990))。其它示范性岩藻糖基转移酶包括α1,2岩藻糖基转移酶(E.C.号2.4.1.69)。可用Mollicone等,Eur.J.Biochem.191:169-176(1990)或美国专利号5,374,655所述方法进行酶促岩藻糖糖基化。 
在另一组实施方式中,本发明重组糖基转移酶蛋白的功能域获自己知的半乳糖基转移酶。示范性半乳糖基转移酶包括β-1,4半乳糖基转移酶I、α1,3-半乳糖基转移酶(E.C.号2.4.1.151,参见例如,Dabkowski等,Transplant Proc.25:2921(1993)和Yamamoto等,Nature345:229-233(1990),牛(GenBankj04989,Joziasse等(1989)J.Biol.Chem.264:14290-14297),小鼠(GenBank m26925;Larsen等(1989)Proc.Nat’l.Acad.Sci.USA86:8227-8231),猪(GenBank L36152;Strahan等(1995)Immunogenetics41:101-105))。另一种合适的α1,3-半乳糖基转移酶是参与合成B血型抗原的酶(EC2.4.1.37,Yamamoto等(1990)J.Biol.Chem.265:1146-1151(人))。适合用于本发明融合蛋白的还有α1,4-半乳糖基转移酶,包括例如:EC2.4.1.90(LacNAc合成酶)和EC2.4.1.22(乳糖合成酶)(牛(D′Agostaro等(1989)Eur.J.Biochem.183:211-217),人(Masri等(1988)Biochem.Biophys.Res.Commun.157:657-663),小鼠(Nakazawa等(1988)J.Biochem.104:165-168),以及E.C.2.4.1.38和神经酰胺半乳糖基转移酶(EC2.4.1.45,Stahl等(1994)J.Neurosci.Res.38:234-242)。其他合适的半乳糖基转移酶包括例如:α1,2-半乳糖基转移酶(来自例如非洲粟酒人体酵母菌(Schizosaccharomyces pombe),Chapell等(1994)Mol.Biol.Cell5:519-528)。
可用于本发明重组融合蛋白的其它糖基转移酶已有详述,如唾液酸转移酶、半乳糖基转移酶和岩藻糖基转移酶。具体说,糖基转移酶也可以是(例如)葡糖基转移酶如Alg8(Stagljov等,Proc.Natl.Acad.Sci.USA91:5977(1994))或Alg5(Heesen等Eur.J.Biochem.224:71(1994)),N-乙酰半乳糖胺基转移酶如β(1,3)-N-乙酰半乳糖胺基转移酶、β(1,4)-N-乙酰半乳糖胺基转移酶(美国专利号5,691,180、Nagata等J.Biol.Chem.267:12082-12089(1992)和Smith等,J.Biol Chem.269:15162(1994))和N-乙酰半乳糖胺基转移酶蛋白(Homa等,J.Biol Chem.268:12609(1993))。合适的N-乙酰葡糖胺基转移酶包括GnTI(2.4.1.101,Hull等,BBRC176:608(1991))、GnTII和GnTIII(Ihara等,J.Biochem.113:692(1993))、GnTV(Shoreiban等,J.Biol.Chem.268:15381(1993))、O-连接的N-乙酰葡糖胺基转移酶(Bierhuizen等,Proc.Natl.Acad.Sci.USA89:9326(1992))、N-乙酰葡糖胺-1-磷酸转移酶(Rajput等,Biochem J.285:985(1992),和乙酰透明质酸合酶。感兴趣的还有参与蛋白聚糖合成的酶,例如N-乙酰半乳糖胺基转移酶I(EC2.4.1.174)和参与硫酸软骨素合成的酶,如N-乙酰半乳糖胺基转移酶II(EC2.4.1.175)。合适的甘露糖基转移酶包括α(1,2)甘露糖基转移酶、α(1,3)甘露糖基转移酶、β(1,4)甘露糖基转移酶、Dol-P-Man合酶、OCh1和Pmt1。木糖基转移酶包括例如蛋白质木糖基转移酶(EC2.4.2.26)。 
在一些实施方式中,在细菌中表达真核N-乙酰半乳糖胺基转移酶,用本发明公开的方法重折叠。已分离和表征了许多GalNAcT酶,如GalNAcT1,登录号X85018;GalNAcT2,登录号X85019(均描述于White等,J.Biol.Chem.270:24156-24165(1995));和GalNAcT3,登录号X92689(描述于Bennett等,J.Biol.Chem.271:17006-17012(1996))。 
IV.核酸 
本领域技术人员知道编码糖基转移酶的核酸和获得这种核酸的方法。可用体外方法如聚合酶链反应(PCR)、连接酶链反应(LCR)、基于转录的扩增系统(TAS)或自身持续序列复制系统(SSR)来扩增或克隆合适的核酸(如cDNA、基因组或子序列(探针))。本领域技术人员熟知各种克隆和体外扩增方法。足以指导本领域技术人员进行许多克隆实践的技术和说明的例子参见Berger和Kimmel,《分子克隆技术指南,酶学方法》(Guide to Molecular Cloning Techniques,Methods in Enzymology)152Academic Press,Inc.,San Diego,CA(Berger);Sambrook等(1989)《分子克隆-实验室手册》(Molecular Cloning-A Laboratory Manual)(第2版),第1-3卷,Cold SpringHarbor Laboratory,Cold Spring Harbor Press,NY,(Sambrook等);《新编分子生物 学实验指南》(Current Protocols in Molecular Biology),F.M.Ausubel等编,CurrentProtocols,Greene Publishing Associates,Inc.与John Wiley&Sons,Inc.的合资公司,(1994增刊)(Ausubel);Cashion等,美国专利号5,017,478;和Carr,欧洲专利号0,246,864。 
可用上述合适方法,包括例如:用限制性酶克隆和限制性切割合适序列制备编码糖基转移酶或其子序列的DNA。在一个优选实施方式中,用常规克隆方法分离得到编码糖基转移酶的核酸。(例如)GenBank或其它序列数据(如上所述)提供的糖基转移酶的核苷酸序列可用来提供能特异性杂交基因组DNA样品中的糖基转移酶基因的探针,或杂交总RNA样品中编码葡糖基转移酶的mRNA(如Southern或Northern印迹)的的探针。一旦鉴定到编码糖基转移酶的靶核酸后,可按照本领域技术人员已知的标准方法分离该核酸(参见例如,Sambrook等(1989),《分子克隆:实验室手册》(Molecular Cloning:A Laboratory Manual),第二版,第1-3卷,Cold Spring HarborLaboratory;Berger和Kimmel(1987)《酶学方法》(MethodsinEnzymology),第152卷:《分子克隆技术指南》(Guide to Molecular Cloning Techniques),San Diego:AcademicPress,Inc.;或Ausubel等(1987)《新编分子生物学实验指南》(Current Protocols inMolecular Biology),Greene Publishing和Wiley-Interscience,New York)。而且,可用限制性酶切割分离的核酸,产生编码全长糖基转移酶,如含有编码至少糖基转移酶的主干区或催化结构域子序列的核酸或其子序列。然后,可连接编码糖基转移酶或其子序列的这些限制性酶切片段,(例如)以产生编码重组糖基转移酶融合蛋白的核酸。 
可通过测定表达产物表征编码糖基转移酶或其子序列的核酸。可采用根据所表达蛋白的物理、化学或免疫学特性的检测试验。例如,可通过该核酸编码的蛋白能否催化使糖从供体底物转移到受体底物来鉴定克隆的糖基转移酶,包括糖基转移酶融合蛋白。在优选方法中,用毛细管电泳来检测反应产物。此高度灵敏试验包括采用荧光素标记的糖或二糖氨基苯基衍生物,如Wakarchuk等(1996),J.Biol.Chem.271(45):28271-276所述。例如,为测定奈瑟球菌lgtC酶,可采用FCHASE-AP-Lac或FCHASE-AP-Gal,而检测奈瑟球菌lgtB酶,合适的试剂是FCHASE-AP-GlcNAc(Id.)。 
同时,可化学合成编码糖基转移酶或其子序列的核酸。合适方法包括Narang等(1979),Meth.Enzymol.68:90-99的磷酸三酯法;Brown等(1979),Meth.Enzymol.68:109-151的磷酸二酯法;Beaucage等(1981),Tetra.Lett.,22:1859-1862的二乙基亚 磷酰胺法;和美国专利号4,458,066的固体支持物法。化学合成产生的单链寡核苷酸,可通过与互补序列杂交或用DNA聚合酶以单链为模板聚合转变成双链DNA。本领域技术人员知道,化学合成DNA的序列长度常常限于约100个碱基,更长的序列可通过连接较短序列获得。 
可用DNA扩增方法如聚合酶链反应(PCR)克隆编码糖基转移酶或其子序列的核酸。因此,(例如)用含有一个限制性酶切位点(如NdeI)的正义引物和含有另一限制性酶切位点(如HindIII)的反义引物,进行PCR扩增该核酸序列或子序列。这将产生编码所需糖基转移酶或子序列并具有末端限制性酶切位点的核酸。然后,此核酸可容易地连接到含有编码第二种分子并具有合适的相应限制性酶切位点的核酸的载体中。本领域技术人员可利用GenBank或其它来源提供的序列信息确定合适的PCR引物。也可通过定点诱变将合适的限制性酶切位点加入到编码糖基转移酶蛋白或蛋白子序列的核酸中。用合适的限制性核酸内切酶切割含有编码糖基转移酶的核苷酸序列或子序列的质粒,然后按照标准方法连接到合适的载体中进行扩增和/或表达。足以指导本领域技术人员进行体外扩增方法的技术的例子见Berger,Sambrook和Ausubel,以及Mullis等,(1987)美国专利号4,683,202;《PCR方法,方法和应用指南》(PCR Protocols A Guide to Methods and Application)(Innis等编)Academic Press Inc.San Diego,CA(1990)(Innis);Arnheim和Levinson(1990年10月1日)C&EN36-47;The Journal Of NIH Research(1991)3:81-94;(Kwoh等(1989)Proc.Natl.Acad.Sci.USA86:1173;Guatelli等(1990)Proc.Natl.Acad.Sci.USA87,1874;Lomell等(1989)J.Clin.Chem.,35:1826;Landegren等,(1988)Science241:1077-1080;Van Brrunt(1990)Biotechnology8:291-294;Wu和Wallace(1989)Gene4:560;和Barringer等(1990)Gene89:117。 
可将具体核酸表达的克隆的糖基转移酶蛋白,包括糖基转移酶融合蛋白的其它物理特性与已知的糖基转移酶的特性作比较,以提供另一种方法来鉴定作为受体底物特异性和/或催化活性决定因素的糖基转移酶的合适序列或结构域。或者,可突变推定的糖基转移酶基因或重组糖基转移酶基因,通过检测未突变的天然产生糖基转移酶或对照糖基转移酶正常产生的糖结构中的变异,来确定其是否有糖基转移酶的作用、重折叠的能力、或具体序列或结构域的作用。 
可采用突变或修饰糖基转移酶和测定修饰或突变蛋白的活性如受体底物活性和/或催化活性的标准方法,来鉴定克隆的糖基转移酶的功能域,如本文所述。可利用 各种糖基转移酶的功能域构建包含一个或多个糖基转移酶功能域的重组糖基转移酶融合蛋白的编码核酸。然后测定这些融合蛋白所需的受体底物或催化活性。 
在克隆重组糖基转移酶融合蛋白的示范性方法中,比对克隆的糖基转移酶的已知核酸或氨基酸序列,进行比较以确定各种糖基转移酶之间序列相同的量。可利用此信息根据感兴趣糖基转移酶之间的序列相同的量来鉴定和选择能赋予或调节糖基转移酶活性如受体底物活性和/或催化活性的蛋白结构域。例如,可利用在感兴趣糖基转移酶之间具有序列相同性并与已知活性相关的结构域,来构建含有该结构域和具有与该结构域相关活性(如受体底物特异性和/或催化活性)的重组糖基转移酶融合蛋白。 
V.重组糖基转移酶的表达 
可在各种宿主细胞,包括大肠杆菌、其它细菌宿主、酵母和各种高等真核细胞如COS、CHO和HeLa细胞系和骨髓瘤细胞系中表达重组真核糖基转移酶。宿主细胞可以是哺乳动物细胞、植物细胞或微生物,例如,酵母细胞、细菌细胞或丝状真菌细胞。合适的宿主细胞例子包括例如:固氮菌(Azotobacter sp.)(如维涅兰德固氮菌(A.vinelandii))、假单胞菌(Pseudomonas sp.)、根瘤菌(Rhizobium sp.)、欧文菌(Erwiniasp.)、埃希菌(Escherichia sp.)(如大肠埃希菌(E.coli))、芽孢杆菌(Bacillus)、假单胞菌(Pseudomonas)、变形杆菌(Proteus)、沙门菌(Salmonella)、沙雷菌(Serratia)、志贺杆菌(Shigella)、根瘤菌(Rhizobia)、透明颤菌(Vitreoscilla)、副球菌(Paracoccus)和克雷伯菌(Klebsiella sp.)等。此类细胞可以是以下几个属中的任何一个,包括酵母(如酿酒酵母(S.cerevisiae))、假丝酵母(Candida)(如产朊假丝酵母(C.utilis)、近平滑假丝酵母(C.parapsilosis)、克柔假丝酵母(C.krusei)、易变假丝酵母(C.versatilis)、解脂假丝酵母(C.lipolytica)、诞沫假丝酵母(C.zeylanoides)、季也蒙假丝酵母(C.guilliermondii)、白假丝酵母(C.albicans)和腐殖假丝酵母(C.humicola))、毕赤酵母(Pichia)(如粉状毕赤酵母(P.farinosa)和奥默毕赤酵母(P.ohmeri))、球拟酵母(Torulopsis)(如白球拟酵母(T.candida)、球形球拟酵母(T.sphaerica)、木质球拟酵母(T.xylinus)、无名球拟酵母(T.famata)和易变球拟酵母(T.versatilis)),德巴利酵母(Debaryomyces)(如亚球形德巴利酵母(D.subglobosus)、莰氏德巴利酵母(D.cantarellii)、球形德巴利酵母(D.globosus)、汉氏德巴利酵母(D.hansenii)和日本德巴利酵母(D.japonicus)),接合酵母(Zygosaccharomyces)(如鲁氏接合酵母(Z.rouxii)和拜氏接合酵母(Z.bailii)),克鲁维酵母(Kluyveromyces)(如马克思克鲁维酵母(K.marxianus)),汉森酵母(Hansenula)(如异常汉森酵母(H.anomala)和翟氏汉森酵母(H.jadinii))和酒香酵母(Brettanomyces)(如B. lambicus和异常酒香酵母(B.anomalus))。有用菌的例子包括但不限于:埃希菌(Escherichia)、肠杆菌(Enterobacter)、固氮菌(Azotobacter)、欧文菌(Erwinia)、克雷伯菌(Klebsielia)。 
一般将编码融合蛋白的多核苷酸置于在所需宿主细胞中起作用的启动子控制下。熟知有各种启动子可用于本发明表达载体中,这取决于具体应用。通常,启动子的选择依赖于启动子在其中具有活性的细胞。也任选包括其它表达控制序列如核糖体结合位点、转录终止位点等。包括这些控制序列中一个或多个的构建物称为“表达盒”。因此,本发明提供其中掺入了编码融合蛋白的核酸以在所需宿主细胞中高水平表达的表达盒。 
常常通过克隆能在某特定宿主细胞中表达的基因来获得适用于该细胞的表达控制序列。常用原核控制序列包括本文中定义的用于启动转录的启动子,和任选地可包含操纵子,以及核糖体结合位点序列,常用启动子例如有β-内酰胺酶(青霉素酶)和乳糖(lac)启动子系统(Change等,Nature(1977)198:1056)、色氨酸(trp)启动子系统(Goeddel等,Nuclear Acids Res.(1980)8:4057)、tac启动子(DeBoer等,Proc.Natl.AcadSci.U.S.A.(1983)80:21-25);和λ-衍生的PL启动子及N-基因核糖体结合位点(Shimatake等,Nature(1981)292:128)。具体启动子系统对本发明来说并不重要,可采用在原核细胞中起作用的任何可得到的启动子。 
为了在除大肠杆菌以外的原核细胞中表达重组真核糖基转移酶,需要在特定的原核细胞中起作用的启动子。这种启动子可获自从该物种已克隆的基因,或可采用杂合启动子。例如,杂合的trp-lac启动子在除大肠杆菌之外的芽孢杆菌中具有功能。 
可将核糖体结合位点(RBS)方便地包含在本发明表达盒中。大肠杆菌的RBS(例如)由位于起始密码子上游3-11个核苷酸处的长3-9个核苷酸的核苷酸序列组成(Shine和Dalgarno,Nature(1975)254:34;Steitz,《生物学调控和发育:基因表达》(Biological regulation and development:Gene Expression)(R.F.Goldberger编),第1卷,349页,1979,Plenum Publishing,NY)。 
为了在酵母中表达重组真核糖基转移酶,方便的启动子包括GAL1-10(Johnson和Davies(1984)Mol.Cell.Biol.4:1440-1448)、ADH2(Russell等(1983)J.Biol.Chem.258:2674-2682)、PHO5(EMBO J.(1982)6:675-680)和MFα(Herskowitz和Oshima(1982),《酵母的分子生物学》(The Molecular Biology of the YeastSaccharomyces)(Strathern、Jones和Broach编)Cold Spring Harbor Lab.,Cold SpringHarbor,N.Y.,181-209页)。另一适用于酵母的启动子是ADH2/GAPDH杂合启动子, 如Cousens等,Gene61:265-275(1987)所述。对于丝状真菌,如曲霉菌菌株(McKnight等,美国专利号4,935,349),有用启动子的例子包括衍生自构巢曲霉菌(Aspergillusnidulans)糖酵解基因的启动子,如ADH3启动子(McKnight等,EMBO J.4:2093-2099(1985))和tpiA启动子。合适的终止子的例子是ADH3终止子(McKnight等)。 
适用于植物的组成性启动子包括例如:花椰菜花叶病毒(CaMV)35S转录启动区和VI启动子、衍生自根癌土壤杆菌(Agrobacterium tumefaciens)T-DNA的1′-或2′-启动子和本领域技术人员已知的在植物细胞中具有活性的其它启动子。其它合适的启动子包括玄参花叶病毒的全长转录启动子、肌动蛋白启动子、组蛋白启动子、微管蛋白启动子或甘露氨酸合酶启动子(MAS)。其它组成性植物启动子包括衍生自拟南芥等的各种泛素或聚泛素启动子(Sun和Callis,PlantJ.,11(5):1017-1027(1997))、mas、Mac或DoubleMac启动子(如美国专利号5,106,739和Comai等,Plant Mol.Biol.15:373-38l(1990)所述)和本领域技术人员已知的各种植物基因的其它转录起始区。可用于植物的启动子也包括获白Ti-或Ri-质粒、植物细胞、植物病毒或发现在植物中起作用的其它宿主的启动子。在植物中起作用,因此适用于本发明方法的细菌启动子包括章鱼氨酸合成酶启动子、胭脂氨酸合酶启动子和甘露氨酸合成酶启动子。合适的内源性植物启动子包括核酮糖-1,6-二磷酸(RUBP)羧化酶小亚基(ssu)启动子、(α-大豆聚球蛋白(conglycinin)启动子、菜豆蛋白启动子、ADH启动子和热激启动子。 
组成性或调节性启动子可用于本发明。调节性启动子可能有优点,因为在诱导融合蛋白表达之前宿主细胞可生长到高密度。在一些情况下,高水平表达异源蛋白会减缓细胞生长。可诱导启动子是指导基因表达时可通过环境或发育因素如温度、pH、缺氧或有氧条件、光照、转录因子和化学物质来改变基因表达水平的启动子。在本文中,这种启动子称为"可诱导"启动子,它使人们能够控制参与核苷酸糖合成的糖基转移酶或酶的表达时间。本领域技术人员已知大肠杆菌和其它细菌宿主细胞的可诱导启动子。它们包括例如:lac启动子、细菌噬菌体λPL启动子、杂合的trp-lac启动子(Amann等(1983)Gene25:167;de Boer等(1983)Proc.Nat’l.Acad.Sci.USA80:21)和细菌噬菌体T7启动子(Studier等(1986)J.Mol.Biol.;Tabor等(1985)Proc.Nat’l.Acad.Sci.USA82:1074-8)。Sambrook等(同上)中讨论了这些启动子和它们的用途。特别优选的原核细胞表达可诱导启动子是双启动子,其包含连接于获自编码参与半乳糖代谢的酶的基因的启动子组件(如UDP半乳糖4-差向异构酶基因(galE)的启动子)的tac启动子组件。在PCT专利申请公开号WO98/20111中描述的双tac-gal启动子提供的表达水平高于单独一个启动子提供的表达水平。
本领域技术人员知道用于植物的可诱导启动子(参见例如,Kuhlemeier等(1987)Ann.Rev.Plant Physiol.38:221引用的参考文献),包括拟南芥(Arabidopsis thaliana)的1,5-二磷酸核酮糖羧化酶小亚基基因的启动子("ssu"启动子),它是光诱导的,只在光合组织中有活性。 
本领域技术人员也熟知其它生物的可诱导启动子,包括例如:阿拉伯糖启动子、lacZ启动子、金属硫蛋白启动子和热激启动子等。 
将包含操作性连接于当置于合适宿主细胞中时能驱动某感兴趣多核苷酸表达的基因表达控制信号的该多核苷酸的构建物称为“表达盒”。常常将编码本发明融合蛋白的表达盒置于表达载体中以引入宿主细胞。除表达盒外,载体一般包括使该载体能够在一种或多种选择的宿主细胞中独立复制的核酸序列。通常,此序列是使该载体能不依赖宿主染色体DNA复制的序列,包括复制源或自主复制序列。熟知各种细菌中的这种序列。例如,源自质粒pBR322的复制适合于大多数革兰阴性菌。或者,可使该载体整合入宿主细胞基因组互补区中随该细胞的DNA复制一起复制。用于在细菌中表达这些酶的优选表达载体是pTGK,它包含双tac-gal启动子,其描述见PCT专利申请公开号WO98/20111。 
也可能需要加入调控序列来调节与宿主细胞生长相关的多肽表达。调控系统的例子是对化学或物理刺激的反应中,包括调节化合物存在时引起基因表达打开或关闭的那些系统。原核系统中调节系统包括lac、tac和trp操纵子系统。酵母菌中,可采用ADH2系统或GAL1系统。在丝状真菌中,可采用TAKAα-淀粉酶启动子、黑曲霉葡糖淀粉酶启动子和米曲霉葡糖淀粉酶启动子作为调控序列。 
构建多核苷酸构建物通常需要采用能在细菌中复制的载体。可购得各种纯化细菌质粒的试剂盒(参见例如,EasyPrepJ,FlexiPrepJ,购自Pharmacia Biotech;StrataCleanJ,Stratagene;和QIAexpress表达系统,Qiagen)。然后,可进一步操作分离和纯化的质粒以产生其它质粒,用于转染细胞。也可能在链霉菌或芽孢杆菌中克隆。 
常常将选择性标记掺入到表达载体中用于表达本发明多核苷酸。这些基因可编码在选择性培养基中培养的转化宿主细胞存活或生长所必需的基因产物,如蛋白质。未转染含有选择基因的载体的宿主细胞不能在该培养基中存活。选择基因一般能编码产生对抗生素或其它毒素、如氨苄青霉素、新霉素、卡那霉素、氯霉素或四环素有抗性的蛋白。或者,选择性标记可编码能补充营养缺陷或提供不能从复合培养基中获得的必需营养物的蛋白,如编码芽孢杆菌D-丙氨酸消旋酶的基因。该载体常含 有一个在(例如)大肠杆菌或其它细胞中起作用的选择性标记,在这些细胞中复制该载体再引入宿主细胞。本领域技术人员知道许多选择性标记,它们的描述参见例如Sambrook等,同上。用于细菌细胞的优选选择性标记是卡那霉素抗性标记(Vieira和Messing,Gene19:259(1982))。采用卡那霉素选择优于(例如)氨苄青霉素选择,因为培养基中的β-内酰胺酶能快速降解氨苄青霉素,从而去除了选择压力,使培养基中不含该载体的细胞过度生长。 
构建含有一个或多个上述组分的合适载体可采用标准连接技术,如上面引用的参考文献所述。将分离的质粒或DNA片段切割、剪裁并以需要的形式再连接产生所需质粒。为了验证构建质粒的序列正确,可用标准技术如限制性核酸内切酶消化和/或用已知方法测序分析质粒。获得这些结果的分子克隆技术是本领域公知的。本领域技术人员熟知适合构建重组核酸的各种克隆和体外扩增方法。足以指导本领域技术人员进行许多克隆实践的技术和说明的例子参见Berger和Kimmel,《分子克隆技术指南,酶学方法》(Guide to Molecular Cloning Techniques,Methods in Enzymology),第152卷,Academic Press,Inc.,San Diego,CA(Berger);和《新编分子生物学实验指南》(Current Protocols in Molecular Biology),F.M.Ausubel等编,CurrentProtocols,Greene Publishing Associates,Inc.与John Wiley&Sons,Inc.的合资公司,(1998增刊)(Ausubel)。 
适合用作构建本发明表达载体的起始材料的各种常用载体是本领域熟知的。对于在细菌中克隆而言,常用载体包括pBR322衍生的载体如pBLUESCRIPTTM,和λ-噬菌体衍生的载体。酵母菌中,载体包括酵母整合质粒(如YIp5)和酵母复制质粒(Yrp系列质粒)和pGPD-2。可用各种常用质粒,包括pSV2、pBC12BI和p91023,以及裂解的病毒载体(如牛痘病毒、腺病毒和杆状病毒),附加型病毒载体(如牛乳头瘤病毒)和逆转录病毒载体(如小鼠逆转录病毒)实现在哺乳动物细胞中的表达。 
将表达载体引入所选择宿主细胞的方法不是特别重要的,本领域技术人员熟知这些方法。例如,可通过氯化钙转化将表达载体引入原核细胞,包括大肠杆菌,可通过磷酸钙处理或电穿孔引入真核细胞。其它转化方法也是合适的。 
翻译偶联可用于增强表达。该方法采用衍生自翻译系统中天然存在的高表达基因的短上游开放阅读框(位于启动子下游)和核糖体结合位点,一些氨基酸密码子之后是终止密码子。在终止密码子前是第二个核糖体结合位点,终止密码子后是启动翻译的起始密码子。该系统解散了RNA的二级结构,而有效启动了翻译。参见Squires等(1988),J Biol.Chem.263:16297-16302。
也可将本发明重组真核糖基转移酶进一步连接于其它细菌蛋白质。此方法常常导致高产量,因为由正常的原核控制序列指导转录和翻译。在大肠杆菌中,lacZ融合蛋白常常用于表达异源蛋白质。不难获得合适的载体,如pUR、pEX和pMR100系列(参见例如,Sambrook等,同上)。对于某些应用,可能需要在纯化后从融合蛋白上切除非糖基转移酶和/或辅酶氨基酸。这可通过本领域已知的任何方法,包括溴化氰、蛋白酶或Xa因子切割来实现(参见例如,Sambrook等,同上;Itakura等,Science(1977)198:1056;Goeddel等,Proc.Natl.Acad.Sci.USA(1979)76:106;Nagai等,Nature(1984)309:810;Sung等,Proc.Natl.Acad.Sci.USA(1986)83:561)。可将切割位点工程改造到融合蛋白基因中所需切割点上。 
通过在一种表达载体中置入多种转录盒,或对该克隆方法中所用的各表达载体采用不同选择性标记,可以在一种宿主细胞中表达一种以上重组真核糖基转移酶。 
Miller等Biotechnology7:698-704(1989)描述了从能保持蛋白质N-末端完整性的大肠杆菌中获得重组蛋白合适系统。在此系统中,产生的感兴趣基因是与含有肽酶切割位点的酵母泛素基因前76个残基融合的C末端融合基因。在这两部分连接处切割可产生具有完整的真正N-末端残基的蛋白质。 
可用熟知方法,如对大肠杆菌用氯化钙转化和对哺乳动物细胞用磷酸钙处理或电穿孔将本发明表达载体转移到选择的宿主细胞中。可利用质粒上所含基因如amp、gpt、neo和hyg基因赋予的抗生素抗性来选择质粒转化的细胞。 
VI.蛋白质和蛋白质纯化 
可根据本领域标准方法,包括硫酸铵沉淀、亲和柱、柱层析、凝胶电泳等纯化重组真核糖基转移酶蛋白(通常参见R.Scopes,《蛋白质纯化》(Protein Purification),Springer-Verlag,N.Y.(1982),Deutscher,《酶学方法》(Methods in Enzymology),第182卷:《蛋白质纯化指南》(Guide to Protein Purification),Academic Press,Inc。N.Y.(1990))。在优选实施方式中,在重折叠重组真核糖基转移酶蛋白之后纯化该蛋白。优选均一性至少约70-90%的基本纯组合物;更优选均一性至少91%、92%、93%、94%、95%、96%或97%;最优选均一性98-99%或更高。也可将纯化蛋白用作(例如)产生抗体的免疫原。 
为帮助纯化本发明的重组真核糖基转移酶蛋白,编码重组真核糖基转移酶蛋白的核酸也可包括亲和结合试剂可利用的表位或“标记”,即纯化标记的编码序列。合适表位的例子包括myc和V-5报道基因;可购得用于重组产生含有这些表位的融合蛋白的表达载体(如Invitrogen(Carlsbad CA)载体pcDNA3.1/V5-His适合于在哺乳动物细胞中表达)。本领域技术人员熟知适合将标记连接于本发明融合蛋白的其它表达载体和相应的检测系统,可购得其中几种(如″FLAG″(Kodak,Rochester NY)。合适标记的另一例子是聚组氨酸序列,它能够结合金属螯合亲和配体。一般采用六个毗连的组氨酸(SEQ ID NO:67),但也可采用多于或少于六个组氨酸。可用作聚组氨酸标记接合部分的合适金属螯合亲和配体包括次氮基-三乙酸(NTA)(Hochuli,E.(1990)“用金属螯合吸附剂纯化重组蛋白”(Purificationof recombinant proteins with metal chelating adsorbents),《基因工程:原理和方法》(Genetic Engineering:Principles and Methods),J.K.Setlow编,Plenum Press,NY;可购自Qiagen(Santa Clarita,CA))。 
纯化标记也包括麦芽糖结合域和淀粉结合域。本领域技术人员了解麦芽糖结合域蛋白的纯化。纳入本文作参考的WO 99/15636中描述了淀粉结合域。2003年5月5日提交的USSN 60/468,374中描述了用β环式糊精(BCD)-衍生的树脂亲和纯化含有淀粉结合域的融合蛋白,以全文纳入本文作参考。 
本领域技术人员知道适合用作标记的其它半抗原,参见(例如)《荧光探针和研究用化学物质手册》(Handbook of Fluorescent Probes and Research Chemicals)(第6版,Molecular Probes,Inc.,Eugene OR)的描述。例如,二硝基酚(DNP)、地高辛配基、巴比妥酸盐(参见例如,美国专利号5,414,085)和几种类型的荧光团以及这些化合物的衍生物可用作半抗原。可购得将半抗原和其它分子与蛋白质和其它分子连接的试剂盒。例如,当半抗原包括硫醇时,可用异质双功能接头如SMCC将该标记连接于捕获试剂上的赖氨酸残基。 
本领域技术人员知道,可对糖基转移酶催化结构域或功能域和/或辅酶催化结构域进行修饰,而不降低其生物学活性。一些修饰能有助于克隆、表达或将催化结构域掺入融合蛋白中。本领域技术人员熟知这些修饰,包括例如在编码催化结构域的多核苷酸的末端之一加入密码子,以(例如)在氨基末端加入甲硫氨酸以提供起始位点,或将氨基酸(如聚组氨酸)加在末端之一以产生方便定位的限制性酶切位点或终止密码子或纯化序列。 
VII.重折叠糖基转移酶的应用 
本发明提供了重组真核糖基转移酶蛋白和用重组真核糖基转移酶蛋白来酶促合成糖蛋白、糖脂和寡糖部分以及糖基PEG化糖蛋白的方法。本发明的糖基转移酶反应在含有至少一种糖基转移酶、受体底物和供体底物,一般还有可溶性二价金属阳离子的反应介质中进行。在一些实施方式中,还存在辅酶和辅酶催化部分的底物,而利用该辅酶可合成糖基转移酶的供体底物。本发明的重组真核糖基转移酶蛋白和方法依赖于采用重组真核糖基转移酶蛋白来催化使糖加在受体底物上。 
已知用糖基转移酶合成具有所需寡糖部分的糖蛋白和糖脂的许多方法。示范性方法的描述见(例如)WO96/32491,Ito等(1993)Pure Appl.Chem.65:753和美国专利5,352,670、5,374,541和5,545,553。 
如本文所述制备的重组真核糖基转移酶蛋白可与可能有或可能没有所需重折叠活性的其它糖基转移酶一起使用。例如,可将重折叠的重组真核糖基转移酶蛋白与从宿主细胞分离后可能已重折叠或未重折叠的细菌糖基转移酶联用。类似地,重组真核糖基转移酶可与可能是或可能不是融合蛋白一部分的重组辅酶一起使用。 
用上述方法产生的产物无需纯化即可使用。在一些实施方式中,产生寡糖。可用标准的熟知技术,例如薄层或厚层层析、离子交换层析或膜过滤来回收糖基化的糖。也可采用(例如)膜过滤、如通常指定的AU专利号735695中所述的纳米滤膜或反渗透膜。另外的例子是,可用分子量截留值约为1000-10,000的膜进行的膜过滤来去除蛋白质。另一个例子是,然后可用纳米滤膜或反渗透去除盐。纳米滤膜是一类能通过一价盐但截留多价盐和约200-1000道尔顿以上不带电溶质(这取决于所用膜)的反渗透膜。因此,例如,可将本发明组合物和方法产生的寡糖保留在膜中,而让污染的盐通过膜。 
VIII.供体底物/受体底物 
本发明的重组糖基转移酶融合蛋白和方法所用的合适供体底物包括但不限于:UDP-Glc、UDP-GlcNAc、UDP-Gal、UDP-GalNAc、GDP-Man、GDP-Fuc、UDP-GlcUA和CMP-唾液酸。Guo等,Applied Biochem.and Biotech.68:1-20(1997)。 
本发明的重组糖基转移酶融合蛋白和方法所用的合适受体底物包括但不限于:多糖、寡糖、蛋白质、脂质、神经节苷脂和可用本发明方法修饰的其它生物结构(如全细胞)。可用本发明方法修饰的示范性结构包括本领域技术人员已知的细胞上的许多糖脂、糖蛋白和糖结构,如表1所列。
表1 
  
激素和生长因子·G-CSF·GM-CSF·TPO·EPO·EPO变体·α-TNF·瘦激素 酶和抑制剂·t-PA·t-PA变体·脲激酶·凝血因子VII、VIII、IX、X·DNA酶·葡糖脑苷脂酶·水蛭素·α1抗胰蛋白酶·抗凝血酶III 细胞因子和嵌合细胞因子·白介素-1(IL-1)、1B、2、3、4·干扰素-α(IFN-α)·IFN-α-2b·IFN-β·IFN-γ·嵌合性白喉毒素-IL-2 受体和嵌合受体·CD4·肿瘤坏死因子(TNF)受体·α-CD20·MAb-CD20·MAb-α-CD3·MAb-TNF受体·MAb-CD4·PSGL-1·MAb-PSGL-1·补体·GlyCAM或其嵌合体·N-CAM或其嵌合体·LFA-3·CTLA-IV 单克隆抗体(免疫球蛋白)·MAb-抗RSV·MAb-抗IL-2受体·MAb-抗CEA·MAb-抗血小板IIb/IIIa受体·MAb-抗EGF·MAb-抗Her-2受体 细胞·红细胞·白细胞(如T细胞、B细胞、树突状细胞、巨噬细胞、NK细胞、嗜中性粒细胞、单核细胞等)·干细胞
Guo等,Applied Biochem.and Biotech.68:1-20(1997)描述了(但不限于)用于岩藻糖基转移酶催化反应的合适受体底物的例子,和用于唾液酸转移酶催化反应的合适受体底物的例子。
IX.糖基转移酶反应 
将重组真核糖基转移酶蛋白、受体底物、供体底物和其它反应混合物成分在水性反应介质中混合。培养基的pH值通常约5-8.5。培养基的选择是根据该培养基能否将pH值维持在所需水平。因此,在一些实施方式中,将该培养基缓冲到pH值约7.5。如果不用缓冲液,该培养基的pH应维持在约5-8.5,这取决于所用的具体糖基转移酶。对于岩藻糖基转移酶而言,pH范围优选维持在约6.0-8.0。对于唾液酸转移酶而言,该范围优选约5.5-7.5。 
酶的用量或浓度用活性单位表示,活性单位是催化起始速率的一种衡量。一个活性单位的酶每分钟在给定温度(如37℃)和pH值(如pH7.5)下催化形成1μmol产物。因此,10单位酶是在温度如37℃和pH值如7.5下在1分钟内将10μmol底物转化为10μmol产物的酶催化量。 
反应混合物可包括二价金属阳离子(Mg2+、Mn2+)。反应介质也可包含增溶去污剂(如Triton或SDS)和有机溶剂如甲醇或乙醇(如果需要)。可在溶液中使用游离形式的酶或可使酶结合于支持物如聚合物。因此,该反应混合物在开始时基本均一,但在反应期间可形成一些沉淀。 
进行上述过程的温度范围可以是恰好高于冻结温度至大部分敏感酶变性的温度。该温度范围优选为约0℃-45℃,更优选为约20℃-37℃。 
将这样形成的反应混合物保持足够时间以在连接于待糖基化糖蛋白寡糖基团上获得所需寡糖决定簇的所需高产率。为了大规模制备,该反应常常进行约0.5-240小时,更通常进行约1-18小时。 
一个或多个糖基转移酶反应可以作为糖基转移酶循环的一部分进行。已报道了糖基转移酶循环的优选条件和描述。美国专利号5,374,541和WO9425615A中描述了许多糖基转移酶循环(如唾液酸转移酶循环、半乳糖基转移酶循环和岩藻糖基转移酶循环)。其它糖基转移酶循环参见Ichikawa等,J.Am.Chem.Soc.114:9283(1992),Wong等,J.Org.Chem.57:4343(1992),DeLuca等,J.Am.Chem.Soc.117:5869-5870(1995)和Ichikawa等《糖和糖聚合物》(Carbohydrates and Carbohydrate Polymers),Yaltami编(ATL Press,1993)。 
在相似的转移酶循环中可替换的其它糖基转移酶,如岩藻糖基转移酶和唾液酸转移酶已有详述。具体说,糖基转移酶也可以是(例如)葡糖基转移酶如Alg8(Stagljov等,Proc.Natl.Acad.Sci.USA91:5977(1994))或Alg5(Heesen等,Eur.J.Biochem.224:71(1994)),N-乙酰半乳糖胺基转移酶如α(1,3)N-乙酰半乳糖胺基转移酶、β(1,4)N- 乙酰半乳糖胺基转移酶(Nagata等,J.Biol.Chem.267:12082-12089(1992)和Smith等,J.Biol Chem.269:15162(1994))和多肽N-乙酰半乳糖胺基转移酶(Homa等J.BiolChem.268:12609(1993))。合适的N-乙酰葡糖胺基转移酶包括GnTI(2.4.1.101,Hull等,BBRC176:608(1991))、GnTII和GnTIII(Ihara等J.Biochem.113:692(1993))、GnTV(Shoreiban等J.Biol.Chem.268:15381(1993))、O-连接的N-乙酰葡糖胺基转移酶(Bierhuizen等Proc.Natl.Acad.Sci.USA89:9326(1992))、N-乙酰葡糖胺-1-磷酸转移酶(Rajput等Biochem J..285:985(1992)和乙酰透明质酸合酶。合适的甘露糖基转移酶包括α(1,2)甘露糖基转移酶、α(1,3)甘露糖基转移酶、β(1,4)甘露糖基转移酶、Dol-P-Man合酶、OCh1和Pmt1。 
在上述糖基转移酶循环中,用于该过程的各种反应物的浓度或用量取决于许多因素,包括反应条件如温度和pH值,以及待糖基化的受体糖的选择和用量。因为该糖基化过程允许再生活化的核苷酸、活化的供体糖并清除在催化量的酶存在下所产生的PPi,所以上述化学计量底物的浓度或用量限制了该方法。可用于本发明方法的反应物浓度上限由该反应物的溶解性决定。 
所选择的活化核苷酸、磷酸供体、供体糖和酶的优选浓度应使糖基化进行到受体消耗光为止。以下讨论的唾液酸转移酶内容,通常可应用于其它糖基转移酶循环。 
各酶以催化用量存在。具体酶的催化用量视该酶的底物浓度以及反应条件如温度、时间和pH值而改变。本领域技术人员熟知在预先选择的底物浓度和反应条件下确定某给定酶催化用量的方法。 
X.多酶的寡糖合成 
如上所述,在一些实施方式中,可采用两种或多种酶在糖蛋白或糖脂上形成所需的寡糖决定簇。例如,特定的寡糖决定簇可能需要加入半乳糖、唾液酸和岩藻糖,才能显示所需活性。因此,本发明提供了用两种或多种酶如葡糖基转移酶、唾液酸转移酶或磺基转移酶来高产率合成所需的寡糖决定簇的方法。 
在特别优选的实施方式中,所用的一种酶是能磺化糖或肽的磺基转移酶。更优选的用磺基转移酶来制备选择素的配体(Kimura等,Proc Natl Acad Sci USA96(8):4530-5(1999))。 
在一些情况下,糖蛋白-或糖脂-连接的寡糖包括用感兴趣的特定糖基转移酶在体内生物合成糖蛋白或糖脂时的受体底物。可用本发明的重组糖基转移酶融合蛋白和方法来糖基化这类糖蛋白或糖脂,而无需事先分别修饰该糖蛋白或糖脂的糖基化模式。然而,在其它情况下,感兴趣的糖蛋白或糖脂将缺少合适的受体底物。在这种 情况下,可用本发明方法来改变该糖蛋白或糖脂的糖基化模式,以使该糖蛋白-或糖脂-连接的寡糖包括用于糖基转移酶-催化连接预先选择的感兴趣糖单元以形成所需寡糖部分的受体底物。 
首先,可任选地“修整”糖蛋白-或糖脂-连接的寡糖(全部或部分),以暴露糖基转移酶的受体底物或可加入一个或多个合适残基以获得合适的受体底物的部分。可利用酶如糖基转移酶和内切糖苷酶来连接和修整这些反应。例如,可用甘露糖苷酶修整显示“高甘露糖”型寡糖的糖蛋白,以获得在连接一个或多个预先选择的糖单元后能形成所需寡糖决定簇的受体底物。 
也可用该方法在天然形式的未糖基化蛋白质或脂质上合成所需寡糖部分。可将相应糖基转移酶的合适受体底物连接于这种蛋白质或脂质,然后用本发明方法糖基化。参见例如,美国专利号5,272,066中获得具有合适糖基化受体的多肽的方法。 
因此,在一些实施方式中,本发明提供了体外唾液酸化某糖偶联物上糖基团的方法,首先包括修饰该糖偶联物以产生合适的受体。 
XI.将修饰糖偶联于肽 
采用合适的酶介导的偶联将修饰糖偶联于糖基化或非糖基化的肽或蛋白质。所选择的修饰的供体糖、酶和受体肽或蛋白质的浓度,优选能使糖基化进行到受体被消耗光为止。下述唾液酸转移酶内容,通常可应用于其它糖基转移酶反应。 
用糖基转移酶合成所需寡糖结构的许多方法是已知的,它们通常可应用于本发明。示范性方法的描述参见例如WO96/32491,Ito等,Pure Appl.Chem.65:753(1993)和美国专利号5,352,670、5,374,541和5,545,553。 
在一些实施方式中,将内切糖苷酶与糖基转移酶一起用于此反应。在将修饰糖加在肽上之前或之后的任何时间用内切糖苷酶改变该肽的糖结构。 
在另一实施方式中,该方法利用一种或多种外切糖苷酶或内切糖苷酶。该糖苷酶一般是突变体,经工程改造形成糖基键,而非使这些键断开。突变的聚糖酶一般包括用一种氨基酸残基取代活性位点的酸性氨基酸残基。例如,当内切聚糖酶是内切-H时,被取代的活性位点残基一般是130位的Asp、132位的Glu或其组合。通常用丝氨酸、丙氨酸、天冬酰胺或谷胺酰胺进行氨基酸取代。 
突变酶能催化该反应,通常是类似于内切聚糖酶水解步骤逆反应的合成步骤。在这些实施方式中,糖基供体分子(如所需寡糖或单糖结构)含有离去基团,随着该反应的进行,将供体分子加到该蛋白质的GlcNAc残基上。例如,离去基团可以是卤素 如氟。在其它实施方式中,离去基团是Asn,或Asn-肽部分。在又一实施方式中,修饰了糖基供体分子上的GlcNAc残基。例如,GlcNAc残基可含有1,2噁唑啉部分。 
在优选实施方式中,用于产生本发明偶联物的各酶以催化用量存在。具体酶的催化用量视该酶的底物浓度以及反应条件如温度、时间和pH值而改变。本领域技术人员熟知在预先选择的底物浓度和反应条件下测定某给定酶催化用量的方法。 
进行上述过程的温度范围可以是恰好高于冻结温度至大部分敏感酶变性的温度。该温度范围优选为约0℃-55℃,更优选为约20℃-30℃。在另一示范性实施方式中,采用嗜热性酶在升高温度下进行本方法的一个或多个组分(合成)。 
将反应混合物保持足够时间以使受体糖基化、从而形成所需的偶联物。通常,可在数小时后检测到一些偶联物,而通常在24小时或更短时间内获得可回收量。本领域技术人员理解,该反应的速率取决于为优化选择系统的许多不同因素(如酶浓度、供体浓度、受体浓度、温度、溶剂体积)。 
本发明也提供了工业规模生产的修饰肽。本文所用的工业规模通常产生至少一克最终纯化偶联物。 
在以下讨论中,通过将修饰的唾液酸部分偶联于糖基化肽来说明本发明。用PEG标记该示范性修饰的唾液酸。以下讨论集中在PEG-修饰的唾液酸和糖基化肽的应用,这些讨论是为了说明,不意味着将本发明仅限于这对物质的偶联物。本领域技术人员理解,上述内容通常可用于加入修饰的糖基部分而非唾液酸。而且,上述内容可同等地应用于用除PEG外的物质包括其它水溶性聚合物、治疗部分和生物分子来修饰糖基单元。 
可用酶学方法将PEG化或PPG化的糖选择性引入肽或糖肽上。该方法采用含有PEG、PPG或掩蔽了活性功能基团的修饰糖,与合适糖基转移酶或糖合成酶混合。通过选择产生所需糖连接的糖基转移酶和将修饰糖用作供体底物,而将PEG或PPG直接引入到肽主链上,引入糖肽中的糖残基上或引入肽中已加有的糖残基上。 
唾液酸转移酶的受体存在于将用本发明方法修饰的肽上,该受体是天然产生的结构或通过重组方法、酶学方法或化学方法安置于此的结构。合适的受体包括例如:半乳糖基受体如Galβ1,4GlcNAc、Galβ1,4GalNAc、Galβ1,3GalNAc、乳糖-N-丁糖、Galβ1,3GlcNAc、Galβ1,3Ara、Galβ1,6GlcNAc、Galβ1,4Glc(乳糖)和本领域技术人员熟知的其它受体(参见例如,Paulson等,J.Biol.Chem.253:5617-5624(1978))。 
在一个实施方式中,唾液酸转移酶受体存在于体内合成糖肽时修饰的糖肽上。可用要求权利的方法唾液酸化这种糖肽,而无需事先改变该糖肽的糖基化模式。或者,可用本发明方法唾液酸化不包含合适受体的肽;首先用本领域技术人员知道的方法修饰该肽以使其包含受体。在示范性实施方式中,通过GalNAc转移酶的作用加入GalNAc残基。 
在示范性实施方式中,通过使半乳糖残基与连接该肽的合适受体如GlcNAc相连接来组装半乳糖基受体。该方法包括孵育该肽,用含有合适量的半乳糖基转移酶(如galβ1,3或galβ1,4)和合适的半乳糖基供体(如UDP-半乳糖)的反应混合物修饰该肽。使该反应基本进行完全,或者加入预先选择量的半乳糖残基终止该反应。本领域技术人员知道组装选择的糖受体的其它方法。 
在又一实施方式中,首先“修整”糖肽-连接的寡糖(全部或部分),以暴露唾液酸转移酶受体或可加入一个或多个合适残基以获得合适的受体。利用酶如糖基转移酶和内切糖苷酶(参见例如美国专利号5,716,812)来连接和修整反应。 
使修饰糖偶联于肽或蛋白质的方法参见例如:2001年10月10日提交的USSN60/328,523;2002年6月7日提交的USSN 60/387,292;2002年6月25日提交的USSN 60/391,777;2002年8月16日提交的USSN 60/404,249;和PCT/US02/32263;各自纳入本文作为参考用于所有目的。 
实施例
实施例1:重折叠在细菌中表达的大鼠肝ST3GalIII。
大鼠肝GST-ST3GalIII融合蛋白的重折叠 
将大鼠肝N-乙酰氨基乳糖苷α-2,3-唾液酸转移酶(ST3GalIII)克隆入pGEX-KT-Ext载体中在大肠杆菌BL21细胞中表达为GST-ST3-GalIII包含体。用GSH/GSSG氧化还原系统重折叠包含体。重折叠的酶GST-ST3-GalIII有活性,能将唾液酸转移到LNnT糖底物和脱唾液酸化糖蛋白如转铁蛋白和凝血因子IX。 
将ST3GalIII克隆入pGEX-XT-KT载体 
用以下引物进行PCR扩增后将大鼠肝ST3-GalIII基因克隆入pGEX-KT-Ext载体的BamH1和EcoR1位点中: 
正义:唾液酸5’Tm 5’-TTTGGATCCAAGCTACACTTACTCCAATGG(SEQID NO:68) 
反义:唾液酸3’全部 5’TTTGAATTCTCAGATACCACTGCTTAAGTC(SEQID NO:69) 
在大肠杆菌BL21细胞中表达GST-ST3GalIII 
将含有ST3GalIII GST融合基因的表达载体pGEX-ST3GalIII转化入化学感受态大肠杆菌BL21细胞中。挑单菌落,接种到5毫升含100μg/ml羧苄青霉素的LB培养基中,37℃振荡培养过夜。第二天,将1ml过夜培养物转移到1升含100μg/ml羧苄青霉素的LB培养基中。培养细菌直到OD620为0.7,然后将150μM IPTG(终浓度)加入培养基中。37℃培养细菌1至2小时以上,然后转移到室温中振荡培养过夜。离心收获细胞;将细菌沉淀重悬于PBS缓冲液中用French Press裂解。在Sorvall,SS34转头中10,000RPM4℃离心30分钟分离可溶性和不溶性组分。 
包含体的纯化 
将50ml Novagen洗涤缓冲液(20mM Tris.HCl,pH7.5,10mM EDTA,1%Triton X-100)加入不溶性组分,即包含体(IB′s)中。涡旋振荡不溶性组分以使沉淀重悬。离心悬浮的IB,如上用洗涤缓冲液重悬洗涤至少两次。回收洁净的沉淀物(IB)贮存在-20℃待用。 
重折叠包含体 
称取IB(144mg),溶解于Genotech IBS缓冲液(1.44ml)中。在Eppendorf离心管中4℃孵育重悬的IB1小时。在Eppendorf离心机中以最大转速离心去除不溶性物质。将溶解的IB稀释至4ml终体积。在含有环式糊精、聚乙二醇(PEG)、ND SB-201或GSH/GSSG氧化还原系统的重折叠缓冲液中测定GST-ST3GalIII的重折叠。通过吸入重折叠溶液快速稀释1ml溶解的IB,剧烈混合30-40秒,然后在4℃温和地搅拌2小时。用Pierce Slide-A-lyzers(MWCO:3.5kDa)以冰冷的PBS缓冲液或含有50mMTris.HCl,pH7.0;100mM NaCl;和1%甘油的缓冲液透析3ml等份重折叠GST-ST3GalIII溶液。透析后,用Vivaspin5K(VivaScience)浓缩器在Jouan离心机中4℃4,000rpm浓缩GST-ST3GalIII溶液3、6和12倍。 
重折叠和透析后,用SDS-聚丙烯酰胺凝胶电泳分析重折叠的GST-ST3GalIII蛋白。所有重折叠条件下都存在分子量约为63-64kDa的GST-ST3GalIII融合物。(数据未显示) 
用重折叠的GST-ST3GalIII唾液酸化寡糖 
用CE-LIF(毛细管电泳-激光诱导的荧光)进行以寡糖底物的酶学试验。测定了重折叠的ST3GalIII酶能否将唾液酸从CMP-NAN(胞苷5-一磷酸-β-D-唾液酸)转移到LNnT-APTS(乳糖-N-新丁糖-9-氨基芘1-4,6三磺酸)上形成LSTd-APTS(乳糖唾液酸-四糖-d-APTS)。在96孔微量滴定板中每孔100μl含有20mM MOPS,pH6.5;0.8mMCMP-NAN;22.1mM LNnT;25μM LNnT-APTS;2.5mM MnCl2的缓冲液中进行反应。通过加入20μl重折叠ST3GalIII在30℃孵育30分钟开始反应。用水作1-25倍稀释终止反应。根据厂商说明书以CE-LIF用N-CHO包被的毛细管分析稀释的反应物。活性计算为LNnT-APTS与LSTd-APTS的标准化峰面积之比。比较不同重折叠条件的结果见表2。用GSH/GSSG系统进行的两次额外试验见表3。 
表2.筛选不同折叠系统后GST-ST3-GalIII的活性。无需浓缩,直接测定蛋白。 
环式糊精    PEG    ND SB-201    GSH/GSSG
0           0      0            7.8U/L* 
*这里报告的活性是每L重折叠酶的单位数。 
表3.用GSH/GSSG系统进行两次单独的折叠试验后GST-ST3GalIII的活性。 
GSH/GSSG          浓缩倍数        活性 
重折叠试验1       12x             182U/L* 
重折叠试验2       40x             531U/L* 
*这里报告的活性是每L重折叠酶的单位数。 
用重折叠的GST-ST3 GalIII唾液酸化糖蛋白 
将20μL脱唾液酸转铁蛋白(2μg/μL)或脱唾液酸凝血因子IX(2μg/μL)加入到50μL含有50mM Tris,pH 8.0;和150mM NaCl,以及10μL 100mM的MnCl2;10μL200mM的CMP-NAN;和0.05%叠氮化钠的缓冲液中。将该反应混合物与30μL重折叠的GST-ST3GalIII一起30℃250rpm振荡孵育过夜或更长时间。停止反应后,在pH 7-3IEF(等电聚焦凝胶,Invitrogen)上分离唾液酸化蛋白质,根据厂商说明书用考马斯蓝染色。转铁蛋白和凝血因子IX都被GST-ST3GalIII唾液酸化。(数据未显示) 
融合于MBP标记的大鼠肝ST3GalIII的重折叠。 
将大鼠肝ST3GalIII克隆入pMAL-c2x载体中在大肠杆菌TB1细胞的包含体中表达为麦芽糖结合蛋白(MBP)融合蛋白MBP-ST3GalIII。重折叠的MBP-ST3GalIII有活性,能将唾液酸转移到糖底物LNnT和脱唾液酸糖蛋白如脱唾液酸转铁蛋白上。 
将ST3GalIII克隆入pMAL-c2x载体中 
用以下引物进行PCR扩增后将大鼠肝ST3-GalIII核酸克隆入pMAL-c2x载体中的BamH1和XbaI位点: 
正义:ST3BAMH1 5’-TAATGGATTCAAGCTACACTTACTCCAATGG(SEQID NO:70) 
反义:ST3XBA1 5’-GCGCTCTAGATCAGATACCACTGCTTAAGT(SEQ IDNO:71) 
将编码氨基酸28-374如ST3GalIII的主干区和催化结构域的核苷酸与MBP氨基酸标记融合。 
构建ST3GalIII的其它三种截短物并与MBP融合。这三种ST3GalIII(Δ73、Δ85、Δ86)插入物分别用以下引物通过PCR分离:5’引物(ST3 BamH1Δ73)TGTATCGGATCCCTGGCCACCAAGTACGCTAACTT(SEQ ID NO:72);(ST3BamH1Δ85)TGTATCGGATCCTGCAAACCCGGCTACGCTTCAGCCAT(SEQ IDNO:73);和(ST3 BamH1 Δ86)TGTATCGGATCCAAACCCGGCTACGCTTCAGCCAT(SEQ ID NO:74),与通用3’引物(ST3-Xho1)GGTCTCCTCGAGTCAGATACCACTGCTTAA(SEQ ID NO:75)配对。用BamHI和Xho1消化各PCR产物,亚克隆入BamHI-XhoI消化的pCWin2-MBPKanr载体中,转化入TB1细胞中,筛选正确的构建物。 
在以下条件下进行PCR反应。95℃1分钟一个循环。加入1μl缺口(vent)聚合酶。进行10轮下面的循环:94℃1分钟;65℃1分钟;72℃1分钟。最后72℃10分钟,将反应物冷却到4℃。 
所有ST3GalIII截短物重折叠后都有活性。用MBP Δ73ST3GalIII截短物进行下述试验。 
在大肠杆菌TB1细胞中表达MBP-ST3GalIII 
将pMAL-ST3GalIII质粒转化入化学感受态大肠杆菌TB1细胞中。从LB琼脂平板上挑出含有TB1/pMAL-ST3GalIII构建物的三个单菌落。在5ml补充有60μg/ml羧苄青霉素的LB培养基中37℃振荡培养这些菌落,直到液体培养物的OD620达到0.7。从各培养物中取出两个1ml等份,用于接种含有或不含500μM IPTG(终浓度)的新鲜培养基。37℃培养该培养物2小时。离心收获细菌细胞。在SDS和DTT存在下加热细胞沉淀制备全细胞裂解物。IPTG诱导MBP-ST3GalIII表达。(数据未显示) 
MBP-ST3GalIII的表达和包含体的纯化: 
将1ml等份的TB1/pMAL-ST3GalIII过夜培养物接种入0.5升含有50μg/ml羧苄青霉素的LB培养基中,培养到OD620为0.7。加入0.5mM IPTG诱导MBP-ST3GalIII表达,然后室温孵育过夜。第二天,离心收获细菌细胞。将细胞沉淀重悬于含有75mMTrisHCl,pH 7.4;100mM NaCl;和1%甘油的缓冲液中。用French Press裂解细菌细胞。离心(4℃,10,000rpm,Sorvall,SS34转头)30分钟分离可溶性和不溶性组分。在Sorvall,SS 34转头中4℃10,000RPM离心30分钟分离可溶性和不溶性组分。 
纯化包含体和利用GSH/GSSG重折叠MBP-ST3GalIII 
用上述GST-ST3GalIII融合蛋白所用的相同方法和缓冲液纯化和悬浮MBP-ST3GalIII包含体。用上述GSH/GSSG系统重折叠MBP-ST3GalIII。用Pierce蛇皮透析袋(MWCO:7kDa)以冰冷的65mM Tris.HCl pH 7.5,100mM NaCl,1%甘油透析重折叠的MBP-ST3GalIII酶。用Vivaspin5K(VivaScience)浓缩器在Jouan离心机中4℃4,000rpm将重折叠和透析的MBP-ST3GalIII浓缩3-14倍。用SDS-聚丙烯酰胺凝胶电泳分析重折叠的MBP-ST3GalIII蛋白。检测到81kDa的MBP-ST3GalIII。(数据未显示) 
MBP-ST3GalIII的酶活试验 
如上所述,测定重折叠MBP-ST3GalIII酶能否将唾液酸从CMP-NAN转移到LNnT-APTS而形成LSTd-APTS。重折叠的MBP-ST3GalIII酶有活性,能将唾液酸转移到LNnT-APTS上形成LSTd-APTS。(数据未显示) 
测定了重折叠的MBP-ST3GalIII酶将唾液酸从CMP-NAN转移到糖蛋白上的能力。如上所述测定了GST-ST3-GalIII酶将唾液酸转移到脱唾液酸转铁蛋白上。重折叠的MBP-ST3GalIII酶有活性,能将唾液酸转移到脱唾液酸转铁蛋白上。(数据未显示)虽然重折叠的GST-ST3GalIII和MBP-ST3GalIII酶具有相似的活性,能将唾液酸转移到可溶性寡糖受体分子,但是重折叠的MBP-ST3GalIII酶将唾液酸转移到糖蛋白受体分子的活性更高。 
重折叠MBP-ST3GalIII条件的附加试验 
用图1所示的条件重折叠MBP-ST3GalIII。在加入溶解的IB以启动重折叠反应之前混合缓冲液、氧化还原对和去污剂(如果使用)。以1/20稀释IB。用不同的氧化还原对,如摩尔比为1/4、4/1、1/10或5/5的胱胺2HCl/半胱氨酸也成功地进行了MBP-ST3GalIII的重折叠。(数据未显示) 
ST3GalIII酶活试验 
如上所述,测定重折叠的MBP-ST3GalIII酶能否将唾液酸从CMP-NAN转移到LNnT-APTS而形成LSTd-APTS。结果见图1。用条件8、11、13和16观察到重折叠的MBP-ST3GalIII活性最高。当重折叠规模扩大到5ml时,用条件8和16重折叠的MBP-ST3GalIII蛋白活性最高。(参见例如表4) 
表4 
条件         U/L折叠蛋白             U/gIB 
8            70                      37.0 
16           50                      40.5 
在直链淀粉柱上纯化MBP-ST3GalIII
混合5ml重折叠制剂中的重折叠MBP-ST3GalIII蛋白,以100mM TrisHCl pH7.4,100mM NaCl和1%甘油透析。将重折叠的MBP-ST3GalIII蛋白施加到直链淀粉柱上。大多数重折叠的MBP-ST3GalIII蛋白结合于直链淀粉柱,用10mM麦芽糖洗脱。洗脱图见图2。用LnNT试验测定MBP-ST3GalIII组分的酶活,见图3。 
用重折叠的MBP-ST3GalIII糖基PEG化脱唾液酸转铁蛋白: 
在230μl反应物中将脱唾液酸转铁蛋白(2mg/ml)与重折叠的100μlMBP-ST3GalIII的纯化组分一起在CMP-SA-PEG(10kDa,1.6mM)或CMP-SA-PEG(20kDa,1.06mM)存在下孵育。30℃进行糖基PEG化反应过夜或3天。从反应物中取出等份,在4-20%SDS-聚丙烯酰胺凝胶上分析。结果见图4。纯化的重折叠MBP-ST3GalIII将10或20K PEG化唾液酸转移到脱唾液酸转铁蛋白上。 
大规模MBP-ST3GalIII重折叠 
用以下方法制备大规模重折叠的MBP-ST3GalIII。 
在15ml培养管中将湿IB(470mg)溶于IB增溶缓冲液(13ml)中。IB增溶缓冲液包括以下组分:4M盐酸胍;100mM TrisHCl,pH9;和100mM NaCl。在IB增溶缓冲液中4℃温和振荡孵育IB约1小时。在1.5mL Eppendorf管中以最大转速4℃离心30分钟除去任何不溶性物质。将溶解的IB转移到干净的试管中,用280nm吸光度测定蛋白浓度。 
制备以下重折叠溶液,保存在4℃:55mM MES缓冲液,pH6.5;264mMNaCl;11mM KCl;0.055%PEG550;550mM精氨酸。在加入溶解的IB之前立即将0.3mM十二烷基麦芽糖苷(LM);0.1mM氧化性谷胱甘肽(GSSG);1mM还原性谷胱甘肽(GSH)加入缓冲液。在50ml无菌培养管中将2ml溶解的IB加入到43ml重折叠缓冲液中。将该培养管放置在摇杆振荡器(rocker-shaker)上,4℃温和振荡24小时。在透析管(MWCO:7kD)中以透析缓冲液(100mM Tris HCl,pH7.5;100mMNaCl;和5%甘油)透析重折叠蛋白两次(以10-20倍体积过量缓冲液)。 
分析大规模透析的重折叠MBP-GalIII的ST3GalIII活性,显示约为53.6U/g IB。 
实施例2:定点诱变人GnTI以促进重折叠。
截短的人N-乙酰葡糖胺基转移酶I(缺失了103个氨基末端氨基酸)在大肠杆菌中表达为麦芽糖接合融合蛋白(GnTI/MBP)。该融合蛋白不溶,而在包含体中表达。溶解和重折叠后,GnTI/MBP融合蛋白具有低活性。兔GnTI截短形式(缺失了105个氨基末端氨基酸)的晶体结构显示在活性位点附近有一个未配对的半胱氨酸残基(CYS123)。(参见例如,Unligil等,EMBO J.19:5269-5280(2000))。人GnTI中相应的未配对半胱氨酸鉴定为CYS121,用大小和化学特征相似的一系列氨基酸取代。所用氨基酸包括丝氨酸(Ser)、苏氨酸(Thr)、丙氨酸(Ala)和天冬氨酸(Asp)。此外,也制备了双突变体ARG120ALA,CYS121HIS。在大肠杆菌中表达突变的GnTI/MBP融合蛋白,重折叠,测定对糖蛋白的GnTI活性。 
用Stratagene的Quick Change定点诱变试剂盒进行诱变。用一些GnT1突变引入其它限制性位点。例如将ApaI位点(下划线,GG
Figure 191754DEST_PATH_GAB00000000000171277200151
CC
Figure 108894DEST_PATH_GAB00000000000171277200152
)引入GnT1ARG120ALA,CYS121HIS突变体,即CGC CTG→ 
Figure 826314DEST_PATH_GAB00000000000171277200153
C C 
Figure 221524DEST_PATH_GAB00000000000171277200154
(粗体表示改变)。用以下诱变的寡核苷酸产生双突变体:GnT1 R120A,C121H+,5’CCGCAGCACTGTTCGG 
Figure 35896DEST_PATH_GAB00000000000171277200155
CC 
Figure 858358DEST_PATH_GAB00000000000171277200156
CTGGACAAGCTGCTG 3’(SEQ ID NO:76);和GnT1 R120A,C121H-5’CAGCAGCTTGTCCAG 
Figure 125392DEST_PATH_GAB00000000000171277200157
GG 
Figure 324292DEST_PATH_GAB00000000000171277200158
CCGAACAGTGCTGCGG3’(SEQ ID NO:77)(粗体表示改变)。将AscI位点(下划线,GGCGC
Figure 930854DEST_PATH_GAB00000000000171277200159
)引入GnT1CYS121ALA突变体,即CTG→ (粗体表示改变)。用以下诱变的寡核苷酸产生GnT1 CYS121ALA突变体:GnT1C123A+5’AGCACTGTTCGGCGC 
Figure 678547DEST_PATH_GAB000000000001712772001511
CTGGACAAGCTGCTG 3’(SEQ ID NO:78);和GnT1C123A-5’CAGCAGCTTGTCCAG 
Figure 415559DEST_PATH_GAB000000000001712772001512
GCGCCGAACAGTGCT 3’(SEQID NO:79)。 
将大肠杆菌表达的突变蛋白的活性与杆状病毒表达的野生型GnT1的活性作比较。CYS121SER GNTI突变体在TLC试验中有活性。相反,检测不到CYS121THR突变体的活性,CYS121ASP突变体具有低活性。CYS121ALA突变体活性很高,基于秀丽新小杆线虫(C.elegans)GnT1蛋白(Gly14)的氨基酸序列的双突变体ARG120ALA,CYS121HIS也有活性,包括能将GlcNAc转移到糖蛋白。GnT1突变体的氨基酸序列和编码核酸序列见图7-11。 
制备第二种GnT1截短物并与MBP融合:MBP-GnT1(D35)。图35提供了MBP-GnT1融合蛋白的示意图,描述了截短物如Δ103或Δ35和Cys121Ser突变(上方)。此图下方提供了全长人GnT1蛋白。还在MBP-GnT1(D35)蛋白中制作了Cys121突变。 
两种融合蛋白都在大肠杆菌中表达,都具有重建RNA酶B糖蛋白的活性。图36提供了SDS-PAGE凝胶,右图显示重折叠的MBP-GnT1融合蛋白:MBP-GnT1(D35)C121A、MBP-GnT1(D103)R120A+C121H和MBP-GnT1(D103)C121A。左图显示两个不同批次(A1和A2)的重折叠MBP-GnT1(D35)C121A在不同时间点重建RNA酶B糖蛋白的活性。MBP-GnT1(D103)C121A也能重建RNA酶B糖蛋白。数据未显示。 
实施例3:GalT1与MPB的融合物。
构建了以下截短的牛GalT1与MBP的融合物:MBP-GalT1(D129)wt,(D70)wt或(D129C342T)。(全长牛序列参见例如,D′Agostaro等,Eur.J.Biochem.183:211-217(1989)和登录号CAA32695)。各构建物重折叠后有活性。全长牛GalT1蛋白的氨基酸序列见图30。图31为描述这些突变体的示意图,对照蛋白是GalT1(40)(S96A+C342T)。参见例如,Ramakrishnan等,J.Biol.Chem.276:37666-37671(2001)。 
在大肠杆菌菌株JM109中表达MBP-GalT1(D70)。用IPTG诱导过夜后,用French Press裂解细胞后分离不溶性沉淀物中的包含体。洗涤IB两次,然后溶于4MGndHCl,100mM NaCl,0.1M TrisHCl pH9.0中。在pH6.5用GSSH/GSH(10/1)稀释成重折叠缓冲液(1/20,0.1-0.2mg/ml蛋白质)进行重折叠,然后4℃孵育过夜,不振荡。重折叠的蛋白质以50mM TrisHCl pH8.0透析两次(MWCO:7kD)。将透析的MBP-GalT1(D70)蛋白加到直链淀粉柱上;洗涤;然后用10mM麦芽糖洗脱。 
用寡糖作为受体测定GalT1的活性。用HPLC/PAD(带脉冲安培计检测的高效液相色谱)进行该酶试验。GalTI酶用UDP-Gal(尿苷5’-二磷酸半乳糖)将LNT2(乳糖-N-丙糖-2)转变为LNnT(乳糖-N-新丁糖)的过程如下:该反应在含有6mM UDP-Gal、5mM LNT-2、5mM MnCl2和100μl重折叠酶的100μl50mM Hepes,pH7缓冲液中37℃进行60分钟。用水终止该反应(1:10稀释),离心通过10,000MWCO离心滤器。然后1:10稀释滤出液。采用Dionex DX-500系统和含有氢氧化钠缓冲液的CarboPacPA1柱作HPLC分析此稀释反应物。将样品产物峰面积与LNnT校正曲线作比较,根据该反应中每微升酶每分钟产生的LNnT量计算活性。 
用可溶性寡糖和糖蛋白(如RNA酶B)作为受体分子时,纯化的MBP-GalT1(D70)蛋白有活性。结果见图32和33。在RNA酶B重建试验中,将MBP-GalT1(D70)与对照蛋白GalT1(40)(S96A+C342T)相比较,对照蛋白是也在大肠杆菌中表达并重折叠的未融合的牛GalT1蛋白截短物。MBP-GalT1(D70)蛋白对RNA酶B糖蛋白的活性比GalT1(40)(S96A+C342T)高。MBP-GalT1(D129)截短物对RNA酶B糖蛋白的活性也比GalT1(40)(S96A+C342T)蛋白高。(数据未显示) 
测定重折叠和纯化的MBP-GalT1(D70)蛋白糖基化RNA酶B的动力学,并与NSO GalT1比较,NSO GalT1是在哺乳动物细胞体系中表达的牛GalT1蛋白的可溶形式。如图34所示,与NSO GalT1蛋白相比,重折叠和纯化的MBP-GalT1(D70)动力学有所改进。 
实施例4:重析叠多种糖基转移酶的单罐方法。
真核ST3GalIII、GalT1和GnT1酶在糖蛋白上建立了N-聚糖链。可用CMP-NAN-PEG作为供体底物进行其它修饰,例如糖基PEG化。一般在真核表达系统如真菌或哺乳动物细胞中表达真核ST3GalIII、GalT1和GnT1酶。 
在一个容器中将各自与麦芽糖结合蛋白(MBP)结构域融合的真核ST3GalIII、GalT1和GnT1酶一起溶解、混合和重折叠。与MBP融合的重折叠酶有活性,可用于将N-聚糖加到糖蛋白或糖基PEG化糖蛋白。重折叠缓冲液包含氧化还原对,如氧化/还原性谷胱甘肽(GSH/GSSG)。通过加入精氨酸和聚乙二醇3350(PEG)促进重折叠。IB可单独溶解以不同比例加入重折叠缓冲液中;或者IB可一起溶解直接加入重折叠缓冲液中。也可利用MBP融合标记一步纯化或固定这些酶。 
制备重折叠的糖基转移酶混合物(SuperGlycoMix) 
制备糖基转移酶IB 
用于产生真核ST3GalIII、GalT1和GnT1酶的细菌菌株见表5。该表也显示了MBP融合蛋白的估计分子量。(MW根据氨基酸组成,Vector NTI软件)。编码真核酶的所有核酸都用IPTG可诱导的表达载体表达。 
表5 
菌株/构建物                                    表达的蛋白质(IBS)    MW(kD)
JM109/pCWori-MBP-GaT1(Δ129)C342T               MBP-GalT1(Δ129)C342T   74.2 
JM109/pCWIN2-MBP-GnT1(Δ103)C121A               MBP-GnT1(Δ103)C121A    82.4 
TB1/pMAL-ST3GalIII                             MBP-ST3GalIII           82 
用IPTG诱导大肠杆菌培养物后,用French Press或去污剂裂解细胞分离含有GnT1、GalT1和ST3GalIII酶的IB(Novagen的Bugbuster试剂)。如上所述,离心后回收沉淀,继续获得IB。用Novagen的IB洗涤缓冲液洗涤IB至少两次。将洗涤的IB储存在-20℃,直到用于重折叠试验。 
将含有ST3GalIII、GalT1或GnT1的IB单独溶于含有6M盐酸胍、50mM TrisHClpH8.0,5mM EDTA,10mM DTT的缓冲液中,4℃1小时。离心(Eppendorf微量离心机的最大转速)后获得清澈的上清。通过测定280nm吸光度测定溶解的IB中蛋白质含量。根据各MBP-糖基转移酶的消光系数确定表6蛋白质的含量。用VectorNTi软件计算消光系数(参见表5) 
表6.溶解的IB中蛋白质浓度。 
蛋白质                1mg/ml的A280         mg/ml
MBP-ST3GalIII        1.49                  4.23
MBP-GalT1(Δ129)C342T                 1.39               6.80 
MBP-GnT1(Δ103)C121A                  1.7                3.29 
糖基转移酶的单罐重折叠 
等量混合溶解的IB,如表7所示。 
表7.在重折叠前按以下量混合溶解的IB。 
蛋白质                           V(mL)       mg      占总蛋白的%
MBP-ST3GalIII                    0.8         3.4         36 
MBP-GalT1(Δ129)C342T             0.5         3.4         36 
MBP-GnT1(Δ103)C121A              0.8         2.6         28
总计                             2.1         9.4         100 
溶解的IB混合物的总蛋白浓度是4.5mg/ml。用重折叠缓冲液稀释该混合物约20倍,使总蛋白混合物的终浓度为0.22mg/mL。重折叠缓冲液含有55mM MES,pH6.5;550mM精氨酸;0.055%PEG3350;264mM NaCl;11mM KCl;1mM GSH;和0.1mM GSSG。也可在含有Tris HCl,pH8.2的缓冲液中进行重折叠,可用半胱氨酸/胱胺氧化还原对替换GSH/GSSG。用重折叠缓冲液稀释IB混合物,4℃孵育过夜(16-18小时)。估计重折叠反应物中糖基转移酶的浓度为: 
MBP-ST3GalIII              0.081mg/mL 
MBP-GalT1(Δ129)C342T       0.081mg/mL 
MBP-GnT1(Δ103)C121A        0.062mg/mL 
重折叠过夜后,透析重折叠的糖基转移酶混合物除去离液剂(即盐酸胍)。在透析袋(蛇皮,MWCO:7kD,Pierce)中以50mM TrisHC1pH8.0,4℃(每次透析20倍)透析两次。用VivaSpin6mL(MWCO:10kD)离心浓缩器将透析后的重折叠糖基转移酶混合物(Superglycomix,SGM)浓缩6倍。浓缩后,如SDS-PAGE分析测定,所有三种糖蛋白都存在于混合物中。(数据未显示)。浓缩SGM后,测定GnT1、GalT1和ST3GalIII的酶活。 
SuperGlycoMix的酶活 
Superglycomix(SGM),单罐重折叠糖基转移酶混合物含有三种糖基转移酶:ST3GalIII、GalT1和GnT1。分别测定这些酶的酶活,用以下方法分析。酶活见表8。 
ST3 GalIII酶活试验
用HPLC/UV(带紫外线检测的高效液相色谱)进行ST3GalIII试验。ST3GalIII酶用CMP-NAN(胞苷5’-一磷酸-β-D-唾液酸)将LNnT(乳糖-N-新丁糖)转变为LSTd(乳糖唾液酸-四糖-d)的过程如下。在96孔微量滴定板中含有2mM CMP-NAN、30mMLNnT、10mM MnCl2和20μl重折叠酶的100μl20mM MOPS,pH6.5缓冲液中30℃反应120分钟。加热到98℃1分钟终止反应。3600rpm离心微量滴定板10分钟形成沉淀。用75μl水1:1稀释75μl上清液。用含有磷酸钠缓冲液/乙腈梯度液的YMC-Pack聚胺II柱以LC/UV分析稀释的反应物,在200nm处检测。将样品产物峰面积与LSTd校正曲线作比较,根据反应中每分钟每微升酶产生的LSTd量计算活性。 
GalTI酶活试验: 
用HPLC/PAD(带脉冲安培计检测的高效液相色谱)进行酶试验。GalTI酶用UDP-Gal(尿苷5’-二磷酸半乳糖)将LNT2(乳糖-N-丙糖-2)转变为LNnT(乳糖-N-新丁糖)的过程如下。该反应在含有6mM UDP-Gal、5mM LNT-2、5mM MnCl2和100μl重折叠酶的100μl50mM Hepes,pH7缓冲液中37℃进行60分钟。用水终止该反应(1-10倍稀释),离心通过10,000MWCO离心滤器。然后1:10稀释滤出液。采用Dionex DX-500系统和含有氢氧化钠缓冲液的CarboPac PA1柱作HPLC分析此稀释反应物。将样品产物峰面积与LNnT校正曲线比较,根据反应中每微升酶每分钟产生的LNnT量计算活性。 
GnTI酶活试验: 
通过测定将氚化糖从UDP-3H-GlcNAc(尿苷二磷酸N-乙酰-D-葡糖胺[6-3H(N)])转移到正辛基3,6-二-O-(α-吡喃甘露糖基)β-D-吡喃甘露糖苷(OM3)(具有辛基尾的三甘露糖基核心)测定GnTI的活性。在含有3mM UDP-GlcNAc,0.1mMUDP-3H-GlcNAc,0.5mM OM3,20mM MnCl2和10μl重折叠酶的20μl100mMMES,pH6.0缓冲液中37℃反应60分钟。用水终止该反应(1:6稀释),将反应物施加到事先按厂商推荐条件化的96孔中的聚合性反相树脂上。用200μl水洗涤树脂两次,用50μl100%MeOH将产物洗脱到捕获板(capture plate)中。各孔中加入闪烁液(200u L),混合该板,用PerkinElmer TopCount NXT微量板闪烁计数器计数。根据反应中每微升酶每分钟掺入产物的3H-GlcNAc量计算活性。 
表8.SGM中重折叠糖基转移酶的酶活 
酶活                         mU/mL
GnT1                         1
GalT1                           165 
ST3GalIII                       10 
上表报道的活性接近这些酶分别重折叠时的活性或在其活性范围内。GnT1和GalT1活性接近用哺乳动物或杆状病毒表达系统获得的活性。ST3GalIII活性稍低于真菌表达系统获得的ST3GalIII制剂活性。对本文所用的ST3GalIII试验步骤进行修饰,本文报道的值比CE-LIF(毛细管电泳-激光诱导的荧光)方法获得的值低约4-5倍。 
用Superglycomix重建RNA酶B-Man5 
用SGM在UDP-糖(UDP-GlcNAc和UDP-Gal)存在下重建含有一个N连接Man5糖的RNA酶B的小糖蛋白。用UDP-GlcNAc或者UDP-GlcNAc和UDP-Gal进行此重建反应,以测定GnT1和GalT1的活性。将8μl SGM加入到含有5mMUDP-GlcNAc和/或5mM UDP-Gal,9μg RNA酶BMan5,5mM MnCl2的10mMMES缓冲液pH6.5中形成25μl试验溶液,33℃孵育过夜至48小时。在反应结束时,以H2O透析10μl等份,将1.5μl样品点样到MALDI-TOF平板上。用TFA和肉桂酸(cinnapinic acid)处理后在MALDI-TOF上分析样品。 
通过将GlcNAc和Gal转移到RNA酶B的Man5上重建了RNA酶Bman5。33℃孵育48小时后,大部分GlcNAc和Gal转移到RNA酶B上,如重建的RNA酶BMan5的MALDI-TOF谱所示。表9小结了结果。 
表9.SGM反应后物质的MALDI-TOF谱。 
                                 m/z 
                                 RNA酶B 
反应                          Man 5     Man 5 -GlcNAc   Man 5 GlcNAc-Gal
无酶                          14983   -               - 
SGM+UDP-GlcNAc                14973   15177           - 
SGM+UDP-GlcNAc+UDP-Gal        14982   15170           15348 
用SGM糖基PEG化EPO重建 
在以下成分组成的单罐反应中进行糖基PEG化(20K):10mM MES pH6.5,5mM MgCL2.5mM UDP-GlcNAc,5mM UDP-GalNAc,0.5mM CMP-SA-PEG(20kDa),24μg EPO,8μL浓缩的SGM。在对照反应中,用在哺乳动物细胞或昆虫细胞或曲霉中重折叠或表达的一种酶替换SGM。孵育过夜后,在SDS-聚丙烯酰胺凝胶上分析反应物。结果见图5。SGM将20K PEG加在EPO上。 
评价多种糖基转移酶的单罐重折叠条件
评价重折叠多种糖基转移酶的条件,包括pH,和一次重折叠两种或三种酶。 
糖基转移酶包含体的制备 
以前描述了用糖基转移酶表达质粒转化的大肠杆菌菌株,有一个例外。在JM109细胞中表达pCWori-ST3GalIII质粒中的MBP-ST3GalIII。如上所述分离并溶解包含体。如上所述评估了蛋白质含量,如表10所示。 
表10.重折叠前按以下用量混合溶解的IB。 
蛋白质                 A280       A280(1mg/ml)    mg      %(溶解的蛋白)
MBP-ST3GalIII          32.3       1.49            21.7    13.6 
MBP-GalT1(Δ129)C342T   35.7       1.39            25.7    13.7 
MBP-GnT1(Δ103)C121S    42.8       1.7             25.2    9.7 
糖基转移酶IB混合物的单罐重折叠 
测定蛋白质含量后,用重折叠缓冲液稀释前按所示量(表11)混合溶解的IB。在44ml体积中用缓冲液A或B(见下)和0.1mM GSSG和1mM GSH在4℃静置地进行GT的重折叠试验。缓冲液A:55mM MES pH6.5、550mM精氨酸、0.055%PEG3350、264mM NaCl、11mM KCl,补充有1mM GSH、0.1mM GSSG。缓冲液B:55mMTrisHCl pH8、550mM精氨酸、0.055%PEG3350、264mM NaCl、11mM KCl,补充有1mM GSH、0.1mM GSSG。 
表11.在2mL IBSB中溶解的GT IB的混合量 
在缓冲液A中重折叠 
重折叠1(A-2x)                          浓度(mg/mL)        V(mL)          mg
MBP-GnT1(Δ103)C121S                    25.2               0.2            5 
MBP-GalT1(Δ129)C342T                   25.7               0.2            5 
IBSB                                    -                  1.6            - 
重折叠2(A-3x)                          浓度(mg/mL)        V(mL)           mg
MBP-GnT1(Δ103)C121S                    25.2               0.2             5 
MBP-GalT1(Δ129)C342T                   25.7               0.2             5 
MBP-ST3GalIII                          21.7               0.4             8.7 
IBSB                                    -                 1.2              - 
在缓冲液B中重折叠 
重折叠3(B-2x)                        浓度(mg/mL)           V(mL)           mg
MBP-GnT1(Δ103)C121S             25.2                0.2             5 
MBP-GalT1(Δ129)C342T            25.7                0.2             5 
IBSB                            -                   1.4             - 
重折叠4(B-3x)                   浓度(mg/mL)         V(mL)           mg
MB-GnT1(Δ103)C121S              25.2                0.2             5 
MBP-GalT1(Δ129)C342T            25.7                0.2             5 
MBP-ST3GalIII                   21.7                0.4             8.7 
IBSB                            -                   1.2 
对于双重折叠(2x,两种糖基转移酶)而言,将2ml10mg总蛋白加入41mL重折叠缓冲液(上述),其含有0.45mL100mM GSH,0.45mL10mM GSSG。稀释后总蛋白是0.44mg/ml。对于三重折叠(3x,三种糖基转移酶)而言,将2ml18.7mg总蛋白加入41mL重折叠缓冲液(上述),其含有0.45mL100mM GSH,0.45mL10mMGSSG。稀释后总蛋白是0.83mg/ml。蛋白质浓度高于先前的三重折叠试验(在SGM中0.22mg/ml)。估计重折叠反应中糖基转移酶的浓度如下: 
MBP-ST3GalIII               0.39mg/mL 
MBP-GalT1(Δ129)C342T       0.23mg/mL 
MBP-GnT1(Δ103)C121S        0.23mg/mL 
重折叠过夜后,透析重折叠的糖基转移酶混合物。在透析袋(蛇皮,MWCO:7kD,Pierce)中以50mM TrisHCl pH8.0,4℃透析两次。透析后,用6mLVIVA-Spin(MWCO:10K)离心浓缩器将该糖基转移酶混合物浓缩9-12倍。 
SDS-PAGE分析证明,经重折叠、透析和浓缩后存在该蛋白质。 
重折叠的糖基转移酶混合物的酶试验 
如上所述进行酶试验。结果见表12。
表12.双重和三重折叠试验后重折叠的糖基转移酶的酶活。 
  
折叠浓缩倍数 酶活 mU/mL
缓冲液A(A-2x) GnT1GalT1 0.84598
缓冲液A(A-3x) GnT1GalT1ST3GalIII 0.163064
缓冲液B(B-2x) GnT1GalT1 3.32747
缓冲液B(B-3x) GnT1GalT1ST3GalIII 0.4742511
等量混合并在缓冲液B中重折叠的与MBP融合的GnT1和GalT1观察到最高活性。加入不等量的与MBP融合的ST3GalIII由于总蛋白高而影响了重折叠效率。然而,采用两种GT或三种GT的两种不同重折叠缓冲液可用于获得有活性的可溶性蛋白。 
实施例5:重折叠真核GalNAcT2。
在大肠杆菌中表达截短的人GalNAcT2酶,用于确定用上述方法溶解和重折叠的最佳条件。图13A和B中提供了全长人GalNAcT2核酸和氨基酸序列。突变蛋白GalNAcT2(D51)的序列见图14A和B。该突变体在大肠杆菌中表达为MBP融合蛋白MBP-GalNAcT2(D51)。制备其它GalNAcT2突变体,在大肠杆菌中表达,并能够重折叠:MBP-GalNAcT2(D40)、MBP-GalNAcT2(D73)和MBP-GalNAcT2(D94)。数据未显示。构建其它缺失突变体的详述参见2004年6月3日提交的USSN60/576,530和2004年8月3日提交的USSN60/598,584,都纳入本文作为参考用于所有目的。 
如上所述培养和收获表达MBP-GalNAcT2(D51)的细菌培养物。如上所述纯化细菌包含体。在pH6.5或pH8.0溶解包含体。溶解后,用缓冲液A和B在pH6.5或pH8.0重折叠MBP-GalNAcT2(D51)蛋白,缓冲液A:55mM MES pH6.5、550mM精氨酸、0.055%PEG3350、264mM NaCl、11mM KCl,补充有1mM GSH、0.1mMGSSG;缓冲液B:55mM TrisHCl pH8、550mM精氨酸、0.055%PEG3350、264mMNaCl、11mM KCl,补充有1mM GSH、0.1mM GSSG。重折叠后,透析MBP-GalNAcT2(D51)蛋白,然后浓缩。图15说明了在pH6.5或pH8.0溶解和在pH6.5或pH8.0重折叠后重折叠的MBP-GalNAcT2(D51)的蛋白浓度。
通过监测将放射标记的GalNAc加到肽受体上进行放射性标记[3H]-UDP-GalNAc试验来测定大肠杆菌表达的重折叠MBP-GalNAcT2(D51)的活性。该受体是具有序列MVTPTPTPTC(SEQ ID NO:80)的MuC-2-样肽。将该肽溶于1MTris-HCl pH=8.0。参见例如,2004年6月3日提交的USSN 60/576,530;和2004年8月3日提交的美国临时专利申请律师案卷号040853-01-5149-P1;都纳入本文作为参考用于所有目的。图16说明了在pH 6.5或pH 8.0溶解和在pH 6.5或pH 8.0重折叠后重折叠的MBP-GalNAcT2(D51)的酶活。图17说明了在pH 6.5或pH 8.0溶解和在pH 6.5或pH 8.0重折叠后重折叠的MBP-GalNAcT2(D51)的特异性活性。在pH 8.0溶解和在pH 8.0重折叠时观察到MBP-GalNAcT2(D51)的活性水平最高。在pH 8.0溶解和在pH 8.0重折叠时观察到的特异性活性水平也最高。 
测定溶解和重折叠的MBP-GalNAcT2(D51)能否将GalNAc加到G-CSF蛋白上。该试验由等份酶和反应缓冲液(27mM MES,pH=7,200mM NaCl,20mM MgCl2,20mM MnCl2和0.1%吐温80),G-CSF蛋白(2mg/ml的H2O溶液)和100mMUDP-GalNAc组成。对于各重折叠样品,将4.4μL样品加入15μL反应溶液中。对于阳性对照而言,将1μL标准GalNAcT2杆状病毒以及3.4μL H2O加入到一个试管中。在旋转摇床上32℃孵育反应物数天,期间在过夜时间点和5天时间点上用MALDI测定。参见例如,2004年6月3日提交的USSN 60/576,530;和2004年8月3日提交的美国临时专利申请律师案卷号040853-01-5149-P1;都纳入本文作为参考用于所有目的。 
图18A和18B提供了在pH 6.5或pH 8.0溶解和在pH 6.5或pH 8.0重折叠后用重折叠的MBP-GalNAcT2(D51)重建重组粒细胞集落刺激因子(GCSF)的结果。包括阳性对照,即纯化的在杆状病毒中表达的MBP-GalNAcT2(D51)和阴性对照,即缺少底物的反应混合物。用在pH 8.0溶解和在pH 8.0重折叠的MBP-GalNAcT2(D51)观察到GCSF重建活性水平最高。 
实施例6:重折叠和纯化真核GalNAcT2。
培养并收获4升表达重组MBP-GalNAcT2(D51)的细菌。分离包含体,洗涤,在4℃将干重2克的包含体溶解于200mL增溶缓冲液(7M尿素/50mM Tris/10mM DTT/5mMEDTA,pH 8.0)中。溶解后,将混合物稀释到4L重折叠缓冲液(50mM Tris/550mM L-精氨酸/250mM NaCl/10mM KCl/0.05%PEG 3350/4mM L-半胱氨酸/1mM二盐酸胱胺,pH8.0)中。4-10℃重折叠约20小时,不停搅拌。然后用10SP CUNO滤器过滤混合物,在4ft2膜上浓缩5倍,用10mM Tris/5mM NaCl,pH 8.0透析4次。最终重折叠MBP-GalNAcT2(D51)溶液的电导率是1.4mS/cm。重折叠蛋白质4℃可贮存数天。 
将重折叠蛋白质施加于Q琼脂糖XL(QXL)柱(Amersham Biosciences,Piscataway,NJ)上。洗脱图见图19,特定柱组分的酶活见图20。合并活性组分施加到I型羟基磷灰石(80μm)(BioRad,Hercules,CA)柱上。洗脱图见图21,I型HA洗脱组分的活性见图22。联用QXL和I型HA层析产生了有活性、高度纯化的MBP-GalNAcT2(D51)。 
实施例7:纯化真核MBP-SBDST3Gal3。
将Δ73ST3GalIII截短物框内融合于麦芽糖结合蛋白和淀粉结合域形成双标记蛋白:MBP-SBD-ST3Gal3(Δ73)。MBP位于氨基末端,然后是SBD,然后是截短的ST3GalIII蛋白。比较MBP-SBD-ST3Gal3(Δ73)蛋白的重折叠和纯化与单标记蛋白MBP-ST3GalIII(Δ73)。在大肠杆菌中两种蛋白表达为不溶性包含体,如本文所述溶解、重折叠。然后,对蛋白质进行透析并用结合MBP和SBD标记的环式糊精柱亲和纯化。结果见图23。透析后MBP-SBD-ST3Gal3(Δ73)蛋白特异性活性较高,用环式糊精从柱上洗脱后保留了更多的特异性活性。 
实施例8:重折叠MBP-ST3Gal1和MBPSBD-ST3Gal1蛋白
将真核ST3Gal1与MPB或MBP和SBD融合。用猪ST3Gal1基因的DNA序列作为设计本文所述pcWINMBP-pST3Gal1和pcWINMBP/SBD-pST3Gal1构建物的模板。全长猪ST3Gal1序列见图37。为了在大肠杆菌中表达,优化密码子,采用截短的pST3Gal1,即pST3Gal1Δ45。编码氨基酸序列见图24。接着消化ST3Gal1基因编码序列,利用BamHI和XhoI克隆位点转移到pcWIN2-MBP和pcWINMBP/SBD载体。通过限制性酶切和序列分析证实了这些构建物正确,然后用于转化大肠杆菌菌株JM109,采用50μg/ml卡那霉素选择。用各构建物的单菌落接种2ml Maritone培养基-10μg/ml卡那霉素,37℃培养16小时。将各培养物分别与50%甘油1:1混合,-80℃冷冻,称为储存小瓶。取各储存小瓶中少量划线Maritone-Kan平板。37℃培养16小时后,用各平板的单菌落接种25ml Maritone培养基-10μg/ml卡那霉素,37℃培养16小时。然后用25ml培养物接种1L Maritone培养基-10μg/ml卡那霉素,37℃培养并监测OD600。当OD600达到0.8时,加入1mM IPTG,再培养细胞16小时。然后7000xG离心15分钟收获细胞。 
然后分离包含体,溶解ST3Gal1融合蛋白,并重折叠。按每10mL20mM TrispH8,5mM EDTA1g湿细胞沉淀物的比例重悬细菌细胞沉淀,两次通过微流化床机 械破坏裂解细胞。在Sorvall RC3中7000xg4℃离心30分钟沉淀不溶性物质即包含体或IB,弃去上清。洗涤循环一般由用洗涤缓冲液完全重悬沉淀和重复离心15分钟组成。用过量体积(每克初始细胞沉淀至少10mL(高达20毫升))的高盐缓冲液(洗液I:10mM Tris pH7.4,1M NaCl,5mM EDTA)洗涤沉淀一次,用去污剂缓冲液(洗液II:25mM Tris pH8,100mM NaCl,1%Triton X100,1%去氧胆酸钠,5mM EDTA)洗涤一次,用洗涤缓冲液(洗液III:10mM Tris pH8,5mM EDTA)洗涤三次(除洗涤IB外还去除痕量去污剂)。 
将洗涤后的IB重悬于增溶缓冲液(8M尿素,50mM BisTris pH6.5,5mMEDTA,10mM DTT)中,将蛋白质浓度调整为2mg/ml。重折叠方法如下:用重折叠缓冲液(55mM Tris pH8.2,10.56mM NaCl,0.44mM KCl,2.2mM MgCl2,2.2mMCaCl2,0.055%PEG3350,550mM L-精氨酸,1mM GSH,100mcM GSSG)快速稀释20倍,4℃搅拌16小时。然后用G50Sephadex脱盐将缓冲液换成50mM BisTris pH6.5,75mM NaCl,0.05%吐温80。 
为测定重折叠酶是否有活性,进行唾液酸转移酶试验。用放射性标记的CMP-NAN监测唾液酸向供体(脱唾液酸-牛下颚粘蛋白)的转移。用杆状病毒系统中表达的鸡ST6GalNacl作为阳性对照。 
简要说,将40μL反应混合物加入10μL酶样品中,37℃孵育1小时。将100μL磷钨酸/15%TCA加入反应物中搅拌沉淀糖蛋白。离心后,吸干并弃去上清。加入500μL5%TCA洗涤沉淀中未掺入的CMP-14C-唾液酸。再次离心反应物,吸干并弃去上清。用100μL10N NaOH重悬沉淀。将1mL1M Tris缓冲液,pH7.5加入重悬的沉淀中,然后将混合物转移到闪烁小瓶中。加入5mL闪烁液(Ecolume,ICN Biomedicals)充分混合。将40μL反应混合物加入闪烁小瓶并加入100μL10N NaOH,1mL水和5mL闪烁液,充分混合测定加入反应的总计数。小瓶计数1分钟。反应条件见表13。
表13 
  
试剂 生产商 目录号 每试管的量 试验中的终浓度
CMP[14C]唾液酸 Amersham CFB-165 4μL 100,000CPM
7mM CMP-唾液酸 Neose AES533pg.42 1.4μL 0.2mM
25mg/mL脱唾液酸-牛下颚粘蛋白 Sigma,在Neose水解 M-3895 20μL 250-500μg
1M Bis/Tris缓冲液pH6.5 Sigma B-9754 2.5μL 50mM
5MNaCl Sigma S-7653 1μL 100mM
dH2O N/A N/A 11.1μL  
每试管中反应混合物总体积:                               40μL 
结果见图25。重折叠的融合蛋白MBP-pST3Gal1和MBP-SBD-pST3Gal1具有可检测的唾液酸转移酶活性。 
实施例9:重折叠MBP-ST6GalNAc1蛋白
将真核ST6GalNAcI融合于MPB。简要说,产生了5个小鼠ST6GalNAcI构建物:D32、E52、S127、S186和S201。从载体pcWin2-MBP的MBP-标记后表达各构建物,其不同之处在于构建物中包括的‘主干’区长度。D32是最长形式,恰好从预计的氨基末端跨膜结构域下游开始。S201最短,从保守催化结构域的预计起始点之前不远处开始。 
除小鼠构建物以外,人ST6GalNAc IK36也表达为MBP融合物。人构建物恰好从跨膜结构域之后开始。用现有的杆状病毒表达载体作模板用PCR分离编码人ST6GalNAc1中K36至其c末端的DNA,将其克隆入pcWin2-MBP的BamHI-XhoI位点中。 
在参考文献中,MBP-mST6GalNAcI S127和MBP-hST6GalNAcI K36的序列见图26。此外,图38提供了人ST6GalNAcI和鸡ST6GalNAcI的全长氨基酸序列以及从天然小鼠蛋白的残基32处开始的小鼠ST6GalNAcI蛋白序列。 
除上述蛋白以外,还制备了缺失突变体,用于本发明的优选ST6GalNAcI的完整列表见表14。图39提供了许多优选的人ST6GalNAcI截短突变体的示意图。图40显示了包括人ST6GalNAcI截短突变体的MBP融合蛋白的示意图。
表14:ST6GalNAcI突变体
Figure S05810602420061012D000731
图45显示了配对和未配对半胱氨酸残基在人ST6GalNAcI蛋白中的位置。也显示了单半胱氨酸取代和双半胱氨酸取代,如C280S、C362S、C362T、(C280S+C362S)和(C280S+C362T)。 
初始表达研究证明,ST6GalNAcI融合蛋白表达为不溶性蛋白质。为了回收活性重组酶,如上所述分离和重折叠无活性的不溶性蛋白:
用1mM IPTG37℃过夜诱导对数生长的0.5L携带pcWin2-MBP-mST6GalNAcID32、E52、S127、S186或pcWin2-MBP-hST6GalNAcI K36的JM109细胞培养物。离心收集细胞,溶于100mL20mM Tris pH8,5mM EDTA溶液中,在微流化床中机械破坏裂解细胞。7000x g离心20分钟收集不溶性物质。弃去上清,用高盐缓冲液(20mM Tris pH7.4,1M NaCl,5mM EDTA)、去污剂缓冲液(25mM Tris pH8,1%去氧胆酸钠,1%Triton x100,100mM NaCl,5mM EDTA)和TE(10mM Tris pH8,1mM EDTA)洗涤沉淀。每次洗涤用100mL,如上所述离心收集沉淀。洗涤后,将包含体沉淀分成等分,贮存在-80℃。 
为筛选适合重折叠和恢复ST6GalNAc I活性的条件,将等份的小鼠和人ST6GalNAcI融合蛋白包含体溶于6M胍、10mM DTT、1x TBS。蛋白浓度按Bradford试验标准化,将溶解的蛋白质转移到一系列市售蛋白重折叠缓冲液中。在96孔板中0.25mL0.2mg/mL溶液中4℃振荡重折叠过夜。将重折叠产物转移到96孔透析板(25000MWCO)中,4℃以1x TBS,0.05%吐温-80透析4小时,然后在4℃以10mM BisTris pH7.1,100mM NaCl,0.05%吐温-80透析过夜。 
在384孔固相活性试验中测定重折叠的重组ST6GalNAcI融合蛋白的活性。简要说,该活性试验在384孔板中检测ST6GalNAcI介导的生物素化唾液酸从生物素化CMP-NAN转移到脱唾液酸-牛下颚粘蛋白包被的孔表面。各反应(13.5μL重折叠酶+1.5μL10x反应缓冲液)一式四份进行。10x反应缓冲液是0.2M BisTris pH6.7,25mM MgCl2,25mM MnCl2,0.5%吐温-80和1mM供体。37℃孵育过夜后,用过量1xTBS,0.05%吐温-20洗涤板孔,按照厂商说明书(Perkin Elmer)用铕标记的链霉抗生物素蛋白检测生物素。保留在板孔中的铕荧光水平表明了ST6GalNAcI活性,用Perkin Elmer Victor3V平板阅读器记录铕荧光水平,表15中小结了表达和活性的检测结果。三种重折叠的ST6GalNAcI融合蛋白具有可检测的活性。 
表15:用固相试验测定重折叠ST6GalNAcI融合蛋白活性的小结 
  
构建物 SDS-PAGE检测的重折叠蛋白 固相试验检测的重折叠蛋白活性
MBP-mST6GalNAcI D32 + -
MBP-mST6GalNAcI E52 ++ -
MBP-mST6GalNAcI S127 +++ +
MBP-mST6GalNAcI S186 +/- +/-
MBP-hST6GalNAcI K36 +/- +
[0554]  实施例10:重折叠Core1GalT1蛋白
将真核Core1GalT1融合于MPB或双标记MBPSPD。采用果蝇和人Core1GalT1蛋白。图41提供人Core1GalT1蛋白的全长序列。图42提供两种果蝇Core1GalT1蛋白的序列。从整个主干区,即从全长主干区开始,一次缺失一个氨基酸制备各酶的截短物,最小截短物仅含Core1GalT1催化结构域。也将整个蛋白质催化结构域中的半胱氨酸残基一次突变一个,成为丝氨酸残基或丙氨酸残基。用截短的蛋白质、半胱氨酸突变体或二者联合制备MBP融合物。蛋白质在大肠杆菌中表达为包含体,溶解,然后用本文所述方法重折叠。通过测量酶活测定重折叠(效果)。有活性的酶是正确重折叠的。如Ju等,J.Biol.Chem.277:178-186(2002)所述测定Core1GalT1的酶活,将其纳入本文作为参考用于所有目的。 
实施例11:O-连接糖基转移酶的单罐重折叠
O-连接糖基转移酶GalNAcT2、Corel和ST3Gal1可一起用于将包含末端唾液酸或唾液酸-PEG的Core1结构加到所选择蛋白(包括治疗性蛋白)的丝氨酸或苏氨酸残基上。在大肠杆菌中表达这些酶和从重折叠的包含体中回收活性酶,用于开发成本效率高的规模化方法。我们在本文中描述了同时重折叠大肠杆菌包含体的两种酶(MBP-GalNAcT2和MBP-ST3Gal1)。同时重折叠的优点包括减少试剂用量和提高重折叠效率。 
选择两株卡那霉素抗性的JM109,确定携带用IPTG诱导后能将MBP-GalNAcT2和MBP-ST3Gal1累积在包含体中的合适表达质粒。 
用1mM IPTG分别诱导过夜后,以每10mL20mM Tris pH8,5mM EDTA1g湿细胞沉淀的比例重悬细菌细胞沉淀,两次通过微流化床机械破坏裂解细胞。在Sorvall RC3中7000xg4℃离心30分钟沉淀不溶性物质即包含体或IB,弃去上清。洗涤循环一般由用洗涤缓冲液完全重悬沉淀和重复离心15分钟组成。用过量体积(每克初始细胞沉淀至少10mL(高达20毫升))的高盐缓冲液(洗液I:10mM Tris pH7.4,1M NaCl,5mM EDTA)洗涤沉淀一次,用去污剂缓冲液(洗液II:25mM Tris pH8,100mM NaCl,1%Triton X100,1%去氧胆酸钠,5mM EDTA)洗涤一次,用洗涤缓冲液(洗液III:10mM Tris pH8,5mM EDTA)洗涤三次(除洗涤IB外还去除痕量去污剂)。 
将洗涤后的IB重悬于增溶缓冲液(8M Urea,50mM BisTris pH6.5,5mMEDTA,10mM DTT)中,将蛋白质浓度调整为4mg/ml。14000xG离心5分钟使尿素 蛋白质溶液澄清。重折叠方法如下:用重折叠缓冲液(55mM Tris pH8.2,10.56mMNaCl,0.44mM KCl,2.2mM MgCl2,2.2mM CaCl2,0.055%PEG3350,550mM L-精氨酸,1mM GSH,100mcM GSSG)快速稀释至0.1mg/ml,4℃搅拌16小时。 
试验系统设定如下:在MBP-GalNAcT2和MBP-ST3Gal1分别重折叠或在同一容器中同时重折叠时保持重折叠条件恒定。重折叠后,用50mM BisTris pH6.5,75mM NaCl,0.05%吐温80平衡的G50Sephadex低速离心使混合物脱盐。在微型离心机中以最高转速离心后回收可溶性物质。 
为确定重折叠后可溶性酶的产量,对各反应进行SDS-PAGE分析,然后用考马斯蓝染色显示多肽(图27A)。结果表明,同时重折叠提高了可溶性酶的产量(见同时重折叠与分别重折叠的泳道)。 
在第二个试验中,对6μg治疗蛋白IFa-2b进行单罐三种酶的PEG化反应。用于此反应的酶浓度是1.4μg MBP-GalNAcT2、0.5mu BV Corel和1.4μg MBP-ST3Gal1,所用糖是1.2μg UDP-GalNac和1.2μg UDP-Gal和125μg20K-PEG-CMP-NAN,在20μl反应体系中用以下反应缓冲液(50mM MES pH6.2,150mM NaCl,l0mM MnCl2)反应0小时或16小时。在反应一半时,通过SDS-PAGE后考马斯蓝染色(图27B)来观察IFα-2b的PEG化程度。设计该试验是为了在保持所有其它组分和浓度不变的情况下直接比较分别重折叠的混合酶与同时重折叠的酶的单罐PEG化(程度)。结果证明,与分别重折叠相比,同时重折叠的酶在此反应中PEG化产物增加(泳道5与7)。 
实施例12:MBP-SiaA融合蛋白表达增加
为在大肠杆菌中表达优化非典型性流感嗜血杆菌(Haemophilus influenzae)的SiaA基因的密码子。用NdeI和EcoRI消化该基因,进行琼脂糖凝胶纯化,然后连接到NdeI/EcoRI消化的pcWin2中,然后转化到大肠杆菌菌株JM109或W3110中。从重组细菌中分离质粒DNA并用NdeI和EcoRI筛选。将含有正确构建物的各JM109和W3110菌落接种到2ml含有10μg/ml硫酸卡那霉素的无动物(animal free)LB中,以250RPM摇动37℃培养6小时。取出100μl等份,10,000x g离心2分钟,弃去上清。将此沉淀冷冻在-20℃,代表未诱导细胞。将IPTG加入剩下的培养物中IPTG终浓度为1mM,以250RPM摇动37℃培养2小时。取出100μl等份,如上所述进行试验(代表诱导细胞)。 
用PCR将SiaA基因末端的限制性位点改变为5’BamHI,3’末端保持为EcoRI。用BamHI和EcoRI消化该PCR产物,琼脂糖凝胶电泳纯化,然后连接入BamHI/EcoRI消化的pcWin2MBP中。用BamHI和EcoRI筛选质粒DNA。将含有正确构建物的三 个菌落接种到2ml含有10μg/ml硫酸卡那霉素的无动物LB中,以250RPM摇动37℃培养6小时。取出100μl等份,10,000x g离心2分钟,弃去上清。将此沉淀冷冻在-20℃,代表未诱导细胞。将IPTG加入剩下的培养物中,IPTG终浓度为1mM,以250RPM摇动37℃培养2小时。取出100μl等份,如上所述进行试验(代表诱导细胞)。 
取各100μl等份在含50mM DTT的100μl SDS-PAGE样品缓冲液中煮沸5分钟。将样品加到4-20%丙烯酰胺Tris-甘氨酸凝胶(Invitrogen)上,电泳~2h,用Invitrogen Simply Blue Safestain染色,用水脱色,并扫描。图X显示检测不到诱导后天然SiaA的表达水平,而图Y显示IPTG诱导后融合于MBP的SiaA高水平表达。此结果证明,pcWin2MBP载体提供的MBP驱使蛋白质高水平表达。 
应理解,本文所述实施例和实施方式仅为了说明,本领域技术人员能据此进行各种修改或改变,这些修改和改变应包括在本申请的精神和范围以及所附权利要求书的范围内。本文引用的所有出版物、专利和专利申请都以其全部内容纳入本文作为参考用于所有目的。
序列表
<110>S.萨里巴斯(Saribas,Sami)
     D.黑克斯(Hakes,David)
     S.威利特(Willet,Scott)
     K.F.约翰逊(Johnson,Karl F.)
     D.J.贝兹拉(Bezila,Daniel James)
     S.德弗里斯(DeFrees,Shawn)
     尼澳斯技术股份有限公司(Neose Technologies,Inc.)
<120>哺乳动物糖基转移酶的重折叠方法
<130>019957-016830PC
<140>WO PCT/US05/03856
<141>2005-02-04
<150>US 60/542,210
<151>2004-02-04
<150>US 60/599,406
<151>2004-08-06
<150>US 60/627,406
<151>2004-11-12
<160>80
<170>PatentIn Ver.2.1
<210>1
<211>445
<212>PRT
<213>智人(Homo sapiens)
<220>
<223>人β-1,2-N-乙酰葡糖胺基转移酶I(GnTI,GnT1)
<400>1
Met Leu Lys Lys Gln Ser Ala Gly Leu Val Leu Trp Gly Ala Ile Leu
  1               5                  10                  15
Phe Val Ala Trp Asn Ala Leu Leu Leu Leu Phe Phe Trp Thr Arg Pro
             20                  25                  30
Ala Pro Gly Arg Pro Pro Ser Val Ser Ala Leu Asp Gly Asp Pro Ala
         35                  40                  45
Ser Leu Thr Arg Glu Val Ile Arg Leu Ala Gln Asp Ala Glu Val Glu
     50                  55                  60
Leu Glu Arg Gln Arg Gly Leu Leu Gln Gln Ile Gly Asp Ala Leu Ser
 65                  70                  75                  80
Ser Gln Arg Gly Arg Val Pro Thr Ala Ala Pro Pro Ala Gln Pro Arg
                85                  90                  95
Val Pro Val Thr Pro Ala Pro Ala Val Ile Pro Ile Leu Val Ile Ala
            100                 105                 110
Cys Asp Arg Ser Thr Val Arg Arg Cys Leu Asp Lys Leu Leu His Tyr
        115                 120                 125
Arg Pro Ser Ala Glu Leu Phe Pro Ile Ile Val Ser Gln Asp Cys Gly
    130                 135                 140
His Glu Glu Thr Ala Gln Ala Ile Ala Ser Tyr Gly Ser Ala Val Thr
145                 150                 155                 160
His Ile Arg Gln Pro Asp Leu Ser Ser Ile Ala Val Pro Pro Asp His
                165                 170                 175
Arg Lys Phe Gln Gly Tyr Tyr Lys Ile Ala Arg His Tyr Arg Trp Ala
            180                 185                 190
Leu Gly Gln Val Phe Arg Gln Phe Arg Phe Pro Ala Ala Val Val Val
        195                 200                 205
Glu Asp Asp Leu Glu Val Ala Pro Asp Phe Phe Glu Tyr Phe Arg Ala
    210                 215                 220
Thr Tyr Pro Leu Leu Lys Ala Asp Pro Ser Leu Trp Cys Val Ser Ala
225                 230                 235                 240
Trp Asn Asp Asn Gly Lys Glu Gln Met Val Asp Ala Ser Arg Pro Glu
                245                 250                 255
Leu Leu Tyr Arg Thr Asp Phe Phe Pro Gly Leu Gly Trp Leu Leu Leu
            260                 265                 270
Ala Glu Leu Trp Ala Glu Leu Glu Pro Lys Trp Pro Lys Ala Phe Trp
        275                 280                 285
Asp Asp Trp Met Arg Arg Pro Glu Gln Arg Gln Gly Arg Ala Cys Ile
    290                 295                 300
Arg Pro Glu Ile Ser Arg Thr Met Thr Phe Gly Arg Lys Gly Val Ser
305                 310                 315                 320
His Gly Gln Phe Phe Asp Gln His Leu Lys Phe Ile Lys Leu Asn Gln
                325                 330                 335
Gln Phe Val His Phe Thr Gln Leu Asp Leu Ser Tyr Leu Gln Arg Glu
            340                 345                 350
Ala Tyr Asp Arg Asp Phe Leu Ala Arg Val Tyr Gly Ala Pro Gln Leu
        355                 360                 365
Gln Val Glu Lys Val Arg Thr Asn Asp Arg Lys Glu Leu Gly Glu Val
    370                 375                 380
Arg Val Gln Tyr Thr Gly Arg Asp Ser Phe Lys Ala Phe Ala Lys Ala
385                 390                 395                 400
Leu Gly Val Met Asp Asp Leu Lys Ser Gly Val Pro Arg Ala Gly Tyr
                405                 410                 415
Arg Gly Ile Val Thr Phe Gln Phe Arg Gly Arg Arg Val His Leu Ala
            420                 425                 430
Pro Pro Pro Thr Trp Glu Gly Tyr Asp Pro Ser Trp Asn
        435                 440                 445
<210>2
<211>447
<212>PRT
<213>家兔(Oryctolagus cuniculus)
<220>
<223>兔β-1,2-N-乙酰葡糖胺基转移酶I(GnTI,GnT1)
<400>2
Met Leu Lys Lys Gln Ser Ala Gly Leu Val Leu Trp Gly Ala Ile Leu
  1               5                  10                  15
Phe Val Ala Trp Asn Ala Leu Leu Leu Leu Phe Phe Trp Thr Arg Pro
             20                  25                  30
Val Pro Ser Arg Leu Pro Ser Asp Asn Ala Leu Asp Asp Asp Pro Ala
         35                  40                  45
Ser Leu Thr Arg Glu Val Ile Arg Leu Ala Gln Asp Ala Glu Val Glu
     50                  55                  60
Leu Glu Arg Gln Arg Gly Leu Leu Gln Gln Ile Arg Glu His His Ala
 64                  70                  75                  80
Leu Trp Ser Gln Arg Trp Lys Val Pro Thr Ala Ala Pro Pro Ala Gln
                 85                  90                  95
Pro His Val Pro Val Thr Pro Pro Pro Ala Val Ile Pro Ile Leu Val
            100                 105                 110
Ile Ala Cys Asp Arg Ser Thr Val Arg Arg Cys Leu Asp Lys Leu Leu
        115                 120                 125
His Tyr Arg Pro Ser Ala Glu Leu Phe Pro Ile Ile Val Ser Gln Asp
    130                 135                 140
Cys Gly His Glu Glu Thr Ala Gln Val Ile Ala Ser Tyr Gly Ser Ala
145                 150                 155                 160
Val Thr His Ile Arg Gln Pro Asp Leu Ser Asn Ile Ala Val Gln Pro
                165                 170                 175
Asp His Arg Lys Phe Gln Gly Tyr Tyr Lys Ile Ala Arg His Tyr Arg
            180                 185                 190
Trp Ala Leu Gly Gln Ile Phe His Asn Phe Asn Tyr Pro Ala Ala Val
        195                 200                 205
Val Val Glu Asp Asp Leu Glu Val Ala Pro Asp Phe Phe Glu Tyr Phe
    210                 215                 220
Gln Ala Thr Tyr Pro Leu Leu Lys Ala Asp Pro Ser Leu Trp Cys Val
225                 230                 235                 240
Ser Ala Trp Asn Asp Asn Gly Lys Glu Gln Met Val Asp Ser Ser Lys
                245                 250                 255
Pro Glu Leu Leu Tyr Arg Thr Asp Phe Phe Pro Gly Leu Gly Trp Leu
            260                 265                 270
Leu Leu Ala Glu Leu Trp Ala Glu Leu Glu Pro Lys Trp Pro Lys Ala
        275                 280                 285
Phe Trp Asp Asp Trp Met Arg Arg Pro Glu Gln Arg Lys Gly Arg Ala
    290                 295                 300
Cys Val Arg Pro Glu Ile Ser Arg Thr Met Thr Phe Gly Arg Lys Gly
305                 310                 315                 320
Val Ser His Gly Gln Phe Phe Asp Gln His Leu Lys Phe Ile Lys Leu
                325                 330                 335
Asn Gln Gln Phe Val Pro Phe Thr Gln Leu Asp Leu Ser Tyr Leu Gln
            340                 345                 350
Gln Glu Ala Tyr Asp Arg Asp Phe Leu Ala Arg Val Tyr Gly Ala Pro
        355                 360                 365
Gln Leu Gln Val Glu Lys Val Arg Thr Asn Asp Arg Lys Glu Leu Gly
    370                 375                 380
Glu Val Arg Val Gln Tyr Thr Gly Arg Asp Ser Phe Lys Ala Phe Ala
385                 390                 395                 400
Lys Ala Leu Gly Val Met Asp Asp Leu Lys Ser Gly Val Pro Arg Ala
                405                 410                 415
Gly Tyr Arg Gly Ile Val Thr Phe Leu Phe Arg Gly Arg Arg Val His
            420                 425                 430
Leu Ala Pro Pro Gln Thr Trp Asp Gly Tyr Asp Pro Ser Trp Thr
        435                 440                 445
<210>3
<211>342
<212>PRT
<213>人工序列
<220>
<223>人工序列描述:
     β-1,2-N-乙酰葡糖胺基转移酶I(GnTI,GnT1)Cys121Ser突变体
<400>3
Ala Val Ile Pro Ile Leu Val Ile Ala Cys Asp Arg Ser Thr Val Arg
  1               5                  10                  15
Arg Ser Leu Asp Lys Leu Leu His Tyr Arg Pro Ser Ala Glu Leu Phe
             20                  25                  30
Pro Ile Ile Val Ser Gln Asp Cys Gly His Glu Glu Thr Ala Gln Ala
         35                  40                  45
Ile Ala Ser Tyr Gly Ser Ala Val Thr His Ile Arg Gln Pro Asp Leu
     50                  55                  60
Ser Ser Ile Ala Val Pro Pro Asp His Arg Lys Phe Gln Gly Tyr Tyr
 65                  70                  75                  80
Lys Ile Ala Arg His Tyr Arg Trp Ala Leu Gly Gln Val Phe Arg Gln
                 85                  90                  95
Phe Arg Phe Pro Ala Ala Val Val Val Glu Asp Asp Leu Glu Val Ala
            100                 105                 110
Pro Asp Phe Phe Glu Tyr Phe Arg Ala Thr Tyr Pro Leu Leu Lys Ala
        115                 120                 125
Asp Pro Ser Leu Trp Cys Val Ser Ala Trp Asn Asp Asn Gly Lys Glu
    130                 135                 140
Gln Met Val Asp Ala Ser Arg Pro Glu Leu Leu Tyr Arg Thr Asp Phe
145                 150                 155                 160
Phe Pro Gly Leu Gly Trp Leu Leu Leu Ala Glu Leu Trp Ala Glu Leu
                165                 170                 175
Glu Pro Lys Trp Pro Lys Ala Phe Trp Asp Asp Trp Met Arg Arg Pro
            180                 185                 190
Glu Gln Arg Gln Gly Arg Ala Cys Ile Arg Pro Glu Ile Ser Arg Thr
       195                 200                 205
Met Thr Phe Gl yArg Lys Gly Val Ser His Gly Gln Phe Phe Asp Gln
    210                 215                 220
His Leu Lys Phe Ile Lys Leu Asn Gln Gln Phe Val His Phe Thr Gln
225                 230                 235                 240
Leu Asp Leu Ser Tyr Leu Gln Arg Glu Ala Tyr Asp Arg Asp Phe Leu
                245                 250                 255
Ala Arg Val Tyr Gly Ala Pro Gln Leu Gln Val Glu Lys Val Arg Thr
            260                 265                 270
Asn Asp Arg Lys Glu Leu Gly Glu Val Arg Val Gln Tyr Thr Gly Arg
        275                 280                 285
Asp Ser Phe Lys Ala Phe Ala Lys Ala Leu Gly Val Met Asp Asp Leu
    290                 295                 300
Lys Ser Gly Val Pro Arg Ala Gly Tyr Arg Gly Ile Val Thr Phe Gln
305                 310                 315                 320
Phe Pro Gly Arg Arg Val His Leu Ala Pro Pro Pro Thr Trp Glu Gly
                325                 330                 335
Tyr Asp Pro Ser Trp Asn
            340
<210>4
<211>1029
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:
     β-1,2-N-乙酰葡糖胺基转移酶I(GnTI,GnT1)Cys121Ser突变体
<400>4
gcggtgattc ccatcctggt catcgcctgt gaccgcagca ctgttcggcg ctctctagac 60
aagctgctgc attatcggcc ctcggctgag ctcttcccca tcatcgttag ccaggactgc 120
gggcacgagg agacggccca ggccatcgcc tcctacggca gcgcggtcac gcacatccgg 180
cagcccgacc tgagcagcat tgcggtgccg ccggaccacc gcaagttcca gggctactac 240
aagatcgcgc gccactaccg ctgggcgctg ggccaggtct tccggcagtt tcgcttcccc 300
gcggccgtgg tggtggagga tgacctggag gtggccccgg acttcttcga gtactttcgg 360
gccacctatc cgctgctgaa ggccgacccc tccctgtggt gcgtctcggc ctggaatgac 420
aacggcaagg agcagatggt ggacgccagc aggcctgagc tgctctaccg caccgacttt 480
ttccctggcc tgggctggct gctgttggcc gagctctggg ctgagctgga gcccaagtgg 540
ccaaaggcct tctgggacga ctggatgcgg cggccggagc agcggcaggg gcgggcctgc 600
atacgccctg agatctcaag aacgatgacc tttggccgca agggtgtgag ccacgggcag 660
ttctttgacc agcacctcaa gtttatcaag ctgaaccagc agtttgtgca cttcacccag 720
ctggacctgt cttacctgca gcgggaggcc tatgaccgag atttcctcgc ccgcgtctac 780
ggtgctcccc agctgcaggt ggagaaagtg aggaccaatg accggaagga gctgggggag 840
gtgcgggtgc agtatacggg cagggacagc ttcaaggctt tcgccaaggc tctgggtgtc 900
atggatgacc ttaagtcggg ggttccgaga gctggctacc ggggtattgt caccttccag 960
ttcccgggcc gccgtgtcca cctggcgccc ccaccgacgt gggagggcta tgatcctagc 1020
tggaattag                                                         1029
<210>5
<211>12
<212>PRT
<213>人工序列
<220>
<223>人工序列描述:未配对的半胱氨酸突变Cys121Ser突变区
<400>5
Ser Thr Val Arg Arg Ser Leu Asp Lys Leu Leu His
  1               5                  10
<210>6
<211>342
<212>PRT
<213>人工序列
<220>
<223>人工序列描述:
     β-1,2-N-乙酰葡糖胺基转移酶I(GnTI,GnT1)Cys121Asp突变体
<400>6
Ala Val Ile Pro Ile Leu Val Ile Ala Cys Asp Arg Ser Thr Val Arg
  1               5                  10                  15
Arg Asp Leu Asp Lys Leu Leu His Tyr Arg Pro Ser Ala Glu Leu Phe
             20                  25                  30
Pro Ile Ile Val Ser Gln Asp Cys Gly His Glu Glu Thr Ala Gln Ala
         35                  40                  45
Ile Ala Ser Tyr Gly Ser Ala Val Thr His Ile Arg Gln Pro Asp Leu
     50                  55                  60
Ser Ser Ile Ala Val Pro Pro Asp His Arg Lys Phe Gln Gly Tyr Tyr
 65                  70                  75                  80
Lys Ile Ala Arg His Tyr Arg Trp Ala Leu Gly Gln Val Phe Arg Gln
                 85                  90                  95
Phe Arg Phe Pro Ala Ala Val Val Val Glu Asp Asp Leu Glu Val Ala
            100                 105                 110
Pro Asp Phe Phe Glu Tyr Phe Arg Ala Thr Tyr Pro Leu Leu Lys Ala
        115                 120                 125
Asp Pro Ser Leu Trp Cys Val Ser Ala Trp Ash Asp Asn Gly Lys Glu
    130                 135                 140
Gln Met Val Asp Ala Ser Arg Pro Glu Leu Leu Tyr Arg Thr Asp Phe
145                 150                 155                 160
Phe Pro Gly Leu Gly Trp Leu Leu Leu Ala Glu Leu Trp Ala Glu Leu
                165                 170                 175
Glu Pro Lys Trp Pro Lys Ala Phe Trp Asp Asp Trp Met Arg Arg Pro
            180                 185                 190
Glu Gln Arg Gln Gly Arg Ala Cys Ile Arg Pro Glu Ile Ser Arg Thr
        195                 200                 205
Met Thr Phe Gly Arg Lys Gly Val Ser His Gly Gln Phe Phe Asp Gln
    210                 215                 220
His Leu Lys Phe Ile Lys Leu Asn GlnGl n Phe Val His Phe Thr Gln
225                 230                 235                 240
Leu Asp Leu Ser Tyr Leu Gln Arg Glu Ala Tyr Asp Arg Asp Phe Leu
                245                 250                 255
Ala Arg Val Tyr Gly Ala Pro Gln Leu Gln Val Glu Lys Val Arg Thr
            260                 265                 270
Asn Asp Arg Lys Glu Leu Gly Glu Val Arg Val Gln Tyr Thr Gly Arg
        275                 280                 285
Asp Ser Phe Lys Ala Phe Ala Lys Ala Leu Gly Val Met Asp Asp Leu
    290                 295                 300
Lys Ser Gly Val Pro Arg Ala Gly Tyr Arg Gly Ile Val Thr Phe Gln
305                 310                 315                 320
Phe Pro Gly Arg Arg Val His Leu Ala Pro Pro Pro Thr Trp Glu Gly
                325                 330                 335
Tyr Asp Pro Ser Trp Asn
            340
<210>7
<211>1029
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:
     β-1,2-N-乙酰葡糖胺基转移酶I(GnTI,GnT1)Cys121Asp突变体
<400>7
gcggtgattc ccatcctggt catcgcctgt gaccgcagca ctgttcggcg cgatctagac 60
aagctgctgc attatcggcc ctcggctgag ctcttcccca tcatcgttag ccaggactgc 120
gggcacgagg agacggccca ggccatcgcc tcctacggca gcgcggtcac gcacatccgg 180
cagcccgacc tgagcagcat tgcggtgccg ccggaccacc gcaagttcca gggctactac 240
aagatcgcgc gccactaccg ctgggcgctg ggccaggtct tccggcagtt tcgcttcccc 300
gcggccgtgg tggtggagga tgacctggag gtggccccgg acttcttcga gtactttcgg 360
gccacctatc cgctgctgaa ggccgacccc tccctgtggt gcgtctcggc ctggaatgac 420
aacggcaagg agcagatggt ggacgccagc aggcctgagc tgctctaccg caccgacttt 480
ttccctggcc tgggctggct gctgttggcc gagctctggg ctgagctgga gcccaagtgg 540
ccaaaggcct tctgggacga ctggatgcgg cggccggagc agcggcaggg gcgggcctgc 600
atacgccctg agatctcaag aacgatgacc tttggccgca agggtgtgag ccacgggcag 660
ttctttgacc agcacctcaa gtttatcaag ctgaaccagc agtttgtgca cttcacccag 720
ctggacctgt cttacctgca gcgggaggcc tatgaccgag atttcctcgc ccgcgtctac 780
ggtgctcccc agctgcaggt ggagaaagtg aggaccaatg accggaagga gctgggggag 840
gtgcgggtgc agtatacggg cagggacagc ttcaaggctt tcgccaaggc tctgggtgtc 900
atggatgacc ttaagtcggg ggttccgaga gctggctacc ggggtattgt caccttccag 960
ttcccgggcc gccgtgtcca cctggcgccc ccaccgacgt gggagggcta tgatcctagc 1020
tggaattag                                                         1029
<210>8
<211>12
<212>PRT
<213>人工序列
<220>
<223>人工序列描述:未配对的半胱氨酸突变Cys121Asp突变区
<400>8
Ser Thr Val Arg Arg Asp Leu Asp Lys Leu Leu His
  1               5                  10
<210>9
<211>342
<212>PRT
<213>人工序列
<220>
<223>人工序列描述:
     β-1,2-N-乙酰葡糖胺基转移酶I(GnTI,GnT1)Cys121Thr突变体
<400>9
Ala Val Ile Pro Ile Leu Val Ile Ala Cys Asp Arg Ser Thr Val Arg
  1               5                  10                  15
Arg Thr Leu Asp Lys Leu Leu His Tyr Arg Pro Ser Ala Glu Leu Phe
             20                  25                  30
Pro Ile Ile Val Ser Gln Asp Cys Gly His Glu Glu Thr Ala Gln Ala
         35                  40                  45
Ile Ala Ser Tyr Gly Ser Ala Val Thr His Ile Arg Gln Pro Asp Leu
     50                  55                  60
Ser Ser Ile Ala Val Pro Pro Asp His Arg Lys Phe Gln Gly Tyr Tyr
 65                  70                  75                  80
Lys Ile Ala Arg His Tyr Arg Trp Ala Leu Gly Gln Val Phe Arg Gln
                 85                  90                  95
Phe Arg Phe Pro Ala Ala Val Val Val Glu Asp Asp Leu Glu Val Ala
            100                 105                 110
Pro Asp Phe Phe Glu Tyr Phe Arg Ala Thr Tyr Pro Leu Leu Lys Ala
        115                 120                 125
Asp Pro Ser Leu Trp Cys Val Ser Ala Trp Asn Asp Asn Gly Lys Glu
    130                 135                 140
Gln Met Val Asp Ala Ser Arg Pro Glu Leu Leu Tyr Arg Thr Asp Phe
145                 150                 155                 160
Phe Pro Gly Leu Gly Trp Leu Leu Leu Ala Glu Leu Trp Ala Glu Leu
                165                 170                 175
Glu Pro Lys Trp Pro Lys Ala Phe Trp Asp Asp Trp Met Arg Arg Pro
            180                 185                 190
Glu Gln Arg Gln Gly Arg Ala Cys Ile Arg Pro Glu Ile Ser Arg Thr
        195                 200                 205
Met Thr Phe Gly Arg Lys Gly Val Ser His Gly Gln Phe Phe Asp Gln
    210                 215                 220
His Leu Lys Phe Ile Lys Leu Asn Gln Gln Phe Val His Phe Thr Gln
225                 230                 235                 240
Leu Asp Leu Ser Tyr Leu Gln Arg Glu Ala Tyr Asp Arg Asp Phe Leu
                245                 250                 255
Ala Arg Val Tyr Gly Ala Pro Gln Leu Gln Val Glu Lys Val Arg Thr
            260                 265                 270
Asn Asp Arg Lys Glu Leu Gly Glu Val Arg Val Gln Tyr Thr Gly Arg
        275                 280                 285
Asp Ser Phe Lys Ala Phe Ala Lys Ala Leu Gly Val Met Asp Asp Leu
    290                 295                 300
Lys Ser Gly Val Pro Arg Ala Gly Tyr Arg Gly Ile Val Thr Phe Gln
305                 310                 315                 320
Phe Pro Gly Arg Arg Val His Leu Ala Pro Pro Pro Thr Trp Glu Gly
                325                 330                 335
Tyr Asp Pro Ser Trp Asn
            340
<210>10
<211>1029
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:
     β-1,2-N-乙酰葡糖胺基转移酶I(GnTI,GnT1)Cys121Thr突变体
<400>10
gcggtgattc ccatcctggt catcgcctgt gaccgcagca ctgttcggcg cactctagac 60
aagctgctgc attatcggcc ctcggctgag ctcttcccca tcatcgttag ccaggactgc 120
gggcacgagg agacggccca ggccatcgcc tcctacggca gcgcggtcac gcacatccgg 180
cagcccgacc tgagcagcat tgcggtgccg ccggaccacc gcaagttcca gggctactac 240
aagatcgcgc gccactaccg ctgggcgctg ggccaggtct tccggcagtt tcgcttcccc 300
gcggccgtgg tggtggagga tgacctggag gtggccccgg acttcttcga gtactttcgg 360
gccacctatc cgctgctgaa ggccgacccc tccctgtggt gcgtctcggc ctggaatgac 420
aacggcaagg agcagatggt ggacgccagc aggcctgagc tgctctaccg caccgacttt 480
ttccctggcc tgggctggct gctgttggcc gagctctggg ctgagctgga gcccaagtgg 540
ccaaaggcct tctgggacga ctggatgcgg cggccggagc agcggcaggg gcgggcctgc 600
atacgccctg agatctcaag aacgatgacc tttggccgca agggtgtgag ccacgggcag 660
ttctttgacc agcacctcaa gtttatcaag ctgaaccagc agtttgtgca cttcacccag 720
ctggacctgt cttacctgca gcgggaggcc tatgaccgag atttcctcgc ccgcgtctac 780
ggtgctcccc agctgcaggt ggagaaagtg aggaccaatg accggaagga gctgggggag 840
gtgcgggtgc agtatacggg cagggacagc ttcaaggctt tcgccaaggc tctgggtgtc 900
atggatgacc ttaagtcggg ggttccgaga gctggctacc ggggtattgt caccttccag 960
ttcccgggcc gccgtgtcca cctggcgccc ccaccgacgt gggagggcta tgatcctagc1020
tggaattag                                                   1029
<210>11
<211>12
<212>PRT
<213>人工序列
<220>
<223>人工序列描述:未配对的半胱氨酸突变Cys121Thr突变区
<400>11
Ser Thr Val Arg Arg Thr Leu Asp Lys Leu Leu His
  1               5                  10
<210>12
<211>342
<212>PRT
<213>人工序列
<220>
<223>人工序列描述:
     β-1,2-N-乙酰葡糖胺基转移酶I(GnTI,GnT1)Cys121Ala突变体
<400>12
Ala Val Ile Pro Ile Leu Val Ile Ala Cys Asp Arg Ser Thr Val Arg
  1               5                  10                  15
Arg Ala Leu Asp Lys Leu Leu His Tyr Arg Pro Ser Ala Glu Leu Phe
             20                  25                  30
Pro Ile Ile Val Ser Gln Asp Cys Gly His Glu Glu Thr Ala Gln Ala
         35                  40                  45
Ile Ala Ser Tyr Gly Ser Ala Val Thr His Ile Arg Gln Pro Asp Leu
     50                  55                  60
Ser Ser Ile Ala Val Pro Pro Asp His Arg Lys Phe Gln Gly Tyr Tyr
 65                  70                  75                  80
Lys Ile Ala Arg His Tyr Arg Trp Ala Leu Gly Gln Val Phe Arg Gln
                 85                  90                  95
Phe Arg Phe Pro Ala Ala Val Val Val Glu Asp Asp Leu Glu Val Ala
            100                 105                 110
Pro Asp Phe Phe Glu Tyr Phe Arg Ala Thr Tyr Pro Leu Leu Lys Ala
        115                 120                 125
Asp Pro Ser Leu Trp Cys Val Ser Ala Trp Asn Asp Asn Gly Lys Glu
    130                 135                 140
Gln Met Val Asp Ala Ser Arg Pro Glu Leu Leu Tyr Arg Thr Asp Phe
145                 150                 155                 160
Phe Pro Gly Leu Gly Trp Leu Leu Leu Ala Glu Leu Trp Ala Glu Leu
                165                 170                 175
Glu Pro Lys Trp Pro Lys Ala Phe Trp Asp Asp Trp Met Arg Arg Pro
            180                 185                 190
Glu Gln Arg Gln Gly Arg Ala Cys Ile Arg Pro Glu Ile Ser Arg Thr
        195                 200                 205
Met Thr Phe Gly Arg Lys Gly Val Ser His Gly Gln Phe Phe Asp Gln
    210                 215                 220
His Leu Lys Phe Ile Lys Leu Asn Gln Gln Phe Val His Phe Thr Gln
225                 230                 235                 240
Leu Asp Leu Ser Tyr Leu Gln Arg Glu Ala Tyr Asp Arg Asp Phe Leu
                245                 250                 255
Ala Arg Val Tyr Gly Ala Pro Gln Leu Gln Val Glu Lys Val Arg Thr
            260                 265                 270
Asn Asp Arg Lys Glu Leu Gly Glu Val Arg Val Gln Tyr Thr Gly Arg
        275                 280                 285
Asp Ser Phe Lys Ala Phe Ala Lys Ala Leu Gly Val Met Asp Asp Leu
    290                 295                 300
Lys Ser Gly Val Pro Arg Ala Gly Tyr Arg Gly Ile Val Thr Phe Gln
305                 310                 315                 320
Phe Pro Gly Arg Arg Val His Leu Ala Pro Pro Pro Thr Trp Glu Gly
                325                 330                 335
Tyr Asp Pro Ser Trp Asn
            340
<210>13
<211>1029
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:
     β-1,2-N-乙酰葡糖胺基转移酶I(GnTI,GnT1)Cys121Ala突变体
<400>13
gcggtgattc ccatcctggt catcgcctgt gaccgcagca ctgttcggcg cgccctagac 60
aagctgctgc attatcggcc ctcggctgag ctcttcccca tcatcgttag ccaggactgc 120
gggcacgagg agacggccca ggccatcgcc tcctacggca gcgcggtcac gcacatccgg 180
cagcccgacc tgagcagcat tgcggtgccg ccggaccacc gcaagttcca gggctactac 240
aagatcgcgc gccactaccg ctgggcgctg ggccaggtct tccggcagtt tcgcttcccc 300
gcggccgtgg tggtggagga tgacctggag gtggccccgg acttcttcga gtactttcgg 360
gccacctatc cgctgctgaa ggccgacccc tccctgtggt gcgtctcggc ctggaatgac 420
aacggcaagg agcagatggt ggacgccagc aggcctgagc tgctctaccg caccgacttt 480
ttccctggcc tgggctggct gctgttggcc gagctctggg ctgagctgga gcccaagtgg 540
ccaaaggcct tctgggacga ctggatgcgg cggccggagc agcggcaggg gcgggcctgc 600
atacgccctg agatctcaag aacgatgacc tttggccgca agggtgtgag ccacgggcag 660
ttctttgacc agcacctcaa gtttatcaag ctgaaccagc agtttgtgca cttcacccag 720
ctggacctgt cttacctgca gcgggaggcc tatgaccgag atttcctcgc ccgcgtctac 780
ggtgctcccc agctgcaggt ggagaaagtg aggaccaatg accggaagga gctgggggag 840
gtgcgggtgc agtatacggg cagggacagc ttcaaggctt tcgccaaggc tctgggtgtc 900
atggatgacc ttaagtcggg ggttccgaga gctggctacc ggggtattgt caccttccag 960
ttcccgggcc gccgtgtcca cctggcgccc ccaccgacgt gggagggcta tgatcctagc 1020
tggaattag                                                         1029
<210>14
<211>12
<212>PRT
<213>人工序列
<220>
<223>人工序列描述:未配对的半胱氨酸突变Cys121Ala突变区
<400>14
Ser Thr Val Arg Arg Ala Leu Asp Lys Leu Leu His
  1               5                  10
<210>15
<211>342
<212>PRT
<213>人工序列
<220>
<223>人工序列描述:
     β-1,2-N-乙酰葡糖胺基转移酶I(GnTI,GnT1)
     Arg120Ala Cys121His双突变体
<400>15
Ala Val Ile Pro Ile Leu Val Ile Ala Cys Asp Arg Ser Thr Val Arg
  1               5                  10                  15
Ala His Leu Asp Lys Leu Leu His Tyr Arg Pro Ser Ala Glu Leu Phe
             20                  25                  30
Pro Ile Ile Val Ser Gln Asp Cys Gly His Glu Glu Thr Ala Gln Ala
         35                  40                  45
Ile Ala Ser Tyr Gly Ser Ala Val Thr His Ile Arg Gln Pro Asp Leu
     50                  55                  60
Ser Ser Ile Ala Val Pro Pro Asp His Arg Lys Phe Gln Gly Tyr Tyr
 65                  70                  75                  80
Lys Ile Ala Arg His Tyr Arg Trp Ala Leu Gly Gln Val Phe Arg Gln
                 85                  90                  95
Phe Arg Phe Pro Ala Ala Val Val Val Glu Asp Asp Leu Glu Val Ala
            100                 105                 110
Pro Asp Phe Phe Glu Tyr Phe Arg Ala Thr Tyr Pro Leu Leu Lys Ala
        115                 120                 125
Asp Pro Ser Leu Trp Cys Val Ser Ala Trp Asn Asp Asn Gly Lys Glu
    130                 135                 140
Gln Met Val Asp Ala Ser Arg Pro Glu Leu Leu Tyr Arg Thr Asp Phe
145                 150                 155                 160
Phe Pro Gly Leu Gly Trp Leu Leu Leu Ala Glu Leu Trp Ala Glu Leu
                165                 170                 175
Glu Pro Lys Trp Pro Lys Ala Phe Trp Asp Asp Trp Met Arg Arg Pro
            180                 185                 190
Glu Gln Arg Gln Gly Arg Ala Cys Ile Arg Pro Glu Ile Ser Arg Thr
        195                 200                 205
Met Thr Phe Gly Arg Lys Gly Val Ser His Gly Gln Phe Phe Asp Gln
    210                 215                 220
His Leu Lys Phe Ile Lys Leu Asn Gln Gln Phe Val His Phe Thr Gln
225                 230                 235                 240
Leu Asp Leu Ser Tyr Leu Gln Arg Glu Ala Tyr Asp Arg Asp Phe Leu
                245                 250                 255
Ala Arg Val Tyr Gly Ala Pro Gln Leu Gln Val Glu Lys Val Arg Thr
            260                 265                 270
Asn Asp Arg Lys Glu Leu Gly Glu Val Arg Val Gln Tyr Thr Gly Arg
        275                 280                 285
Asp Ser Phe Lys Ala Phe Ala Lys Ala Leu Gly Val Met Asp Asp Leu
    290                 295                 300
Lys Ser Gly Val Pro Arg Ala Gly Tyr Arg Gly Ile Val Thr Phe Gln
305                 310                 315                 320
Phe Pro Gly Arg Arg Val His Leu Ala Pro Pro Pro Thr Trp Glu Gly
                325                 330                 335
Tyr Asp Pro Ser Trp Asn
            340
<210>16
<211>1029
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:
     β-1,2-N-乙酰葡糖胺基转移酶I(GnTI,GnT1)
     Arg120Ala Cys121His双突变体
<400>16
gcggtgattc ccatcctggt catcgcctgt gaccgcagca ctgttcgggc ccacctagac 60
aagctgctgc attatcggcc ctcggctgag ctcttcccca tcatcgttag ccaggactgc 120
gggcacgagg agacggccca ggccatcgcc tcctacggca gcgcggtcac gcacatccgg 180
cagcccgacc tgagcagcat tgcggtgccg ccggaccacc gcaagttcca gggctactac 240
aagatcgcgc gccactaccg ctgggcgctg ggccaggtct tccggcagtt tcgcttcccc 300
gcggccgtgg tggtggagga tgacctggag gtggccccgg acttcttcga gtactttcgg 360
gccacctatc cgctgctgaa ggccgacccc tccctgtggt gcgtctcggc ctggaatgac 420
aacggcaagg agcagatggt ggacgccagc aggcctgagc tgctctaccg caccgacttt 480
ttccctggcc tgggctggct gctgttggcc gagctctggg ctgagctgga gcccaagtgg 540
ccaaaggcct tctgggacga ctggatgcgg cggccggagc agcggcaggg gcgggcctgc 600
atacgccctg agatctcaag aacgatgacc tttggccgca agggtgtgag ccacgggcag 660
ttctttgacc agcacctcaa gtttatcaag ctgaaccagc agtttgtgca cttcacccag 720
ctggacctgt cttacctgca gcgggaggcc tatgaccgag atttcctcgc ccgcgtctac 780
ggtgctcccc agctgcaggt ggagaaagtg aggaccaatg accggaagga gctgggggag 840
gtgcgggtgc agtatacggg cagggacagc ttcaaggctt tcgccaaggc tctgggtgtc 900
atggatgacc ttaagtcggg ggttccgaga gctggctacc ggggtattgt caccttccag 960
ttcccgggcc gccgtgtcca cctggcgccc ccaccgacgt gggagggcta tgatcctagc 1020
tggaattag                                                         1029
<210>17
<211>12
<212>PRT
<213>人工序列
<220>
<223>人工序列描述:未配对的半胱氨酸突变Arg120Ala Cys121His双突变区
<400>17
Ser Thr Val Arg Ala His Leu Asp Lys Leu Leu His
  1               5                  10
<210>18
<211>374
<212>PRT
<213>褐家鼠(Rattus norvegicus)
<220>
<223>大鼠肝Gal β-1,3-GalNAc α-2,3-唾液酸转移酶III(ST3GalIII)
<220>
<221>肽
<222>(1)..(28)
<223>Δ28缺失
<400>18
Met Gly Leu Leu Val Phe Val Arg Asn Leu Leu Leu Ala Leu Cys Leu
  1               5                  10                  15
Phe Leu Val Leu Gly Phe Leu Tyr Tyr Ser Ala Trp Lys Leu His Leu
             20                  25                  30
Leu Gln Trp Glu Asp Ser Asn Ser Leu Ile Leu Ser Leu Asp Ser Ala
         35                  40                  45
Gly Gln Thr Leu Gly Thr Glu Tyr Asp Arg Leu Gly Phe Leu Leu Lys
     50                  55                  60
Leu Asp Ser Lys Leu Pro Ala Glu Leu Ala Thr Lys Tyr Ala Asn Phe
 65                  70                  75                  80
Ser Glu Gly Ala Cys Lys Pro Gly Tyr Ala Ser Ala Met Met Thr Ala
                 85                  90                  95
Ile Phe Pro Arg Phe Ser Lys Pro Ala Pro Met Phe Leu Asp Asp Ser
            100                 105                 110
Phe Arg Lys Trp Ala Arg Ile Arg Glu Phe Val Pro Pro Phe Gly Ile
        115                 120                 125
Lys Gly Gln Asp Asn Leu Ile Lys Ala Ile Leu Ser Val Thr Lys Glu
    130                 135                 140
Tyr Arg Leu Thr Pro Ala Leu Asp Ser Leu His Cys Arg Arg Cys Ile
145                 150                 155                 160
Ile Val Gly Asn Gly Gly Val Leu Ala Asn Lys Ser Leu Gly Ser Arg
                165                 170                 175
Ile Asp Asp Tyr Asp Ile Val Ile Arg Leu Asn Ser Ala Pro Val Lys
            180                 185                 190
Gly Phe Glu Lys Asp Val Gly Ser Lys Thr Thr Leu Arg Ile Thr Tyr
        195                 200                 205
Pro Glu Gly Ala Met Gln Arg Pro Glu Gln Tyr Glu Arg Asp Ser Leu
    210                 215                 220
Phe Val Leu Ala Gly Phe Lys Trp Gln Asp Phe Lys Trp Leu Lys Tyr
225                 230                 235                 240
Ile Val Tyr Lys Glu Arg Val Ser Ala Ser Asp Gly Phe Trp Lys Ser
                245                 250                 255
Val Ala Thr Arg Val Pro Lys Glu Pro Pro Glu Ile Arg Ile Leu Asn
            260                 265                 270
Pro Tyr Phe Ile Gln Glu Ala Ala Phe Thr Leu Ile Gly Leu Pro Phe
        275                 280                 285
Asn Asn Gly Leu Met Gly Arg Gly Asn Ile Pro Thr Leu Gly Ser Val
    290                 295                 300
Ala Val Thr Met Ala Leu Asp Gly Cys Asp Glu Val Ala Val Ala Gly
305                 310                 315                 320
Phe Gly Tyr Asp Met Asn Thr Pro Asn Ala Pro Leu His Tyr Tyr Glu
                325                 330                 335
Thr Val Arg Met Ala Ala Ile Lys Glu Ser Trp Thr His Asn Ile Gln
            340                 345                 350
Arg Glu Lys Glu Phe Leu Arg Lys Leu Val Lys Ala Arg Val Ile Thr
        355                 360                 365
Asp Leu Ser Ser Gly Ile
    370
<210>19
<211>571
<212>PRT
<213>智人(Homo sapiens)
<220>
<223>人全长UDP-N-乙酰半乳糖胺基转移酶2(GalNAcT2)
<400>19
Met Arg Arg Arg Ser Arg Met Leu Leu Cys Phe Ala Phe Leu Trp Val
  1               5                  10                  15
Leu Gly Ile Ala Tyr Tyr Met Tyr Ser Gly Gly Gly Ser Ala Leu Ala
             20                  25                  30
Gly Gly Ala Gly Gly Gly Ala Gly Arg Lys Glu Asp Trp Asn Glu Ile
         35                  40                  45
Asp Pro Ile Lys Lys Lys Asp Leu His His Ser Asn Gly Glu Glu Lys
     50                  55                  60
Ala Gln Ser Met Glu Thr Leu Pro Pro Gly Lys Val Arg Trp Pro Asp
 65                  70                  75                  80
Phe Asn Gln Glu Ala Tyr Val Gly Gly Thr Met Val Arg Ser Gly Gln
                 85                  90                  95
Asp Pro Tyr Ala Arg Asn Lys Phe Asn Gln Val Glu Ser Asp Lys Leu
            100                 105                 110
Arg Met Asp Arg Ala Ile Pro Asp Thr Arg His Asp Gln Cys Gln Arg
        115                 120                 125
Lys Gln Trp Arg Val Asp Leu Pro Ala Thr Ser Val Val Ile Thr Phe
    130                 135                 140
His Asn Glu Ala Arg Ser Ala Leu Leu Arg Thr Val Val Ser Val Leu
145                 150                 155                 160
Lys Lys Ser Pro Pro His Leu Ile Lys Glu Ile Ile Leu Val Asp Asp
                165                 170                 175
Tyr Ser Asn Asp Pro Glu Asp Gly Ala Leu Leu Gly Lys Ile Glu Lys
            180                 185                 190
Val Arg Val Leu Arg Asn Asp Arg Arg Glu Gly Leu Met Arg Ser Arg
        195                 200                 205
Val Arg Gly Ala Asp Ala Ala Gln Ala Lys Val Leu Thr Phe Leu Asp
    210                 215                 220
Ser His Cys Glu Cys Asn Glu His Trp Leu Glu Pro Leu Leu Glu Arg
225                 230                 235                 240
Val Ala Glu Asp Arg Thr Arg Val Val Ser Pro Ile Ile Asp Val Ile
                245                 250                 255
Asn Met Asp Asn Phe Gln Tyr Val Gly Ala Ser Ala Asp Leu Lys Gly
            260                 265                 270
Gly Phe Asp Trp Asn Leu Val Phe Lys Trp Asp Tyr Met Thr Pro Glu
        275                 280                 285
Gln Arg Arg Ser Arg Gln Gly Asn Pro Val Ala Pro Ile Lys Thr Pro
    290                 295                 300
Met Ile Ala Gly Gly Leu Phe Val Met Asp Lys Phe Tyr Phe Glu Glu
305                 310                 315                 320
Leu Gly Lys Tyr Asp Met Met Met Asp Val Trp Gly Gly Glu Asn Leu
                325                 330                 335
Glu Ile Ser Phe Arg Val Trp Gln Cys Gly Gly Ser Leu Glu Ile Ile
            340                 345                 350
Pro Cys Ser Arg Val Gly His Val Phe Arg Lys Gln His Pro Tyr Thr
        355                 360                 365
Phe Pro Gly Gly Ser Gly Thr Val Phe Ala Arg Asn Thr Arg Arg Ala
    370                 375                 380
Ala Glu Val Trp Met Asp Gl u Tyr Lys Asn Phe Tyr TyrAla Ala Val
385                 390                 395                 400
Pro Ser Ala Arg Asn Val Pro Tyr Gly Asn Ile Gln Ser Arg Leu Glu
                405                 410                 415
Leu Arg Lys Lys Leu Ser Cys Lys Pro Phe Lys Trp Tyr Leu Glu Asn
            420                 425                 430
Val Tyr Pro Glu Leu Arg Val Pro Asp His Gln Asp Ile Ala Phe Gly
        435                 440                 445
Ala Leu Gln Gln Gly Thr Asn Cys Leu Asp Thr Leu Gly His Phe Ala
    450                 455                 460
Asp Gly Val Val Gly Val Tyr Glu Cys His Asn Ala Gly Gly Asn Gln
465                 470                 475                 480
Glu Trp Ala Leu Thr Lys Glu Lys Ser Val Lys His Met Asp Leu Cys
                485                 490                 495
Leu Thr Val Val Asp Arg Ala Pro Gly Ser Leu Ile Lys Leu Gln Gly
            500                 505                 510
Cys Arg Glu Asn Asp Ser Arg Gln Lys Trp Glu Gln Ile Glu Gly Asn
        515                 520                 525
Ser Lys Leu Arg His Val Gly Ser Asn Leu Cys Leu Asp Ser Arg Thr
    530                 535                 540
Ala Lys Ser Gly Gly Leu Ser Val Glu Val Cys Gly Pro Ala Leu Ser
545                 550                 555                 560
Gln Gln Trp Lys Phe Thr Leu Asn Leu Gln Gln
                565                 570
<210>20
<211>1713
<212>DNA
<213>智人(Homo sapiens)
<220>
<223>人全长UDP-N-乙酰半乳糖胺基转移酶2(GaINAcT2)
<400>20
atgcggcggc gctcgcggat gctgctctgc ttcgccttcc tgtgggtgct gggcatcgcc 60
tactacatgt actcgggggg cggctctgcg ctggccgggg gcgcgggcgg cggcgccggc 120
aggaaggagg actggaatga aattgacccc attaaaaaga aagaccttca tcacagcaat 180
ggagaagaga aagcacaaag catggagacc ctccctccag ggaaagtacg gtggccagac 240
tttaaccagg aagcttatgt tggagggacg atggtccgct ccgggcagga cccttacgcc 300
cgcaacaagt tcaaccaggt ggagagtgat aagcttcgaa tggacagagc catccctgac 360
acccggcatg accagtgtca gcggaagcag tggcgggtgg atctgccggc caccagcgtg 420
gtgatcacgt ttcacaatga agccaggtcg gccctactca ggaccgtggt cagcgtgctt 480
aagaaaagcc cgccccatct cataaaagaa atcatcttgg tggatgacta cagcaatgat 540
cctgaggacg gggctctctt ggggaaaatt gagaaagtgc gagttcttag aaatgatcga 600
cgagaaggcc tcatgcgctc acgggttcgg ggggccgatg ctgcccaagc caaggtcctg 660
accttcctgg acagtcactg cgagtgtaat gagcactggc tggagcccct cctggaaagg 720
gtggcggagg acaggactcg ggttgtgtca cccatcatcg atgtcattaa tatggacaac 780
tttcagtatg tgggggcatc tgctgacttg aagggcggtt ttgattggaa cttggtattc 840
aagtgggatt acatgacgcc tgagcagaga aggtcccggc aggggaaccc agtcgcccct 900
ataaaaaccc ccatgattgc tggtgggctg tttgtgatgg ataagttcta ttttgaagaa 960
ctggggaagt acgacatgat gatggatgtg tggggaggag agaacctaga gatctcgttc 1020
cgcgtgtggc agtgtggtgg cagcctggag atcatcccgt gcagccgtgt gggacacgtg 1080
ttccggaagc agcaccccta cacgttcccg ggtggcagtg gcactgtctt tgcccgaaac 1140
acccgccggg cagcagaggt ctggatggat gaatacaaaa atttctatta tgcagcagtg 1200
ccttctgcta gaaacgttcc ttatggaaat attcagagca gattggagct taggaagaaa 1260
ctcagctgca agcctttcaa atggtacctt gaaaatgtct atccagagtt aagggttcca 1320
gaccatcagg atatagcttt tggggccttg cagcagggaa ctaactgcct cgacactttg 1380
ggacactttg ctgatggtgt ggttggagtt tatgaatgtc acaatgctgg gggaaaccag 1440
gaatgggcct tgacgaagga gaagtcggtg aagcacatgg atttgtgcct tactgtggtg 1500
gaccgggcac cgggctctct tataaagctg cagggctgcc gagaaaatga cagcagacag 1560
aaatgggaac agatcgaggg caactccaag ctgaggcacg tgggcagcaa cctgtgcctg 1620
gacagtcgca cggccaagag cgggggccta agcgtggagg tgtgtggccc ggccctttcg 1680
cagcagtgga agttcacgct caacctgcag cag                              1713
<210>21
<211>520
<212>PRT
<213>人工序列
<220>
<223>人工序列描述:Δ51 UDP-N-乙酰半乳糖胺基转移酶2(Δ51GalNAcT2)
<400>21
Lys Lys Lys Asp Leu His His Ser Asn Gly Glu Glu Lys Ala Gln Ser
  1               5                 10                  15
Met Glu Thr Leu Pro Pro Gly Lys Val Arg Trp Pro Asp Phe Asn Gln
             20                  25                  30
Glu Ala Tyr Val Gly Gly Thr Met Val Arg Ser Gly Gln Asp Pro Tyr
         35                  40                  45
Ala Arg Asn Lys Phe Asn Gln Val Glu Ser Asp Lys Leu Arg Met Asp
     50                  55                  60
Arg Ala Ile Pro Asp Thr Arg His Asp Gln Cys Gln Arg Lys Gln Trp
 65                  70                  75                  80
Arg Val Asp Leu Pro Ala Thr Ser Val Val Ile Thr Phe His Asn Glu
                 85                  90                  95
Ala Arg Ser Ala Leu Leu Arg Thr Val Val Ser Val Leu Lys Lys Ser
            100                 105                 110
Pro Pro His Leu Ile Lys Glu Ile Ile Leu Val Asp Asp Tyr Ser Asn
        115                 120                 125
Asp Pro Glu Asp Gly Ala Leu Leu Gly Lys Ile Glu Lys Val Arg Val
    130                 135                 140
Leu Arg Asn Asp Arg Arg Glu Gly Leu Met Arg Ser Arg Val Arg Gly
145                 150                 155                 160
Ala Asp Ala Ala Gln Ala Lys Val Leu Thr Phe Leu Asp Ser His Cys
                165                 170                 175
Glu Cys Asn Glu His Trp Leu Glu Pro Leu Leu Glu Arg Val Ala Glu
            180                 185                 190
Asp Arg Thr Arg Val Val Ser Pro Ile Ile Asp Val Ile Asn Met Asp
        195                 200                 205
Asn Phe Gln Tyr Val Gly Ala Ser Ala Asp Leu Lys Gly Gly Phe Asp
    210                 215                 220
Trp Asn Leu Val Phe Lys Trp Asp Tyr Met Thr Pro Glu Gln Arg Arg
225                 230                 235                 240
Ser Arg Gln Gly Asn Pro Val Ala Pro Ile Lys Thr Pro Met Ile Ala
                245                 250                 255
Gly Gly Leu Phe Val Met Asp Lys Phe Tyr Phe Glu Glu Leu Gly Lys
            260                 265                 270
Tyr Asp Met Met Met Asp Val Trp Gly Gly Glu Asn Leu Glu Ile Ser
        275                 280                 285
Phe Arg Val Trp Gln Cys Gly Gly Ser Leu Glu Ile Ile Pro Cys Ser
    290                 295                 300
Arg Val Gly His Val Phe Arg Lys Gln His Pro Tyr Thr Phe Pro Gly
305                 310                 315                 320
Gly Ser Gly Thr Val Phe Ala Arg Asn Thr Arg Arg Ala Ala Glu Val
                325                 330                 335
Trp Met Asp Glu Tyr Lys Asn Phe Tyr Tyr Ala Ala Val Pro Ser Ala
            340                 345                 350
Arg Asn Val Pro Tyr Gly Asn Ile Gln Ser Arg Leu Glu Leu Arg Lys
        355                 360                 365
Lys Leu Ser Cys Lys Pro Phe Lys Trp Tyr Leu Glu Asn Val Tyr Pro
    370                 375                 380
Glu Leu Arg Val Pro Asp His Gln Asp Ile Ala Phe Gly Ala Leu Gln
385                 390                 395                 400
Gln Gly Thr Asn Cys Leu Asp Thr Leu Gly His Phe Ala Asp Gly Val
                405                 410                 415
Val Gly Val Tyr Glu Cys His Asn Ala Gly Gly Asn Gln Glu Trp Ala
            420                 425                 430
Leu Thr Lys Glu Lys Ser Val Lys His Met Asp Leu Cys Leu Thr Val
        435                 440                 445
Val Asp Arg Ala Pro Gly Ser Leu Ile Lys Leu Gln Gly Cys Arg Glu
    450                 455                 460
Asn Asp Ser Arg Gln Lys Trp Glu Gln Ile Glu Gly Asn Ser Lys Leu
465                 470                 475                 480
Arg His Val Gly Ser Asn Leu Cys Leu Asp Ser Arg Thr Ala Lys Ser
                485                 490                 495
Gly Gly Leu Ser Val Glu Val Cys Gly Pro Ala Leu Ser Gln Gln Trp
            500                 505                 510
Lys Phe Thr Leu Asn Leu Gln Gln
        515                 520
<210>22
<211>1560
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:Δ51 UDP-N-乙酰半乳糖胺基转移酶2(Δ51GalNAcT2)
<400>22
aaaaagaaag accttcatca cagcaatgga gaagagaaag cacaaagcat ggagaccctc 60
cctccaggga aagtacggtg gccagacttt aaccaggaag cttatgttgg agggacgatg 120
gtccgctccg ggcaggaccc ttacgcccgc aacaagttca accaggtgga gagtgataag 180
cttcgaatgg acagagccat ccctgacacc cggcatgacc agtgtcagcg gaagcagtgg 240
cgggtggatc tgccggccac cagcgtggtg atcacgtttc acaatgaagc caggtcggcc 300
ctactcagga ccgtggtcag cgtgcttaag aaaagcccgc cccatctcat aaaagaaatc 360
atcttggtgg atgactacag caatgatcct gaggacgggg ctctcttggg gaaaattgag 420
aaagtgcgag ttcttagaaa tgatcgacga gaaggcctca tgcgctcacg ggttcggggg 480
gccgatgctg cccaagccaa ggtcctgacc ttcctggaca gtcactgcga gtgtaatgag 540
cactggctgg agcccctcct ggaaagggtg gcggaggaca ggactcgggt tgtgtcaccc 600
atcatcgatg tcattaatat ggacaacttt cagtatgtgg gggcatctgc tgacttgaag 660
ggcggttttg attggaactt ggtattcaag tgggattaca tgacgcctga gcagagaagg 720
tcccggcagg ggaacccagt cgcccctata aaaaccccca tgattgctgg tgggctgttt 780
gtgatggata agttctattt tgaagaactg gggaagtacg acatgatgat ggatgtgtgg 840
ggaggagaga acctagagat ctcgttccgc gtgtggcagt gtggtggcag cctggagatc 900
atcccgtgca gccgtgtggg acacgtgttc cggaagcagc acccctacac gttcccgggt 960
ggcagtggca ctgtctttgc ccgaaacacc cgccgggcag cagaggtctg gatggatgaa 1020
tacaaaaatt tctattatgc agcagtgcct tctgctagaa acgttcctta tggaaatatt 1080
cagagcagat tggagcttag gaagaaactc agctgcaagc ctttcaaatg gtaccttgaa 1140
aatgtctatc cagagttaag ggttccagac catcaggata tagcttttgg ggccttgcag 1200
cagggaacta actgcctcga cactttggga cactttgctg atggtgtggt tggagtttat 1260
gaatgtcaca atgctggggg aaaccaggaa tgggccttga cgaaggagaa gtcggtgaag 1320
cacatggatt tgtgccttac tgtggtggac cgggcaccgg gctctcttat aaagctgcag 1380
ggctgccgag aaaatgacag cagacagaaa tgggaacaga tcgagggcaa ctccaagctg 1440
aggcacgtgg gcagcaacct gtgcctggac agtcgcacgg ccaagagcgg gggcctaagc 1500
gtggaggtgt gtggcccggc cctttcgcag cagtggaagt tcacgctcaa cctgcagcag 1560
<210>23
<211>691
<212>PRT
<213>人工序列
<220>
<223>人工序列描述:麦芽糖结合蛋白-Gal β-1,3-GalNAc
     α-2,3-唾液酸转移酶1(MBP-ST3Gal1)融合蛋白
<400>23
Met Lys Ile Glu Glu Gly Lys Leu Val Ile Trp Ile Asn Gly Asp Lys
  1               5                  10                  15
Gly Tyr Asn Gly Leu Ala Glu Val Gly Lys Lys Phe Glu Lys Asp Thr
            20                  25                  30
Gly Ile Lys Val Thr Val Glu His Pro Asp Lys Leu Glu Glu Lys Phe
        35                  40                  45
Pro Gln Val Ala Ala Thr Gly Asp Gly Pro Asp Ile Ile Phe Trp Ala
    50                  55                  60
His Asp Arg Phe Gly Gly Tyr Ala Gln Ser Gly Leu Leu Ala Glu Ile
65                  70                  75                  80
Thr Pro Asp Lys Ala Phe Gln Asp Lys Leu Tyr Pro Phe Thr Trp Asp
                85                  90                  95
Ala Val Arg Tyr Asn Gly Lys Leu Ile Ala Tyr Pro Ile Ala Val Glu
            100                 105                 110
Ala Leu Ser Leu Ile Tyr Asn Lys Asp Leu Leu Pro Asn Pro Pro Lys
        115                 120                 125
Thr Trp Glu Glu Ile Pro Ala Leu Asp Lys Glu Leu Lys Ala Lys Gly
    130                 135                 140
Lys Ser Ala Leu Met Phe Asn Leu Gln Glu Pro Tyr Phe Thr Trp Pro
145                 150                 155                 160
Leu Ile Ala Ala Asp Gly Gly Tyr Ala Phe Lys Tyr Glu Asn Gly Lys
                165                 170                 175
Tyr Asp Ile Lys Asp Val Gly Val Asp Asn Ala Gly Ala Lys Ala Gly
            180                 185                 190
Leu Thr Phe Leu Val Asp Leu Ile Lys Asn Lys His Met Asn Ala Asp
        195                 200                 205
Thr Asp Tyr Ser Ile Ala Glu Ala Ala Phe Asn Lys Gly Glu Thr Ala
    210                 215                 220
Met Thr Ile Asn Gly Pro Trp Ala Trp Ser Asn Ile Asp Thr Ser Lys
225                 230                 235                 240
Val Asn Tyr Gly Val Thr Val Leu Pro Thr Phe Lys Gly Gln Pro Ser
                245                 250                 255
Lys Pro Phe Val Gly Val Leu Ser Ala Gly Ile Asn Ala Ala Ser Pro
            260                 265                 270
Asn Lys Glu Leu Ala Lys Glu Phe Leu Glu Asn Tyr Leu Leu Thr Asp
        275                 280                 285
Glu Gly Leu Glu Ala Val Asn Lys Asp Lys Pro Leu Gly Ala Val Ala
    290                 295                 300
Leu Lys Ser Tyr Glu Glu Glu Leu Ala Lys Asp Pro Arg Ile Ala Ala
305                 310                 315                 320
Thr Met Glu Asn Ala Gln Lys Gly Glu Ile Met Pro Asn Ile Pro Gln
                325                 330                 335
Met Ser Ala Phe Trp Tyr Ala Val Arg Thr Ala Val Ile Asn Ala Ala
            340                 345                 350
Ser Gly Arg Gln Thr Val Asp Glu Ala Leu Lys Asp Ala Gln Thr Asn
        355                 360                 365
Ser Ser Ser Asn Asn Asn Asn Asn Asn Asn Asn Asn Asn Leu Gly Ile
    370                 375                 380
Glu Gly Arg Ile Ser Glu Phe Gly Ser Glu Leu Ser Glu Asn Phe Lys
385                 390                 395                 400
Lys Leu Met Lys Tyr Pro Tyr Arg Pro Cys Thr Cys Thr Arg Cys Ile
                405                 410                 415
Glu Glu Gln Arg Val Ser Ala Trp Phe Asp Glu Arg Phe Asn Arg Ser
            420                 425                 430
Met Gln Pro Leu Leu Thr Ala Lys Asn Ala His Leu Glu Glu Asp Thr
        435                 440                 445
Tyr Lys Trp Trp Leu Arg Leu Gln Arg Glu Lys Gln Pro Asn Asn Leu
    450                 455                 460
Asn Asp Thr Ile Arg Glu Leu Phe Gln Val Val Pro Gly Asn Val Asp
465                 470                 475                 480
Pro Leu Leu Glu Lys Arg Leu Val Ser Cys Arg Arg Cys Ala Val Val
                485                 490                 495
Gly Asn Ser Gly Asn Leu Lys Glu Ser Tyr Tyr Gly Pro Gln Ile Asp
            500                 505                 510
Ser His Asp Phe Val Leu Arg Met Asn Lys Ala Pro Thr Glu Gly Phe
        515                 520                 525
Glu Ala Asp Val Gly Ser Lys Thr Thr His His Phe Val Tyr Pro Glu
    530                 535                 540
Ser Phe Arg Glu Leu Ala Gln Glu Val Ser Met Ile Leu Val Pro Phe
545                 550                 555                 560
Lys Thr Thr Asp Leu Glu Trp Val Ile Ser Ala Thr Thr Thr Gly Arg
                565                 570                 575
Ile Ser His Thr Tyr Val Pro Val Pro Ala Lys Ile Lys Val Lys Lys
            580                 585                 590
Glu Lys Ile Leu Ile Ty rHis Pro Ala Phe Ile Lys Tyr Val Phe Asp
        595                 600                 605
Arg Trp Leu Gln Gly His Gly Arg Tyr Pro Ser Thr Gly Ile Leu Ser
    610                 615                 620
Val Ile Phe Ser Leu His Ile Cys Asp Glu Val Asp Leu Tyr Gly Phe
625                 630                 635                 640
Gly Ala Asp Ser Lys Gly Asn Trp His His Tyr Trp Glu Asn Asn Pro
                645                 650                 655
Ser Ala Gly Ala Phe Arg Lys Thr Gly Val His Asp Gly Asp Phe Glu
            660                 665                 670
Ser Asn Val Thr Thr Ile Leu Ala Ser Ile Asn Lys Ile Arg Ile Phe
        675                 680                 685
Lys Gly Arg
    690
<210>24
<211>841
<212>PRT
<213>人工序列
<220>
<223>人工序列描述:麦芽糖结合蛋白-淀粉结合域-Gal β-1,3-GalNAc
     α-2,3-唾液酸转移酶1(MBP-SBD-ST3Gal 1)融合蛋白
<400>24
Met Lys Ile Glu Glu Gly Lys Leu Val Ile Trp Ile Asn Gly Asp Lys
  1               5                  10                  15
Gly Tyr Asn Gly Leu Ala Glu Val Gly Lys Lys Phe Glu Lys Asp Thr
             20                  25                  30
Gly Ile Lys Val Thr Val Glu His Pro Asp Lys Leu Glu Glu Lys Phe
         35                  40                  45
Pro Gln Val Ala Ala Thr Gly Asp Gly Pro Asp Ile Ile Phe Trp Ala
     50                  55                  60
His Asp Arg Phe Gly Gly Tyr Ala Gln Ser Gly Leu Leu Ala Glu Ile
 65                  70                  75                  80
Thr Pro Asp Lys Ala Phe Gln Asp Lys Leu Tyr Pro Phe Thr Trp Asp
                 85                  90                  95
Ala Val Arg Tyr Asn Gly Lys Leu Ile Ala Tyr Pro Ile Ala Val Glu
            100                 105                 110
Ala Leu Ser Leu Ile Tyr Asn Lys Asp Leu Leu Pro Asn Pro Pro Lys
        115                 120                 125
Thr Trp Glu Glu Ile Pro Ala Leu Asp Lys Glu Leu Lys Ala Lys Gly
    130                 135                 140
Lys Ser Ala Leu Met Phe Asn Leu Gln Glu Pro Tyr Phe Thr Trp Pro
145                 150                 155                 160
Leu Ile Ala Ala Asp Gly Gly Tyr Ala Phe Lys Tyr Glu Asn Gly Lys
                165                 170                 175
Tyr Asp Ile Lys Asp Val Gly Val Asp Asn Ala Gly Ala Lys Ala Gly
            180                 185                 190
Leu Thr Phe Leu Val Asp Leu Ile Lys Asn Lys His Met Asn Ala Asp
        195                 200                 205
Thr Asp Tyr Ser Ile Ala Glu Ala Ala Phe Asn Lys Gly Glu Thr Ala
    210                 215                 220
Met Thr Ile Asn Gly Pro Trp Ala Trp Ser Asn Ile Asp Thr Ser Lys
225                 230                 235                 240
Val Asn Tyr Gly Val Thr Val Leu Pro Thr Phe Lys Gly Gln Pro Ser
                245                 250                 255
Lys Pro Phe Val Gly Val Leu Ser Ala Gly Ile Asn Ala Ala Ser Pro
            260                 265                 270
Asn Lys Glu Leu Ala Lys Glu Phe Leu Glu Asn Tyr Leu Leu Thr Asp
        275                 280                 285
Glu Gly Leu Glu Ala Val Asn Lys Asp Lys Pro Leu Gly Ala Val Ala
    290                 295                 300
Leu Lys Ser Tyr Glu Glu Glu Leu Ala Lys Asp Pro Arg Ile Ala Ala
305                 310                 315                 320
Thr Met Glu Asn Ala Gln Lys Gly Glu Ile Met Pro Asn Ile Pro Gln
                325                 330                 335
Met Ser Ala Phe Trp Tyr Ala Val Arg Thr Ala Val Ile Asn Ala Ala
            340                 345                 350
Ser Gly Arg Gln Thr Val Asp Glu Ala Leu Lys Asp Ala Gln Thr Asn
        355                 360                 365
Ser Ser Ser Asn Asn Asn Asn Asn Asn Asn Asn Asn Asn Leu Gly Ile
    370                 375                 380
Glu Gly Arg Ile Ser Glu Phe Gly Ser Ile Val Ala Thr Gly Gly Thr
385                 390                 395                 400
Thr Thr Thr Ala Thr Pro Thr Gly Ser Gly Ser Val Thr Ser Thr Ser
                405                 410                 415
Lys Thr Thr Ala Thr Ala Ser Lys Thr Ser Thr Ser Thr Ser Ser Thr
            420                 425                 430
Ser Cys Thr Thr Pro Thr Ala Val Ala Val Thr Phe Asp Leu Thr Ala
        435                 440                 445
Thr Thr Thr Tyr Gly Glu Asn Ile Tyr Leu Val Gly Ser Ile Ser Gln
    450                 455                 460
Leu Gly Asp Trp Glu Thr Ser Asp Gly Ile Ala Leu Ser Ala Asp Lys
465                 470                 475                 480
Tyr Thr Ser Ser Asp Pro Leu Trp Tyr Val Thr Val Thr Leu Pro Ala
                485                 490                 495
Gly Glu Ser Phe Glu Tyr Lys Phe Ile Arg Ile Glu Ser Asp Asp Ser
            500                 505                 510
Val Glu Trp Glu Ser Asp Pro Asn Arg Glu Tyr Thr Val Pro Gln Ala
        515                 520                 525
Cys Gly Thr Ser Thr Ala Thr Val Thr Asp Thr Trp Arg Gly Ser Glu
    530                 535                 540
Leu Ser Glu Asn Phe Lys Lys Leu Met Lys Tyr Pro Ty rArg Pro Cys
545                 550                 555                 560
Thr Cys Thr Arg Cys Ile Glu Glu Gln Arg Val Ser Ala Trp Phe Asp
                565                 570                 575
Glu Arg Phe Asn Arg Ser Met Gln Pro Leu Leu Thr Ala Lys Asn Ala
            580                 585                 590
His Leu Glu Glu Asp Thr Tyr Lys Trp Trp Leu Arg Leu Gln Arg Glu
        595                 600                 605
Lys Gln Pro Asn Asn Leu Asn Asp Thr Ile Arg Glu Leu Phe Gln Val
    610                 615                 620
Val Pro Gly Asn Val Asp Pro Leu Leu Glu Lys Arg Leu Val Ser Cys
625                 630                 635                 640
Arg Arg Cys Ala Val Val Gly Asn Ser Gly Asn Leu Lys Glu Ser Tyr
                645                 650                 655
Tyr Gly Pro Gln Ile Asp Ser His Asp Phe Val Leu Arg Met Asn Lys
            660                 665                 670
Ala Pro Thr Glu Gly Phe Glu Ala Asp Val Gly Ser Lys Thr Thr His
        675                 680                 685
His Phe Val Tyr Pro Glu Ser Phe Arg Glu Leu Ala Gln Glu Val Ser
    690                 695                 700
Met Ile Leu Val Pro Phe Lys Thr Thr Asp Leu Glu Trp Val Ile Ser
705                 710                 715                 720
Ala Thr Thr Thr Gly Arg Ile Ser His Thr Tyr Val Pro Val Pro Ala
                725                 730                 735
Lys Ile Lys Val Lys Lys Glu Lys Ile Leu Ile Tyr His Pro Ala Phe
            740                 745                 750
Ile Lys Tyr Val Phe Asp Arg Trp Leu Gln Gly His Gly Arg Tyr Pro
        755                 760                 765
Ser Thr Gly Ile Leu Ser Val Ile Phe Ser Leu His Ile Cys Asp Glu
    770                 775                 780
Val Asp Leu Tyr Gly Phe Gly Ala Asp Ser Lys Gly Asn Trp His His
785                 790                 795                 800
Tyr Trp Glu Asn Asn Pro Ser Ala Gly Ala Phe Arg Lys Thr Gly Val
                805                 810                 815
His Asp Gly Asp Phe Glu Ser Asn Val Thr Thr Ile Leu Ala Ser Ile
            820                 825                 830
Asn Lys Ile Arg Ile Phe Lys Gly Arg
        835                 840
<210>25
<211>793
<212>PRT
<213>人工序列
<220>
<223>人工序列描述:麦芽糖结合蛋白-α-N-乙酰氨基半乳糖苷
     α-2,6-唾液酸转移酶I小鼠截短融合蛋白(MBP-mST6GalNAcI S127)
<220>
<221>MOD_RES
<222>(708)
<223>Xaa=任何氨基酸
<400>25
Met Lys Ile Glu Glu Gly Lys Leu Val Ile Trp Ile Asn Gly Asp Lys
  1               5                  10                  15
Gly Tyr Asn Gly Leu Ala Glu Val Gly Lys Lys Phe Glu Lys Asp Thr
             20                  25                  30
Gly Ile Lys Val Thr Val Glu His Pro Asp Lys Leu Glu Glu Lys Phe
         35                  40                  45
Pro Gln Val Ala Ala Thr Gly Asp Gly Pro Asp Ile Ile Phe Trp Ala
     50                  55                  60
His Asp Arg Phe Gly Gly Tyr Ala Gln Ser Gly Leu Leu Ala Glu Ile
 65                  70                  75                  80
Thr Pro Asp Lys Ala Phe Gln Asp Lys Leu Tyr Pro Phe Thr Trp Asp
                 85                  90                  95
Ala Val Arg Tyr Asn Gly Lys Leu Ile Ala Tyr Pro Ile Ala Val Glu
            100                 105                 110
Ala Leu Ser Leu Ile Tyr Asn Lys Asp Leu Leu Pro Asn Pro Pro Lys
        115                 120                 125
Thr Trp Glu Glu Ile Pro Ala Leu Asp Lys Glu Leu Lys Ala Lys Gly
    130                 135                 140
Lys Ser Ala Leu Met Phe Asn Leu Gln Glu Pro Tyr Phe Thr Trp Pro
145                 150                 155                 160
Leu Ile Ala Ala Asp Gly Gly Tyr Ala Phe Lys Tyr Glu Asn Gly Lys
                165                 170                 175
Tyr Asp Ile Lys Asp Val Gly Val Asp Asn Ala Gly Ala Lys Ala Gly
            180                 185                 190
Leu Thr Phe Leu Val Asp Leu Ile Lys Ash Lys His Met Asn Ala Asp
        195                 200                 205
Thr Asp Tyr Ser Ile Ala Glu Ala Ala Phe Asn Lys Gly Glu Thr Ala
    210                 215                 220
Met Thr Ile Asn Gly Pro Trp Ala Trp Ser Asn Ile Asp Thr Ser Lys
225                 230                 235                 240
Val Asn Tyr Gly Val Thr Val Leu Pro Thr Phe Lys Gly Gln Pro Ser
                245                 250                 255
Lys Pro Phe Val Gly Val Leu Ser Ala Gly Ile Asn Ala Ala Ser Pro
            260                 265                 270
Asn Lys Glu Leu Ala Lys Glu Phe Leu Glu Asn Tyr Leu Leu Thr Asp
        275                 280                 285
Glu Gly Leu Glu Ala Val Asn Lys Asp Lys Pro Leu Gly Ala Val Ala
    290                 295                 300
Leu Lys Ser Tyr Glu Glu Glu Leu Ala Lys Asp Pro Arg Ile Ala Ala
305                 310                 315                 320
Thr Met Glu Asn Ala Gln Lys Gly Glu Ile Met Pro Asn Ile Pro Gln
                325                 330                 335
Met Ser Ala Phe Trp Tyr Ala Val Arg Thr Ala Val Ile Asn Ala Ala
            340                 345                 350
Ser Gly Arg Gln Thr Val Asp Glu Ala Leu Lys Asp Ala Gln Thr Asn
        355                 360                 365
Ser Ser Ser Asn Asn Asn Asn Asn Asn Asn Asn Asn Asn Leu Gly Ile
    370                 375                 380
Glu Gly Arg Ile Ser Glu Phe Gly Ser Ser Glu His Leu Asp Lys Val
385                 390                 395                 400
Pro Arg Thr Pro Gly Ala Leu Ser Thr Arg Lys Thr Pro Met Ala Thr
                405                 410                 415
Gly Ala Val Pro Ala Lys Lys Lys Val Val Gln Ala Thr Lys Ser Pro
            420                 425                 430
Ala Ser Ser Pro His Pro Thr Thr Arg Arg Arg Gln Arg Leu Lys Ala
        435                 440                 445
Ser Glu Phe Lys Ser Glu Pro Arg Trp Asp Phe Glu Glu Glu Tyr Ser
    450                 455                 460
Leu Asp Met Ser Ser Leu Gln Thr Asn Cys Ser Ala Ser Val Lys Ile
465                 470                 475                 480
Lys Ala Ser Lys Ser Pro Trp Leu Gln Asn Ile Phe Leu Pro Asn Ile
                485                 490                 495
Thr Leu Phe Leu Asp Ser Gly Arg Phe Thr Gln Ser Glu Trp Asn Arg
            500                 505                 510
Leu Glu His Phe Ala Pro Pro Phe Gly Phe Met Glu Leu Asn Gln Ser
        515                 520                 525
Leu Val Gln Lys Val Val Thr Arg Phe Pro Pro Val Arg Gln Gln Gln
    530                 535                 540
Leu Leu Leu Ala Ser Leu Pro Thr Gly Tyr Ser Lys Cys Ile Thr Cys
545                 550                 555                 560
Ala Val Val Gly Asn Gly Gly Ile Leu Asn Asp Ser Arg Val Gly Arg
                565                 570                 575
Glu Ile Asp Ser His Asp Tyr Val Phe Arg Leu Ser Gly Ala Val Ile
            580                 585                 590
Lys Gly Tyr Glu Gln Asp Val Gly Thr Arg Thr Ser Phe Tyr Gly Phe
        595                 600                 605
Thr Ala Phe Ser Leu Thr Gln Ser Ile Leu Ile Leu Gly Arg Arg Gly
    610                 615                 620
Phe Gln His Val Pro Leu Gly Lys Asp Val Arg Tyr Leu His Phe Leu
625                 630                 635                 640
Glu Gly Thr Arg Asn Tyr Glu Trp Leu Glu Ala Met Phe Leu Asn Gln
                645                 650                 655
Thr Leu Ala Lys Thr His Leu Ser Trp Phe Arg His Arg Pro Gln Glu
            660                 665                 670
Ala Phe Arg Asn Ala Leu Asp Leu Asp Arg Tyr Leu Leu Leu His Pro
        675                 680                 685
Asp Phe Leu Arg Tyr Met Lys Asn Arg Phe Leu Arg Ser Lys Thr Leu
    690                 695                 700
Asp Thr Ala Xaa Trp Arg Ile Tyr Arg Pro Thr Thr Gly Ala Leu Leu
705                 710                 715                 720
Leu Leu Thr Ala Leu His Leu Cys Asp Lys Val Ser Ala Tyr Gly Phe
                725                 730                 735
Ile Thr Glu Gly His Glu Arg phe Ser Asp His Tyr Tyr Asp Thr Ser
            740                 745                 750
Trp Lys Arg Leu Ile Phe Tyr Ile Asn His Asp Phe Arg Leu Glu Arg
        755                 760                 765
Met Val Trp Lys Arg Leu His Asp Glu Gly Ile Ile Trp Leu Tyr Gln
    770                 775                 780
Arg Pro Gln Ser Asp Lys Ala Lys Asn
785                 790
<210>26
<211>958
<212>PRT
<213>人工序列
<220>
<223>人工序列描述:麦芽糖结合蛋白-α-N-乙酰氨基半乳糖苷
     α-2,6-唾液酸转移酶I人截短融合蛋白(MBP-hST6Gal NAcI K36)
<400>26
Met Lys Ile Glu Glu Gly Lys Leu Val Ile Trp Ile Asn Gly Asp Lys
  1               5                  10                  15
Gly Tyr Asn Gly Leu Ala Glu Val Gly Lys Lys Phe Glu Lys Asp Thr
             20                  25                  30
Gly Ile Lys Val Thr Val Glu His Pro Asp Lys Leu Glu Glu Lys Phe
         35                  40                 45
Pro Gln Val Ala Ala Thr Gly Asp Gly Pro Asp Ile Ile Phe Trp Ala
     50                  55                  60
His Asp Arg Phe Gly Gly Tyr Ala Gln Ser Gly Leu Leu Ala Glu Ile
 65                  70                  75                  80
Thr Pro Asp Lys Ala Phe Gln Asp Lys Leu Tyr Pro Phe Thr Trp Asp
                 85                  90                  95
Ala Val Arg Tyr Asn Gly Lys Leu Ile Ala Tyr Pro Ile Ala Val Glu
            100                 105                 110
Ala Leu Ser Leu Ile Tyr Asn Lys Asp Leu Leu Pro Asn Pro Pro Lys
        115                 120                 125
Thr Trp Glu Glu Ile Pro Ala Leu Asp Lys Glu Leu Lys Ala Lys Gly
    130                 135                 140
Lys Ser Ala Leu Met Phe Asn Leu Gln Glu Pro Tyr Phe Thr Trp Pro
145                 150                 155                 160
Leu Ile Ala Ala Asp Gly Gly Tyr Ala Phe Lys Tyr Glu Asn Gly Lys
                165                 170                 175
Tyr Asp Ile Lys Asp Val Gly Val Asp Asn Ala Gly Ala Lys Ala Gly
            180                 185                 190
Leu Thr Phe Leu Val Asp Leu Ile Lys Asn Lys His Met Asn Ala Asp
        195                 200                 205
Thr Asp Tyr Ser Ile Ala Glu Ala Ala Phe Asn Lys Gly Glu Thr Ala
    210                 215                 220
Met Thr Ile Asn Gly Pro Trp Ala Trp Ser Asn Ile Asp Thr Ser Lys
225                 230                 235                 240
Val Asn Tyr Gly Val Thr Val Leu Pro Thr Phe Lys Gly Gln Pro Ser
                245                 250                 255
Lys Pro Phe Val Gly Val Leu Ser Ala Gly Ile Asn Ala Ala Ser Pro
            260                 265                 270
Asn Lys Glu Leu Ala Lys Glu Phe Leu Glu Asn Tyr Leu Leu Thr Asp
        275                 280                 285
Glu Gly Leu Glu Ala Val Asn Lys Asp Lys Pro Leu Gly Ala Val Ala
    290                 295                 300
Leu Lys Ser Tyr Glu Glu Glu Leu Ala Lys Asp Pro Arg Ile Ala Ala
305                 310                 315                 320
Thr Met Glu Asn Ala Gln Lys Gly Glu Ile Met Pro Asn Ile Pro Gln
                325                 330                 335
Met Ser Ala Phe Trp Tyr Ala Val Arg Thr Ala Val Ile Asn Ala Ala
            340                 345                 350
Ser Gly Arg Gln Thr Val Asp Glu Ala Leu Lys Asp Ala Gln Thr Asn
        355                 360                 365
Ser Ser Ser Asn Asn Asn Asn Asn Asn Asn Asn Asn Asn Leu Gly Ile
    370                 375                 380
Glu Gly Arg Ile Ser Glu Phe Gly Ser Lys Glu Pro Gln Thr Lys Pro
385                 390                 395                 400
Ser Arg His Gln Arg Thr Glu Asn I1e Lys Glu Arg Ser Leu Gln Ser
                405                 410                 415
Leu Ala Lys Pro Lys Ser Gln Ala Pro Thr Arg Ala Arg Arg Thr Thr
            420                 425                 430
Ile Tyr Ala Glu Pro Val Pro Glu Asn Asn Ala Leu Asn Thr Gln Thr
        435                 440                 445
Gln Pro Lys Ala His Thr Thr Gly Asp Arg Gly Lys Glu Ala Asn Gln
    450                 455                 460
Ala Pro Pro Glu Glu Gln Asp Lys Val Pro His Thr Ala Gln Arg Ala
465                 470                 475                 480
Ala Trp Lys Ser Pro Glu Lys Glu Lys Thr Met Val Asn Thr Leu Ser
                 485                 490                 495
Pro Arg Gly Gln Asp Ala Gly Met Ala Ser Gly Arg Thr Glu Ala Gln
            500                 505                 510
Ser Trp Lys Ser Gln Asp Thr Lys Thr Thr Gln Gly Asn Gly Gly Gln
        515                 520                 525
Thr Arg Lys Leu Thr Ala Ser Arg Thr Val Ser Glu Lys His Gln Gly
    530                 535                 540
Lys Ala Ala Thr Thr Ala Lys Thr Leu Ile Pro Lys Ser Gln His Arg
545                 550                 555                 560
Met Leu Ala Pro Thr Gly Ala Val Ser Thr Arg Thr Arg Gln Lys Gly
                565                 570                 575
Val Thr Thr Ala Val Ile Pro Pro Lys Glu Lys Lys Pro Gln Ala Thr
            580                 585                 590
Pro Pro Pro Ala Pro Phe Gln Ser Pro Thr Thr Gln Arg Asn Gln Arg
        595                 600                 605
Leu Lys Ala Ala Asn Phe Lys Ser Glu Pro Arg Trp Asp Phe Glu Glu
    610                 615                 620
Lys Tyr Ser Phe Glu Ile Gly Gly Leu Gln Thr Thr Cys Pro Asp Ser
625                 630                 635                 640
Val Lys Ile Lys Ala Ser Lys Ser Leu Trp Leu Gln Lys Leu Phe Leu
                645                 650                 655
Pro Asn Leu Thr Leu Phe Leu Asp Ser Arg His Phe Asn Gln Ser Glu
            660                 665                 670
Trp Asp Arg Leu Glu His Phe Ala Pro Pro Phe Gly Phe Met Glu Leu
        675                 680                 685
Asn Tyr Ser Leu Val Gln Lys Val Val Thr Arg Phe Pro Pro Val Pro
    690                 695                 700
Gln Gln Gln Leu Leu Leu Ala Ser Leu Pro Ala Gly Ser Leu Arg Cys
705                 710                 715                 720
Ile Thr Cys Ala Val Val Gly Asn Gly Gly Ile Leu Asn Asn Ser His
                725                 730                 735
Met Gly Gln Glu Ile Asp Ser His Asp Tyr Val Phe Arg Leu Ser Gly
            740                 745                 750
Ala Leu Ile Lys Gly Tyr Glu Gln Asp Val Gly Thr Arg Thr Ser Phe
        755                 760                 765
Tyr Gly Phe Thr Ala Phe Ser Leu Thr Gln Ser Leu Leu Ile Leu Gly
    770                 775                 780
Asn Arg Gly Phe Lys Asn Val Pro Leu Gly Lys Asp Val Arg Tyr Leu
785                 790                 795                 800
His Phe Leu Glu Gly Thr Arg Asp Tyr Glu Trp Leu Glu Ala Leu Leu
                805                 810                 815
Met Asn Gln Thr Val Met Ser Lys Asn Leu Phe Trp Phe Arg His Arg
            820                 825                 830
Pro Gln Glu Ala Phe Arg Glu Ala Leu His Met Asp Arg Tyr Leu Leu
        835                 840                 845
Leu His Pro Asp Phe Leu Arg Tyr Met Lys Asn Arg Phe Leu Arg Ser
    850                 855                 860
Lys Thr Leu Asp Gly Ala His Trp Arg Ile Tyr Arg Pro Thr Thr Gly
865                 870                 875                 880
Ala Leu Leu Leu Leu Thr Ala Leu Gln Leu Cys Asp Gln Val Ser Ala
                885                 890                 895
Tyr Gly Phe Ile Thr Glu Gly His Glu Arg Phe Ser Asp His Tyr Tyr
            900                 905                 910
Asp Thr Ser Trp Lys Arg Leu Ile Phe Tyr Ile Asn His Asp Phe Lys
        915                 920                 925
Leu Glu Arg Glu Val Trp Lys Arg Leu His Asp Glu Gly Ile Ile Arg
    930                 935                 940
Leu Tyr Gln Arg Pro Gly Pro Gly Thr Ala Lys Ala Lys Asn
945                 950                 955
<210>27
<211>402
<212>PRT
<213>普通牛(Bos taurus)
<220>
<223>全长牛β-1,4-半乳糖基转移酶(GalT1)
<400>27
Met Lys Phe Arg Glu Pro Leu Leu Gly Gly Ser Ala Ala Met Pro Gly
  1               5                  10                  15
Ala Ser Leu Gln Arg Ala Cys Arg Leu Leu Val Ala Val Cys Ala Leu
             20                  25                  30
His Leu Gly Val Thr Leu Val Tyr Tyr Leu Ala Gly Arg Asp Leu Arg
         35                  40                  45
Arg Leu Pro Gln Leu Val Gly Val His Pro Pro Leu Gln Gly Ser Ser
     50                  55                  60
His Gly Ala Ala Ala Ile Gly Gln Pro Ser Gly Glu Leu Arg Leu Arg
 65                  70                  75                  80
Gly Val Ala Pro Pro Pro Pro Leu Gln Asn Ser Ser Lys Pro Arg Ser
                 85                  90                  95
Arg Ala Pro Ser Asn Leu Asp Ala Tyr Ser His Pro Gly Pro Gly Pro
            100                 105                 110
Gly Pro Gly Ser Asn Leu Thr Ser Ala Pro Val Pro Ser Thr Thr Thr
        115                 120                 125
Arg Ser Leu Thr Ala Cys Pro Glu Glu Ser Pro Leu Leu Val Gly Pro
    130                 135                 140
Met Leu Ile Glu Phe Asn Ile Pro Val Asp Leu Lys Leu Ile Glu Gln
145                 150                 155                 160
Gln Asn Pro Lys Val Lys Leu Gly Gly Arg Tyr Thr Pro Met Asp Cys
                165                 170                 175
Ile Ser Pro His Lys Val Ala Ile Ile Ile Leu Phe Arg Asn Arg Gln
            180                 185                 190
Glu His Leu Lys Tyr Trp Leu Tyr Tyr Leu His Pro Met Val Gln Arg
        195                 200                 205
Gln Gln Leu Asp Tyr Gly Ile Tyr Val Ile Asn Gln Ala Gly Glu Ser
    210                 215                 220
Met Phe Asn Arg Ala Lys Leu Leu Asn Val Gly Phe Lys Glu Ala Leu
225                 230                 235                 240
Lys Asp Tyr Asp Tyr Asn Cys Phe Val Phe Ser Asp Val Asp Leu Ile
                245                 250                 255
Pro Met Asn Asp His Asn Thr Tyr Arg Cys Phe Ser Gln Pro Arg His
            260                 265                 270
Ile Ser Val Ala Met Asp Lys Phe Gly Phe Ser Leu Pro Tyr Val Gln
        275                 280                 285
Tyr Phe Gly Gly Val Ser Ala Leu Ser Lys Gln Gln Phe Leu Ser Ile
    290                 295                 300
Asn Gly Phe Pro Asn Asn Tyr Trp Gly Trp Gly Gly Glu Asp Asp Asp
305                 310                 315                 320
Ile Tyr Asn Arg Leu Ala Phe Arg Gly Met Ser Val Ser Arg Pro Asn
                325                 330                 335
Ala Val Ile Gly Lys Cys Arg Met Ile Arg His Ser Arg Asp Lys Lys
             340                 345                 350
Asn Glu Pro Asn Pro Gln Arg Phe As pArg Ile Ala His Thr Lys Glu
        355                 360                 365
Thr Met Leu Ser Asp Gly Leu Asn Ser Leu Thr Tyr Met Val Leu Glu
    370                 375                 380
Val Gln Arg Tyr Pro Leu Tyr Thr Lys Ile Thr Val Asp Ile Gly Thr
385                 390                 395                 400
Pro Ser
<210>28
<211>343
<212>PRT
<213>野猪(Sus scrofa)
<220>
<223>全长猪Gal β-1,3-GalNAc α-2,3-唾液酸转移酶1(ST3Gal1)
<400>28
Met Ala Pro Met Arg Lys Lys Ser Thr Leu Lys Leu Leu Thr Leu Leu
  1               5                  10                  15
Val Leu Phe Ile Phe Leu Thr Ser Phe Phe Leu Asn Tyr Ser His Thr
             20                  25                  30
Val Val Thr Thr Ala Trp Phe Pro Lys Gln Met Val Ile Glu Leu Ser
         35                  40                 45
Glu Asn Phe Lys Lys Leu Met Lys Tyr Pro Tyr Arg Pro Cys Thr Cys
     50                  55                  60
Thr Arg Cys Ile Glu Glu Gln Arg Val Ser Ala Trp Phe Asp Glu Arg
 65                  70                  75                  80
Phe Asn Arg Ser Met Gln Pro Leu Leu Thr Ala Lys Asn Ala His Leu
                 85                  90                  95
Glu Glu Asp Thr Tyr Lys Trp Trp Leu Arg Leu Gln Arg Glu Lys Gln
            100                 105                 110
Pro Asn Asn Leu Asn Asp Thr Ile Arg Glu Leu Phe Gln Val Val Pro
        115                 120                 125
Gly Asn Val Asp Pro Leu Leu Glu Lys Arg Leu Val Ser Cys Arg Arg
    130                 135                 140
Cys Ala Val Val Gly Asn Ser Gly Asn Leu Lys Glu Ser Tyr Tyr Gly
145                 150                 155                 160
Pro Gln Ile Asp Ser His Asp Phe Val Leu Arg Met Asn Lys Ala Pro
                165                 170                 175
Thr Glu Gly Phe Glu Ala Asp Val Gly Ser Lys Thr Thr His His Phe
            180                 185                 190
Val Tyr Pro Glu Ser Phe Arg Glu Leu Ala Gln Glu Val Ser Met Ile
        195                 200                 205
Leu Val Pro Phe Lys Thr Thr Asp Leu Glu Trp Val Ile Ser Ala Thr
    210                 215                 220
Thr Thr Gly Thr Ile Ser His Thr Tyr Val Pro Val Pro Ala Lys Ile
225                 230                 235                 240
Lys Val Lys Lys Glu Lys Ile Leu Ile Tyr His Pro Ala Phe Ile Lys
                245                 250                 255
Tyr Val Phe Asp Arg Trp Leu Gln Gly His Gly Arg Tyr Pro Ser Thr
            260                 265                 270
Gly Ile Leu Ser Val Ile Phe Ser Leu His Ile Cys Asp Glu Val Asp
        275                 280                 285
Leu Tyr Gly Phe Gly Ala Asp Ser Lys Gly Asn Trp His His Tyr Trp
    290                 295                 300
Glu Asn Asn Pro Ser Ala Gly Ala Phe Arg Lys Thr Gly Val His Asp
305                 310                 315                 320
Gly Asp Phe Glu Ser Asn Val Thr Thr Ile Leu Ala Ser Ile Asn Lys
                325                 330                 335
Ile Arg Ile Phe Lys Gly Arg
            340
<210>29
<211>600
<212>PRT
<213>智人(Homo sapiens)
<220>
<223>人α-N-乙酰氨基半乳糖苷α-2,6-唾液酸转移酶I(ST6GalNAcTI)
<400>29
Met Arg Ser Cys Leu Trp Arg Cys Arg His Leu Ser Gln Gly Val Gln
  1               5                  10                  15
Trp Ser Leu Leu Leu Ala Val Leu Val Phe Phe Leu Phe Ala Leu Pro
             20                  25                  30
Ser Phe Ile Lys Glu Pro Gln Thr Lys Pro Ser Arg His Gln Arg Thr
         35                  40                  45
Glu Asn Ile Lys Glu Arg Ser Leu Gln Ser Leu Ala Lys Pro Lys Ser
     50                  55                  60
Gln Ala Pro Thr Arg Ala Arg Arg Thr Thr Ile Tyr Ala Glu Pro Val
 65                  70                  75                  80
Pro Glu Asn Asn Ala Leu Asn Thr Gln Thr Gln Pro Lys Ala His Thr
                 85                  90                  95
Thr Gly Asp Arg Gly Lys Glu Ala Asn Gln Ala Pro Pro Glu Glu Gln
            100                 105                 110
Asp Lys Val Pro His Thr Ala Gln Arg Ala Ala Trp Lys Ser Pro Glu
        115                 120                 125
Lys Glu Lys Thr Met Val Asn Thr Leu Ser Pro Arg Gly Gln Asp Ala
    130                 135                 140
Gly Met Ala Ser Gly Arg Thr Glu Ala Gln Ser Trp Lys Ser Gln Asp
145                 150                 155                 160
Thr Lys Thr Thr Gln Gly Asn Gly Gly Gln Thr Arg Lys Leu Thr Ala
                165                 170                 175
Ser Arg Thr Val Ser Glu Lys His Gln Gly Lys Ala Ala Thr Thr Ala
            180                 185                 190
Lys Thr Leu Ile Pro Lys Ser Gln His Arg Met Leu Ala pro Thr Gly
        195                 200                 205
Ala Val Ser Thr Arg Thr Arg Gln Lys Gly Val Thr Thr Ala Val Ile
    210                 215                 220
Pro Pro Lys Glu Lys Lys Pro Gln Ala Thr Pro Pro Pro Ala Pro Phe
225                 230                 235                 240
Gln Ser Pro Thr Thr Gln Arg Asn Gln Arg Leu Lys Ala Ala Asn Phe
                245                 250                 255
Lys Ser Glu Pro Arg Trp Asp Phe Glu Glu Lys Tyr Ser Phe Glu Ile
            260                 265                 270
Gly Gly Leu Gln Thr Thr Cys Pro Asp Ser Val Lys Ile Lys Ala Ser
        275                 280                 285
Lys Ser Leu Trp Leu Gln Lys Leu Phe Leu Pro Asn Leu Thr Leu Phe
    290                 295                 300
Leu Asp Ser Arg His Phe Asn Gln Ser Glu Trp Asp Arg Leu Glu His
305                 310                 315                 320
PheAla pro Pro Phe Gl y Phe Met Glu Leu Asn Tyr Ser Leu Val Gln
                325                 330                 335
Lys Val Val Thr Arg Phe Pro Pro Val Pro Gln Gln Gln Leu Leu Leu
            340                 345                 350
Ala Ser Leu Pro Ala Gly Ser Leu Arg Cys Ile Thr Cys Ala Val Val
        355                 360                 365
Gly Asn Gly Gly Ile Leu Asn Asn Ser His Met Gly Gln Glu Ile Asp
    370                 375                 380
Ser His Asp Tyr Val Phe Arg Leu Ser Gly Ala Leu Ile Lys Gly Tyr
385                 390                 395                 400
Glu Gln Asp Val Gly Thr Arg Thr Ser Phe Tyr Gly Phe Thr Ala Phe
                405                 410                 415
Ser Leu Thr Gln Ser Leu Leu Ile Leu Gly Asn Arg Gly Phe Lys Asn
            420                 425                 430
Val Pro Leu Gly Lys Asp Val Arg Tyr Leu His Phe Leu Glu Gly Thr
        435                 440                 445
Arg Asp Tyr Glu Trp Leu Glu Ala Leu Leu Met Asn Gln Thr Val Met
    450                 455                 460
Ser Lys Asn Leu Phe Trp Phe Arg His Arg Pro Gln Glu Ala Phe Arg
465                 470                 475                 480
Glu Ala Leu His Met Asp Arg Tyr Leu Leu Leu His Pro Asp Phe Leu
                485                 490                 495
Arg Tyr Met Lys Asn Arg Phe Leu Arg Ser Lys Thr Leu Asp Gly Ala
            500                 505                 510
His Trp Arg Ile Tyr Arg Pro Thr Thr Gly Ala Leu Leu Leu Leu Thr
        515                 520                 525
Ala Leu Gln Leu Cys Asp Gln Val Ser Ala Tyr Gly Phe Ile Thr Glu
    530                 535                 540
Gly His Glu Arg Phe Ser Asp His Tyr Tyr Asp Thr Ser Trp Lys Arg
545                 550                 555                 560
Leu Ile Phe Tyr Ile Asn His Asp Phe Lys Leu Glu Arg Glu Val Trp
                565                 570                 575
Lys Arg Leu His Asp Glu Gly Ile Ile Arg Leu Tyr Gln Arg Pro Gly
            580                 585                 590
Pro Gly Thr Ala Lys Ala Lys Asn
        595                 600
<210>30
<211>566
<212>PRT
<213>红原鸡(Gallus gallus)
<220>
<223>鸡α-N-乙酰氨基半乳糖苷α-2,6-唾液酸转移酶I(ST6GalNAcTI)
<400>30
Met Gly Phe Leu Ile Arg Arg Leu Pro Lys Asp Ser Arg Ile Phe Arg
  1               5                  10                  15
Trp Leu Leu Ile Leu Thr Val Phe Ser Phe Ile Ile Thr Ser Phe Ser
             20                  25                  30
Ala Leu Phe Gly Met Glu Lys Ser Ile Phe Arg Gln Leu Lys Ile Tyr
         35                  40                  45
Gln Ser Ile Ala His Met Leu Gln Val Asp Thr Gln Asp Gln Gln Gly
     50                  55                  60
Ser Asn Tyr Ser Ala Asn Gly Arg Ile Ser Lys Val Gly Leu Glu Arg
 65                  70                  75                  80
Asp Ile Ala Trp Leu Glu Leu Asn Thr Ala Val Ser Thr Pro Ser Gly
                 85                  90                  95
Glu Gly Lys Glu Glu Gln Lys Lys Thr Val Lys Pro Val Ala Lys Val
            100                 105                 110
Glu Glu Ala Lys Glu Lys Val Thr Val Lys Pro Phe Pro Glu Val Met
        115                 120                 125
Gly Ile Thr Asn Thr Thr Ala Ser Thr Ala Ser Val Val Glu Arg Thr
    130                 135                 140
Lys Glu Lys Thr Thr Ala Arg Pro Val Pro Gly Val Gly Glu Ala Asp
145                 150                 155                 160
Gly Lys Arg Thr Thr Ile Ala Leu Pro Ser Met Lys Glu Asp Lys Glu
                165                 170                 175
Lys Ala Thr Val Lys Pro Ser Phe Gly Met Lys Val Ala His Ala Asn
            180                 185                 190
Ser Thr Ser Lys Asp Lys Pro Lys Ala Glu Glu Pro Pro Ala Ser Val
        195                 200                 205
Lys Ala Ile Arg Pro Val Thr Gln Ala Ala Thr Val Thr Glu Lys Lys
    210                 215                 220
Lys Leu Arg Ala Ala Asp Phe Lys Thr Glu Pro Gln Trp Asp Phe Asp
225                 230                 235                 240
Asp Glu Tyr Ile Leu Asp Ser Ser Ser Pro Val Ser Thr Cys Ser Glu
                245                 250                 255
Ser Val Arg Ala Lys Ala Ala Lys Ser Asp Trp Leu Arg Asp Leu Phe
            260                 265                 270
Leu Pro Asn Ile Thr Leu Phe Ile Asp Lys Ser Tyr Phe Asn Val Ser
        275                 280                 285
Glu Trp Asp Arg Leu Glu His Phe Ala Pro Pro Tyr Gly Phe Met Glu
    290                 295                 300
Leu Asn Tyr Ser Leu Val Glu Glu Val Met Ser Arg Leu Pro Pro Asn
305                 310                 315                 320
Pro His Gln Gln Leu Leu Leu Ala Asn Ser Ser Ser Asn Val Ser Thr
                325                 330                 335
Cys Ile Ser Cys Ala Val Val Gly Asn Gly Gly Ile Leu Asn Asn Ser
            340                 345                 350
Gly Met Gly Gln Glu Ile Asp Ser His Asp Tyr Val Phe Arg Val Ser
        355                 360                 365
Gly Ala Val Ile Lys Gly Tyr Glu Lys Asp Val Gly Thr Lys Thr Ser
    370                 375                 380
Phe Tyr Gly Phe Thr Ala Tyr Ser Leu Val Ser Ser Leu Gln Asn Leu
385                 390                 395                 400
Gly His Lys Gly Phe Lys Lys Ile Pro Gln Gly Lys His Ile Arg Tyr
                405                 410                 415
Ile His Phe Leu Glu Ala Val Arg Asp Tyr Glu Trp Leu Lys Ala Leu
            420                 425                 430
Leu Leu Asp Lys Asp Ile Arg Lys Gly Phe Leu Asn Tyr Tyr Gly Arg
        435                 440                 445
Arg Pro Arg Glu Arg Phe Asp Glu Asp Phe Thr Met Asn Lys Tyr Leu
    450                 455                 460
Val Ala His Pro Asp Phe Leu Arg Tyr Leu Lys Asn Arg Phe Leu Lys
465                 470                 475                 480
Ser Lys Asn Leu Gln Lys Pro Tyr Trp Arg Leu Tyr Arg Pro Thr Thr
                485                 490                 495
Gly Ala Leu Leu Leu Leu Thr Ala Leu His Leu Cys Asp Arg Val Ser
            500                 505                 510
Ala Tyr Gly Tyr Ile Thr Glu Gly His Gln Lys Tyr Ser Asp His Tyr
        515                 520                 525
Tyr Asp Lys Glu Trp Lys Arg Leu Val Phe Tyr Val Asn His Asp Phe
    530                 535                 540
Asn Leu Glu Lys Gln Val Trp Lys Arg Leu His Asp Glu Asn Ile Met
545                 550                 555                 560
Lys Leu Tyr Gln Arg Ser
                565
<210>31
<211>495
<212>PRT
<213>人工序列
<220>
<223>人工序列描述:从天然小鼠蛋白的残基32处开始的小鼠α-N-
     乙酰氨基半乳糖苷α-2,6-唾液酸转移酶I(ST6GalNAcTI)
<400>31
Asp Pro Arg Ala Lys Asp Ser Arg Cys Gln Phe Ile Trp Lys Asn Asp
  1               5                  10                  15
Ala Ser Ala Gln Glu Asn Gln Gln Lys Ala Glu Pro Gln Val Pro Ile
             20                  25                  30
Met Thr Leu Ser Pro Arg Val His Asn Lys Glu Ser Thr Ser Val Ser
         35                  40                  45
Ser Lys Asp Leu Lys Lys Gln Glu Arg Glu Ala Val Gln Gly Glu Gln
     50                  55                  60
Ala Glu Gly Lys Glu Lys Arg Lys Leu Glu Thr Ile Arg Pro Ala Pro
 65                  70                  75                  80
Glu Asn Pro Gln Ser Lys Ala Glu Pro Ala Ala Lys Thr Pro Val Ser
                 85                  90                  95
Glu His Leu Asp Lys Leu Pro Arg Thr Pro Gly Ala Leu Ser Thr Arg
            100                 105                 110
Lys Thr Pro Met Ala Thr Gly Ala Val Pro Ala Lys Lys Lys Val Val
        115                 120                 125
Gln Ala Thr Lys Ser Pro Ala Ser Ser Pro His Pro Thr Thr Arg Arg
    130                 135                 140
Arg Gln Arg Leu Lys Ala Ser Glu Phe Lys Ser Glu Pro Arg Trp Asp
145                 150                 155                 160
Phe Glu Glu Glu Tyr Ser Leu Asp Met Ser Ser Leu Gln Thr Asn Cys
                165                 170                 175
Ser Ala Ser Val Lys Ile Lys Ala Ser Lys Ser Pro Trp Leu Gln Asn
            180                 185                 190
Ile Phe Leu Pro Asn Ile Thr Leu Phe Leu Asp Ser Gly Arg Phe Thr
        195                 200                 205
Gln Ser Glu Trp Asn Arg Leu Glu His Phe Ala Pro Pro Phe Gly Phe
    210                 215                 220
Met Glu Leu Asn Gl n Ser Leu Val Gln Lys Val Val ThrArg Phe Pro
225                 230                 235                 240
Pro Val Arg Gln Gln Gl n Leu Leu LeuAla Ser Leu Pro Thr Gly Tyr
                245                 250                 255
Ser Lys Cys Ile Thr Cys Ala Val Val Gly Asn Gly Gly Ile Leu Asn
                260                 265                 270
Asp Ser Arg Val Gly Arg Glu Ile Asp Ser His Asp Tyr Val Phe Arg
            275                 280                 285
Leu Ser Gly Ala Val Ile Lys Gly Tyr Glu Gln Asp Val Gly Thr Arg
        290                 295                 300
Thr Ser Phe Tyr Gly Phe Thr Ala Phe Ser Leu Thr Gln Ser Ile Leu
305                 310                 315                 320
Ile Leu Gly Arg Arg Gly Phe Gln His Val Pro Leu Gly Lys Asp Val
                325                 330                 335
Arg Tyr Leu His Phe Leu Glu Gly Thr Arg Asn Tyr Glu Trp Leu Glu
            340                 345                 350
Ala Met Phe Leu Asn Gln Thr Leu Ala Lys Thr His Leu Ser Trp Phe
        355                 360                 365
Arg His Arg Pro Gln Glu Ala Phe Arg Asn Ala Leu Asp Leu Asp Arg
    370                 375                 380
Tyr Leu Leu Leu His Pro Asp Phe Leu Arg Tyr Met Lys Asn Arg Phe
385                 390                 395                 400
Leu Arg Ser Lys Thr Leu Asp Thr Ala His Trp Arg Ile Tyr Arg Pro
                405                 410                 415
Thr Thr Gly Ala Leu Leu Leu Leu Thr Ala Leu His Leu Cys Asp Lys
            420                 425                 430
Val Ser Ala Tyr Gly Phe Ile Thr Glu Gly His Gln Arg Phe Ser Asp
        435                 440                 445
His Tyr Tyr Asp Thr Ser Trp Lys Arg Leu Ile Phe Tyr Ile Asn His
    450                 455                 460
Asp Phe Arg Leu Glu Arg Met Val Trp Lys Arg Leu His Asp Glu Gly
465                 470                 475                 480
Ile Ile Trp Leu Tyr Gln Arg Pro Gln Ser Asp Lys Ala Lys Asn
                485                 490                 495
<210>32
<211>363
<212>PRT
<213>智人(Homo sapiens)
<220>
<223>全长人core 1 UDP-半乳糖:N-乙酰半乳糖胺-α-R
     β-1,3-半乳糖基转移酶(Core 1 GalT1)
<400>32
Met Ala Ser Lys Ser Trp Leu Asn Phe Leu Thr Phe Leu Cys Gly Ser
  1               5                  10                  15
Ala Ile Gly Phe Leu Leu Cys Ser Gln Leu Phe Ser Ile Leu Leu Gly
             20                  25                  30
Glu Lys Val Asp Thr Gln Pro Asn Val Leu His Asn Asp Pro His Ala
         35                  40                  45
Arg His Ser Asp Asp Asn Gly Gln Asn His Leu Glu Gly Gln Met Asn
     50                  55                  60
Phe Asn Ala Asp Ser Ser Gln His Lys Asp Glu Asn Thr Asp Ile Ala
 65                  70                  75                  80
Glu Asn Leu Tyr Gln Lys Val Arg Ile Leu Cys Trp Val Met Thr Gly
                 85                  90                  95
Pro Gln Asn Leu Glu Lys Lys Ala Lys His Val Lys Ala Thr Trp Ala
            100                 105                 110
Gln Arg Cys Asn Lys Val Leu Phe Met Ser Ser Glu Glu Asn Lys Asp
        115                 120                 125
Phe Pro Ala Val Gly Leu Lys Thr Lys Glu Gly Arg Asp Gln Leu Tyr
    130                 135                 140
Trp Lys Thr Ile Lys Ala Phe Gln Tyr Val His Glu His Tyr Leu Glu
145                 150                 155                 160
Asp Ala Asp Trp Phe Leu Lys Ala Asp Asp Asp Thr Tyr Val Ile Leu
                165                 170                 175
Asp Asn Leu Arg Trp Leu Leu Ser Lys Tyr Asp Pro Glu Glu Pro Ile
            180                 185                 190
Tyr Phe Gly Arg Arg Phe Lys Pro Tyr Val Lys Gln Gly Tyr Met Ser
        195                 200                 205
Gly Gly Ala Gly Tyr Val Leu Ser Lys Glu Ala Leu Lys Arg Phe Val
    210                 215                 220
Asp Ala Phe Lys Thr Asp Lys Cys Thr His Ser Ser Ser Ile Glu Asp
225                 230                 235                 240
Leu Ala Leu Gly Arg Cys Met Glu Ile Met Asn Val Glu Ala Gly Asp
                245                 250                 255
Ser Arg Asp Thr Ile Gly Lys Glu Thr Phe His Pro Phe Val Pro Glu
            260                 265                 270
His His Leu Ile Lys Gly Tyr Leu Pro Arg Thr Phe Trp Tyr Trp Asn
        275                 280                 285
Tyr Asn Tyr Tyr Pro Pro Val Glu Gly Pro Gly Cys Cys Ser Asp Leu
    290                 295                 300
Ala Val Ser Phe His Tyr Val Asp Ser Thr Thr Met Tyr Glu Leu Glu
305                 310                 315                 320
Tyr Leu Val Tyr His Leu Arg Pro Tyr Gly Tyr Leu Tyr Arg Tyr Gln
                325                 330                 335
Pro Thr Leu Pro Glu Arg Ile Leu Lys Glu Ile Ser Gln Ala Asn Lys
            340                 345                 350
Asn Glu Asp Thr Lys Val Lys Leu Gly Asn Pro
        355                 360
<210>33
<211>341
<212>PRT
<213>果蝇(Drosophila melanogaster)
<220>
<223>果蝇core 1 UDP-半乳糖:N-乙酰半乳糖胺-α-R
     β-1,3-半乳糖基转移酶(Core 1 GalT1)
<400>33
Glu Phe Met Pro Tyr Asp Gly His Arg His Gly Asp Val Asn Asp Ala
  1               5                  10                  15
His His Ser His Asp Met Met Glu Met Ser Gly Pro Glu Gln Asp Val
             20                  25                  30
Gly Gly His Glu His Val His Glu Asn Ser Thr Ile Ala Glu Arg Leu
         35                  40                  45
Tyr Ser Glu Val Arg Val Leu Cys Trp Ile Met Thr Asn Pro Ser Asn
     50                  55                  60
His Gln Lys Lys Ala Arg His Val Lys Arg Thr Trp Gly Lys Arg Cys
 65                  70                  75                  80
Asn Lys Leu Ile Phe Met Ser Ser Ala Lys Asp Asp Glu Leu Asp Ala
                 85                  90                  95
Val Ala Leu Pro Val Gly Glu Gly Arg Asn Asn Leu Trp Gly Lys Thr
            100                 105                 110
Lys Glu Ala Tyr Lys Tyr Ile Tyr Glu His His Ile Asn Asp Ala Asp
        115                 120                 125
Trp Phe Leu Lys Ala Asp Asp Asp Thr Tyr Thr Ile Val Glu Asn Met
    130                 135                 140
Arg Tyr Met Leu Tyr Pro Tyr Ser Pro Glu Thr Pro Val Tyr Phe Gly
145                 150                 155                 160
Cys Lys Phe Lys Pro Tyr Val Lys Gln Gly Tyr Met Ser Gly Gly Ala
                165                 170                 175
Gly Tyr Val Leu Ser Arg Glu Ala Val Arg Arg Phe Val Val Glu Ala
            180                 185                 190
Leu Pro Asn Pro Lys Leu Cys Lys Ser Asp Asn Ser Gly Ala Glu Asp
        195                 200                 205
Val Glu Ile Gly Lys Cys Leu Gln Asn Val Asn Val Leu Ala Gly Asp
    210                 215                 220
Ser Arg Asp Ser Asn Gly Arg Gly Arg Phe Phe Pro Phe Val Pro Glu
225                 230                 235                 240
His His Leu Ile Pro Ser His Thr Asp Lys Lys Phe Trp Tyr Trp Gln
                245                 250                 255
Tyr Ile Phe Tyr Lys Thr Asp Glu Gly Leu Asp Cys Cys Ser Asp Asn
            260                 265                 270
Ala Ile Ser Phe His Tyr Val Ser Pro Asn Gln Met Tyr Val Leu Asp
        275                 280                 285
Tyr Leu Ile Tyr His Leu Arg Pro Tyr Gly Ile Ile Asn Thr Pro Asp
    290                 295                 300
Ala Leu Pro Asn Lys Leu Ala Val Gly Glu Leu Met Pro Glu Ile Lys
305                 310                 315                 320
Glu Gln Ala Thr Glu Ser Thr Ser Asp Gly Val Ser Lys Arg Ser Ala
                325                 330                 335
Glu Thr Lys Thr Gln
            340
<210>34
<211>341
<212>PRT
<213>果蝇(Drosophila melanogaster)
<220>
<223>果蝇core 1 UDP-半乳糖:N-乙酰半乳糖胺-α-R
     β-1,3-半乳糖基转移酶(Core 1 GalT1)
<400>34
Glu Phe Met Pro Tyr Asp Gly His Arg His Gly Asp Val Asn Asp Ala
  1               5                  10                  15
His His Ser His Asp Met Met Glu Met Ser Gly Pro Glu Gln Asp Val
             20                  25                  30
Gly Gly His Glu His Val His Glu Asn Ser Thr Ile Ala Glu Arg Leu
         35                  40                  45
Tyr Ser Glu Val Arg Val Leu Cys Trp Ile Met Thr Asn Pro Ser Asn
     50                  55                  60
His Gln Lys Lys Ala Arg His Val Lys Arg Thr Trp Gly Lys Arg Cys
 65                  70                  75                  80
Asn Lys Leu Ile Phe Met Ser Ser Ala Lys Asp Asp Glu Leu Asp Ala
                 85                  90                  95
Val Ala Leu Pro Val Gly Glu Gly Arg Asn Asn Leu Trp Gly Lys Thr
            100                 105                 110
Lys Glu Ala Tyr Lys Tyr Ile Tyr Glu His His Ile Asn Asp Ala Asp
        115                 120                 125
Trp Phe Leu Lys Ala Asp Asp Asp Thr Tyr Thr Ile Val Glu Asn Met
    130                 135                 140
Arg Tyr Met Leu Tyr Pro Tyr Ser Pro Glu Thr Pro Val Tyr Phe Gly
145                 150                 155                 160
Cys Lys Phe Lys Pro Tyr Val Lys Gln Gly Tyr Met Ser Gly Gly Ala
                165                 170                 175
Gly Tyr Val Leu Ser Arg Glu Ala Val Arg Arg Phe Val Val Glu Ala
                180                 185                 190
Leu Pro Asn Pro Lys Leu Cys Lys Ser Asp Asn Ser Gly Ala Glu Asp
            195                 200                 205
Val Glu Ile Gly Lys Cys Leu Gln Asn Val Asn Val Leu Ala Gly Asp
        210                 215                 220
Ser Arg Asp Ser Asn Gly Arg Gly Arg Phe Phe Pro Phe Val Pro Glu
225                 230                 235                 240
His His Leu Ile Pro Ser His Thr Asp Lys Lys Phe Trp Tyr Trp Gln
                245                 250                 255
Tyr Ile Phe Tyr Lys Thr Asp Glu Gly Leu Asp Cys Cys Ser Asp Asn
            260                 265                 270
Ala Ile Ser Phe His Tyr Val Ser Pro Asn Gln Met Tyr Val Leu Asp
        275                 280                 285
Tyr Leu Ile Tyr His Leu Arg Pro Tyr Gly Ile Ile Asn Thr Pro Asp
    290                 295                 300
Ala Leu Pro Asn Lys Leu Ala Val Gly Glu Leu Met Pro Glu Ile Lys
305                 310                 315                 320
Glu Gln Ala Thr Glu Ser Thr Ser Asp Gly Val Ser Lys Arg Ser Thr
                325                 330                 335
Glu Thr Lys Thr Gln
            340
<210>35
<211>371
<212>PRT
<213>假结核耶尔森菌(Yersinia pseudotuberculosis)
<220>
<223>麦芽糖结合蛋白(MBP)
<400>35
Met Lys Ile Glu Glu Gly Lys Leu Val Ile Trp Ile Asn Gly Asp Lys
  1               5                  10                  15
Gly Tyr Asn Gly Leu Ala Glu Val Gly Lys Lys Phe Glu Lys Asp Thr
             20                  25                  30
Gly Ile Lys Val Thr Ile Glu His Pro Asp Lys Leu Glu Glu Lys Phe
         35                  40                  45
Pro Gln Val Ala Ala Thr Gly Asp Gly Pro Asp Ile Ile Phe Trp Ala
     50                  55                  60
His Asp Arg Phe Gly Gly Tyr Ala Gln Ser Gly Leu Leu Ala Glu Leu
 65                  70                  75                  80
Thr Pro Ser Lys Ala Phe Gln Glu Lys Leu Phe Pro Phe Thr Trp Asp
                 85                  90                  95
Ala Val Arg Phe Asn Gly Lys Leu Ile Gly Tyr Pro Val Ala Val Glu
            100                 105                 110
Ala Leu Ser Leu Ile Tyr Asn Lys Asp Leu Val Lys Glu Ala Pro Lys
        115                 120                 125
Thr Trp Glu Glu Ile Pro Ala Leu Asp Lys Thr Leu Arg Ala Asn Gly
    130                 135                 140
Lys Ser Ala Ile Met Trp Asn Leu Gln Glu Pro Tyr Phe Thr Trp Pro
145                 150                 155                 160
Val Ile Ala Ala Asp Gly Gly Tyr Ala Phe Lys Phe Glu Asn Gly Val
                165                 170                 175
Tyr Asp Ala Lys Asn Val Gly Val Asn Asn Ala Gly Ala Gln Ala Gly
            180                 185                 190
Leu Gln Phe Ile Val Asp Leu Val Lys Asn Lys His Ile Asn Ala Asp
        195                 200                 205
Thr Asp Tyr Ser Ile Ala Glu Ala Ala Phe Asn Lys Gly Glu Thr Ala
    210                 215                 220
Met Thr Ile Asn Gly Pro Trp Ala Trp Ser Asn Ile Asp Lys Ser Lys
225                 230                 235                 240
Ile Asn Tyr Gly Val Thr Leu Leu Pro Thr Phe His Gly Gln Pro Ser
                245                 250                 255
Lys Pro Phe Val Gly Val Leu Thr Ala Gly Ile Asn Ala Ala Ser Pro
            260                 265                 270
Asn Lys Glu Leu Ala Thr Glu Phe Leu Glu Asn Tyr Leu Ile Thr Asp
        275                 280                 285
Gln Gly Leu Ala Glu Val Asn Lys Asp Lys Pro Leu Gly Ala Val Ala
    290                 295                 300
Leu Lys Ser Phe Gln Glu Gln Leu Ala Lys Asp Pro Arg Ile Ala Ala
305                 310                 315                 320
Thr Met Asp Asn Ala Thr Asn Gly Glu Ile Met Pro Asn Ile Pro Gln
               325                 330                 335
Met Ala Ala Phe Trp Tyr Ala Thr Arg Ser Ala Val Leu Asn Ala Ile
            340                 345                 350
Thr Gly Arg Gln Thr Val Gl u Ala Ala Leu Asn Asp Ala Ala Thr Arg
        355                 360                 365
Ile Thr Lys
    370
<210>36
<211>369
<212>PRT
<213>大肠杆菌(Escherichia coli)
<220>
<223>麦芽糖结合蛋白(MBP)
<400>36
Met Lys Ile Glu Glu Gly Lys Leu Val Ile Trp Ile Asn Gly Asp Lys
  1               5                  10                  15
Gly Tyr Asn Gly Leu Ala Glu Val Gly Lys Lys Phe Glu Lys Asp Thr
             20                  25                  30
Gly Ile Lys Val Thr Val Glu His Pro Asp Lys Leu Glu Glu Lys Phe
 35                  40                  45
Pro Gln Val Ala Ala Thr Gly Asp Gly Pro Asp Ile Ile Phe Trp Ala
     50                  55                  60
His Asp Arg Phe Gly Gly Tyr Ala Gln Ser Gly Leu Leu Ala Glu Ile
 65                  70                  75                  80
Thr Pro Asp Lys Ala Phe Gln Asp Lys Leu Tyr Pro Phe Thr Trp Asp
                 85                  90                  95
Ala Val Arg Tyr Asn Gly Lys Leu Ile Ala Tyr Pro Ile Ala Val Glu
            100                 105                 110
Ala Leu Ser Leu Ile Tyr Asn Lys Asp Leu Leu Pro Asn Pro Pro Lys
        115                 120                 125
Thr Trp Glu Glu Ile Pro Ala Leu Asp Lys Glu Leu Lys Ala Lys Gly
    130                 135                 140
Lys Ser Ala Leu Met Phe Asn Leu Gln Glu Pro Tyr Phe Thr Trp Pro
145                 150                 155                 160
Leu Ile Ala Ala Asp Gly Gly Tyr Ala Phe Lys Tyr Glu Asn Gly Lys
                165                 170                 175
Tyr Asp Ile Lys Asp Val Gly Val Asp Asn Ala Gly Ala Lys Ala Gly
            180                 185                 190
Leu Thr Phe Leu Val Asp Leu Ile Lys Asn Lys His Met Asn Ala Asp
        195                 200                 205
Thr Asp Tyr Ser Ile Ala Glu Ala Ala Phe Asn Lys Gly Glu Thr Ala
    210                 215                 220
Met Thr Ile Asn Gly Pro Trp Ala Trp Ser Asn Ile Asp Thr Ser Lys
225                 230                 235                 240
Val Asn Tyr Gly Val Thr Val Leu Pro Thr Phe Lys Gly Gln Pro Ser
                245                 250                 255
Lys Pro Phe Val Gly Val Leu Ser Ala Gly Ile Asn Ala Ala Ser Pro
            260                 265                 270
Asn Lys Glu Leu Ala Lys Glu Phe Leu Glu Ash Tyr Leu Leu Thr Asp
        275                 280                 285
Glu Gly Leu Glu Ala Val Asn Lys Asp Lys Pro Leu Gly Ala Val Ala
    290                 295                 300
Leu Lys Ser Tyr Glu Glu Glu Leu Ala Lys Asp Pro Arg Ile Ala Ala
305                 310                 315                 320
Thr Met Glu Asn Ala Gln Lys Gly Glu Ile Met Pro Asn Ile Pro Gln
                325                 330                 335
Met Ser Ala Phe Trp Tyr Ala Val Arg Thr Ala Val Ile Asn Ala Ala
            340                 345                 350
Ser Gly Arg Gln Thr Val Asp Glu Ala Leu Lys Asp Ala Gln Thr Asn
        355                 360                 365
Ser
<210>37
<211>381
<212>PRT
<213>激烈火球菌(Pyrococcus furiosus)
<220>
<223>麦芽糖结合蛋白(MBP)
<400>37
Met Lys Ile Glu Glu Gly Lys Val Val Ile Trp His Ala Met Gln Pro
  1               5                  10                  15
Asn Glu Leu Glu Val Phe Gln Ser Leu Ala Glu Glu Tyr Met Ala Leu
             20                  25                  30
Ser Pro Glu Val Glu Ile Val Phe Glu Gln Lys Pro Asn Leu Glu Asp
         35                  40                  45
Ala Leu Lys Ala Ala Ile Pro Thr Gly Gln Gly Pro Asp Leu Phe Ile
     50                  55                  60
Trp Ala His Asp Trp Ile Gly Lys Phe Ala Glu Ala Gly Leu Leu Glu
 65                  70                  75                  80
Pro Ile Asp Glu Tyr Val Thr Glu Asp Leu Leu Asn Glu Phe Ala Pro
                 85                  90                  95
Met Ala Gln Asp Ala Met Gln Tyr Lys Gly His Tyr Tyr Ala Leu Pro
            100                 105                 110
Phe Ala Ala Glu Thr Val Ala Ile Ile Tyr Asn Lys Glu Met Val Ser
        115                 120                 125
Glu Pro Pro Lys Thr Phe Asp Glu Met Lys Ala Ile Met Glu Lys Tyr
    130                 135                 140
Tyr Asp Pro Ala Asn Glu Lys Tyr Gly Ile Ala Trp Pro Ile Asn Ala
145                 150                 155                 160
Tyr Phe Ile Ser Ala Ile Ala Gln Ala Phe Gly Gly Tyr Tyr Phe Asp
                165                 170                 175
Asp Lys Thr Glu Gln Pro Gly Leu Asp Lys Pro Glu Thr Ile Glu Gly
            180                 185                 190
Phe Lys Phe Phe Phe Thr Glu Ile Trp Pro Tyr Met Ala Pro Thr Gly
        195                 200                 205
Asp Tyr Asn Thr Gln Gln Ser Ile Phe Leu Glu Gly Arg Ala Pro Met
    210                 215                 220
Met Val Asn Gly Pro Trp Ser Ile Asn Asp Val Lys Lys Ala Gly Ile
225                 230                 235                 240
Asn Phe Gly Val Val Pro Leu Pro Pro Ile Ile Lys Asp Gly Lys Glu
                245                 250                 255
Tyr Trp Pro Arg Pro Tyr Gly Gly Val Lys Leu Ile Tyr Phe Ala Ala
            260                 265                 270
Gly Ile Lys Asn Lys Asp Ala Ala Trp Lys Phe Ala Lys Trp Leu Thr
        275                 280                 285
Thr Ser Glu Glu Ser Ile Lys Thr Leu Ala Leu Glu Leu Gly Tyr Ile
    290                 295                 300
Pro Val Leu Thr Lys Val Leu Asp Asp ProGl u Ile Lys Asn Asp Pro
305                 310                 315                 320
Val Ile Tyr Gly Phe Gly Gln Ala Val Gln His Ala Tyr Leu Met Pro
                325                 330                 335
Lys Ser Pro Lys Met Ser Ala Val Trp Gly Gly Val Asp Gly Ala Ile
            340                 345                 350
Asn Glu Ile Leu Gln Asp Pro Gln Asn Ala Asp Ile Glu Gly Ile Leu
        355                 360                 365
Lys Lys Tyr Gln Gln Glu Ile Leu Asn Asn Met Gln Gly
    370                 375                 380
<210>38
<211>412
<212>PRT
<213>嗜热球菌(Thermococcus litoralis)
<220>
<223>麦芽糖结合蛋白(MBP)
<400>38
Met Lys Ile Glu Glu Gly Lys Ile Val Phe Ala Val Gly Gly Ala Pro
  1               5                  10                  15
Asn Glu Ile Glu Tyr Trp Lys Gly Val Ile Ala Glu Phe Glu Lys Lys
             20                  25                  30
Tyr Pro Gly Val Thr Val Glu Leu Lys Arg Gln Ala Thr Asp Thr Glu
         35                  40                  45
Gln Arg Arg Leu Asp Leu Val Asn Ala Leu Arg Gly Lys Ser Ser Asp
     50                  55                  60
Pro Asp Val Phe Leu Met Asp Val Ala Trp Leu Gly Gln Phe Ile Ala
 65                  70                  75                  80
Ser Gly Trp Leu Glu Pro Leu Asp Asp Tyr Val Gln Lys Asp Asn Tyr
                 85                  90                  95
Asp Leu Ser Val Phe Phe Gln Ser Val Ile Asn Leu Ala Asp Lys Gln
            100                 105                 110
Gly Gly Lys Leu Tyr Ala Leu Pro Val Tyr Ile Asp Ala Gly Leu Leu
        115                 120                 125
Tyr Tyr Arg Lys Asp Leu Leu Glu Lys Tyr Gly Tyr Ser Lys Pro Pro
    130                 135                 140
Glu Thr Trp Gln Glu Leu Val Glu Met Ala Gln Lys Ile Gln Ser Gly
145                 150                 155                 160
Glu Arg Glu Thr Asn Pro Asn Phe Trp Gly Phe Val Trp Gln Gly Lys
                165                 170                 175
Gln Tyr Glu Gly Leu Val Cys Asp Phe Val Glu Tyr Val Tyr Ser Asn
            180                 185                 190
Gly Gly Ser Leu Gly Glu Phe Lys Asp Gly Lys Trp Val Pro Thr Leu
        195                 200                 205
Asn Lys Pro Glu Asn Val Glu Ala Leu Gln Phe Met Val Asp Leu Ile
    210                 215                 220
His Lys Tyr Lys Ile Ser Pro Pro Asn Thr Tyr Thr Glu Met Thr Glu
225                 230                 235                 240
Glu Pro Val Arg Leu Met Phe Gln Gln Gly Asn Ala Ala Phe Glu Arg
                245                 250                 255
Asn Trp Pro Tyr Ala Trp Gly Leu His Asn Ala Asp Asp Ser Pro Val
            260                 265                 270
Lys Gly Lys Val Gly Val Ala Pro Leu Pro His Phe Pro Gly His Lys
        275                 280                 285
Ser Ala Ala Thr Leu Gly Gly Trp His Ile Gly Ile Ser Lys Tyr Ser
    290                 295                 300
Asp Asn Lys Ala Leu Ala Trp Glu Phe Val Lys Phe Val Glu Ser Tyr
305                 310                 315                 320
Ser Val Gln Lys Gly Phe Ala Met Asn Leu Gly Trp Asn Pro Gly Arg
                325                 330                 335
Val Asp Val Tyr Asp Asp Pro Ala Val Val Ser Lys Ser Pro His Leu
            340                 345                 350
Lys Glu Leu Arg Ala Val Phe Glu Asn Ala Val Pro Arg Pro Ile Val
        355                 360                 365
Pro Tyr Tyr Pro Gln Leu Ser Glu Ile Ile Gln Lys Tyr Val Asn Ser
    370                 375                 380
Ala Leu Ala Gly Lys Ile Ser Pro Gln Glu Ala Leu Asp Lys Ala Gln
385                 390                 395                 400
Lys Glu Ala Glu Glu Leu Val Lys Gln Tyr Ser Lys
                405                 410
<210>39
<211>378
<212>PRT
<213>海栖热袍菌(Thermatoga maritime)
<220>
<223>麦芽糖结合蛋白(MBP)
<400>39
Met Lys Ile Glu Gln Thr Lys Leu Thr Ile Trp Ser Ser Glu Lys Gln
  1               5                  10                  15
Val Asp Ile Leu Gln Lys Leu Gly Glu Glu Phe Lys Ala Lys Tyr Gly
            20                  25                  30
Ile Pro Val Glu Val Gln Tyr Val Asp Phe Gly Ser Ile Lys Ser Lys
        35                  40                  45
Phe Leu Thr Ala Ala Pro Gln Gly Gln Gly Ala Asp Ile Ile Val Gly
    50                  55                  60
Ala His Asp Trp Val Gly Glu Leu Ala Val Asn Gly Leu Ile Glu Pro
65                  70                  75                  80
Ile Pro Asn Phe Ser Asp Leu Lys Asn Phe Tyr Asp Thr Ala Leu Lys
                85                  90                  95
Ala Phe Ser Tyr Gly Gly Lys Leu Tyr Gly Val Pro Tyr Ala Met Glu
            100                 105                 110
Ala Val Ala Leu Ile Tyr Asn Lys Asp Tyr Val Asp Ser Val Pro Lys
        115                 120                 125
Thr Met Asp Glu Leu Ile Glu Lys Ala Lys Gln Ile Asp Glu Glu Tyr
    130                 135                 140
Gly Gly Glu Val Arg Gly Phe Ile Tyr Asp Val Ala Asn Phe Tyr Phe
145                 150                 155                 160
Ser Ala Pro Phe Ile Leu Gly Tyr Gly Gly Tyr Val Phe Lys Glu Thr
                165                 170                 175
Pro Gln Gly Leu Asp Val Thr Asp Ile Gly Leu Ala Asn Glu Gly Ala
            180                 185                 190
Val Lys Gly Ala Lys Leu Ile Lys Arg Met Ile Asp Glu Gly Val Leu
        195                 200                 205
Thr Pro Gly Asp Asn Tyr Gly Thr Met Asp Ser Met Phe Lys Glu Gly
     210                 215                 220
Leu Ala Ala Met Ile Ile Asn Gly Leu Trp Ala Ile Lys Ser Tyr Lys
225                 230                 235                 240
Asp Ala Gly Ile Asn Tyr Gly Val Ala Pro Ile Pro Glu Leu Glu Pro
                245                 250                 255
Gly Val Pro Ala Lys Pro Phe Val Gly Val Gln Gly Phe Met Ile Asn
            260                 265                 270
Ala Lys Ser Pro Asn Lys Val Ile Ala Met Glu Phe Leu Thr Asn Phe
        275                 280                 285
Ile Ala Arg Lys Glu Thr Met Tyr Lys Ile Tyr Leu Ala Asp Pro Arg
    290                 295                 300
Leu Pro Ala Arg Lys Asp Val Leu Glu Leu Val Lys Asp Asn Pro Asp
305                 310                 315                 320
Val Val Ala Phe Thr Gln Ser Ala Ser Met Gly Thr Pro Met Pro Asn
                325                 330                 335
Val Pro Glu Met Ala Pro Val Trp Ser Ala Met Gly Asp Ala Leu Ser
            340                 345                 350
Ile Ile Ile Asn Gly Gln Ala Ser Val Glu Asp Ala Leu Lys Glu Ala
        355                 360                 365
Val Asp Lys Ile Lys Ala Gln Ile Glu Lys
    370                 375
<210>40
<211>372
<212>PRT
<213>霍乱弧菌(Vibrio cholerae)
<220>
<223>麦芽糖结合蛋白(MBP)
<400>40
Met Lys Ile Glu Glu Gly Gln Leu Thr Ile Trp Ile Asn Gly Asp Lys
  1               5              10                   15
Gly Tyr Asn Gly Leu Ala Glu Val Gly Lys Lys Phe Glu Ala Asp Thr
             20                  25                  30
Gly Ile Lys Val Thr Val Ala His Pro Asp Ala Leu Gln Asp Lys Phe
         35                  40                  45
Pro Gln Thr Ala Ala Thr Gly Asp Gly Pro Asp Ile Val Phe Trp Ala
     50                  55                  60
His Asp Arg Phe Gly Gly Tyr Ala Glu Ala Gly Leu Leu Val Glu Ile
 65                  70                  75                  80
Lys Pro Ser Ala Lys Ile Gln Glu Gly Ile Val Asp Phe Ala Trp Asp
                 85                  90                  95
Ala Val Lys Tyr Asn Gly Lys Ile Ile Gly Tyr Pro Ile Ala Val Glu
            100                 105                 110
Ser Leu Ser Leu Ile Tyr Asn Lys Asp Leu Val Pro Asn Pro Pro Lys
        115                 120                 125
Ser Trp Glu Glu Val Ala Glu Leu Asp Ala Lys Leu Lys Lys Glu Gly
    130                 135                 140
Lys Ser Ala Ile Met Trp Asn Leu Lys Glu Pro Tyr Phe Thr Trp Pro
145                 150                 155                 160
Leu Met Ala Ala Asp Gly Gly Tyr Ala Phe Lys Tyr Gly Val Asp Gly
                165                 170                 175
Tyr Asp Val Lys Asp Ala Gly Ile Asn Asn Lys Gly Val Lys Asp Ala
            180                 185                 190
Met Asn Phe Val Lys Gly Leu Val Asp Lys Gly Val Ile Ser Pro Asp
        195                 200                 205
Met Asp Tyr Ser Val Ser Glu Ser Ala Phe Asn Gln Gly Asn Thr Ala
    210                 215                 220
Met Thr Ile Asn Gly Pro Trp Ser Trp Gly Asn Ile Glu Lys Ser Gly
225                 230                 235                 240
Ile Asn Tyr Gly Val Thr Thr Leu Pro Lys Phe Asn Gly Gln Ala Ser
                245                 250                 255
Lys Pro Phe Val Gly Val Leu Thr Ala Gly Ile Ser Thr Ala Ser Pro
            260                 265                 270
Asn Lys Asp Leu Ala Val Glu Phe Ile Glu Asn Tyr Leu Leu Thr Asn
        275                 280                 285
Asp Gly Leu Arg Met Val Asn Asn Asp Lys Pro Leu Gly Ala Val Ala
    290                 295                 300
Leu Asn Ser Phe Gln Arg Glu Leu Asp Ala Asp Ala Arg Ile Ala Ala
305                 310                 315                 320
Thr Met Asp Asn Ala Met Asn Gly Glu Ile Met Pro Asn Ile Pro Gln
                325                 330                 335
Met Asn Ala Phe Trp Ser Ser Ala Lys Asn Ala Ile Ile Asn Ile Val
            340                 345                 350
Asp Gly Arg Gln Thr Val Asp Ala Ala Leu Ala Asp Ala Glu Lys Gln
        355                 360                 365
Met Thr Lys Pro
    370
<210>41
<211>559
<212>PRT
<213>智人(Homo sapiens)
<220>
<223>人UDP-N-乙酰半乳糖胺基转移酶1(GalNAcT1)
<400>41
Met Arg Lys Phe Ala Tyr Cys Lys Val Val Leu Ala Thr Ser Leu Ile
  1               5                  10                  15
Trp Val Leu Leu Asp Met Phe Leu Leu Leu Tyr Phe Ser Glu Cys Asn
             20                  25                  30
Lys Cys Asp Glu Lys Lys Glu Arg Gly Leu Pro Ala Gly Asp Val Leu
         35                  40                  45
Glu Pro Val Gln Lys Pro His Glu Gly Pro Gly Glu Met Gly Lys Pro
     50                  55                  60
Val Val Ile Pro Lys Glu Asp Gln Glu Lys Met Lys Glu Met Phe Lys
 65                  70                  75                  80
Ile Asn Gln Phe Asn Leu Met Ala Ser Glu Met Ile Ala Leu Asn Arg
                 85                  90                  95
Ser Leu Pro Asp Val Arg Leu Glu Gly Cys Lys Thr Lys Val Tyr Pro
            100                 105                 110
Asp Asn Leu Pro Thr Thr Ser Val Val Ile Val Phe His Asn Glu Ala
        115                 120                 125
Trp Ser Thr Leu Leu Arg Thr Val His Ser Val Ile Asn Arg Ser Pro
    130                 135                 140
Arg His Met Ile Glu Glu Ile Val Leu Val Asp Asp Ala Ser Glu Arg
145                 150                 155                 160
Asp Phe Leu Lys Arg Pro Leu Glu Ser Tyr Val Lys Lys Leu Lys Val
                165                 170                 175
Pro Val His Val Ile Arg Met Glu Gln Arg Ser Gly Leu Ile Arg Ala
            180                 185                 190
Arg Leu Lys Gly Ala Ala Val Ser Lys Gly Gln Val Ile Thr Phe Leu
        195                 200                 205
Asp Ala His Cys Glu Cys Thr Val Gly Trp Leu Glu Pro Leu Leu Ala
    210                 215                 220
Arg Ile Lys His Asp Arg Arg Thr Val Val Cys Pro Ile Ile Asp Val
225                 230                 235                 240
Ile Ser Asp Asp Thr Phe Glu Tyr Met Ala Gly Ser Asp Met Thr Tyr
                245                 250                 255
Gly Gly Phe Asn Trp Lys Leu Asn Phe Arg Trp Tyr Pro Val Pro Gln
            260                 265                 270
Arg Glu Met Asp Arg Arg Lys Gly Asp Arg Thr Leu Pro Val Arg Thr
        275                 280                 285
Pro Thr Met Ala Gly Gly Leu Phe Ser Ile Asp Arg Asp Tyr Phe Gln
    290                 295                 300
Glu Ile Gly Thr Tyr Asp Ala Gly Met Asp Ile Trp Gly Gly Glu Asn
305                 310                 315                 320
Leu Glu Ile Ser Phe Arg Ile Trp Gln Cys Gly Gly Thr Leu Glu Ile
                325                 330                 335
Val Thr Cys Ser His Val Gly His Val Phe Arg Lys Ala Thr Pro Tyr
            340                 345                 350
Thr Phe Pro Gly Gly Thr Gly Gln Ile Ile Asn Lys Asn Asn Arg Arg
        355                 360                 365
Leu Ala Glu Val Trp Met Asp Glu Phe Lys Asn Phe Phe Tyr Ile Ile
    370                 375                 380
Ser Pro Gly Val Thr Lys Val Asp Tyr Gly Asp Ile Ser Ser Arg Val
385                 390                 395                 400
Gly Leu Arg His Lys Leu Gln Cys Lys Pro Phe Ser Trp Tyr Leu Glu
                405                 410                 415
Asn Ile Tyr Pro Asp Ser Gln Ile Pro Arg His Tyr Phe Ser Leu Gly
            420                 425                 430
Glu Ile Arg Asn Val Glu Thr Asn Gln Cys Leu Asp Asn Met Ala Arg
        435                 440                 445
Lys Glu Asn Glu Lys Val Gly Ile Phe Asn Cys His Gly Met Gly Gly
    450                 455                 460
Asn Gln Val Phe Ser Tyr Thr Ala Asn Lys Glu Ile Arg Thr Asp Asp
465                 470                 475                 480
Leu Cys Leu Asp Val Ser Lys Leu Asn Gly Pro Val Thr Met Leu Lys
                485                 490                 495
Cys His His Leu Lys Gly Asn Gln Leu Trp Glu Tyr Asp Pro Val Lys
            500                 505                 510
Leu Thr Leu Gln His Val Asn Ser Asn Gln Cys Leu Asp Lys Ala Thr
        515                 520                 525
Glu Glu Asp Ser Gln Val Pro Ser Ile Arg Asp Cys Asn Gly Ser Arg
    530                 535                 540
Ser Gln Gln Trp Leu Leu Arg Asn Val Thr Leu Pro Glu Ile Phe
545                 550                 555
<210>42
<211>4
<212>PRT
<213>人工序列
<220>
<223>人工序列描述:共有序列肽
<400>42
Lys Met Leu Leu
  1
<210>43
<211>4
<212>PRT
<213>人工序列
<220>
<223>人工序列描述:共有序列肽
<400>43
Ile Trp Val Leu
  1
<210>44
<211>5
<212>PRT
<213>人工序列
<220>
<223>人工序列描述:共有序列肽
<400>44
Arg Ala Ile Pro Asp
  1               5
<210>45
<211>5
<212>PRT
<213>人工序列
<220>
<223>人工序列描述:共有序列肽
<400>45
Thr Ser Val Val Ile
  1               5
<210>46
<211>5
<212>PRT
<213>人工序列
<220>
<223>人工序列描述:共有序列肽
<400>46
Phe His Asn Glu Ala
  1               5
<210>47
<211>5
<212>PRT
<213>人工序列
<220>
<223>人工序列描述:共有序列肽
<400>47
Leu Leu Arg Thr Val
  1               5
<210>48
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列描述:共有序列肽
<400>48
Glu Ile Ile Leu Val Asp Asp
  1               5
<210>49
<211>10
<212>PRT
<213>人工序列
<220>
<223>人工序列描述:共有序列肽
<400>49
Gly Leu Ile Arg Ala Arg Leu Lys Gly Ala
  1               5                  10
<210>50
<211>11
<212>PRT
<213>人工序列
<220>
<223>人工序列描述:共有序列肽
<400>50
Val Ile Thr Phe Leu Asp Ala His Cys Glu Cys
  1               5                  10
<210>51
<211>6
<212>PRT
<213>人工序列
<220>
<223>人工序列描述:共有序列肽
<400>51
Trp Leu Glu Pro Leu Leu
  1               5
<210>52
<211>6
<212>PRT
<213>人工序列
<220>
<223>人工序列描述:共有序列肽
<400>52
Pro Ile Ile Asp Val Ile
  1               5
<210>53
<211>5
<212>PRT
<213>人工序列
<220>
<223>人工序列描述:共有序列肽
<400>53
Tyr Met Ala Ala Ser
  1               5
<210>54
<211>5
<212>PRT
<213>人工序列
<220>
<223>人工序列描述:共有序列肽
<400>54
Pro Ile Lys Thr Pro
  1               5
<210>55
<211>6
<212>PRT
<213>人工序列
<220>
<223>人工序列描述:共有序列肽
<400>55
Ile Ala Gly Gly Leu Phe
  1               5
<210>56
<211>25
<212>PRT
<213>人工序列
<220>
<223>人工序列描述:共有序列肽
<400>56
Met Asp Ile Trp Gly Gly Glu Asn Leu Glu Ile Ser Phe Arg Ile Trp
  1               5                  10                  15
Gln Cys Gly Gly Ser Leu Gl u Ile Ile
             20                  25
<210>57
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列描述:共有序列肽
<400>57
Val Gly His Val Phe Arg Lys
  1               5
<210>58
<211>9
<212>PRT
<213>人工序列
<220>
<223>人工序列描述:共有序列肽
<400>58
Pro Tyr Thr Phe Pro Gly Gly Ser Gly
  1               5
<210>59
<211>13
<212>PRT
<213>人工序列
<220>
<223>人工序列描述:共有序列肽
<400>59
Ala Glu Val Trp Met Asp Glu Phe Lys Asn Phe Phe Tyr
  1               5                  10
<210>60
<211>4
<212>PRT
<213>人工序列
<220>
<223>人工序列描述:共有序列肽
<400>60
Cys Lys Pro Phe
  1
<210>61
<211>9
<212>PRT
<213>人工序列
<220>
<223>人工序列描述:共有序列肽
<400>61
Trp Tyr Leu Glu Asn Ile Tyr Pro Asp
  1               5
<210>62
<211>4
<212>PRT
<213>人工序列
<220>
<223>人工序列描述:共有序列肽
<400>62
Val Gly Ile Phe
  1
<210>63
<211>4
<212>PRT
<213>人工序列
<220>
<223>人工序列描述:共有序列肽
<400>63
Gly Gly Asn Gln
  1
<210>64
<211>4
<212>PRT
<213>人工序列
<220>
<223>人工序列描述:共有序列肽
<400>64
Asp Leu Cys Leu
  1
<210>65
<211>4
<212>PRT
<213>人工序列
<220>
<223>人工序列描述:共有序列肽
<400>65
Ser Gln Gln Trp
  1
<210>66
<211>8
<212>PRT
<213>人工序列
<220>
<223>人工序列描述:抗FLAG抗体表位标记,″FLAG标记″
<400>66
Asp Tyr Lys Asp Asp Asp Asp Lys
  1               5
<210>67
<211>6
<212>PRT
<213>人工序列
<220>
<223>人工序列描述:六组氨酸亲和标记,聚组氨酸纯化标记,
     聚组氨酸,金属螯合亲和配体
<400>67
His His His His His His
  1               5
<210>68
<211>30
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:PCR扩增正义引物Sial 5’Tm
<400>68
tttggatcca agctacactt actccaatgg                                      30
<210>69
<211>30
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:PCR扩增反义引物Sial 3’全部
<400>69
tttgaattct cagataccac tgcttaagtc                                      30
<210>70
<211>31
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:PCR扩增正义引物ST3BAMH1
<400>70
taatggattc aagctacact tactccaatg g         31
<210>71
<211>30
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:PCR扩增反义引物ST3XBA1
<400>71
gcgctctaga tcagatacca ctgcttaagt           30
<210>72
<211>35
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:PCR 5’引物ST3BamH1Δ73
<400>72
tgtatcggat ccctggccac caagtacgct aactt     35
<210>73
<211>38
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:PCR 5’引物ST3 BamH1Δ85
<400>73
tgtatcggat cctgcaaacc cggctacgct tcagccat  38
<210>74
<211>35
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:PCR 5’引物ST3BamH1Δ86
<400>74
tgtatcggat ccaaacccgg ctacgcttca gccat      35
<210>75
<211>30
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:PCR共用3’引物ST3-Xho1
<400>75
ggtctcctcg agtcagatac cactgcttaa            30
<210>76
<211>37
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:诱变的寡核苷酸GnT1 R120A C121H+
<400>76
ccgcagcact gttcgggccc acctggacaa gctgctg    37
<210>77
<211>37
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:诱变的寡核苷酸GnT1 R120A C121H-
<400>77
cagcagcttg tccaggtggg cccgaacagt gctgcgg    37
<210>78
<211>33
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:诱变的寡核苷酸GnT1C123A+
<400>78
agcactgttc ggcgcgccct ggacaagctg ctg        33
<210>79
<211>33
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:诱变的寡核苷酸GnT1C123A-
<400>79
cagcagcttg tccagggcgc gccgaacagt gct        33
<210>80
<211>10
<212>PRT
<213>人工序列
<220>
<223>人工序列描述:MuC-2样GalNAc肽受体
<400>80
Met Val Thr Pro Thr Pro Thr Pro Thr Cys
  1               5                  10

Claims (15)

1.一种重组GalNAcT2蛋白,其中所述重组GalNAcT2蛋白中缺失主干锚定区和跨膜结构域,而所述GalNAcT2蛋白框内与麦芽糖结合域融合。
2.如权利要求1所述的重组GalNAcT2蛋白,其特征在于,缺失了所有或一部分主干区。
3.如权利要求1所述的重组GalNAcT2蛋白,其特征在于,通过非半胱氨酸的氨基酸取代去除所述重组GalNAcT2蛋白中的未配对半胱氨酸。
4.如权利要求1所述的GalNAcT2蛋白,其特征在于,GalNAcT2蛋白是选自GalNAcT2Δ40、GalNAcT2Δ51、GalNAcT2Δ74和GalNAcT2Δ95的截短的人GalNAcT2蛋白。
5.一种用权利要求1所述的重组GalNAcT2蛋白重建蛋白质、肽、糖蛋白或糖肽的方法。
6.一种重折叠第一种不溶性重组真核糖基转移酶的方法,其中所述糖基转移酶含有麦芽糖结合蛋白结构域(MBD),所述方法包括以下步骤
(a)将不溶性重组真核糖基转移酶溶于增溶缓冲液中;和
(b)使溶解的真核糖基转移酶与含有氧化还原对的重折叠缓冲液接触以重折叠该真核糖基转移酶,其中重折叠的真核糖基转移酶催化糖从供体底物转移到受体底物,其中所述第一种真核糖基转移酶是GalNAcT2。
7.如权利要求6所述的方法,其特征在于,所述第一种真核糖基转移酶经截短去除了所有或一部分主干区。
8.如权利要求6所述的方法,其特征在于,通过非半胱氨酸的氨基酸取代去除了所述第一种真核糖基转移酶中未配对半胱氨酸。
9.如权利要求6所述的方法,其特征在于,所述第一种真核糖基转移酶还含有选自淀粉结合结构域、硫氧还蛋白结构域、SUMO结构域、聚His结构域、myc表位结构域和谷胱甘肽-S-转移酶结构域的纯化结构域。
10.如权利要求6所述的方法,其特征在于,所述第一种真核糖基转移酶还含有自身切割结构域。
11.如权利要求6所述的方法,其特征在于,所述第一种真核糖基转移酶在细菌宿主细胞中表达为不溶性包含体。
12.如权利要求6所述的方法,其特征在于,用所述第一种真核糖基转移酶来重折叠第二种不溶性重组真核糖基转移酶。
13.如权利要求12所述的方法,其特征在于,用所述第一种真核糖基转移酶和第二种真核糖基转移酶来重折叠第三种不溶性重组真核糖基转移酶。
14.如权利要求6所述的方法,其特征在于,所述氧化还原对选自还原性谷胱甘肽/氧化性谷胱甘肽(GSH/GSSG)和半胱氨酸/胱胺。
15.如权利要求6所述的方法,其特征在于,所述受体底物选自蛋白质、肽、糖蛋白和糖肽。
CN200580010602.4A 2004-02-04 2005-02-04 哺乳动物糖基转移酶的重折叠方法 Expired - Fee Related CN101151367B (zh)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US54221004P 2004-02-04 2004-02-04
US60/542,210 2004-02-04
US59940604P 2004-08-06 2004-08-06
US60/599,406 2004-08-06
US62740604P 2004-11-12 2004-11-12
US60/627,406 2004-11-12
PCT/US2005/003856 WO2005089102A2 (en) 2004-02-04 2005-02-04 Methods of refolding mammalian glycosyltransferases

Publications (2)

Publication Number Publication Date
CN101151367A CN101151367A (zh) 2008-03-26
CN101151367B true CN101151367B (zh) 2013-04-10

Family

ID=39251259

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200580010602.4A Expired - Fee Related CN101151367B (zh) 2004-02-04 2005-02-04 哺乳动物糖基转移酶的重折叠方法

Country Status (2)

Country Link
CN (1) CN101151367B (zh)
ES (1) ES2368740T3 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015144936A1 (en) * 2014-03-28 2015-10-01 Novozymes A/S Resolubilization of protein crystals at low ph
WO2017175239A1 (en) * 2016-04-05 2017-10-12 Council Of Scientific & Industrial Research A multifunctional recombinant nucleotide dependent glycosyltransferase protein and its method of glycosylation thereof
CN106801047A (zh) * 2016-12-30 2017-06-06 武汉金开瑞生物工程有限公司 一种通过无细胞蛋白合成系统制备半胱氨酸蛋白酶的方法
CN113817043B (zh) * 2021-09-22 2023-07-25 清华大学 制备活性铁调节激素的方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5858751A (en) * 1992-03-09 1999-01-12 The Regents Of The University Of California Compositions and methods for producing sialyltransferases

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5858751A (en) * 1992-03-09 1999-01-12 The Regents Of The University Of California Compositions and methods for producing sialyltransferases

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Eliana De Bernardez Clark.Protein refolding for industrial processes.Current Opinion in Biotechnology 12.2001,(12),202-207.
Eliana De Bernardez Clark.Protein refolding for industrial processes.Current Opinion in Biotechnology 12.2001,(12),202-207. *
康铁军等.外源蛋白在大肠杆菌中的折叠.军事医学科学院院刊26 4.2002,26(4),304-307.
康铁军等.外源蛋白在大肠杆菌中的折叠.军事医学科学院院刊26 4.2002,26(4),304-307. *

Also Published As

Publication number Publication date
ES2368740T3 (es) 2011-11-21
CN101151367A (zh) 2008-03-26

Similar Documents

Publication Publication Date Title
US7524655B2 (en) Synthesis of oligosaccharides, glycolipids, and glycoproteins using bacterial glycosyltransferases
AU2006226782B2 (en) Expression of soluble, active eukaryotic glycosyltransferases in prokaryotic organisms
JP2011167200A (ja) H.pyloriフコシルトランスフェラーゼ
JP4892358B2 (ja) 哺乳動物グリコシルトランスフェラーゼをリフォールディングする方法
CN101151367B (zh) 哺乳动物糖基转移酶的重折叠方法
US8822191B2 (en) Methods of refolding mammalian glycosyltransferases
WO2008097829A2 (en) Large scale production of eukaryotic n-acetylglucosaminyltransferase i in bacteria
ES2365393T3 (es) Síntesis de oligosacáridos, glicolípidos y glicoproteínas usando glicosiltransferasas bacterianas.

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: NOVO NORDISK CO.,LTD.

Free format text: FORMER OWNER: NI'AOSI TECHNOLOGY CO., LTD.

Effective date: 20091023

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20091023

Address after: Denmark bagsvaerd

Applicant after: NOVO NORDISK A/S

Address before: American Pennsylvania

Applicant before: CYTEL Corp.

C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20130410

Termination date: 20220204

CF01 Termination of patent right due to non-payment of annual fee