CN1214732A

CN1214732A - 新的β1→4N-乙酰葡糖胺基转移酶和编码该酶的基因

Info

Publication number: CN1214732A
Application number: CN97193477A
Authority: CN
Inventors: 小栗秀; 箕轮真理; 吉田有人; 竹内诚; 谷口直之
Original assignee: Kirin Brewery Co Ltd
Current assignee: Kirin Brewery Co Ltd
Priority date: 1996-12-12
Filing date: 1997-12-10
Publication date: 1999-04-21
Anticipated expiration: 2017-12-10
Also published as: US6338955B2; EP0905232A1; EP0905232A4; DE69732628T2; KR100325552B1; WO1998026053A1; US20010024814A1; EP0905232B1; KR19990082498A; DE69732628D1; ATE290068T1; CN1273586C; JP4246264B2; ES2235259T3

Abstract

一种新的具有β1→4N－乙酰葡糖胺基转移酶(GnT－Ⅳ)活性的酶;编码该酶的基团;含有该基因的重组DNA;含有该重组DNA的宿主细胞;用于通过在培养基中培养宿主细胞而制备具有Gn－T－Ⅳ活性酶蛋白的方法;和具有由GnT－Ⅳ所修饰糖链的糖类。本发明提供新的GnT－Ⅳ,用于制备该酶的方法,和编码该酶的基因。该新的GnT－Ⅳ使制备不能由现存糖基转移酶而形成的分枝糖类成为可能。因此,它有助于药物、试剂和复合糖型食物的制备和改善且在修饰任何生物高分子的糖链结构中是有用的。

Description

新的β1→4N-乙酰葡糖胺基转移酶和编码该酶的基因

技术领域

本发明涉及一种新的N-乙酰葡糖胺基转移酶(GlcNAc转移酶)，其识别糖类中特异性的糖链结构并且向其中导入GlcNAc β1→4分支结构。

背景领域1．糖蛋白

自然中大多数蛋白并非是仅由氨基酸所组成的简单蛋白，而是具有糖链和其它物质如磷酸基和脂类附着其上的“成熟”蛋白。因此，由大肠杆菌制备的简单蛋白型产物的开发包括多种问题因为该产物缺乏蛋白的成熟过程。因为除少数例外，所有分泌型生理活性蛋白(如细胞因子)均为糖蛋白，故糖链的功能和作用在开发生物药物中受到极高的重视。

糖蛋白中的糖链粗略地分为Asn-连接型、粘蛋白(mucin)-型、O-连接的GlcNAc型、GPI锚定型和蛋白聚糖型[makoto Takeuchi，“糖生物学系列5：糖技术”，Kihata,Hakomori和Nagai(编)，Kodansha科学公司，(1994),191-208]。这些糖链类型的每一种具有其自己的生物合成途径和各自的生理功能。Asn-连接的糖链广泛分布于霉菌、酵母、昆虫、植物和动物中。Asn-连接的糖链的基本生物合成途径在不同种间是保守的(图1)。代表具体种类的糖链在核心糖链部分的外侧(称为“非还原性末端一侧”)形成，这在Asn-连接的糖链的生物合成中是常见的。其中的α1,3-和α1,2-分支甘露糖残基通过α1,6键延伸而附着到主链的甘露聚糖型糖链是真菌如酵母的特征性糖链结构(见图版2)[Hiroshi Nakajima，糖链技术，工业调查协会(Industry Survey Association(1992),384-397]。另一方面，在昆虫、植物和动物中，未观察到甘露糖残基的延伸；相反，形成了高甘露糖型糖链，其为由多萜醇中间体转移而来且仅修整(trimmed)过糖链(见图2中c版)。具有特征性木糖等的独特结构(见图2中b版)也在昆虫、植物和软体动物中观察到。在动物中，观察到特征性糖链结构如复合型糖链(图2中e版)和杂合型糖链(图2中d版)；在前者中，GlcNAc分支结构在曾经修整过的糖链中形成，并且添加其它种单糖如半乳糖和唾液酸形成复杂的结构；在后者，既存在复合型糖链又存在高甘露糖型糖链[Kiyoshi Furukawa，糖链技术，工业调查协会(1992),64-75]。

如上述的这种糖链存在于大多数细胞表面蛋白和分泌蛋白中，且认为起决定细胞和蛋白性质和特性的重要作用。其中，形成象从常见核心糖链延伸出天线一样的分支的糖链结构部分称为糖链分支结构。该结构据信具有产生有机体识别配体(即糖链末端部分)的功能，由此高度自由地提供多位点识别机会和通过大大增加空间占据体积而使保护蛋白部分的能力最大化的另一功能(Takeuchi等，见上)。因此，通过控制糖链的分支结构，用各种方式修饰生理功能，如糖蛋白的体内稳定性，体内动力学和器官靶向特性是可能的。考虑到这些，控制糖链分支结构的技术预期成为下一代用于开发“对人类灵敏的”糖蛋白型药物的生物技术。2．糖蛋白糖链的生理意义

分泌型糖蛋白的糖链在糖蛋白的生物合成、细胞内分组、抗原性的掩蔽、体内稳定性及器官-靶向特性中显示出杰出的功能。已知细胞表面蛋白的糖链依细胞中的变化(如分化、转变为病态、癌变)而变化。特别地，已报道在肿癌的迁移和糖链分支结构之间存在着密切的相关性。(1)抗原性的掩蔽(Masking of Antigenicity)

据认为就空间结构而言糖链具有高度的自由度且因此象推进器一样自由地移动。因此，蛋白分子如蛋白酶和抗不具对糖链亲和性蛋白的抗体被糖链所隔开且因此不能够达到蛋白部分。结果，即使在靠近糖链结合位点的肽部分具有抗原性，抗体分子仍然不能够接近肽部分。这样，抗原-抗体反应极难发生。此外，当糖蛋白被巨噬细胞捕获且降解产物以抗原形式给出，受体难以接近糖链结合位点附近的肽。因此，抗原性刺激难以发生。实际上，据报导当糖链被导入到卵清蛋白溶菌酶抗原性肽中部时，MHCⅡ类分子与该抗原的结合受到异常抑制[Mouritsen,S.,Meldal,M.,Christiansen-Brams,I.,Elsner,H.和Werdelin,O.，欧洲免疫学杂志，(1994),24,1066-1072]。随着糖链占据体积的变大，抗原性的这种掩蔽效应变得更大。因此，认为开发分支结构大大有助于这种掩蔽的效应。(2)体内稳定性

关于以转基因动物细胞作为宿主而制备的第一种糖蛋白型药物的红细胞生成素，其糖链的功能已被彻底研究过。结果，显示红细胞生成素的糖链抑制其与其受体的结合但对维持活性结构和体内动力学的改进起决定作用；总之，糖链显示出对红细胞生成素药物学活性的表达至关重要(Takeuchi,M和Kobata,A.，糖生物学(1991),1,337-346]。特别地，发现细胞生成素糖链天线数目和红细胞生成素的药物学效应之间存在着强烈的相关性，且因此从未引起注意的分支结构(由GlcNAc残基附着到核心糖链而形成的分支结构)的重要性首次被弄清[Takeuchi,M.,Inoue,N.,Strickland,T.W.,Kobata,M.,Wada,M.,Shimizu,R.,Hoshi,S.,Kozutsumi,H.,Takasaki,S.和Kobata,A.，美国自然科学院院刊(1989),86,7819-22]。上面现象的主要原因解释如下：没有发达分支结构的红细胞生成素在肾脏内很快被清除且，结果，该红细胞生成素在体内的存留时间变短[Misaizu,T,Matsuki,S.,Strickland,T.W.,Takeuchi,M.,Kobata,A.和Takasaki,S.，血液，(1995),86,4097-4104]。(3)器官靶向性

大多数生物组织具有凝集素样受体且然后用于细胞-细胞相互作用或从血液中摄入糖蛋白。肝脏中的脱唾液酸蛋白结合凝集素是对老化糖蛋白清除系统的一个代表性实例[Toshihiro Kawasaki,Sugar糖链技术，工业调查协会(1992),125-136]。此外，血管内皮细胞、血小板和白细胞(Kawasaki，见上)中含的选择蛋白和存在于巨噬细胞和NK细胞表面的凝集素受体(Kawasaki，见上)是众所周知的。此外，已知不仅糖蛋白而且细胞用糖链作为配体而聚集于特异的组织中。骨髓细胞的归巢(homing)[Tatsuo Irimura，“糖生物学系列3：细胞社会中的糖生物学”，Katsutaka Nagai,Senichiro Hakomori和AkiraKobata(编)，Kodansha科学公司，(1993),127-175]和纂集噬中性细胞至炎症区(Irimura，见上)的事例已详细研究过。将所有这些事加起来，可很好地认为糖蛋白和细胞，通过其糖链结构，对在血液循环中呈现出凝集素受体的特异性器官或组织具有靶向性，尽管这种靶向系统没有发现于所有器官中。这意味着通过糖链的药物运输是可能的。在该药物运输中，凝集素对糖链的亲和性剧烈地受糖链配体自由度和数目的影响。因此，糖链的分支结构将在这种药物运输中成为最重要的因素。(4)细胞向病态的转变和其糖链分支结构的相关性[Junko Kato,

Naoko Suzuki，“糖链技术和药物开发”，药物副作用所致损

伤的减轻与研究基金会(编)，Yakugyo-Jiho-Sha,(1994),

107-13214]。

一旦称为L-PHA的植物凝集素开发成探针以检测多-分支型糖链结构时，检测各种病态组织样品变为可能。结果，发现一种趋势，即有些类型癌细胞，特别是具有高度迁移能力的癌细胞用L-PHA能很好地被染色。这样，研究人员便注意到糖链分支结构与癌细胞迁移能力的相关性。人类绒毛膜促性腺蛋白(hCG)为在胚胎早期绒毛组织中进行活跃生物合成的糖蛋白激素。由于相当多的hCG释放到尿液中，hCG在临床上被用作妊娠的指标。主要通过单一和双重天线(biantennary)复合型链而形成的Asn-连接糖链是hCG特征性糖链。随着从绒毛膜上皮癌至侵袭性葡萄胎和从侵袭性葡萄胎至绒毛膜癌而癌逐渐增加其恶性，据报道2,4,2型三-天线糖链和异常双天线糖链(两者分别通过GnT-Ⅳ-对正常双天线和单一-天线糖链的作用而形成)出现于hCG的糖链中[Katsuko Yamashita，蛋白、核酸和酶(1992),37,1880-1888]。由于该现象的原因，已表明随着绒毛膜癌恶性的进展GnT-Ⅳ活性增加。

γ-谷氨酰基转肽酶(γ-GTP)是在肝脏中尤为丰富的糖蛋白。由于当有肝病时血清γ-GTP水平剧烈升高,该水平被用作肝病的诊断指标。此外，Yamashita等[Yamashita,K.,Totani,K.,Iwaki,Y.,Takamisawa,I.,Takeishi,N.,Higashi,T.,Sakamoto,Y.和Kobata,A.，生物化学杂志，(1989),105,728-735]已发现，由于细胞的癌变，与异常hCG中情况一样，γ-GTP的糖链结构在其分支结构中变化异常；因此，他们报导了癌变和GnT-Ⅳ激活的相关性。源自健康人肝细胞γ-GTP的Asn-连接的糖链主要由双天线复合型糖链所组成，且具有少量三天线和四天线糖链混合其中。相反，在源自人肝癌细胞γ-GTP的Asn-连接的糖链中观察到分支程度的异常增加。同时，尽管量较少，但出现高甘露糖型糖链和异常的双天线糖链(两者在正常细胞的γ-GTP中均未观察到)。由于糖链结构的这些变化，故表明有这样的可能性即N-乙酰葡糖胺基转移酶Ⅳ(GnT-Ⅳ)和Ⅴ(GnT-Ⅴ)的激活与肝细胞癌变有关(Yamashita等，见上)。

另据报导细胞中糖蛋白的糖链分支结构受病毒感染而剧烈改变(Yamashita等，见上)。BHK细胞具有分支成四天线型的糖链结构。当BHK细胞以多瘤病毒感染时，在细胞产生的糖蛋白糖链中双天线型糖链减少，而四天线型糖链和N-乙酰乳糖胺重复结构增加；总的来说，分支数目的异常改变已被认识到[Takasaki S.,Ikehira,H.和Kobata A.,生化、生物物理、研究通讯，(1980),90,(3),735-742]。由于上述的改变，GnT-Ⅳ、GnT-Ⅴ和i-GnT的激活可以考虑。3．与糖蛋白糖链分支结构有关的酶

动物特征性糖蛋白糖链结构的复合型糖链具有复杂的分支结构，其中的N-乙酰葡糖胺(GlcNAc)残基以各种方式附着到常见的核心结构上(Kiyoshi Furukawa，见上)(图1)。由于此分支结构与糖蛋白的体内及体内稳定性、定位、生物学活性和药物学特性密切相关(MakotoTakeuchi，见上)，分支结构的生物合成过程已被详细研究。通过用发明底物，H.Schachter等在母鸡输卵管中区分出多种酶活性继而预言GlcNAc分支形成酶GnT-Ⅰ至GnT-Ⅵ的存在(GlcNAc糖基转移酶的分组；图3)[Glesson,P.A.和Schachter,H.，生物化学杂志，(1983),258,6162-6173]。之后，GnT-Ⅰ[Kumar,R.,Yang,J.,Larsen,R.D.和Stanley P.，美国自然科学院院刊，(1990),87,9948-9952；Sarkar,M.,Hull,E.,Nishikawa,Y.,Simpson,R.J.,Moritz,R.L.,Dunn,R,和Schachter,H.，美国自然科学院院刊，(1991),88,234-238],GnT-Ⅱ[D′Agostaro,GA.,Zingoni,A.,Moritz,RL.,Simpson,RJ.,Schachter,H.和Bendiak,B.，生物化学杂志，(1995),270,15211-21],GnT-Ⅲ[Nishikawa,A.,Ihara,Y.,Hatakeyama,M.,Kangawa,K.和Taniguchi,N.,生物化学杂志，(1992),267,18199-18204]和GnT-Ⅴ[Shorebah,M.G.,Hindsgaul,O.和Pierce,M.,生物化学杂志，(1992),267,2920-2927；Gu,J,Nishikawa,A.,Turuoka,N.,Ono,M.,Yamaguchi,N.,Kangawa,K.,和Taniguchi,N.，生化杂志，(1993),113,614-619]被相继纯化，且其基因已被克隆。然而，仅具有这些已知的GlcNAc转移酶，是不可能形成发现于人血液糖蛋白[Yoshima,K.,Tsuji,T.,Irimura,T.和Osawa,T.生物化学杂志，(1984),256,10834-10840]和细胞生成素[Takeuchi,M.,Takasaki S.,Shimada,M.和Kobata,A.，生化化学杂志，(1990),265,12127-12130]中α1酸性糖蛋白中的主要糖链(四天线型；见下面的公式)。因此，已寻找预期在GnT-Ⅳ中具有该底物特异性和反应特异性的N-乙酰葡糖胺基转移酶作为缺失的环节。四天线型糖链结构

除上述那些酶外，下面的N-乙酰-葡糖胺基转移酶已被纯化或其基因已被克隆：作用于粘蛋白型糖链的转移酶[Bierhuizen,M.F.,Maemura,K.和Fukuda,M.，生物化学杂志，(1994),269,4473-4479]，作用于糖脂的转移酶，和形成称为I.i抗原结构糖链表位的转移酶[Kawashima,H.,Yamamoto,K.,Osawa,T和Irimura,T.，生物化学杂志，(1993),268,27118-27126；Bierhuizen,M.F.,Mattei,M.G.和Fukuda,M.，基因发育，(1993),7,468-478]。然而，这些转移酶的底物特异性和由这些转移酶转移的GlcNAc基因的结合模式不同于GnT-Ⅳ。这些转移酶中任何一个不产生象GnT-Ⅳ产物的产物。

发明内容

以下是本发明的目的，包括提供具有β1→4N-乙酰葡糖胺基转移酶(以下称为“GnT-Ⅳ”)活性的酶；编码该酶的基因；包括该基因的重组DNA；含有重组DNA的细胞；用于制备具有GnT-Ⅳ活性酶蛋白包括在培养基中培养细胞的方法；和其中的糖链以GnT-Ⅳ修饰的糖类。

为了解决上面的方案，本发明者进行了深入而广泛的研究。结果，发明者在牛小肠中分离纯化一种GnT-Ⅳ酶蛋白，并对该蛋白的生化特性进行了特征描述。然后，根据上面酶蛋白的部分氨基酸序列本发明者成功地从小肠cDNA文库和mRNA中克隆出编码牛GnT-Ⅳa的基因。此外，根据牛GnT-Ⅳa基因，本发明者又从人肝脏和人肺的cDNA文库和mRNAs中分别成功地克隆出编码人GnT-Ⅳa和人GnT-Ⅳb的两个基因。通过证实这些基因产物显示出GnT-Ⅳ活性而完成本发明。

本申请第一个发明涉及具有产生具有下面化学式所代表部分结构糖类活性的GnT-Ⅳ：

用UDP-GlcNAc作为糖供体且用具有下面化学式所代表的部分结构的糖类作为糖受体：

第二个发明涉及由显示于SEQ ID NO:18中的氨基酸序列所组成的GnT-Ⅳ或由显示于SEQ ID NO:18中的氨基酸序列所组成但具有一个或更多个氨基酸残基添加、缺失或替代而仍产生GnT-Ⅳ活性的GnT-Ⅳ；由显示于SEQ ID NO:24中的氨基酸序列所组成的GnT-Ⅳ或由显示于SEQ ID NO:24中的氨基酸序列所组成但具有一个或更多个氨基酸残基的添加、缺失或替代而仍产生GnT-Ⅳ活性的GnT-Ⅳ；和由显示于SEQ ID NO:37中的氨基酸序列所组成的GnT-Ⅳ或由显示于SEQ ID NO:37中的氨基酸序列所组成但具有一个或更多个氨基酸残基的添加、缺失或替代而仍产生GnT-Ⅳ活性的GnT-Ⅳ。

第三个发明涉及编码GnT-Ⅳ的GnT-Ⅳ基因，该GnT-Ⅳ由显示于SEQ ID NO:18中的氨基酸序列所组成或由显示于SEQ IDNO:18中的氨基酸序列所组成但具有一个或更多个氨基酸残基的添加、缺失或替代而仍产生GnT-Ⅳ活性；编码GnT-Ⅳ的GnT-Ⅳ基因，该GnT-Ⅳ基因由显示于SEQ ID NO:24中的氨基酸序列所组成或由显示于SEQ ID NO:24中的氨基酸序列所组成但具有一个或更多个氨基酸残基的添加、缺失或替代而仍具有GnT-Ⅳ活性；编码GnT-Ⅳ的GnT-Ⅳ基因，该GnT-Ⅳ基因由显示于SEQ ID NO:37中的氨基酸序列所组成或由SEQ ID NO:37中的氨基酸序列所组成但具有一个或更多个氨基酸残基的添加、缺失或替代而仍产生GnT-Ⅳ活性；由显示于SEQ ID NO:17中的核苷酸序列所组成的GnT-Ⅳ基因；由显示于SEQ ID NO:23中的核苷酸序列所组成的GnT-Ⅳ基因；和由显示于SEQ ID NO:36中的核苷酸序列所组成的GnT-Ⅳ基因。

第四个发明涉及可通过将上述GnT-Ⅳ基因中的任何一个插入到载体DNA中而获得的重组DNA；和包括上述GnT-Ⅳ基因中任何一个基因的部分或全长的染色体片段。

第五个发明涉及带有上述重组DNA的宿主细胞；和其中人工导入有上述染色体片段的宿主细胞。

第六个发明涉及用于制备GnT-Ⅳ的方法，包括在培养基中培养上述宿主细胞和从得到的培养物中回收GnT-Ⅳ；以及用于制备GnT-Ⅳ的方法，包括从分泌物中、体液或源自上述宿主细胞的匀浆液回收GnT-Ⅳ酶。

第七个发明涉及用于从生物样品中纯化GnT-Ⅳ的方法。

第八个发明涉及其糖链结构以GnT-Ⅳ修饰的糖。

以下，将对本发明进行详细描述。

本发明的GnT-Ⅳ基因可按下述方法分离。牛GnT-Ⅳa基因的分离

首先，将从去污剂溶解的牛小肠微粒体级分用阴离子交换层析、铜螯合物层析、用底物类似物的两步亲和层析及凝胶过滤进行一系列的纯化步骤继而获得GnT-Ⅳ酶的纯化样品。将得到的纯化样品进行SDS-PAGE且然后转移至PVDF膜上。转移的蛋白原样或经有限的水解后从气相氨基酸测序仪进行分析以获得GnT-Ⅳ酶的部分氨基酸序列。

随后，用从动物细胞(即，牛小肠)提取的RNA作为模板用根据上面测得的部分氨基酸序列而设计的引物进行RT-PCR。此外，用通过RT-PCR获得的片段作为探针，通过噬菌斑杂交从上面提到组织的cDNA文库中筛选感兴趣的GnT-Ⅳ基因。将在得到的阳性噬菌斑中含有的cDNA片段切出并亚克隆到载体如pUC19中，然后分析其核苷酸序列。如果编码感兴趣蛋白的基因全长没有含在该片段中，用部分的该亚克隆cDNA片段作为探针再次进行噬菌斑杂交。或者，根据上面获得的核苷酸序列信息通过RACE等而获得感兴趣cDNA的末端部分。将这样获得的GnT-Ⅳ基因(后称为GnT-Ⅳa)进行其全长核苷酸序列的分析。将具有上面提到的核苷酸序列的基因翻译成氨基酸序列。此氨基酸序列显示于SEQ ID NO:18中。人类GnT-Ⅳa和GnT-Ⅳb基因的分离

通过用从人组织(肝脏或肺)提取的RNA且根据上面获得的牛GnT-Ⅳa基因核苷酸序列信息进行PCR，然后从上面的组织中筛选cDNA文库可获得人GnT-Ⅳa和GnT-Ⅳb基因。将得到的人GnT-Ⅳa和GnT-Ⅳb基因进行它们的全长核苷酸序列分析。然后，将这些基因翻译成氨基酸序列。这些氨基酸序列显示于SEQ ID NOS:24和37。

为了获得编码显示于SEQ ID NO:18、24或37中的氨基酸序列并具有一个或更多个氨基酸残基的添加、缺失或替代的DNA，可用多种方法。例如，以诱变剂处理DNA以诱导点突变或缺失突变的方法，包括选择性切割DNA、去除或添加选择的核苷酸且然后连接DNA的方法；点特异性诱变；等可被列举。

本发明的GnT-Ⅳ蛋白可通过以下方法制备，包括制备其中的启动子下游插入通过上述方法而获得的编码本发明GnT-Ⅳ DNA的重组载体，将该载体导入宿主细胞并培养得到的细胞。用于此目的的载体DNA或者可以是质粒DNA或者可以是噬菌体DNA。例如，可以使用显示于后面所述实施例中的pSVL载体(发玛西亚，瑞典)。作为其中导入有得到的重组DNA的宿主细胞，可以使用在重组DNA技术中方便使用的任何细胞，例如，原核细胞、动物细胞、酵母、真菌及昆虫细胞。具体的实例包括作为原核细胞的大肠杆菌和作为动物细胞的来自中国仓鼠的CHO细胞和来自猴的COS细胞。

对每种宿主用常规的方法对上述宿主细胞进行转化。例如，如果宿主为大肠杆菌，包括重组DNA的载体通过热休克方法或电穿孔导入由钙方法等而制备的感受态细胞中。如宿主为酵母，包括重组DNA的载体通过热休克方法或电穿孔进入由锂方法等而制备的感受态细胞中。如果宿主为动物细胞，包括重组DNA的载体通过磷酸钙方法、脂质转染法或电穿孔法导入生长期的细胞中。

通过在培养基中培养这样获得的转化子，制备GnT-Ⅳ蛋白。

在转化子的培养中，只要宿主能够在其中存活可使用任何培养基，例如，如果宿主是大肠杆菌可以使用LB培养基等。如果宿主是酵母，可以使用YPD培养基等。如果宿主是动物细胞，可以使用补充以动物血清等的Dulbecco′s培养基。培养在常规用于宿主的条件下进行。例如，如果宿主是大肠杆菌，细胞在约25-37℃，如果必要，通气和/或振荡下培养约3-24小时。如果宿主是酵母，细胞在约25-37℃，如果必要，通气和/或振荡下培养约12小时至2周。如果宿主是动物细胞，培养在约32-37℃于5％CO₂和100％湿度下，如果必要，改变通气条件和/或振荡下进行24小时至2周。

培养后，用匀浆器、弗氏压碎器、超声处理、溶菌酶和/或冻融破碎培养的微生物或细胞以从该微生物或细胞中洗脱出GnT-Ⅳ蛋白。然后，蛋白可获自可溶性部分。如果感兴趣的蛋白含在不溶性部分中，破碎微生物或细胞后通过离心收集不溶性部分。然后，该蛋白可用含盐酸胍等的缓冲液溶解而用于回收。或者，将培养的微生物或细胞可直接以含有蛋白变性剂和盐酸胍的缓冲液破碎以从微生物或细胞中洗脱出感兴趣的蛋白。

从上面的上清液中对GnT-Ⅳ蛋白的纯化可通过实施例1中描述的方法完成。或者，此纯化可通过适当地结合常规的分离/纯化方法而进行。这些常规的分离/纯化方法包括，但不限于，离心、盐析、溶剂沉淀、透析、超滤、分配层析、凝胶过滤、毛细管电泳、TLC、离子交换层析、金属螯合层析、亲和层析、反相层析及等电点聚焦。

按上述获自牛小肠的GnT-Ⅳ酶蛋白的生化特性如下。(1)作用

该酶蛋白产生具有下面化学式所代表的部分结构的糖类：用UDP-GlcNAc作为糖供体且用具有下面化学式所代表的部分结构的糖类作为糖受体：

作为糖受体的糖类意指寡糖、多糖、糖缀合物(糖肽、糖蛋白、糖脂或蛋白聚糖)或其衍生物。(2)底物特异性

当糖受体是寡糖(寡糖结构，见图4)时，酶蛋白对核心型寡糖显示出0％的反应性，对GnT-Ⅰ产物型寡糖显示出54％的反应性且对GnT-Ⅴ产物型寡糖显示出164％的反应性，其中将酶蛋白对GnT-Ⅱ产物型寡糖的反应性看作100％。

酶蛋白对GnT-Ⅱ产物型寡糖的结构显示出46％的反应性，其中的岩藻糖通过α1→6链附着到还原性末端的GlcNAc上。

酶蛋白对GnT-Ⅱ产物型寡糖的结构显示出0％的反应性，其中α1→3甘露糖上的GlcNAc缺失。

酶蛋白对GnT-Ⅱ产物型寡糖的结构显示出16％的反应性，其中的半乳糖通过β1→4键附着到α1→6甘露糖上的GlcNAc中，且酶蛋白对下面的GnT-Ⅱ产物型寡糖的结构显示出0％的反应性，该寡糖中的半乳糖通过β1→4键附着到α1→3甘露糖上的GlcNAc上。

酶蛋白对下面的GnT-Ⅱ产物型寡糖的结构显示出0％的反应性，该寡糖中的GlcNAc通过β1→4键附着到β1→4甘露糖上。(3)分子量

由SDS-PAGE(非变性条件下)测定约为66K。经肽N-糖苷酶F处理后约60K。由于当使用肽N-糖苷酶时观察到带的迁移，故认为此酶蛋白是糖蛋白。

通过含有Triton Ⅹ-100的凝胶过滤而测得的表观分子量为77K。因此，认为GnT-Ⅳ不具有亚单位结构且以单体起作用。

由此核苷酸序列推导的该酶蛋白部分由535个氨基酸残基所组成且具有61614的分子量。(4)最适pH

反应的最适pH约为5.5。在pH6.5至8.0的范围内观察到多于50％的最大活性。(5)抑制、激活和稳定化

(ⅰ)抑制

该酶活性受添加20mM EDTA而受到抑制。

该酶受UDP衍生物抑制。抑制的强度按下面顺序：UDP＞＞UDP-Glc＞UDP-GalNAc＞＞2′-脱氧UDP＞UDP-己酸胺(hexanolamine)＞＞UDP-Gal＞UTP＞UDP-葡萄糖醛酸＞UMP。

尿苷、TDP及CDP不具有抑制效应。

(ⅱ)激活

二价阳离子对活性的表达是至关重要的。二价阳离子中，Mn²⁺显示出最大的效应。在7.5mM的浓度时，Co²⁺和Mg²⁺的各自效应约为Mn^2-的70％，且Ca²⁺的效应约为Mn²⁺的10％。在5-20mM的范围中Mn^2-的效应是最大的。

(ⅲ)稳定化

在BSA和甘油中认识到有稳定效应。(6)动力学参数

当作为受体的糖为单糖时(单糖结构，见图4)：

(ⅰ)其中的酶在50μl 125mM MOPS缓冲液(pH7.3)中于37℃反应4小时的分析条件下，其中的缓冲液含有0.8mM的受体底物，20mM的UDP-GlcNAc,7.5mM的MnCl₂,200mM的GlcNAc,0.5％(w/v)Triton X-100,10％的甘油和1％的BSA：

对GnT-Ⅱ产物型寡糖的Km和Vmax值分别为0.73mM和3.23μM/分钟。

对GnT-Ⅴ产物型寡糖的Km和Vmax值分别为0.13mM和1.75μM/分钟。

当GnT-Ⅱ产物型寡糖为受体底物时，对UDP-GlcNAc的Km值为0.22mM。

(ⅱ)其中的酶在125mM MOPS缓中液(pH7.3)中于37℃反应4小时的分析条件下，其中的缓冲液含有120mM的UDP-GlcNAc,7.5nM的MnCl₂,0.5％(w/v)的Triton X-100,10％的甘油和1％的BSA：

对GnT-Ⅱ产物型寡糖的Km和Vmax值分别为0.59mM和0.74mM/分钟/mg。

对GnT-Ⅴ产物型寡糖的Km和Vmax值分别为0.14mM和0.47mM/分钟/mg。(7)GnT-Ⅳ家族

牛GnT-Ⅳa和人GnT-Ⅳa之间同源性在核苷酸水平为91％且在氨基酸水平为96％。

所有从牛小肠中纯化的GnT-Ⅳ中含有的部分氨基酸结构均编码于牛GnT-Ⅳa基因中。

人GnT-Ⅳb和人GnT-Ⅳa在核酸水平有63％的同源性且在氨基酸水平具有62％的同源性。然而，它们在C-末端和N-末端区域是完全不同的。

从上述的生化特性看，本发明的GnT-Ⅳ被认为是一种新的酶因为该酶能够完成下面常规酶不能够完成的反应：

附图简述

图1显示Asn-连接糖链的生物合成途径。

图2显示Asn-连接糖链的变异(修改自位于Makoto Takeuchi,Wako Purechemical Newsletter 64,18-19,1996中的图1)。

a．甘露聚糖型：真菌如酵母和霉菌的特征性糖链结构。

b．木-高-甘露糖型：植物、软体动物和昆虫的特征性结构。

c．高甘露糖型：常见于植物、昆虫和动物中的结构。

d．杂合型：常见于昆虫和动物中的结构。

e．复合型：动物的特征性结构。

f．原核细胞：没有用于Asn-连接糖链生物合成的系统。

套于点线中的部分代表常见的核心糖链。

图3显示由各种GlcNAc转移酶(GlcNAc糖基转移酶)对GlcNAc转移的位置。

图4显示寡糖的命名和结构。

图5显示对GnT-Ⅳ反应产物的高效液相色谱。

图6显示由Q-Sepharose FF色谱对GnT-Ⅳ的分析结果。

图7显示通过铜螯合物Sepharose FF层析对GnT-Ⅳ的分析结果。

图8显示通过UDP-己酸胺(UDP-Hexanolamine)琼脂糖亲和层析(Ⅰ)对GnT-Ⅳ的分析结果。

图9显示通过UDP-己酸胺琼脂糖亲和层析(Ⅱ)对GnT-Ⅳ的分析结果。

图10显示通过Superdex200凝胶层析对GnT-Ⅳ的分析结果。

图11为显示纯化GnT-Ⅳ SDS-PAGE(SDS聚丙烯酰胺凝胶电泳)结果图。

图12显示纯化GnT-Ⅳ的天然凝胶电泳及其活性的结果。

图13显示GnT-Ⅳ、-Ⅴ和Ⅵ产物型寡糖的Smith降解图。

图14显示GnT-Ⅳ反应产物的1H-NMR(30℃)结果。

图15显示GnT-Ⅳ的最适pH。

图16显示GnT-Ⅳ的最适Mn2+浓度。

图17显示GnT-Ⅳ反应产物糖蛋白的SDS-PAGE和荧光层析分析结果。

道1和道2:7.6μg脱唾液酸人转铁蛋白

道3:7.6μg唾液酸人转铁蛋白

道4和道5:2.8μg脱唾液酸CHO细胞来源的重组人红细胞生成素

道6和道7:1.3μg脱唾液酸胎球蛋白

道1、4和6代表反应在无GnT-Ⅳ进行的模拟实验。M代表分子量标准(伯乐)。PM代表预染的分子量标记(伯乐，美国)。

GnT-Ⅳ反应条件：向10μl含0.702mnol/hr的GnT-Ⅳ、相当于1.6nmol的双天线型糖链的底物糖蛋白(对于仅是胎球蛋白，糖链含量为1.6nmol)和450nCi的UDP-[¹⁴C]GlcNAc的溶液中，加入等体积的分析混合物(250mM MOPS缓冲液，pH7.3,400mM GlcNAc,20％甘油，1.0％(w/v)Triton X-100,15mM MnCl₂,1mM UDP-GlcNAc)以获得反应溶液，将其于37℃孵育20小时。将得到溶液的十分之一通过SDS-PAGE和荧光自显影进行分析。

对于SDS-PAGE，使用10-20％的梯度胶(Daiichi Kagaku)。对于荧光自显影，用Amplify(Amersham)将样品暴露至X射线胶片20小时。当点印迹至PVDF膜上后用ConA-HRP和POD-Immunostain试剂盒(Wako Purechemical)对糖蛋白中的双天线糖链进行观察。

图18显示人GnT-Ⅳa的开放阅读框和含在pCore-His表达载体中的区域。

图19显示由单个细胞克隆产生的红细胞生成素的等电点聚焦及Western分析结果。分别用2种产生红细胞生成素的菌株及其中导入有牛和人GnT-Ⅳa基因的相同菌株，通过等电点聚焦和用抗红细胞生成素抗体的Western印迹对每种菌株分泌的红细胞生成素进行分析。在左侧，显示出PI标准的位置。

完成本发明的最佳方式

下面，将参照下面的实施例对本发明进行更为详细的描述。然而，本发明不限于这些实施例。[参照实施例1](1)用于实施例中的试剂

除非特别说明，所用的试剂为由Wako Purechemical Industries公司生产的最高级别的产品。

(ⅰ)吡啶基胺化(Pyridylaminated)的寡糖

所用的每种吡啶基胺化的寡糖按下述获得。首先，根据Tokugawa等的方法[Biehuizen,M.F.,Mattei,M.G.和Fukuda,M.(1993)基因发育，7,468-478]从人转铁蛋白(apo型；Sigma，美国)中制备吡啶胺化的寡糖。以一种或几种下面的酶处理得到的材料：产脲节杆菌来源的唾液酸酶(Nacalai Tesque)，曲霉类来源的β-半乳糖苷酶(Toyobo)，刀豆来源的β-N-乙酰氨基己糖苷酶(Seikagaku公司)，CHO-K1细胞提取物(通过超声处理位于2体积5mM Tris-HCl缓冲液中的CHO-K1细胞而获得的上清，缓冲液pH7.5，含有2mMMgCl₂和1mM PMSF)中的GnT-Ⅴ活性部分，位于牛小肠匀浆物溶解部分中的GnT-Ⅴ活性部分(对于制备方法，见实施例1中的“微粒体级分的制备”和“溶解”)。通过以上述的酶处于PA-糖链021和022(Takara Shuzo)制备部分的吡啶基胺化寡糖。在两种情况，使用前通过用ODS柱(10×250mm；Vydac，美国)的反相层析纯化制备的寡糖。

(ⅱ)糖蛋白底物

将牛胎球蛋白(Sigma，美国)和CHO细胞来源的重组人红细胞生成素(Kirim Brewery)进行下面的预处理以将它们纯化成相对一致的糖形式(glycoform)。简言之，将40-100mg糖蛋白应用于以pH7.4，含有1mM MgCl₂,1mM CaCl₂和0.15M NaCl的10mM Tris-HCl缓冲液平衡的ConA-Sepharose柱(5ml；发玛西亚，瑞典)以获得具有低双天线糖链含量作为非吸附部分的糖形式。之后，以含有1.0Mα-甲基甘露糖苷(Nacalai Tesque)的上述缓冲液洗脱柱以获得吸收具有高双天线糖链含量糖形式的部分。这样，获得具有低双天线糖链含量的胎球蛋白和具有高双天线糖链含量的红细胞生成素。至于人转铁蛋白，没有必要纯化此糖蛋白因为几乎其所有的糖链均为双天线型。

将这样获得的胎球蛋白和人转铁蛋白于1ml pH5.0，含有4mMMgCl₂的醋酸钠缓冲液中以1U的唾液酸酶和0或107U的β-半乳糖苷酶于37℃反应16小时以唾液酸(asialo)或脱唾液酸(asialo agalacto)的糖蛋白。具有高度双天线型糖链含量的红细胞生成素以与上述同样的方式与0.5U的唾液酸酶和5U的β-半乳糖苷酶反应以获得脱唾液酸脱乳糖的糖蛋白。

这样获得的每种糖蛋白以pH7.3的50mM醋酸铵缓冲液透析。然后，用BSA(牛血清蛋白)作为标准以BCA蛋白分析仪(Pierce，美国)测定蛋白的量。此外，通过SDS-PAGE(十二烷基磺酸钠聚丙烯酰胺凝胶电泳)分析此蛋白。这样制备的糖蛋白用于实施例中。

(ⅲ)RT-PCR(反转录-聚合酶链式反应)

对于RT-PCR，使用Acess RT-PCR系统(Promega，美国)。对于感兴趣基因片段的扩增，使用Pfu聚合酶(Stratagene，美国)。(2)用于实施例中的设备

(ⅰ)基因测序

ABI PLISM 377 DNA测序仪(Perkin-Elmer，美国)被使用。[参考实施例2]GnT-Ⅳ活性的特异性分析

一般地，有2种用于分析GnT-Ⅳ活性的方法：测定放射性标记的GlcNAc向寡糖底物中转移的方法和通过HPLC等分级分析GlcNAc向标记的寡糖底物中转移的方法。Taniguchi等开发出一种用GnT-Ⅱ产物型寡糖作为受体同时测定GnT-Ⅲ、-Ⅳ和-Ⅴ活性的方法[Nishikawa,A.,Fujii,S.,Sugiyama,T.和Taniguchi,N.(1988)生化年鉴，170,349-354]。然而，此分析方法本身不适于在GnT-Ⅳ纯化过程中的分析因为GnT-Ⅳ的相对活性大大低于GnT-Ⅲ和-Ⅴ的活性。

因此，本发明者通过增加受体吡啶基胺化寡糖至10倍于用于前面分析系统中的量而开发出用于定量选择性地测定GnT-Ⅳ活性的方法[Tokugawa,K.,Oguri,S.和Takeuchi,M.(1996)糖缀合物杂志，13,53-56]，这种寡糖可容易地制备。

在本发明的实施例中，GnT-Ⅳ活性按下述分析。

该酶在pH7.3的125mM MOPS[3-(N-吗啉代)丙烷磺酸]缓冲液中于37℃反应4小时，MOPS缓中液中含有0.8mM吡啶基胺化的寡糖底物(GnT-Ⅱ产物型寡糖底物)，20mM UDP-GlcNAc,7.5mM MnCl₂,200mM GlcNAc,0.5％(w/v)Triton X-100,10％甘油和1％BSA。然后，通过煮沸该溶液2分钟而终止反应。以0.45nm滤膜去除固体后，以ODS-80TM柱(4.6×150mm；TOSO)于50℃以pH4.0含有0.15％(w/v)n-丁醇的50mM醋酸铵缓冲液以1.2ml/分钟的流速分析5μl的滤液。吡啶氨基的荧光用320nm的激发光和400nm的发射光加以检测。[实施例1]酶的分离和纯化(1)酶源的筛选

通过利用上述的分析方法搜索待纯化的GnT-Ⅳ酶的来源。如表1中所示，已发现牛小肠中GnT-Ⅳ对GnT-Ⅲ和GnT-Ⅴ的相对活性大大高于GnT-Ⅳ在任何其它组织中的相对活性。因此，选择牛小肠作为纯化的起始原料。

表1

GnT-Ⅳ酶源的搜索

酶源	比活性(pmol/h·mg-蛋白)
	比活性(pmol/h·mg-蛋白)			Ⅳ	Ⅲ	Ⅴ
	培养的细胞大鼠器官¹⁾人类¹⁾牛器官初乳	CHOBowesAH66¹⁾Solid AH¹⁾Yoshida sarcoma¹⁾小肠心脏胰脏肾脏脑肝脏小肠心脏胰脏	10.812.02.0271.3179.4201.93.72.825N.D.10.9N.D.	Ⅳ	Ⅲ	Ⅴ	0341634116702801110018406608.1174N.D.0.7N.D.	1097150308010968102130388.241N.D.10.9N.D.

N.D.：低于检测极限

¹⁾：数据来自Nishikawa,A.等，BBA 1035,313-318(1990)(2)纯化

除非特别说明，否则所有操作均在4℃进行。(ⅰ)微粒体级分的制备

将2千克牛小肠(获自肉类加工厂)切碎。然后，向其中加入4体积的提取缓冲液(10mM Tris-HCl缓冲液，pH7.4，含0.25M蔗糖，1mM苯甲磺酰氟，1mM盐酸苯脒(benzamidine hydrochloride),1mM二硫苏糖醇及10mg/ml抗蛋白酶)并从Polytron(Kinematica，瑞典)匀浆。得到的匀浆物以900×g离心10分钟。然后，进一步以105,000×g离心上清60分钟以得到微粒体沉淀级分(样品1)。(ⅱ)溶解

以3体积通过添加Triton-100至提取缓冲液而制备的溶解缓冲液悬浮样品1以得到1％的终浓度。通过以105,000×g离心60分钟而获得上清。再次悬浮沉淀并收集上清。合并第一及第二次提取物(样品2)。(ⅲ)Q-Sepharose FF层析

将样品2应用于Q-Sepharose FF柱(5×30cm；发玛西亚，瑞典)，该柱以20mM Tris-HCl,pH7.4，含有1mM盐酸苯脒，0.1％Triton X-100和20％甘油的操作缓冲液1预平衡且然后以0-0.5MKCl的线性梯度洗脱(图6)(样品3)。(ⅳ)铜螯合物Sepharose FF层析

将样品3应用于以操作缓冲液2(通过向操作缓冲液1中加入KCl至0.15M而获得)预平衡的铜螯合物Sepharose FF层析柱(5×10cm；发玛西亚，瑞典)。然后以5体积的操作缓冲液2将没有被吸收的部分洗出。之后，以0.01M的甘氨酸线性梯度洗脱吸收的部分(图7)。合并得到的GnT-Ⅳ活性部分并以YM30超滤膜(Amicon，美国)浓缩(样品4)。(ⅴ)UDP-己酸胺琼脂糖亲和层析Ⅰ

将在加入1mM苯脒盐酸的操作缓冲液3中透析过的样品4的一半应用至以操作缓冲液3(20mM Tris-HCl,pH8.0，含有0.15M KCl,10mM MnCl₂,0.05％Trion X-100和20％甘油)预平衡的UDP-己酸胺琼脂糖亲和柱(1.2×4.5cm；Sigma，美国)中。然后，没有吸附的部分以操作缓冲液4(20mM Tris-HCl,pH8.0，含有10mMMnCl₂,0.05％Triton X-100和20％的甘油)洗出。之后，以其中加入有1M(终浓度)KCl的操作缓冲液4洗脱吸附产物(图8)。合并GnT-Ⅳ活性部分并在操作缓冲液5(与操作缓冲液4具有相同的级分但具有7.4的pH)中透析(样品5)。(ⅵ)UDP-己酸胺琼脂糖亲和层析Ⅱ

将样品5应用于以操作缓冲液5预平衡的UDP-己酸胺琼脂糖亲和柱(1.0×6.5cm；Sigma，美国)。然后，以操作缓冲液5将未吸附的部分洗出。之后，以去除MnCl2的操作缓冲液5洗脱吸附产物(图9)。合并得到的GnT-Ⅳ活性部分(样品6)。(ⅶ)Superdex 200凝胶层析

用小的Q-sepharose FF柱浓缩样品6并应用于以操作缓冲液6(通过向操作缓冲液5中添加KCl至0.15M的终浓度而获得)预平衡的Superdex 200HR5/5柱(1×30cm；发玛西亚，瑞典)。操作缓冲液6以0.25ml/分钟的流速应用于柱以获得GnT-Ⅳ活性部分(样品7)。(ⅷ)每个纯化步骤中蛋白的量、活性及特异性活性总结于表2中。最终样品较小肠匀浆物纯化224,000倍。

表2GnT-Ⅳ的纯化

纯化步骤	蛋白量(mg)	总的酶活性(nmol/h)	比活性(nmol/h/mg)	产量(％)	纯化系数(-倍数)
纯化步骤	蛋白量(mg)	总的酶活性(nmol/h)	比活性(nmol/h/mg)	产量(％)	纯化系数(-倍数)	牛小肠匀浆物溶解的级分Q-Sepherose铜螯合物SepheroseUDP-己酸胺ⅠUDP-己酸胺ⅡSuperdex 200	112,90024,1004,0004500.590.0350.008	49,50014,5007,2003,6701,9501,420790	0.440.601.808.103,31040,60098,800	10029147.43.92.91.6	11.44.118.47,51092,200224,000

以2kg牛小肠开始。(3)酶化学及蛋白化学特性(ⅰ)纯度

在SDS-PAGE中样品7在分子量为60K处出现单一条带(图11)。当将样品7进行非变性-PAGE(native-PAGE)并将得到的带从凝胶中切除以测定GnT-Ⅳ活性时，此蛋白带的位置与活性位置相一致(图12)。此外，样品7中没有检测到任何GnT-Ⅰ、-Ⅱ、-Ⅲ或-Ⅴ活性。从这些结果，得出样品7为纯的GnT-Ⅳ。考虑到通过含Triton X-100凝胶过滤而测得该蛋白的表观分子为77K(图10)，认为GnT-Ⅳ不具有亚单位结构且以单体形式表达其活性。当样品7以肽N-糖苷酶F(宝灵曼，德国)处理时，在SDS-PAGE中观察到流动性的增加。因此，认为牛小肠的GnT-Ⅳ为具有至少Asn-连接酶链的糖蛋白。(ⅱ)反应特异性

当该酶与由下面化学式所代表的GnT-Ⅱ产物型寡糖作为底物反应时：在由HPLC分析的标准条件下，该酶产生单一的产物(比啶基胺化的寡糖1)。

收集此产物，然后通过下面的方法测定其结构，包括(ⅰ)Smith降解加激光TOF-MS(时相质谱仪(time-of-flight massspectrometer)和(ⅱ)¹H-NMR。因此，该酶的反应特异性得以检测。当根据Kobata和Takasaki方法[Kobata,A.和Takasaki,S.(1993)于《糖生物学》中“实践方法”(Fukuda,M.和Kobata,A.，编)165-185,IRL出版社，牛津，英国]将吡啶基胺化的寡糖1进行Smith降解时，由于第一次降解时其质量数由1599.0变为795.30且由于第二次降解进一步变为634.68。这与图13中所示的反应途径相一致。因此，得出此酶的反应产物具有下面的结构：

此外，当将吡啶基胺化的寡糖1进行¹H-NMR时，检到4.53ppm的峰值，其相应于显示下面通式中GlcNAc7的无头质子；其偶联常数J1,2为7.9Hz(图14)。这些结果显示GlcNAc7，如下面化学式中所示，GlcNAc7通过β-型键附着到Man4的位置4上，完全支持了上述结构。

(ⅲ)最适pH

如图15所示，该酶的最适pH约为7.5。(ⅳ)二价阳离子的需求

如表3中所示，该酶可由加入EDTA(乙二胺四乙酸)而失活。二价阳离子对其活性是至关重要的。二价阳离子中，Mn²⁺显示出最大的效应，其次是Co²⁺和Mg²⁺。Ca²⁺和Fe²⁺有微弱的效应。如图16所示Mn²⁺的最适浓度约为10mM。

表3

GnT-Ⅳ的二价阳离子需求

添加物	活性(％)
添加物	活性(％)	无EDTAMnCl₂CoCl₂MgCl₂CaCl₂FeCl₂CuCl₂	5.6010074.872.57.29.80

通过加入每种金属离子(10mM)至去除金属离子的GnT-Ⅳ样品中而测定GnT-Ⅳ的活性。GnT-Ⅳ活性由表中的百分比表示，其中加入10mM MnCl₂的活性被看作是100％。(ⅴ)糖核苷酸类的抑制

如表4中所示，UDP最为强烈地抑制该酶的活性。UDP-葡萄糖，UDP-GalNAc,2′-脱氧-UDP和UDP-己酸胺(Sigma，美国)的抑制效应以此顺序列于UDP的抑制效应之后。尿苷、UMP、TDP和CDP几乎没有显示出抑制效应。

表4

核苷酸对GnT-Ⅳ的抑制

添加物	活性(％)
添加物	活性(％)	无尿苷UMPUDPUTPTDPCDP2′-脱氧-UDPUDP-己酸胺UDP-葡萄糖UDP-半乳糖UDP-葡糖醛酸UDP-N-乙酰半乳糖胺	10011597.327.388.211011267.473.656.687.392.359.7

当在0.5mM UDP-GlcNAc存在时加入每种核苷酸(2mM)时的GnT-Ⅳ活性在表中以百分数表示，其中没有加入任何物质时的活性看作是100％。(ⅵ)底物特异性

如表5中所示，该酶最优选以GnT-Ⅴ产物型寡糖(表中E)作为受体。其次，该酶优选GnT-Ⅱ产物型寡糖(表5中D)。

当该酶对GnT-Ⅱ型寡糖的反应性看作为100％时，它对核心型寡糖(表5中A)和GnT-Ⅰ底物型寡糖(表5中C)分别表现出0％和54％的反应性。

该酶对GnT-Ⅱ产物型寡糖的结构显示出46％的反应性，其中的岩藻糖通过α1→6键附着到GlcNAc的还原性末端(G有5中F)。

该酶对GnT-Ⅱ产物型寡糖显示出0％的反应性，其中的GlcNAcα1→3甘露糖缺失(表5中B)。

该酶对GnT-Ⅱ产物型寡糖的结构显示出16％的反应性，其中的半乳糖以β1→4键附着到GlcNAc的α1→6甘露糖上(表5中的G)，且对GnT-Ⅱ产物型寡糖的结构显示出0％的反应性，其中的半乳糖通过β1→4键附着到GlcNAc的α1→3甘露糖上(表5中的H和I)。

该酶对GnT-Ⅱ产物型寡糖的结构显示出0％的反应性，其中的GlcNAc以β1→4键附着到β1→4甘露糖上(表5中J)。

上述该酶的底物特异性与Schachter等所预言的GnT-Ⅳ底物特异性[Glesson,P.A.和Schachter,H.(1983)生物化学杂志，258,6162-6173]几乎一致。因此，很明显本发明的酶正是复合型糖链生物合成中长期缺失的环节(link)中的GnT-Ⅳ。表5

(ⅶ)动力学参数

在参照实施例2中所述分析条件下，该酶对GnT-Ⅱ产物型寡糖的Km和Vmax值分别为0.73mM和3.23μm/分钟，对GnT-Ⅴ产物型寡糖的这些值分别为0.13mM和1.75μM/分钟。对UDP-GlcNAc的Km值为0.22mM。

在获得的吡啶基胺化寡糖中，发现由下面化学式所代表的寡糖为新的寡糖：

和(ⅷ)对糖蛋白的作用

为了证明GnT-Ⅳ不仅能对寡糖底物而且能对糖蛋白中的寡糖链起作用，用UDP[¹⁴C]GlcNAc作为糖供体GnT-Ⅳ对脱唾液酸糖起反应。然后，通过SDS-PAGE和荧光自显影分析反应产物(图17中A版和B版)。如图17B版中的2道和5道所示，[¹⁴C]GlcNAc向脱唾液酸人转铁蛋白和脱唾液酸、CHO细胞来源的重组人红细胞生成素的转移。

通过此GnT-Ⅳ反应而获得的具有GnT-Ⅳ产物型糖链的人转铁蛋白(具有下面的化学式)为自然界中没有的新物质。

GnT-Ⅳ产物型糖链结构[实施例2]肽作图分析

约1mg最终纯化的本发明酶根据Laemmli方法[Laemmli，英国，自然(1970)313,756-762]于0.1％SDS-10％聚丙烯酰胺凝胶上电泳。将分离的蛋白电印迹至PVDF膜上。将固定于膜上的蛋白进行S-羧甲基化然后以赖氨酰内肽酶无色杆菌蛋白酶Ⅰ(AP-I)(Wako纯化学工业公司)消化以获得AP-I-消化的片段混合物。AP-I-消化的PVDF膜进一步以Asp-N(Takara Shuzo)消化以获得Asp-N-消化的片段混合物。通过高液相层析分离肽段混合物中的每一片段并进行氨基酸序列分析。结果，获得显示于SEQ ID NOS:1-14中的序列。[实施例3]牛GnT-Ⅳa cDNA的分离和鉴定(1)RT-PCR

根据在实施例2中获得的显示于SEQ ID NOS:7和11中的氨基酸序列，分别合成显示于SEQ ID NO:15中的寡聚体AP-5F和显示于SEQ ID NO:16中的寡聚体DN-9R。用从牛小肠组织中通过异硫氰酸胍方法提取的总RNA作为模板且用上述引物进行RT-PCR。结果，获得似乎特异性的约170bp的扩增片段。将该片段亚克隆。(2)文库的筛选

用上述RT-PCR产物筛选牛小肠cDNA文库(Clontech，美国)以获得4个阳性噬菌斑。测定这些克隆的核苷酸序列。得到的序列含有许多编码一些实施例2中获得的部分氨基酸序列(SEQ ID NOS:1-14)的核苷酸序列，且也含有似乎为终止密码子的序列。用代表得到核苷酸序列最上游区域的150bp的片段，再次筛选该文库以获得两个阳性噬菌斑。测定这些克隆的核苷酸序列。然后，以150bp的最上游区域的探针进一步同样地筛选该文库，然而，没有获得新的克隆。(3)5′RACE(cDNA末端的快速扩增)

随后，为了获得全长cDNA而进行5′RACE。用噬菌体筛选获得的最上游区域序列，进行第1次5′RACE。然而，没有能够发现起始密码子。然后，根据第一次5′RACE获得的序列，进行第二次5′RACE以获得含有起始密码子的序列。将该序列连接到以前获得的噬菌体克隆的部分基因序列上以获得含有完整开放阅读框的基因片段(基因1)。这样获得基因片段的核苷酸序列显示于SEQ ID NO:17中，且由其推测的氨基酸序列显示于SEQ ID NO:18中。已证实此DNA片段含有所有编码在实施例2中获得的部分氨基酸序列(SEQ ID NOS:1-14)的核苷酸序列。[实施例4]用克隆的牛GnT-Ⅳa基因对表达载体的构建和用于制备

GnT-Ⅳa酶的方法(1)载体的构建

合成将XhoⅠ位点导入基因1起始密码子上游区域的引物(SEQ IDNO:19)和将XbaⅠ位点导入该基因终止密码子下游区域的另一种引物(SEQ ID NO:20)。然后，用此引物用PCR扩增编码GnT-Ⅳ酶的整个基因。以XhoⅠ和XbaⅠ消化获得的扩增片段，并插入pSVL载体(发玛西亚，瑞典)的XhoⅠ和XbaⅠ位点之间以制备质粒pBGT4。(2)导入COS7细胞

质粒pBGT4通过电穿孔导入COS7细胞(RIKEN细胞库)。简言之，将10μg质粒加入到约含5×10⁶个细胞的0.8mlPBS(-)(Nissui药物公司)中。在室温下用基因脉冲仪(伯乐，美国)以25μF的容量应用1600伏以将该基因导入细胞。将得到的细胞转移至90mm实验室培养皿中并于5％CO₂,37℃下培养于含10％胎牛血清的10ml Dulbecco′s修饰的Eagle′s培养基中(基本目录号.12430，美国生物技术公司)72小时。之后，回收细胞并悬浮于100μl缓冲液(5mM Tris-HCl,pH7.5,2mM MgCl₂,1mM苯甲磺酰氟)中，然后超声处理并以2000×g离心5分钟。因此，获得细胞提取物。(3)GnT-Ⅳ活性的分析

细胞提取物中GnT-Ⅳ的活性通过参照实施例2中所述的方法测定。结果显示于表6中。与其中导入pSVL载体作为对照的细胞提取物相比，其中导入质粒pBGT4的提取物每个细胞显示出44-78倍更高的GnT-Ⅳ活性。从这些结果，证实基因1编码GnT-Ⅳ酶。这样，GnT-Ⅳ酶可根据此方法通过培养的细胞制备。

表6

质粒	比活性(pmol/hr/mg蛋白)	活性比率
质粒	比活性(pmol/hr/mg蛋白)	活性比率	pSVLpBGT4(#1)pBGT4(#2)pBGT4(#3)	409296233177320182	1727844

反应时间：4小时

活性比率是相对于把pSVL的总活性看作1来表示的。[实施例5]人类GnT-Ⅳa cDNA的分离和鉴定(1)RT-PCR

根据在实施例3中获得的牛GnT-Ⅳa核苷酸序列，合成显示于SEQID NO:21中的引物h1-2F和显示于SEQ ID NO:22中的引物h1-1R。用人肝脏的总RNA(Clontech，美国)作为模板，以上述引物进行RT-PCR。结果，获得似乎为特异性的约650bp的扩增片段。将此片段亚克隆，并测定其核苷酸序列。(2)文库的筛选

用上面RT-PCR获得的685 bp DNA片段作为探针筛选人肝脏cDNA文库(Clontech，美国)。获得2个阳性噬菌斑hGT4/λgt10-1和hGT4/λgt10-2。测定这些噬菌体克隆中插入子的核苷酸序列。结果，hGT4/λgt10-1含有804bp的DNA区域且hGT4/λgt10-2含有2115bp的DNA区域。前者区域完全包括在后者区域内。如SEQ ID NO:23中所示，hGT4/λgt10-2中含有的DNA片段具有与牛GnT-Ⅳa氨基酸序列高度同源的开放阅读框(ORF)(96％一致)。从实施例6中获得的结果，证实此ORF为人GnT-Ⅳa基因。该ORF的氨基酸序列显示于SEQ ID NO:24中。[实施例6]人GnT-Ⅳa基因表达质粒的构建及制备人GnT-Ⅳa酶

的方法(1)人GnT-Ⅳa基因表达质粒pHGT4-1的构建

合成将XhoⅠ位点导入人GnT-Ⅳa基因起始密码子上游区域的引物(h1-7F；SEQ ID NO:25)和与该基因终止密码子下游区域互补的另一种引物(h1-7R；SEQ ID NO:26)。用人肝脏RNA(Clontech，美国)作为模板，用上述引物通过RT-PCR扩增编码人GnT-Ⅳa酶的整个基因。将得到的扩增片段以与lacz基因转录相反的方向插入质粒pCRScnpt Amp SK(+)(Stratagene,DNA)的SrfⅠ位点。用得到的质粒，通过核苷酸序列分析证实扩增的片段编码显示于SEQ IDNO:24中的氨基酸序列。此外，以XhoⅠ和SacⅠ消化此质粒以获得XhoⅠ-Sacl 1.7kb的片段。将此片段插入到pSVL载体(发玛西亚，瑞典)的XhoⅠ和SacⅠ位点之间以从人GnT-Ⅳa基因制备表达质粒pHGT4-1。(2)人GnT-Ⅳa基因向COS7细胞的导入

通过电穿孔将质粒pHGT4-1导入COS7细胞。将得到的细胞于10％CO2,37℃下培养72小时。然后，收获细胞，悬浮于100μl缓冲液(5mMTris-HCl,pH7.5,2mM氯化镁，1mM苯甲磺酰氟)中，超声处理破碎，2000×g离心5分钟并收集上清以获得细胞提取物。(3)人GnT-Ⅳa基因在COS7细胞中的表达

通过参照实施例2中描述的方法测定细胞提取物中的GnT-Ⅳ活性。结果显示于表7中。与其中导入pSVL载体作为对照的细胞提取物相比，其中导入质粒pHGT4-1的细胞提取物每个细胞显示出21-28倍更高的GnT-Ⅳ活性。从这些结果，证实显示于SEQ ID NO:23中的GnT-Ⅳa基因编码糖基转移酶GnT-Ⅳ。也证实人GnT-Ⅳa酶可根据此方法通过培养的细胞制备。

表7

质粒	比活性(pmol/hr/mg蛋白)	活性比率
质粒	比活性(pmol/hr/mg蛋白)	活性比率	pSVLpHGT4-1(#1)pHGT4-1(#2)pHGT4-2(#1)pHGT4-2(#2)	10372895121788110248029	12821118

反应时间：1.3小时

活性比率以相对于把pSVL的总活性看成为1而表示的。[实施例7]人GnT-Ⅳb cDNA的分离和鉴定(1)通过PCR、RT-PCR和5′RACE(cDNA末端的快速扩增)获

得人GnT-Ⅳa-样基因

在基因数据库GerBank中通过BLASTN搜索与实施例3中获得的人GnT-Ⅳa基因核苷酸序列具有类似性的核苷酸序列。结果，发现了许可号R12057,H10557和W16571。然后，合成显示于SEQ ID NO:27中的引物h2-45F和显示于SEQ ID NO:28中的引物h2-43R，从而用人类cDNA文库中心的快速筛选(Quick Screen Human cDNALibrary Panel)(Clontech，美国)的人脑cDNA文库作为模板进行PCR。将扩增的片段亚克隆入pCRScript Amp SK(+)(Stratagene，美国)的SrfⅠ位点并进行核苷酸序列分析。同时，合成显示于SEQ ID NO:29中的引物h2-2F和显示于SEQ ID NO:30中的引物h2-1R从而用人肺总RNA(Clontech，美国)作为模板进行RT-PCR。结果，得到约500bp预期大小的扩增片段。然后，将此片段亚克隆入pCRScriptAmp SK(+)(Stratagene，美国)的SrfⅠ位点并进行核苷酸序列分析。

这样获得的2个DNA片段的核苷酸序列相互间形成1006bp区域的重叠。在该区域内，编码与牛和人GnT-Ⅳa同源的氨基酸序列的开放阅读框被发现。因此，提示与GnT-Ⅳa蛋白有关的蛋白的存在。

然后，在DNA数据库GenBank中通过BLASTN搜索可能是R12057上游序列或W16571下游序列的可能核苷酸序列。结果，发现R15554为R12057的上游序列，且W16466为W16571的下游序列。然而，在从这些核苷酸序列推导的ORFs中含有显然不适当的终止密码子。因此，为了证实该核苷酸序列，通过RT-PCR获得DNA片段。作为引物，合成显示于SEQ ID NO:31中的h2-1F，显示于SEQ ID NO:32中的h2-3F和显示于SEQ ID NO:33中的h2-8R。用实施例5中所述的h2-1F和h1-1R组合，或h2-3F和h2-8R组合，用人肝脏的总RNA(Clontech，美国)作为模板进行RT-PCR。检测到均与预期大小相一致的约550bp和约300bp的扩增片段。将这些片段中的每一个亚克隆入pCRScript Amp SK(+)中的SrfⅠ位点中以分析其核苷酸序列。结果，证实这些片段分别与上述h2-45F和h2-1R之间1006bp的上游区域和下游区域重叠。在1361bp的连接区域内，发现编码与牛和人GnT-Ⅳa蛋白氨基酸序列具有高度同源性的433个氨基酸蛋白的ORF。

然而，当此ORF与GnT-Ⅳa蛋白的氨基酸序列比较时，认为起始的甲硫氨酸应存在于该ORF上游的区域。因此，上游区域用人肺5＇-RACE-即用(Ready)cDNA(Clortech，美国)通过5＇-RACE获得。在第一次PCR中，锚定引物和显示于SEQ ID NO:34中的h2-5R用作引物。在第二次PCR中，锚定引物和显示于SEQ ID NO:35中的h2-3R用作引物。纯化由5′-RACE获得的片段，用EcoRⅠ和PstⅠ消化，且然后通过琼脂糖凝胶电泳分离。从凝胶中回收约450bp的片段。将该片段插入pUC18载体(发玛西亚，瑞典)的EcoRⅠ和PstⅠ位点之间以分析其核苷酸序列。结果，证实此片段与h2-1F和h2-8R之间区域的上游区重叠。在1758bp的连接区域内，证实了一个编码与牛和人GnT-Ⅳa蛋白氨基酸序列具有高度类似性的548个氨基酸蛋白的ORF。该ORF的核苷酸序列显示于SEQ ID NO:36中，且其氨基酸序列显示于SEQ ID NO:37中。从下面实施例8中描述的结果，证实该基因为人GnT-Ⅳb基因。[实施例8]人GnT-Ⅳb基因表达质粒的构建和制备人GnT-Ⅳb酶

的方法(1)人GnT-Ⅳb基因表达质粒pHGT4-2的构建

合成将XhoⅠ位点导入人GnT-Ⅳb基因起始密码子上游区域的引物(h2-4:SEQ ID NO:38)，和将XbaⅠ位点导入上述基因终止密码子下游区域的另一种引物(h2-10R:SEQ ID NO:39)。用这些引物，以人肺RNA(Clontech，美国)作为模板通过RT-PCR扩增编码人GnT-Ⅳb酶的整个ORF。将扩增的片段插入质粒pCRScript AmpSK(+)的SrfⅠ位点中，然后测定其核苷酸序列。结果，证实扩增的片段编码SEQ ID NO:37的氨基酸序列。此外，将该质粒以XhoⅠ和XbaⅠ消化以获得XhoⅠ-XbaⅠ1.7kb的片段。将该片段插入pSVL载体(发玛西亚，瑞典)的XhoⅠ与XbaⅠ之间的位点以构建用于人GnT-Ⅳb基因的表达质粒。(2)人GnT-Ⅳb基因向COS7细胞中的导入

通过电穿孔将质粒pHGT4-2导入COS7细胞。得到的细胞于10％CO₂,37℃下培养72小时。然后，回收细胞，悬浮于100μl缓冲液(5mMTris-HCl,pH7.5,2mM氯化镁，1mM苯甲磺酰氟)，超声处理破碎，2000×g离心5分钟且收集上清以获得细胞提取物。(3)人GnT-Ⅳb基因在COS7细胞中的表达

通过参照实施例2中所述的方法测定细胞提取物中的GnT-Ⅳ活性。结果显示于上面的表7中。与其中导入pSVL载体作为对照的细胞提取物相比，其中导入质粒pHGT4-2的细胞提取物每个细胞显示出8-11倍更高的GnT-Ⅳ活性。从这些结果，证实显示于SEQ ID NO:36中的GnT-Ⅳb基因编码糖基转移酶GnT-Ⅳ。同时也证实人GnT-Ⅳb酶可根据此方法由培养的细胞制备。[实施例9]牛GnT-ⅣaN-末端缺失突变体表达质粒的构建及其表达(1)牛GnT-Ⅳa表达质粒pSigIle93、pSigPro113和pSigPro142

表达质粒的构建

合成将XhoⅠ位点导入人红细胞生成素信号序列(GenBank登记号X02157)上游区域的引物(XhoEsig:SEQ ID NO:40)和将上述信号序列的C-末端连接至牛跨越位置93(Ile)至末端GnT-Ⅳa氨基酸序列的部分的反义引物(E4-1R:SEQ ID NO:41)，从而通过PCR扩增人红细胞生成素的信号序列。同时，合成相应于上述反义引物的有义引物(E4-1F:SEQ ID NO:42)和将XbaⅠ位点导入牛GnT-Ⅳa终止密码子下游区域的XbaⅠ位点的引物(4EXPR:SEQ IDNO:20)以通过PCR扩增牛GnT-Ⅳa基因的部分序列。用得到的2种PCR产物的部分作为混合模板，以引物XhoEsig和4EXPR进行PCR。扩增的片段以XhoⅠ和XbaⅠ消化并插入到pSVL载体(发玛西亚，瑞典)的XhoⅠ和XbaⅠ位点之间以构建质粒psigIle93，其表达其中的人红细胞生成素信号序列连接到牛跨越位置93至末端GnT-Ⅳa氨基酸序列部分的氨基酸序列。用E4-2R引物(SEQ ID NO:43)或E4-3R引物(SEQ ID NO:44)代替E4-1R引物；且以E4-2F引物(SEQ IDNO:45)或E4-3F引物(SEQ ID NO:46)代替E4-1F引物，用与上述相同的方式分别构建表达其中的人红细胞生成素信号序列连接到牛跨越位置113(Pro)至末端GnT-Ⅳa氨基酸序列部分的氨基酸序列的质粒pSigPro113；或其中的人红细胞生成素信号序列连接到牛跨越位置142(Pro)至末端GnT-Ⅳa氨基酸序列部分的氨基酸序列的质粒pSigPro142。(2)表达牛GnT-Ⅳa N-末端缺失突变体的质粒向COS7细胞中的导入

通过电穿孔将质粒pSigIle93、pSigPro113或pSigPro142导入COS7细胞。得到的细胞于10％CO₂,37℃下培养72小时。然后，分别回收细胞和培养上清。将细胞悬浮于100μl缓冲液(5mM Tris-HCl,pH7.5,2mM氯化镁，1mM苯甲磺酰氟)，超声处理打碎且2000×g离心5分钟以获得细胞提取物。以Centriplus30(Amicon)将培养上清浓缩至约100μl。(3)牛GnT-Ⅳa N-末端缺失突变体在COS7细胞中的表达

培养上清与细胞提取物中GnT-Ⅳ活性通过参照实施例2中所述方法加以测定。结果显示于表8中。与其中导入有pBGT4载体作为阳性对照的细胞总活性(即，细胞中活性+上清中活性)相比，其中导入有pSigIle93的细胞总活性大于30％。此外，三分之一的活性分泌至培养上清中。从这些结果，发现牛GnT-Ⅳa N-末端至位置92的氨基酸序列可被缺失而维持酶活性。同时也显示GnT-Ⅳa酶可用适当的分泌信号分泌表达。

表8

质粒	级分	活性(pmol/hr)	每个级分的活性比率(％)	总活性比率(％)
质粒	级分	活性(pmol/hr)	每个级分的活性比率(％)	总活性比率(％)	pSVLpSVLpBGT4pBGT4pSigIle 93pSigIle 93pSigPro 113pSigPro 113pSigPro 142pSigPro 142	上清细胞上清细胞上清细胞上清细胞上清细胞	1363847222615231065471312606219381	0.51.42.797.311.620.41.22.30.81.4	1.9100.031.93.42.2

反应时间：2.5小时

活性比率以相对于pBGT4总活性的百分数表示，pBGT4总活性看

成为100％。[实施例10]牛GnT-Ⅳa C-末端缺失突变体表达质粒的构建及其

表达(1)牛GnT-Ⅳa表达质粒pCGly499、pCPro465、pCLys432和

pCPro383的构建

合成将XhoⅠ位点导入牛GnT-Ⅳa基因起始密码子上游区域的引物(SEQ ID NO:19)和连接位置499Gly密码子之后终止密码子并将XbaⅠ位点导入上述终止密码子下游区域的引物(CGly 499:SEQ IDNO:47)以通过PCR扩增牛GnT-Ⅳa基因的部分序列。扩增的片段以XhoⅠ和XbaⅠ消化，并插入到pSVL载体(发玛西亚，瑞典)的XhoⅠ和XbaⅠ位点之间。这样，构建出表达牛GnT-Ⅳa氨基酸序列至位置499(甘氨酸)的质粒pCGly499。用CPro465引物(SEQ ID NO:48),CLys432引物(SEQ ID NO:49)或CPro383引物(SEQ ID NO:50)代替CGly499引物，以相同的方式构建三个其它的质粒。它们分别命名为pCPro465(表达牛GnT-Ⅳa氨基酸序列至位置465(脯氨酸)的质粒)；pCLys432(表达牛GnT-Ⅳa氨基酸序列至位置432(赖氨酸)的质粒)；和pCPro383(表达牛GnT-Ⅳa氨基酸序列至位置383(脯氨酸)的质粒)。(2)表达牛GnT-Ⅳa C-末端缺失突变体的质粒向COS7细胞中的导入

通过电穿孔将质粒pCGly499,pCPro465,pCLys432p或pCPro383导入COS7细胞。得到的细胞于10％CO₂,37℃下培养72小时。然后，回收细胞并悬浮于100μl缓冲液(5mM Tris-HCl,pH7.5,2mM氯化镁，1mM苯甲磺酰氟)中，超声处理破碎且以2000×g离心5分钟以获得细胞提取物。(3)牛GnT-Ⅳa C-末端缺失突变体在COS7细胞中的表达

细胞提取物中GnT-Ⅳ的活性用参照实施例2中所述的方法测定。结果显示于表9中。与其中导入有pBGT4载体作为阳性对照的细胞提取物的GnT-Ⅳ活性相比，其中导入有pCGly499、pCPro465、pCLys432或pCPro383的细胞提取物活性分别为每个细胞15.2％、12.1％、2.8％或104.2％。从这些结果，显示即使牛GnT-Ⅳa氨基酸序列的位置384至C-末端的氨基酸被缺失，GnT-Ⅳ活性仍被维持。

表9

质粒	比活性(pmol/hr/mg蛋白)	活性比率(％)
质粒	比活性(pmol/hr/mg蛋白)	活性比率(％)	pSVLpBGT4pCGly 499pCPro 465pCLys 432pCPro 383	77149172263179841015551	110015123104

反应时间：2小时

活性比率以相对于pBGT4总活性的百分数表示，pBGT4的总活性

看成为100％。[实施例11]大肠杆菌中表达各种GnT-Ⅳ基因质粒的构建及其表达(1)牛GnT-Ⅳa大肠杆菌表达质粒的构建

合成将BspHⅠ位点导入牛GnT-Ⅳa基因起始密码子上游区域的引物(BSP-N:SEQ ID NO:51)和将HindⅢ位点导入终止密码子下游区域的另一种引物(C-Hd:SEQ ID NO:52)以通过PCR扩增牛GnT-Ⅳa基因的整个开放阅读框。扩增的片段以BspHⅠ和HindⅢ消化，并导入pTrc99A载体(发玛西亚，瑞典)的NcoⅠ和HindⅢ位点之间以构建质粒pEBGT4。用BSP-sN引物(SEQ ID NO:53)替代BSP-N引物及C-Hd引物，以类似的方式构建质粒pEIle93。此外，用BSP-N引物，可将His-Tag、终止密码子和HindⅢ位点导入牛GnT-Ⅳa基因C-末端下游区域的引物(CH-Hd:SEQ ID NO:54)和具有His-Tag、终止密码子和HindⅢ位点的引物(H-Hd:SEQ ID NO:55)扩增编码其中的His-Tag被添加至C末端开放阅读框的基因，从而以同类似的方式构建质粒pEBGT4+His。(2)人GnT-Ⅳa基因和人GnT-Ⅳb基因大肠杆菌表达质粒的构建

合成可在人GnT-Ⅳa氨基酸序列位置94(Leu)上游区导入起始密码子和Ile密码子并在其进一步上游区也可导入BspHⅠ位点的引物(4aBSPIL94:SEQ ID NO:56)；在C-末端氨基酸下游区导入His-Tag、终止密码子和HindⅢ位点的引物(4aCH-Hd:SEQ ID NO:57)；和H-Hd引物以扩增部分的人GnT-Ⅳa氨基酸序列的基因片段，其中被添加上编码His-Tag的序列。扩增的片段以BspHⅠ和HindⅢ消化，并插入到pTrc99A载体(发玛西亚，瑞典)的NcoⅠ和HindⅢ位点之间以构建质粒pMA4a+His。此外，用CP383H-Hd引物(SEQ IDNO:58)代替4aCH-Hd引物，以类似的方式构建质粒pCore+His。用将BspHⅠ位点导入人GnT-Ⅳb基因起始密码子上游区的引物(4bBSP-N:SEQ ID NO:59)和4bSACR引物(SEQ ID NO:60)扩增人GnT-Ⅳb基因片段，以BspHⅠ和SacⅠ消化，且然后插入到pTrc99A载体(发玛西亚，瑞典)的NcoⅠ和SacⅠ位点之间。得到质粒的SacⅠ和HindⅢ位点之间，用4bSACF引物(SEQ ID NO:61)、在人GnT-Ⅳb氨基酸序列的C-末端导入His-Tag的引物(4bCH-Hd:SEQ ID NO:62)和H-Hd引物，扩增部分长度的人GnT-Ⅳb基因，并以SacⅠ和HindⅢ消化，然后插入以得到质粒pEHGT4-2+His。此外，用将NcoⅠ位点和起始密码子导入人GnT-Ⅳb氨基酸序列位置91(Gly)上游区的引物(4bNCOG91:SEQ ID NO:63)、4bCH-Hd引物和H-Hd引物扩增人GnT-Ⅳb基因的部分序列，以NcoⅠ和HindⅢ消化，且然后插入到pTrc99A载体(发玛西亚，瑞典)的NcoⅠ和HindⅢ位点之间以构建质粒pMA4b+His。(3)每种表达质粒向大肠杆菌BL21菌株中的导入

将每种质粒导入到通过钙方法而制备的大肠杆菌BL21菌株感受态细胞中。将得到的细胞培养于含100μg/ml氨苄青霉素的LB琼脂平板上。得到的以每种质粒转化的大肠杆菌菌落接种至LB液体培养基并于37℃振荡培养过夜。然后，将培养物接种至新鲜LB液体培养基以得到2％的浓度。当培养液混浊度(OD595nm)约为0.1至0.2时向其中加入IPTG(异丙基b-D-硫代半乳糖吡喃糖苷)至1mm的终浓度。细胞于37℃培养2小时或于25℃培养4小时。然后，收获500μl的细胞。将细胞沉淀物悬浮于50μl缓冲液(5mM Tris-HCl,pH7.5,2mM MgCl₂,1mM苯甲磺酰氟)，超声处理打碎且以2000×g离心5分钟以获得作为上清的细胞提取物。(4)大肠杆菌BL21菌株中每种表达质粒的表达

细胞提取物中GnT-Ⅳ活性通过参照实施例2中所述的方法测定。表10显示了牛基因的表达结果。虽然其中导入有pTrc99A载体作为对照的大肠杆菌细胞提取物几乎没有GnT-Ⅳ活性，但其中导入有pEBGT4的大肠杆菌细胞提取物具有一定的GnT-Ⅳ活性。从这些结果，证明GnT-Ⅳ酶可通过大肠杆菌制备。添加到牛GnT-Ⅳa C-末端的His-Tag序列没有强烈地影响GnT-Ⅳ活性。因此，显示适当的tag序列可添加至GnT-Ⅳ酶上。其中的N-末端92个氨基酸被缺失的突变体显示出更强的GnT-Ⅳ活性。也显示在动物细胞中证实的GnT-Ⅳ酶变异体的表达在大肠杆菌中是可能的。

表10

质粒	活性(pmol/hr/mg蛋白)	活性比率(％)
质粒	活性(pmol/hr/mg蛋白)	活性比率(％)	pTrc99ApEBGT4pEBGT4+HispEIle93	0461130905841	010067127

反应时间：3.0小时

添加IPTG后，细胞于37℃培养2小时。

活性比率以相对于pEBGT4总活性的百分数表示，pEBGT4总活性

看成为100％。

表11显示了人基因的表达结果。与其中导入有pTrc99A载体作为对照的大肠杆菌细胞提取物相比，其中导入有任何一种表达质粒的大肠杆菌细胞提取物具有显著的GnT-Ⅳ活性。如在牛GnT-Ⅳa酶中所示，在人GnT-Ⅳa和GnT-Ⅳb酶中缺失N-末端序列而维持活性也是可能的。此外，既具有N-末端缺失又具有C-末端缺失的人GnT-Ⅳa酶显示出高的GnT-Ⅳ活性(pCore+His)。这显示在这个突变体中的这些部分对GnT-Ⅳ活性不是必需的。

表11

质粒	活性(pmol/hr/mg蛋白)	活性比率(％)
质粒	活性(pmol/hr/mg蛋白)	活性比率(％)	pTrc99ApEBGT4+HispMA4a+HispCore+HispEHGT4-2+HispMA4b+His	0213903359397662702812	06371001184884

反应时间：4.0小时

加入IPTG后，细胞于25℃培养4小时。

活性比率以相对于pMA4a+His总活性的百分数表示，pMA4a+

His总活性看成为100％。[实施例12]通过将牛或人GnT-Ⅳa基因导入产生-EPO的CHO细胞

中而使重组人红细胞生成素(EPO)向糖链分支结构转换(1)GnT-Ⅳ表达质粒向产生-EPO CHO细胞中的导入

根据日本审查的专利公开No.2-17156中所述的方法构建产生-EPO的CHO细胞克隆。通过电穿孔将GnT-Ⅳa表达质粒pBGT4或pHGT4-1导入得到的细胞克隆MO1和H-5。导入过程中，15μg表达质粒和1.5μg抗药标记质粒(来自Kaken Pharmaceutical的pSV2bsr或来自Clontech的pMAMneo)用于混合物中。电穿孔的细胞于10％CO₂,37℃下培养约60小时。然后，向培养基中加入杀稻瘟素S(KakenPharmaceuticals)(终浓度：10μg/ml)或遗传霉素(生物技术公司)(终浓度：500μg/ml)，细胞再培养10天至2周。这样，分离出抗这两种药物中任何一种的克隆。(2)导入的GnT-Ⅳ基因在产生-EPO的CHO细胞克隆中表达的

验证

将产生-EPO的CHO细胞克隆(起始克隆)和单个药物抗性克隆培养于适当的规模。纯化每个克隆的总RNA。然后，用GnT-Ⅳa基因的部分作为探针进行RNA点印迹分析以检测GnT-Ⅳa mRNA的量。此外，在起始克隆中表达的GnT-Ⅳ活性和抗药克隆通过参照实施例2中所述的分析方法加以测定。筛选那些在RNA点印迹分析中产生强烈信号且较起始克隆显示出更高GnT-Ⅳ活性的克隆并用于EPO生产。筛选出的克隆具有增加的GnT-Ⅳ活性；例如，MO1(牛GnT-Ⅳ)#36较MO1克隆显示出约104倍的增加，且H-5(人GnT-Ⅳ)#23较H-5克隆显示出约125倍的增加。(3)用导入GnT-Ⅳ基因的产生-EPO的CHO细胞克隆生产EPO

EPO分泌表达至培养液中。然后，将产生-EPO的CHO细胞克隆MO1和H-5，和上述的克隆MO1(牛GnT-Ⅳ)#36和H-5(人GnT-Ⅳ)#23培养于滚瓶中。首先，将每种克隆贴壁培养于培养基中，且然后将1.5×10⁷个细胞转入含200ml培养基的滚瓶中。细胞于10％CO₂,37℃下培养3天从而使它们一致地附着到瓶上。之后，倒去培养基，并以PBS缓冲液洗细胞。然后，将200ml无血清培养基加入到瓶中，其中的细胞于10％CO₂,37℃下培养7天。之后，回收培养上清。作为培养基，使用了D-MEM/F12混合培养基，其中补充以5％胎牛血清，290mg/升L-谷氨酸，1×MEM非必需氨基酸溶液和100nM的氨甲蝶呤。作为无血清的培养基，使用了没有胎牛血清的上述培养基。每种无血清培养上清中含有的EPO用抗-人EPO抗体通过ELISA加以定量。(4)根据其糖链结构对导入GnT-Ⅳ基因或没有导入该基因的克隆

产生EPOs的分析

在等电聚焦凝胶中重组EPO没有作为单个分子存在；它是带各种电荷分子的混合物。由于蛋白的部分没有变化，故显示这些分子中的电荷差异是基于糖链结构的不同；这种分子混合物称为糖形式(glycoforms)[Watson,E和Yao,F.，生化年鉴(1993),210,389-93]。EPO具有3个Asn-连接的糖链；单个糖链的分支结构从双天线型至四天线型而变化。Gal(半乳糖)进一步附着到每种分支GlcNAc的末端，且唾液酸进一步附着到此Gal上。因此，如果糖链分支程度通过导入GnT-Ⅳ基因而增加。附着到Gal上的唾液酸分子数目增加，且因此，具有低等电点的糖形式含量将增加。然后，本发明者通过等电点聚焦分析以检测导入GnT-Ⅳ基因的产生-EPO的细胞产生的EPO糖链结构的变化。

对于等电聚焦，使用了发玛西亚生产的MultiphorⅡ设备。凝胶由5％丙烯酰胺(30∶0.8)和1.5％Pharmelyte 2.5-5(发玛西亚)所组成。作为(+)极溶液，使用了0.1M的硫酸。作为(-)极溶液，使用了0.2M的L-组氨酸。等电点聚焦后，将样品电泳转移至PVDF膜上，然后用抗-EPO小鼠单克隆抗体的Western印迹以检测单个EPOs糖形式的条带。简言之，如果必要，每种细胞克隆的无血清培养上清以Centriplus30和Microcon 30(均由Amicon生产)浓缩至约7-100倍。开始时，约50-100IU的EPO用作样品，但适当地调整此样品量从而使由Western印迹分析检测到的条带密度在样品间几乎相等。

当来自MO1克隆的EPO与来自MO1(牛GnT-Ⅳ)#36克隆的EPO比较时，证实了后者主要糖形式的位置表现出向至少一个糖形式低pI一侧(+电极溶液一侧)的迁移(图19)。从这些结果，认为由于基因导入而表达的GnT-Ⅳ酶增加了附着到EPO Asn-连接糖链中GlcNAc分支的数目，因而增加了附着唾液酸分子的数目从而增加了具有低等电点糖形式的含量。对H-5克隆和H-5(人GnT-Ⅳ)#23克隆进行了类似的分析。结果，也发现在后者中主要EPO糖形式的位置迁移至低pI一侧(图19)。

从上述，证实修饰通过导入GnT-Ⅳ基因至任何细胞而制备蛋白的Asn-连接糖链结构是可能的。工业应用性

根据本发明，提供了新的β1→4N-乙酰-葡糖胺基转移酶(GnT-Ⅳ)、用于制备GnT-Ⅳ酶的方法和编码GnT-Ⅳ的基因。有了本发明的GnT-Ⅳ，制备用传统的糖基转移酶不能形成的具有分支结构的糖缀合物变为可能。因此，本发明的GnT-Ⅳ不仅对制备或改善糖缀合物型药物、试剂和食物是有用的，而且对修饰任何生物高分子的糖链结构也是有用的。

本发明的GnT-Ⅳ基因对于诊断或治疗疾病如癌症和修饰微生物产生的糖缀合物产物糖链结构也是有用的。

此外，产生的抗作为抗原的本发明GnT-Ⅳ蛋白的抗体或抗血清，或作为探针的本发明GnT-Ⅳ基因的部分或全长对微生物、培养细胞、各种动物组织、血细胞及血液的特征描述或诊断患病细胞或组织如癌症是有用的。

序列表SEQ ID NO:1序列长度：8序列类型：氨基酸拓扑学：线性分子类型：肽序列描述Asp Asn Leu Tyr Pro Glu Glu Lys

5SEQ ID NO:2序列长度：11序列类型：氨基酸拓扑学：线性分子类型：肽序列描述Asp Tyr Val Asn Gly Val Val Ala Asn Glu Lys

5 10SEQ ID NO:3序列长度：21序列类型：氨基酸拓扑学：线性分子类型：肽序列描述Glu Ile Ser Ser Gly Leu Val Glu Ile Ile Ser Pro Pro Glu Ser Tyr

5 10 15Tyr Pro Asp Leu Thr

20SEQ ID NO:4序列长度：8序列类型：氨基酸拓扑学：线性分子类型：肽序列描述Glu Arg Val Arg Trp Arg Thr Lys

5SEQ ID NO:5序列长度：15序列类型：氨基酸拓扑学：线性分子类型：肽序列描述Lys Gln Asn Leu Asp Tyr Cys Phe Leu Met Met Tyr Ala Gln Glu

5 10 15SEQ ID NO:6序列长度：6序列类型：氨基酸拓扑学：线性分子类型：肽序列描述Asp His Ile Leu Trp Val

5SEQ ID NO:7序列长度：14序列类型：氨基酸拓扑学：线性分子类型：肽序列描述Lys Ile His Val Asn Pro Pro Ala Glu Val Ser Thr Ser Leu

5 10SEQ ID NO:8序列长度：10序列类型：氨基酸拓扑学：线性分子类型：肽序列描述Lys Val Tyr Gln Gly His Thr Leu Glu Lys

5 10SEQ ID NO:9序列长度：10序列类型：氨基酸拓扑学：线性分子类型：肽序列描述Asp Phe Phe Trp Ala Ile Thr Pro Val Ala

5 10SEQ ID NO:10序列长度：6序列类型：氨基酸拓扑学：线性分子类型：肽序列描述Asp Tyr Ile Leu Phe Lys

5SEQ ID NO:11序列长度：15序列类型：氨基酸拓扑学：线性分子类型：肽序列描述Asp Lys Pro Val Asn Val Glu Ser Tyr Leu Phe His Ser Gly Asn

5 10SEQ ID NO:12序列长度：10序列类型：氨基酸拓扑学：线性分子类型：肽序列描述Asp Ile Leu Leu X Thr Thr Val Glu Val

5 10SEQ ID NO:13序列长度：9序列类型：氨基酸拓扑学：线性分子类型：肽序列描述Lys Ser Glu Gly Leu Asp Ile Ser Lys

5SEQ ID NO:14序列长度：8序列类型：氨基酸拓扑学：线性分子类型：肽序列描述Asp Gly Tyr Phe Arg Ile Gly Lys

5SEQ ID NO:15序列长度：29序列类型：核酸链型：单链拓扑学：线性分子类型：合成DNA序列描述AAR ATY CAY GTB AAY CCH CCH GCN GAR GT 29Lys Ile His Val Asn Pro Pro Ala Glu ValSEQ ID NO:16序列长度：35序列类型：核酸链型：单链拓扑学：线性分子类型：合成DNA反义：是序列描述TG RAA VAR RTA RSW YTC VAC RTT VAC DGG YTT RTC 35His Phe Leu Tyr Ser Glu Val Asn Val Pro Lys AspSEQ ID NO:17序列长度：2246序列类型：核酸链型：双链拓扑学：线性分子类型：cDNA序列描述GGCGGCTGCT CGGTGGCGGC TCGTCGGCGG CCGCGGCAGG ACTGGCAGCG CCGGCGGCGG 60GGAGAAAGAA GCATCCACCT ATGAAGACCG TGCAGACAGT CCTGAATAAT AATTGTGAAT 120GGTGTGGCTG CCAGACTAGT TCTGCTGAGC ATCTGAAATG AACCTCTCCT ATTGATTGTT 180TCAGTTGGCC CCGAGCCAGG AGTACTGGGT TTGCTTGACT TCAGGATAAA AAGAAACGGA 240CTTGGTTATC ATCGTAAACA TATGAACCAG TGTGATGGTG AAATGAG ATG AGG CTC 296

Met Arg Leu

1CGA AAT GGA ACT GTA GCC ACT GTT TTA GCA TTT ATC ACC TCG TTC CTC 344Arg Asn Gly Thr Val Ala Thr Val Leu Ala Phe Ile Thr Ser Phe Leu

5 10 15ACT TTA TCT TGG TAT ACA ACA TGG CAA AAT GGG AAA GAA AAA GTG ATT 392Thr Leu Ser Trp Tyr Thr Thr Trp Gln Asn Gly Lys Glu Lys Val Ile20 25 30 35GCT TAT CAA CGA GAA TTT CTT GCT CTG AAA GAA CGT CTC CGA ATA GCT 440Ala Tyr Gln Arg Glu Phe Leu Ala Leu Lys Glu Arg Leu Arg Ile Ala

40 45 50GAA CAT CGA ATC TCT CAG CGC TCT TCT GAG CTC AGT GCC ATT GTA CAG 488Glu His Arg Ile Ser Gln Arg Ser Ser Glu Leu Ser Ala Ile Val Gln

55 60 65CAA TTC AAG CGT GTA GAA GCA GAA ACA AAC AGG AGT AAG GAT CCA GTG 536Gln Phe Lys Arg Val Glu Ala Glu Thr Asn Arg Ser Lys Asp Pro Val

70 75 80AAT AAA TTT TCA GAT GAT ACC CTA AAG ATA CTA AAG GAG TTA ACA AGC 584Asn Lys Phe Ser Asp Asp Thr Leu Lys Ile Leu Lys Glu Leu Thr Ser

85 90 95AAA AAG TCT CTT CAA GTG CCA AGT ATT TAT TAT CAT TTG CCT CAT TTA 632Lys Lys Ser Leu Gln Val Pro Ser Ile Tyr Tyr His Leu Pro His Leu100 105 110 115TTG CAA AAT GAA GGA AGC CTT CAA CCT GCC GTG CAG ATC GGA AAT GGA 680Leu Gln Asn Glu Gly Ser Leu Gln Pro Ala Val Gln Ile Gly Asn Gly

120 125 130CGA ACA GGA GTT TCA ATA GTA ATG GGA ATT CCT ACA GTG AAG AGA GAA 728Arg Thr Gly Val Ser Ile Val Met Gly Ile Pro Thr Val Lys Arg Glu

135 140 145GTT AAA TCT TAC CTC ATA GAA ACT CTT CAT TCC CTT ATT GAT AAT CTG 776Val Lys Ser Tyr Leu Ile Glu Thr Leu His Ser Leu Ile Asp Asn Leu

150 155 160TAT CCT GAA GAG AAG TTG GAC TGT GTT ATA GTA GTC TTC ATA GGA GAG 824Tyr Pro Glu Glu Lys Leu Asp Cys Val Ile Val Val Phe Ile Gly Glu

165 170 175ACA GAT ACT GAT TAT GTA AAT GGT GTT GTA GCC AAC CTG GAG AAA GAA 872Thr Asp Thr Asp Tyr Val Asn Gly Val Val Ala Asn Leu Glu Lys Glu180 185 190 195TTT TCT AAA GAA ATC AGT TCT GGC TTG GTG GAA ATA ATA TCA CCT CCT 920Phe Ser Lys Glu Ile Ser Ser Gly Leu Val Glu Ile Ile Ser Pro Pro

200 205 210GAA AGC TAT TAT CCT GAC CTG ACG AAC TTA AAG GAG ACA TTT GGA GAT 968Glu Ser Tyr Tyr Pro Asp Leu Thr Asn Leu Lys Glu Thr Phe Gly Asp

215 220 225TCT AAA GAA AGA GTA AGA TGG AGA ACA AAG CAA AAC CTA GAT TAT TGT 1016Ser Lys Glu Arg Val Arg Trp Arg Thr Lys Gln Asn Leu Asp Tyr Cys

230 235 240TTT CTA ATG ATG TAT GCT CAG GAA AAA GGC ACA TAC TAC ATC CAG CTT 1064Phe Leu Met Met Tyr Ala Gln Glu Lys Gly Thr Tyr Tyr Ile Gln Leu

245 250 255GAA GAT GAT ATT ATT GTC AAA CAG AAT TAC TTT AAC ACC ATA AAG AAT 1112Glu Asp Asp Ile Ile Val Lys Gln Asn Tyr Phe Asn Thr Ile Lys Asn260 265 270 275TTT GCA CTT CAA CTT TCT TCT GAG GAA TGG ATG ATA CTT GAG TTC TCC 1160Phe Ala Leu Gln Leu Ser Ser Glu Glu Trp Met Ile Leu Glu Phe Ser

280 285 290CAG CTG GGA TTC ATT GGT AAA ATG TTT CAA GCA CCT GAC CCA CTC CTG 1208Gln Leu Gly Phe Ile Gly Lys Met Phe Gln Ala Pro Asp Leu Thr Leu

295 300 305ATT GTG GAA TTC ATA TTT ATG TTC TAT AAG GAG AAG CCC ATC GAC TGG 1256Ile Val Glu Phe Ile Phe Met Phe Tyr Lys Glu Lys Pro Ile Asp Trp

310 315 320CTC TTG GAC CAT ATT CTG TGG GTC AAA GTC TGC AAC CCG GAA AAA GAT 1304Leu Leu Asp His Ile Leu Trp Val Lys Val Cys Asn Pro Glu Lys Asp

325 330 335GCA AAA CAC TGT GAT CGA CAG AAG GCA AAT CTG CGA ATT CGT TTC AGA 1352Ala Lys His Cys Asp Arg Gln Lys Ala Asn Leu Arg Ile Arg Phe Arg340 345 350 355CCG TCC CTT TTC CAA CAC GTT GGT CTG CAT TCT TCA CTC ACA GGA AAA 1400Pro Ser Leu Phe Gln His Val Gly Leu His Ser Ser Leu Thr Gly Lys

360 365 370ATT CAG AAA CTC ACG GAT AAA GAT TAC ATG AAA CCA TTA CTG CTC AAA 1448Ile Gln Lys Leu Thr Asp Lys Asp Tyr Met Lys Pro Leu Leu Leu Lys

375 380 385ATC CAT GTA AAC CCC CCT GCA GAG GTA TCT ACT TCT TTG AAG GTC TAC 1496Ile His Val Asn Pro Pro Ala Glu Val Ser Thr Ser Leu Lys Val Tyr

390 395 400CAA GGT CAT ACA CTG GAG AAA ACT TAC ATG GGT GAG GAC TTC TTC TGG 1544Gln Gly His Thr Leu Glu Lys Thr Tyr Met Gly Glu Asp Phe Phe Trp

405 410 415GCT ATA ACC CCA GTA GCT GGA GAC TAC ATC CTA TTT AAA TTC GAC AAG 1592Ala Ile Thr Pro Val Ala Gly Asp Tyr Ile Leu Phe Lys Phe Asp Lys420 425 430 435CCA GTC AAT GTG GAA AGT TAT TTG TTC CAT AGT GGC AAC CAG GAT CAT 1640Pro Val Asn Val Glu Ser Tyr Leu Phe His Ser Gly Asn Gln Asp His

440 445 450CCA GGG GAT ATT CTG CTC AAC ACA ACG GTG GAA GTT CTG CCT TTG AAG 1688Pro Gly Asp Ile Leu Leu Asn Thr Thr Val Glu Val Leu Pro Leu Lys

455 460 465AGT GAA GGT TTG GAC ATC AGC AAA GAA ACC AAA GAC AAA CGA TTA GAA 1736Ser Glu Gly Leu Asp Ile Ser Lys Glu Thr Lys Asp Lys Arg Leu Glu

470 475 480GAT GGC TAT TTC AGA ATA GGG AAA TTT GAA AAC GGT GTT GCG GAA GGG 1784Asp Gly Tyr Phe Arg Ile Gly Lys Phe Glu Asn Gly Val Ala Glu Gly

485 490 495ATG GTG GAT CCC AGC CTA AAC CCC ATT TCG GCC TTC CGA CTT TCA GTT 1832Met Val Asp Pro Ser Leu Asn Pro Ile Ser Ala Phe Arg Leu Ser Val 500500 505 510 515ATT CAG AAT TCT GCT GTT TGG GCC ATT CTT AAT GAG ATC CAT ATT AAA 1880Ile Gln Asn Ser Ala Val Trp Ala Ile Leu Asn Glu Ile His Ile Lys

520 525 530AAA GTC ACA AAC TGACCATC 1900Lys Val Thr Asn

535TCTACTAAGA AACCAACACA TTTTTTCCCT GTGAATTTGT TGATTAAAGA CAGCTGAGCA 1960CGTACCTTTT TTTGGTAACT TGAATTCTAC CTCTCGCGAA ATCTACTGTA GATAAAATGA 2020TTGTCATATT TCCACTTGGA AAATGAATCT CCCACGGATA ATTGTATTCA TTTGAATCTA 2080AGCTGTCCTC CAGTTTTAAC TCAACTCAAA CGTTTTACAG TTATGACAGC CTGTTAATAT 2140GACTTGTACT ATTTTGGTAT TATACTAATA CATAAGAGTT GTACATATTG TTACATTCAT 2200TAAATTTGAG AAAAATTAAT GTTAAATACA TTTTATGAAC GGGCCG 2246SEQ ID NO:18序列长度：535序列类型：氨基酸拓扑学：线性分子类型：肽序列描述Met Arg Leu Arg Asn Gly Thr Val Ala Thr Val Leu Ala Phe Ile Thr1 5 10 15Ser Phe Leu Thr Leu Ser Trp Tyr Thr Thr Trp Gln Asn Gly Lys Glu

20 25 30Lys Val Ile Ala Tyr Gln Arg Glu Phe Leu Ala Leu Lys Glu Arg Leu

35 40 45Arg Ile Ala Glu His Arg Ile Ser Gln Arg Ser Ser Glu Leu Ser Ala

50 55 60Ile Val Gln Gln Phe Lys Arg Val Glu Ala Glu Thr Asn Arg Ser Lys65 70 75 80Asp Pro Val Asn Lys Phe Ser Asp Asp Thr Leu Lys Ile Leu Lys Glu

85 90 95Leu Thr Ser Lys Lys Ser Leu Gln Val Pro Ser Ile Tyr Tyr His Leu

100 105 110Pro His Leu Leu Gln Asn Glu Gly Ser Leu Gln Pro Ala Val Gln Ile

115 120 125Gly Asn Gly Arg Thr Gly Val Ser Ile Val Met Gly Ile Pro Thr Val

130 135 140Lys Arg Glu Val Lys Ser Tyr Leu Ile Glu Thr Leu His Ser Leu Ile145 150 155 160Asp Asn Leu Tyr Pro Glu Glu Lys Leu Asp Cys Val Ile Val Val Phe

165 170 175Ile Gly Glu Thr Asp Thr Asp Tyr Val Asn Gly Val Val Ala Asn Leu

180 185 190Glu Lys Glu Phe Ser Lys Glu Ile Ser Ser Gly Leu Val Glu Ile Ile

195 200 205Ser Pro Pro Glu Ser Tyr Tyr Pro Asp Leu Thr Asn Leu Lys Glu Thr

210 215 220Phe Gly Asp Ser Lys Glu Arg Val Arg Trp Arg Thr Lys Gln Asn Leu225 230 235 240Asp Tyr Cys Phe Leu Met Met Tyr Ala Gln Glu Lys Gly Thr Tyr Tyr

245 250 255Ile Gln Leu Glu Asp Asp Ile Ile Val Lys Gln Asn Tyr Phe Asn Thr

260 265 270Ile Lys Asn Phe Ala Leu Gln Leu Ser Ser Glu Glu Trp Met Ile Leu

275 280 285Glu Phe Ser Gln Leu Gly Phe Ile Gly Lys Met Phe Gln Ala Pro Asp

290 295 300Leu Thr Leu Ile Val Glu Phe Ile Phe Met Phe Tyr Lys Glu Lys Pro305 310 315 320Ile Asp Trp Leu Leu Asp His Ile Leu Trp Val Lys Val Cys Asn Pro

325 330 335Glu Lys Asp Ala Lys His Cys Asp Arg Gln Lys Ala Asn Leu Arg Ile

340 345 350Arg Phe Arg Pro Ser Leu Phe Gln His Val Gly Leu His Ser Ser Leu

355 360 365Thr Gly Lys Ile Gln Lys Leu Thr Asp Lys Asp Tyr Met Lys Pro Leu

370 375 380Leu Leu Lys Ile His Val Asn Pro Pro Ala Glu Val Ser Thr Ser Leu385 390 395 400Lys Val Tyr Gln Gly His Thr Leu Glu Lys Thr Tyr Met Gly Glu Asp

405 410 415Phe Phe Trp Ala Ile Thr Pro Val Ala Gly Asp Tyr Ile Leu Phe Lys

420 425 430Phe Asp Lys Pro Val Asn Val Glu Ser Tyr Leu Phe His Ser Gly Asn

435 440 445Gln Asp His Pro Gly Asp Ile Leu Leu Asn Thr Thr Val Glu Val Leu

450 455 460Pro Leu Lys Ser Glu Gly Leu Asp Ile Ser Lys Glu Thr Lys Asp Lys465 470 475 480Arg Leu Glu Asp Gly Tyr Phe Arg Ile Gly Lys Phe Glu Asn Gly Val

485 490 495Ala Glu Gly Met Val Asp Pro Ser Leu Asn Pro Ile Ser Ala Phe Arg

500 505 510Leu Ser Val Ile Gln Asn Ser Ala Val Trp Ala Ile Leu Asn Glu Ile

515 520 525His Ile Lys Lys Val Thr Asn

530 535SEQ ID NO:19序列长度：31序列类型：核酸链型：单链拓扑学：线性分子类型：合成DNA序列描述CCCTCGAG ATG AGG CTC CGA AAT GGA ACT GT 31

Met Arg Leu Arg Asn Gly Thr ValSEQ ID NO:20序列长度：31序列类型：核酸链型：单链拓扑学：线性分子类型：合成DNA反义：是序列描述TTTCTAGA TCA GTT TGT GAC TTT TTT AAT AT 31

TRM Asn Thr Val Lys Lys Ile HisSEQ ID NO:21序列长度：24序列类型：核酸链型：单链拓扑学：线性分子类型：合成DNA序列描述ACGATTGTGC AACAGTTCAA GCGT 24SEQ ID NO:22序列长度：24序列类型：核酸链型：单链拓扑学：线性分子类型：合成DNA序列描述GGGAGAACTC CAGGATCATC CAGT 24SEQ ID NO:23序列长度：2115序列类型：核酸链型：双链拓扑学：线性分子类型：cDNA序列描述GAAATGAACC TCTCTTATTG ATTTTTATTG GCCTAGAGCC AGGAGTACTG CATTCAGTTG 60ACTTTCAGGG TAAAAAGAAA ACAGTCCTGG TTGTTGTCAT CATAAACATA TGGACCAGTG 120TGATGGTGAA ATGAG ATG AGG CTC CGC AAT GGA ACT GTA GCC ACT GCT TTA 171

Met Arg Leu Arg Asn Gly Thr Val Ala Thr Ala Leu

1 5 10GCA TTT ATC ACT TCC TTC CTT ACT TTG TCT TGG TAT ACT ACA TGG CAA 219Ala Phe Ile Thr Ser Phe Leu Thr Leu Ser Trp Tyr Thr Thr Trp Gln

15 20 25AAT GGG AAA GAA AAA CTG ATT GCT TAT CAA CGA GAA TTC CTT GCT TTG 267Asn Gly Lys Glu Lys Leu Ile Ala Tyr Gln Arg Glu Phe Leu Ala Leu

30 35 40AAA GAA CGT CTT CGA ATA GCT GAA CAC AGA ATC TCA CAG CGC TCT TCT 315Lys Glu Arg Leu Arg Ile Ala Glu His Arg Ile Ser Gln Arg Ser Ser45 50 55 60GAA TTA AAT ACG ATT GTG CAA CAG TTC AAG CGT GTA GGA GCA GAA ACA 363Glu Leu Asn Thr Ile Val Gln Gln Phe Lys Arg Val Gly Ala Glu Thr

65 70 75AAT GGA AGT AAG GAT GCG TTG AAT AAG TTT TCA GAT AAT ACC CTA AAG 411Asn Gly Ser Lys Asp Ala Leu Asn Lys Phe Ser Asp Asn Thr Leu Lys

80 85 90CTG TTA AAG GAG TTA ACA AGC AAA AAA TCT CTT CAA GTG CCA AGT ATT 459Leu Leu Lys Glu Leu Thr Ser Lys Lys Ser Leu Gln Val Pro Ser Ile

95 100 105TAT TAT CAT TTG CCT CAT TTA TTG AAA AAT GAA GGA AGT CTT CAA CCT 507Tyr Tyr His Leu Pro His Leu Leu Lys Asn Glu Gly Ser Leu Gln Pro

110 115 120GCT GTA CAG ATT GGC AAC GGA AGA ACA GGA GTT TCA ATA GTC ATG GGC 555Ala Val Gln Ile Gly Asn Gly Arg Thr Gly Val Ser Ile Val Met Gly125 130 135 140ATT CCC ACA GTG AAG AGA GAA GTT AAA TCT TAC CTC ATA GAA ACT CTT 603Ile Pro Thr Val Lys Arg Glu Val Lys Ser Tyr Leu Ile Glu Thr Leu

145 150 155CAT TCC CTT ATT GAT AAC CTG TAT CCT GAA GAG AAG TTG GAC TGT GTT 651His Ser Leu Ile Asp Asn Leu Tyr Pro Glu Glu Lys Leu Asp Cys Val

160 165 170ATA GTA GTC TTC ATA GGA GAG ACA GAT ATT GAT TAT GTA CAT GGT GTT 699Ile Val Val Phe Ile Gly Glu Thr Asp Ile Asp Tyr Val His Gly Val

175 180 185GTA GCC AAC CTG GAG AAA GAA TTT TCT AAA GAA ATC AGT TCT GGC TTG 747Val Ala Asn Leu Glu Lys Glu Phe Ser Lys Glu Ile Ser Ser Gly Leu

190 195 200GTG GAA GTC ATA TCA CCC CCT GAA AGC TAT TAT CCT GAC TTG ACA AAC 795Val Glu Val Ile Ser Pro Pro Glu Ser Tyr Tyr Pro Asp Leu Thr Asn205 210 215 220CTA AAG GAG ACA TTT GGA GAC TCC AAA GAA AGA GTA AGA TGG AGA ACA 843Leu Lys Glu Thr Phe Gly Asp Ser Lys Glu Arg Val Arg Trp Arg Thr

225 230 235AAG CAA AAC CTA GAT TAC TGT TTT CTA ATG ATG TAT GCT CAA GAA AAG 891Lys Gln Asn Leu Asp Tyr Cys Phe Leu Met Met Tyr Ala Gln Glu Lys

240 245 250GGC ATA TAT TAC ATT CAG CTT GAA GAT GAT ATT ATT GTC AAA CAA AAT 939Gly Ile Tyr Tyr Ile Gln Leu Glu Asp Asp Ile Ile Val Lys Gln Asn

255 260 265TAT TTT AAT ACC ATA AAA AAT TTT GCA CTT CAA CTT TCT TCT GAG GAA 987Tyr Phe Asn Thr Ile Lys Asn Phe Ala Leu Gln Leu Ser Ser Glu Glu

270 275 280TGG ATG ATT CTA GAG TTT TCC CAG CTG GGC TTC ATT GGT AAA ATG TTT 1035Trp Met Ile Leu Glu Phe Ser Gln Leu Gly Phe Ile Gly Lys Met Phe285 290 295 300CAA GCG CCG GAT CTT ACT CTG ATT GTA GAA TTC ATA TTC ATG TTT TAC 1083Gln Ala Pro Asp Leu Thr Leu Ile Val Glu Phe Ile Phe Met Phe Tyr

305 310 315AAG GAG AAA CCC ATT GAT TGG CTC CTG GAC CAT ATT CTC TGG GTG AAA 1131Lys Glu Lys Pro Ile Asp Trp Leu Leu Asp His Ile Leu Trp Val Lys

320 325 330GTC TGC AAC CCT GAA AAA GAT GCA AAA CAT TGT GAT AGA CAG AAA GCA 1179Val Cys Asn Pro Glu Lys Asp Ala Lys His Cys Asp Arg Gln Lys Ala

335 340 345AAT CTG CGA ATT CGC TTC AGA CCT TCC CTT TTC CAA CAT GTT GGT CTG 1227Asn Leu Arg Ile Arg Phe Arg Pro Ser Leu Phe Gln His Val Gly Leu

350 355 360CAC TCA TCA CTA TCA GGA AAA ATC CAA AAA CTC ACG GAT AAA GAT TAT 1275His Ser Ser Leu Ser Gly Lys Ile Gln Lys Leu Thr Asp Lys Asp Tyr365 370 375 380ATG AAA CCA TTA CTT CTT AAA ATC CAT GTA AAC CCA CCT GCG GAG GTA 1323Met Lys Pro Leu Leu Leu Lys Ile His Val Asn Pro Pro Ala Glu Val

385 390 395TCT ACT TCC TTG AAG GTC TAC CAA GGG CAT ACG CTG GAG AAA ACT TAC 1371Ser Thr Ser Leu Lys Val Tyr Gln Gly His Thr Leu Glu Lys Thr Tyr

400 405 410ATG GGA GAG GAT TTC TTC TGG GCT ATC ACA CCG ATA GCT GGA GAC TAC 1419Met Gly Glu Asp Phe Phe Trp Ala Ile Thr Pro Ile Ala Gly Asp Tyr

415 420 425ATC TTG TTT AAA TTT GAT AAA CCA GTC AAT GTA GAA AGT TAT TTG TTC 1467Ile Leu Phe Lys Phe Asp Lys Pro Val Asn Val Glu Ser Tyr Leu Phe

430 435 440CAT AGC GGC AAC CAA GAA CAT CCT GGA GAT ATT CTG CTA AAC ACA ACT 1515His Ser Gly Asn Gln Glu His Pro Gly Asp Ile Leu Leu Asn Thr Thr445 450 455 460GTG GAA GTT TTG CCT TTT AAG AGT GAA GGT TTG GAA ATA AGC AAA GAA 1563Val Glu Val Leu Pro Phe Lys Ser Glu Gly Leu Glu Ile Ser Lys Glu

465 470 475ACC AAA GAC AAA CGA TTA GAA GAT GGC TAT TTC AGA ATA GGA AAA TTT 1611Thr Lys Asp Lys Arg Leu Glu Asp Gly Tyr Phe Arg Ile Gly Lys Phe

480 485 490GAG AAT GGT GTT GCA GAA GGA ATG GTG GAT CCA AGT CTC AAT CCC ATT 1659Glu Asn Gly Val Ala Glu Gly Met Val Asp Pro Ser Leu Asn Pro Ile

495 500 505TCA GCC TTT CGA CTT TCA GTT ATT CAG AAT TCT GCT GTT TGG GCC ATT 1707Ser Ala Phe Arg Leu Ser Val Ile Gln Asn Ser Ala Val Trp Ala Ile

510 515 520CTT AAT GAG ATT CAT ATT AAA AAA GCC ACC AAC TGATCATCTG AGAAACCAAC 1760Leu Asn Glu Ile His Ile Lys Lys Ala Thr Asn525 530 535ACATTTTTTC CTGTGAATTT GTTAATTAAA GATAGTTAAG CATGTATCTT TTTTTTATTT 1820CTACTTGAAC ACTACCTCTT GTGAAGTCTA CTGTAGATAA GACGATTGTC ATTTCCACTT 1880GGAAAGTGAA TCTCCCATAA TAATTGTATT TGTTTGAAAC TAAGCTGTCC TCAGATTTTA 1940ACTTGACTCA AACATTTTTC AATTATGACA GCCTGTTAAT ATGACTTGTA CTATTTTGGT 2000ATTATACTAA TACATAAGAG TTGTACATAT TGTTACATTC TTTAAATTTG AGAAAAACTA 2060ATGTTACATA CATTTTATGA AGGGGGTACT TTTGAGGTTC ACTTATTTTA CTATT 2115SEQ ID NO:24序列长度：535序列类型：氨基酸拓扑学：线性分子类型：肽序列描述Met Arg Leu Arg Asn Gly Thr Val Ala Thr Ala Leu Ala Phe Ile Thr1 5 10 15Ser Phe Leu Thr Leu Ser Trp Tyr Thr Thr Trp Gln Asn Gly Lys Glu

20 25 30Lys Leu Ile Ala Tyr Gln Arg Glu Phe Leu Ala Leu Lys Glu Arg Leu

35 40 45Arg Ile Ala Glu His Arg Ile Ser Gln Arg Ser Ser Glu Leu Asn Thr

50 55 60Ile Val Gln Gln Phe Lys Arg Val Gly Ala Glu Thr Asn Gly Ser Lys65 70 75 80Asp Ala Leu Asn Lys Phe Ser Asp Asn Thr Leu Lys Leu Leu Lys Glu

85 90 95Leu Thr Ser Lys Lys Ser Leu Gln Val Pro Ser Ile Tyr Tyr His Leu

100 105 110Pro His Leu Leu Lys Asn Glu Gly Ser Leu Gln Pro Ala Val Gln Ile

115 120 125Gly Asn Gly Arg Thr Gly Val Ser Ile Val Met Gly Ile Pro Thr Val

165 170 175Ile Gly Glu Thr Asp Ile Asp Tyr Val His Gly Val Val Ala Asn Leu

180 185 190Glu Lys Glu Phe Ser Lys Glu Ile Ser Ser Gly Leu Val Glu Val Ile

195 200 205Ser Pro Pro Glu Ser Tyr Tyr Pro Asp Leu Thr Asn Leu Lys Glu Thr

210 215 220Phe Gly Asp Ser Lys Glu Arg Val Arg Trp Arg Thr Lys Gln Asn Leu225 230 235 240Asp Tyr Cys Phe Leu Met Met Tyr Ala Gln Glu Lys Gly Ile Tyr Tyr

245 250 255Ile Gln Leu Glu Asp Asp Ile Ile Val Lys Gln Asn Tyr Phe Asn Thr

260 265 270Ile Lys Asn Phe Ala Leu Gln Leu Ser Ser Glu Glu Trp Met Ile Leu

275 280 285Glu Phe Ser Gln Leu Gly Phe Ile Gly Lys Met Phe Gln Ala Pro Asp

325 330 335Glu Lys Asp Ala Lys His Cys Asp Arg Gln Lys Ala Asn Leu Arg Ile

340 345 350Arg Phe Arg Pro Ser Leu Phe Gln His Val Gly Leu His Ser Ser Leu

355 360 365Ser Gly Lys Ile Gln Lys Leu Thr Asp Lys Asp Tyr Met Lys Pro Leu

405 410 415Phe Phe Trp Ala Ile Thr Pro Ile Ala Gly Asp Tyr Ile Leu Phe Lys

420 425 430Phe Asp Lys Pro Val Asn Val Glu Ser Tyr Leu Phe His Ser Gly Asn

435 440 445Gln Glu His Pro Gly Asp Ile Leu Leu Asn Thr Thr Val Glu Val Leu

450 455 460Pro Phe Lys Ser Glu Gly Leu Glu Ile Ser Lys Glu Thr Lys Asp Lys465 470 475 480Arg Leu Glu Asp Gly Tyr Phe Arg Ile Gly Lys Phe Glu Asn Gly Val

485 490 495Ala Glu Gly Met Val Asp Pro Ser Leu Asn Pro Ile Ser Ala Phe Arg

500 505 510Leu Ser Val Ile Gln Asn Ser Ala Val Trp Ala Ile Leu Asn Glu Ile

515 520 525His Ile Lys Lys Ala Thr Asn

530 535SEQ ID NO:25序列长度：30序列类型：核酸链型：单链拓扑学：线性分子类型：合成DNA序列描述TTCTCGAGAT GAGGCTCCGC AATGGAACTG 30SEQ ID NO:26序列长度：24序列类型：核酸链型：单链拓扑学：线性分子类型：合成DNA序列描述AGAAATGTGG GCTTCAGGGC TGGC 24SEQ ID NO:27序列长度：30序列类型：核酸链型：单链拓扑学：线性分子类型：合成DNA序列描述TTCTCGAGAT GAGGCTCCGC AATGGAACTG 30SEQ ID NO:28序列长度：24序列类型：核酸链型：单链拓扑学：线性分子类型：合成DNA序列描述AGAAATGTGG GCTTCAGGGC TGGC 24SEQ ID NO:29序列长度：30序列类型：核酸链型：单链拓扑学：线性分子类型：合成DNA序列描述TTCTCGAGAT GAGGCTCCGC AATGGAACTG 30SEQ ID NO:30序列长度：24序列类型：核酸链型：单链拓扑学：线性分子类型：合成DNA序列描述AGAAATGTGG GCTTCAGGGC TGGC 24SEQ ID NO:31序列长度：25序列类型：核酸链型：单链拓扑学：线性分子类型：合成DNA序列描述TTCCATCACC TGCCACACCT GCTGG 25SEQ ID NO:32序列长度：24序列类型：核酸链型：单链拓扑学：线性分子类型：合成DNA序列描述ACAACCCTCA GTCAGACAAG GAGG 24SEQ ID NO:33序列长度：24序列类型：核酸链型：单链拓扑学：线性分子类型：合成DNA序列描述ACACCCCCAG AAATGTGGGC TTCA 24SEQ ID NO:34序列长度：24序列类型：核酸链型：单链拓扑学：线性分子类型：合成DNA序列描述ATGACCGAGT CCTCCTTCTC CTGC 24SEQ ID NO:35序列长度：24序列类型：核酸链型：单链拓扑学：线性分子类型：合成DNA序列描述ATGCCCATCA CCACCGACAC TCCG 24SEQ ID NO:36序列长度：1724序列类型：核酸链型：双链拓扑学：线性分子类型：cDNA序列描述TGCAGCCTCG GCCCCGCGGG CGCCCGCCGC GCACCCGAGG AG ATG AGG CTC CGC 54

Met Arg Leu Arg

1AAT GGC ACC TTC CTG ACG CTG CTG CTC TTC TGC CTG TGC GCC TTC CTC 102Asn Gly Thr Phe Leu Thr Leu Leu Leu Phe Cys Leu Cys Ala Phe Leu5 10 15 20TCG CTG TCC TGG TAC GCG GCA CTC AGC GGC CAG AAA GGC GAC GTT GTG 150Ser Leu Ser Trp Tyr Ala Ala Leu Ser Gly Gln Lys Gly Asp Val Val

25 30 35GAC GTT TAC CAG CGG GAG TTC CTG GCG CTG CGC GAT CGG TTG CAC GCA 198Asp Val Tyr Gln Arg Glu Phe Leu Ala Leu Arg Asp Arg Leu His Ala

40 45 50GCT GAG CAG GAG AGC CTC AAG CGC TCC AAG GAG CTC AAC CTG GTG CTG 246Ala Glu Gln Glu Ser Leu Lys Arg Ser Lys Glu Leu Asn Leu Val Leu

55 60 65GAC GAG ATC AAG AGG GCC GTG TCA GAA AGG CAG GCG CTG CGA GAC GGA 294Asp Glu Ile Lys Arg Ala Val Ser Glu Arg Gln Ala Leu Arg Asp Gly

70 75 80GAC GGC AAT CGC ACC TGG GGC CGC CTA ACA GAG GAC CCC CGA TTG AAG 342Asp Gly Asn Arg Thr Trp Gly Arg Leu Thr Glu Asp Pro Arg Leu Lys85 90 95 100CCG TGG AAC GGC TCA CAC CGG CAC GTG CTG CAC CTG CCC ACC GTC TTC 390Pro Trp Asn Gly Ser His Arg His Val Leu His Leu Pro Thr Val Phe

105 110 115CAT CAC CTG CCA CAC CTG CTG GCC AAG GAG AGC AGT CTG CAG CCC GCG 438His His Leu Pro His Leu Leu Ala Lys Glu Ser Ser Leu Gln Pro Ala

120 125 130GTG CGC GTG GGC CAG GGC CGC ACC GGA GTG TCG GTG GTG ATG GGC ATC 486Val Arg Val Gly Gln Gly Arg Thr Gly Val Ser Val Val Met Gly Ile

135 140 145CCG AGC GTG CGG CGC GAG GTG CAC TCG TAC CTG ACT GAC ACT CTG CAC 534Pro Ser Val Arg Arg Glu Val His Ser Tyr Leu Thr Asp Thr Leu His

150 155 160TCG CTC ATC TCC GAG CTG AGC CCG CAG GAG AAG GAG GAC TCG GTC ATC 582Ser Leu Ile Ser Glu Leu Ser Pro Gln Glu Lys Glu Asp Ser Val Ile165 170 175 180GTG GTG CTG ATC GCC GAG ACT GAC TCA CAG TAC ACT TCG GCA GTG ACA 630Val Val Leu Ile Ala Glu Thr Asp Ser Gln Tyr Thr Ser Ala Val Thr

185 190 195GAG AAC ATC AAG GCC TTG TTC CCC ACG GAG ATC CAT TCT GGG CTC CTG 678Glu Asn Ile Lys Ala Leu Phe Pro Thr Glu Ile His Ser Gly Leu Leu

200 205 210GAG GTC ATC TCA CCC TCC CCC CAC TTC TAC CCT GAC TTC TCC CGC CTC 726Glu Val Ile Ser Pro Ser Pro His Phe Tyr Pro Asp Phe Ser Arg Leu

215 220 225CGA GAG TCC TTT GGG GAC CCC AAG GAG AGA GTC AGG TGG AGG ACC AAA 774Arg Glu Ser Phe Gly Asp Pro Lys Glu Arg Val Arg Trp Arg Thr Lys

230 235 240CAG AAC CTC GAT TAC TGC TTC CTC ATG ATG TAC GCG CAG TCC AAA GGC 822Gln Asn Leu Asp Tyr Cys Phe Leu Met Met Tyr Ala Gln Ser Lys Gly245 250 255 260ATC TAC TAC GTG CAG CTG GAG GAT GAC ATC GTG GCC AAG CCC AAC TAC 870Ile Tyr Tyr Val Gln Leu Glu Asp Asp Ile Val Ala Lys Pro Asn Tyr

265 270 275CTG AGC ACC ATG AAG AAC TTT GCA CTG CAG CAG CCT TCA GAG GAC TGG 918Leu Ser Thr Met Lys Asn Phe Ala Leu Gln Gln Pro Ser Glu Asp Trp

280 285 290ATG ATC CTG GAG TTC TCC CAG CTG GGC TTC ATT GGT AAG ATG TTC AAG 966Met Ile Leu Glu Phe Ser Gln Leu Gly Phe Ile Gly Lys Met Phe Lys

295 300 305TCG CTG GAC CTG AGC CTG ATT GTA GAG TTC ATT CTC ATG TTC TAC CGG 1014Ser Leu Asp Leu Ser Leu Ile Val Glu Phe Ile Leu Met Phe Tyr Arg

310 315 320GAC AAG CCC ATC GAC TGG CTC CTG GAC CAT ATT CTG TGG GTG AAA GTC 1062Asp Lys Pro Ile Asp Trp Leu Leu Asp His Ile Leu Trp Val Lys Val325 330 335 340TGC AAC CCC GAG AAG GAT GCG AAG CAC TGT GAC CGG CAG AAA GCC AAC 1110Cys Asn Pro Glu Lys Asp Ala Lys His Cys Asp Arg Gln Lys Ala Asn

345 350 355CTG CGG ATC CGC TTC AAA CCG TCC CTC TTC CAG CAC GTG GGC ACT CAC 1158Leu Arg Ile Arg Phe Lys Pro Ser Leu Phe Gln His Val Gly Thr His

360 365 370TCC TCG CTG GCT GGC AAG ATC CAG AAA CTG AAG GAC AAA GAC TTT GGA 1206Ser Ser Leu Ala Gly Lys Ile Gln Lys Leu Lys Asp Lys Asp Phe Gly

375 380 385AAG CAG GCG CTG CGG AAG GAG CAT GTG AAC CCG CCA GCA GAG GTG AGC 1254Lys Gln Ala Leu Arg Lys Glu His Val Asn Pro Pro Ala Glu Val Ser

390 395 400ACG AGC CTG AAG ACA TAC CAG CAC TTC ACC CTG GAG AAA GCC TAC CTG 1302Thr Ser Leu Lys Thr Tyr Gln His Phe Thr Leu Glu Lys Ala Tyr Leu405 410 415 420CGC GAG GAC TTC TTC TGG GCC TTC ACC CCT GCC GCG GGG GAC TTC ATC 1350Arg Glu Asp Phe Phe Trp>Ala Phe Thr Pro Ala Ala Gly Asp Phe Ile

425 430 435CGC TTC CGC TTC TTC CAA CCT CTA AGA CTG GAG CGG TTC TTC TTC CGC 1398Arg Phe Arg Phe Phe Gln Pro Leu Arg Leu Glu Arg Phe Phe Phe Arg

440 445 450AGT GGG AAC ATC GAG CAC CCG GAG GAC AAG CTC TTC AAC ACG TCT GTG 1446Ser Gly Asn Ile Glu His Pro Glu Asp Lys Leu Phe Asn Thr Ser Val

455 460 465GAG GTG CTG CCC TTC GAC AAC CCT CAG TCA GAC AAG GAG GCC CTG CAG 1494Glu Val Leu Pro Phe Asp Asn Pro Gln Ser Asp Lys Glu Ala Leu Gln

470 475 480GAG GGC CGC ACC GCC ACC CTC CGG TAC CCT CGG AGC CCC GAC GGC TAC 1542Glu Gly>Arg Thr Ala Thr Leu Arg Tyr Pro Arg Ser Pro Asp Gly Tyr485 490 495 500CTC CAG ATC GGC TCC TTC TAC AAG GGA GTG GCA GAG GGA GAG GTG GAC 1590Leu Gln Ile Gly Ser Phe Tyr Lys Gly Val Ala Glu Gly Glu Val Asp

505 510 515CCA GCC TTC GGC CCT CTG GAA GCA CTG CGC CTC TCG ATC CAG ACG GAC 1638Pro Ala Phe Gly Pro Leu Glu Ala Leu Arg Leu Ser Ile Gln Thr Asp

520 525 530TCC CCT GTG TGG GTG ATT CTG AGC GAG ATC TTC CTG AAA AAG GCC GAC 1686Ser Pro Val Trp Val Ile Leu Ser Glu Ile Phe Leu Lys Lys Ala Asp

535 540 545 548TAAGCTGCGG GCTTCTGAGG GTACCCTGTG GCCAGCCC 1724SEQ ID NQ:37序列长度：548序列类型：氨基酸拓扑学：线性分子类型：肽序列描述Met Arg Leu Arg Asn Gly Thr Phe Leu Thr Leu Leu Leu Phe Cys Leu1 5 10 15Cys Ala Phe Leu Ser Leu Ser Trp Tyr Ala Ala Leu Ser Gly Gln Lys

20 25 30Gly Asp Val Val Asp Val Tyr Gln Arg Glu Phe Leu Ala Leu Arg Asp

35 40 45Arg Leu His Ala Ala Glu Gln Glu Ser Leu Lys Arg Ser Lys Glu Leu

50 55 60Asn Leu Val Leu Asp Glu Ile Lys Arg Ala Val Ser Glu Arg Gln Ala65 70 75 80Leu Arg Asp Gly Asp Gly Asn Arg Thr Trp Gly Arg Leu Thr Glu Asp

85 90 95Pro Arg Leu Lys Pro Trp Asn Gly Ser His Arg His Val Leu His Leu

100 105 110Pro Thr Val Phe His His Leu Pro His Leu Leu Ala Lys Glu Ser Ser

115 120 125Leu Gln Pro Ala Val Arg Val Gly Gln Gly Arg Thr Gly Val Ser Val

130 135 140Val Met Gly Ile Pro Ser Val Arg Arg Glu Val His Ser Tyr Leu Thr145 150 155 160Asp Thr Leu His Ser Leu Ile Ser Glu Leu Ser Pro Gln Glu Lys Glu

165 170 175Asp Ser Val Ile Val Val Leu Ile Ala Glu Thr Asp Ser Gln Tyr Thr

180 185 190Ser Ala Val Thr Glu Asn Ile Lys Ala Leu Phe Pro Thr Glu Ile His

195 200 205Ser Gly Leu Leu Glu Val Ile Ser Pro Ser Pro His Phe Tyr Pro Asp

210 215 220Phe Ser Arg Leu Arg Glu Ser Phe Gly Asp Pro Lys Glu Arg Val Arg225 230 235 240Trp Arg Thr Lys Gln Asn Leu Asp Tyr Cys Phe Leu Met Met Tyr Ala

245 250 255Gln Ser Lys Gly Ile Tyr Tyr Val Gln Leu Glu Asp Asp Ile Val Ala

260 265 270Lys Pro Asn Tyr Leu Ser Thr Met Lys Asn Phe Ala Leu Gln Gln Pro

275 280 285Ser Glu Asp Trp Met Ile Leu Glu Phe Ser Gln Leu Gly Phe Ile Gly

290 295 300Lys Met Phe Lys Ser Leu Asp Leu Ser Leu Ile Val Glu Phe Ile Leu305 310 315 320Met Phe Tyr Arg Asp Lys Pro Ile Asp Trp Leu Leu Asp His Ile Leu

325 330 335Trp Val Lys Val Cys Asn Pro Glu Lys Asp Ala Lys His Cys Asp Arg

340 345 350Gln Lys Ala Asn Leu Arg Ile Arg Phe Lys Pro Ser Leu Phe Gln His

355 360 365Val Gly Thr His Ser Ser Leu Ala Gly Lys Ile Gln Lys Leu Lys Asp

370 375 380Lys Asp Phe Gly Lys Gln Ala Leu Arg Lys Glu His Val Asn Pro Pro385 390 395 400Ala Glu Val Ser Thr Ser Leu Lys Thr Tyr Gln His Phe Thr Leu Glu

405 410 415Lys Ala Tyr Leu Arg Glu Asp Phe Phe Trp Ala Phe Thr Pro Ala Ala

420 425 430Gly Asp Phe Ile Arg Phe Arg Phe Phe Gln Pro Leu Arg Leu Glu Arg

435 440 445Phe Phe Phe Arg Ser Gly Asn Ile Glu His Pro Glu Asp Lys Leu Phe

450 455 460Asn Thr Ser Val Glu Val Leu Pro Phe Asp Asn Pro Gln Ser Asp Lys465 470 475 480Glu Ala Leu Gln Glu Gly Arg Thr Ala Thr Leu Arg Tyr Pro Arg Ser

485 490 495Pro Asp Gly Tyr Leu Gln Ile Gly Ser Phe Tyr Lys Gly Val Ala Glu

500 505 510Gly Glu Val Asp Pro Ala Phe Gly Pro Leu Glu Ala Leu Arg Leu Ser

515 520 525Ile Gln Thr Asp Ser Pro Val Trp Val Ile Leu Ser Glu Ile Phe Leu

530 535 540Lys Lys Ala Asp545 548SEQ ID NO:38序列长度：29序列类型：核酸链型：单链拓扑学：线性分子类型：合成DNA序列描述TTCTCGAGGA GATGAGGCTC CGCAATGGC 29SEQ ID NO:39序列长度：30序列类型：核酸链型：单链拓扑学：线性分子类型：合成DNA序列描述AATCTAGAAA TGTGGGCTTC AGGGCTGGC 30SEQ ID NO：40序列长度：28序列类型：核酸链型：单链拓扑学：线性分子类型：合成DNA序列描述CCCTCGAG ATG GGG GTG CAC GAA TGT CC 28

Met Gly Val His Glu Cys ProSEQ ID NO:41序列长度：48序列类型：核酸链型：单链拓扑学：线性分子类型：合成DNA反义：是序列描述CTTTTTGCTT GTTAACTCCT TTAGTATTGG GGCGCCCAGG ACTGGGAG 48SEQ ID NO:42序列长度：48序列类型：核酸链型：单链拓扑学：线性分子类型：合成DNA序列描述CTCCCAGTCC TGGGCGCCCC AATACTAAAG GAGTTAACAA GCAAAAAG 48SEQ ID NO:43序列长度：44序列类型：核酸链型：单链拓扑学：线性分子类型：合成DNA反义：是序列描述CTTCCTTCAT TTTGCAATAA ATGAGGGGCG CCCAGGACTG GGAG 44SEQ ID NO:44序列长度：43序列类型：核酸链型：单链拓扑学：线性分子类型：合成DNA反义：是序列描述ATTTAACTTC TCTCTTCACT GTAGGGGCGC CCAGGACTGG GAG 43SEQ ID NO:45序列长度：44序列类型：核酸链型：单链拓扑学：线性分子类型：合成DNA序列描述CTCCCAGTCC TGGGCGCCCC TCATTTATTG CAAAATGAAG GAAG 44SEQ ID NO:46序列长度：43序列类型：核酸链型：单链拓扑学：线性分子类型：合成DNA序列描述CTCCCAGTCC TGGGCGCCCC TACAGTGAAG AGAGAAGTTA AAT 43SEQ ID NO:47序列长度：26序列类型：核酸链型：单链拓扑学：线性分子类型：合成DNA反义：是序列描述TTCTAGAA TCA CCC TTC CGC AAC ACC 26

TRM Gly Glu Ala Val GlySEQ ID NO:48序列长度：28序列类型：核酸链型：单链拓扑学：线性分子类型：合成DNA反义：是序列描述TTCTAGAA TCA AGG CAG AAC TTC CAC CG 28

TRM Pro Leu Val G1u Val ThrSEQ ID NO:49序列长度：38序列类型：核酸链型：单链拓扑学：线性分子类型：合成DNA反义：是序列描述TTCTAGAA TCA TTT AAA TAG GAT GTA GTC TCC AGC TAC 38

TRM Lys Phe Leu Ile Tyr Asp Gly Ala ValSEQ ID NO:50序列长度：34序列类型：核酸链型：单链拓扑学：线性分子类型：合成DNA反义：是序列描述TTCTAGAA TCA TGG TTT CAT GTA ATC TTT ATC CG 34

TRM Pro Lys Met Tyr Asp Lys Asp ThrSEQ ID NO:51序列长度：19序列类型：核酸链型：单链拓扑学：线性分子类型：合成DNA序列描述TTC ATG AGG CTC CGA AAT G 19

Met Arg Leu Arg Asn GlySEQ ID NO:52序列长度：29序列类型：核酸链型：单链拓扑学：线性分子类型：合成DNA反义：是序列描述CAAGCT TCA GTT TGT GAC TTT TTT AAT AT 29

TRM Asn Thr Val Lys Lys Ile HisSEQ ID NO:53序列长度：27序列类型：核酸链型：单链拓扑学：线性分子类型：合成DNA序列描述TC ATG ATA CTA AAG GAG TTA ACA AGC A 27Met Ile Leu Lys Glu Leu Thr Ser LysSEQ ID NO:54序列长度：51序列类型：核酸链型：单链拓扑学：线性分子类型：合成DNA反义：是序列描述CAAGCT TCA GTG GTG GTG GTG GTG GTG GTT TGT GAC TTT 39

TRM His His His His His His Asn Thr Val LysTTT AAT ATG GAT 51Lys Ile His IleSEQ ID NO:55序列长度：18序列类型：核酸链型：单链拓扑学：线性分子类型：合成DNA反义：是序列描述CAAGCT TCA GTG GTG GTG 18

TRM His His HisSEQ ID NO:56序列长度：32序列类型：核酸链型：单链拓扑学：线性分子类型：合成DNA序列描述TC ATG ATA TTA AAG GAG TTA ACA AGC AAA AAA 32Met Ile Leu Lys Glu Leu Thr Ser Lys LysSEQ ID NO:57序列长度：51序列类型：核酸链型：单链拓扑学：线性分子类型：合成DNA反义：是序列描述CAAGCT TCA GTG GTG GTG GTG GTG GTG GTT GGT GGC TTT 39

TRM His His His His His His Asn Thr Ala LysTTT AAT ATG AAT 51Lys Ile His IleSEQ ID NO:58序列长度：49序列类型：核酸链型：单链拓扑学：线性分子类型：合成DNA反义：是序列描述CAAGCT TCA GTG GTG GTG GTG GTG GTG TGG TTT CAT ATA 39

TRM His His His His His His Pro Lys Met TyrATC TTT ATC C 49Asp Lys AspSEQ ID NO:59序列长度：19序列类型：核酸链型：单链拓扑学：线性分子类型：合成DNA序列描述TTC ATG AGG CTC CGC AAT G 19

Met Arg Leu Arg Asn GlySEQ ID NO:60序列长度：18序列类型：核酸链型：单链拓扑学：线性分子类型：合成DNA反义：是序列描述CAGGTTGAGC TCCTTGGA 18SEQ ID NO:61序列长度：18序列类型：核酸链型：单链拓扑学：线性分子类型：合成DNA序列描述TCCAAGGAGC TCAACCTG 18SEQ ID NO:62序列长度：44序列类型：核酸链型：单链拓扑学：线性分子类型：合成DNA反义：是序列描述CAAGCT TCA GTG GTG GTG GTG GTG GTG GTC GGC CTT TTT CAG GA 44

TRM His His His His His His Asp Als Lys Lys Leu PheSEQ ID NO:63序列长度：23序列类型：核酸链型：单链拓扑学：线性分子类型：合成DNA序列描述CCC ATG GGC CGC CTA ACA GAG GA 23

Met Gly Arg Leu Thr Glu Asp

Claims

1．具有产生含有由下面化学式所代表的部分结构的糖类活性的β1→4N-乙酰葡糖胺基转移酶：

该酶用UDP-GlcNAc作为糖供体和具有由下面化学式所代表的部分结构的糖类作为糖受体：

2．权利要求1的β1→4N-乙酰葡糖胺基转移酶，其中的作为糖受体的糖类为寡糖、多糖、糖缀合物(糖肽、糖蛋白、糖脂或蛋白聚糖)或其衍生物。

3．权利要求1的β1→4N-乙酰葡糖胺基转移酶，其中的糖受体为具有由下面化学式所代表的部分结构的糖类：

其中的R1:H-,Manα1→6或GlcNAcβ1→6

R2:H-,Manα1→3或GlcNAcβ1→2

R3:-OH或β1→4 GlcNAc→R4

R4:-OH,-H，-吡啶基胺或-肽链。

4．β1→4N-乙酰葡糖胺基转移酶，包括显示于SEQ ID NOS:1-14中氨基酸序列作为部分序列。

5．β1→4N-乙酰葡糖胺基转移酶，其由显示于SEQ ID NO:18中氨基酸序列所组成或由显示于SEQ ID NO:18中的氨基酸序列所组成但具有一个或更多个氨基酸残基的添加、缺失或替代而仍具有β1→4N-乙酰葡糖胺基转移酶活性。

6．由显示于SEQ ID NO:18中部分氨基酸序列所组成的β1→4N-乙酰葡糖胺基转移酶，其中包括至少从位置93至位置383的残基，或者所述的部分序列具有一个或更多个氨基酸残基的添加、缺失或替代而仍具有β1→4N-乙酰葡糖胺基转移酶活性。

7．β1→4N-乙酰葡糖胺基转移酶，其由显示于SEQ ID NO:24中的氨基酸序列所组成，或由显示于SEQ ID NO:24中的氨基酸序列所组成但具有一个或更多个氨基酸残基的添加、缺失或替代而仍具有β1→4N-乙酰葡糖胺基转移酶活性。

8．由显示于SEQ ID NO:24中部分氨基酸序列所组成的β1→4N-乙酰葡糖胺基转移酶，包括至少从位置94至位置383的残基，或所述的部分序列具有一个或更多个氨基酸残基的添加、缺失或替代而仍具有β1→4N-乙酰葡糖胺基转移酶活性。

9．β1→4N-乙酰葡糖胺基转移酶，其由显示于SEQ ID NO:37中氨基酸序列所组成，或由显示于SEQ ID NO:37中的氨基酸序列所组成但具有一个或更多个氨基酸残基的添加、缺失或替代而仍具有β1→4N-乙酰葡糖胺基转移酶活性。

10．由显示于SEQ ID NO:37中部分氨基酸序列所组成的β1→4N-乙酰葡糖胺基转移酶，其中包括至少从位置91至位置390的残基，或所述的部分序列具有一个或更多个氨基酸残基的添加、缺失或替代而仍具有β1→4N-乙酰葡糖胺基转移酶活性。

11．编码权利要求5或6的β1→4N-乙酰葡糖胺基转移酶的β1→4N-乙酰葡糖胺基转移酶基团。

12．编码权利要求7或8的β1→4N-乙酰葡糖胺基转移酶的β1→4N-乙酰葡糖胺基转移酶基因。

13．编码权利要求9或10的β1→4N-乙酰葡糖胺基转移酶的β1→4N-乙酰葡糖胺基转移酶基因。

14．由SEQ ID NO:17中显示的核苷酸序列所组成的β1→4N-乙酰葡糖胺基转移酶基因。

15．由SEQ ID NO:23中显示的核苷酸序列所组成的β1→4N-乙酰葡糖胺基转移酶基因。

16．由显示于SEQ ID NO:36中核苷酸序列所组成的β1→4N-乙酰葡糖胺基转移酶基因。

17．通过将权利要求11至16中的任何一种β1→4N-乙酰葡糖胺基转移酶基因插入载体DNA而获得的重组DNA。

18．包括权利要求11至16中任何一种β1→4N乙酰葡糖胺基转移酶基因部分或全长的染色体片段。

19．带有权利要求17重组DNA的宿主细胞。

20．向其中人工导入有权利要求18染色体片段的宿主细胞。

21．用于从生物样品中纯化权利要求1至3中任何一种β1→4N-乙酰葡糖胺基转移酶的方法。

22．用于制备β1→4N-乙酰葡糖胺基转移酶的方法，包括在培养基中培养权利要求19的宿主细胞和从得到的培养物中回收β1→4N-乙酰葡糖胺基转移酶。

23．用于制备β1→4N-乙酰葡糖胺基转移酶的方法，包括在培养基中培养权利要求20的宿主细胞和从得到的培养物中回收β1→4N-乙酰葡糖胺基转移酶。

24．用于制备β1→4N-乙酰葡糖胺基转移酶的方法，包括从分泌物、体液或从权利要求19的宿主细胞匀浆中回收β1→4N-乙酰葡糖胺基转移酶。

25．用于制备β1→4N-乙酰葡糖胺基转移酶的方法，包括从分泌物、体液或从权利要求20的宿主细胞匀浆中回收β1→4N-乙酰葡糖胺基转移酶。

26．其糖链结构被权利要求1-3中任何一种β1→4N-乙酰葡糖胺基转移酶修饰的糖类。

27．权利要求26的糖类，其为寡糖、糖肽、糖蛋白或其衍生物。

28．用于修饰由宿主细胞产生糖蛋白糖链分支结构的方法，包括将权利要求11至16中的任何一种β1→4N-乙酰葡糖胺基转移酶基因导入宿主细胞。

29．其中糖链的分支结构由权利要求28的方法修饰的糖蛋白。

30．权利要求29的糖蛋白，其为红细胞生成素。