CN1273586C

CN1273586C - β1→4N－乙酰葡糖胺基转移酶和编码该酶的基因

Info

Publication number: CN1273586C
Application number: CNB971934770A
Authority: CN
Inventors: 小栗秀; 箕轮真理; 吉田有人; 竹内诚; 谷口直之
Original assignee: Kirin Brewery Co Ltd
Current assignee: Kirin Brewery Co Ltd
Priority date: 1996-12-12
Filing date: 1997-12-10
Publication date: 2006-09-06
Anticipated expiration: 2017-12-10
Also published as: WO1998026053A1; US6338955B2; EP0905232B1; EP0905232A1; JP4246264B2; KR19990082498A; CN1214732A; KR100325552B1; US20010024814A1; ES2235259T3; EP0905232A4; DE69732628D1; DE69732628T2; ATE290068T1

Abstract

一种新的具有β1→4N-乙酰葡糖胺基转移酶(GnT-IV)活性的酶；编码该酶的基团；含有该基因的重组DNA；含有该重组DNA的宿主细胞；用于通过在培养基中培养宿主细胞而制备具有Gn-T-IV活性酶蛋白的方法；和具有由GnT-IV所修饰糖链的糖类。本发明提供新的GnT-IV，用于制备该酶的方法，和编码该酶的基因。该新的GnT-IV使制备不能由现存糖基转移酶而形成的分枝糖类成为可能。因此，它有助于药物、试剂和复合糖型食物的制备和改善且在修饰任何生物高分子的糖链结构中是有用的。

Description

β1→4N-乙酰葡糖胺基转移酶和编码该酶的基因

技术领域

本发明涉及一种新的N-乙酰葡糖胺基转移酶(GlcNAc转移酶)，其识别糖类中特异性的糖链结构并且向其中导入GlcNAc β1→4分支结构。

背景领域

1.糖蛋白

自然中大多数蛋白并非是仅由氨基酸所组成的简单蛋白，而是具有糖链和其它物质如磷酸基和脂类附着其上的“成熟”蛋白。因此，由大肠杆菌制备的简单蛋白型产物的开发包括多种问题因为该产物缺乏蛋白的成熟过程。因为除少数例外，所有分泌型生理活性蛋白(如细胞因子)均为糖蛋白，故糖链的功能和作用在开发生物药物中受到极高的重视。

糖蛋白中的糖链粗略地分为Asn-连接型、粘蛋白(mucin)-型、O-连接的GlcNAc型、GPI锚定型和蛋白聚糖型[makoto Takeuchi，“糖生物学系列5：糖技术”，Kihata，Hakomori和Nagai(编)，Kodansha科学公司，(1994)，191-208]。这些糖链类型的每一种具有其自己的生物合成途径和各自的生理功能。Asn-连接的糖链广泛分布于霉菌、酵母、昆虫、植物和动物中。Asn-连接的糖链的基本生物合成途径在不同种间是保守的(图1)。代表具体种类的糖链在核心糖链部分的外侧(称为“非还原性末端一侧”)形成，这在Asn-连接的糖链的生物合成中是常见的。其中的α1，3-和α1，2-分支甘露糖残基通过α1，6键延伸而附着到主链的甘露聚糖型糖链是真菌如酵母的特征性糖链结构(见图版2)[Hiroshi Nakajima，糖链技术，工业调查协会(Industry Survey Association(1992)，384-397]。另一方面，在昆虫、植物和动物中，未观察到甘露糖残基的延伸；相反，形成了高甘露糖型糖链，其为由多萜醇中间体转移而来且仅修整(trimmed)过糖链(见图2中c版)。具有特征性木糖等的独特结构(见图2中b版)也在昆虫、植物和软体动物中观察到。在动物中，观察到特征性糖链结构如复合型糖链(图2中e版)和杂合型糖链(图2中d版)；在前者中，GlcNAc分支结构在曾经修整过的糖链中形成，并且添加其它种单糖如半乳糖和唾液酸形成复杂的结构；在后者，既存在复合型糖链又存在高甘露糖型糖链[Kiyoshi Furukawa，糖链技术，工业调查协会(1992)，64-75]。

如上述的这种糖链存在于大多数细胞表面蛋白和分泌蛋白中，且认为起决定细胞和蛋白性质和特性的重要作用。其中，形成象从常见核心糖链延伸出天线一样的分支的糖链结构部分称为糖链分支结构。该结构据信具有产生有机体识别配体(即糖链末端部分)的功能，由此高度自由地提供多位点识别机会和通过大大增加空间占据体积而使保护蛋白部分的能力最大化的另一功能(Takeuchi等，见上)。因此，通过控制糖链的分支结构，用各种方式修饰生理功能，如糖蛋白的体内稳定性，体内动力学和器官靶向特性是可能的。考虑到这些，控制糖链分支结构的技术预期成为下一代用于开发“对人类灵敏的”糖蛋白型药物的生物技术。

2.糖蛋白糖链的生理意义

分泌型糖蛋白的糖链在糖蛋白的生物合成、细胞内分组、抗原性的掩蔽、体内稳定性及器官-靶向特性中显示出杰出的功能。已知细胞表面蛋白的糖链依细胞中的变化(如分化、转变为病态、癌变)而变化。特别地，已报道在肿癌的迁移和糖链分支结构之间存在着密切的相关性。

(1)抗原性的掩蔽(Masking of Antigenicity)

据认为就空间结构而言糖链具有高度的自由度且因此象推进器一样自由地移动。因此，蛋白分子如蛋白酶和抗不具对糖链亲和性蛋白的抗体被糖链所隔开且因此不能够达到蛋白部分。结果，即使在靠近糖链结合位点的肽部分具有抗原性，抗体分子仍然不能够接近肽部分。这样，抗原-抗体反应极难发生。此外，当糖蛋白被巨噬细胞捕获且降解产物以抗原形式给出，受体难以接近糖链结合位点附近的肽。因此，抗原性刺激难以发生。实际上，据报导当糖链被导入到卵清蛋白溶菌酶抗原性肽中部时，MHC II类分子与该抗原的结合受到异常抑制[Mouritsen，S.，Meldal，M.，Christiansen-Brams，I.，Elsner，H.和Werdelin，O.，欧洲免疫学杂志，(1994)，24，1066-1072]。随着糖链占据体积的变大，抗原性的这种掩蔽效应变得更大。因此，认为开发分支结构大大有助于这种掩蔽的效应。

(2)体内稳定性

关于以转基因动物细胞作为宿主而制备的第一种糖蛋白型药物的红细胞生成素，其糖链的功能已被彻底研究过。结果，显示红细胞生成素的糖链抑制其与其受体的结合但对维持活性结构和体内动力学的改进起决定作用；总之，糖链显示出对红细胞生成素药物学活性的表达至关重要(Takeuchi，M.和Kobata，A.，糖生物学(1991)，1，337-346]。特别地，发现细胞生成素糖链天线数目和红细胞生成素的药物学效应之间存在着强烈的相关性，且因此从未引起注意的分支结构(由GlcNAc残基附着到核心糖链而形成的分支结构)的重要性首次被弄清[Takeuchi，M.，Inoue，N.，Strickland，T.W.，Kobata，M.，Wada，M.，Shimizu，R.，Hoshi，S.，Kozutsumi，H.，Takasaki，S.和Kobata，A.，美国自然科学院院刊(1989)，86，7819-22]。上面现象的主要原因解释如下：没有发达分支结构的红细胞生成素在肾脏内很快被清除且，结果，该红细胞生成素在体内的存留时间变短[Misaizu，T.，Matsuki，S.，Strickland，T.W.，Takeuchi，M.，Kobata，A.和Takasaki，S.，血液，(1995)，86，4097-4104]。

(3)器官靶向性

大多数生物组织具有凝集素样受体且然后用于细胞-细胞相互作用或从血液中摄入糖蛋白。肝脏中的脱唾液酸蛋白结合凝集素是对老化糖蛋白清除系统的一个代表性实例[Toshihiro Kawasaki，Sugar糖链技术，工业调查协会(1992)，125-136]。此外，血管内皮细胞、血小板和白细胞(Kawasaki，见上)中含的选择蛋白和存在于巨噬细胞和NK细胞表面的凝集素受体(Kawasaki，见上)是众所周知的。此外，已知不仅糖蛋白而且细胞用糖链作为配体而聚集于特异的组织中。骨髓细胞的归巢(homing)[Tatsuo Irimura，“糖生物学系列3：细胞社会中的糖生物学”，Katsutaka Nagai，Senichiro Hakomori和AkiraKobata(编)，Kodansha科学公司，(1993)，127-175]和纂集噬中性细胞至炎症区(Irimura，见上)的事例已详细研究过。将所有这些事加起来，可很好地认为糖蛋白和细胞，通过其糖链结构，对在血液循环中呈现出凝集素受体的特异性器官或组织具有靶向性，尽管这种靶向系统没有发现于所有器官中。这意味着通过糖链的药物运输是可能的。在该药物运输中，凝集素对糖链的亲和性剧烈地受糖链配体自由度和数目的影响。因此，糖链的分支结构将在这种药物运输中成为最重要的因素。

(4)细胞向病态的转变和其糖链分支结构的相关性[Junko Kato，Naoko Suzuki“糖链技术和药物开发”，药物副作用所致损伤的减轻与研究基金会(编)，Yakugyo-Jiho-Sha，(1994)，107-13214]。

一旦称为L-PHA的植物凝集素开发成探针以检测多-分支型糖链结构时，检测各种病态组织样品变为可能。结果，发现一种趋势，即有些类型癌细胞，特别是具有高度迁移能力的癌细胞用L-PHA能很好地被染色。这样，研究人员便注意到糖链分支结构与癌细胞迁移能力的相关性。人类绒毛膜促性腺蛋白(hCG)为在胚胎早期绒毛组织中进行活跃生物合成的糖蛋白激素。由于相当多的hCG释放到尿液中，hCG在临床上被用作妊娠的指标。主要通过单一和双重天线(biantennary)复合型链而形成的Asn-连接糖链是hCG特征性糖链。随着从绒毛膜上皮癌至侵袭性葡萄胎和从侵袭性葡萄胎至绒毛膜癌而癌逐渐增加其恶性，据报道2，4，2型三-天线糖链和异常双天线糖链(两者分别通过GnT-IV-对正常双天线和单一-天线糖链的作用而形成)出现于hCG的糖链中[Katsuko Yamashita，蛋白、核酸和酶(1992)，37，1880-1888]。由于该现象的原因，已表明随着绒毛膜癌恶性的进展GnT-IV活性增加。

γ-谷氨酰基转肽酶(γ-GTP)是在肝脏中尤为丰富的糖蛋白。由于当有肝病时血清γ-GTP水平剧烈升高，该水平被用作肝病的诊断指标。此外，Yamashita等[Yamashita，K.，Totani，K.，Iwaki，Y.，Takamisawa，I.，Takeishi，N.，Higashi，T.，Sakamoto，Y.和Kobata，A.，生物化学杂志，(1989)，105，728-735]已发现，由于细胞的癌变，与异常hCG中情况一样，γ-GTP的糖链结构在其分支结构中变化异常；因此，他们报导了癌变和GnT-IV激活的相关性。源自健康人肝细胞γ-GTP的Asn-连接的糖链主要由双天线复合型糖链所组成，且具有少量三天线和四天线糖链混合其中。相反，在源自人肝癌细胞γ-GTP的Asn-连接的糖链中观察到分支程度的异常增加。同时，尽管量较少，但出现高甘露糖型糖链和异常的双天线糖链(两者在正常细胞的γ-GTP中均未观察到)。由于糖链结构的这些变化，故表明有这样的可能性即N-乙酰葡糖胺基转移酶IV(GnT-IV)和V(GnT-V)的激活与肝细胞癌变有关(Yamashita等，见上)。

另据报导细胞中糖蛋白的糖链分支结构受病毒感染而剧烈改变(Yamashita等，见上)。BHK细胞具有分支成四天线型的糖链结构。当BHK细胞以多瘤病毒感染时，在细胞产生的糖蛋白糖链中双天线型糖链减少，而四天线型糖链和N-乙酰乳糖胺重复结构增加；总的来说，分支数目的异常改变已被认识到[Takasaki S.，Ikehira，H.和Kobata A.，生化、生物物理、研究通讯，(1980)，90，(3)，735-742]。由于上述的改变，GnT-IV、GnT-V和i-GnT的激活可以考虑。

3.与糖蛋白糖链分支结构有关的酶

动物特征性糖蛋白糖链结构的复合型糖链具有复杂的分支结构，其中的N-乙酰葡糖胺(GlcNAc)残基以各种方式附着到常见的核心结构上(Kiyoshi Furukawa，见上)(图1)。由于此分支结构与糖蛋白的体内及体内稳定性、定位、生物学活性和药物学特性密切相关(MakotoTakeuchi，见上)，分支结构的生物合成过程已被详细研究。通过用发明底物，H.Schachter等在母鸡输卵管中区分出多种酶活性继而预言GlcNAc分支形成酶GnT-I至GnT-VI的存在(GlcNAc糖基转移酶的分组；图3)[Glesson，P.A.和Schachter，H.，生物化学杂志，(1983)，258，6162-6173]。之后，GnT-I[Kumar，R.，Yang，J.，Larsen，R.D.和Stanley P.，美国自然科学院院刊，(1990)，87，9948-9952；Sarkar，M.，Hull，E.，Nishikawa，Y.，Simpson，R.J.，Moritz，R.L.，Dunn，R.和Schachter，H.，美国自然科学院院刊，(1991)，88，234-238]，GnT-II[D′Agostaro，GA.，Zingoni，A.，Moritz，RL.，Simpson，RJ.，Schachter，H.和Bendiak，B.，生物化学杂志，(1995)，270，15211-21]，GnT-III[Nishikawa，A.，Ihara，Y.，Hatakeyama，M.，Kangawa，K.和Taniguchi，N.，生物化学杂志，(1992)，267，18199-18204]和GnT-V[Shorebah，M.G.，Hindsgaul，O.和Pierce，M.，生物化学杂志，(1992)，267，2920-2927；Gu，J.，Nishikawa，A.，Turuoka，N.，Ono，M.，Yamaguchi，N.，Kangawa，K.，和Taniguchi，N.，生化杂志，(1993)，113，614-619]被相继纯化，且其基因已被克隆。然而，仅具有这些已知的GlcNAc转移酶，是不可能形成发现于人血液糖蛋白[Yoshima，H.，Matsumoto，A.，Mizuochi，T.，Kawasaki，T.和Kobata，A.，生物化学杂志(1981)，256，8476-8484]和细胞生成素[Takeuchi，M.，Takasaki，S.，Shimada，M.和Kobata，A.，生化化学杂志，(1990)，265，12127-12130]中α1酸性糖蛋白中的主要糖链(四天线型；见下面的公式)。因此，已寻找预期在GnT-IV中具有该底物特异性和反应特异性的N-乙酰葡糖胺基转移酶作为缺失的环节。

四天线型糖链结构

除上述那些酶外，下面的N-乙酰-葡糖胺基转移酶已被纯化或其基因已被克隆：作用于粘蛋白型糖链的转移酶[Bierhuizen，M.F.，Maemura，K.和Fukuda，M.，生物化学杂志，(1994)，269，4473-4479]，作用于糖脂的转移酶，和形成称为I.i抗原结构糖链表位的转移酶[Kawashima，H.，Yamamoto，K.，Osawa，T.和Irimura，T.，生物化学杂志，(1993)，268，27118-27126；Bierhuizen，M.F.，Mattei，M.G.和Fukuda，M.，基因发育，(1993)，7，468-478]。然而，这些转移酶的底物特异性和由这些转移酶转移的GlcNAc基因的结合模式不同于GnT-IV。这些转移酶中任何一个不产生象GnT-IV产物的产物。

发明内容

以下是本发明的目的，包括提供具有β1→4N-乙酰葡糖胺基转移酶(以下称为“GnT-IV”)活性的酶；编码该酶的基因；包括该基因的重组DNA；含有重组DNA的细胞；用于制备具有GnT-IV活性酶蛋白包括在培养基中培养细胞的方法；和其中的糖链以GnT-IV修饰的糖类。

为了解决上面的方案，本发明者进行了深入而广泛的研究。结果，发明者在牛小肠中分离纯化一种GnT-IV酶蛋白，并对该蛋白的生化特性进行了特征描述。然后，根据上面酶蛋白的部分氨基酸序列本发明者成功地从小肠cDNA文库和mRNA中克隆出编码牛GnT-IVa的基因。此外，根据牛GnT-IVa基因，本发明者又从人肝脏和人肺的cDNA文库和mRNAs中分别成功地克隆出编码人GnT-IVa和人GnT-IVb的两个基因。通过证实这些基因产物显示出GnT-IV活性而完成本发明。

本申请第一个发明涉及具有产生具有下面化学式所代表部分结构糖类活性的GnT-IV：

用UDP-GlcNAc作为糖供体且用具有下面化学式所代表的部分结构的糖类作为糖受体：

第二个发明涉及由显示于SEQ ID NO：18中的氨基酸序列所组成的GnT-IV或由显示于SEQ ID NO：18中的氨基酸序列所组成但具有一个或更多个氨基酸残基添加、缺失或替代而仍产生GnT-IV活性的GnT-IV；由显示于SEQ ID NO：24中的氨基酸序列所组成的GnT-IV或由显示于SEQ ID NO：24中的氨基酸序列所组成但具有一个或更多个氨基酸残基的添加、缺失或替代而仍产生GnT-IV活性的GnT-IV；和由显示于SEQ ID NO：37中的氨基酸序列所组成的GnT-IV或由显示于SEQ ID NO：37中的氨基酸序列所组成但具有一个或更多个氨基酸残基的添加、缺失或替代而仍产生GnT-IV活性的GnT-IV。

第三个发明涉及编码GnT-IV的GnT-IV基因，该GnT-IV由显示于SEQ ID NO：18中的氨基酸序列所组成或由显示于SEQ IDNO：18中的氨基酸序列所组成但具有一个或更多个氨基酸残基的添加、缺失或替代而仍产生GnT-IV活性；编码GnT-IV的GnT-IV基因，该GnT-IV基因由显示于SEQ ID NO：24中的氨基酸序列所组成或由显示于SEQ ID NO：24中的氨基酸序列所组成但具有一个或更多个氨基酸残基的添加、缺失或替代而仍具有GnT-IV活性；编码GnT-IV的GnT-IV基因，该GnT-IV基因由显示于SEQ ID NO：37中的氨基酸序列所组成或由SEQ ID NO：37中的氨基酸序列所组成但具有一个或更多个氨基酸残基的添加、缺失或替代而仍产生GnT-IV活性；由显示于SEQ ID NO：17中的核苷酸序列所组成的GnT-IV基因；由显示于SEQ ID NO：23中的核苷酸序列所组成的GnT-IV基因；和由显示于SEQ ID NO：36中的核苷酸序列所组成的GnT-IV基因。

第四个发明涉及可通过将上述GnT-IV基因中的任何一个插入到载体DNA中而获得的重组DNA；和包括上述GnT-IV基因中任何一个基因的部分或全长的染色体片段。

第五个发明涉及带有上述重组DNA的宿主细胞；和其中人工导入有上述染色体片段的宿主细胞。

第六个发明涉及用于制备GnT-IV的方法，包括在培养基中培养上述宿主细胞和从得到的培养物中回收GnT-IV；以及用于制备GnT-IV的方法，包括从分泌物中、体液或源自上述宿主细胞的匀浆液回收GnT-IV酶。

第七个发明涉及用于从生物样品中纯化GnT-IV的方法。

第八个发明涉及其糖链结构以GnT-IV修饰的糖。

以下，将对本发明进行详细描述。

本发明的GnT-IV基因可按下述方法分离。

牛GnT-IVa基因的分离

首先，将从去污剂溶解的牛小肠微粒体级分用阴离子交换层析、铜螯合物层析、用底物类似物的两步亲和层析及凝胶过滤进行一系列的纯化步骤继而获得GnT-IV酶的纯化样品。将得到的纯化样品进行SDS-PAGE且然后转移至PVDF膜上。转移的蛋白原样或经有限的水解后从气相氨基酸测序仪进行分析以获得GnT-IV酶的部分氨基酸序列。

随后，用从动物细胞(即，牛小肠)提取的RNA作为模板用根据上面测得的部分氨基酸序列而设计的引物进行RT-PCR。此外，用通过RT-PCR获得的片段作为探针，通过噬菌斑杂交从上面提到组织的cDNA文库中筛选感兴趣的GnT-IV基因。将在得到的阳性噬菌斑中含有的cDNA片段切出并亚克隆到载体如pUC19中，然后分析其核苷酸序列。如果编码感兴趣蛋白的基因全长没有含在该片段中，用部分的该亚克隆cDNA片段作为探针再次进行噬菌斑杂交。或者，根据上面获得的核苷酸序列信息通过RACE等而获得感兴趣cDNA的末端部分。将这样获得的GnT-IV基因(后称为GnT-IVa)进行其全长核苷酸序列的分析。将具有上面提到的核苷酸序列的基因翻译成氨基酸序列。此氨基酸序列显示于SEQ ID NO：18中。

人类GnT-IVa和GnT-IVb基因的分离

通过用从人组织(肝脏或肺)提取的RNA且根据上面获得的牛GnT-IVa基因核苷酸序列信息进行PCR，然后从上面的组织中筛选cDNA文库可获得人GnT-IVa和GnT-IVb基因。将得到的人GnT-IVa和GnT-IVb基因进行它们的全长核苷酸序列分析。然后，将这些基因翻译成氨基酸序列。这些氨基酸序列显示于SEQ ID NOS：24和37。

为了获得编码显示于SEQ ID NO：18、24或37中的氨基酸序列并具有一个或更多个氨基酸残基的添加、缺失或替代的DNA，可用多种方法。例如，以诱变剂处理DNA以诱导点突变或缺失突变的方法，包括选择性切割DNA、去除或添加选择的核苷酸且然后连接DNA的方法；点特异性诱变；等可被列举。

本发明的GnT-IV蛋白可通过以下方法制备，包括制备其中的启动子下游插入通过上述方法而获得的编码本发明GnT-IV DNA的重组载体，将该载体导入宿主细胞并培养得到的细胞。用于此目的的载体DNA或者可以是质粒DNA或者可以是噬菌体DNA。例如，可以使用显示于后面所述实施例中的pSVL载体(发玛西亚，瑞典)。作为其中导入有得到的重组DNA的宿主细胞，可以使用在重组DNA技术中方便使用的任何细胞，例如，原核细胞、动物细胞、酵母、真菌及昆虫细胞。具体的实例包括作为原核细胞的大肠杆菌和作为动物细胞的来自中国仓鼠的CHO细胞和来自猴的COS细胞。

对每种宿主用常规的方法对上述宿主细胞进行转化。例如，如果宿主为大肠杆菌，包括重组DNA的载体通过热休克方法或电穿孔导入由钙方法等而制备的感受态细胞中。如宿主为酵母，包括重组DNA的载体通过热休克方法或电穿孔进入由锂方法等而制备的感受态细胞中。如果宿主为动物细胞，包括重组DNA的载体通过磷酸钙方法、脂质转染法或电穿孔法导入生长期的细胞中。

通过在培养基中培养这样获得的转化子，制备GnT-IV蛋白。

在转化子的培养中，只要宿主能够在其中存活可使用任何培养基，例如，如果宿主是大肠杆菌可以使用LB培养基等。如果宿主是酵母，可以使用YPD培养基等。如果宿主是动物细胞，可以使用补充以动物血清等的Dulbecco′s培养基。培养在常规用于宿主的条件下进行。例如，如果宿主是大肠杆菌，细胞在约25-37℃，如果必要，通气和/或振荡下培养约3-24小时。如果宿主是酵母，细胞在约25-37℃，如果必要，通气和/或振荡下培养约12小时至2周。如果宿主是动物细胞，培养在约32-37℃于5％ CO₂和100％湿度下，如果必要，改变通气条件和/或振荡下进行24小时至2周。

培养后，用匀浆器、弗氏压碎器、超声处理、溶菌酶和/或冻融破碎培养的微生物或细胞以从该微生物或细胞中洗脱出GnT-IV蛋白。然后，蛋白可获自可溶性部分。如果感兴趣的蛋白含在不溶性部分中，破碎微生物或细胞后通过离心收集不溶性部分。然后，该蛋白可用含盐酸胍等的缓冲液溶解而用于回收。或者，将培养的微生物或细胞可直接以含有蛋白变性剂和盐酸胍的缓冲液破碎以从微生物或细胞中洗脱出感兴趣的蛋白。

从上面的上清液中对GnT-IV蛋白的纯化可通过实施例1中描述的方法完成。或者，此纯化可通过适当地结合常规的分离/纯化方法而进行。这些常规的分离/纯化方法包括，但不限于，离心、盐析、溶剂沉淀、透析、超滤、分配层析、凝胶过滤、毛细管电泳、TLC、离子交换层析、金属螯合层析、亲和层析、反相层析及等电点聚焦。

按上述获自牛小肠的GnT-IV酶蛋白的生化特性如下。

(1)作用

该酶蛋白产生具有下面化学式所代表的部分结构的糖类：

作为糖受体的糖类意指寡糖、多糖、糖缀合物(糖肽、糖蛋白、糖脂或蛋白聚糖)或其衍生物。

(2)底物特异性

当糖受体是寡糖(寡糖结构，见图4)时，酶蛋白对核心型寡糖显示出0％的反应性，对GnT-I产物型寡糖显示出54％的反应性且对GnT-V产物型寡糖显示出164％的反应性，其中将酶蛋白对GnT-II产物型寡糖的反应性看作100％。

酶蛋白对GnT-II产物型寡糖的结构显示出46％的反应性，其中的岩藻糖通过α1→6链附着到还原性末端的GlcNAc上。

酶蛋白对GnT-II产物型寡糖的结构显示出0％的反应性，其中α1→3甘露糖上的GlcNAc缺失。

酶蛋白对GnT-II产物型寡糖的结构显示出16％的反应性，其中的半乳糖通过β1→4键附着到α1→6甘露糖上的GlcNAc中，且酶蛋白对下面的GnT-II产物型寡糖的结构显示出0％的反应性，该寡糖中的半乳糖通过β1→4键附着到α1→3甘露糖上的GlcNAc上。

酶蛋白对下面的GnT-II产物型寡糖的结构显示出0％的反应性，该寡糖中的GlcNAc通过β1→4键附着到β1→4甘露糖上。

(3)分子量

由SDS-PAGE(非变性条件下)测定约为66K。经肽N-糖苷酶F处理后约60K。由于当使用肽N-糖苷酶时观察到带的迁移，故认为此酶蛋白是糖蛋白。

通过含有Triton X-100的凝胶过滤而测得的表观分子量为77K。因此，认为GnT-IV不具有亚单位结构且以单体起作用。

由此核苷酸序列推导的该酶蛋白部分由535个氨基酸残基所组成且具有61614的分子量。

(4)最适pH

反应的最适pH约为5.5。在pH 6.5至8.0的范围内观察到多于50％的最大活性。

(5)抑制、激活和稳定化

(i)抑制

该酶活性受添加20mM EDTA而受到抑制。

该酶受UDP衍生物抑制。抑制的强度按下面顺序：UDP＞＞UDP-Glc＞UDP-GalNAc＞＞2′-脱氧UDP＞UDP-己酸胺(hexanolamine)＞＞UDP-Gal＞UTP＞UDP-葡萄糖醛酸＞UMP。

尿苷、TDP及CDP不具有抑制效应。

(ii)激活

二价阳离子对活性的表达是至关重要的。二价阳离子中，Mn²⁺显示出最大的效应。在7.5mM的浓度时，Co²⁺和Mg²⁺的各自效应约为Mn²⁺的70％，且Ca²⁺的效应约为Mn²⁺的10％。在5-20mM的范围中Mn²⁺的效应是最大的。

(iii)稳定化

在BSA和甘油中认识到有稳定效应。

(6)动力学参数

当作为受体的糖为单糖时(单糖结构，见图4)：

(i)其中的酶在50μl 125mM MOPS缓冲液(pH 7.3)中于37℃反应4小时的分析条件下，其中的缓冲液含有0.8mM的受体底物，20mM的UDP-GlcNAc，7.5mM的MnCl₂，200mM的GlcNAc，0.5％(w/v)Triton X-100，10％的甘油和1％的BSA：

对GnT-II产物型寡糖的Km和Vmax值分别为0.73mM和3.23μM/分钟。

对GnT-V产物型寡糖的Km和Vmax值分别为0.13mM和1.75μM/分钟。

当GnT-II产物型寡糖为受体底物时，对UDP-GlcNAc的Km值为0.22mM。

(ii)其中的酶在125mM MOPS缓冲液(pH 7.3)中于37℃反应4小时的分析条件下，其中的缓冲液含有120mM的UDP-GlcNAc，7.5nM的MnCl₂，0.5％(w/v)的Triton X-100，10％的甘油和1％的BSA：

对GnT-II产物型寡糖的Km和Vmax值分别为0.59mM和0.74mM/分钟/mg。

对GnT-V产物型寡糖的Km和Vmax值分别为0.14mM和0.47mM/分钟/mg。

(7)GnT-IV家族

牛GnT-IVa和人GnT-IVa之间同源性在核苷酸水平为91％且在氨基酸水平为96％。

所有从牛小肠中纯化的GnT-IV中含有的部分氨基酸结构均编码于牛GnT-IVa基因中。

人GnT-IVb和人GnT-IVa在核酸水平有63％的同源性且在氨基酸水平具有62％的同源性。然而，它们在C-末端和N-末端区域是完全不同的。

从上述的生化特性看，本发明的GnT-IV被认为是一种新的酶因为该酶能够完成下面常规酶不能够完成的反应：

附图简述

图1显示Asn-连接糖链的生物合成途径。

图2显示Asn-连接糖链的变异(修改自位于Makoto Takeuchi，Wako Purechemical Newsletter 64，18-19，1996中的图1)。

a.甘露聚糖型：真菌如酵母和霉菌的特征性糖链结构。

b.木-高-甘露糖型：植物、软体动物和昆虫的特征性结构。

c.高甘露糖型：常见于植物、昆虫和动物中的结构。

d.杂合型：常见于昆虫和动物中的结构。

e.复合型：动物的特征性结构。

f.原核细胞：没有用于Asn-连接糖链生物合成的系统。

套于点线中的部分代表常见的核心糖链。

图3显示由各种GlcNAc转移酶(GlcNAc糖基转移酶)对GlcNAc转移的位置。

图4显示寡糖的命名和结构。

图5显示对GnT-IV反应产物的高效液相色谱。

图6显示由Q-Sepharose FF色谱对GnT-IV的分析结果。

图7显示通过铜螯合物Sepharose FF层析对GnT-IV的分析结果。

图8显示通过UDP-己酸胺(UDP-Hexanolamine)琼脂糖亲和层析(I)对GnT-IV的分析结果。

图9显示通过UDP-己酸胺琼脂糖亲和层析(II)对GnT-IV的分析结果。

图10显示通过Superdex 200凝胶层析对GnT-IV的分析结果。

图11为显示纯化GnT-IV SDS-PAGE(SDS聚丙烯酰胺凝胶电泳)结果图。

图12显示纯化GnT-IV的天然凝胶电泳及其活性的结果。

图13显示GnT-IV、-V和VI产物型寡糖的Smith降解图。

图14显示GnT-IV反应产物的¹H-NMR(30℃)结果。

图15显示GnT-IV的最适pH。

图16显示GnT-IV的最适Mn²⁺浓度。

图17显示GnT-IV反应产物糖蛋白的SDS-PAGE和荧光层析分析结果。

道1和道2：7.6μg脱唾液酸人转铁蛋白

道3：7.6μg唾液酸人转铁蛋白

道4和道5：2.8μg脱唾液酸CHO细胞来源的重组人红细胞生成素

道6和道7：1.3μg脱唾液酸胎球蛋白

道1、4和6代表反应在无GnT-IV进行的模拟实验。M代表分子量标准(伯乐)。PM代表预染的分子量标记(伯乐，美国)。

GnT-IV反应条件：向10μl含0.702mnol/hr的GnT-IV、相当于1.6nmol的双天线型糖链的底物糖蛋白(对于仅是胎球蛋白，糖链含量为1.6nmol)和450nCi的UDP-[¹⁴C]GlcNAc的溶液中，加入等体积的分析混合物(250mM MOPS缓冲液，pH 7.3，400mM GlcNAc，20％甘油，1.0％(w/v)Triton X-100，15mM MnCl₂，1mM UDP-GlcNAc)以获得反应溶液，将其于37℃孵育20小时。将得到溶液的十分之一通过SDS-PAGE和荧光自显影进行分析。

对于SDS-PAGE，使用10-20％的梯度胶(Daiichi Kagaku)。对于荧光自显影，用Amplify(Amersham)将样品暴露至X射线胶片20小时。

图18显示人GnT-IVa的开放阅读框和含在pCore-His表达载体中的区域。

图19显示由单个细胞克隆产生的红细胞生成素的等电点聚焦及Western分析结果。分别用2种产生红细胞生成素的菌株及其中导入有牛和人GnT-IVa基因的相同菌株，通过等电点聚焦和用抗红细胞生成素抗体的Western印迹对每种菌株分泌的红细胞生成素进行分析。在左侧，显示出PI标准的位置。

完成本发明的最佳方式

下面，将参照下面的实施例对本发明进行更为详细的描述。然而，本发明不限于这些实施例。

[参照实施例1]

(1)用于实施例中的试剂

除非特别说明，所用的试剂为由Wako Purechemical Industries公司生产的最高级别的产品。

(i)吡啶基胺化(Pyridylaminated)的寡糖

所用的每种吡啶基胺化的寡糖按下述获得。首先，根据Tokugawa等的方法[Biehuizen，M.F.，Mattei，M.G.和Fukuda，M.(1993)基因发育，7，468-478]从人转铁蛋白(apo型；Sigma，美国)中制备吡啶胺化的寡糖。以一种或几种下面的酶处理得到的材料：产脲节杆菌来源的唾液酸酶(Nacalai Tesque)，曲霉类来源的β-半乳糖苷酶(Toyobo)，刀豆来源的β-N-乙酰氨基己糖苷酶(Seikagaku公司)，CHO-K1细胞提取物(通过超声处理位于2体积5mM Tris-HCl缓冲液中的CHO-K1细胞而获得的上清，缓冲液pH 7.5，含有2mMMgCl₂和1mM PMSF)中的GnT-V活性部分，位于牛小肠匀浆物溶解部分中的GnT-V活性部分(对于制备方法，见实施例1中的“微粒体级分的制备”和“溶解”)。通过以上述的酶处于PA-糖链021和022(Takara Shuzo)制备部分的吡啶基胺化寡糖。在两种情况，使用前通过用ODS柱(10×250mm；Vydac，美国)的反相层析纯化制备的寡糖。

(ii)糖蛋白底物

将牛胎球蛋白(Sigma，美国)和CHO细胞来源的重组人红细胞生成素(Kirim Brewery)进行下面的预处理以将它们纯化成相对一致的糖形式(glycoform)。简言之，将40-100mg糖蛋白应用于以pH 7.4，含有1mM MgCl₂，1mM CaCl₂和0.15M NaCl的10mM Tris-HCl缓冲液平衡的ConA-Sepharose柱(5ml；发玛西亚，瑞典)以获得具有低双天线糖链含量作为非吸附部分的糖形式。之后，以含有1.0M α-甲基甘露糖苷(Nacalai Tesque)的上述缓冲液洗脱柱以获得吸收具有高双天线糖链含量糖形式的部分。这样，获得具有低双天线糖链含量的胎球蛋白和具有高双天线糖链含量的红细胞生成素。至于人转铁蛋白，没有必要纯化此糖蛋白因为几乎其所有的糖链均为双天线型。

将这样获得的胎球蛋白和人转铁蛋白于1ml pH 5.0，含有4mMMgCl₂的醋酸钠缓冲液中以1U的唾液酸酶和0或107U的β-半乳糖苷酶于37℃反应16小时以唾液酸(asialo)或脱唾液酸(asialo agalacto)的糖蛋白。具有高度双天线型糖链含量的红细胞生成素以与上述同样的方式与0.5U的唾液酸酶和5U的β-半乳糖苷酶反应以获得脱唾液酸脱乳糖的糖蛋白。

这样获得的每种糖蛋白以pH 7.3的50mM醋酸铵缓冲液透析。然后，用BSA(牛血清蛋白)作为标准以BCA蛋白分析仪(Pierce，美国)测定蛋白的量。此外，通过SDS-PAGE(十二烷基磺酸钠聚丙烯酰胺凝胶电泳)分析此蛋白。这样制备的糖蛋白用于实施例中。

(iii)RT-PCR(反转录-聚合酶链式反应)

对于RT-PCR，使用Acess RT-PCR系统(Promega，美国)。对于感兴趣基因片段的扩增，使用Pfu聚合酶(Stratagene，美国)。

(2)用于实施例中的设备

(i)基因测序

ABI PLISM 377DNA测序仪(Perkin-Elmer，美国)被使用。

[参考实施例2]GnT-IV活性的特异性分析

一般地，有2种用于分析GnT-IV活性的方法：测定放射性标记的GlcNAc向寡糖底物中转移的方法和通过HPLC等分级分析GlcNAc向标记的寡糖底物中转移的方法。Taniguchi等开发出一种用GnT-II产物型寡糖作为受体同时测定GnT-III、-IV和-V活性的方法[Nishikawa，A.，Fujii，S.，Sugiyama，T.和Taniguchi，N.(1988)生化年鉴，170，349-354]。然而，此分析方法本身不适于在GnT-IV纯化过程中的分析因为GnT-IV的相对活性大大低于GnT-III和-V的活性。

因此，本发明者通过增加受体吡啶基胺化寡糖至10倍于用于前面分析系统中的量而开发出用于定量选择性地测定GnT-IV活性的方法[Tokugawa，K.，Oguri，S.和Takeuchi，M.(1996)糖缀合物杂志，13，53-56]，这种寡糖可容易地制备。

在本发明的实施例中，GnT-IV活性按下述分析。

该酶在pH 7.3的125mM MOPS[3-(N-吗啉代)丙烷磺酸]缓冲液中于37℃反应4小时，MOPS缓冲液中含有0.8mM吡啶基胺化的寡糖底物(GnT-II产物型寡糖底物)，20mM UDP-GlcNAc，7.5mM MnCl₂，200mM GlcNAc，0.5％(w/v)Triton X-100，10％甘油和1％ BSA。然后，通过煮沸该溶液2分钟而终止反应。以0.45nm滤膜去除固体后，以ODS-80TM柱(4.6×150mm；TOSO)于50℃以pH 4.0含有0.15％(w/v)n-丁醇的50mM醋酸铵缓冲液以1.2ml/分钟的流速分析5μl的滤液。吡啶氨基的荧光用320nm的激发光和400nm的发射光加以检测。

[实施例1]酶的分离和纯化

(1)酶源的筛选

通过利用上述的分析方法搜索待纯化的GnT-IV酶的来源。如表1中所示，已发现牛小肠中GnT-IV对GnT-III和GnT-V的相对活性大大高于GnT-IV在任何其它组织中的相对活性。因此，选择牛小肠作为纯化的起始原料。

表1

GnT-IV酶源的搜索

酶源	比活性(pmol/h·mg-蛋白)
	比活性(pmol/h·mg-蛋白)			IV	III	V
	培养的细胞大鼠器官¹⁾人类¹⁾牛器官初乳	CHOBowesAH66¹⁾Solid AH¹⁾Yoshida sarcoma¹⁾小肠心脏胰脏肾脏脑肝脏小肠心脏胰脏	10.812.02.0271.3179.4201.93.72.825N.D.10.9N.D.	IV	III	V	0341634116702801110018406608.1174N.D.0.7N.D.	1097150308010968102130388.241N.D.10.9N.D.

N.D.：低于检测极限

¹⁾：数据来自Nishikawa，A.等，BBA 1035，313-318(1990)

(2)纯化

除非特别说明，否则所有操作均在4℃进行。

(i)微粒体级分的制备

将2千克牛小肠(获自肉类加工厂)切碎。然后，向其中加入4体积的提取缓冲液(10mM Tris-HCl缓冲液，pH 7.4，含0.25M蔗糖，1mM苯甲磺酰氟，1mM盐酸苯脒(benzamidine hydrochloride)，1mM二硫苏糖醇及10mg/ml抗蛋白酶)并从Polytron(Kinematica，瑞典)匀浆。得到的匀浆物以900×g离心10分钟。然后，进一步以105,000×g离心上清60分钟以得到微粒体沉淀级分(样品1)。

(ii)溶解

以3体积通过添加Triton-100至提取缓冲液而制备的溶解缓冲液悬浮样品1以得到1％的终浓度。通过以105,000×g离心60分钟而获得上清。再次悬浮沉淀并收集上清。合并第一及第二次提取物(样品2)。

(iii)Q-Sepharose FF层析

将样品2应用于Q-Sepharose FF柱(5×30cm；发玛西亚，瑞典)，该柱以20mM Tris-HCl，pH 7.4，含有1mM盐酸苯脒，0.1％Triton X-100和20％甘油的操作缓冲液1预平衡且然后以0-0.5MKCl的线性梯度洗脱(图6)(样品3)。

(iv)铜螯合物Sepharose FF层析

将样品3应用于以操作缓冲液2(通过向操作缓冲液1中加入KCl至0.15M而获得)预平衡的铜螯合物Sepharose FF层析柱(5×10cm；发玛西亚，瑞典)。然后以5体积的操作缓冲液2将没有被吸收的部分洗出。之后，以0.01M的甘氨酸线性梯度洗脱吸收的部分(图7)。合并得到的GnT-IV活性部分并以YM30超滤膜(Amicon，美国)浓缩(样品4)。

(v)UDP-己酸胺琼脂糖亲和层析I

将在加入1mM苯脒盐酸的操作缓冲液3中透析过的样品4的一半应用至以操作缓冲液3(20mM Tris-HCl，pH 8.0，含有0.15M KCl，10mM MnCl₂，0.05％ Triton X-100和20％甘油)预平衡的UDP-己酸胺琼脂糖亲和柱(1.2×4.5cm；Sigma，美国)中。然后，没有吸附的部分以操作缓冲液4(20mM Tris-HCl，pH 8.0，含有10mMMnCl₂，0.05％ Triton X-100和20％的甘油)洗出。之后，以其中加入有1M(终浓度)KCl的操作缓冲液4洗脱吸附产物(图8)。合并GnT-IV活性部分并在操作缓冲液5(与操作缓冲液4具有相同的级分但具有7.4的pH)中透析(样品5)。

(vi)UDP-己酸胺琼脂糖亲和层析II

将样品5应用于以操作缓冲液5预平衡的UDP-己酸胺琼脂糖亲和柱(1.0×6.5cm；Sigma，美国)。然后，以操作缓冲液5将未吸附的部分洗出。之后，以去除MnCl₂的操作缓冲液5洗脱吸附产物(图9)。合并得到的GnT-IV活性部分(样品6)。

(vii)Superdex 200凝胶层析

用小的Q-sepharose FF柱浓缩样品6并应用于以操作缓冲液6(通过向操作缓冲液5中添加KCl至0.15M的终浓度而获得)预平衡的Superdex 200HR5/5柱(1×30cm；发玛西亚，瑞典)。操作缓冲液6以0.25ml/分钟的流速应用于柱以获得GnT-IV活性部分(样品7)。

(viii)每个纯化步骤中蛋白的量、活性及特异性活性总结于表2中。最终样品较小肠匀浆物纯化224,000倍。

表2

GnT-IV的纯化

纯化步骤	蛋白量(mg)	总的酶活性(nmol/h)	比活性(nmol/h/mg)	产量(％)	纯化系数(-倍数)
纯化步骤	蛋白量(mg)	总的酶活性(nmol/h)	比活性(nmol/h/mg)	产量(％)	纯化系数(-倍数)	牛小肠匀浆物溶解的级分Q-Sepherose铜螯合物SepheroseUDP-己酸胺IUDP-己酸胺IISuperdex 200	112,90024,1004,0004500.590.0350.008	49,50014,5007,2003,6701,9501,420790	0.440.601.808.103,31040,60098,800	10029147.43.92.91.6	11.44.118.47,51092,200224,000

以2kg牛小肠开始。

(3)酶化学及蛋白化学特性

(i)纯度

在SDS-PAGE中样品7在分子量为60K处出现单一条带(图11)。当将样品7进行非变性-PAGE(native-PAGE)并将得到的带从凝胶中切除以测定GnT-IV活性时，此蛋白带的位置与活性位置相一致(图12)。此外，样品7中没有检测到任何GnT-I、-II、-III或-V活性。从这些结果，得出样品7为纯的GnT-IV。考虑到通过含Triton X-100凝胶过滤而测得该蛋白的表观分子为77K(图10)，认为GnT-IV不具有亚单位结构且以单体形式表达其活性。当样品7以肽N-糖苷酶F(宝灵曼，德国)处理时，在SDS-PAGE中观察到流动性的增加。因此，认为牛小肠的GnT-IV为具有至少Asn-连接酶链的糖蛋白。

(ii)反应特异性

当该酶与由下面化学式所代表的GnT-II产物型寡糖作为底物反应时：

在由HPLC分析的标准条件下，该酶产生单一的产物(吡啶基胺化的寡糖1)。

收集此产物，然后通过下面的方法测定其结构，包括(i)Smith降解加激光TOF-MS(时相质谱仪(time-of-flight massspectrometer)和(ii)¹H-NMR。因此，该酶的反应特异性得以检测。当根据Kobata和Takasaki方法[Kobata，A.和Takasaki，S.(1993)于《糖生物学》中“实践方法”(Fukuda，M.和Kobata，A.，编)165-185，IRL出版社，牛津，英国]将吡啶基胺化的寡糖1进行Smith降解时，由于第一次降解时其质量数由1599.0变为795.30且由于第二次降解进一步变为634.68。这与图13中所示的反应途径相一致。因此，得出此酶的反应产物具有下面的结构：

此外，当将吡啶基胺化的寡糖1进行¹H-NMR时，检到4.53ppm的峰值，其相应于显示下面通式中GlcNAc 7的无头质子；其偶联常数J1，2为7.9Hz(图14)。这些结果显示GlcNAc 7，如下面化学式中所示，GlcNAc 7通过β-型键附着到Man 4的位置4上，完全支持了上述结构。

(iii)最适pH

如图15所示，该酶的最适pH约为7.5。

(iv)二价阳离子的需求

如表3中所示，该酶可由加入EDTA(乙二胺四乙酸)而失活。二价阳离子对其活性是至关重要的。二价阳离子中，Mn²⁺显示出最大的效应，其次是Co²⁺和Mg²⁺。Ca²⁺和Fe²⁺有微弱的效应。如图16所示Mn²⁺的最适浓度约为10mM。

表3

GnT-IV的二价阳离子需求

添加物	活性(％)
添加物	活性(％)	无EDTAMnCl₂CoCl₂MgCl₂CaCl₂FeCl₂CuCl₂	5.6010074.872.57.29.80

通过加入每种金属离子(10mM)至去除金属离子的GnT-IV样品中而测定GnT-IV的活性。GnT-IV活性由表中的百分比表示，其中加入10mM MnCl₂的活性被看作是100％。

(v)糖核苷酸类的抑制

如表4中所示，UDP最为强烈地抑制该酶的活性。UDP-葡萄糖，UDP-GalNAc，2′-脱氧-UDP和UDP-己酸胺(Sigma，美国)的抑制效应以此顺序列于UDP的抑制效应之后。尿苷、UMP、TDP和CDP几乎没有显示出抑制效应。

表4

核苷酸对GnT-IV的抑制

添加物	活性(％)
添加物	活性(％)	无尿苷UMPUDPUTPTDPCDP2′-脱氧-UDPUDP-己酸胺UDP-葡萄糖UDP-半乳糖UDP-葡糖醛酸UDP-N-乙酰半乳糖胺	10011597.327.388.211011267.473.656.687.392.359.7

当在0.5mM UDP-GlcNAc存在时加入每种核苷酸(2mM)时的GnT-IV活性在表中以百分数表示，其中没有加入任何物质时的活性看作是100％。

(vi)底物特异性

如表5中所示，该酶最优选以GnT-V产物型寡糖(表中E)作为受体。其次，该酶优选GnT-II产物型寡糖(表5中D)。

当该酶对GnT-II型寡糖的反应性看作为100％时，它对核心型寡糖(表5中A)和GnT-I底物型寡糖(表5中C)分别表现出0％和54％的反应性。

该酶对GnT-II产物型寡糖的结构显示出46％的反应性，其中的岩藻糖通过α1→6键附着到GlcNAc的还原性末端(G有5中F)。

该酶对GnT-II产物型寡糖显示出0％的反应性，其中的GlcNAcα1→3甘露糖缺失(表5中B)。

该酶对GnT-II产物型寡糖的结构显示出16％的反应性，其中的半乳糖以β1→4键附着到GlcNAc的α1→6甘露糖上(表5中的G)，且对GnT-II产物型寡糖的结构显示出0％的反应性，其中的半乳糖通过β1→4键附着到GlcNAc的α1→3甘露糖上(表5中的H和I)。

该酶对GnT-II产物型寡糖的结构显示出0％的反应性，其中的GlcNAc以β1→4键附着到β1→4甘露糖上(表5中J)。

上述该酶的底物特异性与Schachter等所预言的GnT-IV底物特异性[Glesson，P.A.和Schachter，H.(1983)生物化学杂志，258，6162-6173]几乎一致。因此，很明显本发明的酶正是复合型糖链生物合成中长期缺失的环节(link)中的GnT-IV。

表5

(vii)动力学参数

在参照实施例2中所述分析条件下，该酶对GnT-II产物型寡糖的Km和Vmax值分别为0.73mM和3.23μm/分钟，对GnT-V产物型寡糖的这些值分别为0.13mM和1.75μM/分钟。对UDP-GlcNAc的Km值为0.22mM。

在获得的吡啶基胺化寡糖中，发现由下面化学式所代表的寡糖为新的寡糖：

和

(viii)对糖蛋白的作用

为了证明GnT-IV不仅能对寡糖底物而且能对糖蛋白中的寡糖链起作用，用UDP[¹⁴C]GlcNAc作为糖供体GnT-IV对脱唾液酸糖起反应。然后，通过SDS-PAGE和荧光自显影分析反应产物(图17中A版和B版)。如图17B版中的2道和5道所示，[¹⁴C]GlcNAc向脱唾液酸人转铁蛋白和脱唾液酸、CHO细胞来源的重组人红细胞生成素的转移。相反，在没有双天线糖链的脱唾液酸胎球蛋白中没有观察到[¹⁴C]GlcNAc的转移(图17，B版)。

通过此GnT-IV反应而获得的具有GnT-IV产物型糖链的人转铁蛋白(具有下面的化学式)为自然界中没有的新物质。

GnT-IV产物型糖链结构

[实施例2]肽作图分析

约1mg最终纯化的本发明酶根据Laemmli方法[Laemmli，英国，自然(1970)313，756-762]于0.1％ SDS-10％聚丙烯酰胺凝胶上电泳。将分离的蛋白电印迹至PVDF膜上。将固定于膜上的蛋白进行S-羧甲基化然后以赖氨酰内肽酶无色杆菌蛋白酶I(AP-I)(Wako纯化学工业公司)消化以获得AP-I-消化的片段混合物。AP-I-消化的PVDF膜进一步以Asp-N(Takara Shuzo)消化以获得Asp-N-消化的片段混合物。通过高液相层析分离肽段混合物中的每一片段并进行氨基酸序列分析。结果，获得显示于SEQ ID NOS：1-14中的序列。

[实施例3]牛GnT-IVa cDNA的分离和鉴定

(1)RT-PCR

根据在实施例2中获得的显示于SEQ ID NOS：7和11中的氨基酸序列，分别合成显示于SEQ ID NO：15中的寡聚体AP-5F和显示于SEQ ID NO：16中的寡聚体DN-9R。用从牛小肠组织中通过异硫氰酸胍方法提取的总RNA作为模板且用上述引物进行RT-PCR。结果，获得似乎特异性的约170bp的扩增片段。将该片段亚克隆。

(2)文库的筛选

用上述RT-PCR产物筛选牛小肠cDNA文库(Clontech，美国)以获得4个阳性噬菌斑。测定这些克隆的核苷酸序列。得到的序列含有许多编码一些实施例2中获得的部分氨基酸序列(SEQ ID NOS：1-14)的核苷酸序列，且也含有似乎为终止密码子的序列。用代表得到核苷酸序列最上游区域的150bp的片段，再次筛选该文库以获得两个阳性噬菌斑。测定这些克隆的核苷酸序列。然后，以150bp的最上游区域的探针进一步同样地筛选该文库，然而，没有获得新的克隆。

(3)5′RACE(cDNA末端的快速扩增)

随后，为了获得全长cDNA而进行5′RACE。用噬菌体筛选获得的最上游区域序列，进行第1次5′RACE。然而，没有能够发现起始密码子。然后，根据第一次5′RACE获得的序列，进行第二次5′RACE以获得含有起始密码子的序列。将该序列连接到以前获得的噬菌体克隆的部分基因序列上以获得含有完整开放阅读框的基因片段(基因1)。这样获得基因片段的核苷酸序列显示于SEQ ID NO：17中，且由其推测的氨基酸序列显示于SEQ ID NO：18中。已证实此DNA片段含有所有编码在实施例2中获得的部分氨基酸序列(SEQ ID NOS：1-14)的核苷酸序列。

[实施例4]用克隆的牛GnT-IVa基因对表达载体的构建和用于制备GnT-IVa酶的方法

(1)载体的构建

合成将XhoI位点导入基因1起始密码子上游区域的引物(SEQ IDNO：19)和将XbaI位点导入该基因终止密码子下游区域的另一种引物(SEQ ID NO：20)。然后，用此引物用PCR扩增编码GnT-IV酶的整个基因。以XhoI和XbaI消化获得的扩增片段，并插入pSVL载体(发玛西亚，瑞典)的XhoI和XbaI位点之间以制备质粒pBGT4。

(2)导入COS7细胞

质粒pBGT4通过电穿孔导入COS7细胞(RIKEN细胞库)。简言之，将10μg质粒加入到约含5×10⁶个细胞的0.8ml PBS(-)(Nissui药物公司)中。在室温下用基因脉冲仪(伯乐，美国)以25μF的容量应用1600伏以将该基因导入细胞。将得到的细胞转移至90mm实验室培养皿中并于5％ CO₂，37℃下培养于含10％胎牛血清的10ml Dulbecco′s修饰的Eagle′s培养基中(基本目录号.12430，美国生物技术公司)72小时。之后，回收细胞并悬浮于100μl缓冲液(5mM Tris-HCl，pH 7.5，2mM MgCl₂，1mM苯甲磺酰氟)中，然后超声处理并以2000×g离心5分钟。因此，获得细胞提取物。

(3)GnT-IV活性的分析

细胞提取物中GnT-IV的活性通过参照实施例2中所述的方法测定。结果显示于表6中。与其中导入pSVL载体作为对照的细胞提取物相比，其中导入质粒pBGT4的提取物每个细胞显示出44-78倍更高的GnT-IV活性。从这些结果，证实基因1编码GnT-IV酶。这样，GnT-IV酶可根据此方法通过培养的细胞制备。

表6

质粒	比活性(pmol/hr/mg蛋白)	活性比率
质粒	比活性(pmol/hr/mg蛋白)	活性比率	pSVLpBGT4(#1)pBGT4(#2)pBGT4(#3)	409296233177320182	1727844

反应时间：4小时

活性比率是相对于把pSVL的总活性看作1来表示的。

[实施例5]人类GnT-IVa cDNA的分离和鉴定

(1)RT-PCR

根据在实施例3中获得的牛GnT-IVa核苷酸序列，合成显示于SEQID NO：21中的引物h1-2F和显示于SEQ ID NO：22中的引物h1-1R。用人肝脏的总RNA(Clontech，美国)作为模板，以上述引物进行RT-PCR。结果，获得似乎为特异性的约650bp的扩增片段。将此片段亚克隆，并测定其核苷酸序列。

(2)文库的筛选

用上面RT-PCR获得的685bp DNA片段作为探针筛选人肝脏cDNA文库(Clontech，美国)。获得2个阳性噬菌斑hGT4/λgt10-1和hGT4/λgt10-2。测定这些噬菌体克隆中插入子的核苷酸序列。结果，hGT4/λgt10-1含有804bp的DNA区域且hGT4/λgt10-2含有2115bp的DNA区域。前者区域完全包括在后者区域内。如SEQ ID NO：23中所示，hGT4/λgt10-2中含有的DNA片段具有与牛GnT-IVa氨基酸序列高度同源的开放阅读框(ORF)(96％一致)。从实施例6中获得的结果，证实此ORF为人GnT-IVa基因。该ORF的氨基酸序列显示于SEQ ID NO：24中。

[实施例6]人GnT-IVa基因表达质粒的构建及制备人GnT-IVa酶的方法

(1)人GnT-IVa基因表达质粒pHGT4-1的构建

合成将XhoI位点导入人GnT-IVa基因起始密码子上游区域的引物(h1-7F；SEQ ID NO：25)和与该基因终止密码子下游区域互补的另一种引物(h1-7R；SEQ ID NO：26)。用人肝脏RNA(Clontech，美国)作为模板，用上述引物通过RT-PCR扩增编码人GnT-IVa酶的整个基因。将得到的扩增片段以与lacz基因转录相反的方向插入质粒pCRScript Amp SK(+)(Stratagene，DNA)的SrfI位点。用得到的质粒，通过核苷酸序列分析证实扩增的片段编码显示于SEQ IDNO：24中的氨基酸序列。此外，以XhoI和SacI消化此质粒以获得XhoI-SacI 1.7kb的片段。将此片段插入到pSVL载体(发玛西亚，瑞典)的XhoI和SacI位点之间以从人GnT-IVa基因制备表达质粒pHGT4-1。

(2)人GnT-IVa基因向COS7细胞的导入

通过电穿孔将质粒pHGT4-1导入COS7细胞。将得到的细胞于10％CO₂，37℃下培养72小时。然后，收获细胞，悬浮于100μl缓冲液(5mMTris-HCl，pH 7.5，2mM氯化镁，1mM苯甲磺酰氟)中，超声处理破碎，2000×g离心5分钟并收集上清以获得细胞提取物。

(3)人GnT-IVa基因在COS7细胞中的表达

通过参照实施例2中描述的方法测定细胞提取物中的GnT-IV活性。结果显示于表7中。与其中导入pSVL载体作为对照的细胞提取物相比，其中导入质粒pHGT4-1的细胞提取物每个细胞显示出21-28倍更高的GnT～IV活性。从这些结果，证实显示于SEQ ID NO：23中的GnT-IVa基因编码糖基转移酶GnT-IV。也证实人GnT-IVa酶可根据此方法通过培养的细胞制备。

表7

质粒	比活性(pmol/hr/mg蛋白)	活性比率
质粒	比活性(pmol/hr/mg蛋白)	活性比率	pSVLpHGT4-1(#1)pHGT4-1(#2)pHGT4-2(#1)pHGT4-2(#2)	10372895121788110248029	12821118

反应时间：1.3小时

活性比率以相对于把pSVL的总活性看成为1而表示的。

[实施例7]人GnT-IVb cDNA的分离和鉴定

(1)通过PCR、RT-PCR和5′RACE(cDNA末端的快速扩增)获得人GnT-IVa-样基因

在基因数据库GerBank中通过BLASTN搜索与实施例3中获得的人GnT-IVa基因核苷酸序列具有类似性的核苷酸序列。结果，发现了许可号R12057，H10557和W16571。然后，合成显示于SEQ ID NO：27中的引物h2-45F和显示于SEQ ID NO：28中的引物h2-43R，从而用人类cDNA文库中心的快速筛选(Quick Screen Human cDNALibrary Panel)(Clontech，美国)的人脑cDNA文库作为模板进行PCR。将扩增的片段亚克隆入pCRScript Amp SK(+)(Stratagene，美国)的SrfI位点并进行核苷酸序列分析。同时，合成显示于SEQ ID NO：29中的引物h2-2F和显示于SEQ ID NO：30中的引物h2-1R从而用人肺总RNA(Clontech，美国)作为模板进行RT-PCR。结果，得到约500bp预期大小的扩增片段。然后，将此片段亚克隆入pCRScriptAmp SK(+)(Stratagene，美国)的SrfI位点并进行核苷酸序列分析。

这样获得的2个DNA片段的核苷酸序列相互间形成1006bp区域的重叠。在该区域内，编码与牛和人GnT-IVa同源的氨基酸序列的开放阅读框被发现。因此，提示与GnT-IVa蛋白有关的蛋白的存在。

然后，在DNA数据库GenBank中通过BLASTN搜索可能是R12057上游序列或W16571下游序列的可能核苷酸序列。结果，发现R15554为R12057的上游序列，且W16466为W16571的下游序列。然而，在从这些核苷酸序列推导的ORFs中含有显然不适当的终止密码子。因此，为了证实该核苷酸序列，通过RT-PCR获得DNA片段。作为引物，合成显示于SEQ ID NO：31中的h2-1F，显示于SEQ ID NO：32中的h2-3F和显示于SEQ ID NO：33中的h2-8R。用实施例5中所述的h2-1F和h1-1R组合，或h2-3F和h2-8R组合，用人肝脏的总RNA(Clontech，美国)作为模板进行RT-PCR。检测到均与预期大小相一致的约550bp和约300bp的扩增片段。将这些片段中的每一个亚克隆入pCRScript Amp SK(+)中的SrfI位点中以分析其核苷酸序列。结果，证实这些片段分别与上述h2-45F和h2-1R之间1006bp的上游区域和下游区域重叠。在1361bp的连接区域内，发现编码与牛和人GnT-IVa蛋白氨基酸序列具有高度同源性的433个氨基酸蛋白的ORF。

然而，当此ORF与GnT-IVa蛋白的氨基酸序列比较时，认为起始的甲硫氨酸应存在于该ORF上游的区域。因此，上游区域用人肺5′-RACE-即用(Ready)cDNA(Clortech，美国)通过5′-RACE获得。在第一次PCR中，锚定引物和显示于SEQ ID NO：34中的h2-5R用作引物。在第二次PCR中，锚定引物和显示于SEQ ID NO：35中的h2-3R用作引物。纯化由5′-RACE获得的片段，用EcoRI和PstI消化，且然后通过琼脂糖凝胶电泳分离。从凝胶中回收约450bp的片段。将该片段插入pUC18载体(发玛西亚，瑞典)的EcoRI和PstI位点之间以分析其核苷酸序列。结果，证实此片段与h2-1F和h2-8R之间区域的上游区重叠。在1758bp的连接区域内，证实了一个编码与牛和人GnT-IVa蛋白氨基酸序列具有高度类似性的548个氨基酸蛋白的ORF。该ORF的核苷酸序列显示于SEQ ID NO：36中，且其氨基酸序列显示于SEQ ID NO：37中。从下面实施例8中描述的结果，证实该基因为人GnT-IVb基因。

[实施例8]人GnT-IVb基因表达质粒的构建和制备人GnT-IVb酶的方法

(1)人GnT-IVb基因表达质粒pHGT4-2的构建

合成将XhoI位点导入人GnT-IVb基因起始密码子上游区域的引物(h2-4：SEQ ID NO：38)，和将XbaI位点导入上述基因终止密码子下游区域的另一种引物(h2-10R：SEQ ID NO：39)。用这些引物，以人肺RNA(Clontech，美国)作为模板通过RT-PCR扩增编码人GnT-IVb酶的整个ORF。将扩增的片段插入质粒pCRScript AmpSK(+)的SrfI位点中，然后测定其核苷酸序列。结果，证实扩增的片段编码SEQ ID NO：37的氨基酸序列。此外，将该质粒以XhoI和XbaI消化以获得XhoI-XbaI 1.7kb的片段。将该片段插入pSVL载体(发玛西亚，瑞典)的XhoI与XbaI之间的位点以构建用于人GnT-IVb基因的表达质粒。

(2)人GnT-IVb基因向COS7细胞中的导入

通过电穿孔将质粒pHGT4-2导入COS7细胞。得到的细胞于10％CO₂，37℃下培养72小时。然后，回收细胞，悬浮于100μl缓冲液(5mMTris-HCl，pH 7.5，2mM氯化镁，1mM苯甲磺酰氟)，超声处理破碎，2000×g离心5分钟且收集上清以获得细胞提取物。

(3)人GnT-IVb基因在COS7细胞中的表达

通过参照实施例2中所述的方法测定细胞提取物中的GnT-IV活性。结果显示于上面的表7中。与其中导入pSVL载体作为对照的细胞提取物相比，其中导入质粒pHGT4-2的细胞提取物每个细胞显示出8-11倍更高的GnT-IV活性。从这些结果，证实显示于SEQ ID NO：36中的GnT-IVb基因编码糖基转移酶GnT-IV。同时也证实人GnT-IVb酶可根据此方法由培养的细胞制备。

[实施例9]牛GnT-IVa N-末端缺失突变体表达质粒的构建及其表达

(1)牛GnT-IVa表达质粒pSigIle 93、pSigPro 113和pSigPro 142表达质粒的构建

合成将XhoI位点导入人红细胞生成素信号序列(GenBank登记号X02157)上游区域的引物(XhoEsig：SEQ ID NO：40)和将上述信号序列的C-末端连接至牛跨越位置93(Ile)至末端GnT-IVa氨基酸序列的部分的反义引物(E4-1R：SEQ ID NO：41)，从而通过PCR扩增人红细胞生成素的信号序列。同时，合成相应于上述反义引物的有义引物(E4-1F：SEQ ID NO：42)和将XbaI位点导入牛GnT-IVa终止密码子下游区域的XbaI位点的引物(4EXPR：SEQ IDNO：20)以通过PCR扩增牛GnT-IVa基因的部分序列。用得到的2种PCR产物的部分作为混合模板，以引物XhoEsig和4EXPR进行PCR。扩增的片段以XhoI和XbaI消化并插入到pSVL载体(发玛西亚，瑞典)的XhoI和XbaI位点之间以构建质粒pSigIle 93，其表达其中的人红细胞生成素信号序列连接到牛跨越位置93至末端GnT-IVa氨基酸序列部分的氨基酸序列。用E4-2R引物(SEQ ID NO：43)或E4-3R引物(SEQ ID NO：44)代替E4-1R引物；且以E4-2F引物(SEQ IDNO：45)或E4-3F引物(SEQ ID NO：46)代替E4-1F引物，用与上述相同的方式分别构建表达其中的人红细胞生成素信号序列连接到牛跨越位置113(Pro)至末端GnT-IVa氨基酸序列部分的氨基酸序列的质粒pSigPro 113；或其中的人红细胞生成素信号序列连接到牛跨越位置142(Pro)至末端GnT-IVa氨基酸序列部分的氨基酸序列的质粒pSigPro 142。

(2)表达牛GnT-IVa N-末端缺失突变体的质粒向COS7细胞中的导入

通过电穿孔将质粒pSigIle 93、pSigPro 113或pSigPro 142导入COS7细胞。得到的细胞于10％ CO₂，37℃下培养72小时。然后，分别回收细胞和培养上清。将细胞悬浮于100μl缓冲液(5mM Tris-HCl，pH 7.5，2mM氯化镁，1mM苯甲磺酰氟)，超声处理打碎且2000×g离心5分钟以获得细胞提取物。以Centriplus 30(Amicon)将培养上清浓缩至约100μl。

(3)牛GnT-IVa N-末端缺失突变体在COS7细胞中的表达

培养上清与细胞提取物中GnT-IV活性通过参照实施例2中所述方法加以测定。结果显示于表8中。与其中导入有pBGT4载体作为阳性对照的细胞总活性(即，细胞中活性+上清中活性)相比，其中导入有pSigIle 93的细胞总活性大于30％。此外，三分之一的活性分泌至培养上清中。从这些结果，发现牛GnT-IVa N-末端至位置92的氨基酸序列可被缺失而维持酶活性。同时也显示GnT-IVa酶可用适当的分泌信号分泌表达。

表8

质粒	级分	活性(pmol/hr)	每个级分的活性比率(％)	总活性比率(％)
质粒	级分	活性(pmol/hr)	每个级分的活性比率(％)	总活性比率(％)	pSVLpSVLpBGT4pBGT4pSigIle 93pSigIle 93pSigPro 113pSigPro 113pSigPro 142pSigPro 142	上清细胞上清细胞上清细胞上清细胞上清细胞	1363847222615231065471312606219381	0.51.42.797.311.620.41.22.30.81.4	1.9100.031.93.42.2

反应时间：2.5小时

活性比率以相对于pBGT4总活性的百分数表示，pBGT4总活性看成为100％。

[实施例10]牛GnT-IVa C-末端缺失突变体表达质粒的构建及其表达

(1)牛GnT-IVa表达质粒pCGly 499、pCPro 465、pCLys 432和pCPro 383的构建

合成将XhoI位点导入牛GnT-IVa基因起始密码子上游区域的引物(SEQ ID NO：19)和连接位置499Gly密码子之后终止密码子并将XbaI位点导入上述终止密码子下游区域的引物(CGly 499：SEQ IDNO：47)以通过PCR扩增牛GnT-IVa基因的部分序列。扩增的片段以XhoI和XbaI消化，并插入到pSVL载体(发玛西亚，瑞典)的XhoI和XbaI位点之间。这样，构建出表达牛GnT-IVa氨基酸序列至位置499(甘氨酸)的质粒pCGly 499。用CPro 465引物(SEQ ID NO：48)，CLys 432引物(SEQ ID NO：49)或CPro 383引物(SEQ ID NO：50)代替CGly 499引物，以相同的方式构建三个其它的质粒。它们分别命名为pCPro 465(表达牛GnT-IVa氨基酸序列至位置465(脯氨酸)的质粒)；pCLys 432(表达牛GnT-IVa氨基酸序列至位置432(赖氨酸)的质粒)；和pCPro 383(表达牛GnT-IVa氨基酸序列至位置383(脯氨酸)的质粒)。

(2)表达牛GnT-IVa C-末端缺失突变体的质粒向COS7细胞中的导入

通过电穿孔将质粒pCGly 499，pCPro 465，pCLys 432p或pCPro383导入COS7细胞。得到的细胞于10％ CO₂，37℃下培养72小时。然后，回收细胞并悬浮于100μl缓冲液(5mM Tris-HCl，pH 7.5，2mM氯化镁，1mM苯甲磺酰氟)中，超声处理破碎且以2000×g离心5分钟以获得细胞提取物。

(3)牛GnT-IVa C-末端缺失突变体在COS7细胞中的表达

细胞提取物中GnT-IV的活性用参照实施例2中所述的方法测定。结果显示于表9中。与其中导入有pBGT4载体作为阳性对照的细胞提取物的GnT-IV活性相比，其中导入有pCGly 499、pCPro 465、pCLys432或pCPro 383的细胞提取物活性分别为每个细胞15.2％、12.1％、2.8％或104.2％。从这些结果，显示即使牛GnT-IVa氨基酸序列的位置384至C-末端的氨基酸被缺失，GnT-IV活性仍被维持。

表9

质粒	比活性(pmol/hr/mg蛋白)	活性比率(％)
质粒	比活性(pmol/hr/mg蛋白)	活性比率(％)	pSVLpBGT4pCGly 499pCPro 465pCLys 432pCPro 383	77149172263179841015551	110015123104

反应时间：2小时

活性比率以相对于pBGT4总活性的百分数表示，pBGT4的总活性看成为100％。

[实施例11]大肠杆菌中表达各种GnT-IV基因质粒的构建及其表达

(1)牛GnT-IVa大肠杆菌表达质粒的构建

合成将BspHI位点导入牛GnT-IVa基因起始密码子上游区域的引物(BSP-N：SEQ ID NO：51)和将HindIII位点导入终止密码子下游区域的另一种引物(C-Hd：SEQ ID NO：52)以通过PCR扩增牛GnT-IVa基因的整个开放阅读框。扩增的片段以BspHI和HindIII消化，并导入pTrc99A载体(发玛西亚，瑞典)的NcoI和HindIII位点之间以构建质粒pEBGT4。用BSP-sN引物(SEQ ID NO：53)替代BSP-N引物及C-Hd引物，以类似的方式构建质粒pEIle 93。此外，用BSP-N引物，可将His-Tag、终止密码子和HindIII位点导入牛GnT-IVa基因C-末端下游区域的引物(CH-Hd：SEQ ID NO：54)和具有His-Tag、终止密码子和HindIII位点的引物(H-Hd：SEQ ID NO：55)扩增编码其中的His-Tag被添加至C-末端开放阅读框的基因，从而以同类似的方式构建质粒pEBGT4+His。

(2)人GnT-IVa基因和人GnT-IVb基因大肠杆菌表达质粒的构建

合成可在人GnT-IVa氨基酸序列位置94(Leu)上游区导入起始密码子和Ile密码子并在其进一步上游区也可导入BspHI位点的引物(4aBSPIL 94：SEQ ID NO：56)；在C-末端氨基酸下游区导入His-Tag、终止密码子和HindIII位点的引物(4aCH-Hd：SEQ ID NO：57)；和H-Hd引物以扩增部分的人GnT-IVa氨基酸序列的基因片段，其中被添加上编码His-Tag的序列。扩增的片段以BspHI和HindIII消化，并插入到pTrc99A载体(发玛西亚，瑞典)的NcoI和HindIII位点之间以构建质粒pMA4a+His。此外，用CP383H-Hd引物(SEQ IDNO：58)代替4aCH-Hd引物，以类似的方式构建质粒pCore+His。用将BspHI位点导入人GnT-IVb基因起始密码子上游区的引物(4bBSP-N：SEQ ID NO：59)和4bSACR引物(SEQ ID NO：60)扩增人GnT-IVb基因片段，以BspHI和SacI消化，且然后插入到pTrc99A载体(发玛西亚，瑞典)的NcoI和SacI位点之间。得到质粒的SacI和HindIII位点之间，用4bSACF引物(SEQ ID NO：61)、在人GnT-IVb氨基酸序列的C-末端导入His-Tag的引物(4bCH-Hd：SEQ ID NO：62)和H-Hd引物，扩增部分长度的人GnT-IVb基因，并以SacI和HindIII消化，然后插入以得到质粒pEHGT4-2+His。此外，用将NcoI位点和起始密码子导入人GnT-IVb氨基酸序列位置91(Gly)上游区的引物(4bNCOG91：SEQ ID NO：63)、4bCH-Hd引物和H-Hd引物扩增人GnT-IVb基因的部分序列，以NcoI和HindIII消化，且然后插入到pTrc99A载体(发玛西亚，瑞典)的NcoI和HindIII位点之间以构建质粒pMA4b+His。

(3)每种表达质粒向大肠杆菌BL21菌株中的导入

将每种质粒导入到通过钙方法而制备的大肠杆菌BL21菌株感受态细胞中。将得到的细胞培养于含100μg/ml氨苄青霉素的LB琼脂平板上。得到的以每种质粒转化的大肠杆菌菌落接种至LB液体培养基并于37℃振荡培养过夜。然后，将培养物接种至新鲜LB液体培养基以得到2％的浓度。当培养液混浊度(OD 595nm)约为0.1至0.2时向其中加入IPTG(异丙基b-D-硫代半乳糖吡喃糖苷)至1mm的终浓度。细胞于37℃培养2小时或于25℃培养4小时。然后，收获500μl的细胞。将细胞沉淀物悬浮于50μl缓冲液(5mM Tris-HCl，pH 7.5，2mM MgCl₂，1mM苯甲磺酰氟)，超声处理打碎且以2000×g离心5分钟以获得作为上清的细胞提取物。

(4)大肠杆菌BL21菌株中每种表达质粒的表达

细胞提取物中GnT-IV活性通过参照实施例2中所述的方法测定。表10显示了牛基因的表达结果。虽然其中导入有pTrc99A载体作为对照的大肠杆菌细胞提取物几乎没有GnT-IV活性，但其中导入有pEBGT4的大肠杆菌细胞提取物具有一定的GnT-IV活性。从这些结果，证明GnT-IV酶可通过大肠杆菌制备。添加到牛GnT-IVa C-末端的His-Tag序列没有强烈地影响GnT-IV活性。因此，显示适当的tag序列可添加至GnT-IV酶上。其中的N-末端92个氨基酸被缺失的突变体显示出更强的GnT-IV活性。也显示在动物细胞中证实的GnT-IV酶变异体的表达在大肠杆菌中是可能的。

表10

质粒	活性(pmol/hr/mg蛋白)	活性比率(％)
质粒	活性(pmol/hr/mg蛋白)	活性比率(％)	pTrc99ApEBGT4pEBGT4+HispEIle93	0461130905841	010067127

反应时间：3.0小时

添加IPTG后，细胞于37℃培养2小时。

活性比率以相对于pEBGT4总活性的百分数表示，pEBGT4总活性看成为100％。

表11显示了人基因的表达结果。与其中导入有pTrc99A载体作为对照的大肠杆菌细胞提取物相比，其中导入有任何一种表达质粒的大肠杆菌细胞提取物具有显著的GnT-IV活性。如在牛GnT-IVa酶中所示，在人GnT-IVa和GnT-IVb酶中缺失N-末端序列而维持活性也是可能的。此外，既具有N-末端缺失又具有C-末端缺失的人GnT-IVa酶显示出高的GnT-IV活性(pCore+His)。这显示在这个突变体中的这些部分对GnT-IV活性不是必需的。

表11

质粒	活性(pmol/hr/mg蛋白)	活性比率(％)
质粒	活性(pmol/hr/mg蛋白)	活性比率(％)	pTrc99ApEBGT4+HispMA4a+HispCore+HispEHGT4-2+HispMA4b+His	0213903359397662702812	06371001184884

反应时间：4.0小时

加入IPTG后，细胞于25℃培养4小时。

活性比率以相对于pMA4a+His总活性的百分数表示，pMA4a+His总活性看成为100％。

[实施例12]通过将牛或人GnT-IVa基因导入产生-EPO的CHO细胞中而使重组人红细胞生成素(EPO)向糖链分支结构转换

(1)GnT-IVa表达质粒向产生-EPO CHO细胞中的导入

根据日本审查的专利公开No.2-17156中所述的方法构建产生-EPO的CHO细胞克隆。通过电穿孔将GnT-IVa表达质粒pBGT4或pHGT4-1导入得到的细胞克隆MO1和H-5。导入过程中，15μg表达质粒和1.5μg抗药标记质粒(来自Kaken Pharmaceutical的pSV2bsr或来自Clontech的pMAMneo)用于混合物中。电穿孔的细胞于10％CO₂，37℃下培养约60小时。然后，向培养基中加入杀稻瘟素S(KakenPharmaceuticals)(终浓度：10μg/ml)或遗传霉素(生物技术公司)(终浓度：500μg/ml)，细胞再培养10天至2周。这样，分离出抗这两种药物中任何一种的克隆。

(2)导入的GnT-IVa基因在产生-EPO的CHO细胞克隆中表达的验证

将产生-EPO的CHO细胞克隆(起始克隆)和单个药物抗性克隆培养于适当的规模。纯化每个克隆的总RNA。然后，用GnT-IVa基因的部分作为探针进行RNA点印迹分析以检测GnT-IVa mRNA的量。此外，在起始克隆中表达的GnT-IV活性和抗药克隆通过参照实施例2中所述的分析方法加以测定。筛选那些在RNA点印迹分析中产生强烈信号且较起始克隆显示出更高GnT-IV活性的克隆并用于EPO生产。筛选出的克隆具有增加的GnT-IV活性；例如，MO1(牛GnT-IVa)#36较MO1克隆显示出约104倍的增加，且H-5(人GnT-IVa)#23较H-5克隆显示出约125倍的增加。

(3)用导入GnT-IVa基因的产生-EPO的CHO细胞克隆生产EPO

EPO分泌表达至培养液中。然后，将产生-EPO的CHO细胞克隆MO1和H-5，和上述的克隆MO1(牛GnT-IVa)#36和H-5(人GnT-IVa)#23培养于滚瓶中。首先，将每种克隆贴壁培养于培养基中，且然后将1.5×107个细胞转入含200ml培养基的滚瓶中。细胞于10％ CO₂，37℃下培养3天从而使它们一致地附着到瓶上。之后，倒去培养基，并以PBS缓冲液洗细胞。然后，将200ml无血清培养基加入到瓶中，其中的细胞于10％ CO₂，37℃下培养7天。之后，回收培养上清。作为培养基，使用了D-MEM/F12混合培养基，其中补充以5％胎牛血清，290mg/升L-谷氨酸，1×MEM非必需氨基酸溶液和100nM的氨甲蝶呤。作为无血清的培养基，使用了没有胎牛血清的上述培养基。每种无血清培养上清中含有的EPO用抗-人EPO抗体通过ELISA加以定量。

(4)根据其糖链结构对导入GnT-IVa基因或没有导入该基因的克隆产生EPOs的分析

在等电聚焦凝胶中重组EPO没有作为单个分子存在；它是带各种电荷分子的混合物。由于蛋白的部分没有变化，故显示这些分子中的电荷差异是基于糖链结构的不同；这种分子混合物称为糖形式(glycoforms)[Watson，E.和Yao，F.，生化年鉴(1993)，210，389-93]。EPO具有3个Asn-连接的糖链；单个糖链的分支结构从双天线型至四天线型而变化。Gal(半乳糖)进一步附着到每种分支GlcNAc的末端，且唾液酸进一步附着到此Gal上。因此，如果糖链分支程度通过导入GnT-IVa基因而增加。附着到Gal上的唾液酸分子数目增加，且因此，具有低等电点的糖形式含量将增加。然后，本发明者通过等电点聚焦分析以检测导入GnT-IVa基因的产生-EPO的细胞产生的EPO糖链结构的变化。

对于等电聚焦，使用了发玛西亚生产的Multiphor II设备。凝胶由5％丙烯酰胺(30∶0.8)和1.5％ Pharmelyte 2.5-5(发玛西亚)所组成。作为(+)极溶液，使用了0.1M的硫酸。作为(-)极溶液，使用了0.2M的L-组氨酸。等电点聚焦后，将样品电泳转移至PVDF膜上，然后用抗-EPO小鼠单克隆抗体的Western印迹以检测单个EPOs糖形式的条带。简言之，如果必要，每种细胞克隆的无血清培养上清以Centriplus30和Microcon 30(均由Amicon生产)浓缩至约7-100倍。开始时，约50-100IU的EPO用作样品，但适当地调整此样品量从而使由Western印迹分析检测到的条带密度在样品间几乎相等。

当来自MO1克隆的EPO与来自MO1(牛GnT-IVa)#36克隆的EPO比较时，证实了后者主要糖形式的位置表现出向至少一个糖形式低pI一侧(+电极溶液一侧)的迁移(图19)。从这些结果，认为由于基因导入而表达的GnT-IVa酶增加了附着到EPO Asn-连接糖链中GlcNAc分支的数目，因而增加了附着唾液酸分子的数目从而增加了具有低等电点糖形式的含量。对H-5克隆和H-5(人GnT-IVa)#23克隆进行了类似的分析。结果，也发现在后者中主要EPO糖形式的位置迁移至低pI一侧(图19)。

从上述，证实修饰通过导入GnT-IVa基因至任何细胞而制备蛋白的Asn-连接糖链结构是可能的。

工业应用性

根据本发明，提供了新的β1→4N-乙酰-葡糖胺基转移酶(GnT-IV)、用于制备GnT-IV酶的方法和编码GnT-IV的基因。有了本发明的GnT-IV，制备用传统的糖基转移酶不能形成的具有分支结构的糖缀合物变为可能。因此，本发明的GnT-IV不仅对制备或改善糖缀合物型药物、试剂和食物是有用的，而且对修饰任何生物高分子的糖链结构也是有用的。

本发明的GnT-IV基因对于诊断或治疗疾病如癌症和修饰微生物产生的糖缀合物产物糖链结构也是有用的。

此外，产生的抗作为抗原的本发明GnT-IV蛋白的抗体或抗血清，或作为探针的本发明GnT-IV基因的部分或全长对微生物、培养细胞、各种动物组织、血细胞及血液的特征描述或诊断患病细胞或组织如癌症是有用的。

序列表

SEQ ID NO：1

序列长度：8

序列类型：氨基酸

拓扑学：线性

分子类型：肽

序列描述

Asp Asn Leu Tyr Pro Glu Glu Lys

5

SEQ ID NO：2

序列长度：11

序列类型：氨基酸

拓扑学：线性

分子类型：肽

序列描述

Asp Tyr Val Asn Gly Val Val Ala Asn Glu Lys

5 10

SEQ ID NO：3

序列长度：21

序列类型：氨基酸

拓扑学：线性

分子类型：肽

序列描述

Glu Ile Ser Ser Gly Leu Val Glu Ile Ile Ser Pro Pro Glu Ser Tyr

5 10 15

Tyr Pro Asp Leu Thr

20

SEQ ID NO：4

序列长度：8

序列类型：氨基酸

拓扑学：线性

分子类型：肽

序列描述

Glu Arg Val Arg Trp Arg Thr Lys

5

SEQ ID NO：5

序列长度：15

序列类型：氨基酸

拓扑学：线性

分子类型：肽

序列描述

Lys Gln Asn Leu Asp Tyr Cys Phe Leu Met Met Tyr Ala Gln Glu

5 10 15

SEQ ID NO：6

序列长度：6

序列类型：氨基酸

拓扑学：线性

分子类型：肽

序列描述

Asp His Ile Leu Trp Val

5

SEQ ID NO：7

序列长度：14

序列类型：氨基酸

拓扑学：线性

分子类型：肽

序列描述

Lys Ile His Val Asn Pro Pro Ala Glu Val Ser Thr Ser Leu

5 10

SEQ ID NO：8

序列长度：10

序列类型：氨基酸

拓扑学：线性

分子类型：肽

序列描述

Lys Val Tyr Gln Gly His Thr Leu Glu Lys

5 10

SEQ ID NO：9

序列长度：10

序列类型：氨基酸

拓扑学：线性

分子类型：肽

序列描述

Asp Phe Phe Trp Ala Ile Thr Pro Val Ala

5 10

SEQ ID NO：10

序列长度：6

序列类型：氨基酸

拓扑学：线性

分子类型：肽

序列描述

Asp Tyr Ile Leu Phe Lys

5

SEQ ID NO：11

序列长度：15

序列类型：氨基酸

拓扑学：线性

分子类型：肽

序列描述

Asp Lys Pro Val Asn Val Glu Ser Tyr Leu Phe His Ser Gly Asn

5 10

SEQ ID NO：12

序列长度：10

序列类型：氨基酸

拓扑学：线性

分子类型：肽

序列描述

Asp Ile Leu Leu X Thr Thr Val Glu Val

5 10

SEQ ID NO：13

序列长度：9

序列类型：氨基酸

拓扑学：线性

分子类型：肽

序列描述

Lys Ser Glu Gly Leu Asp Ile Ser Lys

5

SEQ ID NO：14

序列长度：8

序列类型：氨基酸

拓扑学：线性

分子类型：肽

序列描述

Asp Gly Tyr Phe Arg Ile Gly Lys

5

SEQ ID NO：15

序列长度：29

序列类型：核酸

链型：单链

拓扑学：线性

分子类型：合成DNA

序列描述

AAR ATY CAY GTB AAY CCH CCH GCN GAR GT 29

Lys Ile His Val Asn Pro Pro Ala Glu Val

SEQ ID NO：16

序列长度：35

序列类型：核酸

链型：单链

拓扑学：线性

分子类型：合成DNA

反义：是

序列描述

TG RAA VAR RTA RSW YTC VAC RTT VAC DGG YTT RTC 35

His Phe Leu Tyr Ser Glu Val Asn Val Pro Lys Asp

SEQ ID NO：17

序列长度：2246

序列类型：核酸

链型：双链

拓扑学：线性

分子类型：cDNA

序列描述

GGCGGCTGCT CGGTGGCGGC TCGTCGGCGG CCGCGGCAGG ACTGGCAGCG CCGGCGGCGG 60

GGAGAAAGAA GCATCCACCT ATGAAGACCG TGCAGACAGT CCTGAATAAT AATTGTGAAT 120

GGTGTGGCTG CCAGACTAGT TCTGCTGAGC ATCTGAAATG AACCTCTCCT ATTGATTGTT 180

TCAGTTGGCC CCGAGCCAGG AGTACTGGGT TTGCTTGACT TCAGGATAAA AAGAAACGGA 240

CTTGGTTATC ATCGTAAACA TATGAACCAG TGTGATGGTG AAATGAG ATG AGG CTC 296

Met Arg Leu

1

CGA AAT GGA ACT GTA GCC ACT GTT TTA GCA TTT ATC ACC TCG TTC CTC 344

Arg Asn Gly Thr Val Ala Thr Val Leu Ala Phe Ile Thr Ser Phe Leu

5 10 15

ACT TTA TCT TGG TAT ACA ACA TGG CAA AAT GGG AAA GAA AAA GTG ATT 392

Thr Leu Ser Trp Tyr Thr Thr Trp Gln Asn Gly Lys Glu Lys Val Ile

20 25 30 35

GCT TAT CAA CGA GAA TTT CTT GCT CTG AAA GAA CGT CTC CGA ATA GCT 440

Ala Tyr Gln Arg Glu Phe Leu Ala Leu Lys Glu Arg Leu Arg Ile Ala

40 45 50

GAA CAT CGA ATC TCT CAG CGC TCT TCT GAG CTC AGT GCC ATT GTA CAG 488

Glu His Arg Ile Ser Gln Arg Ser Ser Glu Leu Ser Ala Ile Val Gln

55 60 65

CAA TTC AAG CGT GTA GAA GCA GAA ACA AAC AGG AGT AAG GAT CCA GTG 536

Gln Phe Lys Arg Val Glu Ala Glu Thr Asn Arg Ser Lys Asp Pro Val

70 75 80

AAT AAA TTT TCA GAT GAT ACC CTA AAG ATA CTA AAG GAG TTA ACA AGC 584

Asn Lys Phe Ser Asp Asp Thr Leu Lys Ile Leu Lys Glu Leu Thr Ser

85 90 95

AAA AAG TCT CTT CAA GTG CCA AGT ATT TAT TAT CAT TTG CCT CAT TTA 632

Lys Lys Ser Leu Gln Val Pro Ser Ile Tyr Tyr His Leu Pro His Leu

100 105 110 115

TTG CAA AAT GAA GGA AGC CTT CAA CCT GCC GTG CAG ATC GGA AAT GGA 680

Leu Gln Asn Glu Gly Ser Leu Gln Pro Ala Val Gln Ile Gly Asn Gly

120 125 130

CGA ACA GGA GTT TCA ATA GTA ATG GGA ATT CCT ACA GTG AAG AGA GAA 728

Arg Thr Gly Val Ser Ile Val Met Gly Ile Pro Thr Val Lys Arg Glu

135 140 145

GTT AAA TCT TAC CTC ATA GAA ACT CTT CAT TCC CTT ATT GAT AAT CTG 776

Val Lys Ser Tyr Leu Ile Glu Thr Leu His Ser Leu Ile Asp Asn Leu

150 155 160

TAT CCT GAA GAG AAG TTG GAC TGT GTT ATA GTA GTC TTC ATA GGA GAG 824

Tyr Pro Glu Glu Lys Leu Asp Cys Val Ile Val Val Phe Ile Gly Glu

165 170 175

ACA GAT ACT GAT TAT GTA AAT GGT GTT GTA GCC AAC CTG GAG AAA GAA 872

Thr Asp Thr Asp Tyr Val Asn Gly Val Val Ala Asn Leu Glu Lys Glu

180 185 190 195

TTT TCT AAA GAA ATC AGT TCT GGC TTG GTG GAA ATA ATA TCA CCT CCT 920

Phe Ser Lys Glu Ile Ser Ser Gly Leu Val Glu Ile Ile Ser Pro Pro

200 205 210

GAA AGC TAT TAT CCT GAC CTG ACG AAC TTA AAG GAG ACA TTT GGA GAT 968

Glu Ser Tyr Tyr Pro Asp Leu Thr Asn Leu Lys Glu Thr Phe Gly Asp

215 220 225

TCT AAA GAA AGA GTA AGA TGG AGA ACA AAG CAA AAC CTA GAT TAT TGT 1016

Ser Lys Glu Arg Val Arg Trp Arg Thr Lys Gln Asn Leu Asp Tyr Cys

230 235 240

TTT CTA ATG ATG TAT GCT CAG GAA AAA GGC ACA TAC TAC ATC CAG CTT 1064

Phe Leu Met Met Tyr Ala Gln Glu Lys Gly Thr Tyr Tyr Ile Gln Leu

245 250 255

GAA GAT GAT ATT ATT GTC AAA CAG AAT TAC TTT AAC ACC ATA AAG AAT 1112

Glu Asp Asp Ile Ile Val Lys Gln Asn Tyr Phe Asn Thr Ile Lys Asn

260 265 270 275

TTT GCA CTT CAA CTT TCT TCT GAG GAA TGG ATG ATA CTT GAG TTC TCC 1160

Phe Ala Leu Gln Leu Ser Ser Glu Glu Trp Met Ile Leu Glu Phe Ser

280 285 290

CAG CTG GGA TTC ATT GGT AAA ATG TTT CAA GCA CCT GAC CCA CTC CTG 1208

Gln Leu Gly Phe Ile Gly Lys Met Phe Gln Ala Pro Asp Leu Thr Leu

295 300 305

ATT GTG GAA TTC ATA TTT ATG TTC TAT AAG GAG AAG CCC ATC GAC TGG 1256

Ile Val Glu Phe Ile Phe Met Phe Tyr Lys Glu Lys Pro Ile Asp Trp

310 315 320

CTC TTG GAC CAT ATT CTG TGG GTC AAA GTC TGC AAC CCG GAA AAA GAT 1304

Leu Leu Asp His Ile Leu Trp Val Lys Val Cys Asn Pro Glu Lys Asp

325 330 335

GCA AAA CAC TGT GAT CGA CAG AAG GCA AAT CTG CGA ATT CGT TTC AGA 1352

Ala Lys His Cys Asp Arg Gln Lys Ala Asn Leu Arg Ile Arg Phe Arg

340 345 350 355

CCG TCC CTT TTC CAA CAC GTT GGT CTG CAT TCT TCA CTC ACA GGA AAA 1400

Pro Ser Leu Phe Gln His Val Gly Leu His Ser Ser Leu Thr Gly Lys

360 365 370

ATT CAG AAA CTC ACG GAT AAA GAT TAC ATG AAA CCA TTA CTG CTC AAA 1448

Ile Gln Lys Leu Thr Asp Lys Asp Tyr Met Lys Pro Leu Leu Leu Lys

375 380 385

ATC CAT GTA AAC CCC CCT GCA GAG GTA TCT ACT TCT TTG AAG GTC TAC 1496

Ile His Val Asn Pro Pro Ala Glu Val Ser Thr Ser Leu Lys Val Tyr

390 395 400

CAA GGT CAT ACA CTG GAG AAA ACT TAC ATG GGT GAG GAC TTC TTC TGG 1544

Gln Gly His Thr Leu Glu Lys Thr Tyr Met Gly Glu Asp Phe Phe Trp

405 410 415

GCT ATA ACC CCA GTA GCT GGA GAC TAC ATC CTA TTT AAA TTC GAC AAG 1592

Ala Ile Thr Pro Val Ala Gly Asp Tyr Ile Leu Phe Lys Phe Asp Lys

420 425 430 435

CCA GTC AAT GTG GAA AGT TAT TTG TTC CAT AGT GGC AAC CAG GAT CAT 1640

Pro Val Asn Val Glu Ser Tyr Leu Phe His Ser Gly Asn Gln Asp His

440 445 450

CCA GGG GAT ATT CTG CTC AAC ACA ACG GTG GAA GTT CTG CCT TTG AAG 1688

Pro Gly Asp Ile Leu Leu Asn Thr Thr Val Glu Val Leu Pro Leu Lys

455 460 465

AGT GAA GGT TTG GAC ATC AGC AAA GAA ACC AAA GAC AAA CGA TTA GAA 1736

Ser Glu Gly Leu Asp Ile Ser Lys Glu Thr Lys Asp Lys Arg Leu Glu

470 475 480

GAT GGC TAT TTC AGA ATA GGG AAA TTT GAA AAC GGT GTT GCG GAA GGG 1784

Asp Gly Tyr Phe Arg Ile Gly Lys Phe Glu Asn Gly Val Ala Glu Gly

485 490 495

ATG GTG GAT CCC AGC CTA AAC CCC ATT TCG GCC TTC CGA CTT TCA GTT 1832

Met Val Asp Pro Ser Leu Asn Pro Ile Ser Ala Phe Arg Leu Ser Val 500

500 505 510 515

ATT CAG AAT TCT GCT GTT TGG GCC ATT CTT AAT GAG ATC CAT ATT AAA 1880

Ile Gln Asn Ser Ala Val Trp Ala Ile Leu Asn Glu Ile His Ile Lys

520 525 530

AAA GTC ACA AAC TGACCATC 1900

Lys Val Thr Asn

535

TCTACTAAGA AACCAACACA TTTTTTCCCT GTGAATTTGT TGATTAAAGA CAGCTGAGCA 1960

CGTACCTTTT TTTGGTAACT TGAATTCTAC CTCTCGCGAA ATCTACTGTA GATAAAATGA 2020

TTGTCATATT TCCACTTGGA AAATGAATCT CCCACGGATA ATTGTATTCA TTTGAATCTA 2080

AGCTGTCCTC CAGTTTTAAC TCAACTCAAA CGTTTTACAG TTATGACAGC CTGTTAATAT 2140

GACTTGTACT ATTTTGGTAT TATACTAATA CATAAGAGTT GTACATATTG TTACATTCAT 2200

TAAATTTGAG AAAAATTAAT GTTAAATACA TTTTATGAAC GGGCCG 2246

SEQ ID NO：18

序列长度：535

序列类型：氨基酸

拓扑学：线性

分子类型：肽

序列描述

Met Arg Leu Arg Asn Gly Thr Val Ala Thr Val Leu Ala Phe Ile Thr

1 5 10 15

Ser Phe Leu Thr Leu Ser Trp Tyr Thr Thr Trp Gln Asn Gly Lys Glu

20 25 30

Lys Val Ile Ala Tyr Gln Arg Glu Phe Leu Ala Leu Lys Glu Arg Leu

35 40 45

Arg Ile Ala Glu His Arg Ile Ser Gln Arg Ser Ser Glu Leu Ser Ala

50 55 60

Ile Val Gln Gln Phe Lys Arg Val Glu Ala Glu Thr Asn Arg Ser Lys

65 70 75 80

Asp Pro Val Asn Lys Phe Ser Asp Asp Thr Leu Lys Ile Leu Lys Glu

85 90 95

Leu Thr Ser Lys Lys Ser Leu Gln Val Pro Ser Ile Tyr Tyr His Leu

100 105 110

Pro His Leu Leu Gln Asn Glu Gly Ser Leu Gln Pro Ala Val Gln Ile

115 120 125

Gly Asn Gly Arg Thr Gly Val Ser Ile Val Met Gly Ile Pro Thr Val

130 135 140

Lys Arg Glu Val Lys Ser Tyr Leu Ile Glu Thr Leu His Ser Leu Ile

145 150 155 160

Asp Asn Leu Tyr Pro Glu Glu Lys Leu Asp Cys Val Ile Val Val Phe

165 170 175

Ile Gly Glu Thr Asp Thr Asp Tyr Val Asn Gly Val Val Ala Asn Leu

180 185 190

Glu Lys Glu Phe Ser Lys Glu Ile Ser Ser Gly Leu Val Glu Ile Ile

195 200 205

Ser Pro Pro Glu Ser Tyr Tyr Pro Asp Leu Thr Asn Leu Lys Glu Thr

210 215 220

Phe Gly Asp Ser Lys Glu Arg Val Arg Trp Arg Thr Lys Gln Asn Leu

225 230 235 240

Asp Tyr Cys Phe Leu Met Met Tyr Ala Gln Glu Lys Gly Thr Tyr Tyr

245 250 255

Ile Gln Leu Glu Asp Asp Ile Ile Val Lys Gln Asn Tyr Phe Asn Thr

260 265 270

Ile Lys Asn Phe Ala Leu Gln Leu Ser Ser Glu Glu Trp Met Ile Leu

275 280 285

Glu Phe Ser Gln Leu Gly Phe Ile Gly Lys Met Phe Gln Ala Pro Asp

290 295 300

Leu Thr Leu Ile Val Glu Phe Ile Phe Met Phe Tyr Lys Glu Lys Pro

305 310 315 320

Ile Asp Trp Leu Leu Asp His Ile Leu Trp Val Lys Val Cys Asn Pro

325 330 335

Glu Lys Asp Ala Lys His Cys Asp Arg Gln Lys Ala Asn Leu Arg Ile

340 345 350

Arg Phe Arg Pro Ser Leu Phe Gln His Val Gly Leu His Ser Ser Leu

355 360 365

Thr Gly Lys Ile Gln Lys Leu Thr Asp Lys Asp Tyr Met Lys Pro Leu

370 375 380

Leu Leu Lys Ile His Val Asn Pro Pro Ala Glu Val Ser Thr Ser Leu

385 390 395 400

Lys Val Tyr Gln Gly His Thr Leu Glu Lys Thr Tyr Met Gly Glu Asp

405 410 415

Phe Phe Trp Ala Ile Thr Pro Val Ala Gly Asp Tyr Ile Leu Phe Lys

420 425 430

Phe Asp Lys Pro Val Asn Val Glu Ser Tyr Leu Phe His Ser Gly Asn

435 440 445

Gln Asp His Pro Gly Asp Ile Leu Leu Asn Thr Thr Val Glu Val Leu

450 455 460

Pro Leu Lys Ser Glu Gly Leu Asp Ile Ser Lys Glu Thr Lys Asp Lys

465 470 475 480

Arg Leu Glu Asp Gly Tyr Phe Arg Ile Gly Lys Phe Glu Asn Gly Val

485 490 495

Ala Glu Gly Met Val Asp Pro Ser Leu Asn Pro Ile Ser Ala Phe Arg

500 505 510

Leu Ser Val Ile Gln Asn Ser Ala Val Trp Ala Ile Leu Asn Glu Ile

515 520 525

His Ile Lys Lys Val Thr Asn

530 535

SEQ ID NO：19

序列长度：31

序列类型：核酸

链型：单链

拓扑学：线性

分子类型：合成DNA

序列描述

CCCTCGAG ATG AGG CTC CGA AAT GGA ACT GT 31

Met Arg Leu Arg Asn Gly Thr Val

SEQ ID NO：20

序列长度：31

序列类型：核酸

链型：单链

拓扑学：线性

分子类型：合成DNA

反义：是

序列描述

TTTCTAGA TCA GTT TGT GAC TTT TTT AAT AT 31

TRM Asn Thr Val Lys Lys Ile His

SEQ ID NO：21

序列长度：24

序列类型：核酸

链型：单链

拓扑学：线性

分子类型：合成DNA

序列描述

ACGATTGTGC AACAGTTCAA GCGT 24

SEQ ID NO：22

序列长度：24

序列类型：核酸

链型：单链

拓扑学：线性

分子类型：合成DNA

序列描述

GGGAGAACTC CAGGATCATC CAGT 24

SEQ ID NO：23

序列长度：2115

序列类型：核酸

链型：双链

拓扑学：线性

分子类型：cDNA

序列描述

GAAATGAACC TCTCTTATTG ATTTTTATTG GCCTAGAGCC AGGAGTACTG CATTCAGTTG 60

ACTTTCAGGG TAAAAAGAAA ACAGTCCTGG TTGTTGTCAT CATAAACATA TGGACCAGTG 120

TGATGGTGAA ATGAG ATG AGG CTC CGC AAT GGA ACT GTA GCC ACT GCT TTA 171

Met Arg Leu Arg Asn Gly Thr Val Ala Thr Ala Leu

1 5 10

GCA TTT ATC ACT TCC TTC CTT ACT TTG TCT TGG TAT ACT ACA TGG CAA 219

Ala Phe Ile Thr Ser Phe Leu Thr Leu Ser Trp Tyr Thr Thr Trp Gln

15 20 25

AAT GGG AAA GAA AAA CTG ATT GCT TAT CAA CGA GAA TTC CTT GCT TTG 267

Asn Gly Lys Glu Lys Leu Ile Ala Tyr Gln Arg Glu Phe Leu Ala Leu

30 35 40

AAA GAA CGT CTT CGA ATA GCT GAA CAC AGA ATC TCA CAG CGC TCT TCT 315

Lys Glu Arg Leu Arg Ile Ala Glu His Arg Ile Ser Gln Arg Ser Ser

45 50 55 60

GAA TTA AAT ACG ATT GTG CAA CAG TTC AAG CGT GTA GGA GCA GAA ACA 363

Glu Leu Asn Thr Ile Val Gln Gln Phe Lys Arg Val Gly Ala Glu Thr

65 70 75

AAT GGA AGT AAG GAT GCG TTG AAT AAG TTT TCA GAT AAT ACC CTA AAG 411

Asn Gly Ser Lys Asp Ala Leu Asn Lys Phe Ser Asp Asn Thr Leu Lys

80 85 90

CTG TTA AAG GAG TTA ACA AGC AAA AAA TCT CTT CAA GTG CCA AGT ATT 459

Leu Leu Lys Glu Leu Thr Ser Lys Lys Ser Leu Gln Val Pro Ser Ile

95 100 105

TAT TAT CAT TTG CCT CAT TTA TTG AAA AAT GAA GGA AGT CTT CAA CCT 507

Tyr Tyr His Leu Pro His Leu Leu Lys Asn Glu Gly Ser Leu Gln Pro

110 115 120

GCT GTA CAG ATT GGC AAC GGA AGA ACA GGA GTT TCA ATA GTC ATG GGC 555

Ala Val Gln Ile Gly Asn Gly Arg Thr Gly Val Ser Ile Val Met Gly

125 130 135 140

ATT CCC ACA GTG AAG AGA GAA GTT AAA TCT TAC CTC ATA GAA ACT CTT 603

Ile Pro Thr Val Lys Arg Glu Val Lys Ser Tyr Leu Ile Glu Thr Leu

145 150 155

CAT TCC CTT ATT GAT AAC CTG TAT CCT GAA GAG AAG TTG GAC TGT GTT 651

His Ser Leu Ile Asp Asn Leu Tyr Pro Glu Glu Lys Leu Asp Cys Val

160 165 170

ATA GTA GTC TTC ATA GGA GAG ACA GAT ATT GAT TAT GTA CAT GGT GTT 699

Ile Val Val Phe Ile Gly Glu Thr Asp Ile Asp Tyr Val His Gly Val

175 180 185

GTA GCC AAC CTG GAG AAA GAA TTT TCT AAA GAA ATC AGT TCT GGC TTG 747

Val Ala Asn Leu Glu Lys Glu Phe Ser Lys Glu Ile Ser Ser Gly Leu

190 195 200

GTG GAA GTC ATA TCA CCC CCT GAA AGC TAT TAT CCT GAC TTG ACA AAC 795

Val Glu Val Ile Ser Pro Pro Glu Ser Tyr Tyr Pro Asp Leu Thr Asn

205 210 215 220

CTA AAG GAG ACA TTT GGA GAC TCC AAA GAA AGA GTA AGA TGG AGA ACA 843

Leu Lys Glu Thr Phe Gly Asp Ser Lys Glu Arg Val Arg Trp Arg Thr

225 230 235

AAG CAA AAC CTA GAT TAC TGT TTT CTA ATG ATG TAT GCT CAA GAA AAG 891

Lys Gln Asn Leu Asp Tyr Cys Phe Leu Met Met Tyr Ala Gln Glu Lys

240 245 250

GGC ATA TAT TAC ATT CAG CTT GAA GAT GAT ATT ATT GTC AAA CAA AAT 939

Gly Ile Tyr Tyr Ile Gln Leu Glu Asp Asp Ile Ile Val Lys Gln Asn

255 260 265

TAT TTT AAT ACC ATA AAA AAT TTT GCA CTT CAA CTT TCT TCT GAG GAA 987

Tyr Phe Asn Thr Ile Lys Asn Phe Ala Leu Gln Leu Ser Ser Glu Glu

270 275 280

TGG ATG ATT CTA GAG TTT TCC CAG CTG GGC TTC ATT GGT AAA ATG TTT 1035

Trp Met Ile Leu Glu Phe Ser Gln Leu Gly Phe Ile Gly Lys Met Phe

285 290 295 300

CAA GCG CCG GAT CTT ACT CTG ATT GTA GAA TTC ATA TTC ATG TTT TAC 1083

Gln Ala Pro Asp Leu Thr Leu Ile Val Glu Phe Ile Phe Met Phe Tyr

305 310 315

AAG GAG AAA CCC ATT GAT TGG CTC CTG GAC CAT ATT CTC TGG GTG AAA 1131

Lys Glu Lys Pro Ile Asp Trp Leu Leu Asp His Ile Leu Trp Val Lys

320 325 330

GTC TGC AAC CCT GAA AAA GAT GCA AAA CAT TGT GAT AGA CAG AAA GCA 1179

Val Cys Asn Pro Glu Lys Asp Ala Lys His Cys Asp Arg Gln Lys Ala

335 340 345

AAT CTG CGA ATT CGC TTC AGA CCT TCC CTT TTC CAA CAT GTT GGT CTG 1227

Asn Leu Arg Ile Arg Phe Arg Pro Ser Leu Phe Gln His Val Gly Leu

350 355 360

CAC TCA TCA CTA TCA GGA AAA ATC CAA AAA CTC ACG GAT AAA GAT TAT 1275

His Ser Ser Leu Ser Gly Lys Ile Gln Lys Leu Thr Asp Lys Asp Tyr

365 370 375 380

ATG AAA CCA TTA CTT CTT AAA ATC CAT GTA AAC CCA CCT GCG GAG GTA 1323

Met Lys Pro Leu Leu Leu Lys Ile His Val Asn Pro Pro Ala Glu Val

385 390 395

TCT ACT TCC TTG AAG GTC TAC CAA GGG CAT ACG CTG GAG AAA ACT TAC 1371

Ser Thr Ser Leu Lys Val Tyr Gln Gly His Thr Leu Glu Lys Thr Tyr

400 405 410

ATG GGA GAG GAT TTC TTC TGG GCT ATC ACA CCG ATA GCT GGA GAC TAC 1419

Met Gly Glu Asp Phe Phe Trp Ala Ile Thr Pro Ile Ala Gly Asp Tyr

415 420 425

ATC TTG TTT AAA TTT GAT AAA CCA GTC AAT GTA GAA AGT TAT TTG TTC 1467

Ile Leu Phe Lys Phe Asp Lys Pro Val Asn Val Glu Ser Tyr Leu Phe

430 435 440

CAT AGC GGC AAC CAA GAA CAT CCT GGA GAT ATT CTG CTA AAC ACA ACT 1515

His Ser Gly Asn Gln Glu His Pro Gly Asp Ile Leu Leu Asn Thr Thr

445 450 455 460

GTG GAA GTT TTG CCT TTT AAG AGT GAA GGT TTG GAA ATA AGC AAA GAA 1563

Val Glu Val Leu Pro Phe Lys Ser Glu Gly Leu Glu Ile Ser Lys Glu

465 470 475

ACC AAA GAC AAA CGA TTA GAA GAT GGC TAT TTC AGA ATA GGA AAA TTT 1611

Thr Lys Asp Lys Arg Leu Glu Asp Gly Tyr Phe Arg Ile Gly Lys Phe

480 485 490

GAG AAT GGT GTT GCA GAA GGA ATG GTG GAT CCA AGT CTC AAT CCC ATT 1659

Glu Asn Gly Val Ala Glu Gly Met Val Asp Pro Ser Leu Asn Pro Ile

495 500 505

TCA GCC TTT CGA CTT TCA GTT ATT CAG AAT TCT GCT GTT TGG GCC ATT 1707

Ser Ala Phe Arg Leu Ser Val Ile Gln Asn Ser Ala Val Trp Ala Ile

510 515 520

CTT AAT GAG ATT CAT ATT AAA AAA GCC ACC AAC TGATCATCTG AGAAACCAAC 1760

Leu Asn Glu Ile His Ile Lys Lys Ala Thr Asn

525 530 535

ACATTTTTTC CTGTGAATTT GTTAATTAAA GATAGTTAAG CATGTATCTT TTTTTTATTT 1820

CTACTTGAAC ACTACCTCTT GTGAAGTCTA CTGTAGATAA GACGATTGTC ATTTCCACTT 1880

GGAAAGTGAA TCTCCCATAA TAATTGTATT TGTTTGAAAC TAAGCTGTCC TCAGATTTTA 1940

ACTTGACTCA AACATTTTTC AATTATGACA GCCTGTTAAT ATGACTTGTA CTATTTTGGT 2000

ATTATACTAA TACATAAGAG TTGTACATAT TGTTACATTC TTTAAATTTG AGAAAAACTA 2060

ATGTTACATA CATTTTATGA AGGGGGTACT TTTGAGGTTC ACTTATTTTA CTATT 2115

SEQ ID NO：24

序列长度：535

序列类型：氨基酸

拓扑学：线性

分子类型：肽

序列描述

Met Arg Leu Arg Asn Gly Thr Val Ala Thr Ala Leu Ala Phe Ile Thr

1 5 10 15

Ser Phe Leu Thr Leu Ser Trp Tyr Thr Thr Trp Gln Asn Gly Lys Glu

20 25 30

Lys Leu Ile Ala Tyr Gln Arg Glu Phe Leu Ala Leu Lys Glu Arg Leu

35 40 45

Arg Ile Ala Glu His Arg Ile Ser Gln Arg Ser Ser Glu Leu Asn Thr

50 55 60

Ile Val Gln Gln Phe Lys Arg Val Gly Ala Glu Thr Asn Gly Ser Lys

65 70 75 80

Asp Ala Leu Asn Lys Phe Ser Asp Asn Thr Leu Lys Leu Leu Lys Glu

85 90 95

Leu Thr Ser Lys Lys Ser Leu Gln Val Pro Ser Ile Tyr Tyr His Leu

100 105 110

Pro His Leu Leu Lys Asn Glu Gly Ser Leu Gln Pro Ala Val Gln Ile

115 120 125

Gly Asn Gly Arg Thr Gly Val Ser Ile Val Met Gly Ile Pro Thr Val

130 135 140

Lys Arg Glu Val Lys Ser Tyr Leu Ile Glu Thr Leu His Ser Leu Ile

145 150 155 160

Asp Asn Leu Tyr Pro Glu Glu Lys Leu Asp Cys Val Ile Val Val Phe

165 170 175

Ile Gly Glu Thr Asp Ile Asp Tyr Val His Gly Val Val Ala Asn Leu

180 185 190

Glu Lys Glu Phe Ser Lys Glu Ile Ser Ser Gly Leu Val Glu Val Ile

195 200 205

Ser Pro Pro Glu Ser Tyr Tyr Pro Asp Leu Thr Asn Leu Lys Glu Thr

210 215 220

Phe Gly Asp Ser Lys Glu Arg Val Arg Trp Arg Thr Lys Gln Asn Leu

225 230 235 240

Asp Tyr Cys Phe Leu Met Met Tyr Ala Gln Glu Lys Gly Ile Tyr Tyr

245 250 255

Ile Gln Leu Glu Asp Asp Ile Ile Val Lys Gln Asn Tyr Phe Asn Thr

260 265 270

Ile Lys Asn Phe Ala Leu Gln Leu Ser Ser Glu Glu Trp Met Ile Leu

275 280 285

Glu Phe Ser Gln Leu Gly Phe Ile Gly Lys Met Phe Gln Ala Pro Asp

290 295 300

Leu Thr Leu Ile Val Glu Phe Ile Phe Met Phe Tyr Lys Glu Lys Pro

305 310 315 320

Ile Asp Trp Leu Leu Asp His Ile Leu Trp Val Lys Val Cys Asn Pro

325 330 335

Glu Lys Asp Ala Lys His Cys Asp Arg Gln Lys Ala Asn Leu Arg Ile

340 345 350

Arg Phe Arg Pro Ser Leu Phe Gln His Val Gly Leu His Ser Ser Leu

355 360 365

Ser Gly Lys Ile Gln Lys Leu Thr Asp Lys Asp Tyr Met Lys Pro Leu

370 375 380

Leu Leu Lys Ile His Val Asn Pro Pro Ala Glu Val Ser Thr Ser Leu

385 390 395 400

Lys Val Tyr Gln Gly His Thr Leu Glu Lys Thr Tyr Met Gly Glu Asp

405 410 415

Phe Phe Trp Ala Ile Thr Pro Ile Ala Gly Asp Tyr Ile Leu Phe Lys

420 425 430

Phe Asp Lys Pro Val Asn Val Glu Ser Tyr Leu Phe His Ser Gly Asn

435 440 445

Gln Glu His Pro Gly Asp Ile Leu Leu Asn Thr Thr Val Glu Val Leu

450 455 460

Pro Phe Lys Ser Glu Gly Leu Glu Ile Ser Lys Glu Thr Lys Asp Lys

465 470 475 480

Arg Leu Glu Asp Gly Tyr Phe Arg Ile Gly Lys Phe Glu Asn Gly Val

485 490 495

Ala Glu Gly Met Val Asp Pro Ser Leu Asn Pro Ile Ser Ala Phe Arg

500 505 510

Leu Ser Val Ile Gln Asn Ser Ala Val Trp Ala Ile Leu Asn Glu Ile

515 520 525

His Ile Lys Lys Ala Thr Asn

530 535

SEQ ID NO：25

序列长度：30

序列类型：核酸

链型：单链

拓扑学：线性

分子类型：合成DNA

序列描述

TTCTCGAGAT GAGGCTCCGC AATGGAACTG 30

SEQ ID NO：26

序列长度：24

序列类型：核酸

链型：单链

拓扑学：线性

分子类型：合成DNA

序列描述

AGAAATGTGG GCTTCAGGGC TGGC 24

SEQ ID NO：27

序列长度：30

序列类型：核酸

链型：单链

拓扑学：线性

分子类型：合成DNA

序列描述

TTCTCGAGAT GAGGCTCCGC AATGGAACTG 30

SEQ ID NO：28

序列长度：24

序列类型：核酸

链型：单链

拓扑学：线性

分子类型：合成DNA

序列描述

AGAAATGTGG GCTTCAGGGC TGGC 24

SEQ ID NO：29

序列长度：30

序列类型：核酸

链型：单链

拓扑学：线性

分子类型：合成DNA

序列描述

TTCTCGAGAT GAGGCTCCGC AATGGAACTG 30

SEQ ID NO：30

序列长度：24

序列类型：核酸

链型：单链

拓扑学：线性

分子类型：合成DNA

序列描述

AGAAATGTGG GCTTCAGGGC TGGC 24

SEQ ID NO：31

序列长度：25

序列类型：核酸

链型：单链

拓扑学：线性

分子类型：合成DNA

序列描述

TTCCATCACC TGCCACACCT GCTGG 25

SEQ ID NO：32

序列长度：24

序列类型：核酸

链型：单链

拓扑学：线性

分子类型：合成DNA

序列描述

ACAACCCTCA GTCAGACAAG GAGG 24

SEQ ID NO：33

序列长度：24

序列类型：核酸

链型：单链

拓扑学：线性

分子类型：合成DNA

序列描述

ACACCCCCAG AAATGTGGGC TTCA 24

SEQ ID NO：34

序列长度：24

序列类型：核酸

链型：单链

拓扑学：线性

分子类型：合成DNA

序列描述

ATGACCGAGT CCTCCTTCTC CTGC 24

SEQ ID NO：35

序列长度：24

序列类型：核酸

链型：单链

拓扑学：线性

分子类型：合成DNA

序列描述

ATGCCCATCA CCACCGACAC TCCG 24

SEQ ID NO：36

序列长度：1724

序列类型：核酸

链型：双链

拓扑学：线性

分子类型：cDNA

序列描述

TGCAGCCTCG GCCCCGCGGG CGCCCGCCGC GCACCCGAGG AG ATG AGG CTC CGC 54

Met Arg Leu Arg

1

AAT GGC ACC TTC CTG ACG CTG CTG CTC TTC TGC CTG TGC GCC TTC CTC 102

Asn Gly Thr Phe Leu Thr Leu Leu Leu Phe Cys Leu Cys Ala Phe Leu

5 10 15 20

TCG CTG TCC TGG TAC GCG GCA CTC AGC GGC CAG AAA GGC GAC GTT GTG 150

Ser Leu Ser Trp Tyr Ala Ala Leu Ser Gly Gln Lys Gly Asp Val Val

25 30 35

GAC GTT TAC CAG CGG GAG TTC CTG GCG CTG CGC GAT CGG TTG CAC GCA 198

Asp Val Tyr Gln Arg Glu Phe Leu Ala Leu Arg Asp Arg Leu His Ala

40 45 50

GCT GAG CAG GAG AGC CTC AAG CGC TCC AAG GAG CTC AAC CTG GTG CTG 246

Ala Glu Gln Glu Ser Leu Lys Arg Ser Lys Glu Leu Asn Leu Val Leu

55 60 65

GAC GAG ATC AAG AGG GCC GTG TCA GAA AGG CAG GCG CTG CGA GAC GGA 294

Asp Glu Ile Lys Arg Ala Val Ser Glu Arg Gln Ala Leu Arg Asp Gly

70 75 80

GAC GGC AAT CGC ACC TGG GGC CGC CTA ACA GAG GAC CCC CGA TTG AAG 342

Asp Gly Asn Arg Thr Trp Gly Arg Leu Thr Glu Asp Pro Arg Leu Lys

85 90 95 100

CCG TGG AAC GGC TCA CAC CGG CAC GTG CTG CAC CTG CCC ACC GTC TTC 390

Pro Trp Asn Gly Ser His Arg His Val Leu His Leu Pro Thr Val Phe

105 110 115

CAT CAC CTG CCA CAC CTG CTG GCC AAG GAG AGC AGT CTG CAG CCC GCG 438

His His Leu Pro His Leu Leu Ala Lys Glu Ser Ser Leu Gln Pro Ala

120 125 130

GTG CGC GTG GGC CAG GGC CGC ACC GGA GTG TCG GTG GTG ATG GGC ATC 486

Val Arg Val Gly Gln Gly Arg Thr Gly Val Ser Val Val Met Gly Ile

135 140 145

CCG AGC GTG CGG CGC GAG GTG CAC TCG TAC CTG ACT GAC ACT CTG CAC 534

Pro Ser Val Arg Arg Glu Val His Ser Tyr Leu Thr Asp Thr Leu His

150 155 160

TCG CTC ATC TCC GAG CTG AGC CCG CAG GAG AAG GAG GAC TCG GTC ATC 582

Ser Leu Ile Ser Glu Leu Ser Pro Gln Glu Lys Glu Asp Ser Val Ile

165 170 175 180

GTG GTG CTG ATC GCC GAG ACT GAC TCA CAG TAC ACT TCG GCA GTG ACA 630

Val Val Leu Ile Ala Glu Thr Asp Ser Gln Tyr Thr Ser Ala Val Thr

185 190 195

GAG AAC ATC AAG GCC TTG TTC CCC ACG GAG ATC CAT TCT GGG CTC CTG 678

Glu Asn Ile Lys Ala Leu Phe Pro Thr Glu Ile His Ser Gly Leu Leu

200 205 210

GAG GTC ATC TCA CCC TCC CCC CAC TTC TAC CCT GAC TTC TCC CGC CTC 726

Glu Val Ile Ser Pro Ser Pro His Phe Tyr Pro Asp Phe Ser Arg Leu

215 220 225

CGA GAG TCC TTT GGG GAC CCC AAG GAG AGA GTC AGG TGG AGG ACC AAA 774

Arg Glu Ser Phe Gly Asp Pro Lys Glu Arg Val Arg Trp Arg Thr Lys

230 235 240

CAG AAC CTC GAT TAC TGC TTC CTC ATG ATG TAC GCG CAG TCC AAA GGC 822

Gln Asn Leu Asp Tyr Cys Phe Leu Met Met Tyr Ala Gln Ser Lys Gly

245 250 255 260

ATC TAC TAC GTG CAG CTG GAG GAT GAC ATC GTG GCC AAG CCC AAC TAC 870

Ile Tyr Tyr Val Gln Leu Glu Asp Asp Ile Val Ala Lys Pro Asn Tyr

265 270 275

CTG AGC ACC ATG AAG AAC TTT GCA CTG CAG CAG CCT TCA GAG GAC TGG 918

Leu Ser Thr Met Lys Asn Phe Ala Leu Gln Gln Pro Ser Glu Asp Trp

280 285 290

ATG ATC CTG GAG TTC TCC CAG CTG GGC TTC ATT GGT AAG ATG TTC AAG 966

Met Ile Leu Glu Phe Ser Gln Leu Gly Phe Ile Gly Lys Met Phe Lys

295 300 305

TCG CTG GAC CTG AGC CTG ATT GTA GAG TTC ATT CTC ATG TTC TAC CGG 1014

Ser Leu Asp Leu Ser Leu Ile Val Glu Phe Ile Leu Met Phe Tyr Arg

310 315 320

GAC AAG CCC ATC GAC TGG CTC CTG GAC CAT ATT CTG TGG GTG AAA GTC 1062

Asp Lys Pro Ile Asp Trp Leu Leu Asp His Ile Leu Trp Val Lys Val

325 330 335 340

TGC AAC CCC GAG AAG GAT GCG AAG CAC TGT GAC CGG CAG AAA GCC AAC 1110

Cys Asn Pro Glu Lys Asp Ala Lys His Cys Asp Arg Gln Lys Ala Asn

345 350 355

CTG CGG ATC CGC TTC AAA CCG TCC CTC TTC CAG CAC GTG GGC ACT CAC 1158

Leu Arg Ile Arg Phe Lys Pro Ser Leu Phe Gln His Val Gly Thr His

360 365 370

TCC TCG CTG GCT GGC AAG ATC CAG AAA CTG AAG GAC AAA GAC TTT GGA 1206

Ser Ser Leu Ala Gly Lys Ile Gln Lys Leu Lys Asp Lys Asp Phe Gly

375 380 385

AAG CAG GCG CTG CGG AAG GAG CAT GTG AAC CCG CCA GCA GAG GTG AGC 1254

Lys Gln Ala Leu Arg Lys Glu His Val Asn Pro Pro Ala Glu Val Ser

390 395 400

ACG AGC CTG AAG ACA TAC CAG CAC TTC ACC CTG GAG AAA GCC TAC CTG 1302

Thr Ser Leu Lys Thr Tyr Gln His Phe Thr Leu Glu Lys Ala Tyr Leu

405 410 415 420

CGC GAG GAC TTC TTC TGG GCC TTC ACC CCT GCC GCG GGG GAC TTC ATC 1350

Arg Glu Asp Phe Phe Trp>Ala Phe Thr Pro Ala Ala Gly Asp Phe Ile

425 430 435

CGC TTC CGC TTC TTC CAA CCT CTA AGA CTG GAG CGG TTC TTC TTC CGC 1398

Arg Phe Arg Phe Phe Gln Pro Leu Arg Leu Glu Arg Phe Phe Phe Arg

440 445 450

AGT GGG AAC ATC GAG CAC CCG GAG GAC AAG CTC TTC AAC ACG TCT GTG 1446

Ser Gly Asn Ile Glu His Pro Glu Asp Lys Leu Phe Asn Thr Ser Val

455 460 465

GAG GTG CTG CCC TTC GAC AAC CCT CAG TCA GAC AAG GAG GCC CTG CAG 1494

Glu Val Leu Pro Phe Asp Asn Pro Gln Ser Asp Lys Glu Ala Leu Gln

470 475 480

GAG GGC CGC ACC GCC ACC CTC CGG TAC CCT CGG AGC CCC GAC GGC TAC 1542

Glu Gly>Arg Thr Ala Thr Leu Arg Tyr Pro Arg Ser Pro Asp Gly Tyr

485 490 495 500

CTC CAG ATC GGC TCC TTC TAC AAG GGA GTG GCA GAG GGA GAG GTG GAC 1590

Leu Gln Ile Gly Ser Phe Tyr Lys Gly Val Ala Glu Gly Glu Val Asp

505 510 515

CCA GCC TTC GGC CCT CTG GAA GCA CTG CGC CTC TCG ATC CAG ACG GAC 1638

Pro Ala Phe Gly Pro Leu Glu Ala Leu Arg Leu Ser Ile Gln Thr Asp

520 525 530

TCC CCT GTG TGG GTG ATT CTG AGC GAG ATC TTC CTG AAA AAG GCC GAC 1686

Ser Pro Val Trp Val Ile Leu Ser Glu Ile Phe Leu Lys Lys Ala Asp

535 540 545 548

TAAGCTGCGG GCTTCTGAGG GTACCCTGTG GCCAGCCC 1724

SEQ ID NO：37

序列长度：548

序列类型：氨基酸

拓扑学：线性

分子类型：肽

序列描述

Met Arg Leu Arg Asn Gly Thr Phe Leu Thr Leu Leu Leu Phe Cys Leu

1 5 10 15

Cys Ala Phe Leu Ser Leu Ser Trp Tyr Ala Ala Leu Ser Gly Gln Lys

20 25 30

Gly Asp Val Val Asp Val Tyr Gln Arg Glu Phe Leu Ala Leu Arg Asp

35 40 45

Arg Leu His Ala Ala Glu Gln Glu Ser Leu Lys Arg Ser Lys Glu Leu

50 55 60

Asn Leu Val Leu Asp Glu Ile Lys Arg Ala Val Ser Glu Arg Gln Ala

65 70 75 80

Leu Arg Asp Gly Asp Gly Asn Arg Thr Trp Gly Arg Leu Thr Glu Asp

85 90 95

Pro Arg Leu Lys Pro Trp Asn Gly Ser His Arg His Val Leu His Leu

100 105 110

Pro Thr Val Phe His His Leu Pro His Leu Leu Ala Lys Glu Ser Ser

115 120 125

Leu Gln Pro Ala Val Arg Val Gly Gln Gly Arg Thr Gly Val Ser Val

130 135 140

Val Met Gly Ile Pro Ser Val Arg Arg Glu Val His Ser Tyr Leu Thr

145 150 155 160

Asp Thr Leu His Ser Leu Ile Ser Glu Leu Ser Pro Gln Glu Lys Glu

165 170 175

Asp Ser Val Ile Val Val Leu Ile Ala Glu Thr Asp Ser Gln Tyr Thr

180 185 190

Ser Ala Val Thr Glu Asn Ile Lys Ala Leu Phe Pro Thr Glu Ile His

195 200 205

Ser Gly Leu Leu Glu Val Ile Ser Pro Ser Pro His Phe Tyr Pro Asp

210 215 220

Phe Ser Arg Leu Arg Glu Ser Phe Gly Asp Pro Lys Glu Arg Val Arg

225 230 235 240

Trp Arg Thr Lys Gln Asn Leu Asp Tyr Cys Phe Leu Met Met Tyr Ala

245 250 255

Gln Ser Lys Gly Ile Tyr Tyr Val Gln Leu Glu Asp Asp Ile Val Ala

260 265 270

Lys Pro Asn Tyr Leu Ser Thr Met Lys Asn Phe Ala Leu Gln Gln Pro

275 280 285

Ser Glu Asp Trp Met Ile Leu Glu Phe Ser Gln Leu Gly Phe Ile Gly

290 295 300

Lys Met Phe Lys Ser Leu Asp Leu Ser Leu Ile Val Glu Phe Ile Leu

305 310 315 320

Met Phe Tyr Arg Asp Lys Pro Ile Asp Trp Leu Leu Asp His Ile Leu

325 330 335

Trp Val Lys Val Cys Asn Pro Glu Lys Asp Ala Lys His Cys Asp Arg

340 345 350

Gln Lys Ala Asn Leu Arg Ile Arg Phe Lys Pro Ser Leu Phe Gln His

355 360 365

Val Gly Thr His Ser Ser Leu Ala Gly Lys Ile Gln Lys Leu Lys Asp

370 375 380

Lys Asp Phe Gly Lys Gln Ala Leu Arg Lys Glu His Val Asn Pro Pro

385 390 395 400

Ala Glu Val Ser Thr Ser Leu Lys Thr Tyr Gln His Phe Thr Leu Glu

405 410 415

Lys Ala Tyr Leu Arg Glu Asp Phe Phe Trp Ala Phe Thr Pro Ala Ala

420 425 430

Gly Asp Phe Ile Arg Phe Arg Phe Phe Gln Pro Leu Arg Leu Glu Arg

435 440 445

Phe Phe Phe Arg Ser Gly Asn Ile Glu His Pro Glu Asp Lys Leu Phe

450 455 460

Asn Thr Ser Val Glu Val Leu Pro Phe Asp Asn Pro Gln Ser Asp Lys

465 470 475 480

Glu Ala Leu Gln Glu Gly Arg Thr Ala Thr Leu Arg Tyr Pro Arg Ser

485 490 495

Pro Asp Gly Tyr Leu Gln Ile Gly Ser Phe Tyr Lys Gly Val Ala Glu

500 505 510

Gly Glu Val Asp Pro Ala Phe Gly Pro Leu Glu Ala Leu Arg Leu Ser

515 520 525

Ile Gln Thr Asp Ser Pro Val Trp Val Ile Leu Ser Glu Ile Phe Leu

530 535 540

Lys Lys Ala Asp

545 548

SEQ ID NO：38

序列长度：29

序列类型：核酸

链型：单链

拓扑学：线性

分子类型：合成DNA

序列描述

TTCTCGAGGA GATGAGGCTC CGCAATGGC 29

SEQ ID NO：39

序列长度：30

序列类型：核酸

链型：单链

拓扑学：线性

分子类型：合成DNA

序列描述

AATCTAGAAA TGTGGGCTTC AGGGCTGGC 30

SEQ ID NO：40

序列长度：28

序列类型：核酸

链型：单链

拓扑学：线性

分子类型：合成DNA

序列描述

CCCTCGAG ATG GGG GTG CAC GAA TGT CC 28

Met Gly Val His Glu Cys Pro

SEQ ID NO：41

序列长度：48

序列类型：核酸

链型：单链

拓扑学：线性

分子类型：合成DNA

反义：是

序列描述

CTTTTTGCTT GTTAACTCCT TTAGTATTGG GGCGCCCAGG ACTGGGAG 48

SEQ ID NO：42

序列长度：48

序列类型：核酸

链型：单链

拓扑学：线性

分子类型：合成DNA

序列描述

CTCCCAGTCC TGGGCGCCCC AATACTAAAG GAGTTAACAA GCAAAAAG 48

SEQ ID NO：43

序列长度：44

序列类型：核酸

链型：单链

拓扑学：线性

分子类型：合成DNA

反义：是

序列描述

CTTCCTTCAT TTTGCAATAA ATGAGGGGCG CCCAGGACTG GGAG 44

SEQ ID NO：44

序列长度：43

序列类型：核酸

链型：单链

拓扑学：线性

分子类型：合成DNA

反义：是

序列描述

ATTTAACTTC TCTCTTCACT GTAGGGGCGC CCAGGACTGG GAG 43

SEQ ID NO：45

序列长度：44

序列类型：核酸

链型：单链

拓扑学：线性

分子类型：合成DNA

序列描述

CTCCCAGTCC TGGGCGCCCC TCATTTATTG CAAAATGAAG GAAG 44

SEQ ID NO：46

序列长度：43

序列类型：核酸

链型：单链

拓扑学：线性

分子类型：合成DNA

序列描述

CTCCCAGTCC TGGGCGCCCC TACAGTGAAG AGAGAAGTTA AAT 43

SEQ ID NO：47

序列长度：26

序列类型：核酸

链型：单链

拓扑学：线性

分子类型：合成DNA

反义：是

序列描述

TTCTAGAA TCA CCC TTC CGC AAC ACC 26

TRM Gly Glu Ala Val Gly

SEQ ID NO：48

序列长度：28

序列类型：核酸

链型：单链

拓扑学：线性

分子类型：合成DNA

反义：是

序列描述

TTCTAGAA TCA AGG CAG AAC TTC CAC CG 28

TRM Pro Leu Val Glu Val Thr

SEQ ID NO：49

序列长度：38

序列类型：核酸

链型：单链

拓扑学：线性

分子类型：合成DNA

反义：是

序列描述

TTCTAGAA TCA TTT AAA TAG GAT GTA GTC TCC AGC TAC 38

TRM Lys Phe Leu Ile Tyr Asp Gly Ala Val

SEQ ID NO：50

序列长度：34

序列类型：核酸

链型：单链

拓扑学：线性

分子类型：合成DNA

反义：是

序列描述

TTCTAGAA TCA TGG TTT CAT GTA ATC TTT ATC CG 34

TRM Pro Lys Met Tyr Asp Lys Asp Thr

SEQ ID NO：51

序列长度：19

序列类型：核酸

链型：单链

拓扑学：线性

分子类型：合成DNA

序列描述

TTC ATG AGG CTC CGA AAT G 19

Met Arg Leu Arg Asn Gly

SEQ ID NO：52

序列长度：29

序列类型：核酸

链型：单链

拓扑学：线性

分子类型：合成DNA

反义：是

序列描述

CAAGCT TCA GTT TGT GAC TTT TTT AAT AT 29

TRM Asn Thr Val Lys Lys Ile His

SEQ ID NO：53

序列长度：27

序列类型：核酸

链型：单链

拓扑学：线性

分子类型：合成DNA

序列描述

TC ATG ATA CTA AAG GAG TTA ACA AGC A 27

Met Ile Leu Lys Glu Leu Thr Ser Lys

SEQ ID NO：54

序列长度：51

序列类型：核酸

链型：单链

拓扑学：线性

分子类型：合成DNA

反义：是

序列描述

CAAGCT TCA GTG GTG GTG GTG GTG GTG GTT TGT GAC TTT 39

TRM His His His His His His Asn Thr Val Lys

TTT AAT ATG GAT 51

Lys Ile His Ile

SEQ ID NO：55

序列长度：18

序列类型：核酸

链型：单链

拓扑学：线性

分子类型：合成DNA

反义：是

序列描述

CAAGCT TCA GTG GTG GTG 18

TRM His His His

SEQ ID NO：56

序列长度：32

序列类型：核酸

链型：单链

拓扑学：线性

分子类型：合成DNA

序列描述

TC ATG ATA TTA AAG GAG TTA ACA AGC AAA AAA 32

Met Ile Leu Lys Glu Leu Thr Ser Lys Lys

SEQ ID NO：57

序列长度：51

序列类型：核酸

链型：单链

拓扑学：线性

分子类型：合成DNA

反义：是

序列描述

CAAGCT TCA GTG GTG GTG GTG GTG GTG GTT GGT GGC TTT 39

TRM His His His His His His Asn Thr Ala Lys

TTT AAT ATG AAT 51

Lys Ile His Ile

SEQ ID NO：58

序列长度：49

序列类型：核酸

链型：单链

拓扑学：线性

分子类型：合成DNA

反义：是

序列描述

CAAGCT TCA GTG GTG GTG GTG GTG GTG TGG TTT CAT ATA 39

TRM His His His His His His Pro Lys Met Tyr

ATC TTT ATC C 49

Asp Lys Asp

SEQ ID NO：59

序列长度：19

序列类型：核酸

链型：单链

拓扑学：线性

分子类型：合成DNA

序列描述

TTC ATG AGG CTC CGC AAT G 19

Met Arg Leu Arg Asn Gly

SEQ ID NO：60

序列长度：18

序列类型：核酸

链型：单链

拓扑学：线性

分子类型：合成DNA

反义：是

序列描述

CAGGTTGAGC TCCTTGGA 18

SEQ ID NO：61

序列长度：18

序列类型：核酸

链型：单链

拓扑学：线性

分子类型：合成DNA

序列描述

TCCAAGGAGC TCAACCTG 18

SEQ ID NO：62

序列长度：44

序列类型：核酸

链型：单链

拓扑学：线性

分子类型：合成DNA

反义：是

序列描述

CAAGCT TCA GTG GTG GTG GTG GTG GTG GTC GGC CTT TTT CAG GA 44

TRM His His His His His His Asp Als Lys Lys Leu Phe

SEQ ID NO：63

序列长度：23

序列类型：核酸

链型：单链

拓扑学：线性

分子类型：合成DNA

序列描述

CCC ATG GGC CGC CTA ACA GAG GA 23

Met Gly Arg Leu Thr Glu Asp

Claims

1.β1→4N-乙酰葡糖胺基转移酶，其由显示于SEQ ID NO：18中氨基酸序列所组成。

2.β1→4N-乙酰葡糖胺基转移酶，其由显示于SEQ ID NO：18中的氨基酸序列所组成但具有一个氨基酸残基的添加、缺失或替代而仍具有β1→4N-乙酰葡糖胺基转移酶活性。

3.β1→4N-乙酰葡糖胺基转移酶，其由显示于SEQ ID NO：18中的氨基酸序列所组成但具有两个或更多个氨基酸残基的添加、缺失或替代而仍具有β1→4N-乙酰葡糖胺基转移酶活性。

4.由显示于SEQ ID NO：18中部分氨基酸序列所组成的β1→4N-乙酰葡糖胺基转移酶，其中包括至少从位置93至位置383的残基。

5.由显示于SEQ ID NO：18中部分氨基酸序列所组成的β1→4N-乙酰葡糖胺基转移酶，其中包括至少从位置93至位置383的残基，所述的部分序列具有一个氨基酸残基的添加、缺失或替代而仍具有β1→4N-乙酰葡糖胺基转移酶活性。

6.由显示于SEQ ID NO：18中部分氨基酸序列所组成的β1→4N-乙酰葡糖胺基转移酶，其中包括至少从位置93至位置383的残基，所述的部分序列具有两个或更多个氨基酸残基的添加、缺失或替代而仍具有β1→4N-乙酰葡糖胺基转移酶活性。

7.β1→4N-乙酰葡糖胺基转移酶，其由显示于SEQ ID NO：24中的氨基酸序列所组成。

8.β1→4N-乙酰葡糖胺基转移酶，其由显示于SEQ ID NO：24中的氨基酸序列所组成但具有一个氨基酸残基的添加、缺失或替代而仍具有β1→4N-乙酰葡糖胺基转移酶活性。

9.β1→4N-乙酰葡糖胺基转移酶，其由显示于SEQ ID NO：24中的氨基酸序列所组成但具有两个或更多个氨基酸残基的添加、缺失或替代而仍具有β1→4N-乙酰葡糖胺基转移酶活性。

10.由显示于SEQ ID NO：24中部分氨基酸序列所组成的β1→4N-乙酰葡糖胺基转移酶，包括至少从位置94至位置383的残基，或所述的部分序列具有一个或更多个氨基酸残基的添加、缺失或替代而仍具有β1→4N-乙酰葡糖胺基转移酶活性。

11.由显示于SEQ ID NO：24中部分氨基酸序列所组成的β1→4N-乙酰葡糖胺基转移酶，包括至少从位置94至位置383的残基，所述的部分序列具有一个氨基酸残基的添加、缺失或替代而仍具有β1→4N-乙酰葡糖胺基转移酶活性。

12.由显示于SEQ ID NO：24中部分氨基酸序列所组成的β1→4N-乙酰葡糖胺基转移酶，包括至少从位置94至位置383的残基，所述的部分序列具有两个或更多个氨基酸残基的添加、缺失或替代而仍具有β1→4N-乙酰葡糖胺基转移酶活性。

13.β1→4N-乙酰葡糖胺基转移酶，其由显示于SEQ ID NO：37中氨基酸序列所组成。

14.β1→4N-乙酰葡糖胺基转移酶，其由显示于SEQ ID NO：37中的氨基酸序列所组成但具有一个氨基酸残基的添加、缺失或替代而仍具有β1→4N-乙酰葡糖胺基转移酶活性。

15.β1→4N-乙酰葡糖胺基转移酶，其由显示于SEQ ID NO：37中的氨基酸序列所组成但具有两个或更多个氨基酸残基的添加、缺失或替代而仍具有β1→4N-乙酰葡糖胺基转移酶活性。

16.由显示于SEQ ID NO：37中部分氨基酸序列所组成的β1→4N-乙酰葡糖胺基转移酶，其中包括至少从位置91至位置390的残基。

17.由显示于SEQ ID NO：37中部分氨基酸序列所组成的β1→4N-乙酰葡糖胺基转移酶，其中包括至少从位置91至位置390的残基，所述的部分序列具有一个氨基酸残基的添加、缺失或替代而仍具有β1→4N-乙酰葡糖胺基转移酶活性。

18.由显示于SEQ ID NO：37中部分氨基酸序列所组成的β1→4N-乙酰葡糖胺基转移酶，其中包括至少从位置91至位置390的残基，所述的部分序列具有两个或更多个氨基酸残基的添加、缺失或替代而仍具有β1→4N-乙酰葡糖胺基转移酶活性。

19.编码权利要求1-6中任何一种β1→4N-乙酰葡糖胺基转移酶的β1→4N-乙酰葡糖胺基转移酶基因。

20.编码权利要求7-12中任何一种β1→4N-乙酰葡糖胺基转移酶的β1→4N-乙酰葡糖胺基转移酶基因。

21.编码权利要求13-18中任何一种β1→4N-乙酰葡糖胺基转移酶的β1→4N-乙酰葡糖胺基转移酶基因。

22.由SEQ ID NO：17中显示的核苷酸序列所组成的β1→4N-乙酰葡糖胺基转移酶基因。

23.由SEQ ID NO：23中显示的核苷酸序列所组成的β1→4N-乙酰葡糖胺基转移酶基因。

24.由显示于SEQ ID NO：36中核苷酸序列所组成的β1→4N-乙酰葡糖胺基转移酶基因。

25.通过将权利要求19至24中的任何一种β1→4N-乙酰葡糖胺基转移酶基因插入载体DNA而获得的重组DNA。

26.包括权利要求19至24中任何一种β1→4N-乙酰葡糖胺基转移酶基因部分或全长的染色体片段。

27.带有权利要求25重组DNA的宿主细胞。

28.向其中人工导入有权利要求26染色体片段的宿主细胞。

29.用于从生物样品中纯化权利要求1至18中任何一种β1→4N-乙酰葡糖胺基转移酶的方法。

30.用于制备β1→4N-乙酰葡糖胺基转移酶的方法，包括在培养基中培养权利要求27的宿主细胞和从得到的培养物中回收β1→4N-乙酰葡糖胺基转移酶。

31.用于制备β1→4N-乙酰葡糖胺基转移酶的方法，包括在培养基中培养权利要求28的宿主细胞和从得到的培养物中回收β1→4N-乙酰葡糖胺基转移酶。

32.用于制备β1→4N-乙酰葡糖胺基转移酶的方法，包括从权利要求27的宿主细胞分泌物、体液或匀浆中回收β1→4N-乙酰葡糖胺基转移酶。

33.用于制备β1→4N-乙酰葡糖胺基转移酶的方法，包括从分泌物、体液或从权利要求28的宿主细胞匀浆中回收β1→4N-乙酰葡糖胺基转移酶。