CN1273586C - β1→4N-乙酰葡糖胺基转移酶和编码该酶的基因 - Google Patents

β1→4N-乙酰葡糖胺基转移酶和编码该酶的基因 Download PDF

Info

Publication number
CN1273586C
CN1273586C CNB971934770A CN97193477A CN1273586C CN 1273586 C CN1273586 C CN 1273586C CN B971934770 A CNB971934770 A CN B971934770A CN 97193477 A CN97193477 A CN 97193477A CN 1273586 C CN1273586 C CN 1273586C
Authority
CN
China
Prior art keywords
leu
gnt
seq
based transferase
lys
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
CNB971934770A
Other languages
English (en)
Other versions
CN1214732A (zh
Inventor
小栗秀
箕轮真理
吉田有人
竹内诚
谷口直之
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kirin Brewery Co Ltd
Original Assignee
Kirin Brewery Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kirin Brewery Co Ltd filed Critical Kirin Brewery Co Ltd
Publication of CN1214732A publication Critical patent/CN1214732A/zh
Application granted granted Critical
Publication of CN1273586C publication Critical patent/CN1273586C/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • C12N9/1051Hexosyltransferases (2.4.1)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/20Bacteria; Culture media therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/10Cells modified by introduction of foreign genetic material

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Biophysics (AREA)
  • Animal Behavior & Ethology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Veterinary Medicine (AREA)
  • Public Health (AREA)
  • Cell Biology (AREA)
  • Physics & Mathematics (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Plant Pathology (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Virology (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Peptides Or Proteins (AREA)

Abstract

一种新的具有β1→4N-乙酰葡糖胺基转移酶(GnT-IV)活性的酶;编码该酶的基团;含有该基因的重组DNA;含有该重组DNA的宿主细胞;用于通过在培养基中培养宿主细胞而制备具有Gn-T-IV活性酶蛋白的方法;和具有由GnT-IV所修饰糖链的糖类。本发明提供新的GnT-IV,用于制备该酶的方法,和编码该酶的基因。该新的GnT-IV使制备不能由现存糖基转移酶而形成的分枝糖类成为可能。因此,它有助于药物、试剂和复合糖型食物的制备和改善且在修饰任何生物高分子的糖链结构中是有用的。

Description

β1→4N-乙酰葡糖胺基转移酶 和编码该酶的基因
技术领域
本发明涉及一种新的N-乙酰葡糖胺基转移酶(GlcNAc转移酶),其识别糖类中特异性的糖链结构并且向其中导入GlcNAc β1→4分支结构。
背景领域
1.糖蛋白
自然中大多数蛋白并非是仅由氨基酸所组成的简单蛋白,而是具有糖链和其它物质如磷酸基和脂类附着其上的“成熟”蛋白。因此,由大肠杆菌制备的简单蛋白型产物的开发包括多种问题因为该产物缺乏蛋白的成熟过程。因为除少数例外,所有分泌型生理活性蛋白(如细胞因子)均为糖蛋白,故糖链的功能和作用在开发生物药物中受到极高的重视。
糖蛋白中的糖链粗略地分为Asn-连接型、粘蛋白(mucin)-型、O-连接的GlcNAc型、GPI锚定型和蛋白聚糖型[makoto Takeuchi,“糖生物学系列5:糖技术”,Kihata,Hakomori和Nagai(编),Kodansha科学公司,(1994),191-208]。这些糖链类型的每一种具有其自己的生物合成途径和各自的生理功能。Asn-连接的糖链广泛分布于霉菌、酵母、昆虫、植物和动物中。Asn-连接的糖链的基本生物合成途径在不同种间是保守的(图1)。代表具体种类的糖链在核心糖链部分的外侧(称为“非还原性末端一侧”)形成,这在Asn-连接的糖链的生物合成中是常见的。其中的α1,3-和α1,2-分支甘露糖残基通过α1,6键延伸而附着到主链的甘露聚糖型糖链是真菌如酵母的特征性糖链结构(见图版2)[Hiroshi Nakajima,糖链技术,工业调查协会(Industry Survey Association(1992),384-397]。另一方面,在昆虫、植物和动物中,未观察到甘露糖残基的延伸;相反,形成了高甘露糖型糖链,其为由多萜醇中间体转移而来且仅修整(trimmed)过糖链(见图2中c版)。具有特征性木糖等的独特结构(见图2中b版)也在昆虫、植物和软体动物中观察到。在动物中,观察到特征性糖链结构如复合型糖链(图2中e版)和杂合型糖链(图2中d版);在前者中,GlcNAc分支结构在曾经修整过的糖链中形成,并且添加其它种单糖如半乳糖和唾液酸形成复杂的结构;在后者,既存在复合型糖链又存在高甘露糖型糖链[Kiyoshi Furukawa,糖链技术,工业调查协会(1992),64-75]。
如上述的这种糖链存在于大多数细胞表面蛋白和分泌蛋白中,且认为起决定细胞和蛋白性质和特性的重要作用。其中,形成象从常见核心糖链延伸出天线一样的分支的糖链结构部分称为糖链分支结构。该结构据信具有产生有机体识别配体(即糖链末端部分)的功能,由此高度自由地提供多位点识别机会和通过大大增加空间占据体积而使保护蛋白部分的能力最大化的另一功能(Takeuchi等,见上)。因此,通过控制糖链的分支结构,用各种方式修饰生理功能,如糖蛋白的体内稳定性,体内动力学和器官靶向特性是可能的。考虑到这些,控制糖链分支结构的技术预期成为下一代用于开发“对人类灵敏的”糖蛋白型药物的生物技术。
2.糖蛋白糖链的生理意义
分泌型糖蛋白的糖链在糖蛋白的生物合成、细胞内分组、抗原性的掩蔽、体内稳定性及器官-靶向特性中显示出杰出的功能。已知细胞表面蛋白的糖链依细胞中的变化(如分化、转变为病态、癌变)而变化。特别地,已报道在肿癌的迁移和糖链分支结构之间存在着密切的相关性。
(1)抗原性的掩蔽(Masking of Antigenicity)
据认为就空间结构而言糖链具有高度的自由度且因此象推进器一样自由地移动。因此,蛋白分子如蛋白酶和抗不具对糖链亲和性蛋白的抗体被糖链所隔开且因此不能够达到蛋白部分。结果,即使在靠近糖链结合位点的肽部分具有抗原性,抗体分子仍然不能够接近肽部分。这样,抗原-抗体反应极难发生。此外,当糖蛋白被巨噬细胞捕获且降解产物以抗原形式给出,受体难以接近糖链结合位点附近的肽。因此,抗原性刺激难以发生。实际上,据报导当糖链被导入到卵清蛋白溶菌酶抗原性肽中部时,MHC II类分子与该抗原的结合受到异常抑制[Mouritsen,S.,Meldal,M.,Christiansen-Brams,I.,Elsner,H.和Werdelin,O.,欧洲免疫学杂志,(1994),24,1066-1072]。随着糖链占据体积的变大,抗原性的这种掩蔽效应变得更大。因此,认为开发分支结构大大有助于这种掩蔽的效应。
(2)体内稳定性
关于以转基因动物细胞作为宿主而制备的第一种糖蛋白型药物的红细胞生成素,其糖链的功能已被彻底研究过。结果,显示红细胞生成素的糖链抑制其与其受体的结合但对维持活性结构和体内动力学的改进起决定作用;总之,糖链显示出对红细胞生成素药物学活性的表达至关重要(Takeuchi,M.和Kobata,A.,糖生物学(1991),1,337-346]。特别地,发现细胞生成素糖链天线数目和红细胞生成素的药物学效应之间存在着强烈的相关性,且因此从未引起注意的分支结构(由GlcNAc残基附着到核心糖链而形成的分支结构)的重要性首次被弄清[Takeuchi,M.,Inoue,N.,Strickland,T.W.,Kobata,M.,Wada,M.,Shimizu,R.,Hoshi,S.,Kozutsumi,H.,Takasaki,S.和Kobata,A.,美国自然科学院院刊(1989),86,7819-22]。上面现象的主要原因解释如下:没有发达分支结构的红细胞生成素在肾脏内很快被清除且,结果,该红细胞生成素在体内的存留时间变短[Misaizu,T.,Matsuki,S.,Strickland,T.W.,Takeuchi,M.,Kobata,A.和Takasaki,S.,血液,(1995),86,4097-4104]。
(3)器官靶向性
大多数生物组织具有凝集素样受体且然后用于细胞-细胞相互作用或从血液中摄入糖蛋白。肝脏中的脱唾液酸蛋白结合凝集素是对老化糖蛋白清除系统的一个代表性实例[Toshihiro Kawasaki,Sugar糖链技术,工业调查协会(1992),125-136]。此外,血管内皮细胞、血小板和白细胞(Kawasaki,见上)中含的选择蛋白和存在于巨噬细胞和NK细胞表面的凝集素受体(Kawasaki,见上)是众所周知的。此外,已知不仅糖蛋白而且细胞用糖链作为配体而聚集于特异的组织中。骨髓细胞的归巢(homing)[Tatsuo Irimura,“糖生物学系列3:细胞社会中的糖生物学”,Katsutaka Nagai,Senichiro Hakomori和AkiraKobata(编),Kodansha科学公司,(1993),127-175]和纂集噬中性细胞至炎症区(Irimura,见上)的事例已详细研究过。将所有这些事加起来,可很好地认为糖蛋白和细胞,通过其糖链结构,对在血液循环中呈现出凝集素受体的特异性器官或组织具有靶向性,尽管这种靶向系统没有发现于所有器官中。这意味着通过糖链的药物运输是可能的。在该药物运输中,凝集素对糖链的亲和性剧烈地受糖链配体自由度和数目的影响。因此,糖链的分支结构将在这种药物运输中成为最重要的因素。
(4)细胞向病态的转变和其糖链分支结构的相关性[Junko Kato,Naoko Suzuki“糖链技术和药物开发”,药物副作用所致损伤的减轻与研究基金会(编),Yakugyo-Jiho-Sha,(1994),107-13214]。
一旦称为L-PHA的植物凝集素开发成探针以检测多-分支型糖链结构时,检测各种病态组织样品变为可能。结果,发现一种趋势,即有些类型癌细胞,特别是具有高度迁移能力的癌细胞用L-PHA能很好地被染色。这样,研究人员便注意到糖链分支结构与癌细胞迁移能力的相关性。人类绒毛膜促性腺蛋白(hCG)为在胚胎早期绒毛组织中进行活跃生物合成的糖蛋白激素。由于相当多的hCG释放到尿液中,hCG在临床上被用作妊娠的指标。主要通过单一和双重天线(biantennary)复合型链而形成的Asn-连接糖链是hCG特征性糖链。随着从绒毛膜上皮癌至侵袭性葡萄胎和从侵袭性葡萄胎至绒毛膜癌而癌逐渐增加其恶性,据报道2,4,2型三-天线糖链和异常双天线糖链(两者分别通过GnT-IV-对正常双天线和单一-天线糖链的作用而形成)出现于hCG的糖链中[Katsuko Yamashita,蛋白、核酸和酶(1992),37,1880-1888]。由于该现象的原因,已表明随着绒毛膜癌恶性的进展GnT-IV活性增加。
γ-谷氨酰基转肽酶(γ-GTP)是在肝脏中尤为丰富的糖蛋白。由于当有肝病时血清γ-GTP水平剧烈升高,该水平被用作肝病的诊断指标。此外,Yamashita等[Yamashita,K.,Totani,K.,Iwaki,Y.,Takamisawa,I.,Takeishi,N.,Higashi,T.,Sakamoto,Y.和Kobata,A.,生物化学杂志,(1989),105,728-735]已发现,由于细胞的癌变,与异常hCG中情况一样,γ-GTP的糖链结构在其分支结构中变化异常;因此,他们报导了癌变和GnT-IV激活的相关性。源自健康人肝细胞γ-GTP的Asn-连接的糖链主要由双天线复合型糖链所组成,且具有少量三天线和四天线糖链混合其中。相反,在源自人肝癌细胞γ-GTP的Asn-连接的糖链中观察到分支程度的异常增加。同时,尽管量较少,但出现高甘露糖型糖链和异常的双天线糖链(两者在正常细胞的γ-GTP中均未观察到)。由于糖链结构的这些变化,故表明有这样的可能性即N-乙酰葡糖胺基转移酶IV(GnT-IV)和V(GnT-V)的激活与肝细胞癌变有关(Yamashita等,见上)。
另据报导细胞中糖蛋白的糖链分支结构受病毒感染而剧烈改变(Yamashita等,见上)。BHK细胞具有分支成四天线型的糖链结构。当BHK细胞以多瘤病毒感染时,在细胞产生的糖蛋白糖链中双天线型糖链减少,而四天线型糖链和N-乙酰乳糖胺重复结构增加;总的来说,分支数目的异常改变已被认识到[Takasaki S.,Ikehira,H.和Kobata A.,生化、生物物理、研究通讯,(1980),90,(3),735-742]。由于上述的改变,GnT-IV、GnT-V和i-GnT的激活可以考虑。
3.与糖蛋白糖链分支结构有关的酶
动物特征性糖蛋白糖链结构的复合型糖链具有复杂的分支结构,其中的N-乙酰葡糖胺(GlcNAc)残基以各种方式附着到常见的核心结构上(Kiyoshi Furukawa,见上)(图1)。由于此分支结构与糖蛋白的体内及体内稳定性、定位、生物学活性和药物学特性密切相关(MakotoTakeuchi,见上),分支结构的生物合成过程已被详细研究。通过用发明底物,H.Schachter等在母鸡输卵管中区分出多种酶活性继而预言GlcNAc分支形成酶GnT-I至GnT-VI的存在(GlcNAc糖基转移酶的分组;图3)[Glesson,P.A.和Schachter,H.,生物化学杂志,(1983),258,6162-6173]。之后,GnT-I[Kumar,R.,Yang,J.,Larsen,R.D.和Stanley P.,美国自然科学院院刊,(1990),87,9948-9952;Sarkar,M.,Hull,E.,Nishikawa,Y.,Simpson,R.J.,Moritz,R.L.,Dunn,R.和Schachter,H.,美国自然科学院院刊,(1991),88,234-238],GnT-II[D′Agostaro,GA.,Zingoni,A.,Moritz,RL.,Simpson,RJ.,Schachter,H.和Bendiak,B.,生物化学杂志,(1995),270,15211-21],GnT-III[Nishikawa,A.,Ihara,Y.,Hatakeyama,M.,Kangawa,K.和Taniguchi,N.,生物化学杂志,(1992),267,18199-18204]和GnT-V[Shorebah,M.G.,Hindsgaul,O.和Pierce,M.,生物化学杂志,(1992),267,2920-2927;Gu,J.,Nishikawa,A.,Turuoka,N.,Ono,M.,Yamaguchi,N.,Kangawa,K.,和Taniguchi,N.,生化杂志,(1993),113,614-619]被相继纯化,且其基因已被克隆。然而,仅具有这些已知的GlcNAc转移酶,是不可能形成发现于人血液糖蛋白[Yoshima,H.,Matsumoto,A.,Mizuochi,T.,Kawasaki,T.和Kobata,A.,生物化学杂志(1981),256,8476-8484]和细胞生成素[Takeuchi,M.,Takasaki,S.,Shimada,M.和Kobata,A.,生化化学杂志,(1990),265,12127-12130]中α1酸性糖蛋白中的主要糖链(四天线型;见下面的公式)。因此,已寻找预期在GnT-IV中具有该底物特异性和反应特异性的N-乙酰葡糖胺基转移酶作为缺失的环节。
Figure C9719347700101
                    四天线型糖链结构
除上述那些酶外,下面的N-乙酰-葡糖胺基转移酶已被纯化或其基因已被克隆:作用于粘蛋白型糖链的转移酶[Bierhuizen,M.F.,Maemura,K.和Fukuda,M.,生物化学杂志,(1994),269,4473-4479],作用于糖脂的转移酶,和形成称为I.i抗原结构糖链表位的转移酶[Kawashima,H.,Yamamoto,K.,Osawa,T.和Irimura,T.,生物化学杂志,(1993),268,27118-27126;Bierhuizen,M.F.,Mattei,M.G.和Fukuda,M.,基因发育,(1993),7,468-478]。然而,这些转移酶的底物特异性和由这些转移酶转移的GlcNAc基因的结合模式不同于GnT-IV。这些转移酶中任何一个不产生象GnT-IV产物的产物。
发明内容
以下是本发明的目的,包括提供具有β1→4N-乙酰葡糖胺基转移酶(以下称为“GnT-IV”)活性的酶;编码该酶的基因;包括该基因的重组DNA;含有重组DNA的细胞;用于制备具有GnT-IV活性酶蛋白包括在培养基中培养细胞的方法;和其中的糖链以GnT-IV修饰的糖类。
为了解决上面的方案,本发明者进行了深入而广泛的研究。结果,发明者在牛小肠中分离纯化一种GnT-IV酶蛋白,并对该蛋白的生化特性进行了特征描述。然后,根据上面酶蛋白的部分氨基酸序列本发明者成功地从小肠cDNA文库和mRNA中克隆出编码牛GnT-IVa的基因。此外,根据牛GnT-IVa基因,本发明者又从人肝脏和人肺的cDNA文库和mRNAs中分别成功地克隆出编码人GnT-IVa和人GnT-IVb的两个基因。通过证实这些基因产物显示出GnT-IV活性而完成本发明。
本申请第一个发明涉及具有产生具有下面化学式所代表部分结构糖类活性的GnT-IV:
Figure C9719347700111
用UDP-GlcNAc作为糖供体且用具有下面化学式所代表的部分结构的糖类作为糖受体:
Figure C9719347700112
第二个发明涉及由显示于SEQ ID NO:18中的氨基酸序列所组成的GnT-IV或由显示于SEQ ID NO:18中的氨基酸序列所组成但具有一个或更多个氨基酸残基添加、缺失或替代而仍产生GnT-IV活性的GnT-IV;由显示于SEQ ID NO:24中的氨基酸序列所组成的GnT-IV或由显示于SEQ ID NO:24中的氨基酸序列所组成但具有一个或更多个氨基酸残基的添加、缺失或替代而仍产生GnT-IV活性的GnT-IV;和由显示于SEQ ID NO:37中的氨基酸序列所组成的GnT-IV或由显示于SEQ ID NO:37中的氨基酸序列所组成但具有一个或更多个氨基酸残基的添加、缺失或替代而仍产生GnT-IV活性的GnT-IV。
第三个发明涉及编码GnT-IV的GnT-IV基因,该GnT-IV由显示于SEQ ID NO:18中的氨基酸序列所组成或由显示于SEQ IDNO:18中的氨基酸序列所组成但具有一个或更多个氨基酸残基的添加、缺失或替代而仍产生GnT-IV活性;编码GnT-IV的GnT-IV基因,该GnT-IV基因由显示于SEQ ID NO:24中的氨基酸序列所组成或由显示于SEQ ID NO:24中的氨基酸序列所组成但具有一个或更多个氨基酸残基的添加、缺失或替代而仍具有GnT-IV活性;编码GnT-IV的GnT-IV基因,该GnT-IV基因由显示于SEQ ID NO:37中的氨基酸序列所组成或由SEQ ID NO:37中的氨基酸序列所组成但具有一个或更多个氨基酸残基的添加、缺失或替代而仍产生GnT-IV活性;由显示于SEQ ID NO:17中的核苷酸序列所组成的GnT-IV基因;由显示于SEQ ID NO:23中的核苷酸序列所组成的GnT-IV基因;和由显示于SEQ ID NO:36中的核苷酸序列所组成的GnT-IV基因。
第四个发明涉及可通过将上述GnT-IV基因中的任何一个插入到载体DNA中而获得的重组DNA;和包括上述GnT-IV基因中任何一个基因的部分或全长的染色体片段。
第五个发明涉及带有上述重组DNA的宿主细胞;和其中人工导入有上述染色体片段的宿主细胞。
第六个发明涉及用于制备GnT-IV的方法,包括在培养基中培养上述宿主细胞和从得到的培养物中回收GnT-IV;以及用于制备GnT-IV的方法,包括从分泌物中、体液或源自上述宿主细胞的匀浆液回收GnT-IV酶。
第七个发明涉及用于从生物样品中纯化GnT-IV的方法。
第八个发明涉及其糖链结构以GnT-IV修饰的糖。
以下,将对本发明进行详细描述。
本发明的GnT-IV基因可按下述方法分离。
牛GnT-IVa基因的分离
首先,将从去污剂溶解的牛小肠微粒体级分用阴离子交换层析、铜螯合物层析、用底物类似物的两步亲和层析及凝胶过滤进行一系列的纯化步骤继而获得GnT-IV酶的纯化样品。将得到的纯化样品进行SDS-PAGE且然后转移至PVDF膜上。转移的蛋白原样或经有限的水解后从气相氨基酸测序仪进行分析以获得GnT-IV酶的部分氨基酸序列。
随后,用从动物细胞(即,牛小肠)提取的RNA作为模板用根据上面测得的部分氨基酸序列而设计的引物进行RT-PCR。此外,用通过RT-PCR获得的片段作为探针,通过噬菌斑杂交从上面提到组织的cDNA文库中筛选感兴趣的GnT-IV基因。将在得到的阳性噬菌斑中含有的cDNA片段切出并亚克隆到载体如pUC19中,然后分析其核苷酸序列。如果编码感兴趣蛋白的基因全长没有含在该片段中,用部分的该亚克隆cDNA片段作为探针再次进行噬菌斑杂交。或者,根据上面获得的核苷酸序列信息通过RACE等而获得感兴趣cDNA的末端部分。将这样获得的GnT-IV基因(后称为GnT-IVa)进行其全长核苷酸序列的分析。将具有上面提到的核苷酸序列的基因翻译成氨基酸序列。此氨基酸序列显示于SEQ ID NO:18中。
人类GnT-IVa和GnT-IVb基因的分离
通过用从人组织(肝脏或肺)提取的RNA且根据上面获得的牛GnT-IVa基因核苷酸序列信息进行PCR,然后从上面的组织中筛选cDNA文库可获得人GnT-IVa和GnT-IVb基因。将得到的人GnT-IVa和GnT-IVb基因进行它们的全长核苷酸序列分析。然后,将这些基因翻译成氨基酸序列。这些氨基酸序列显示于SEQ ID NOS:24和37。
为了获得编码显示于SEQ ID NO:18、24或37中的氨基酸序列并具有一个或更多个氨基酸残基的添加、缺失或替代的DNA,可用多种方法。例如,以诱变剂处理DNA以诱导点突变或缺失突变的方法,包括选择性切割DNA、去除或添加选择的核苷酸且然后连接DNA的方法;点特异性诱变;等可被列举。
本发明的GnT-IV蛋白可通过以下方法制备,包括制备其中的启动子下游插入通过上述方法而获得的编码本发明GnT-IV DNA的重组载体,将该载体导入宿主细胞并培养得到的细胞。用于此目的的载体DNA或者可以是质粒DNA或者可以是噬菌体DNA。例如,可以使用显示于后面所述实施例中的pSVL载体(发玛西亚,瑞典)。作为其中导入有得到的重组DNA的宿主细胞,可以使用在重组DNA技术中方便使用的任何细胞,例如,原核细胞、动物细胞、酵母、真菌及昆虫细胞。具体的实例包括作为原核细胞的大肠杆菌和作为动物细胞的来自中国仓鼠的CHO细胞和来自猴的COS细胞。
对每种宿主用常规的方法对上述宿主细胞进行转化。例如,如果宿主为大肠杆菌,包括重组DNA的载体通过热休克方法或电穿孔导入由钙方法等而制备的感受态细胞中。如宿主为酵母,包括重组DNA的载体通过热休克方法或电穿孔进入由锂方法等而制备的感受态细胞中。如果宿主为动物细胞,包括重组DNA的载体通过磷酸钙方法、脂质转染法或电穿孔法导入生长期的细胞中。
通过在培养基中培养这样获得的转化子,制备GnT-IV蛋白。
在转化子的培养中,只要宿主能够在其中存活可使用任何培养基,例如,如果宿主是大肠杆菌可以使用LB培养基等。如果宿主是酵母,可以使用YPD培养基等。如果宿主是动物细胞,可以使用补充以动物血清等的Dulbecco′s培养基。培养在常规用于宿主的条件下进行。例如,如果宿主是大肠杆菌,细胞在约25-37℃,如果必要,通气和/或振荡下培养约3-24小时。如果宿主是酵母,细胞在约25-37℃,如果必要,通气和/或振荡下培养约12小时至2周。如果宿主是动物细胞,培养在约32-37℃于5% CO2和100%湿度下,如果必要,改变通气条件和/或振荡下进行24小时至2周。
培养后,用匀浆器、弗氏压碎器、超声处理、溶菌酶和/或冻融破碎培养的微生物或细胞以从该微生物或细胞中洗脱出GnT-IV蛋白。然后,蛋白可获自可溶性部分。如果感兴趣的蛋白含在不溶性部分中,破碎微生物或细胞后通过离心收集不溶性部分。然后,该蛋白可用含盐酸胍等的缓冲液溶解而用于回收。或者,将培养的微生物或细胞可直接以含有蛋白变性剂和盐酸胍的缓冲液破碎以从微生物或细胞中洗脱出感兴趣的蛋白。
从上面的上清液中对GnT-IV蛋白的纯化可通过实施例1中描述的方法完成。或者,此纯化可通过适当地结合常规的分离/纯化方法而进行。这些常规的分离/纯化方法包括,但不限于,离心、盐析、溶剂沉淀、透析、超滤、分配层析、凝胶过滤、毛细管电泳、TLC、离子交换层析、金属螯合层析、亲和层析、反相层析及等电点聚焦。
按上述获自牛小肠的GnT-IV酶蛋白的生化特性如下。
(1)作用
该酶蛋白产生具有下面化学式所代表的部分结构的糖类:
Figure C9719347700151
用UDP-GlcNAc作为糖供体且用具有下面化学式所代表的部分结构的糖类作为糖受体:
Figure C9719347700152
作为糖受体的糖类意指寡糖、多糖、糖缀合物(糖肽、糖蛋白、糖脂或蛋白聚糖)或其衍生物。
(2)底物特异性
当糖受体是寡糖(寡糖结构,见图4)时,酶蛋白对核心型寡糖显示出0%的反应性,对GnT-I产物型寡糖显示出54%的反应性且对GnT-V产物型寡糖显示出164%的反应性,其中将酶蛋白对GnT-II产物型寡糖的反应性看作100%。
酶蛋白对GnT-II产物型寡糖的结构显示出46%的反应性,其中的岩藻糖通过α1→6链附着到还原性末端的GlcNAc上。
酶蛋白对GnT-II产物型寡糖的结构显示出0%的反应性,其中α1→3甘露糖上的GlcNAc缺失。
酶蛋白对GnT-II产物型寡糖的结构显示出16%的反应性,其中的半乳糖通过β1→4键附着到α1→6甘露糖上的GlcNAc中,且酶蛋白对下面的GnT-II产物型寡糖的结构显示出0%的反应性,该寡糖中的半乳糖通过β1→4键附着到α1→3甘露糖上的GlcNAc上。
酶蛋白对下面的GnT-II产物型寡糖的结构显示出0%的反应性,该寡糖中的GlcNAc通过β1→4键附着到β1→4甘露糖上。
(3)分子量
由SDS-PAGE(非变性条件下)测定约为66K。经肽N-糖苷酶F处理后约60K。由于当使用肽N-糖苷酶时观察到带的迁移,故认为此酶蛋白是糖蛋白。
通过含有Triton X-100的凝胶过滤而测得的表观分子量为77K。因此,认为GnT-IV不具有亚单位结构且以单体起作用。
由此核苷酸序列推导的该酶蛋白部分由535个氨基酸残基所组成且具有61614的分子量。
(4)最适pH
反应的最适pH约为5.5。在pH 6.5至8.0的范围内观察到多于50%的最大活性。
(5)抑制、激活和稳定化
(i)抑制
该酶活性受添加20mM EDTA而受到抑制。
该酶受UDP衍生物抑制。抑制的强度按下面顺序:UDP>>UDP-Glc>UDP-GalNAc>>2′-脱氧UDP>UDP-己酸胺(hexanolamine)>>UDP-Gal>UTP>UDP-葡萄糖醛酸>UMP。
尿苷、TDP及CDP不具有抑制效应。
(ii)激活
二价阳离子对活性的表达是至关重要的。二价阳离子中,Mn2+显示出最大的效应。在7.5mM的浓度时,Co2+和Mg2+的各自效应约为Mn2+的70%,且Ca2+的效应约为Mn2+的10%。在5-20mM的范围中Mn2+的效应是最大的。
(iii)稳定化
在BSA和甘油中认识到有稳定效应。
(6)动力学参数
当作为受体的糖为单糖时(单糖结构,见图4):
(i)其中的酶在50μl 125mM MOPS缓冲液(pH 7.3)中于37℃反应4小时的分析条件下,其中的缓冲液含有0.8mM的受体底物,20mM的UDP-GlcNAc,7.5mM的MnCl2,200mM的GlcNAc,0.5%(w/v)Triton X-100,10%的甘油和1%的BSA:
对GnT-II产物型寡糖的Km和Vmax值分别为0.73mM和3.23μM/分钟。
对GnT-V产物型寡糖的Km和Vmax值分别为0.13mM和1.75μM/分钟。
当GnT-II产物型寡糖为受体底物时,对UDP-GlcNAc的Km值为0.22mM。
(ii)其中的酶在125mM MOPS缓冲液(pH 7.3)中于37℃反应4小时的分析条件下,其中的缓冲液含有120mM的UDP-GlcNAc,7.5nM的MnCl2,0.5%(w/v)的Triton X-100,10%的甘油和1%的BSA:
对GnT-II产物型寡糖的Km和Vmax值分别为0.59mM和0.74mM/分钟/mg。
对GnT-V产物型寡糖的Km和Vmax值分别为0.14mM和0.47mM/分钟/mg。
(7)GnT-IV家族
牛GnT-IVa和人GnT-IVa之间同源性在核苷酸水平为91%且在氨基酸水平为96%。
所有从牛小肠中纯化的GnT-IV中含有的部分氨基酸结构均编码于牛GnT-IVa基因中。
人GnT-IVb和人GnT-IVa在核酸水平有63%的同源性且在氨基酸水平具有62%的同源性。然而,它们在C-末端和N-末端区域是完全不同的。
从上述的生化特性看,本发明的GnT-IV被认为是一种新的酶因为该酶能够完成下面常规酶不能够完成的反应:
Figure C9719347700171
附图简述
图1显示Asn-连接糖链的生物合成途径。
图2显示Asn-连接糖链的变异(修改自位于Makoto Takeuchi,Wako Purechemical Newsletter 64,18-19,1996中的图1)。
a.甘露聚糖型:真菌如酵母和霉菌的特征性糖链结构。
b.木-高-甘露糖型:植物、软体动物和昆虫的特征性结构。
c.高甘露糖型:常见于植物、昆虫和动物中的结构。
d.杂合型:常见于昆虫和动物中的结构。
e.复合型:动物的特征性结构。
f.原核细胞:没有用于Asn-连接糖链生物合成的系统。
套于点线中的部分代表常见的核心糖链。
图3显示由各种GlcNAc转移酶(GlcNAc糖基转移酶)对GlcNAc转移的位置。
图4显示寡糖的命名和结构。
图5显示对GnT-IV反应产物的高效液相色谱。
图6显示由Q-Sepharose FF色谱对GnT-IV的分析结果。
图7显示通过铜螯合物Sepharose FF层析对GnT-IV的分析结果。
图8显示通过UDP-己酸胺(UDP-Hexanolamine)琼脂糖亲和层析(I)对GnT-IV的分析结果。
图9显示通过UDP-己酸胺琼脂糖亲和层析(II)对GnT-IV的分析结果。
图10显示通过Superdex 200凝胶层析对GnT-IV的分析结果。
图11为显示纯化GnT-IV SDS-PAGE(SDS聚丙烯酰胺凝胶电泳)结果图。
图12显示纯化GnT-IV的天然凝胶电泳及其活性的结果。
图13显示GnT-IV、-V和VI产物型寡糖的Smith降解图。
图14显示GnT-IV反应产物的1H-NMR(30℃)结果。
图15显示GnT-IV的最适pH。
图16显示GnT-IV的最适Mn2+浓度。
图17显示GnT-IV反应产物糖蛋白的SDS-PAGE和荧光层析分析结果。
道1和道2:7.6μg脱唾液酸人转铁蛋白
道3:7.6μg唾液酸人转铁蛋白
道4和道5:2.8μg脱唾液酸CHO细胞来源的重组人红细胞生成素
道6和道7:1.3μg脱唾液酸胎球蛋白
道1、4和6代表反应在无GnT-IV进行的模拟实验。M代表分子量标准(伯乐)。PM代表预染的分子量标记(伯乐,美国)。
GnT-IV反应条件:向10μl含0.702mnol/hr的GnT-IV、相当于1.6nmol的双天线型糖链的底物糖蛋白(对于仅是胎球蛋白,糖链含量为1.6nmol)和450nCi的UDP-[14C]GlcNAc的溶液中,加入等体积的分析混合物(250mM MOPS缓冲液,pH 7.3,400mM GlcNAc,20%甘油,1.0%(w/v)Triton X-100,15mM  MnCl2,1mM UDP-GlcNAc)以获得反应溶液,将其于37℃孵育20小时。将得到溶液的十分之一通过SDS-PAGE和荧光自显影进行分析。
对于SDS-PAGE,使用10-20%的梯度胶(Daiichi Kagaku)。对于荧光自显影,用Amplify(Amersham)将样品暴露至X射线胶片20小时。
图18显示人GnT-IVa的开放阅读框和含在pCore-His表达载体中的区域。
图19显示由单个细胞克隆产生的红细胞生成素的等电点聚焦及Western分析结果。分别用2种产生红细胞生成素的菌株及其中导入有牛和人GnT-IVa基因的相同菌株,通过等电点聚焦和用抗红细胞生成素抗体的Western印迹对每种菌株分泌的红细胞生成素进行分析。在左侧,显示出PI标准的位置。
完成本发明的最佳方式
下面,将参照下面的实施例对本发明进行更为详细的描述。然而,本发明不限于这些实施例。
[参照实施例1]
(1)用于实施例中的试剂
除非特别说明,所用的试剂为由Wako Purechemical Industries公司生产的最高级别的产品。
(i)吡啶基胺化(Pyridylaminated)的寡糖
所用的每种吡啶基胺化的寡糖按下述获得。首先,根据Tokugawa等的方法[Biehuizen,M.F.,Mattei,M.G.和Fukuda,M.(1993)基因发育,7,468-478]从人转铁蛋白(apo型;Sigma,美国)中制备吡啶胺化的寡糖。以一种或几种下面的酶处理得到的材料:产脲节杆菌来源的唾液酸酶(Nacalai Tesque),曲霉类来源的β-半乳糖苷酶(Toyobo),刀豆来源的β-N-乙酰氨基己糖苷酶(Seikagaku公司),CHO-K1细胞提取物(通过超声处理位于2体积5mM Tris-HCl缓冲液中的CHO-K1细胞而获得的上清,缓冲液pH 7.5,含有2mMMgCl2和1mM PMSF)中的GnT-V活性部分,位于牛小肠匀浆物溶解部分中的GnT-V活性部分(对于制备方法,见实施例1中的“微粒体级分的制备”和“溶解”)。通过以上述的酶处于PA-糖链021和022(Takara Shuzo)制备部分的吡啶基胺化寡糖。在两种情况,使用前通过用ODS柱(10×250mm;Vydac,美国)的反相层析纯化制备的寡糖。
(ii)糖蛋白底物
将牛胎球蛋白(Sigma,美国)和CHO细胞来源的重组人红细胞生成素(Kirim Brewery)进行下面的预处理以将它们纯化成相对一致的糖形式(glycoform)。简言之,将40-100mg糖蛋白应用于以pH 7.4,含有1mM MgCl2,1mM CaCl2和0.15M NaCl的10mM Tris-HCl缓冲液平衡的ConA-Sepharose柱(5ml;发玛西亚,瑞典)以获得具有低双天线糖链含量作为非吸附部分的糖形式。之后,以含有1.0M α-甲基甘露糖苷(Nacalai Tesque)的上述缓冲液洗脱柱以获得吸收具有高双天线糖链含量糖形式的部分。这样,获得具有低双天线糖链含量的胎球蛋白和具有高双天线糖链含量的红细胞生成素。至于人转铁蛋白,没有必要纯化此糖蛋白因为几乎其所有的糖链均为双天线型。
将这样获得的胎球蛋白和人转铁蛋白于1ml pH 5.0,含有4mMMgCl2的醋酸钠缓冲液中以1U的唾液酸酶和0或107U的β-半乳糖苷酶于37℃反应16小时以唾液酸(asialo)或脱唾液酸(asialo agalacto)的糖蛋白。具有高度双天线型糖链含量的红细胞生成素以与上述同样的方式与0.5U的唾液酸酶和5U的β-半乳糖苷酶反应以获得脱唾液酸脱乳糖的糖蛋白。
这样获得的每种糖蛋白以pH 7.3的50mM醋酸铵缓冲液透析。然后,用BSA(牛血清蛋白)作为标准以BCA蛋白分析仪(Pierce,美国)测定蛋白的量。此外,通过SDS-PAGE(十二烷基磺酸钠聚丙烯酰胺凝胶电泳)分析此蛋白。这样制备的糖蛋白用于实施例中。
(iii)RT-PCR(反转录-聚合酶链式反应)
对于RT-PCR,使用Acess RT-PCR系统(Promega,美国)。对于感兴趣基因片段的扩增,使用Pfu聚合酶(Stratagene,美国)。
(2)用于实施例中的设备
(i)基因测序
ABI PLISM 377DNA测序仪(Perkin-Elmer,美国)被使用。
[参考实施例2]GnT-IV活性的特异性分析
一般地,有2种用于分析GnT-IV活性的方法:测定放射性标记的GlcNAc向寡糖底物中转移的方法和通过HPLC等分级分析GlcNAc向标记的寡糖底物中转移的方法。Taniguchi等开发出一种用GnT-II产物型寡糖作为受体同时测定GnT-III、-IV和-V活性的方法[Nishikawa,A.,Fujii,S.,Sugiyama,T.和Taniguchi,N.(1988)生化年鉴,170,349-354]。然而,此分析方法本身不适于在GnT-IV纯化过程中的分析因为GnT-IV的相对活性大大低于GnT-III和-V的活性。
因此,本发明者通过增加受体吡啶基胺化寡糖至10倍于用于前面分析系统中的量而开发出用于定量选择性地测定GnT-IV活性的方法[Tokugawa,K.,Oguri,S.和Takeuchi,M.(1996)糖缀合物杂志,13,53-56],这种寡糖可容易地制备。
在本发明的实施例中,GnT-IV活性按下述分析。
该酶在pH 7.3的125mM MOPS[3-(N-吗啉代)丙烷磺酸]缓冲液中于37℃反应4小时,MOPS缓冲液中含有0.8mM吡啶基胺化的寡糖底物(GnT-II产物型寡糖底物),20mM UDP-GlcNAc,7.5mM MnCl2,200mM GlcNAc,0.5%(w/v)Triton X-100,10%甘油和1% BSA。然后,通过煮沸该溶液2分钟而终止反应。以0.45nm滤膜去除固体后,以ODS-80TM柱(4.6×150mm;TOSO)于50℃以pH 4.0含有0.15%(w/v)n-丁醇的50mM醋酸铵缓冲液以1.2ml/分钟的流速分析5μl的滤液。吡啶氨基的荧光用320nm的激发光和400nm的发射光加以检测。
[实施例1]酶的分离和纯化
(1)酶源的筛选
通过利用上述的分析方法搜索待纯化的GnT-IV酶的来源。如表1中所示,已发现牛小肠中GnT-IV对GnT-III和GnT-V的相对活性大大高于GnT-IV在任何其它组织中的相对活性。因此,选择牛小肠作为纯化的起始原料。
                            表1
                      GnT-IV酶源的搜索
  酶源         比活性(pmol/h·mg-蛋白)
  IV   III   V
  培养的细胞大鼠器官1)人类1)牛器官初乳   CHOBowesAH661)Solid AH1)Yoshida sarcoma1)小肠心脏胰脏肾脏脑肝脏小肠心脏胰脏   10.812.02.0271.3179.4201.93.72.825N.D.10.9N.D.   0341634116702801110018406608.1174N.D.0.7N.D.   1097150308010968102130388.241N.D.10.9N.D.
N.D.:低于检测极限
1):数据来自Nishikawa,A.等,BBA 1035,313-318(1990)
(2)纯化
除非特别说明,否则所有操作均在4℃进行。
(i)微粒体级分的制备
将2千克牛小肠(获自肉类加工厂)切碎。然后,向其中加入4体积的提取缓冲液(10mM Tris-HCl缓冲液,pH 7.4,含0.25M蔗糖,1mM苯甲磺酰氟,1mM盐酸苯脒(benzamidine hydrochloride),1mM二硫苏糖醇及10mg/ml抗蛋白酶)并从Polytron(Kinematica,瑞典)匀浆。得到的匀浆物以900×g离心10分钟。然后,进一步以105,000×g离心上清60分钟以得到微粒体沉淀级分(样品1)。
(ii)溶解
以3体积通过添加Triton-100至提取缓冲液而制备的溶解缓冲液悬浮样品1以得到1%的终浓度。通过以105,000×g离心60分钟而获得上清。再次悬浮沉淀并收集上清。合并第一及第二次提取物(样品2)。
(iii)Q-Sepharose FF层析
将样品2应用于Q-Sepharose FF柱(5×30cm;发玛西亚,瑞典),该柱以20mM Tris-HCl,pH 7.4,含有1mM盐酸苯脒,0.1%Triton X-100和20%甘油的操作缓冲液1预平衡且然后以0-0.5MKCl的线性梯度洗脱(图6)(样品3)。
(iv)铜螯合物Sepharose FF层析
将样品3应用于以操作缓冲液2(通过向操作缓冲液1中加入KCl至0.15M而获得)预平衡的铜螯合物Sepharose FF层析柱(5×10cm;发玛西亚,瑞典)。然后以5体积的操作缓冲液2将没有被吸收的部分洗出。之后,以0.01M的甘氨酸线性梯度洗脱吸收的部分(图7)。合并得到的GnT-IV活性部分并以YM30超滤膜(Amicon,美国)浓缩(样品4)。
(v)UDP-己酸胺琼脂糖亲和层析I
将在加入1mM苯脒盐酸的操作缓冲液3中透析过的样品4的一半应用至以操作缓冲液3(20mM Tris-HCl,pH 8.0,含有0.15M KCl,10mM MnCl2,0.05% Triton X-100和20%甘油)预平衡的UDP-己酸胺琼脂糖亲和柱(1.2×4.5cm;Sigma,美国)中。然后,没有吸附的部分以操作缓冲液4(20mM Tris-HCl,pH 8.0,含有10mMMnCl2,0.05% Triton X-100和20%的甘油)洗出。之后,以其中加入有1M(终浓度)KCl的操作缓冲液4洗脱吸附产物(图8)。合并GnT-IV活性部分并在操作缓冲液5(与操作缓冲液4具有相同的级分但具有7.4的pH)中透析(样品5)。
(vi)UDP-己酸胺琼脂糖亲和层析II
将样品5应用于以操作缓冲液5预平衡的UDP-己酸胺琼脂糖亲和柱(1.0×6.5cm;Sigma,美国)。然后,以操作缓冲液5将未吸附的部分洗出。之后,以去除MnCl2的操作缓冲液5洗脱吸附产物(图9)。合并得到的GnT-IV活性部分(样品6)。
(vii)Superdex 200凝胶层析
用小的Q-sepharose FF柱浓缩样品6并应用于以操作缓冲液6(通过向操作缓冲液5中添加KCl至0.15M的终浓度而获得)预平衡的Superdex 200HR5/5柱(1×30cm;发玛西亚,瑞典)。操作缓冲液6以0.25ml/分钟的流速应用于柱以获得GnT-IV活性部分(样品7)。
(viii)每个纯化步骤中蛋白的量、活性及特异性活性总结于表2中。最终样品较小肠匀浆物纯化224,000倍。
                                表2
GnT-IV的纯化
  纯化步骤   蛋白量(mg)   总的酶活性(nmol/h)   比活性(nmol/h/mg)   产量(%)   纯化系数(-倍数)
  牛小肠匀浆物溶解的级分Q-Sepherose铜螯合物SepheroseUDP-己酸胺IUDP-己酸胺IISuperdex 200   112,90024,1004,0004500.590.0350.008   49,50014,5007,2003,6701,9501,420790   0.440.601.808.103,31040,60098,800   10029147.43.92.91.6   11.44.118.47,51092,200224,000
以2kg牛小肠开始。
(3)酶化学及蛋白化学特性
(i)纯度
在SDS-PAGE中样品7在分子量为60K处出现单一条带(图11)。当将样品7进行非变性-PAGE(native-PAGE)并将得到的带从凝胶中切除以测定GnT-IV活性时,此蛋白带的位置与活性位置相一致(图12)。此外,样品7中没有检测到任何GnT-I、-II、-III或-V活性。从这些结果,得出样品7为纯的GnT-IV。考虑到通过含Triton X-100凝胶过滤而测得该蛋白的表观分子为77K(图10),认为GnT-IV不具有亚单位结构且以单体形式表达其活性。当样品7以肽N-糖苷酶F(宝灵曼,德国)处理时,在SDS-PAGE中观察到流动性的增加。因此,认为牛小肠的GnT-IV为具有至少Asn-连接酶链的糖蛋白。
(ii)反应特异性
当该酶与由下面化学式所代表的GnT-II产物型寡糖作为底物反应时:
在由HPLC分析的标准条件下,该酶产生单一的产物(吡啶基胺化的寡糖1)。
收集此产物,然后通过下面的方法测定其结构,包括(i)Smith降解加激光TOF-MS(时相质谱仪(time-of-flight massspectrometer)和(ii)1H-NMR。因此,该酶的反应特异性得以检测。当根据Kobata和Takasaki方法[Kobata,A.和Takasaki,S.(1993)于《糖生物学》中“实践方法”(Fukuda,M.和Kobata,A.,编)165-185,IRL出版社,牛津,英国]将吡啶基胺化的寡糖1进行Smith降解时,由于第一次降解时其质量数由1599.0变为795.30且由于第二次降解进一步变为634.68。这与图13中所示的反应途径相一致。因此,得出此酶的反应产物具有下面的结构:
此外,当将吡啶基胺化的寡糖1进行1H-NMR时,检到4.53ppm的峰值,其相应于显示下面通式中GlcNAc 7的无头质子;其偶联常数J1,2为7.9Hz(图14)。这些结果显示GlcNAc 7,如下面化学式中所示,GlcNAc 7通过β-型键附着到Man 4的位置4上,完全支持了上述结构。
Figure C9719347700262
(iii)最适pH
如图15所示,该酶的最适pH约为7.5。
(iv)二价阳离子的需求
如表3中所示,该酶可由加入EDTA(乙二胺四乙酸)而失活。二价阳离子对其活性是至关重要的。二价阳离子中,Mn2+显示出最大的效应,其次是Co2+和Mg2+。Ca2+和Fe2+有微弱的效应。如图16所示Mn2+的最适浓度约为10mM。
          表3
GnT-IV的二价阳离子需求
  添加物   活性(%)
  无EDTAMnCl2CoCl2MgCl2CaCl2FeCl2CuCl2   5.6010074.872.57.29.80
通过加入每种金属离子(10mM)至去除金属离子的GnT-IV样品中而测定GnT-IV的活性。GnT-IV活性由表中的百分比表示,其中加入10mM MnCl2的活性被看作是100%。
(v)糖核苷酸类的抑制
如表4中所示,UDP最为强烈地抑制该酶的活性。UDP-葡萄糖,UDP-GalNAc,2′-脱氧-UDP和UDP-己酸胺(Sigma,美国)的抑制效应以此顺序列于UDP的抑制效应之后。尿苷、UMP、TDP和CDP几乎没有显示出抑制效应。
            表4
    核苷酸对GnT-IV的抑制
  添加物   活性(%)
  无尿苷UMPUDPUTPTDPCDP2′-脱氧-UDPUDP-己酸胺UDP-葡萄糖UDP-半乳糖UDP-葡糖醛酸UDP-N-乙酰半乳糖胺   10011597.327.388.211011267.473.656.687.392.359.7
当在0.5mM  UDP-GlcNAc存在时加入每种核苷酸(2mM)时的GnT-IV活性在表中以百分数表示,其中没有加入任何物质时的活性看作是100%。
(vi)底物特异性
如表5中所示,该酶最优选以GnT-V产物型寡糖(表中E)作为受体。其次,该酶优选GnT-II产物型寡糖(表5中D)。
当该酶对GnT-II型寡糖的反应性看作为100%时,它对核心型寡糖(表5中A)和GnT-I底物型寡糖(表5中C)分别表现出0%和54%的反应性。
该酶对GnT-II产物型寡糖的结构显示出46%的反应性,其中的岩藻糖通过α1→6键附着到GlcNAc的还原性末端(G有5中F)。
该酶对GnT-II产物型寡糖显示出0%的反应性,其中的GlcNAcα1→3甘露糖缺失(表5中B)。
该酶对GnT-II产物型寡糖的结构显示出16%的反应性,其中的半乳糖以β1→4键附着到GlcNAc的α1→6甘露糖上(表5中的G),且对GnT-II产物型寡糖的结构显示出0%的反应性,其中的半乳糖通过β1→4键附着到GlcNAc的α1→3甘露糖上(表5中的H和I)。
该酶对GnT-II产物型寡糖的结构显示出0%的反应性,其中的GlcNAc以β1→4键附着到β1→4甘露糖上(表5中J)。
上述该酶的底物特异性与Schachter等所预言的GnT-IV底物特异性[Glesson,P.A.和Schachter,H.(1983)生物化学杂志,258,6162-6173]几乎一致。因此,很明显本发明的酶正是复合型糖链生物合成中长期缺失的环节(link)中的GnT-IV。
表5
Figure C9719347700301
(vii)动力学参数
在参照实施例2中所述分析条件下,该酶对GnT-II产物型寡糖的Km和Vmax值分别为0.73mM和3.23μm/分钟,对GnT-V产物型寡糖的这些值分别为0.13mM和1.75μM/分钟。对UDP-GlcNAc的Km值为0.22mM。
在获得的吡啶基胺化寡糖中,发现由下面化学式所代表的寡糖为新的寡糖:
Figure C9719347700311
Figure C9719347700312
(viii)对糖蛋白的作用
为了证明GnT-IV不仅能对寡糖底物而且能对糖蛋白中的寡糖链起作用,用UDP[14C]GlcNAc作为糖供体GnT-IV对脱唾液酸糖起反应。然后,通过SDS-PAGE和荧光自显影分析反应产物(图17中A版和B版)。如图17B版中的2道和5道所示,[14C]GlcNAc向脱唾液酸人转铁蛋白和脱唾液酸、CHO细胞来源的重组人红细胞生成素的转移。相反,在没有双天线糖链的脱唾液酸胎球蛋白中没有观察到[14C]GlcNAc的转移(图17,B版)。
通过此GnT-IV反应而获得的具有GnT-IV产物型糖链的人转铁蛋白(具有下面的化学式)为自然界中没有的新物质。
Figure C9719347700313
GnT-IV产物型糖链结构
[实施例2]肽作图分析
约1mg最终纯化的本发明酶根据Laemmli方法[Laemmli,英国,自然(1970)313,756-762]于0.1% SDS-10%聚丙烯酰胺凝胶上电泳。将分离的蛋白电印迹至PVDF膜上。将固定于膜上的蛋白进行S-羧甲基化然后以赖氨酰内肽酶无色杆菌蛋白酶I(AP-I)(Wako纯化学工业公司)消化以获得AP-I-消化的片段混合物。AP-I-消化的PVDF膜进一步以Asp-N(Takara Shuzo)消化以获得Asp-N-消化的片段混合物。通过高液相层析分离肽段混合物中的每一片段并进行氨基酸序列分析。结果,获得显示于SEQ ID NOS:1-14中的序列。
[实施例3]牛GnT-IVa cDNA的分离和鉴定
(1)RT-PCR
根据在实施例2中获得的显示于SEQ ID NOS:7和11中的氨基酸序列,分别合成显示于SEQ ID NO:15中的寡聚体AP-5F和显示于SEQ ID NO:16中的寡聚体DN-9R。用从牛小肠组织中通过异硫氰酸胍方法提取的总RNA作为模板且用上述引物进行RT-PCR。结果,获得似乎特异性的约170bp的扩增片段。将该片段亚克隆。
(2)文库的筛选
用上述RT-PCR产物筛选牛小肠cDNA文库(Clontech,美国)以获得4个阳性噬菌斑。测定这些克隆的核苷酸序列。得到的序列含有许多编码一些实施例2中获得的部分氨基酸序列(SEQ ID NOS:1-14)的核苷酸序列,且也含有似乎为终止密码子的序列。用代表得到核苷酸序列最上游区域的150bp的片段,再次筛选该文库以获得两个阳性噬菌斑。测定这些克隆的核苷酸序列。然后,以150bp的最上游区域的探针进一步同样地筛选该文库,然而,没有获得新的克隆。
(3)5′RACE(cDNA末端的快速扩增)
随后,为了获得全长cDNA而进行5′RACE。用噬菌体筛选获得的最上游区域序列,进行第1次5′RACE。然而,没有能够发现起始密码子。然后,根据第一次5′RACE获得的序列,进行第二次5′RACE以获得含有起始密码子的序列。将该序列连接到以前获得的噬菌体克隆的部分基因序列上以获得含有完整开放阅读框的基因片段(基因1)。这样获得基因片段的核苷酸序列显示于SEQ ID NO:17中,且由其推测的氨基酸序列显示于SEQ ID NO:18中。已证实此DNA片段含有所有编码在实施例2中获得的部分氨基酸序列(SEQ ID NOS:1-14)的核苷酸序列。
[实施例4]用克隆的牛GnT-IVa基因对表达载体的构建和用于制备GnT-IVa酶的方法
(1)载体的构建
合成将XhoI位点导入基因1起始密码子上游区域的引物(SEQ IDNO:19)和将XbaI位点导入该基因终止密码子下游区域的另一种引物(SEQ ID NO:20)。然后,用此引物用PCR扩增编码GnT-IV酶的整个基因。以XhoI和XbaI消化获得的扩增片段,并插入pSVL载体(发玛西亚,瑞典)的XhoI和XbaI位点之间以制备质粒pBGT4。
(2)导入COS7细胞
质粒pBGT4通过电穿孔导入COS7细胞(RIKEN细胞库)。简言之,将10μg质粒加入到约含5×106个细胞的0.8ml PBS(-)(Nissui药物公司)中。在室温下用基因脉冲仪(伯乐,美国)以25μF的容量应用1600伏以将该基因导入细胞。将得到的细胞转移至90mm实验室培养皿中并于5% CO2,37℃下培养于含10%胎牛血清的10ml Dulbecco′s修饰的Eagle′s培养基中(基本目录号.12430,美国生物技术公司)72小时。之后,回收细胞并悬浮于100μl缓冲液(5mM Tris-HCl,pH 7.5,2mM MgCl2,1mM苯甲磺酰氟)中,然后超声处理并以2000×g离心5分钟。因此,获得细胞提取物。
(3)GnT-IV活性的分析
细胞提取物中GnT-IV的活性通过参照实施例2中所述的方法测定。结果显示于表6中。与其中导入pSVL载体作为对照的细胞提取物相比,其中导入质粒pBGT4的提取物每个细胞显示出44-78倍更高的GnT-IV活性。从这些结果,证实基因1编码GnT-IV酶。这样,GnT-IV酶可根据此方法通过培养的细胞制备。
                     表6
  质粒   比活性(pmol/hr/mg蛋白)   活性比率
  pSVLpBGT4(#1)pBGT4(#2)pBGT4(#3)   409296233177320182   1727844
反应时间:4小时
活性比率是相对于把pSVL的总活性看作1来表示的。
[实施例5]人类GnT-IVa cDNA的分离和鉴定
(1)RT-PCR
根据在实施例3中获得的牛GnT-IVa核苷酸序列,合成显示于SEQID NO:21中的引物h1-2F和显示于SEQ ID NO:22中的引物h1-1R。用人肝脏的总RNA(Clontech,美国)作为模板,以上述引物进行RT-PCR。结果,获得似乎为特异性的约650bp的扩增片段。将此片段亚克隆,并测定其核苷酸序列。
(2)文库的筛选
用上面RT-PCR获得的685bp DNA片段作为探针筛选人肝脏cDNA文库(Clontech,美国)。获得2个阳性噬菌斑hGT4/λgt10-1和hGT4/λgt10-2。测定这些噬菌体克隆中插入子的核苷酸序列。结果,hGT4/λgt10-1含有804bp的DNA区域且hGT4/λgt10-2含有2115bp的DNA区域。前者区域完全包括在后者区域内。如SEQ ID NO:23中所示,hGT4/λgt10-2中含有的DNA片段具有与牛GnT-IVa氨基酸序列高度同源的开放阅读框(ORF)(96%一致)。从实施例6中获得的结果,证实此ORF为人GnT-IVa基因。该ORF的氨基酸序列显示于SEQ ID NO:24中。
[实施例6]人GnT-IVa基因表达质粒的构建及制备人GnT-IVa酶的方法
(1)人GnT-IVa基因表达质粒pHGT4-1的构建
合成将XhoI位点导入人GnT-IVa基因起始密码子上游区域的引物(h1-7F;SEQ ID NO:25)和与该基因终止密码子下游区域互补的另一种引物(h1-7R;SEQ ID NO:26)。用人肝脏RNA(Clontech,美国)作为模板,用上述引物通过RT-PCR扩增编码人GnT-IVa酶的整个基因。将得到的扩增片段以与lacz基因转录相反的方向插入质粒pCRScript Amp SK(+)(Stratagene,DNA)的SrfI位点。用得到的质粒,通过核苷酸序列分析证实扩增的片段编码显示于SEQ IDNO:24中的氨基酸序列。此外,以XhoI和SacI消化此质粒以获得XhoI-SacI 1.7kb的片段。将此片段插入到pSVL载体(发玛西亚,瑞典)的XhoI和SacI位点之间以从人GnT-IVa基因制备表达质粒pHGT4-1。
(2)人GnT-IVa基因向COS7细胞的导入
通过电穿孔将质粒pHGT4-1导入COS7细胞。将得到的细胞于10%CO2,37℃下培养72小时。然后,收获细胞,悬浮于100μl缓冲液(5mMTris-HCl,pH 7.5,2mM氯化镁,1mM苯甲磺酰氟)中,超声处理破碎,2000×g离心5分钟并收集上清以获得细胞提取物。
(3)人GnT-IVa基因在COS7细胞中的表达
通过参照实施例2中描述的方法测定细胞提取物中的GnT-IV活性。结果显示于表7中。与其中导入pSVL载体作为对照的细胞提取物相比,其中导入质粒pHGT4-1的细胞提取物每个细胞显示出21-28倍更高的GnT~IV活性。从这些结果,证实显示于SEQ ID NO:23中的GnT-IVa基因编码糖基转移酶GnT-IV。也证实人GnT-IVa酶可根据此方法通过培养的细胞制备。
                    表7
  质粒   比活性(pmol/hr/mg蛋白)   活性比率
  pSVLpHGT4-1(#1)pHGT4-1(#2)pHGT4-2(#1)pHGT4-2(#2)   10372895121788110248029   12821118
反应时间:1.3小时
活性比率以相对于把pSVL的总活性看成为1而表示的。
[实施例7]人GnT-IVb cDNA的分离和鉴定
(1)通过PCR、RT-PCR和5′RACE(cDNA末端的快速扩增)获得人GnT-IVa-样基因
在基因数据库GerBank中通过BLASTN搜索与实施例3中获得的人GnT-IVa基因核苷酸序列具有类似性的核苷酸序列。结果,发现了许可号R12057,H10557和W16571。然后,合成显示于SEQ ID NO:27中的引物h2-45F和显示于SEQ ID NO:28中的引物h2-43R,从而用人类cDNA文库中心的快速筛选(Quick Screen Human cDNALibrary Panel)(Clontech,美国)的人脑cDNA文库作为模板进行PCR。将扩增的片段亚克隆入pCRScript Amp SK(+)(Stratagene,美国)的SrfI位点并进行核苷酸序列分析。同时,合成显示于SEQ ID NO:29中的引物h2-2F和显示于SEQ ID NO:30中的引物h2-1R从而用人肺总RNA(Clontech,美国)作为模板进行RT-PCR。结果,得到约500bp预期大小的扩增片段。然后,将此片段亚克隆入pCRScriptAmp SK(+)(Stratagene,美国)的SrfI位点并进行核苷酸序列分析。
这样获得的2个DNA片段的核苷酸序列相互间形成1006bp区域的重叠。在该区域内,编码与牛和人GnT-IVa同源的氨基酸序列的开放阅读框被发现。因此,提示与GnT-IVa蛋白有关的蛋白的存在。
然后,在DNA数据库GenBank中通过BLASTN搜索可能是R12057上游序列或W16571下游序列的可能核苷酸序列。结果,发现R15554为R12057的上游序列,且W16466为W16571的下游序列。然而,在从这些核苷酸序列推导的ORFs中含有显然不适当的终止密码子。因此,为了证实该核苷酸序列,通过RT-PCR获得DNA片段。作为引物,合成显示于SEQ ID NO:31中的h2-1F,显示于SEQ ID NO:32中的h2-3F和显示于SEQ ID NO:33中的h2-8R。用实施例5中所述的h2-1F和h1-1R组合,或h2-3F和h2-8R组合,用人肝脏的总RNA(Clontech,美国)作为模板进行RT-PCR。检测到均与预期大小相一致的约550bp和约300bp的扩增片段。将这些片段中的每一个亚克隆入pCRScript Amp SK(+)中的SrfI位点中以分析其核苷酸序列。结果,证实这些片段分别与上述h2-45F和h2-1R之间1006bp的上游区域和下游区域重叠。在1361bp的连接区域内,发现编码与牛和人GnT-IVa蛋白氨基酸序列具有高度同源性的433个氨基酸蛋白的ORF。
然而,当此ORF与GnT-IVa蛋白的氨基酸序列比较时,认为起始的甲硫氨酸应存在于该ORF上游的区域。因此,上游区域用人肺5′-RACE-即用(Ready)cDNA(Clortech,美国)通过5′-RACE获得。在第一次PCR中,锚定引物和显示于SEQ ID NO:34中的h2-5R用作引物。在第二次PCR中,锚定引物和显示于SEQ ID NO:35中的h2-3R用作引物。纯化由5′-RACE获得的片段,用EcoRI和PstI消化,且然后通过琼脂糖凝胶电泳分离。从凝胶中回收约450bp的片段。将该片段插入pUC18载体(发玛西亚,瑞典)的EcoRI和PstI位点之间以分析其核苷酸序列。结果,证实此片段与h2-1F和h2-8R之间区域的上游区重叠。在1758bp的连接区域内,证实了一个编码与牛和人GnT-IVa蛋白氨基酸序列具有高度类似性的548个氨基酸蛋白的ORF。该ORF的核苷酸序列显示于SEQ ID NO:36中,且其氨基酸序列显示于SEQ ID NO:37中。从下面实施例8中描述的结果,证实该基因为人GnT-IVb基因。
[实施例8]人GnT-IVb基因表达质粒的构建和制备人GnT-IVb酶的方法
(1)人GnT-IVb基因表达质粒pHGT4-2的构建
合成将XhoI位点导入人GnT-IVb基因起始密码子上游区域的引物(h2-4:SEQ ID NO:38),和将XbaI位点导入上述基因终止密码子下游区域的另一种引物(h2-10R:SEQ ID NO:39)。用这些引物,以人肺RNA(Clontech,美国)作为模板通过RT-PCR扩增编码人GnT-IVb酶的整个ORF。将扩增的片段插入质粒pCRScript AmpSK(+)的SrfI位点中,然后测定其核苷酸序列。结果,证实扩增的片段编码SEQ ID NO:37的氨基酸序列。此外,将该质粒以XhoI和XbaI消化以获得XhoI-XbaI 1.7kb的片段。将该片段插入pSVL载体(发玛西亚,瑞典)的XhoI与XbaI之间的位点以构建用于人GnT-IVb基因的表达质粒。
(2)人GnT-IVb基因向COS7细胞中的导入
通过电穿孔将质粒pHGT4-2导入COS7细胞。得到的细胞于10%CO2,37℃下培养72小时。然后,回收细胞,悬浮于100μl缓冲液(5mMTris-HCl,pH 7.5,2mM氯化镁,1mM苯甲磺酰氟),超声处理破碎,2000×g离心5分钟且收集上清以获得细胞提取物。
(3)人GnT-IVb基因在COS7细胞中的表达
通过参照实施例2中所述的方法测定细胞提取物中的GnT-IV活性。结果显示于上面的表7中。与其中导入pSVL载体作为对照的细胞提取物相比,其中导入质粒pHGT4-2的细胞提取物每个细胞显示出8-11倍更高的GnT-IV活性。从这些结果,证实显示于SEQ ID NO:36中的GnT-IVb基因编码糖基转移酶GnT-IV。同时也证实人GnT-IVb酶可根据此方法由培养的细胞制备。
[实施例9]牛GnT-IVa N-末端缺失突变体表达质粒的构建及其表达
(1)牛GnT-IVa表达质粒pSigIle 93、pSigPro 113和pSigPro 142表达质粒的构建
合成将XhoI位点导入人红细胞生成素信号序列(GenBank登记号X02157)上游区域的引物(XhoEsig:SEQ ID NO:40)和将上述信号序列的C-末端连接至牛跨越位置93(Ile)至末端GnT-IVa氨基酸序列的部分的反义引物(E4-1R:SEQ ID NO:41),从而通过PCR扩增人红细胞生成素的信号序列。同时,合成相应于上述反义引物的有义引物(E4-1F:SEQ ID NO:42)和将XbaI位点导入牛GnT-IVa终止密码子下游区域的XbaI位点的引物(4EXPR:SEQ IDNO:20)以通过PCR扩增牛GnT-IVa基因的部分序列。用得到的2种PCR产物的部分作为混合模板,以引物XhoEsig和4EXPR进行PCR。扩增的片段以XhoI和XbaI消化并插入到pSVL载体(发玛西亚,瑞典)的XhoI和XbaI位点之间以构建质粒pSigIle 93,其表达其中的人红细胞生成素信号序列连接到牛跨越位置93至末端GnT-IVa氨基酸序列部分的氨基酸序列。用E4-2R引物(SEQ ID NO:43)或E4-3R引物(SEQ ID NO:44)代替E4-1R引物;且以E4-2F引物(SEQ IDNO:45)或E4-3F引物(SEQ ID NO:46)代替E4-1F引物,用与上述相同的方式分别构建表达其中的人红细胞生成素信号序列连接到牛跨越位置113(Pro)至末端GnT-IVa氨基酸序列部分的氨基酸序列的质粒pSigPro 113;或其中的人红细胞生成素信号序列连接到牛跨越位置142(Pro)至末端GnT-IVa氨基酸序列部分的氨基酸序列的质粒pSigPro 142。
(2)表达牛GnT-IVa N-末端缺失突变体的质粒向COS7细胞中的导入
通过电穿孔将质粒pSigIle 93、pSigPro 113或pSigPro 142导入COS7细胞。得到的细胞于10% CO2,37℃下培养72小时。然后,分别回收细胞和培养上清。将细胞悬浮于100μl缓冲液(5mM Tris-HCl,pH 7.5,2mM氯化镁,1mM苯甲磺酰氟),超声处理打碎且2000×g离心5分钟以获得细胞提取物。以Centriplus 30(Amicon)将培养上清浓缩至约100μl。
(3)牛GnT-IVa N-末端缺失突变体在COS7细胞中的表达
培养上清与细胞提取物中GnT-IV活性通过参照实施例2中所述方法加以测定。结果显示于表8中。与其中导入有pBGT4载体作为阳性对照的细胞总活性(即,细胞中活性+上清中活性)相比,其中导入有pSigIle 93的细胞总活性大于30%。此外,三分之一的活性分泌至培养上清中。从这些结果,发现牛GnT-IVa N-末端至位置92的氨基酸序列可被缺失而维持酶活性。同时也显示GnT-IVa酶可用适当的分泌信号分泌表达。
                              表8
  质粒   级分   活性(pmol/hr)   每个级分的活性比率(%)   总活性比率(%)
  pSVLpSVLpBGT4pBGT4pSigIle 93pSigIle 93pSigPro 113pSigPro 113pSigPro 142pSigPro 142   上清细胞上清细胞上清细胞上清细胞上清细胞   1363847222615231065471312606219381   0.51.42.797.311.620.41.22.30.81.4   1.9100.031.93.42.2
反应时间:2.5小时
活性比率以相对于pBGT4总活性的百分数表示,pBGT4总活性看成为100%。
[实施例10]牛GnT-IVa C-末端缺失突变体表达质粒的构建及其表达
(1)牛GnT-IVa表达质粒pCGly 499、pCPro 465、pCLys 432和pCPro 383的构建
合成将XhoI位点导入牛GnT-IVa基因起始密码子上游区域的引物(SEQ ID NO:19)和连接位置499Gly密码子之后终止密码子并将XbaI位点导入上述终止密码子下游区域的引物(CGly 499:SEQ IDNO:47)以通过PCR扩增牛GnT-IVa基因的部分序列。扩增的片段以XhoI和XbaI消化,并插入到pSVL载体(发玛西亚,瑞典)的XhoI和XbaI位点之间。这样,构建出表达牛GnT-IVa氨基酸序列至位置499(甘氨酸)的质粒pCGly 499。用CPro 465引物(SEQ ID NO:48),CLys 432引物(SEQ ID NO:49)或CPro 383引物(SEQ ID NO:50)代替CGly 499引物,以相同的方式构建三个其它的质粒。它们分别命名为pCPro 465(表达牛GnT-IVa氨基酸序列至位置465(脯氨酸)的质粒);pCLys 432(表达牛GnT-IVa氨基酸序列至位置432(赖氨酸)的质粒);和pCPro 383(表达牛GnT-IVa氨基酸序列至位置383(脯氨酸)的质粒)。
(2)表达牛GnT-IVa C-末端缺失突变体的质粒向COS7细胞中的导入
通过电穿孔将质粒pCGly 499,pCPro 465,pCLys 432p或pCPro383导入COS7细胞。得到的细胞于10% CO2,37℃下培养72小时。然后,回收细胞并悬浮于100μl缓冲液(5mM Tris-HCl,pH 7.5,2mM氯化镁,1mM苯甲磺酰氟)中,超声处理破碎且以2000×g离心5分钟以获得细胞提取物。
(3)牛GnT-IVa C-末端缺失突变体在COS7细胞中的表达
细胞提取物中GnT-IV的活性用参照实施例2中所述的方法测定。结果显示于表9中。与其中导入有pBGT4载体作为阳性对照的细胞提取物的GnT-IV活性相比,其中导入有pCGly 499、pCPro 465、pCLys432或pCPro 383的细胞提取物活性分别为每个细胞15.2%、12.1%、2.8%或104.2%。从这些结果,显示即使牛GnT-IVa氨基酸序列的位置384至C-末端的氨基酸被缺失,GnT-IV活性仍被维持。
                    表9
  质粒   比活性(pmol/hr/mg蛋白)   活性比率(%)
  pSVLpBGT4pCGly 499pCPro 465pCLys 432pCPro 383   77149172263179841015551   110015123104
反应时间:2小时
活性比率以相对于pBGT4总活性的百分数表示,pBGT4的总活性看成为100%。
[实施例11]大肠杆菌中表达各种GnT-IV基因质粒的构建及其表达
(1)牛GnT-IVa大肠杆菌表达质粒的构建
合成将BspHI位点导入牛GnT-IVa基因起始密码子上游区域的引物(BSP-N:SEQ ID NO:51)和将HindIII位点导入终止密码子下游区域的另一种引物(C-Hd:SEQ ID NO:52)以通过PCR扩增牛GnT-IVa基因的整个开放阅读框。扩增的片段以BspHI和HindIII消化,并导入pTrc99A载体(发玛西亚,瑞典)的NcoI和HindIII位点之间以构建质粒pEBGT4。用BSP-sN引物(SEQ ID NO:53)替代BSP-N引物及C-Hd引物,以类似的方式构建质粒pEIle 93。此外,用BSP-N引物,可将His-Tag、终止密码子和HindIII位点导入牛GnT-IVa基因C-末端下游区域的引物(CH-Hd:SEQ ID NO:54)和具有His-Tag、终止密码子和HindIII位点的引物(H-Hd:SEQ ID NO:55)扩增编码其中的His-Tag被添加至C-末端开放阅读框的基因,从而以同类似的方式构建质粒pEBGT4+His。
(2)人GnT-IVa基因和人GnT-IVb基因大肠杆菌表达质粒的构建
合成可在人GnT-IVa氨基酸序列位置94(Leu)上游区导入起始密码子和Ile密码子并在其进一步上游区也可导入BspHI位点的引物(4aBSPIL 94:SEQ ID NO:56);在C-末端氨基酸下游区导入His-Tag、终止密码子和HindIII位点的引物(4aCH-Hd:SEQ ID NO:57);和H-Hd引物以扩增部分的人GnT-IVa氨基酸序列的基因片段,其中被添加上编码His-Tag的序列。扩增的片段以BspHI和HindIII消化,并插入到pTrc99A载体(发玛西亚,瑞典)的NcoI和HindIII位点之间以构建质粒pMA4a+His。此外,用CP383H-Hd引物(SEQ IDNO:58)代替4aCH-Hd引物,以类似的方式构建质粒pCore+His。用将BspHI位点导入人GnT-IVb基因起始密码子上游区的引物(4bBSP-N:SEQ ID NO:59)和4bSACR引物(SEQ ID NO:60)扩增人GnT-IVb基因片段,以BspHI和SacI消化,且然后插入到pTrc99A载体(发玛西亚,瑞典)的NcoI和SacI位点之间。得到质粒的SacI和HindIII位点之间,用4bSACF引物(SEQ ID NO:61)、在人GnT-IVb氨基酸序列的C-末端导入His-Tag的引物(4bCH-Hd:SEQ ID NO:62)和H-Hd引物,扩增部分长度的人GnT-IVb基因,并以SacI和HindIII消化,然后插入以得到质粒pEHGT4-2+His。此外,用将NcoI位点和起始密码子导入人GnT-IVb氨基酸序列位置91(Gly)上游区的引物(4bNCOG91:SEQ ID NO:63)、4bCH-Hd引物和H-Hd引物扩增人GnT-IVb基因的部分序列,以NcoI和HindIII消化,且然后插入到pTrc99A载体(发玛西亚,瑞典)的NcoI和HindIII位点之间以构建质粒pMA4b+His。
(3)每种表达质粒向大肠杆菌BL21菌株中的导入
将每种质粒导入到通过钙方法而制备的大肠杆菌BL21菌株感受态细胞中。将得到的细胞培养于含100μg/ml氨苄青霉素的LB琼脂平板上。得到的以每种质粒转化的大肠杆菌菌落接种至LB液体培养基并于37℃振荡培养过夜。然后,将培养物接种至新鲜LB液体培养基以得到2%的浓度。当培养液混浊度(OD 595nm)约为0.1至0.2时向其中加入IPTG(异丙基b-D-硫代半乳糖吡喃糖苷)至1mm的终浓度。细胞于37℃培养2小时或于25℃培养4小时。然后,收获500μl的细胞。将细胞沉淀物悬浮于50μl缓冲液(5mM Tris-HCl,pH 7.5,2mM  MgCl2,1mM苯甲磺酰氟),超声处理打碎且以2000×g离心5分钟以获得作为上清的细胞提取物。
(4)大肠杆菌BL21菌株中每种表达质粒的表达
细胞提取物中GnT-IV活性通过参照实施例2中所述的方法测定。表10显示了牛基因的表达结果。虽然其中导入有pTrc99A载体作为对照的大肠杆菌细胞提取物几乎没有GnT-IV活性,但其中导入有pEBGT4的大肠杆菌细胞提取物具有一定的GnT-IV活性。从这些结果,证明GnT-IV酶可通过大肠杆菌制备。添加到牛GnT-IVa C-末端的His-Tag序列没有强烈地影响GnT-IV活性。因此,显示适当的tag序列可添加至GnT-IV酶上。其中的N-末端92个氨基酸被缺失的突变体显示出更强的GnT-IV活性。也显示在动物细胞中证实的GnT-IV酶变异体的表达在大肠杆菌中是可能的。
                     表10
  质粒   活性(pmol/hr/mg蛋白)   活性比率(%)
  pTrc99ApEBGT4pEBGT4+HispEIle93   0461130905841   010067127
反应时间:3.0小时
添加IPTG后,细胞于37℃培养2小时。
活性比率以相对于pEBGT4总活性的百分数表示,pEBGT4总活性看成为100%。
表11显示了人基因的表达结果。与其中导入有pTrc99A载体作为对照的大肠杆菌细胞提取物相比,其中导入有任何一种表达质粒的大肠杆菌细胞提取物具有显著的GnT-IV活性。如在牛GnT-IVa酶中所示,在人GnT-IVa和GnT-IVb酶中缺失N-末端序列而维持活性也是可能的。此外,既具有N-末端缺失又具有C-末端缺失的人GnT-IVa酶显示出高的GnT-IV活性(pCore+His)。这显示在这个突变体中的这些部分对GnT-IV活性不是必需的。
                    表11
  质粒   活性(pmol/hr/mg蛋白)   活性比率(%)
  pTrc99ApEBGT4+HispMA4a+HispCore+HispEHGT4-2+HispMA4b+His   0213903359397662702812   06371001184884
反应时间:4.0小时
加入IPTG后,细胞于25℃培养4小时。
活性比率以相对于pMA4a+His总活性的百分数表示,pMA4a+His总活性看成为100%。
[实施例12]通过将牛或人GnT-IVa基因导入产生-EPO的CHO细胞中而使重组人红细胞生成素(EPO)向糖链分支结构转换
(1)GnT-IVa表达质粒向产生-EPO CHO细胞中的导入
根据日本审查的专利公开No.2-17156中所述的方法构建产生-EPO的CHO细胞克隆。通过电穿孔将GnT-IVa表达质粒pBGT4或pHGT4-1导入得到的细胞克隆MO1和H-5。导入过程中,15μg表达质粒和1.5μg抗药标记质粒(来自Kaken Pharmaceutical的pSV2bsr或来自Clontech的pMAMneo)用于混合物中。电穿孔的细胞于10%CO2,37℃下培养约60小时。然后,向培养基中加入杀稻瘟素S(KakenPharmaceuticals)(终浓度:10μg/ml)或遗传霉素(生物技术公司)(终浓度:500μg/ml),细胞再培养10天至2周。这样,分离出抗这两种药物中任何一种的克隆。
(2)导入的GnT-IVa基因在产生-EPO的CHO细胞克隆中表达的验证
将产生-EPO的CHO细胞克隆(起始克隆)和单个药物抗性克隆培养于适当的规模。纯化每个克隆的总RNA。然后,用GnT-IVa基因的部分作为探针进行RNA点印迹分析以检测GnT-IVa mRNA的量。此外,在起始克隆中表达的GnT-IV活性和抗药克隆通过参照实施例2中所述的分析方法加以测定。筛选那些在RNA点印迹分析中产生强烈信号且较起始克隆显示出更高GnT-IV活性的克隆并用于EPO生产。筛选出的克隆具有增加的GnT-IV活性;例如,MO1(牛GnT-IVa)#36较MO1克隆显示出约104倍的增加,且H-5(人GnT-IVa)#23较H-5克隆显示出约125倍的增加。
(3)用导入GnT-IVa基因的产生-EPO的CHO细胞克隆生产EPO
EPO分泌表达至培养液中。然后,将产生-EPO的CHO细胞克隆MO1和H-5,和上述的克隆MO1(牛GnT-IVa)#36和H-5(人GnT-IVa)#23培养于滚瓶中。首先,将每种克隆贴壁培养于培养基中,且然后将1.5×107个细胞转入含200ml培养基的滚瓶中。细胞于10% CO2,37℃下培养3天从而使它们一致地附着到瓶上。之后,倒去培养基,并以PBS缓冲液洗细胞。然后,将200ml无血清培养基加入到瓶中,其中的细胞于10% CO2,37℃下培养7天。之后,回收培养上清。作为培养基,使用了D-MEM/F12混合培养基,其中补充以5%胎牛血清,290mg/升L-谷氨酸,1×MEM非必需氨基酸溶液和100nM的氨甲蝶呤。作为无血清的培养基,使用了没有胎牛血清的上述培养基。每种无血清培养上清中含有的EPO用抗-人EPO抗体通过ELISA加以定量。
(4)根据其糖链结构对导入GnT-IVa基因或没有导入该基因的克隆产生EPOs的分析
在等电聚焦凝胶中重组EPO没有作为单个分子存在;它是带各种电荷分子的混合物。由于蛋白的部分没有变化,故显示这些分子中的电荷差异是基于糖链结构的不同;这种分子混合物称为糖形式(glycoforms)[Watson,E.和Yao,F.,生化年鉴(1993),210,389-93]。EPO具有3个Asn-连接的糖链;单个糖链的分支结构从双天线型至四天线型而变化。Gal(半乳糖)进一步附着到每种分支GlcNAc的末端,且唾液酸进一步附着到此Gal上。因此,如果糖链分支程度通过导入GnT-IVa基因而增加。附着到Gal上的唾液酸分子数目增加,且因此,具有低等电点的糖形式含量将增加。然后,本发明者通过等电点聚焦分析以检测导入GnT-IVa基因的产生-EPO的细胞产生的EPO糖链结构的变化。
对于等电聚焦,使用了发玛西亚生产的Multiphor II设备。凝胶由5%丙烯酰胺(30∶0.8)和1.5% Pharmelyte  2.5-5(发玛西亚)所组成。作为(+)极溶液,使用了0.1M的硫酸。作为(-)极溶液,使用了0.2M的L-组氨酸。等电点聚焦后,将样品电泳转移至PVDF膜上,然后用抗-EPO小鼠单克隆抗体的Western印迹以检测单个EPOs糖形式的条带。简言之,如果必要,每种细胞克隆的无血清培养上清以Centriplus30和Microcon 30(均由Amicon生产)浓缩至约7-100倍。开始时,约50-100IU的EPO用作样品,但适当地调整此样品量从而使由Western印迹分析检测到的条带密度在样品间几乎相等。
当来自MO1克隆的EPO与来自MO1(牛GnT-IVa)#36克隆的EPO比较时,证实了后者主要糖形式的位置表现出向至少一个糖形式低pI一侧(+电极溶液一侧)的迁移(图19)。从这些结果,认为由于基因导入而表达的GnT-IVa酶增加了附着到EPO Asn-连接糖链中GlcNAc分支的数目,因而增加了附着唾液酸分子的数目从而增加了具有低等电点糖形式的含量。对H-5克隆和H-5(人GnT-IVa)#23克隆进行了类似的分析。结果,也发现在后者中主要EPO糖形式的位置迁移至低pI一侧(图19)。
从上述,证实修饰通过导入GnT-IVa基因至任何细胞而制备蛋白的Asn-连接糖链结构是可能的。
工业应用性
根据本发明,提供了新的β1→4N-乙酰-葡糖胺基转移酶(GnT-IV)、用于制备GnT-IV酶的方法和编码GnT-IV的基因。有了本发明的GnT-IV,制备用传统的糖基转移酶不能形成的具有分支结构的糖缀合物变为可能。因此,本发明的GnT-IV不仅对制备或改善糖缀合物型药物、试剂和食物是有用的,而且对修饰任何生物高分子的糖链结构也是有用的。
本发明的GnT-IV基因对于诊断或治疗疾病如癌症和修饰微生物产生的糖缀合物产物糖链结构也是有用的。
此外,产生的抗作为抗原的本发明GnT-IV蛋白的抗体或抗血清,或作为探针的本发明GnT-IV基因的部分或全长对微生物、培养细胞、各种动物组织、血细胞及血液的特征描述或诊断患病细胞或组织如癌症是有用的。
                    序列表
SEQ ID NO:1
序列长度:8
序列类型:氨基酸
拓扑学:线性
分子类型:肽
序列描述
Asp Asn Leu Tyr Pro Glu Glu Lys
                  5
SEQ ID NO:2
序列长度:11
序列类型:氨基酸
拓扑学:线性
分子类型:肽
序列描述
Asp Tyr Val Asn Gly Val Val Ala Asn Glu Lys
                  5                  10
SEQ ID NO:3
序列长度:21
序列类型:氨基酸
拓扑学:线性
分子类型:肽
序列描述
Glu Ile Ser Ser Gly Leu Val Glu Ile Ile Ser Pro Pro Glu Ser Tyr
                  5                  10                  15
Tyr Pro Asp Leu Thr
             20
SEQ ID NO:4
序列长度:8
序列类型:氨基酸
拓扑学:线性
分子类型:肽
序列描述
Glu Arg Val Arg Trp Arg Thr Lys
                  5
SEQ ID NO:5
序列长度:15
序列类型:氨基酸
拓扑学:线性
分子类型:肽
序列描述
Lys Gln Asn Leu Asp Tyr Cys Phe Leu Met Met Tyr Ala Gln Glu
                  5                  10                  15
SEQ ID NO:6
序列长度:6
序列类型:氨基酸
拓扑学:线性
分子类型:肽
序列描述
Asp His Ile Leu Trp Val
                  5
SEQ ID NO:7
序列长度:14
序列类型:氨基酸
拓扑学:线性
分子类型:肽
序列描述
Lys Ile His Val Asn Pro Pro Ala Glu Val Ser Thr Ser Leu
                  5                  10
SEQ ID NO:8
序列长度:10
序列类型:氨基酸
拓扑学:线性
分子类型:肽
序列描述
Lys Val Tyr Gln Gly His Thr Leu Glu Lys
                  5                  10
SEQ ID NO:9
序列长度:10
序列类型:氨基酸
拓扑学:线性
分子类型:肽
序列描述
Asp Phe Phe Trp Ala Ile Thr Pro Val Ala
                  5                  10
SEQ ID NO:10
序列长度:6
序列类型:氨基酸
拓扑学:线性
分子类型:肽
序列描述
Asp Tyr Ile Leu Phe Lys
                  5
SEQ ID NO:11
序列长度:15
序列类型:氨基酸
拓扑学:线性
分子类型:肽
序列描述
Asp Lys Pro Val Asn Val Glu Ser Tyr Leu Phe His Ser Gly Asn
                  5                  10
SEQ ID NO:12
序列长度:10
序列类型:氨基酸
拓扑学:线性
分子类型:肽
序列描述
Asp Ile Leu Leu X Thr Thr Val Glu Val
                5                  10
SEQ ID NO:13
序列长度:9
序列类型:氨基酸
拓扑学:线性
分子类型:肽
序列描述
Lys Ser Glu Gly Leu Asp Ile Ser Lys
                  5
SEQ ID NO:14
序列长度:8
序列类型:氨基酸
拓扑学:线性
分子类型:肽
序列描述
Asp Gly Tyr Phe Arg Ile Gly Lys
                  5
SEQ ID NO:15
序列长度:29
序列类型:核酸
链型:单链
拓扑学:线性
分子类型:合成DNA
序列描述
AAR ATY CAY GTB AAY CCH CCH GCN GAR GT       29
Lys Ile His Val Asn Pro Pro Ala Glu Val
SEQ ID NO:16
序列长度:35
序列类型:核酸
链型:单链
拓扑学:线性
分子类型:合成DNA
反义:是
序列描述
TG RAA VAR RTA RSW YTC VAC RTT VAC DGG YTT RTC  35
His Phe Leu Tyr Ser Glu Val Asn Val Pro Lys Asp
SEQ ID NO:17
序列长度:2246
序列类型:核酸
链型:双链
拓扑学:线性
分子类型:cDNA
序列描述
GGCGGCTGCT CGGTGGCGGC TCGTCGGCGG CCGCGGCAGG ACTGGCAGCG CCGGCGGCGG  60
GGAGAAAGAA GCATCCACCT ATGAAGACCG TGCAGACAGT CCTGAATAAT AATTGTGAAT 120
GGTGTGGCTG CCAGACTAGT TCTGCTGAGC ATCTGAAATG AACCTCTCCT ATTGATTGTT 180
TCAGTTGGCC CCGAGCCAGG AGTACTGGGT TTGCTTGACT TCAGGATAAA AAGAAACGGA 240
CTTGGTTATC ATCGTAAACA TATGAACCAG TGTGATGGTG AAATGAG ATG AGG CTC   296
                                                    Met Arg Leu
                                                      1
CGA AAT GGA ACT GTA GCC ACT GTT TTA GCA TTT ATC ACC TCG TTC CTC 344
Arg Asn Gly Thr Val Ala Thr Val Leu Ala Phe Ile Thr Ser Phe Leu
      5                  10                  15
ACT TTA TCT TGG TAT ACA ACA TGG CAA AAT GGG AAA GAA AAA GTG ATT 392
Thr Leu Ser Trp Tyr Thr Thr Trp Gln Asn Gly Lys Glu Lys Val Ile
 20                  25                  30                  35
GCT TAT CAA CGA GAA TTT CTT GCT CTG AAA GAA CGT CTC CGA ATA GCT 440
Ala Tyr Gln Arg Glu Phe Leu Ala Leu Lys Glu Arg Leu Arg Ile Ala
                 40                  45                  50
GAA CAT CGA ATC TCT CAG CGC TCT TCT GAG CTC AGT GCC ATT GTA CAG 488
Glu His Arg Ile Ser Gln Arg Ser Ser Glu Leu Ser Ala Ile Val Gln
             55                  60                  65
CAA TTC AAG CGT GTA GAA GCA GAA ACA AAC AGG AGT AAG GAT CCA GTG 536
Gln Phe Lys Arg Val Glu Ala Glu Thr Asn Arg Ser Lys Asp Pro Val
         70                  75                  80
AAT AAA TTT TCA GAT GAT ACC CTA AAG ATA CTA AAG GAG TTA ACA AGC 584
Asn Lys Phe Ser Asp Asp Thr Leu Lys Ile Leu Lys Glu Leu Thr Ser
     85                  90                  95
AAA AAG TCT CTT CAA GTG CCA AGT ATT TAT TAT CAT TTG CCT CAT TTA 632
Lys Lys Ser Leu Gln Val Pro Ser Ile Tyr Tyr His Leu Pro His Leu
100                 105                 110                 115
TTG CAA AAT GAA GGA AGC CTT CAA CCT GCC GTG CAG ATC GGA AAT GGA 680
Leu Gln Asn Glu Gly Ser Leu Gln Pro Ala Val Gln Ile Gly Asn Gly
                120                 125                 130
CGA ACA GGA GTT TCA ATA GTA ATG GGA ATT CCT ACA GTG AAG AGA GAA 728
Arg Thr Gly Val Ser Ile Val Met Gly Ile Pro Thr Val Lys Arg Glu
            135                 140                 145
GTT AAA TCT TAC CTC ATA GAA ACT CTT CAT TCC CTT ATT GAT AAT CTG 776
Val Lys Ser Tyr Leu Ile Glu Thr Leu His Ser Leu Ile Asp Asn Leu
        150                 155                 160
TAT CCT GAA GAG AAG TTG GAC TGT GTT ATA GTA GTC TTC ATA GGA GAG 824
Tyr Pro Glu Glu Lys Leu Asp Cys Val Ile Val Val Phe Ile Gly Glu
    165                 170                 175
ACA GAT ACT GAT TAT GTA AAT GGT GTT GTA GCC AAC CTG GAG AAA GAA 872
Thr Asp Thr Asp Tyr Val Asn Gly Val Val Ala Asn Leu Glu Lys Glu
180                 185                 190                 195
TTT TCT AAA GAA ATC AGT TCT GGC TTG GTG GAA ATA ATA TCA CCT CCT 920
Phe Ser Lys Glu Ile Ser Ser Gly Leu Val Glu Ile Ile Ser Pro Pro
                200                 205                 210
GAA AGC TAT TAT CCT GAC CTG ACG AAC TTA AAG GAG ACA TTT GGA GAT 968
Glu Ser Tyr Tyr Pro Asp Leu Thr Asn Leu Lys Glu Thr Phe Gly Asp
            215                 220                 225
TCT AAA GAA AGA GTA AGA TGG AGA ACA AAG CAA AAC CTA GAT TAT TGT 1016
Ser Lys Glu Arg Val Arg Trp Arg Thr Lys Gln Asn Leu Asp Tyr Cys
        230                 235                 240
TTT CTA ATG ATG TAT GCT CAG GAA AAA GGC ACA TAC TAC ATC CAG CTT 1064
Phe Leu Met Met Tyr Ala Gln Glu Lys Gly Thr Tyr Tyr Ile Gln Leu
    245                 250                 255
GAA GAT GAT ATT ATT GTC AAA CAG AAT TAC TTT AAC ACC ATA AAG AAT 1112
Glu Asp Asp Ile Ile Val Lys Gln Asn Tyr Phe Asn Thr Ile Lys Asn
260                 265                 270                 275
TTT GCA CTT CAA CTT TCT TCT GAG GAA TGG ATG ATA CTT GAG TTC TCC 1160
Phe Ala Leu Gln Leu Ser Ser Glu Glu Trp Met Ile Leu Glu Phe Ser
                280                 285                 290
CAG CTG GGA TTC ATT GGT AAA ATG TTT CAA GCA CCT GAC CCA CTC CTG 1208
Gln Leu Gly Phe Ile Gly Lys Met Phe Gln Ala Pro Asp Leu Thr Leu
            295                 300                 305
ATT GTG GAA TTC ATA TTT ATG TTC TAT AAG GAG AAG CCC ATC GAC TGG 1256
Ile Val Glu Phe Ile Phe Met Phe Tyr Lys Glu Lys Pro Ile Asp Trp
        310                 315                 320
CTC TTG GAC CAT ATT CTG TGG GTC AAA GTC TGC AAC CCG GAA AAA GAT 1304
Leu Leu Asp His Ile Leu Trp Val Lys Val Cys Asn Pro Glu Lys Asp
    325                 330                 335
GCA AAA CAC TGT GAT CGA CAG AAG GCA AAT CTG CGA ATT CGT TTC AGA 1352
Ala Lys His Cys Asp Arg Gln Lys Ala Asn Leu Arg Ile Arg Phe Arg
340                 345                 350                 355
CCG TCC CTT TTC CAA CAC GTT GGT CTG CAT TCT TCA CTC ACA GGA AAA 1400
Pro Ser Leu Phe Gln His Val Gly Leu His Ser Ser Leu Thr Gly Lys
                360                 365                 370
ATT CAG AAA CTC ACG GAT AAA GAT TAC ATG AAA CCA TTA CTG CTC AAA 1448
Ile Gln Lys Leu Thr Asp Lys Asp Tyr Met Lys Pro Leu Leu Leu Lys
            375                 380                 385
ATC CAT GTA AAC CCC CCT GCA GAG GTA TCT ACT TCT TTG AAG GTC TAC 1496
Ile His Val Asn Pro Pro Ala Glu Val Ser Thr Ser Leu Lys Val Tyr
        390                 395                 400
CAA GGT CAT ACA CTG GAG AAA ACT TAC ATG GGT GAG GAC TTC TTC TGG 1544
Gln Gly His Thr Leu Glu Lys Thr Tyr Met Gly Glu Asp Phe Phe Trp
    405                 410                 415
GCT ATA ACC CCA GTA GCT GGA GAC TAC ATC CTA TTT AAA TTC GAC AAG 1592
Ala Ile Thr Pro Val Ala Gly Asp Tyr Ile Leu Phe Lys Phe Asp Lys
420                 425                 430                 435
CCA GTC AAT GTG GAA AGT TAT TTG TTC CAT AGT GGC AAC CAG GAT CAT 1640
Pro Val Asn Val Glu Ser Tyr Leu Phe His Ser Gly Asn Gln Asp His
                440                 445                 450
CCA GGG GAT ATT CTG CTC AAC ACA ACG GTG GAA GTT CTG CCT TTG AAG 1688
Pro Gly Asp Ile Leu Leu Asn Thr Thr Val Glu Val Leu Pro Leu Lys
            455                 460                 465
AGT GAA GGT TTG GAC ATC AGC AAA GAA ACC AAA GAC AAA CGA TTA GAA 1736
Ser Glu Gly Leu Asp Ile Ser Lys Glu Thr Lys Asp Lys Arg Leu Glu
        470                 475                 480
GAT GGC TAT TTC AGA ATA GGG AAA TTT GAA AAC GGT GTT GCG GAA GGG 1784
Asp Gly Tyr Phe Arg Ile Gly Lys Phe Glu Asn Gly Val Ala Glu Gly
    485                 490                 495
ATG GTG GAT CCC AGC CTA AAC CCC ATT TCG GCC TTC CGA CTT TCA GTT 1832
Met Val Asp Pro Ser Leu Asn Pro Ile Ser Ala Phe Arg Leu Ser Val  500
500                 505                 510                 515
ATT CAG AAT TCT GCT GTT TGG GCC ATT CTT AAT GAG ATC CAT ATT AAA 1880
Ile Gln Asn Ser Ala Val Trp Ala Ile Leu Asn Glu Ile His Ile Lys
                520                 525                 530
AAA GTC ACA AAC TGACCATC                                          1900
Lys Val Thr Asn
            535
TCTACTAAGA AACCAACACA TTTTTTCCCT GTGAATTTGT TGATTAAAGA CAGCTGAGCA 1960
CGTACCTTTT TTTGGTAACT TGAATTCTAC CTCTCGCGAA ATCTACTGTA GATAAAATGA 2020
TTGTCATATT TCCACTTGGA AAATGAATCT CCCACGGATA ATTGTATTCA TTTGAATCTA 2080
AGCTGTCCTC CAGTTTTAAC TCAACTCAAA CGTTTTACAG TTATGACAGC CTGTTAATAT 2140
GACTTGTACT ATTTTGGTAT TATACTAATA CATAAGAGTT GTACATATTG TTACATTCAT 2200
TAAATTTGAG AAAAATTAAT GTTAAATACA TTTTATGAAC GGGCCG                2246
SEQ ID NO:18
序列长度:535
序列类型:氨基酸
拓扑学:线性
分子类型:肽
序列描述
Met Arg Leu Arg Asn Gly Thr Val Ala Thr Val Leu Ala Phe Ile Thr
  1               5                  10                  15
Ser Phe Leu Thr Leu Ser Trp Tyr Thr Thr Trp Gln Asn Gly Lys Glu
             20                  25                  30
Lys Val Ile Ala Tyr Gln Arg Glu Phe Leu Ala Leu Lys Glu Arg Leu
         35                  40                  45
Arg Ile Ala Glu His Arg Ile Ser Gln Arg Ser Ser Glu Leu Ser Ala
     50                  55                  60
Ile Val Gln Gln Phe Lys Arg Val Glu Ala Glu Thr Asn Arg Ser Lys
65                  70                  75                  80
Asp Pro Val Asn Lys Phe Ser Asp Asp Thr Leu Lys Ile Leu Lys Glu
                 85                  90                  95
Leu Thr Ser Lys Lys Ser Leu Gln Val Pro Ser Ile Tyr Tyr His Leu
            100                 105                 110
Pro His Leu Leu Gln Asn Glu Gly Ser Leu Gln Pro Ala Val Gln Ile
        115                 120                 125
Gly Asn Gly Arg Thr Gly Val Ser Ile Val Met Gly Ile Pro Thr Val
    130                 135                 140
Lys Arg Glu Val Lys Ser Tyr Leu Ile Glu Thr Leu His Ser Leu Ile
145                 150                 155                 160
Asp Asn Leu Tyr Pro Glu Glu Lys Leu Asp Cys Val Ile Val Val Phe
                165                 170                 175
Ile Gly Glu Thr Asp Thr Asp Tyr Val Asn Gly Val Val Ala Asn Leu
            180                 185                 190
Glu Lys Glu Phe Ser Lys Glu Ile Ser Ser Gly Leu Val Glu Ile Ile
        195                 200                 205
Ser Pro Pro Glu Ser Tyr Tyr Pro Asp Leu Thr Asn Leu Lys Glu Thr
    210                 215                 220
Phe Gly Asp Ser Lys Glu Arg Val Arg Trp Arg Thr Lys Gln Asn Leu
225                 230                 235                 240
Asp Tyr Cys Phe Leu Met Met Tyr Ala Gln Glu Lys Gly Thr Tyr Tyr
                245                 250                 255
Ile Gln Leu Glu Asp Asp Ile Ile Val Lys Gln Asn Tyr Phe Asn Thr
            260                 265                 270
Ile Lys Asn Phe Ala Leu Gln Leu Ser Ser Glu Glu Trp Met Ile Leu
        275                 280                 285
Glu Phe Ser Gln Leu Gly Phe Ile Gly Lys Met Phe Gln Ala Pro Asp
    290                 295                 300
Leu Thr Leu Ile Val Glu Phe Ile Phe Met Phe Tyr Lys Glu Lys Pro
305                 310                 315                 320
Ile Asp Trp Leu Leu Asp His Ile Leu Trp Val Lys Val Cys Asn Pro
                325                 330                 335
Glu Lys Asp Ala Lys His Cys Asp Arg Gln Lys Ala Asn Leu Arg Ile
            340                 345                 350
Arg Phe Arg Pro Ser Leu Phe Gln His Val Gly Leu His Ser Ser Leu
        355                 360                 365
Thr Gly Lys Ile Gln Lys Leu Thr Asp Lys Asp Tyr Met Lys Pro Leu
    370                 375                 380
Leu Leu Lys Ile His Val Asn Pro Pro Ala Glu Val Ser Thr Ser Leu
385                 390                 395                 400
Lys Val Tyr Gln Gly His Thr Leu Glu Lys Thr Tyr Met Gly Glu Asp
                405                 410                 415
Phe Phe Trp Ala Ile Thr Pro Val Ala Gly Asp Tyr Ile Leu Phe Lys
            420                 425                 430
Phe Asp Lys Pro Val Asn Val Glu Ser Tyr Leu Phe His Ser Gly Asn
        435                 440                 445
Gln Asp His Pro Gly Asp Ile Leu Leu Asn Thr Thr Val Glu Val Leu
    450                 455                 460
Pro Leu Lys Ser Glu Gly Leu Asp Ile Ser Lys Glu Thr Lys Asp Lys
465                 470                 475                 480
Arg Leu Glu Asp Gly Tyr Phe Arg Ile Gly Lys Phe Glu Asn Gly Val
                485                 490                 495
Ala Glu Gly Met Val Asp Pro Ser Leu Asn Pro Ile Ser Ala Phe Arg
            500                 505                 510
Leu Ser Val Ile Gln Asn Ser Ala Val Trp Ala Ile Leu Asn Glu Ile
        515                 520                 525
His Ile Lys Lys Val Thr Asn
    530                 535
SEQ ID NO:19
序列长度:31
序列类型:核酸
链型:单链
拓扑学:线性
分子类型:合成DNA
序列描述
CCCTCGAG ATG AGG CTC CGA AAT GGA ACT GT    31
         Met Arg Leu Arg Asn Gly Thr Val
SEQ ID NO:20
序列长度:31
序列类型:核酸
链型:单链
拓扑学:线性
分子类型:合成DNA
反义:是
序列描述
TTTCTAGA TCA GTT TGT GAC TTT TTT AAT AT  31
         TRM Asn Thr Val Lys Lys Ile His
SEQ ID NO:21
序列长度:24
序列类型:核酸
链型:单链
拓扑学:线性
分子类型:合成DNA
序列描述
ACGATTGTGC AACAGTTCAA GCGT  24
SEQ ID NO:22
序列长度:24
序列类型:核酸
链型:单链
拓扑学:线性
分子类型:合成DNA
序列描述
GGGAGAACTC CAGGATCATC CAGT  24
SEQ ID NO:23
序列长度:2115
序列类型:核酸
链型:双链
拓扑学:线性
分子类型:cDNA
序列描述
GAAATGAACC TCTCTTATTG ATTTTTATTG GCCTAGAGCC AGGAGTACTG CATTCAGTTG  60
ACTTTCAGGG TAAAAAGAAA ACAGTCCTGG TTGTTGTCAT CATAAACATA TGGACCAGTG 120
TGATGGTGAA ATGAG ATG AGG CTC CGC AAT GGA ACT GTA GCC ACT GCT TTA  171
                 Met Arg Leu Arg Asn Gly Thr Val Ala Thr Ala Leu
                   1               5                  10
GCA TTT ATC ACT TCC TTC CTT ACT TTG TCT TGG TAT ACT ACA TGG CAA 219
Ala Phe Ile Thr Ser Phe Leu Thr Leu Ser Trp Tyr Thr Thr Trp Gln
         15                  20                  25
AAT GGG AAA GAA AAA CTG ATT GCT TAT CAA CGA GAA TTC CTT GCT TTG 267
Asn Gly Lys Glu Lys Leu Ile Ala Tyr Gln Arg Glu Phe Leu Ala Leu
     30                  35                  40
AAA GAA CGT CTT CGA ATA GCT GAA CAC AGA ATC TCA CAG CGC TCT TCT 315
Lys Glu Arg Leu Arg Ile Ala Glu His Arg Ile Ser Gln Arg Ser Ser
45                  50                  55                  60
GAA TTA AAT ACG ATT GTG CAA CAG TTC AAG CGT GTA GGA GCA GAA ACA 363
Glu Leu Asn Thr Ile Val Gln Gln Phe Lys Arg Val Gly Ala Glu Thr
                 65                  70                  75
AAT GGA AGT AAG GAT GCG TTG AAT AAG TTT TCA GAT AAT ACC CTA AAG 411
Asn Gly Ser Lys Asp Ala Leu Asn Lys Phe Ser Asp Asn Thr Leu Lys
             80                  85                  90
CTG TTA AAG GAG TTA ACA AGC AAA AAA TCT CTT CAA GTG CCA AGT ATT 459
Leu Leu Lys Glu Leu Thr Ser Lys Lys Ser Leu Gln Val Pro Ser Ile
         95                 100                 105
TAT TAT CAT TTG CCT CAT TTA TTG AAA AAT GAA GGA AGT CTT CAA CCT 507
Tyr Tyr His Leu Pro His Leu Leu Lys Asn Glu Gly Ser Leu Gln Pro
    110                 115                 120
GCT GTA CAG ATT GGC AAC GGA AGA ACA GGA GTT TCA ATA GTC ATG GGC 555
Ala Val Gln Ile Gly Asn Gly Arg Thr Gly Val Ser Ile Val Met Gly
125                 130                 135                 140
ATT CCC ACA GTG AAG AGA GAA GTT AAA TCT TAC CTC ATA GAA ACT CTT 603
Ile Pro Thr Val Lys Arg Glu Val Lys Ser Tyr Leu Ile Glu Thr Leu
                145                 150                 155
CAT TCC CTT ATT GAT AAC CTG TAT CCT GAA GAG AAG TTG GAC TGT GTT 651
His Ser Leu Ile Asp Asn Leu Tyr Pro Glu Glu Lys Leu Asp Cys Val
            160                 165                 170
ATA GTA GTC TTC ATA GGA GAG ACA GAT ATT GAT TAT GTA CAT GGT GTT 699
Ile Val Val Phe Ile Gly Glu Thr Asp Ile Asp Tyr Val His Gly Val
        175                 180                 185
GTA GCC AAC CTG GAG AAA GAA TTT TCT AAA GAA ATC AGT TCT GGC TTG 747
Val Ala Asn Leu Glu Lys Glu Phe Ser Lys Glu Ile Ser Ser Gly Leu
    190                 195                 200
GTG GAA GTC ATA TCA CCC CCT GAA AGC TAT TAT CCT GAC TTG ACA AAC 795
Val Glu Val Ile Ser Pro Pro Glu Ser Tyr Tyr Pro Asp Leu Thr Asn
205                 210                 215                 220
CTA AAG GAG ACA TTT GGA GAC TCC AAA GAA AGA GTA AGA TGG AGA ACA 843
Leu Lys Glu Thr Phe Gly Asp Ser Lys Glu Arg Val Arg Trp Arg Thr
                225                 230                 235
AAG CAA AAC CTA GAT TAC TGT TTT CTA ATG ATG TAT GCT CAA GAA AAG 891
Lys Gln Asn Leu Asp Tyr Cys Phe Leu Met Met Tyr Ala Gln Glu Lys
            240                 245                 250
GGC ATA TAT TAC ATT CAG CTT GAA GAT GAT ATT ATT GTC AAA CAA AAT 939
Gly Ile Tyr Tyr Ile Gln Leu Glu Asp Asp Ile Ile Val Lys Gln Asn
        255                 260                 265
TAT TTT AAT ACC ATA AAA AAT TTT GCA CTT CAA CTT TCT TCT GAG GAA 987
Tyr Phe Asn Thr Ile Lys Asn Phe Ala Leu Gln Leu Ser Ser Glu Glu
    270                 275                 280
TGG ATG ATT CTA GAG TTT TCC CAG CTG GGC TTC ATT GGT AAA ATG TTT 1035
Trp Met Ile Leu Glu Phe Ser Gln Leu Gly Phe Ile Gly Lys Met Phe
285                 290                 295                 300
CAA GCG CCG GAT CTT ACT CTG ATT GTA GAA TTC ATA TTC ATG TTT TAC 1083
Gln Ala Pro Asp Leu Thr Leu Ile Val Glu Phe Ile Phe Met Phe Tyr
                305                 310                 315
AAG GAG AAA CCC ATT GAT TGG CTC CTG GAC CAT ATT CTC TGG GTG AAA 1131
Lys Glu Lys Pro Ile Asp Trp Leu Leu Asp His Ile Leu Trp Val Lys
            320                 325                 330
GTC TGC AAC CCT GAA AAA GAT GCA AAA CAT TGT GAT AGA CAG AAA GCA 1179
Val Cys Asn Pro Glu Lys Asp Ala Lys His Cys Asp Arg Gln Lys Ala
        335                 340                 345
AAT CTG CGA ATT CGC TTC AGA CCT TCC CTT TTC CAA CAT GTT GGT CTG 1227
Asn Leu Arg Ile Arg Phe Arg Pro Ser Leu Phe Gln His Val Gly Leu
    350                 355                 360
CAC TCA TCA CTA TCA GGA AAA ATC CAA AAA CTC ACG GAT AAA GAT TAT 1275
His Ser Ser Leu Ser Gly Lys Ile Gln Lys Leu Thr Asp Lys Asp Tyr
365                 370                 375                 380
ATG AAA CCA TTA CTT CTT AAA ATC CAT GTA AAC CCA CCT GCG GAG GTA 1323
Met Lys Pro Leu Leu Leu Lys Ile His Val Asn Pro Pro Ala Glu Val
                385                 390                 395
TCT ACT TCC TTG AAG GTC TAC CAA GGG CAT ACG CTG GAG AAA ACT TAC 1371
Ser Thr Ser Leu Lys Val Tyr Gln Gly His Thr Leu Glu Lys Thr Tyr
            400                 405                 410
ATG GGA GAG GAT TTC TTC TGG GCT ATC ACA CCG ATA GCT GGA GAC TAC 1419
Met Gly Glu Asp Phe Phe Trp Ala Ile Thr Pro Ile Ala Gly Asp Tyr
        415                 420                 425
ATC TTG TTT AAA TTT GAT AAA CCA GTC AAT GTA GAA AGT TAT TTG TTC 1467
Ile Leu Phe Lys Phe Asp Lys Pro Val Asn Val Glu Ser Tyr Leu Phe
    430                 435                 440
CAT AGC GGC AAC CAA GAA CAT CCT GGA GAT ATT CTG CTA AAC ACA ACT 1515
His Ser Gly Asn Gln Glu His Pro Gly Asp Ile Leu Leu Asn Thr Thr
445                 450                 455                 460
GTG GAA GTT TTG CCT TTT AAG AGT GAA GGT TTG GAA ATA AGC AAA GAA 1563
Val Glu Val Leu Pro Phe Lys Ser Glu Gly Leu Glu Ile Ser Lys Glu
                465                 470                 475
ACC AAA GAC AAA CGA TTA GAA GAT GGC TAT TTC AGA ATA GGA AAA TTT 1611
Thr Lys Asp Lys Arg Leu Glu Asp Gly Tyr Phe Arg Ile Gly Lys Phe
            480                 485                 490
GAG AAT GGT GTT GCA GAA GGA ATG GTG GAT CCA AGT CTC AAT CCC ATT 1659
Glu Asn Gly Val Ala Glu Gly Met Val Asp Pro Ser Leu Asn Pro Ile
        495                 500                 505
TCA GCC TTT CGA CTT TCA GTT ATT CAG AAT TCT GCT GTT TGG GCC ATT 1707
Ser Ala Phe Arg Leu Ser Val Ile Gln Asn Ser Ala Val Trp Ala Ile
    510                 515                 520
CTT AAT GAG ATT CAT ATT AAA AAA GCC ACC AAC TGATCATCTG AGAAACCAAC 1760
Leu Asn Glu Ile His Ile Lys Lys Ala Thr Asn
525                 530                 535
ACATTTTTTC CTGTGAATTT GTTAATTAAA GATAGTTAAG CATGTATCTT TTTTTTATTT 1820
CTACTTGAAC ACTACCTCTT GTGAAGTCTA CTGTAGATAA GACGATTGTC ATTTCCACTT 1880
GGAAAGTGAA TCTCCCATAA TAATTGTATT TGTTTGAAAC TAAGCTGTCC TCAGATTTTA 1940
ACTTGACTCA AACATTTTTC AATTATGACA GCCTGTTAAT ATGACTTGTA CTATTTTGGT 2000
ATTATACTAA TACATAAGAG TTGTACATAT TGTTACATTC TTTAAATTTG AGAAAAACTA 2060
ATGTTACATA CATTTTATGA AGGGGGTACT TTTGAGGTTC ACTTATTTTA CTATT      2115
SEQ ID NO:24
序列长度:535
序列类型:氨基酸
拓扑学:线性
分子类型:肽
序列描述
Met Arg Leu Arg Asn Gly Thr Val Ala Thr Ala Leu Ala Phe Ile Thr
  1               5                  10                  15
Ser Phe Leu Thr Leu Ser Trp Tyr Thr Thr Trp Gln Asn Gly Lys Glu
             20                  25                  30
Lys Leu Ile Ala Tyr Gln Arg Glu Phe Leu Ala Leu Lys Glu Arg Leu
         35                  40                  45
Arg Ile Ala Glu His Arg Ile Ser Gln Arg Ser Ser Glu Leu Asn Thr
     50                  55                  60
Ile Val Gln Gln Phe Lys Arg Val Gly Ala Glu Thr Asn Gly Ser Lys
 65                  70                  75                  80
Asp Ala Leu Asn Lys Phe Ser Asp Asn Thr Leu Lys Leu Leu Lys Glu
                 85                  90                  95
Leu Thr Ser Lys Lys Ser Leu Gln Val Pro Ser Ile Tyr Tyr His Leu
            100                 105                 110
Pro His Leu Leu Lys Asn Glu Gly Ser Leu Gln Pro Ala Val Gln Ile
        115                 120                 125
Gly Asn Gly Arg Thr Gly Val Ser Ile Val Met Gly Ile Pro Thr Val
    130                 135                 140
Lys Arg Glu Val Lys Ser Tyr Leu Ile Glu Thr Leu His Ser Leu Ile
145                 150                 155                 160
Asp Asn Leu Tyr Pro Glu Glu Lys Leu Asp Cys Val Ile Val Val Phe
                165                 170                 175
Ile Gly Glu Thr Asp Ile Asp Tyr Val His Gly Val Val Ala Asn Leu
             180                 185                 190
Glu Lys Glu Phe Ser Lys Glu Ile Ser Ser Gly Leu Val Glu Val Ile
        195                 200                 205
Ser Pro Pro Glu Ser Tyr Tyr Pro Asp Leu Thr Asn Leu Lys Glu Thr
    210                 215                 220
Phe Gly Asp Ser Lys Glu Arg Val Arg Trp Arg Thr Lys Gln Asn Leu
225                 230                 235                 240
Asp Tyr Cys Phe Leu Met Met Tyr Ala Gln Glu Lys Gly Ile Tyr Tyr
                245                 250                 255
Ile Gln Leu Glu Asp Asp Ile Ile Val Lys Gln Asn Tyr Phe Asn Thr
            260                 265                 270
Ile Lys Asn Phe Ala Leu Gln Leu Ser Ser Glu Glu Trp Met Ile Leu
        275                 280                 285
Glu Phe Ser Gln Leu Gly Phe Ile Gly Lys Met Phe Gln Ala Pro Asp
    290                 295                 300
Leu Thr Leu Ile Val Glu Phe Ile Phe Met Phe Tyr Lys Glu Lys Pro
305                 310                 315                 320
Ile Asp Trp Leu Leu Asp His Ile Leu Trp Val Lys Val Cys Asn Pro
                325                 330                 335
Glu Lys Asp Ala Lys His Cys Asp Arg Gln Lys Ala Asn Leu Arg Ile
            340                 345                 350
Arg Phe Arg Pro Ser Leu Phe Gln His Val Gly Leu His Ser Ser Leu
        355                 360                 365
Ser Gly Lys Ile Gln Lys Leu Thr Asp Lys Asp Tyr Met Lys Pro Leu
    370                 375                 380
Leu Leu Lys Ile His Val Asn Pro Pro Ala Glu Val Ser Thr Ser Leu
385                 390                 395                 400
Lys Val Tyr Gln Gly His Thr Leu Glu Lys Thr Tyr Met Gly Glu Asp
                405                 410                 415
Phe Phe Trp Ala Ile Thr Pro Ile Ala Gly Asp Tyr Ile Leu Phe Lys
            420                 425                 430
Phe Asp Lys Pro Val Asn Val Glu Ser Tyr Leu Phe His Ser Gly Asn
        435                 440                 445
Gln Glu His Pro Gly Asp Ile Leu Leu Asn Thr Thr Val Glu Val Leu
    450                 455                 460
Pro Phe Lys Ser Glu Gly Leu Glu Ile Ser Lys Glu Thr Lys Asp Lys
465                 470                 475                 480
Arg Leu Glu Asp Gly Tyr Phe Arg Ile Gly Lys Phe Glu Asn Gly Val
                485                 490                 495
Ala Glu Gly Met Val Asp Pro Ser Leu Asn Pro Ile Ser Ala Phe Arg
            500                 505                 510
Leu Ser Val Ile Gln Asn Ser Ala Val Trp Ala Ile Leu Asn Glu Ile
        515                 520                 525
His Ile Lys Lys Ala Thr Asn
    530                 535
SEQ ID NO:25
序列长度:30
序列类型:核酸
链型:单链
拓扑学:线性
分子类型:合成DNA
序列描述
TTCTCGAGAT GAGGCTCCGC AATGGAACTG   30
SEQ ID NO:26
序列长度:24
序列类型:核酸
链型:单链
拓扑学:线性
分子类型:合成DNA
序列描述
AGAAATGTGG GCTTCAGGGC TGGC    24
SEQ ID NO:27
序列长度:30
序列类型:核酸
链型:单链
拓扑学:线性
分子类型:合成DNA
序列描述
TTCTCGAGAT GAGGCTCCGC AATGGAACTG   30
SEQ ID NO:28
序列长度:24
序列类型:核酸
链型:单链
拓扑学:线性
分子类型:合成DNA
序列描述
AGAAATGTGG GCTTCAGGGC TGGC         24
SEQ ID NO:29
序列长度:30
序列类型:核酸
链型:单链
拓扑学:线性
分子类型:合成DNA
序列描述
TTCTCGAGAT GAGGCTCCGC AATGGAACTG   30
SEQ ID NO:30
序列长度:24
序列类型:核酸
链型:单链
拓扑学:线性
分子类型:合成DNA
序列描述
AGAAATGTGG GCTTCAGGGC TGGC    24
SEQ ID NO:31
序列长度:25
序列类型:核酸
链型:单链
拓扑学:线性
分子类型:合成DNA
序列描述
TTCCATCACC TGCCACACCT GCTGG 25
SEQ ID NO:32
序列长度:24
序列类型:核酸
链型:单链
拓扑学:线性
分子类型:合成DNA
序列描述
ACAACCCTCA GTCAGACAAG GAGG  24
SEQ ID NO:33
序列长度:24
序列类型:核酸
链型:单链
拓扑学:线性
分子类型:合成DNA
序列描述
ACACCCCCAG AAATGTGGGC TTCA  24
SEQ ID NO:34
序列长度:24
序列类型:核酸
链型:单链
拓扑学:线性
分子类型:合成DNA
序列描述
ATGACCGAGT CCTCCTTCTC CTGC  24
SEQ ID NO:35
序列长度:24
序列类型:核酸
链型:单链
拓扑学:线性
分子类型:合成DNA
序列描述
ATGCCCATCA CCACCGACAC TCCG  24
SEQ ID NO:36
序列长度:1724
序列类型:核酸
链型:双链
拓扑学:线性
分子类型:cDNA
序列描述
TGCAGCCTCG GCCCCGCGGG CGCCCGCCGC GCACCCGAGG AG ATG AGG CTC CGC   54
                                               Met Arg Leu Arg
                                                1
AAT GGC ACC TTC CTG ACG CTG CTG CTC TTC TGC CTG TGC GCC TTC CTC 102
Asn Gly Thr Phe Leu Thr Leu Leu Leu Phe Cys Leu Cys Ala Phe Leu
  5                  10                  15                  20
TCG CTG TCC TGG TAC GCG GCA CTC AGC GGC CAG AAA GGC GAC GTT GTG 150
Ser Leu Ser Trp Tyr Ala Ala Leu Ser Gly Gln Lys Gly Asp Val Val
                 25                  30                  35
GAC GTT TAC CAG CGG GAG TTC CTG GCG CTG CGC GAT CGG TTG CAC GCA 198
Asp Val Tyr Gln Arg Glu Phe Leu Ala Leu Arg Asp Arg Leu His Ala
             40                  45                  50
GCT GAG CAG GAG AGC CTC AAG CGC TCC AAG GAG CTC AAC CTG GTG CTG 246
Ala Glu Gln Glu Ser Leu Lys Arg Ser Lys Glu Leu Asn Leu Val Leu
         55                  60                  65
GAC GAG ATC AAG AGG GCC GTG TCA GAA AGG CAG GCG CTG CGA GAC GGA 294
Asp Glu Ile Lys Arg Ala Val Ser Glu Arg Gln Ala Leu Arg Asp Gly
     70                  75                  80
GAC GGC AAT CGC ACC TGG GGC CGC CTA ACA GAG GAC CCC CGA TTG AAG 342
Asp Gly Asn Arg Thr Trp Gly Arg Leu Thr Glu Asp Pro Arg Leu Lys
 85                  90                  95                 100
CCG TGG AAC GGC TCA CAC CGG CAC GTG CTG CAC CTG CCC ACC GTC TTC 390
Pro Trp Asn Gly Ser His Arg His Val Leu His Leu Pro Thr Val Phe
                105                 110                 115
CAT CAC CTG CCA CAC CTG CTG GCC AAG GAG AGC AGT CTG CAG CCC GCG 438
His His Leu Pro His Leu Leu Ala Lys Glu Ser Ser Leu Gln Pro Ala
            120                 125                 130
GTG CGC GTG GGC CAG GGC CGC ACC GGA GTG TCG GTG GTG ATG GGC ATC 486
Val Arg Val Gly Gln Gly Arg Thr Gly Val Ser Val Val Met Gly Ile
        135                 140                 145
CCG AGC GTG CGG CGC GAG GTG CAC TCG TAC CTG ACT GAC ACT CTG CAC 534
Pro Ser Val Arg Arg Glu Val His Ser Tyr Leu Thr Asp Thr Leu His
    150                 155                 160
TCG CTC ATC TCC GAG CTG AGC CCG CAG GAG AAG GAG GAC TCG GTC ATC 582
Ser Leu Ile Ser Glu Leu Ser Pro Gln Glu Lys Glu Asp Ser Val Ile
165                 170                 175                 180
GTG GTG CTG ATC GCC GAG ACT GAC TCA CAG TAC ACT TCG GCA GTG ACA 630
Val Val Leu Ile Ala Glu Thr Asp Ser Gln Tyr Thr Ser Ala Val Thr
                185                 190                 195
GAG AAC ATC AAG GCC TTG TTC CCC ACG GAG ATC CAT TCT GGG CTC CTG 678
Glu Asn Ile Lys Ala Leu Phe Pro Thr Glu Ile His Ser Gly Leu Leu
            200                 205                 210
GAG GTC ATC TCA CCC TCC CCC CAC TTC TAC CCT GAC TTC TCC CGC CTC 726
Glu Val Ile Ser Pro Ser Pro His Phe Tyr Pro Asp Phe Ser Arg Leu
        215                 220                 225
CGA GAG TCC TTT GGG GAC CCC AAG GAG AGA GTC AGG TGG AGG ACC AAA 774
Arg Glu Ser Phe Gly Asp Pro Lys Glu Arg Val Arg Trp Arg Thr Lys
    230                 235                 240
CAG AAC CTC GAT TAC TGC TTC CTC ATG ATG TAC GCG CAG TCC AAA GGC 822
Gln Asn Leu Asp Tyr Cys Phe Leu Met Met Tyr Ala Gln Ser Lys Gly
245                 250                 255                 260
ATC TAC TAC GTG CAG CTG GAG GAT GAC ATC GTG GCC AAG CCC AAC TAC 870
Ile Tyr Tyr Val Gln Leu Glu Asp Asp Ile Val Ala Lys Pro Asn Tyr
                265                 270                 275
CTG AGC ACC ATG AAG AAC TTT GCA CTG CAG CAG CCT TCA GAG GAC TGG 918
Leu Ser Thr Met Lys Asn Phe Ala Leu Gln Gln Pro Ser Glu Asp Trp
            280                 285                 290
ATG ATC CTG GAG TTC TCC CAG CTG GGC TTC ATT GGT AAG ATG TTC AAG 966
Met Ile Leu Glu Phe Ser Gln Leu Gly Phe Ile Gly Lys Met Phe Lys
        295                 300                 305
TCG CTG GAC CTG AGC CTG ATT GTA GAG TTC ATT CTC ATG TTC TAC CGG 1014
Ser Leu Asp Leu Ser Leu Ile Val Glu Phe Ile Leu Met Phe Tyr Arg
    310                 315                 320
GAC AAG CCC ATC GAC TGG CTC CTG GAC CAT ATT CTG TGG GTG AAA GTC 1062
Asp Lys Pro Ile Asp Trp Leu Leu Asp His Ile Leu Trp Val Lys Val
325                 330                 335                 340
TGC AAC CCC GAG AAG GAT GCG AAG CAC TGT GAC CGG CAG AAA GCC AAC 1110
Cys Asn Pro Glu Lys Asp Ala Lys His Cys Asp Arg Gln Lys Ala Asn
                345                 350                 355
CTG CGG ATC CGC TTC AAA CCG TCC CTC TTC CAG CAC GTG GGC ACT CAC 1158
Leu Arg Ile Arg Phe Lys Pro Ser Leu Phe Gln His Val Gly Thr His
            360                 365                 370
TCC TCG CTG GCT GGC AAG ATC CAG AAA CTG AAG GAC AAA GAC TTT GGA 1206
Ser Ser Leu Ala Gly Lys Ile Gln Lys Leu Lys Asp Lys Asp Phe Gly
        375                 380                 385
AAG CAG GCG CTG CGG AAG GAG CAT GTG AAC CCG CCA GCA GAG GTG AGC 1254
Lys Gln Ala Leu Arg Lys Glu His Val Asn Pro Pro Ala Glu Val Ser
    390                 395                 400
ACG AGC CTG AAG ACA TAC CAG CAC TTC ACC CTG GAG AAA GCC TAC CTG 1302
Thr Ser Leu Lys Thr Tyr Gln His Phe Thr Leu Glu Lys Ala Tyr Leu
405                 410                 415                 420
CGC GAG GAC TTC TTC TGG GCC TTC ACC CCT GCC GCG GGG GAC TTC ATC 1350
Arg Glu Asp Phe Phe Trp>Ala Phe Thr Pro Ala Ala Gly Asp Phe Ile
                425                 430                 435
CGC TTC CGC TTC TTC CAA CCT CTA AGA CTG GAG CGG TTC TTC TTC CGC 1398
Arg Phe Arg Phe Phe Gln Pro Leu Arg Leu Glu Arg Phe Phe Phe Arg
            440                 445                 450
AGT GGG AAC ATC GAG CAC CCG GAG GAC AAG CTC TTC AAC ACG TCT GTG 1446
Ser Gly Asn Ile Glu His Pro Glu Asp Lys Leu Phe Asn Thr Ser Val
        455                 460                 465
GAG GTG CTG CCC TTC GAC AAC CCT CAG TCA GAC AAG GAG GCC CTG CAG 1494
Glu Val Leu Pro Phe Asp Asn Pro Gln Ser Asp Lys Glu Ala Leu Gln
    470                 475                 480
GAG GGC CGC ACC GCC ACC CTC CGG TAC CCT CGG AGC CCC GAC GGC TAC 1542
Glu Gly>Arg Thr Ala Thr Leu Arg Tyr Pro Arg Ser Pro Asp Gly Tyr
485                 490                 495                 500
CTC CAG ATC GGC TCC TTC TAC AAG GGA GTG GCA GAG GGA GAG GTG GAC 1590
Leu Gln Ile Gly Ser Phe Tyr Lys Gly Val Ala Glu Gly Glu Val Asp
                505                 510                 515
CCA GCC TTC GGC CCT CTG GAA GCA CTG CGC CTC TCG ATC CAG ACG GAC 1638
Pro Ala Phe Gly Pro Leu Glu Ala Leu Arg Leu Ser Ile Gln Thr Asp
            520                 525                 530
TCC CCT GTG TGG GTG ATT CTG AGC GAG ATC TTC CTG AAA AAG GCC GAC 1686
Ser Pro Val Trp Val Ile Leu Ser Glu Ile Phe Leu Lys Lys Ala Asp
        535                 540                 545         548
TAAGCTGCGG GCTTCTGAGG GTACCCTGTG GCCAGCCC                       1724
SEQ ID NO:37
序列长度:548
序列类型:氨基酸
拓扑学:线性
分子类型:肽
序列描述
Met Arg Leu Arg Asn Gly Thr Phe Leu Thr Leu Leu Leu Phe Cys Leu
  1               5                  10                  15
Cys Ala Phe Leu Ser Leu Ser Trp Tyr Ala Ala Leu Ser Gly Gln Lys
             20                  25                  30
Gly Asp Val Val Asp Val Tyr Gln Arg Glu Phe Leu Ala Leu Arg Asp
         35                  40                  45
Arg Leu His Ala Ala Glu Gln Glu Ser Leu Lys Arg Ser Lys Glu Leu
     50                  55                  60
Asn Leu Val Leu Asp Glu Ile Lys Arg Ala Val Ser Glu Arg Gln Ala
 65                  70                  75                  80
Leu Arg Asp Gly Asp Gly Asn Arg Thr Trp Gly Arg Leu Thr Glu Asp
                 85                  90                  95
Pro Arg Leu Lys Pro Trp Asn Gly Ser His Arg His Val Leu His Leu
            100                 105                 110
Pro Thr Val Phe His His Leu Pro His Leu Leu Ala Lys Glu Ser Ser
        115                 120                 125
Leu Gln Pro Ala Val Arg Val Gly Gln Gly Arg Thr Gly Val Ser Val
    130                 135                 140
Val Met Gly Ile Pro Ser Val Arg Arg Glu Val His Ser Tyr Leu Thr
145                 150                 155                 160
Asp Thr Leu His Ser Leu Ile Ser Glu Leu Ser Pro Gln Glu Lys Glu
                165                 170                 175
Asp Ser Val Ile Val Val Leu Ile Ala Glu Thr Asp Ser Gln Tyr Thr
            180                 185                 190
Ser Ala Val Thr Glu Asn Ile Lys Ala Leu Phe Pro Thr Glu Ile His
        195                 200                 205
Ser Gly Leu Leu Glu Val Ile Ser Pro Ser Pro His Phe Tyr Pro Asp
    210                 215                 220
Phe Ser Arg Leu Arg Glu Ser Phe Gly Asp Pro Lys Glu Arg Val Arg
225                 230                 235                 240
Trp Arg Thr Lys Gln Asn Leu Asp Tyr Cys Phe Leu Met Met Tyr Ala
                245                 250                 255
Gln Ser Lys Gly Ile Tyr Tyr Val Gln Leu Glu Asp Asp Ile Val Ala
            260                 265                 270
Lys Pro Asn Tyr Leu Ser Thr Met Lys Asn Phe Ala Leu Gln Gln Pro
        275                 280                 285
Ser Glu Asp Trp Met Ile Leu Glu Phe Ser Gln Leu Gly Phe Ile Gly
    290                 295                 300
Lys Met Phe Lys Ser Leu Asp Leu Ser Leu Ile Val Glu Phe Ile Leu
305                 310                 315                 320
Met Phe Tyr Arg Asp Lys Pro Ile Asp Trp Leu Leu Asp His Ile Leu
                325                 330                 335
Trp Val Lys Val Cys Asn Pro Glu Lys Asp Ala Lys His Cys Asp Arg
            340                 345                 350
Gln Lys Ala Asn Leu Arg Ile Arg Phe Lys Pro Ser Leu Phe Gln His
        355                 360                 365
Val Gly Thr His Ser Ser Leu Ala Gly Lys Ile Gln Lys Leu Lys Asp
    370                 375                 380
Lys Asp Phe Gly Lys Gln Ala Leu Arg Lys Glu His Val Asn Pro Pro
385                 390                 395                 400
Ala Glu Val Ser Thr Ser Leu Lys Thr Tyr Gln His Phe Thr Leu Glu
                405                 410                 415
Lys Ala Tyr Leu Arg Glu Asp Phe Phe Trp Ala Phe Thr Pro Ala Ala
            420                 425                 430
Gly Asp Phe Ile Arg Phe Arg Phe Phe Gln Pro Leu Arg Leu Glu Arg
        435                 440                 445
Phe Phe Phe Arg Ser Gly Asn Ile Glu His Pro Glu Asp Lys Leu Phe
    450                 455                 460
Asn Thr Ser Val Glu Val Leu Pro Phe Asp Asn Pro Gln Ser Asp Lys
465                 470                 475                 480
Glu Ala Leu Gln Glu Gly Arg Thr Ala Thr Leu Arg Tyr Pro Arg Ser
                485                 490                 495
Pro Asp Gly Tyr Leu Gln Ile Gly Ser Phe Tyr Lys Gly Val Ala Glu
            500                 505                 510
Gly Glu Val Asp Pro Ala Phe Gly Pro Leu Glu Ala Leu Arg Leu Ser
        515                 520                 525
Ile Gln Thr Asp Ser Pro Val Trp Val Ile Leu Ser Glu Ile Phe Leu
    530                 535                 540
Lys Lys Ala Asp
545         548
SEQ ID NO:38
序列长度:29
序列类型:核酸
链型:单链
拓扑学:线性
分子类型:合成DNA
序列描述
TTCTCGAGGA GATGAGGCTC CGCAATGGC   29
SEQ ID NO:39
序列长度:30
序列类型:核酸
链型:单链
拓扑学:线性
分子类型:合成DNA
序列描述
AATCTAGAAA TGTGGGCTTC AGGGCTGGC  30
SEQ ID NO:40
序列长度:28
序列类型:核酸
链型:单链
拓扑学:线性
分子类型:合成DNA
序列描述
CCCTCGAG ATG GGG GTG CAC GAA TGT CC    28
         Met Gly Val His Glu Cys Pro
SEQ ID NO:41
序列长度:48
序列类型:核酸
链型:单链
拓扑学:线性
分子类型:合成DNA
反义:是
序列描述
CTTTTTGCTT GTTAACTCCT TTAGTATTGG GGCGCCCAGG ACTGGGAG  48
SEQ ID NO:42
序列长度:48
序列类型:核酸
链型:单链
拓扑学:线性
分子类型:合成DNA
序列描述
CTCCCAGTCC TGGGCGCCCC AATACTAAAG GAGTTAACAA GCAAAAAG  48
SEQ ID NO:43
序列长度:44
序列类型:核酸
链型:单链
拓扑学:线性
分子类型:合成DNA
反义:是
序列描述
CTTCCTTCAT TTTGCAATAA ATGAGGGGCG CCCAGGACTG GGAG  44
SEQ ID NO:44
序列长度:43
序列类型:核酸
链型:单链
拓扑学:线性
分子类型:合成DNA
反义:是
序列描述
ATTTAACTTC TCTCTTCACT GTAGGGGCGC CCAGGACTGG GAG  43
SEQ ID NO:45
序列长度:44
序列类型:核酸
链型:单链
拓扑学:线性
分子类型:合成DNA
序列描述
CTCCCAGTCC TGGGCGCCCC TCATTTATTG CAAAATGAAG GAAG 44
SEQ ID NO:46
序列长度:43
序列类型:核酸
链型:单链
拓扑学:线性
分子类型:合成DNA
序列描述
CTCCCAGTCC TGGGCGCCCC TACAGTGAAG AGAGAAGTTA AAT 43
SEQ ID NO:47
序列长度:26
序列类型:核酸
链型:单链
拓扑学:线性
分子类型:合成DNA
反义:是
序列描述
TTCTAGAA TCA CCC TTC CGC AAC ACC  26
         TRM Gly Glu Ala Val Gly
SEQ ID NO:48
序列长度:28
序列类型:核酸
链型:单链
拓扑学:线性
分子类型:合成DNA
反义:是
序列描述
TTCTAGAA TCA AGG CAG AAC TTC CAC CG  28
         TRM Pro Leu Val Glu Val Thr
SEQ ID NO:49
序列长度:38
序列类型:核酸
链型:单链
拓扑学:线性
分子类型:合成DNA
反义:是
序列描述
TTCTAGAA TCA TTT AAA TAG GAT GTA GTC TCC AGC TAC  38
         TRM Lys Phe Leu Ile Tyr Asp Gly Ala Val
SEQ ID NO:50
序列长度:34
序列类型:核酸
链型:单链
拓扑学:线性
分子类型:合成DNA
反义:是
序列描述
TTCTAGAA TCA TGG TTT CAT GTA ATC TTT ATC CG  34
         TRM Pro Lys Met Tyr Asp Lys Asp Thr
SEQ ID NO:51
序列长度:19
序列类型:核酸
链型:单链
拓扑学:线性
分子类型:合成DNA
序列描述
TTC ATG AGG CTC CGA AAT G  19
    Met Arg Leu Arg Asn Gly
SEQ ID NO:52
序列长度:29
序列类型:核酸
链型:单链
拓扑学:线性
分子类型:合成DNA
反义:是
序列描述
CAAGCT TCA GTT TGT GAC TTT TTT AAT AT  29
       TRM Asn Thr Val Lys Lys Ile His
SEQ ID NO:53
序列长度:27
序列类型:核酸
链型:单链
拓扑学:线性
分子类型:合成DNA
序列描述
TC ATG ATA CTA AAG GAG TTA ACA AGC A    27
   Met Ile Leu Lys Glu Leu Thr Ser Lys
SEQ ID NO:54
序列长度:51
序列类型:核酸
链型:单链
拓扑学:线性
分子类型:合成DNA
反义:是
序列描述
CAAGCT TCA GTG GTG GTG GTG GTG GTG GTT TGT GAC TTT  39
       TRM His His His His His His Asn Thr Val Lys
TTT AAT ATG GAT  51
Lys Ile His Ile
SEQ ID NO:55
序列长度:18
序列类型:核酸
链型:单链
拓扑学:线性
分子类型:合成DNA
反义:是
序列描述
CAAGCT TCA GTG GTG GTG  18
       TRM His His His
SEQ ID NO:56
序列长度:32
序列类型:核酸
链型:单链
拓扑学:线性
分子类型:合成DNA
序列描述
TC ATG ATA TTA AAG GAG TTA ACA AGC AAA AAA  32
   Met Ile Leu Lys Glu Leu Thr Ser Lys Lys
SEQ ID NO:57
序列长度:51
序列类型:核酸
链型:单链
拓扑学:线性
分子类型:合成DNA
反义:是
序列描述
CAAGCT TCA GTG GTG GTG GTG GTG GTG GTT GGT GGC TTT  39
       TRM His His His His His His Asn Thr Ala Lys
TTT AAT ATG AAT  51
Lys Ile His Ile
SEQ ID NO:58
序列长度:49
序列类型:核酸
链型:单链
拓扑学:线性
分子类型:合成DNA
反义:是
序列描述
CAAGCT TCA GTG GTG GTG GTG GTG GTG TGG TTT CAT ATA  39
       TRM His His His His His His Pro Lys Met Tyr
ATC TTT ATC C  49
Asp Lys Asp
SEQ ID NO:59
序列长度:19
序列类型:核酸
链型:单链
拓扑学:线性
分子类型:合成DNA
序列描述
TTC ATG AGG CTC CGC AAT G  19
    Met Arg Leu Arg Asn Gly
SEQ ID NO:60
序列长度:18
序列类型:核酸
链型:单链
拓扑学:线性
分子类型:合成DNA
反义:是
序列描述
CAGGTTGAGC TCCTTGGA  18
SEQ ID NO:61
序列长度:18
序列类型:核酸
链型:单链
拓扑学:线性
分子类型:合成DNA
序列描述
TCCAAGGAGC TCAACCTG  18
SEQ ID NO:62
序列长度:44
序列类型:核酸
链型:单链
拓扑学:线性
分子类型:合成DNA
反义:是
序列描述
CAAGCT TCA GTG GTG GTG GTG GTG GTG GTC GGC CTT TTT CAG GA  44
       TRM His His His His His His Asp Als Lys Lys Leu Phe
SEQ ID NO:63
序列长度:23
序列类型:核酸
链型:单链
拓扑学:线性
分子类型:合成DNA
序列描述
CCC ATG GGC CGC CTA ACA GAG GA  23
    Met Gly Arg Leu Thr Glu Asp

Claims (33)

1.β1→4N-乙酰葡糖胺基转移酶,其由显示于SEQ ID NO:18中氨基酸序列所组成。
2.β1→4N-乙酰葡糖胺基转移酶,其由显示于SEQ ID NO:18中的氨基酸序列所组成但具有一个氨基酸残基的添加、缺失或替代而仍具有β1→4N-乙酰葡糖胺基转移酶活性。
3.β1→4N-乙酰葡糖胺基转移酶,其由显示于SEQ ID NO:18中的氨基酸序列所组成但具有两个或更多个氨基酸残基的添加、缺失或替代而仍具有β1→4N-乙酰葡糖胺基转移酶活性。
4.由显示于SEQ ID NO:18中部分氨基酸序列所组成的β1→4N-乙酰葡糖胺基转移酶,其中包括至少从位置93至位置383的残基。
5.由显示于SEQ ID NO:18中部分氨基酸序列所组成的β1→4N-乙酰葡糖胺基转移酶,其中包括至少从位置93至位置383的残基,所述的部分序列具有一个氨基酸残基的添加、缺失或替代而仍具有β1→4N-乙酰葡糖胺基转移酶活性。
6.由显示于SEQ ID NO:18中部分氨基酸序列所组成的β1→4N-乙酰葡糖胺基转移酶,其中包括至少从位置93至位置383的残基,所述的部分序列具有两个或更多个氨基酸残基的添加、缺失或替代而仍具有β1→4N-乙酰葡糖胺基转移酶活性。
7.β1→4N-乙酰葡糖胺基转移酶,其由显示于SEQ ID NO:24中的氨基酸序列所组成。
8.β1→4N-乙酰葡糖胺基转移酶,其由显示于SEQ ID NO:24中的氨基酸序列所组成但具有一个氨基酸残基的添加、缺失或替代而仍具有β1→4N-乙酰葡糖胺基转移酶活性。
9.β1→4N-乙酰葡糖胺基转移酶,其由显示于SEQ ID NO:24中的氨基酸序列所组成但具有两个或更多个氨基酸残基的添加、缺失或替代而仍具有β1→4N-乙酰葡糖胺基转移酶活性。
10.由显示于SEQ ID NO:24中部分氨基酸序列所组成的β1→4N-乙酰葡糖胺基转移酶,包括至少从位置94至位置383的残基,或所述的部分序列具有一个或更多个氨基酸残基的添加、缺失或替代而仍具有β1→4N-乙酰葡糖胺基转移酶活性。
11.由显示于SEQ ID NO:24中部分氨基酸序列所组成的β1→4N-乙酰葡糖胺基转移酶,包括至少从位置94至位置383的残基,所述的部分序列具有一个氨基酸残基的添加、缺失或替代而仍具有β1→4N-乙酰葡糖胺基转移酶活性。
12.由显示于SEQ ID NO:24中部分氨基酸序列所组成的β1→4N-乙酰葡糖胺基转移酶,包括至少从位置94至位置383的残基,所述的部分序列具有两个或更多个氨基酸残基的添加、缺失或替代而仍具有β1→4N-乙酰葡糖胺基转移酶活性。
13.β1→4N-乙酰葡糖胺基转移酶,其由显示于SEQ ID NO:37中氨基酸序列所组成。
14.β1→4N-乙酰葡糖胺基转移酶,其由显示于SEQ ID NO:37中的氨基酸序列所组成但具有一个氨基酸残基的添加、缺失或替代而仍具有β1→4N-乙酰葡糖胺基转移酶活性。
15.β1→4N-乙酰葡糖胺基转移酶,其由显示于SEQ ID NO:37中的氨基酸序列所组成但具有两个或更多个氨基酸残基的添加、缺失或替代而仍具有β1→4N-乙酰葡糖胺基转移酶活性。
16.由显示于SEQ ID NO:37中部分氨基酸序列所组成的β1→4N-乙酰葡糖胺基转移酶,其中包括至少从位置91至位置390的残基。
17.由显示于SEQ ID NO:37中部分氨基酸序列所组成的β1→4N-乙酰葡糖胺基转移酶,其中包括至少从位置91至位置390的残基,所述的部分序列具有一个氨基酸残基的添加、缺失或替代而仍具有β1→4N-乙酰葡糖胺基转移酶活性。
18.由显示于SEQ ID NO:37中部分氨基酸序列所组成的β1→4N-乙酰葡糖胺基转移酶,其中包括至少从位置91至位置390的残基,所述的部分序列具有两个或更多个氨基酸残基的添加、缺失或替代而仍具有β1→4N-乙酰葡糖胺基转移酶活性。
19.编码权利要求1-6中任何一种β1→4N-乙酰葡糖胺基转移酶的β1→4N-乙酰葡糖胺基转移酶基因。
20.编码权利要求7-12中任何一种β1→4N-乙酰葡糖胺基转移酶的β1→4N-乙酰葡糖胺基转移酶基因。
21.编码权利要求13-18中任何一种β1→4N-乙酰葡糖胺基转移酶的β1→4N-乙酰葡糖胺基转移酶基因。
22.由SEQ ID NO:17中显示的核苷酸序列所组成的β1→4N-乙酰葡糖胺基转移酶基因。
23.由SEQ ID NO:23中显示的核苷酸序列所组成的β1→4N-乙酰葡糖胺基转移酶基因。
24.由显示于SEQ ID NO:36中核苷酸序列所组成的β1→4N-乙酰葡糖胺基转移酶基因。
25.通过将权利要求19至24中的任何一种β1→4N-乙酰葡糖胺基转移酶基因插入载体DNA而获得的重组DNA。
26.包括权利要求19至24中任何一种β1→4N-乙酰葡糖胺基转移酶基因部分或全长的染色体片段。
27.带有权利要求25重组DNA的宿主细胞。
28.向其中人工导入有权利要求26染色体片段的宿主细胞。
29.用于从生物样品中纯化权利要求1至18中任何一种β1→4N-乙酰葡糖胺基转移酶的方法。
30.用于制备β1→4N-乙酰葡糖胺基转移酶的方法,包括在培养基中培养权利要求27的宿主细胞和从得到的培养物中回收β1→4N-乙酰葡糖胺基转移酶。
31.用于制备β1→4N-乙酰葡糖胺基转移酶的方法,包括在培养基中培养权利要求28的宿主细胞和从得到的培养物中回收β1→4N-乙酰葡糖胺基转移酶。
32.用于制备β1→4N-乙酰葡糖胺基转移酶的方法,包括从权利要求27的宿主细胞分泌物、体液或匀浆中回收β1→4N-乙酰葡糖胺基转移酶。
33.用于制备β1→4N-乙酰葡糖胺基转移酶的方法,包括从分泌物、体液或从权利要求28的宿主细胞匀浆中回收β1→4N-乙酰葡糖胺基转移酶。
CNB971934770A 1996-12-12 1997-12-10 β1→4N-乙酰葡糖胺基转移酶和编码该酶的基因 Expired - Lifetime CN1273586C (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP33241196 1996-12-12
JP332411/96 1996-12-12
JP161462/97 1997-06-18
JP16146297 1997-06-18

Publications (2)

Publication Number Publication Date
CN1214732A CN1214732A (zh) 1999-04-21
CN1273586C true CN1273586C (zh) 2006-09-06

Family

ID=26487595

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB971934770A Expired - Lifetime CN1273586C (zh) 1996-12-12 1997-12-10 β1→4N-乙酰葡糖胺基转移酶和编码该酶的基因

Country Status (9)

Country Link
US (1) US6338955B2 (zh)
EP (1) EP0905232B1 (zh)
JP (1) JP4246264B2 (zh)
KR (1) KR100325552B1 (zh)
CN (1) CN1273586C (zh)
AT (1) ATE290068T1 (zh)
DE (1) DE69732628T2 (zh)
ES (1) ES2235259T3 (zh)
WO (1) WO1998026053A1 (zh)

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030170864A1 (en) * 2000-05-30 2003-09-11 Genentech, Inc. Secreted and transmembrane polypeptides and nucleic acids encoding the same
US6784123B2 (en) * 1998-02-05 2004-08-31 Asm Japan K.K. Insulation film on semiconductor substrate and method for forming same
JP4160652B2 (ja) * 1998-05-22 2008-10-01 キリンファーマ株式会社 エンド−β−N−アセチルグルコサミニダーゼ遺伝子
DK1137789T3 (da) * 1998-12-09 2010-11-08 Phyton Holdings Llc Fremgangsmåde til fremstilling af et glycoprotein med glycosylering af human type
CA2397340A1 (en) * 2000-01-14 2001-07-19 Incyte Genomics, Inc. Drug metabolizing enzymes
CA2403644A1 (en) * 2000-04-13 2001-10-25 Incyte Genomics, Inc. Drug metabolizing enzymes
US20060293266A1 (en) * 2000-05-10 2006-12-28 The Trustees Of Columbia Phosphodiesterase 4D in the ryanodine receptor complex protects against heart failure
US7393652B2 (en) * 2000-05-10 2008-07-01 The Trustees Of Columbia University In The City Of New York Methods for identifying a chemical compound that directly enhances binding of FKBP12.6 to PKA-phosphorylated type 2 ryanodine receptor (RyR2)
US20040229781A1 (en) * 2000-05-10 2004-11-18 Marks Andrew Robert Compounds and methods for treating and preventing exercise-induced cardiac arrhythmias
US7879840B2 (en) * 2005-08-25 2011-02-01 The Trustees Of Columbia University In The City Of New York Agents for preventing and treating disorders involving modulation of the RyR receptors
US8022058B2 (en) 2000-05-10 2011-09-20 The Trustees Of Columbia University In The City Of New York Agents for preventing and treating disorders involving modulation of the RyR receptors
US7718644B2 (en) * 2004-01-22 2010-05-18 The Trustees Of Columbia University In The City Of New York Anti-arrhythmic and heart failure drugs that target the leak in the ryanodine receptor (RyR2) and uses thereof
US6489125B1 (en) * 2000-05-10 2002-12-03 The Trustees Of Columbia University In The City Of New York Methods for identifying chemical compounds that inhibit dissociation of FKBP12.6 binding protein from type 2 ryanodine receptor
US20040048780A1 (en) * 2000-05-10 2004-03-11 The Trustees Of Columbia University In The City Of New York Method for treating and preventing cardiac arrhythmia
EP2322644A1 (en) 2000-06-28 2011-05-18 GlycoFi, Inc. Methods for producing modified glycoproteins
US7449308B2 (en) 2000-06-28 2008-11-11 Glycofi, Inc. Combinatorial DNA library for producing modified N-glycans in lower eukaryotes
US7598055B2 (en) 2000-06-28 2009-10-06 Glycofi, Inc. N-acetylglucosaminyltransferase III expression in lower eukaryotes
US8697394B2 (en) 2000-06-28 2014-04-15 Glycofi, Inc. Production of modified glycoproteins having multiple antennary structures
US7625756B2 (en) 2000-06-28 2009-12-01 GycoFi, Inc. Expression of class 2 mannosidase and class III mannosidase in lower eukaryotic cells
US7863020B2 (en) 2000-06-28 2011-01-04 Glycofi, Inc. Production of sialylated N-glycans in lower eukaryotes
ZA200306406B (en) 2001-01-19 2004-09-06 Dow Chemical Co Method for secretory production of glycoprotein having human-type sugar chain using plant cell.
US20040110176A1 (en) * 2001-02-26 2004-06-10 Kazuhito Fujiyama Fused protein having beta 1,2-n-acetylglucosaminyltransferase II activity and process for producing the same
CA2483436A1 (en) 2002-04-23 2003-11-06 University Of Georgia Research Foundation, Inc. N-acetylglucosaminyltransferase vb coding sequence, recombinant cells and methods
US7544678B2 (en) * 2002-11-05 2009-06-09 The Trustees Of Columbia University In The City Of New York Anti-arrythmic and heart failure drugs that target the leak in the ryanodine receptor (RyR2)
US7332299B2 (en) 2003-02-20 2008-02-19 Glycofi, Inc. Endomannosidases in the modification of glycoproteins in eukaryotes
JP2007525165A (ja) 2003-03-07 2007-09-06 トラスティーズ・オブ・コロンビア・ユニバーシティ・イン・ザ・シティ・オブ・ニューヨーク タイプ1ライアノジン受容体に基づく方法
US8710045B2 (en) * 2004-01-22 2014-04-29 The Trustees Of Columbia University In The City Of New York Agents for preventing and treating disorders involving modulation of the ryanodine receptors
US7704990B2 (en) * 2005-08-25 2010-04-27 The Trustees Of Columbia University In The City Of New York Agents for preventing and treating disorders involving modulation of the RyR receptors
NZ580510A (en) 2007-04-17 2011-06-30 Stichting Dienst Landbouwkundi Mammalian-type glycosylation in plants by expression of non-mammalian glycosyltransferases
US9616114B1 (en) 2014-09-18 2017-04-11 David Gordon Bermudes Modified bacteria having improved pharmacokinetics and tumor colonization enhancing antitumor activity
US11180535B1 (en) 2016-12-07 2021-11-23 David Gordon Bermudes Saccharide binding, tumor penetration, and cytotoxic antitumor chimeric peptides from therapeutic bacteria
US11129906B1 (en) 2016-12-07 2021-09-28 David Gordon Bermudes Chimeric protein toxins for expression by therapeutic bacteria

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2789283B2 (ja) * 1992-08-21 1998-08-20 寳酒造株式会社 ヒト糖転移酵素遺伝子

Also Published As

Publication number Publication date
DE69732628D1 (de) 2005-04-07
EP0905232A1 (en) 1999-03-31
KR19990082498A (ko) 1999-11-25
WO1998026053A1 (en) 1998-06-18
ES2235259T3 (es) 2005-07-01
EP0905232A4 (en) 2002-09-25
JP4246264B2 (ja) 2009-04-02
ATE290068T1 (de) 2005-03-15
US20010024814A1 (en) 2001-09-27
DE69732628T2 (de) 2005-12-29
EP0905232B1 (en) 2005-03-02
US6338955B2 (en) 2002-01-15
KR100325552B1 (ko) 2002-08-14
CN1214732A (zh) 1999-04-21

Similar Documents

Publication Publication Date Title
CN1273586C (zh) β1→4N-乙酰葡糖胺基转移酶和编码该酶的基因
CN1202255C (zh) 编码具有果糖基转移酶活性的蛋白质的核酸分子及制备长链菊粉的方法
CN1170940C (zh) 生长得到改造的植物以及获得此种植物的方法
CN1280613A (zh) 编码哺乳动物内切葡糖醛酸糖苷酶的分离的核酸分子及其应用
CN100351393C (zh) 核苷酸多态性的检测方法
CN1572879A (zh) 糖核苷酸类及复合糖类的制备方法
CN1552869A (zh) 新型dna聚合酶
CN1151252C (zh) 生产微生物转谷氨酰胺酶的方法
CN101052719A (zh) 利用编码花色苷3'位芳香族酰基转移酶的基因的花色苷色素稳定化和蓝化方法
CN1993377A (zh) 丙氨酸2,3氨基变位酶
CN1845990A (zh) 耐热化蔗糖磷酸化酶(sp)的方法
CN1081205A (zh) N-乙酰氨基葡糖转移酶v蛋白及基因
CN1592793A (zh) 肝细胞癌-相关基因和多肽,以及检测肝细胞癌的方法
CN1950501A (zh) 放线菌来源的amp脱氨酶及其应用
CN1153831C (zh) 编码神经酰胺糖内切酶激活物的基因
CN1198921C (zh) 棉子糖合成酶基因、棉子糖的制备方法及其转化的植物
CN1195855C (zh) 棉子糖合酶基因及其用途
CN1668739A (zh) 植物核苷酸糖焦磷酸酶 /磷酸二酯酶( n p p酶 )、及其生产方法、在制造测试装置中的用途、和在生产转基因植物中的应用
CN101044238A (zh) 高敏感的内切核酸酶的生产方法、内切核酸酶的新制品及其用途
CN1948339A (zh) 端粒酶活性抑制蛋白的制备和纯化
CN1170850C (zh) 人血管生成素样蛋白和编码序列及其用途
CN1950505A (zh) 生产多肽的方法
CN1809636A (zh) 耐热化α-葡聚糖磷酸化酶(GP)的方法
CN1496370A (zh) 分离的苛养木杆菌gum操纵子,分离的其核酸分子及它们的用途
CN1214041C (zh) 信号序列捕获方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CX01 Expiry of patent term
CX01 Expiry of patent term

Granted publication date: 20060906