CN101343635A - 构建表达预定糖链修饰糖蛋白工程菌株的方法 - Google Patents

构建表达预定糖链修饰糖蛋白工程菌株的方法 Download PDF

Info

Publication number
CN101343635A
CN101343635A CNA2008100074391A CN200810007439A CN101343635A CN 101343635 A CN101343635 A CN 101343635A CN A2008100074391 A CNA2008100074391 A CN A2008100074391A CN 200810007439 A CN200810007439 A CN 200810007439A CN 101343635 A CN101343635 A CN 101343635A
Authority
CN
China
Prior art keywords
sequence
sugar chain
encoding sequence
screening
ser
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2008100074391A
Other languages
English (en)
Other versions
CN101343635B (zh
Inventor
高新
宋海峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Emission and Radiation Medical Research Institute
Original Assignee
高新
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 高新 filed Critical 高新
Priority to CN2008100074391A priority Critical patent/CN101343635B/zh
Publication of CN101343635A publication Critical patent/CN101343635A/zh
Application granted granted Critical
Publication of CN101343635B publication Critical patent/CN101343635B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明涉及蛋白质糖基化工程领域,本发明涉及借助基因工程手段构建表达预定糖链修饰的工程菌株的方法,本发明还涉及对糖蛋白N-糖基化修饰糖链的设计与改造,使糖蛋白可以根据需要含有结构选自Man5GlcNAc2、GalGlcNAcMan5GlcNAc2或SAGalGlcNAcMan5GlcNAc2的修饰糖链。

Description

构建表达预定糖链修饰糖蛋白工程菌株的方法
技术领域
本发明涉及蛋白质糖基化工程领域,本发明涉及借助基因工程手段构建表达预定糖链修饰的工程菌株的方法,本发明还涉及对糖蛋白N-糖基化修饰糖链的设计与改造,根据需要,所述糖蛋白可以含有结构为Man5GlcNAc2、GalGlcNAcMan5GlcNAc2和/或SAGalGlcNAcMan5GlcNAc2的修饰糖链。
背景技术
蛋白质药物一直是全球开发的热点。目前已有多种重组蛋白在临床治疗中发挥着重要的作用,如胰岛素、生长激素等。这类重组蛋白大多属于糖蛋白,即在多肽骨架的一个或多个位点上共价结合有寡糖的糖基化修饰蛋白。糖蛋白中糖链的主要功能有两大类:a)参与分子内作用,如蛋白质的正确折叠、细胞内定位、生物活性、溶解度、抗原性、生物半寿期、蛋白酶敏感性等;b)参与分子间作用,如趋靶于溶酶体、趋靶于组织、细胞-细胞黏附和结合病原体等。归根结底,糖链影响着蛋白质的整体构象,从而影响由构象决定的所有功能。
糖蛋白上的糖链从连接方式上可分为两类:一类是与天冬氨酰(Asn)残基连接,即N-连接糖蛋白,另一类与丝氨酸或苏氨酸连接,称为O-连接糖蛋白。
N-糖链通常都有一个五糖核心:[Manα1→6(Manα1→3)Manβ1→4GlcNAc β1→4GlcNAc]-((Man)3(GlcNAc)2),根据它们的外层链结构的不同,可分为:高甘露糖型(High mannosetype),杂合型(Hybrid type)与复合型(Complex type)。如图1所示,三者之间的区别在于:高甘露糖型只含有多个α连接的甘露糖残基,而复杂型具有岩藻糖(Fuc)、半乳糖(Gal)和唾液酸(SA)为组分的糖链天线,杂合型则兼具二者特点。许多研究表明:三种类型的糖链具有共同的生物合成起源,即高甘露糖聚合物前体。该前体并非直接在蛋白质上合成出来的,而是在脂质载体多萜醇(Dol)上合成寡糖链后转运到蛋白质受体上。
前体物(Glc)3(Man)9(GlcNAc)2从脂供体在穿过内质网粗面(RER)膜时转到新生肽的Asn上,加工过程是以一个特异α1→2葡萄糖苷酶去除葡萄糖末端开始的。然后内部的两个葡萄糖残基被α1→3葡萄糖苷酶II切除,这些葡萄糖苷酶和α1,2-甘露糖苷酶都位于RER上。有人推测,葡萄糖修饰的目的是为了更有效地将蛋白从RER运到高尔基(Golgi)体。
糖蛋白到达Golgi体后,那些最终成为复合性结构的寡糖,通过N-已酰氨基葡萄糖转移酶I添加N-已酰葡萄糖胺残基,由Golgi体内的α-甘露糖酶II切除两个甘露糖残基,随后由GlcNAc转移酶加入天线上的GlcNAc残基。同时,Fuc转运酶可能转运一个Fuc到糖链的GlcNAc上。复合型寡糖的合成最后步骤发生在Golgi体的反面囊腔中。此时Gal或SA转移酶催化添加Gal和SA。最后新合成的糖蛋白离开Golgi体,运送到最终目的地。
最终的寡糖结构在很大程度上取决于糖蛋白在处理过程中与糖基化酶和糖基转移酶的作用顺序,以及它们特异性作用,许多不同的酶催化不同的反应,最后形成最终的寡糖结构。
酵母是目前应用最广泛的外源蛋白表达系统之一((J.M.Cregg,2000 FEMS MicrobiologyReviews 24(1)45-66)。该系统兼有原核表达系统和真核表达系统的优点:易于操作培养、快速生长、表达量高,同时又能对外源真核基因进行正确翻译和翻译后加工与修饰,并能对许多蛋白质产物进行分泌表达,使产物易于提纯。已用该系统成功表达了数百种来自病毒、细菌、真菌、动植物和人的蛋白,如胰岛素、白介素、人血清白蛋白、肿瘤坏死因子、乙肝表面抗原、水蛭素等等。
虽然酵母和哺乳动物具有相同的糖基化起始步骤及内质网中的修饰过程,但由于酵母高尔基体中常产生高甘露糖型糖链并且缺少部分合成复杂型糖链的所需的系列酶,所以酵母工程菌株所表达糖蛋白的N-糖基化修饰主要为高甘露糖型。众所周知,高甘露糖型糖链糖蛋白具有很强的免疫原性,且在人体中半衰期短,易被清除。同时,不同类型的糖基化修饰对治疗性蛋白质的性质与疗效有很大影响。因此利用基因工程手段对酵母工程菌株进行遗传改造,使其产生具有不同类型糖基化修饰的糖蛋白,对于研究其性质、功能与疗效尤为有用。
Hamilton等人利用组合文库筛选的方法对毕赤酵母表达系统N-糖基化进行了人源化改造(S.R.Hamilton,Science 313,1441-1443),但该方法是对野生型酵母菌株进行改造,由于文库筛选方法本身成本较高,操作复杂,不适合对已构建好的工程菌株进行改造,本发明从这一要求出发,利用不同定位信号引导,同时借助各种筛选标志,以相对简便的方法对不同的糖蛋白表达工程菌株进行改造,使其产生的糖蛋白能够满足不同的目的要求。
发明内容
本发明涉及蛋白质糖基化工程领域,本发明涉及对工程菌株进行遗传改造的方法,以使其表达的异源糖蛋白N-糖基化修饰具有期望的糖链类型,所述糖链的末端糖基为选自甘露糖、葡萄糖、半乳糖和唾液酸中的一种或多种。
本申请中的术语“工程菌株”包括但不限于酵母工程菌株,例如,稳定表达异源蛋白的酿酒酵母、毕赤酵母或汉逊酵母。
本发明目的在于提供构建表达预定糖链修饰糖蛋白工程菌株的方法。
一方面,本发明提供了一种构建表达预定糖链修饰糖蛋白工程菌株的方法,该方法包括下列步骤:a)以编码糖苷酶α-1,2-甘露糖苷酶或其功能结构域的编码序列替换α-1,3-甘露糖基转移酶或α-1,6-甘露糖基转移酶基因的内部编码序列,构建同源重组突变基因序列;b)将步骤a)获得的重组突变基因序列插入具有筛选标志序列的载体中,得到重组质粒;c)将N-乙酰氨基葡萄糖转移酶I和β-1,4-半乳糖基转移酶的编码序列的编码序列分别与各自定位信号编码序列相连接,得到两种融合基因序列;d)将步骤c)获得的两种融合基因序列插入具有筛选标志序列的载体中,得到重组质粒;e)将α-2,6-唾液酸转移酶编码序列和唾液酸转运蛋白编码序列连接,得到融合基因序列;f)向载体中插入唾液酸合成酶编码序列使与载体内的筛选标志编码序列相连接,然后再向载体中插入步骤e)获得的融合基因序列,得到重组质粒;g)将(i)步骤a)得到的重组质粒,(ii)步骤a)和步骤b)得到的重组质粒,或者(iii)步骤a)、b)和c)得到的重组质粒,导入工程菌株,借助筛选标志筛选发生表型改变的工程菌株;h)在培养基中对所述工程菌株进行培养和诱导表达,收集上清中的糖蛋白并对其N-糖基化修饰糖链进行分析,确认工程菌株表达的糖蛋白N-糖基化修饰为预定糖链。
一个实施方案中,其中所述的α-1,2-甘露糖苷酶编码序列为SEQ ID NO:1。
一个实施方案中,其中所述的N-乙酰氨基葡萄糖转移酶I及定位信号的编码序列为SEQ IDNO:2。
一个实施方案中,其中所述的β-1,4-半乳糖基转移酶I及定位信号的编码序列为SEQ ID NO:3。
一个实施方案中,其中所述的α-2,6-唾液酸酶和唾液酸转运蛋白的编码序列为SEQ ID NO:4。
一个实施方案中,其中所述的唾液酸合成酶的编码序列为SEQ ID NO:5。
本发明中,所述的预定糖链的末端糖基为选自甘露糖、葡萄糖、半乳糖和唾液酸中的一种或多种。
本发明中,其中所述的预定糖链的结构为选自下列其中的一种或多种:Man5GlcNAc2、GalGlcNAcMan5GlcNAc2和SAGalGlcNAcMan5GlcNAc2
一方面,本发明提供了一种构建表达低甘露糖型糖链糖蛋白的工程菌株的方法,该方法包括通过基因工程手段对工程菌株进行改造,使其表达的异源糖蛋白的糖链由原来的高甘露糖型糖链变为免疫原性较低的短甘露糖型糖链,其特征在于所述短甘露糖型糖链的结构为Man5GlcNAc2
在本发明的一个实施方案中,构建异源糖蛋白表达工程菌株,使其基因组α-1,6-甘露糖基转移酶失活,同时工程菌株获得α-1,2-甘露糖苷酶活性。
具体而言,以α-1,2-甘露糖苷酶与筛选标志的编码序列替换α-1,6-甘露糖基转移酶和/或α-1,3甘露糖基转移酶基因的编码序列,构建两侧与基因组α-1,6-糖基转移酶和/或α-1,3糖基转移酶基因同源,而内部编码序列被α-1,2-甘露糖苷酶编码序列取代的同源重组突变序列,将突变序列导入工程菌株,通过筛选标志筛选发生同源重组的工程菌株。发生同源重组指的是工程菌株基因组上α-1,6-甘露糖基转移酶基因序列被外源插入序列所取代,从而使所述工程菌株失去α-1,6-甘露糖基转移酶活的同时获得了α-1,2-甘露糖苷酶活性。
另一方面,本发明提供了一种构建表达杂合型糖链糖蛋白的工程菌株的方法,该方法包括在前述构建的短甘露糖型修饰糖蛋白表达工程菌株的基础上,通过基因工程手段进一步对其进行改造,使其表达的异源糖蛋白的糖链由原来的高甘露糖型糖链或短甘露糖型糖链变为杂合型糖链,其特征在于所述杂合型糖链的结构为GalGlcNAcMan5GlcNAc2
在本发明的一个实施方案中,其中所述的基因工程手段为引入N-乙酰氨基葡萄糖转移酶I和β-1,4-半乳糖基转移酶活性。
具体而言为,将N-乙酰氨基葡萄糖转移酶I与其定位信号的编码序列相连接,插入含有筛选标志基因序列的载体;将β-1,4-半乳糖基转移酶与其定位信号的编码序列相连接,插入相应载体后切下含有启动子和编码序列部分,插入前述构建的含有N-乙酰氨基葡萄糖转移酶I的载体,构建重组质粒,导入前述短甘露糖型工程菌株,筛选具有筛选标志表型的重组菌株,使其获得N-乙酰氨基葡萄糖转移酶I和β-1,4-半乳糖基转移酶活性。
另一方面,本发明提供了一种构建表达复合型糖链糖蛋白的工程菌株的方法,该方法包括在前述构建的杂合型糖链糖蛋白的工程菌株的基础上,通过基因工程手段进一步对其进行改造,使其表达的异源糖蛋白的糖链由原来的高甘露糖型糖链或短甘露糖型糖链或杂合型糖链变为复合糖链,其特征在于所述复合型糖链的结构为SAGalGlcNAcMan5GlcNAc2
在本发明的一个实施方案中,其中所述的基因工程手段为引入α-2,6-唾液酸转移酶和唾液酸合成酶活性,使其产生的糖蛋白糖基化修饰具有糖链末端为唾液酸的复合型结构。
具体而言为,将α-2,6-唾液酸转移酶与唾液酸转运蛋白的编码序列相连接,插入含有筛选标志序列的载体;将唾液酸合成酶编码序列与载体中筛选标志的编码序列相连接,构建重组质粒,导入前述杂合型工程菌株,筛选具有筛选标志表型的重组菌株,使其获得α-2,6-唾液酸转移酶和唾液酸合成酶活性。
另一方面,本发明提供了用上述方法生产的能够表达预定糖链修饰糖蛋白的工程菌株。其中所述的预定糖链类型为短甘露糖型糖链、杂合型糖链或复合型糖链,所述糖链的末端糖基为选自甘露糖、葡萄糖、半乳糖和唾液酸中的一种或多种。
附图说明
图1描述用于同源重组引入α-1,2-甘露糖苷酶基因,同时失活基因组α-1,6-糖基转移酶基因的重组质粒构建策略。
图2描述根据本发明所述方法改造后,β-IFN/GS115表达工程菌株所产生的β-IFN糖链的质谱分析图,1904位置的峰对应于SAGalGlcNAcMan5GlcNAc2
除非本文另有定义,本发明相关使用的科学和技术术语具有本领域技术人员通常理解的含义。本发明的方法和技术通常根据本领域众所周知的常规方法进行。通常,与本文所述相关使用的命名,以及本文所述的生物化学、酶学、分子和细胞生物学、微生物学、遗传学以及蛋白质和核酸化学杂交技术及电泳分析技术是本领域众所周知的而且普遍使用的。除非另有说明,本发明的方法和技术通常按照本技术领域众所周知以及更为具体的参考文献中所记载的常规方法进行。参见例如Sambrook等,Molecular Cloning:A Laboratory Manual,2d ed.,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.(1989);Introduction toGlycobiology,Maureen E.Taylor,Kurt Drickamer,Oxford Univ.Press(2003);
除非另有说明,下列术语应被理解为如下含义:
N-糖基化修饰指包含N-乙酰葡萄糖胺残基的糖链与多肽链中天冬酰胺(Asn)残基的酰胺氮相连接,糖链的主要组分包括葡萄糖、甘露糖、半乳糖、岩藻糖、N-乙酰葡萄糖胺、N-乙酰半乳糖胺和唾液酸。糖基化修饰主要在内质网(ER)腔与翻译同时进行,并在高尔基体中继续反应成N-糖基化蛋白。
N-糖基化修饰类型指糖蛋白中与多肽链中Asn相连的外部糖链类型。外部糖链类型主要有高甘露糖型(High mannose type),杂合型(Hybrid type)与复合型(Complex type)三种。
本文使用的术语,“基因序列”是指具有预定功能的DNA序列,可以是基因组中含有基因外元与内元的DNA序列,可以是编码或不编码氨基酸的DNA序列,可以是构成载体元件的人工DNA序列。
本文使用的术语,“编码序列”是指能按照密码子规则翻译成预定氨基酸序列的DNA序列。
本发明的术语,“定位信号”是指能使蛋白质锚定在内质网、高尔基体或高尔基体外侧网络中预定位置的多肽序列。所述多肽序列可分为如下三类:a)N-末端序列,该序列编码胞质尾(ct)、跨膜功能结构域(tmd)以及部分或全部的茎区(sr),其共同或独立地将蛋白质锚定在高尔其体内;b)回收信号,其通常位于C-端,例如HDEL或KDEL四肽;和c)源自各种蛋白质跨膜区的序列,例如定位于高尔基体的核糖体转运蛋白。
本文使用的术语,“载体”是指能够转运已经与其连接的另一基因序列的DNA分子。载体的一种类型是“质粒”,其是环状双链的DNA环,其可连接其它DNA片段成双链环状DNA。某些载体可以在其导入的宿主细胞中自主复制,其它载体可在导入宿主细胞后整合到宿主细胞的基因组中,并随宿主基因组一起复制。此外,载体还含有预定的控制序列。已有多种载体商品化并可应用细菌、病毒、真菌、植物和动物宿主细胞,例如Invitrogen公司的系列载体。
本发明的术语,“筛选标志”是指赋予宿主细胞抗药性或补足宿主细胞代谢缺陷的基因序列。筛选标志的存在用于后续的转化子筛选。例如在酵母中,可有的筛选标志包括HIS4、GENETICIN、ZEO、BLA、URA3、URA5、Blasticidin基因。多种筛选标志是已知的并已应用于细菌、病毒、真菌、植物和动物宿主细胞。
本发明的术语“工程菌株”,包括但不限于,能产生某种预定蛋白质的工程化菌株,其稳定表达所述蛋白质,所述蛋白质具有某种预定的应用价值。所述工程菌株可以通过诱变筛选,也可以通过基因工程手段建立。多种工程菌株可由商业上获得或可采用标准技术制备。
改造工程菌株蛋白糖基化修饰类型
本发明的一个目的是提供构建工程菌株的方法,将其表达的异源糖蛋白的高甘露糖型糖链改造成免疫原性较低的短甘露糖型糖链的方法,其特征在于糖蛋白的修饰糖链的结构为Man5GlcNAc2结构。
根据本发明,以基因重组方式对异源糖蛋白表达工程菌株进行改造,向基因组中原α-1,6-糖基转移酶或α-1,3甘露糖基转移酶编码序列位置处插入α-1,2-甘露糖苷酶编码序列,破坏工程菌株α-1,6-糖基转移酶或α-1,3甘露糖基转移酶活性的同时,获得了α-1,2-甘露糖苷酶活性。
本发明的一个实施方案中,以α-1,2-甘露糖苷酶与筛选标志的编码序列替换α-1,6-甘露糖基转移酶基因内部的编码序列。
通过PCR方法从工程菌株中获得α-1,6-甘露糖基转移酶编码序列的两侧基因片段,其中上游片段的3’端保留α-1,6-甘露糖基转移酶的跨膜区部分;在去掉自身跨膜区的α-1,2-甘露糖苷酶编码序列的C端引入筛选标志,然后在此序列的两侧分别与α-1,6-甘露糖基转移酶上、下游的侧翼片段相连,设计上确保α-1,2-甘露糖苷酶与原α-1,6-甘露糖基转移酶的跨膜区融合,构建重组质粒并转化工程菌株。利用筛选标志和PCR方法筛选发生同源重组的工程菌株,最后借助分析手段对异源表达糖蛋白的糖链结构鉴定进行确认。
用于遗传改造的α-1,2-甘露糖苷酶基因选自哺乳动物如人、小鼠,植物如大豆或真菌如黑曲霉或里氏木霉,优选里氏木霉α-1,2-甘露糖苷酶基因,优选根据密码子偏嗜性优化的序列如SEO ID NO.1;
所述α-1,6-甘露糖基转移酶侧翼片段,通过PCR方法从工程菌株的基因组获得。跨膜序列前保留核苷酸长度100bp以上,优选500bp以上,更优选900bp以上,插入序列后保留核苷酸长度100bp以上,优选400bp以上。
所述的筛选标志选自HIS4、GENETICIN、ZEO、BLA、URA3、URA5、BLASTICIDIN,优选GENETICIN。
所述载体为整合型质粒载体,例如美国Promega公司(Promega,USA)的系列载体。
工程菌株包括但不限于,酵母工程菌株例如酿酒酵母和毕赤酵母表达工程菌株,优选GS115表达工程菌株。
导入工程菌株的方法,可以使用任何方便的DNA转化方法,例如电穿孔、PEG-氯化锂或原生质球法。
筛选除利用筛选标志获得相应表型外,还要对工程菌株通过PCR鉴定和异源糖蛋白糖链结构分析进行确认。筛选方法可通过一系列表型富集和/或排除步骤来进行。例如,可通过特异性结合N-寡糖的凝集素,对具有正确糖基化表型的菌株加以富集;随后,可采用多种分析方法对糖蛋白的糖链结构进行分析,例如荧光测定法。可选地,采用本领域已知技术分离并纯化糖蛋白,使用诸如内切-β-N-乙酰葡萄糖胺糖苷酶(New England Biolabs)从糖蛋白上切下糖链,然后通过毛细管电泳或质谱或其它适宜的方法对其加以分析。
本发明进一步提供将异源表达糖蛋白的高甘露糖型糖链改造成杂合型糖链的方法,其特征在于具有GalGlcNAcMan5GlcNAc2结构。
根据本发明,在构建前述短甘露糖型修饰糖蛋白表达工程菌株的基础上,进一步引入N-乙酰氨基葡萄糖转移酶I和β-1,4-半乳糖基转移酶活性。
本发明的一个实施方案中,合成N-乙酰氨基葡萄糖转移酶I与其定位信号的融合编码序列,其中定位信号位于酶编码序列的N-端。将合成序列插入含有筛选标志基因序列的载体;合成β-1,4-半乳糖基转移酶与其定位信号的融合编码序列定位信号位于酶编码序列的C-端,插入相应载体后切下含有启动子和融合序列部分,插入前述构建的含有N-乙酰氨基葡萄糖转移酶I融合序列的载体,构建重组质粒,导入前述短甘露糖型工程菌株,筛选具有筛选标志表型的重组菌株,使其获得N-乙酰氨基葡萄糖转移酶I和β-1,4-半乳糖基转移酶活性。
所述N-乙酰氨基葡萄糖转移酶I基因选自哺乳动物、人、昆虫和植物。优选地,将N-乙酰氨基葡萄糖转移酶I基因与早期高尔基体定位信号编码序列相连接,优选的定位信号为MNN9,优选人工合成根据密码子偏嗜性的融合序列如SEO ID NO.2。
所述β-1,4-半乳糖基转移酶基因选自哺乳动物、人、昆虫和植物。优选地,将β-1,4-半乳糖基将转移酶基因与中期高尔基体定位信号编码序列相连接,优选的定位信号为HDEL,优选人工合成根据密码子偏嗜性的融合序列如SEO ID NO.3。
所述筛选标志选自HIS4、GENETICIN、ZEO、BLA、URA3、URA5、BLASTICIDIN,优选HIS4。
所述载体为整合型质粒载体,例如美国Invitrogen公司的系列载体,优选酵母表达载体,更优选毕赤酵母表达载体,更优选pGAPZA(Invitrogen,USA)。
本发明进一步提供将异源表达糖蛋白的具有复合型糖链修饰的方法,其特征在于具有SAGalGlcNAcMan5GlcNAc2结构。
根据本发明,在构建前述杂合型工程菌株的基础上,进一步获得α-2,6-唾液酸转移酶和唾液酸合成酶活性,使其产生的糖蛋白糖基化修饰具有糖链末端为唾液酸的复合型结构。
本发明的一个实施方案中,合成α-2,6-唾液酸转移酶与唾液酸转运蛋白的融合编码序列,插入含有筛选标志序列的载体;将唾液酸合成酶编码序列与载体中筛选标志的编码序列相连接,构建重组质粒,导入前述杂合型工程菌株,筛选具有筛选标志表型的重组菌株,使其获得α-2,6-唾液酸转移酶和唾液酸合成酶活性。
所述唾液酸转运蛋白和α-2,6-唾液酸转移酶基因选自哺乳动物、人、昆虫、植物和光合细菌。优选α-2,6-唾液酸转移酶自身C端含有定位于晚期高尔基体序列的大鼠α-2,6-唾液酸转移酶,优选地,人工合成根据密码子偏嗜性的α-2,6-唾液酸转移酶和唾液酸转运蛋白的融合序列如SEO ID NO.4。
所述唾液酸合成酶基因选自哺乳动物、人、昆虫、植物和真菌。优选小鼠唾液酸合成酶。优选地,人工合成根据密码子偏嗜性的唾液酸合成酶编码序列如SEO ID NO.5。
所述筛选标志选自HIS4、GENETICIN、ZEO、BLA、URA3、URA5、BLASTICIDIN,优选BLASTICIDIN。
所述载体为整合型质粒载体,例如美国Invitrogen公司的系列载体,优选酵母表达载体,更优选毕赤酵母表达载体,更优选pPIC6(Invitrogen,USA)。
本发明的另一个目的是提供构建预定修饰糖链工程菌株的方法,其特征在于可设计产生的糖蛋白,其糖基化修饰糖链具有满足预定需要的结构。
根据本发明,可选择性地,分别或同时破坏工程菌株的α-1,6-甘露糖基转移酶和/或α-1,3甘露糖基转移酶活性,分别或同时向工程菌株中引入α-1,2-甘露糖苷酶、N-乙酰氨基葡萄糖转移酶I和β-1,4-半乳糖基转移酶、α-2,6-唾液酸转移酶和唾液酸合成本科活性,使其产生的糖蛋白糖基化修饰糖链根据需要,所述糖链的末端糖基为选自甘露糖、葡萄糖、半乳糖和唾液酸中的一种或多种。
预定结构的糖基化修饰糖链在治疗性糖蛋白的靶向中尤为有用。不同的糖链修饰在体内的组织分布有很大差异。例如甘露糖可靶向溶酶体,而半乳糖可靶向肝脏。此外,糖基化的末端糖链还影响到糖蛋白的免疫原性和体内半衰期等。
本发明通过下列实施例进一步举例说明。
实施例
实施例1α-1,6-甘露糖基转移酶的失活与α-1,2-甘露糖苷酶的引入
本实施例通过在α-1,6-甘露糖基转移酶基因中插入α-1,2-甘露糖苷酶和GENETICIN编码序列,然后转化毕赤酵母工程菌株IFN/GS115,通过筛选抗GENETICIN表型的工程菌株,得到α-1,6-甘露糖基转移酶失活而同时拥有α-1,2-甘露糖苷酶活性的工程菌株,其表达的糖蛋白具有结构为Man5GlcNAc2的修饰糖链。
材料与方法:
毕赤酵母工程菌株GS115购自Invitrogen公司,表达糖基化IFN的GS115工程菌株可从菌种保藏中心购买,也可采用Invitrogen公司的Original Pichia Expression Kit,按照其相关专利美国专利号4,879,231、4,882,279、4,885,242、4,895,800、4,929,555自行构建,本发明在此一并引入作为参考。本实施例中,使用EasySelectTM Pichia Expression Kit试剂盒(购自Invitrogen公司),按照专利CN1325651C中酵母表达部分的操作方法(在此引入作为参考),以所述试剂盒中的pPICZaA载体自行构建了能够表达带有His标签的β-干扰素的工程菌株。
载体pPIC9K、pPIC9和pPIC6均购自Invitrogen公司。
1)重组质粒的构建
本发明人根据酵母密码子偏嗜性设计并合成了α-1,2-甘露糖苷酶的编码基因,其核苷酸序列如Seq ID NO.1所示,将合成序列克隆于pUC19载体中,得到质粒pUC19-M。
根据GenBank中报道的毕赤酵母α-1,6-甘露糖基转移酶(och1)基因序列(E12456)、Hypocrea jecorina α-1,2-甘露糖苷酶编码序列(AF212153)和质粒pPIC9K中的kanamycin编码序列(赋予大肠杆菌卡那抗性,而使酵母具有Geneticin抗性的基因,位于载体的4928-5743位,815bp),设计4对寡核苷酸引物P1和P2、P3和P4,P5和P6、P7和P8。
P1:5’-TCAGAAACAGACACAGAGCGTTCTG-3’(OCH1基因F1的正向引物),
P2:5’-AGCGTTCCAAGAAGTTTGGAATATTTTTGGAGATGATAATTGTTGTG-3’(OCH1基因F1的反向引物);
P3:5’-CACAACAATTATCATCTCCAAAAATATTCCAAACTTCTTGGAACGCT-3’(甘露糖苷酶编码序列M的正向引物),
P4:5’-CGTTTCCCGTTGAATATGGCTCAT TTAGGCTAAGTGACCACCTCTACG-3’(甘露糖苷酶编码序列M的反向引物);
P5:5’-CGTAGAGGTGGTCACTTAGCCTAAATGAGCCATATTCAACGGGAAACG-3’(卡那霉素的正向引物)
P6:5’-ATCTATTTTACTCTAGCTTTCTTTAGAAAAACTCATCGAGCATC-3’(卡那霉素的反向引物);
P7:5’-GATGCTCGATGAGTTTTTCTAAAGAAAGCTAGAGTAAAATAGAT-3’(OCH1基因F2的正向引物),
P8:5’-GTCGACGTTCTTGTCAATTCGGAAAG-3’(OCH1基因F2的反向向引物)。
采用基因组提取试剂盒(购自Invitrogen公司)提取GS115工程菌株基因组DNA。在50μl的PCR反应体系中加入2×master mix(Qiagen公司)25μl、基因组DNA模板2μl引物P1和P2(各0.5μl)1μl、Pfu(高保真DNA聚合酶,Qiagen公司)1μl,补水至体积为50μl;于94℃变性5min,然后94℃,30s、60℃,45s、72℃,60s共循环30次,最后72℃延伸10min,所得PCR产物在1%的琼脂糖凝胶上进行电泳分析,回收950bp的目的条带备用[och1编码序列上游片段F1,243-1167,950bp,其中F1的3’端保留有α-1,6-甘露糖基转移酶跨膜区(29aa)的基因编码序列(1080-1167,87bp)]。以同样反应体系,改以P7和P8(各0.5μl)为扩增引物,94℃变性5min,然后94℃,30s、54℃,45s、72℃,45s循环30次,最后72℃延伸7min,所得PCR产物在1%的琼脂糖凝胶上进行电泳分析,回收650bp的目的条带(och1编码序列下游片段F2,2241-2858,650bp)备用。
里氏木霉α-1,2-甘露糖苷酶除去跨膜区(29aa)的编码序列M(1446bp)由上海生物工程有限公司合成,克隆于pUC19中,所得质粒命名为pUC19-M。在50μl的PCR反应体系中加入2×master mix(Qiagen公司)25μl、质粒pUC19-M模板0.1μl,引物P3和P4(各0.5μl)1μl、Pfu(高保真DNA聚合酶,Qiagen公司)1μl,补水至体积为50μl;于94℃变性5min,然后94℃,30s、55℃,45s、72℃,90s共循环30次,最后72℃延伸10min,所得PCR产物在1%的琼脂糖凝胶上进行电泳分析,回收1480bp的目的条带(α-1,2-甘露糖苷酶编码序列M,1480bp)备用。
在50μl的PCR反应体系中加入2×master mix(Qiagen公司)25μl、质粒pPIC9K模板0.1μl,引物P5和P6(各0.5μl)1μl、Pfu(高保真DNA聚合酶,Qiagen公司)1μl,补水至体积为50μl;于94℃变性5min,然后94℃,30s、58℃,45s、72℃,90s共循环30次,最后72℃延伸7min,所得PCR产物在1%的琼脂糖凝胶上进行电泳分析,回收850bp左右的目的条带(Kanamycin编码序列K,850bp)备用。
在50μl的PCR反应体系中加入2×master mix(Qiagen公司)25μl、前述PCR产物F1、F2、M、K各2μl,Pfu(高保真DNA聚合酶,Qiagen公司)2μl,补水至体积为50μl;于94℃变性5min,然后94℃,30s、50℃,120s,68℃,120s循环5次,最后72℃延伸7min。然后加入引物P1和P8各0.5μl,继续循环30次,最后72℃延伸10min。所得PCR产物在0.8%的琼脂糖凝胶上进行电泳分析,回收3800bp左右的目的条带(F1-MK-F2片段),连接到pEGM-T easy载体(Promega公司,USA)中,经序列分析结果得到验证。重组质粒的构建策略如图1所示。
2)工程菌株的转化与筛选
构建好的质粒以EcoRI酶切,回收F1-MK-F2片段。采用前述电穿孔方法转化工程菌株,涂布于含有Geneticin的YPD平板上进行筛选。挑选能够在Geneticin抗性平板上生长的菌株,提取基因组DNA,分别以P3和P6为引物进行PCR鉴定,PCR产物在0.8%的琼脂糖凝胶电泳上进行分析,能扩增出2300bp特异性产物的菌株为阳性基因重组工程菌株,命名为IFN/GSm。
3)工程菌株表达糖蛋白的纯化与鉴定
将工程菌株IFN/GSm接种于100mL BMGY培养基中,培养至O.D600=6.0左右,离心去除培养上清,以BMMY重悬,使其O.D600=1.0,继续培养,每24小时补充诱导剂甲醇至终浓度为1%。诱导结束后离心收集培养上清,首先采用Ni-亲和层析柱从上清中纯化β-IFN,纯化后的重组β-IFN用内切-β-N-乙酰葡萄糖胺糖苷酶(New England Biolabs)从糖蛋白上切下糖链,再采用ConA亲和层析柱(Qiagen,German)纯化回收切下的糖链,通过MALDI-TOF分析其糖链结构,通过与标准样品质谱进行比较,确认工程菌株IFN/GSm表达的IFN-β的N糖基化修饰糖链具有Man5GlcNAc2结构(图未给出)。
实施例2N-乙酰氨基葡萄糖转移酶I和β-1,4-半乳糖基转移酶甘露糖苷酶活性的引入
本实施例是向实施例1构建的工程菌株IFN/GSm基因组中整合含有定位序列的N-乙酰氨基葡萄糖转移酶I和β-1,4-半乳糖基转移酶的编码序列,使改造后的工程菌株表达的β-IFN具有结构为GalGlcNAcMan5GlcNAc2的修饰糖链。
材料与方法:
1)重组质粒的构建
IFN/GSm工程菌株按照实施例1制备,根据酵母密码子偏嗜性设计并合成了N-乙酰氨基葡萄糖转移酶I及定位信号MNN9融合蛋白的编码序列mGn,其中MNN9定位信号(38aa)的编码序列位于N-乙酰氨基葡萄糖转移酶I的5’-端,并在序列的5’端和3’端分别引入EcoRI和NotI酶切位点,序列如Seq ID NO.2所示,将合成序列克隆于pUC载体中;根据酵母密码子偏嗜性设计并合成β-1,4-半乳糖基转移酶及定位信号HDEL的编码序列Gah,其中HDEL定位信号位于β-1,4-半乳糖基转移酶的C-端,并在序列的5’端和3’端分别引入EcoRI和NotI酶切位点,序列如Seq ID NO.3所示,合成序列克隆于pUC载体中,所得质粒命名为pUC-Gah。
以pPIC9载体为模板,采用引物对P9和P10扩增HIS编码序列(1980-4584,宿主细胞的组氨酸缺陷代偿基因):
P9:5’-GGATCCATGACATTTCCCTTGCTACCTGCATAC-3’
P10:5’-GATATCTTAAATAAGTCCCAGTTTCTCCATAC-3’
上游引物引入BamHI位点,下游引物引入EcoRV位点,在50μl PCR反应体系中加入2×master mix(Qiagen公司)25μl、质粒pPIC9模板0.1μl,引物P9和P10(各0.5μl)1μl、Pfu(高保真DNA聚合酶,Qiagen公司)1μl,补水至体积为50μl;于94℃变性5min,然后94℃,30s、55℃,45s、72℃,90s共循环30次,最后72℃延伸10min,所得PCR产物在0.8%的琼脂糖凝胶上进行电泳分析,回收2600bp左右的目的条带(His序列H,2610bp)。回收产物经BamHI和EcoRV双酶切后再进行胶回收,与同样酶切的pGAPZA载体以T4 DNA连接酶16℃连接过夜,转化DH5α感受态,筛选Zeocin(Invitrogen公司)抗性菌,提取质粒进行酶切鉴定,切下插入片段条带的质粒为重组质粒,命名为pPH。
分别以EcoRI和NotI双酶切mGn序列和Gah序列,1%琼脂糖凝胶回收相应片段(1350bp和950bp)。分别将mGn序列和GaH序列与同样酶切的pPH载体,以T4 DNA连接酶16℃连接过夜,转化DH5α感受态,筛选Zeocin(Invitrogen公司)抗性菌,提取质粒进行酶切鉴定,能切下插入片段条带的质粒为重组质粒,分别命名为pPHmGn和pPGah。以BglII和BamHI酶切pPGah质粒,得到与5’AOX1启动子连接的Gah序列PGaH;以BamHI酶切pPHmGn质粒,利用BglII与BamHI同尾酶的特性将PGah插入pPHmGn,筛选能切下插入片段的重组质粒,命名为pPH-GnGa。
2)工程菌株的转化与筛选
按照pPIC9K Mannual(Invitrogen公司)操作手册所述电穿孔方法,将质粒pPH-GnGa转化工程菌株IFN/GSm,筛选能在MD(His缺陷型培养基)平板上生长的菌株。所得菌株再分别以mGn和GaH的特异性引物对P11和P12、P13和P14进行PCR鉴定。
P11:ACCAGACTTGTCTTCTATCGCTGTT
P12:TACCGGTGTATTGAACTCTAACTTC
P13:TCGACTTGATCCCAATGAACGAT
P14:GCCAGTTCGTCGTGTTAGGATG
PCR产物在1%琼脂糖凝胶电泳上分析,能同时扩增680bp和418bp片段的菌株为阳性基因重组工程菌株,命名为IFN/GSmGna。
3)工程菌株表达糖蛋白的纯化与鉴定
按照实施例1中步骤3操作,纯化工程菌株IFN/GSmGna表达的IFN,并对其糖链结构进行质谱分析鉴定,确认工程菌株表达糖蛋白的糖基化修饰糖链结构为GalGlcNacMan5GlcNAc2(图未给出)。
实施例3引入唾液酸转运蛋白和α-2,6-唾液酸转移酶活性
本实施例是向实施例2构建的工程菌株IFN/GSmGna基因组中整合含有定位序列的唾液酸转运蛋白和α-2,6-唾液酸转移酶编码序列,使工程菌株表达的β-IFN的具有结构为SAGalGlcNAcMan5GlcNAc2修饰糖链。
材料与方法
1)重组质粒的构建
IFN/GSmGna工程菌株按照实施例2制备,根据酵母密码子偏嗜性设计α-2,6-唾液酸转移酶及唾液酸转运蛋白融合蛋白的编码序列STC,其上下游分别引入EcoRI和NotI酶切位点,序列如Seq ID NO.4所示,由上海生工生物工程有限公司合成,克隆于pUC载体中,命名为pUC-STC;质粒pUC-STC经EcoRI和NotI双酶切后,胶回收STC片段,与同样酶切的pPIC6载体以T4DNA连接酶16℃连接过夜,转化DH5α感受态,筛选Blasticidin(Invitrogen公司)抗性菌,提取质粒进行酶切鉴定,能切下插入片段条带的质粒为重组质粒,命名pPIC6-STC。
根据酵母密码子偏嗜性设计并合成唾液酸合成酶的编码序列SS,其下游引入NcoI酶切位点,序列如SEQ ID NO.5所示,由上海生工生物工程有限公司合成,克隆于pUC载体中,命名为pUC-SS。以EcoRI酶切pUC-SS,Klenow酶(NEB公司)补平后再用NcoI酶切,胶回收切下的片段,与NcoI酶切并去磷酸化的pPIC6-STC质粒以T4DNA连接酶16℃连接过夜,转化DH5α感受态,筛选Zeocin(Invitrogen公司)抗性菌,提取质粒进行酶切鉴定,能切下插入片段条带的质粒为重组质粒,命名pPIC6-STCS。
2)工程菌株的转化与筛选
按照pPIC9K Mannual(Invitrogen公司)操作手册所述电穿孔方法,将质粒pPIC6H-GnGa转化工程菌株IFN/GSmGna,筛选能在blasticidin抗性平板上生长的菌株。所得菌株再分别以STC和SS的特异性引物对P15和P16、P17和P18进行PCR鉴定。
P15:GGAATTGGCTAAGTTGTCCGTCCC
P12:CAACAAGGCACCCAAAGCGAAAGAC
P13:GGTATGGATGAAATGGCCGTTGAA
P14:TAAAGAAGCGGAGTGATCGGAACCC
同时扩增出660bp和430bp片段的菌株为阳性基因重组工程菌株命名为IFN/GSmGnaS。
3)工程菌株表达糖蛋白的纯化与鉴定
按照实施例1中步骤3操作,不同之处在于,分别采用内切-β-N-乙酰葡萄糖胺糖苷酶(New England Biolabs)从工程菌株IFN/GSmGnaS表达的IFN糖蛋白上切下糖链,并且采用Qproteome Sialic Glycoprotein Kit(Qiagen,German)纯化,采用毛细管电泳法对其糖链结构进行质谱分析鉴定,如附图2所示,确认IFN-β的N-糖基化修饰具有SAGalGlcNAcMan5GlcNAcGlc2的糖链结构。
序列表
<110>高新
<120>构建表达预定糖链修饰糖蛋白工程菌株的方法
<130>xxx
<160>5
<170>PatentIn version 3.4
<210>1
<211>1446
<212>DNA
<213>人工序列
<220>
<221>CDS
<222>(1)..(1446)
<400>1
ttc caa act tct tgg aac gct tac cac cac ttc gcc ttc cca cat gat    48
Phe Gln Thr Ser Trp Asn Ala Tyr His His Phe Ala Phe Pro His Asp
1               5                   10                  15
gat tta cac cca gtt tct aac tct ttt gac gac gag aga aac ggt tgg    96
Asp Leu His Pro Val Ser Asn Ser Phe Asp Asp Glu Arg Asn Gly Trp
            20                  25                  30
ggt agc tcc gct att gat ggc ttg gat acc gct att ttg atg ggt gac    144
Gly Ser Ser Ala Ile Asp Gly Leu Asp Thr Ala Ile Leu Met Gly Asp
        35                  40                  45
gct gac att gtt aac act atc ttg caa tac gtt cca caa att aac ttc    192
Ala Asp Ile Val Asn Thr Ile Leu Gln Tyr Val Pro Gln Ile Asn Phe
    50                  55                  60
acc act acc gct gtt gcc aac caa ggt tcc tcc gtc ttc gaa acc aac    240
Thr Thr Thr Ala Val Ala Asn Gln Gly Ser Ser Val Phe Glu Thr Asn
65                  70                  75                  80
atc aga tac ttg ggt ggt ttg ttg tct gct tac gac ttg ttg aga ggt    288
Ile Arg Tyr Leu Gly Gly Leu Leu Ser Ala Tyr Asp Leu Leu Arg Gly
                85                  90                  95
cct ttc tct tct cta gct act aac caa acc ttg gtt aac tct ttg ttg    336
Pro Phe Ser Ser Leu Ala Thr Asn Gln Thr Leu Val Asn Ser Leu Leu
            100                 105                 110
aga caa gct caa acc ttg gct aac ggt ttg aag gtc gct ttc act acc    384
Arg Gln Ala Gln Thr Leu Ala Asn Gly Leu Lys Val Ala Phe Thr Thr
        115                 120                 125
cca tct ggt gtt cca gac cct act gtc ttc ttc aac cca act gtt aga    432
Pro Ser Gly Val Pro Asp Pro Thr Val Phe Phe Asn Pro Thr Val Arg
    130                 135                 140
aga tcc ggt gcc tct tct aac aac gtc gct gaa atc ggt tcc ttg gtc    480
Arg Ser Gly Ala Ser Ser Asn Asn Val Ala Glu Ile Gly Ser Leu Val
145                 150                 155                 160
ttg gaa tgg acc aga ttg tct gac ttg act ggt aac cca caa tac gct    528
Leu Glu Trp Thr Arg Leu Ser Asp Leu Thr Gly Asn Pro Gln Tyr Ala
                165                 170                 175
caa ttg gct caa aag ggt gaa tct tac ttg cta aac cca aag ggt tct    576
Gln Leu Ala Gln Lys Gly Glu Ser Tyr Leu Leu Asn Pro Lys Gly Ser
            180                 185                 190
cca gaa gct tgg cca ggt ttg atc ggt act ttc gtt tct act tcc aac    624
Pro Glu Ala Trp Pro Gly Leu Ile Gly Thr Phe Val Ser Thr Ser Asn
        195                 200                 205
ggt act ttc caa gac tct tct ggt tct tgg tct ggt ttg atg gac tct    672
Gly Thr Phe Gln Asp Ser Ser Gly Ser Trp Ser Gly Leu Met Asp Ser
    210                 215                 220
ttc tac gaa tac ttg atc aag atg tac ttg tat gat cca gtc gct ttc    720
Phe Tyr Glu Tyr Leu Ile Lys Met Tyr Leu Tyr Asp Pro Val Ala Phe
225                 230                 235                 240
gct cac tac aaa gac aga tgg gtt ttg ggt gct gac tct act atc ggt    768
Ala His Tyr Lys Asp Arg Trp Val Leu Gly Ala Asp Ser Thr Ile Gly
                245                 250                 255
cac ttg ggt tct cac cct tcc acc aga aag gac ttg acc ttc cta tct    816
His Leu Gly Ser His Pro Ser Thr Arg Lys Asp Leu Thr Phe Leu Ser
            260                 265                 270
tct tac aac ggt caa tct act tcc cca aac tct ggt cat ttg gcc tcc    864
Ser Tyr Asn Gly Gln Ser Thr Ser Pro Asn Ser Gly His Leu Ala Ser
        275                 280                 285
ttc ggt ggt ggt aac ttt atc tta ggt ggt att ttg ttg aac gaa caa    912
Phe Gly Gly Gly Asn Phe Ile Leu Gly Gly Ile Leu Leu Asn Glu Gln
    290                 295                 300
aag tac att gac ttc ggt att aag ttg gct tcc tct tac ttc ggt act    960
Lys Tyr Ile Asp Phe Gly Ile Lys Leu Ala Ser Ser Tyr Phe Gly Thr
305                 310                 315                 320
tac acc caa act gcc tct ggt atc ggt cca gaa ggt ttc gcc tgg gtt    1008
Tyr Thr Gln Thr Ala Ser Gly Ile Gly Pro Glu Gly Phe Ala Trp Val
                325                 330                 335
gac tct gtt acc ggt gct ggt ggt tcc cca cca tct agc caa tcc ggt    1056
Asp Ser Val Thr Gly Ala Gly Gly Ser Pro Pro Ser Ser Gln Ser Gly
            340                 345                 350
ttc tac tcc tct gcc ggt ttc tgg gtc acc gct cca tac tac att ttg    1104
Phe Tyr Ser Ser Ala Gly Phe Trp Val Thr Ala Pro Tyr Tyr Ile Leu
        355                 360                 365
cgt cca gaa act ttg gaa tct ttg tac tac gct tac aga gtc acc ggt    1152
Arg Pro Glu Thr Leu Glu Ser Leu Tyr Tyr Ala Tyr Arg Val Thr Gly
    370                 375                 380
gac tcc aag tgg caa gac ttg gct tgg gaa gct ttg tcc gcc atc gaa    1200
Asp Ser Lys Trp Gln Asp Leu Ala Trp Glu Ala Leu Ser Ala Ile Glu
385                 390                 395                 400
gac gct tgt aga gct ggt tcc gcc tac tcc tct att aac gac gtt acc    1248
Asp Ala Cys Arg Ala Gly Ser Ala Tyr Ser Ser Ile Asn Asp Val Thr
                405                 410                 415
caa gct aac ggt ggt ggt gct tct gac gat atg gaa tcc ttt tgg ttc    1296
Gln Ala Asn Gly Gly Gly Ala Ser Asp Asp Met Glu Ser Phe Trp Phe
            420                 425                 430
gct gaa gct ttg aag tac gct tac tta atc ttc gcc gaa gaa tcc gat    1344
Ala Glu Ala Leu Lys Tyr Ala Tyr Leu Ile Phe Ala Glu Glu Ser Asp
        435                 440                 445
gtc caa gtt caa gct acc ggt ggt aac aag ttc gtt ttc aac act gaa    1392
Val Gln Val Gln Ala Thr Gly Gly Asn Lys Phe Val Phe Asn Thr Glu
    450                 455                 460
gct cac cca ttc tct atc aga tcc tct tct cgt aga ggt ggt cac tta    1440
Ala His Pro Phe Ser Ile Arg Ser Ser Ser Arg Arg Gly Gly His Leu
465                 470                 475                 480
gcc taa                                                            1446
Ala
<210>2
<211>1355
<212>DNA
<213>人工序列
<220>
<221>融合基因
<222>(1)..(1355)
<400>2
gaattcatgt cactttctct tgtatcgtac cgcctaagaa agaacccgtg ggttaacatt    60
tttctacctg ttttggccat atttctaata tatataattt ttttccagag agatcaatct    120
agtgtttccg ctttggacgg tgacccagct tctttgacta gagaagtcat tagattggct    180
caagacgctg aagttgaatt ggaaagacaa agaggtttgt tgcaacaaat tggtgacgct    240
ttgtcctccc aaagaggtag agtcccaact gccgctcctc cagctcaacc aagagttcca    300
gtcactccag cccctgctgt catccctatt ttggttatcg cttgtgacag atccactgtc    360
agaagatgtt tggacaagtt gttgcattac agaccatccg ctgaattatt cccaatcatc    420
gtttctcaag actgtggtca cgaagaaacc gctcaagcta tcgcttccta cggttctgcc    480
gtgacccaca ttagacaacc agacttgtct tctatcgctg ttccaccaga tcaccgtaag    540
ttccaaggtt actacaagat cgctagacac tacagatggg ctttgggtca agtcttcaga    600
caattcagat tcccagctgc cgtcgttgtc gaagacgact tggaagtcgc tccagacttc    660
ttcgaatact tcagagctac ctatccattg ttgaaggctg atccatcttt atggtgtgtc    720
tctgcttgga acgacaacgg taaggaacaa atggtcgacg cttccagacc tgaattgttg    780
tacagaactg acttcttccc aggcttgggt tggttgttgt tggccgaatt gtgggccgaa    840
ttggaaccta agtggccaaa ggctttctgg gacgactgga tgagaagacc agaacaaaga    900
caaggtagag cttgtatcag accagaaatc tccagaacca tgaccttcgg tagaaagggt    960
gtctctcatg gtcaattctt cgaccaacat ttgaagttca tcaagttgaa ccaacaattc    1020
gtccacttca ctcaattgga tttgtcttac ctacaaagag aagcctacga tagagatttc    1080
ttagctagag tctacggtgc cccacaatta caagttgaaa aggtcagaac taacgacaga    1140
aaggaattag gtgaagttag agttcaatac accggtagag actccttcaa ggctttcgcc  1200
aaggccttgg gtgttatgga cgacttgaag tctggtgtcc caagagctgg ttacagaggt  1260
attgttacct tccaattcag aggtcgtaga gttcacttgg ctccaccacc aacttgggaa  1320
ggttacgacc catcttggaa ccattaggcg gccgc                             1355
<210>3
<211>956
<212>DNA
<213>人工序列
<220>
<221>融合基因
<222>(1)..(956)
<400>3
gaattcgctt cctctcaacc aagaccaggt ggtgactctt ctccagtcgt cgactctggt    60
ccaggtccag cctccaactt gacctctgtt ccagtcccac acactactgc tttgtccttg    120
ccagcttgtc cagaagaatc tccattgttg gtcggtccaa tgttgattga atttaacatg    180
ccagttgatt tggaattggt tgctaaacaa aacccaaacg tcaagatggg tggtagatac    240
gccccaagag attgtgtctc cccacacaag gtcgctatca tcatcccatt tagaaaccgt    300
caagaacact tgaagtactg gttgtactac ttgcacccag tcttgcaacg tcaacaattg    360
gactacggta tctacgttat caaccaagct ggtgacacta tcttcaacag agctaagttg    420
ttgaacgttg gcttccaaga agctctaaag gactacgatt acacctgttt tgtcttctcc    480
gacgtcgact tgatcccaat gaacgatcac aacgcttata gatgtttctc tcaaccaaga    540
cacatttctg ttgctatgga taaatttggt ttctctttac catacgtcca atacttcggt  600
ggtgtttctg ctttgtccaa gcaacaattc ttgactatta acggttttcc aaacaactac  660
tggggttggg gtggtgaaga tgacgacatc ttcaacagat tagttttcag aggtatgtct  720
atctccagac caaacgctgt cgtcggtaga tgtcgtatga tccgtcattc cagagacaag  780
aagaacgaac caaacccaca aagattcgat agaatcgctc acactaagga aactatgttg  840
tccgatggtt tgaactcctt gacctaccaa gtcttggacg tccaaagata cccactttac  900
acccaaatca ccgtcgacat tggtacccca tcctaacacg acgaactggc ggccgc      956
<210>4
<211>2087
<212>DNA
<213>人工序列
<220>
<221>融合基因
<222>(1)..(2087)
<400>4
gaattcatga ttcacaccaa cttgaagaag aaattctctt tgttcatctt ggttttcttg    60
ttgttcgctg ttatttgtgt ttggaagaag ggttccgact acgaagcttt gaccttgcaa    120
gctaaggaat tccaaatgcc aaagtctcaa gaaaaggtcg ctatgggttc cgcctctcaa    180
gttgtcttct ctaactccaa gcaagatcca aaggaagaca tcccaatctt gagttaccac    240
agagtcactg ccaaggttaa gccacaacca tctttccaag tctgggacaa ggactccact    300
tactccaagt tgaacccaag attgctaaag atttggagaa actacttgaa catgaataag    360
tacaaggtct cttacaaggg tccaggtcca ggcgtcaagt tttccgttga agctttgaga    420
tgtcacttga gagaccacgt taacgtctct atgatcgaag ccaccgactt ccctttcaac    480
accactgaat gggaaggtta cttgccaaag gaaaacttcc gtaccaaggt cggtccatgg    540
caaagatgtg ctgtcgtttc ctccgccggt agtttgaaga actcccaact aggtagagaa    600
attgacaacc acgatgctgt cttaagattt aacggtgctc caactgacaa ctttcaacaa    660
gacgttggtt ctaagactac tatcagattg atgaactctc aattggtcac cactgaaaag    720
agattcttga aggattcctt gtacactgaa ggtatcttga tcgtttggga tccatccgtc    780
taccacgctg acatcccaaa gtggtaccaa aagccagatt acaacttctt cgaaacttac    840
aagtcttacc gtagattgaa cccatctcaa ccattctaca tcttgaagcc acaaatgcca    900
tgggaattgt gggatatcat tcaagaaatc tctgctgatt tgatccaacc aaacccacca    960
tcctccggta tgttgggtat cattatcatg atgactttgt gtgatcaagt cgacatctac    1020
gaattcttgc catccaagcg taagaccgac gtctgttact accaccaaaa gttcttcgac    1080
tccgcttgta ctatgggtgc ttacgatcca ttgttgttcg aaaagaacat ggtcaagcac    1140
ctaaacgaag gtaccgatga agacatctat ttgttcggta aggctacctt gtctggtttc    1200
agaaacattc gttgtatgac tttggtcgct gctgcttaca ccgtcgcttt aagatacacc    1260
agaaccaccg ctgaagaatt gtacttttct actaccgctg tctgtatcac cgaagtcatt    1320
aagttgttga tttccgtcgg tttgttggct aaggaaaccg gttccttggg tagattcaag    1380
gcttccttgt ccgaaaacgt tttgggttct ccaaaggaat tggctaagtt gtccgtccca    1440
tctttggttt acgctgtgca aaacaatatg gctttcttgg ctttgagtaa cttggacgcc    1500
gctgtttacc aagttaccta ccaattgaag atcccatgta ccgccttgtg taccgtcttg    1560
atgctaaaca gaaccttgtc taagttgcaa tggatctccg tcttcatgtt gtgtggtggt  1620
gtcactttgg tccaatggaa gccagcccaa gcctccaagg tcgttgtcgc ccaaaaccca  1680
ttgttgggtt tcggtgccat cgctattgct gttttgtgtt ctggtttcgc tggtgtttac  1740
ttcgaaaagg ttttgaagtc ctccgacact tccttgtggg tcagaaacat tcaaatgtac  1800
ttgtctggta tcgttgttac tttggccggt acttacttgt ctgacggtgc cgaaatccaa  1860
gaaaagggtt tcttttacgg ttacacttac tacgtctggt tcgtcatctt cttggcctct  1920
gtcggtggtt tgtacacctc cgtcgtcgtc aagtacactg acaatatcat gaagggtttc  1980
tctgctgctg ctgctatcgt tctatctact attgcttctg ttttgttgtt tggtttgcaa  2040
atcactttgt ctttcgcttt gggtgccttg ttggtctaag cggccgc                2087
<210>5
<211>729
<212>DNA
<213>人工序列
<220>
<221>CDS
<222>(1)..(729)
<400>5
atg att cgt acc gct aag gaa tgc ggt gct gac tgt gcc aag ttc caa    48
Met Ile Arg Thr Ala Lys Glu Cys Gly Ala Asp Cys Ala Lys Phe Gln
1               5                   10                  15
aag tcc gaa ttg gaa ttc aag ttc aac aga aag gct ttg gaa cgt cca    96
Lys Ser Glu Leu Glu Phe Lys Phe Asn Arg Lys Ala Leu Glu Arg Pro
            20                  25                  30
tac aca tct aag cac tcc tgg ggt aag acc tac ggt gaa cac aag aga    144
Tyr Thr Ser Lys His Ser Trp Gly Lys Thr Tyr Gly Glu His Lys Arg
        35                  40                  45
cac ttg gaa ttc tcc cac gac caa tac aag gaa ttg caa tct tac gcc    192
His Leu Glu Phe Ser His Asp Gln Tyr Lys Glu Leu Gln Ser Tyr Ala
    50                  55                  60
caa gaa atc ggt att ttc ttc act gct tct ggt atg gat gaa atg gcc    240
Gln Glu Ile Gly Ile Phe Phe Thr Ala Ser Gly Met Asp Glu Met Ala
65                  70                  75                  80
gtt gaa ttc ttg cac gaa ttg aac gtt cca ttc ttc aag gtc ggt tcc    288
Val Glu Phe Leu His Glu Leu Asn Val Pro Phe Phe Lys Val Gly Ser
                85                  90                  95
ggc gat act aac aat ttc cca tac ttg gaa aag acc gct aag aag ggt    336
Gly Asp Thr Asn Asn Phe Pro Tyr Leu Glu Lys Thr Ala Lys Lys Gly
            100                 105                 110
aga cca atg gtt atc tcc tct ggt atg caa tcc atg gat acc atg aag    384
Arg Pro Met Val Ile Ser Ser Gly Met Gln Ser Met Asp Thr Met Lys
        115                 120                 125
caa gtc tac caa att gtc aag cca ttg aat cca aac ttt tgt ttc ttg    432
Gln Val Tyr Gln Ile Val Lys Pro Leu Asn Pro Asn Phe Cys Phe Leu
    130                 135                 140
caa tgt acc tcc gct tac cca ttg caa cca gaa gat gct aac ttg aga    480
Gln Cys Thr Ser Ala Tyr Pro Leu Gln Pro Glu Asp Ala Asn Leu Arg
145                 150                 155                 160
gtc atc tct gaa tac caa aag ttg ttc cca gac atc cca atc ggt tac    528
Val Ile Ser Glu Tyr Gln Lys Leu Phe Pro Asp Ile Pro Ile Gly Tyr
                165                 170                 175
tcc ggt cac gaa act ggt att gct att tcc gtg gcc gct gtt gct ttg    576
Ser Gly His Glu Thr Gly Ile Ala Ile Ser Val Ala Ala Val Ala Leu
            180                 185                 190
ggt gct aag gtc ttg gaa aga cac atc act ttg gac aag act tgg aag    624
Gly Ala Lys Val Leu Glu Arg His Ile Thr Leu Asp Lys Thr Trp Lys
        195                 200                 205
ggt tcc gat cac tcc gct tct tta gaa cca ggt gaa tta gct gaa ttg    672
Gly Ser Asp His Ser Ala Ser Leu Glu Pro Gly Glu Leu Ala Glu Leu
    210                 215                 220
gtt aga tcc gtt cgt ttg gtc gaa aga gct ttg ggt tct cca acc aag    720
Val Arg Ser Val Arg Leu Val Glu Arg Ala Leu Gly Ser Pro Thr Lys
225                 230                 235                 240
tcc atg gcc                                                        729
Ser Met Ala

Claims (9)

1.一种构建表达预定糖链修饰糖蛋白工程菌株的方法,该方法包括下列步骤:
a)以编码糖苷酶α-1,2-甘露糖苷酶或其功能结构域的编码序列替换α-1,3-甘露糖基转移酶或α-1,6-甘露糖基转移酶基因的内部编码序列,构建同源重组突变基因序列;
b)将步骤a)获得的重组突变基因序列插入具有筛选标志序列的载体中,得到重组质粒;
c)将N-乙酰氨基葡萄糖转移酶I和β-1,4-半乳糖基转移酶的编码序列的编码序列分别与各自定位信号编码序列相连接,得到两种融合基因序列;
d)将步骤c)获得的两种融合基因序列插入具有筛选标志序列的载体中,得到重组质粒;
e)将α-2,6-唾液酸转移酶编码序列和唾液酸转运蛋白编码序列连接,得到融合基因序列
f)向载体中插入唾液酸合成酶编码序列使与载体内的筛选标志编码序列相连接,然后再向载体中插入步骤e)获得的融合基因序列,得到重组质粒;
g)将(i)步骤a)得到的重组质粒,(ii)步骤a)和步骤b)得到的重组质粒,或者(iii)步骤a)、b)和c)得到的重组质粒,导入工程菌株,借助筛选标志筛选发生表型改变的工程菌株;
h)在培养基中对所述工程菌株进行培养和诱导表达,收集上清中的糖蛋白并对其N-糖基化修饰糖链进行分析,确认工程菌株表达的糖蛋白N-糖基化修饰为预定糖链。
2.权利要求1所述的方法,其中所述的α-1,2-甘露糖苷酶编码序列为SEQ ID NO:1。
3.权利要求1所述的方法,其中所述的N-乙酰氨基葡萄糖转移酶I及定位信号的编码序列为SEQ ID NO:2。
4.权利要求1所述的方法,其中所述的β-1,4-半乳糖基转移酶I及定位信号的编码序列为SEQID NO:3。
5.权利要求1所述的方法,其中所述的α-2,6-唾液酸酶和唾液酸转运蛋白的编码序列为SEQID NO:4。
6.权利要求1所述的方法,其中所述的唾液酸合成酶的编码序列为SEQ ID NO:5。
7.权利要求1所述的方法,其中所述的α-1,2-甘露糖苷酶编码序列、N-乙酰氨基葡萄糖转移酶I及定位信号的编码序列、β-1,4-半乳糖基转移酶I及定位信号的编码序列、α-2,6-唾液酸酶和唾液酸转运蛋白的编码序列以及唾液酸合成酶的编码序列可从任何物种,诸如哺乳动物、植物、真菌和细菌中PCR扩增获得,也可依据Genebank序列通过人工合成,优选根据酵母密码子偏嗜性人工合成。
8.权利要求1所述的方法,其中所述的预定糖链的末端糖基为选自甘露糖、葡萄糖、半乳糖和唾液酸中的一种或多种。
9.权利要求1或8所述的方法,其中所述的预定糖链的结构为选自下列其中的一种或多种:Man5GlcNAc2、GalGlcNAcMan5GlcNAc2和SAGalGlcNAcMan5GlcNAc2
CN2008100074391A 2008-03-10 2008-03-10 构建表达预定糖链修饰糖蛋白工程菌株的方法 Expired - Fee Related CN101343635B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2008100074391A CN101343635B (zh) 2008-03-10 2008-03-10 构建表达预定糖链修饰糖蛋白工程菌株的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2008100074391A CN101343635B (zh) 2008-03-10 2008-03-10 构建表达预定糖链修饰糖蛋白工程菌株的方法

Publications (2)

Publication Number Publication Date
CN101343635A true CN101343635A (zh) 2009-01-14
CN101343635B CN101343635B (zh) 2010-12-08

Family

ID=40245747

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008100074391A Expired - Fee Related CN101343635B (zh) 2008-03-10 2008-03-10 构建表达预定糖链修饰糖蛋白工程菌株的方法

Country Status (1)

Country Link
CN (1) CN101343635B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012162277A1 (en) * 2011-05-25 2012-11-29 Merck Sharp & Dohme Corp. METHOD FOR PREPARING Fc-CONTAINING POLYPEPTIDES HAVING IMPROVED PROPERTIES
CN102839157A (zh) * 2012-07-12 2012-12-26 扬州大学 稳定共表达hST3GalIV和β1-4GalT1的MDCK细胞系及构建方法和应用
US9187552B2 (en) 2010-05-27 2015-11-17 Merck Sharp & Dohme Corp. Method for preparing antibodies having improved properties
CN106164276A (zh) * 2013-12-18 2016-11-23 凯立博生物疗法公司 用作下游蛋白质糖重构的底物的去糖基化的重组蛋白质的体内制备的方法
CN108179160A (zh) * 2018-01-29 2018-06-19 江南大学 一种植烷醇连接的高甘露糖型寡糖的制备方法
CN109852651A (zh) * 2018-12-27 2019-06-07 大连大学 一种重组大肠杆菌质周腔内生产唾液酸修饰n-糖基化重组蛋白方法
CN112961888A (zh) * 2021-03-03 2021-06-15 东北师范大学 一种新型重组酶在合成含有α-(1,2)糖苷键的葡聚糖中的应用

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101087806A (zh) * 2004-12-23 2007-12-12 格利科菲公司 主要含有GalGlcNAcMan5GLcNAc2糖形的免疫球蛋白
CN1793324A (zh) * 2005-11-25 2006-06-28 山东大学 利用酵母表达、生产及糖基化改造人干扰素-β的方法

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10858686B2 (en) 2010-05-27 2020-12-08 Merck Sharp & Dohme Corp. Method for preparing antibodies having improved properties
US9187552B2 (en) 2010-05-27 2015-11-17 Merck Sharp & Dohme Corp. Method for preparing antibodies having improved properties
CN103582650A (zh) * 2011-05-25 2014-02-12 默沙东公司 用于制备具有改善性质的含Fc多肽的方法
EP2714732A1 (en) * 2011-05-25 2014-04-09 Merck Sharp & Dohme Corp. METHOD FOR PREPARING Fc-CONTAINING POLYPEPTIDES HAVING IMPROVED PROPERTIES
EP2714732A4 (en) * 2011-05-25 2014-12-10 Merck Sharp & Dohme PROCESS FOR PREPARING FC-CONTAINING POLYPEPTIDES WITH IMPROVED PROPERTIES
WO2012162277A1 (en) * 2011-05-25 2012-11-29 Merck Sharp & Dohme Corp. METHOD FOR PREPARING Fc-CONTAINING POLYPEPTIDES HAVING IMPROVED PROPERTIES
CN102839157A (zh) * 2012-07-12 2012-12-26 扬州大学 稳定共表达hST3GalIV和β1-4GalT1的MDCK细胞系及构建方法和应用
CN106164276A (zh) * 2013-12-18 2016-11-23 凯立博生物疗法公司 用作下游蛋白质糖重构的底物的去糖基化的重组蛋白质的体内制备的方法
CN108179160A (zh) * 2018-01-29 2018-06-19 江南大学 一种植烷醇连接的高甘露糖型寡糖的制备方法
CN108179160B (zh) * 2018-01-29 2021-05-11 江南大学 一种植烷醇连接的高甘露糖型寡糖的制备方法
CN109852651A (zh) * 2018-12-27 2019-06-07 大连大学 一种重组大肠杆菌质周腔内生产唾液酸修饰n-糖基化重组蛋白方法
WO2020133610A1 (zh) * 2018-12-27 2020-07-02 大连大学 一种重组大肠杆菌质周腔内生产唾液酸修饰n-糖基化重组蛋白方法
CN109852651B (zh) * 2018-12-27 2022-03-15 大连大学 一种重组大肠杆菌质周腔内生产唾液酸修饰n-糖基化重组蛋白方法
CN112961888A (zh) * 2021-03-03 2021-06-15 东北师范大学 一种新型重组酶在合成含有α-(1,2)糖苷键的葡聚糖中的应用

Also Published As

Publication number Publication date
CN101343635B (zh) 2010-12-08

Similar Documents

Publication Publication Date Title
DE69333112T2 (de) Modifizierte pilzzellen und methode zur herstelllung rekombinanter produkte
CN101343635B (zh) 构建表达预定糖链修饰糖蛋白工程菌株的方法
JP4954866B2 (ja) 糖タンパク質の作製においてアルファ−マンノシダーゼ抵抗性グリカンを減少させるか又は排除する方法
FI113372B (fi) Menetelmä LIF-polypeptidin (LIF = Leukemiaa estävä tekijä) valmistamiseksi
KR102338008B1 (ko) 당사슬 연장에 촉매 작용하기 위한 한 그룹의 udp-글리코실트랜스퍼라제 및 이의 응용
EP2912162B1 (en) Pichia pastoris strains for producing predominantly homogeneous glycan structure
CN103003438B (zh) 减少蛋白质糖基化的方法和过程及其蛋白质
CN102203123A (zh) 在宿主细胞中制造糖基化蛋白的新方法
WO2003091431A1 (fr) Methylotrophe produisant une chaine de sucre de type mammifere
CN101679991A (zh) 用于产生同质糖蛋白的遗传改良酵母
CN101535340A (zh) 促红细胞生成素组合物
CN104471053A (zh) 用于在缺少alg3表达的巴斯德毕赤酵母株中提高n-聚糖占据并减少杂合n-聚糖的产生的方法
CN113151211B (zh) 一种α-1,3-岩藻糖基转移酶突变体及利用该突变体制备3-岩藻糖基乳糖的应用
CN105985938A (zh) 糖基转移酶突变蛋白及其应用
KR20240037322A (ko) 단백질 조성물 및 제조 방법
CA2974185A1 (en) Method for preparing mogroside
CN103764837A (zh) 用于生产具有修饰的o-糖基化的蛋白的酵母菌株
JPH08336387A (ja) ピキア属酵母由来の糖鎖伸長タンパク及びそのdna
CN113549560B (zh) 一种用于糖蛋白制备的工程化酵母构建方法及其菌株
CN114181288B (zh) 制备l-缬氨酸的方法及其所用的基因与该基因编码的蛋白质
CN114349831B (zh) aspA基因突变体、重组菌及制备L-缬氨酸的方法
KR20240032944A (ko) 람노스가 고도로 특이적인 글리코실트랜스퍼라제 및 이의 응용
JP2770010B2 (ja) 酵母のマンノース−1−リン酸転移を正に制御する遺伝子ならびにこの遺伝子の欠損変異株を利用する高マンノース型中性糖鎖の製造方法
Morales et al. Efficient isolation of genes differentially expressed on cellulose by suppression subtractive hybridization in Agaricus bisporus
KR100915670B1 (ko) 야로위아 리폴리티카 유래의 신규 YlMPO1 유전자 및이의 파쇄 균주를 이용한 만노스 인산이 제거된 당단백질생산 방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: EMISSION AND RADIATION MEDICAL RESEARCH INSTITUTE

Free format text: FORMER OWNER: GAO XIN

Effective date: 20110913

C41 Transfer of patent application or patent right or utility model
COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; FROM: 100085 HAIDIAN, BEIJING TO: 100850 HAIDIAN, BEIJING

TR01 Transfer of patent right

Effective date of registration: 20110913

Address after: 100850 Taiping Road, Beijing, Haidian District, No. 27

Patentee after: Emission and Radiation Medical Research Institute

Address before: 100085, No. 38 Taiping Road, building 1, gate 203, Beijing, Haidian District

Patentee before: Gao Xin

C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20101208

Termination date: 20140310