发明内容
针对现有技术不足,本发明的目的是提供一种可用于大规模、低成本制备GLP-1或其类似物的生物制备方法。
为此发明目的,发明首先提供了一种可用于制备GLP-1或其类似物多肽的先导融合蛋白及编码该先导融合蛋白的融合基因。所述的融合基因具有形如A-B-C结构的基因序列,其中A为伴侣蛋白基因,B为编码包含酶切位点的连接肽的核苷酸序列,C为编码GLP-1或其类似物的基因。
所述融合基因中,A部分的伴侣蛋白基因可选自TrxA、DsbA、DsbC、Sumo、GST,Intein等,优选TrxA蛋白。TrxA蛋白的氨基酸序列如Seq ID No.8所示,编码基因的序列如Seq ID No.7所示。
所述融合基因中,B部分的酶切位点连接肽可选自肠激酶、凝血酶、SUMO Protease等,优选肠激酶酶切位点连接肽。肠激酶酶切位点连接肽的序列如Seq ID No.6所示,编码基因的序列如Seq ID No.5所示。
所述融合基因中,C部分为编码GLP-1或其类似物的基因序列,所述的GLP-1或其类似物可选自GLP-1(7-37),GLP-1(8-37),GLP-1(9-37),GLP-1(10-37),GLP-1(11-37),GLP-1(12-37),GLP-1(13-37),GLP-1(14-37),GLP-1(15-37)或GLP-1多肽类似物,包括:
Arg34-GLP-1(7-37),Arg26-GLP-1(7-37),Lys36-GLP-1(7-37),Arg26,34Lys38-GLP-1(7-38),Arg26,34Lys39-GLP-1(7-39),Arg26,34Lys40-GLP-1(7-40),Arg26Lys36-GLP-1(7-37),Arg34Lys36-GLP-1(7-37),Arg26Lys39-GLP-1(7-39),Arg34Lys40-GLP-1(7-40),Arg26,34Lys36 ,39-GLP-1(7-39),Arg26,34Lys36,40-GLP-1(7-40),Gly8Arg26-GLP-1(7-37),Gly8Arg34-GLP-1(7-37),Gly8Lys36-GLP-1(7-37),Gly8Arg26,34Lys36-GLP-1(7-37),Gly8Arg26,34Lys39-GLP-1(7-39),Gly8Arg26,34Lys40-GLP-1(7-40),Gly8Arg26Lys36-GLP-1(7-37),Gly8Arg34Lys36-GLP-1(7-37),Gly8Arg26Lys39-GLP-1(7-39),Gly8Arg34Lys40-GLP-1(7-40),Gly8Arg26,34Lys36,39-GLP-1(7-39),Gly8Arg26,34Lys36,40-GLP-1(7-40),Arg26,34Lys38-GLP-1(7-38),Arg26,34Lys39-GLP-1(7-39),Arg26,34Lys40-GLP-1(7-40),Arg26,34Lys41-GLP-1(7-41),Arg26,34Lys42-GLP-1(7-42),Arg26,34Lys43-GLP-1(7-43),Arg26,34Lys44-GLP-1(7-44),Arg26,34Lys45-GLP-1(7-45),Arg26,34Lys38-GLP-1(1-38),Arg26,34Lys39-GLP-1(1-39),Arg26,34Lys40-GLP-1(1-40),Arg26,34Lys41-GLP-1(1-41),Arg26,34Lys42-GLP-1(1-42),Arg26,34Lys43-GLP-1(1-43),Arg26, 34Lys44-GLP-1(1-44),Arg26,34Lys45-GLP-1(1-45),Arg26,34Lys38-GLP-1(2-38),Arg26, 34Lys39-GLP-1(2-39),Arg26,34Lys40-GLP-1(2-40),Arg26,34Lys41-GLP-1(2-41),Arg26, 34Lys42-GLP-1(2-42),Arg26,34Lys43-GLP-1(2-43),Arg26,34Lys44-GLP-1(2-44),Arg26, 34Lys45-GLP-1(2-45),Arg26,34Lys38-GLP-1(3-38),Arg26,34Lys39-GLP-1(3-39),Arg26, 34Lys40-GLP-1(3-40),Arg26,34Lys41-GLP-1(3-41),Arg26,34Lys42-GLP-1(3-42),Arg26, 34Lys43-GLP-1(3-43),Arg26,34Lys44-GLP-1(3-44),Arg26,34Lys45-GLP-1(3-45),Arg26, 34Lys38-GLP-1(4-38),Arg26,34Lys39-GLP-1(4-39),Arg26,34Lys40-GLP-1(4-40),Arg26, 34Lys41-GLP-1(4-41),Arg26,34Lys42-GLP-1(4-42),Arg26,34Lys43-GLP-1(4-43),Arg26, 34Lys44-GLP-1(4-44),Arg26,34Lys45-GLP-1(4-45),Arg26,34Lys38-GLP-1(5-38),Arg26, 34Lys39-GLP-1(5-39),Arg26,34Lys40-GLP-1(5-40),Arg26,34Lys41-GLP-1(5-41),Arg26, 34Lys42-GLP-1(5-42),Arg26,34Lys43-GLP-1(5-43),Arg26,34Lys44-GLP-1(5-44),Arg26, 34Lys45-GLP-1(5-45),Arg26,34Lys38-GLP-1(6-38),Arg26,34Lys39-GLP-1(6-39),Arg26, 34Lys40-GLP-1(6-40),Arg26,34Lys41-GLP-1(6-41),Arg26,34Lys42-GLP-1(6-42),Arg26, 34Lys43-GLP-1(6-43),Arg26,34Lys44-GLP-1(6-44),Arg26,34Lys45-GLP-1(6-45),Arg26Lys38-GLP-1(1-38),Arg34Lys38-GLP-1(1-38),Arg26,34Lys36,38-GLP-1(1-38),Arg26Lys38-GLP-1(7-38),Arg34Lys38-GLP-1(7-38),Arg26,34Lys36,38-GLP-1(7-38),Arg26,34Lys38-GLP-1(7-38),Arg26Lys39-GLP-1(1-39),Arg34Lys39-GLP-1(1-39),Arg26,34Lys36,39-GLP-1(1-39),Arg26Lys39-GLP-1(7-39),Arg34Lys39-GLP-1(7-39)和Arg26,34Lys36,39-GLP-1(7-39)。
适合本发明的GLP-1类似物在现有技术中有多处记载,具体可参考描述于WO93/19175中(Novo Nordisk),WO99/43705(Novo Nordisk),WO99/43706(Novo Nordisk),WO99/43707(Novo Nordisk),WO98/08871(具有亲脂性取代基的类似物)和WO02/46227(与血清白蛋白或与Ig的Fc部分融合的类似物)(Novo Nordisk A/S),WO99/43708(Novo Nordisk A/S),WO99/43341(Novo Nordisk A/S),WO87/06941(The General Hospital Corporation),WO90/11296(The General Hospital Corporation),WO91/11457(Buckley等),WO98/43658(Eli Lilly&Co.),EP0708179-A2(Eli Lilly&Co.),EP0699686-A2(Eli Lilly&Co.),WO01/98331(Eli Lilly&Co.)和CN200480034152.8中所提及的那些,在此全部引入作为参考。
可用一简单体系来描述GLP-1多肽的片段及类似物。例如Arg34-GLP-1(7-37)表示从GLP-1缺失掉氨基酸残基No.1-6,并在位置34(Lys)用Arg取代天然存在的氨基酸残基后形成的GLP-1片段,其他类似物以此类推。本文中提到C-末端延伸的GLP-1类似物时,则除非另外说明,在38位的氨基酸残基均是Arg,在39位的可选氨基酸残基也是Arg(除非另有说明),在40位的可选氨基酸残基是Asp(除非另有说明)。同样,如果C-末端延伸的类似物延伸到位置41、42、43、44或45,则除非另外说明,此延伸物的氨基酸序列均与人前胰高血糖素原中的对应序列一样。
所述融合基因中,C部分的GLP-1或其类似物优选自Arg34-GLP-1(7-37)、Arg34-GLP-1(8-37),Arg34-GLP-1(9-37),Arg34-GLP-1(10-37),Arg34-GLP-1(11-37),Arg34-GLP-1(12-37),Arg34-GLP-1(13-37),Arg34-GLP-1(14-37)和Arg34-GLP-1(15-37)。
其中,Arg34-GLP-1(7-37)的序列为:
HAEGTFTSDVSSYLEGQAAKEFIAWLVRGRG;
其基因序列和氨基酸序列分别如Seq ID No.1和Seq ID No.2所示。
Arg34-GLP-1(9-37)的序列为:
EGTFTSDVSSYLEGQAAKEFIAWLVRGRG;
其基因序列和氨基酸序列分别如Seq ID No.3和Seq ID No.4所示。
本发明构建的融合基因,优选为编码TrxA-肠激酶酶切位点-Arg34-GLP-1(7-37)融合蛋白的基因序列,其DNA序列如SEQ ID No.9所示,编码的融合蛋白的氨基酸序列如如SEQ ID No.10所示。
本发明构建的融合基因,另一优选为编码TrxA-肠激酶酶切位点-Arg34-GLP-1(9-37)融合蛋白的基因序列,其DNA序列如SEQ ID No.11所示,编码的融合蛋白的氨基酸序列如SEQ ID No.12所示。
构建好融合基因后,可用本领域公知的方法将含编码融合蛋白序列的核酸克隆到各种表达载体中去。所用标准的分子克隆过程见J.萨姆布鲁克等(J.萨姆布鲁克等,《分子克隆实验指南》第二版,科学出版社,1995.)的叙述。不同的融合基因可分别在宿主中表达得到各种融合蛋白。
本发明的另一目的提供一种可以大规模,低成本生产重组GLP-1多肽或其类似物的方法,所述方法包括如下的步骤:
(1)、在保持各自基因密码子阅读框架不变的前提下,构建具有如下结构的融合基因:A-B-C,其中A部分为编码伴侣蛋白的核苷酸序列,B为编码蛋白酶切位点的连接肽的核苷酸序列,C为GLP-1多肽或其类似物基因;
(2)、将上述的A-B-C融合基因序列连接到表达载体,将表达载体转化导入大肠杆菌中,经筛选得到重组基因工程菌;
(3)、高密度发酵重组大肠杆菌,经诱导表达获得融合蛋白,加入蛋白酶切,经分离纯化获得重组GLP-1多肽或其类似物。
步骤(1)中,A、B、C各部分的基因定义如前所述。人工合成C部分(GLP-1或其类似物)基因,并在5’和3’端分别添加KpnI和BamHI酶切位点,合成好的基因克隆在pUC32质粒中,此部分工作由技术服务公司完成。抽提质粒双酶切,得到GLP-1基因片段,将此片段通过连接酶克隆岛双酶切后的pET32a质粒载体,利用载体上已有的A和B部分基因,构成完整的表达序列A-B-C。
构建好融合基因后,可用本领域公知的方法将含编码融合蛋白序列的核酸克隆到各种表达载体中去。所用标准的分子克隆过程见J.萨姆布鲁克等(J.萨姆布鲁克等,《分子克隆实验指南》第二版,科学出版社,1995.)的叙述。许多表达载体和其对应的宿主可以从公司购得,如表达载体pET系列载体、pDEST系列载体等。优选的方法是将编码本发明中的融合蛋白或多肽的核酸克隆至表达载体pDEST-15,含有T7启动子。
载体可经转化大肠杆菌宿主,宿主可选自BL21(DE3)、T7Express、BL21(DE3pLyss)等,优选BL21(DE3pLyss)。转化所需载体至宿主细胞中去可用通常的方法,如:热激法、电转法等。成功转化的细胞,即含有本发明DNA构建体的细菌,可通过人们熟知的技术加以鉴定,如细胞经收集并裂解,提取DNA,然后PCR方法鉴定。
可以通过培养含有本发明DNA构建体的宿主,生产本发明的融合蛋白。具体的培养方法,可以用摇瓶或生物反应器等,生产时优选的为生物反应器。培养基应能提供菌体(或细胞)生长和产物表达所需的物质,应包含氮源、碳源、pH缓冲成分等,培养基配方一般应根据不同培养对象,通过试验获得。培养可分两个阶段,第一阶段主要用于菌体(或细胞)的生长,第二阶段主要用于合成产物。可以用各种蛋白分离的方法分离纯化蛋白,如盐析、沉淀、超滤、液相层析等技术及这些技术的组合。其中液相层析可以用凝胶排阻、亲和、离子交换、疏水、反相等层析技术。
本发明一个优选的实施例是在大肠杆菌中表达GLP-1及其类似物,为此构建一个重组质粒,该质粒含有T7启动子、融合蛋白、蛋白酶切位点、GLP-1或其类似物。将构建好的质粒,转化大肠杆菌BL21,得到重组工程菌,表达重组融合蛋白。构建好重组工程菌经发酵,重组蛋白获得表达。离心收集菌体,通过高压匀浆破碎大肠杆菌,释放重组蛋白。利用重组蛋白中的His-Tag,通过金属螯合柱层析,纯化出融合蛋白。再利用E切割,将GLP-1或其类似物与融合蛋白断开,释放出多肽。最后利用等电沉淀,获得GLP-1或其类似物。
本发明的技术现对于现有技术具有以下的优点:
1、由于融合蛋白的存在,目的蛋白以可溶性蛋白形式表达,表达量高(占菌体总蛋白15%以上,最高可达50%)。2、融合蛋白的存在可以大大简化下游简化工艺。如TrxA融合蛋白很容易通过硫胺分级沉淀与其它蛋白分离。
3、利用EK酶酶切,酶识别位点特异性高,酶活性高、反应时间短、反应条件温和,处理工艺简易。
4、融合蛋白的纯在,使得酶切后多肽与余下部分容易分离,简化了多肽的纯化工艺。
5、通过等点沉淀的方法,一步从酶切液里面回收多肽,工艺简单、成本低。