CN115975047B

CN115975047B - 一种重组融合蛋白生产多肽的方法及其应用

Info

Publication number: CN115975047B
Application number: CN202211305495.XA
Authority: CN
Inventors: 李岩; 李洁萍; 黄美群
Original assignee: Guangdong Zhuotin Pharmaceutical Co ltd; Yangzhou Aoruite Pharmaceutical Co ltd
Current assignee: Guangdong Zhuotin Pharmaceutical Co ltd; Yangzhou Aoruite Pharmaceutical Co ltd
Priority date: 2022-10-24
Filing date: 2022-10-24
Publication date: 2024-05-28
Anticipated expiration: 2042-10-24
Also published as: WO2024087761A1; CN115975047A

Abstract

本发明涉及一种重组融合蛋白生产多肽的方法，公开了一种由多个蛋白酶酶切位点与多肽序列按特定顺序串联组合，在蛋白伴侣的辅助下生产多肽的方法及其应用。本发明构建的高串联数重组工程菌，可以高效表达可溶的重组蛋白，不形成包涵体且杂蛋白少，经高压破碎后捕获的融合蛋白，在1‑2h内可快速完成酶切得到目标多肽单体。该表达系统可用于生产多种氨基酸个数为10‑60个和/或等电点范围为2‑10的多肽。与单个串联相比，大大提高了目标多肽产量，更适合工业化大规模生产。

Description

一种重组融合蛋白生产多肽的方法及其应用

技术领域

本发明涉及生物技术领域，具体地说涉及一种重组融合蛋白生产多肽的方法及其应用。

背景技术

多肽是由氨基酸以肽键形式连接在一起而形成的一类化合物，多肽普遍存在于生物体内，迄今为止，在生物体内发现的各类多肽已达数万种，其广泛参与和调节机体内各系统、器官、组织和细胞的功能活动，在生命活动中发挥重要作用。近些年，多肽药物作为国内外生物医药创新研发的重点领域，一直保持良好的发展前景。多肽药物在全球生物医药市场中占比较小，但发展迅速，2019年全球多肽药物市场规模突破300亿美元，年均复合增长率保持在10％左右。

随着蛋白质组学的研究深入，对多肽合成的要求越来越高，合成肽序越来越长，这就对多肽合成技术提出了更高的要求。常见的多肽药物可以是天然提取的、化学合成的，也可以是通过基因工程法获得的。

本发明中所涉及到多肽是一种人胰高血糖素样肽-1(GLP-1)类似物，是诺和诺德公司研发能够大幅改善2型糖尿病患者血糖水平的周制剂。化学合成该多肽方法通常采用固相偶联缩合方法，反应效率相对较低、纯化难度高、成本偏高。

基因工程方法一般在体外构建杂种DNA分子，然后导入活细胞，以改变生物原有的遗传特性、获得新品种、生产新产品。微生物表达系统具有培养简单，周期性短，成本低等优点，是商业性蛋白重要的表达来源。常用的微生物表达宿主有大肠杆菌、枯草杆菌、酵母等。原核表达的表达产物效率高、比较稳定，不易被宿主降解且由于大肠杆菌增殖时间较短、培养成本低廉，因此大肠杆菌表达系统成为一种较为快捷获取异源蛋白的方式。

融合蛋白表达是蛋白表达中常用的策略，将两个或多个基因的编码区首尾连接，然后由同一调控序列控制，从而目的蛋白融合表达的效率高、降解少、纯化简单方便。另外还可以利用构建于融合表达载体中的化学试剂断裂位点或蛋白酶切位点，在体外去除融合蛋白的原核肽段，从而得到天然蛋白产物。目前较为广泛使用的融合表达系统有PA系统、PG系统、His融合系统、GST系统、FLAG系统、MBP系统、TrxA融合系统等。融合表达不仅可以提高蛋白表达量，还可以帮助目的蛋白正确折叠，从而获得可溶蛋白。通常为了充分发挥宿主菌株的潜能，会串联多个目标蛋白进行表达，但是随着目标蛋白串联数量增多，融合蛋白分子量增大，满足高串联度融合蛋白可溶性高表达量的需要会愈加困难。

现有技术CN101910193A公开了GLP-1类似物的制备方法，其使用酿酒酵母作为表达宿主，提供了可生物合成的GLP-1类似物肽的生产方法。不足之处是：(1)酵母本身发酵周期长，成本较大肠杆菌要高；(2)虽然优化了GLP-1类似物肽的表达系统，使得酿酒酵母自身的Kex2蛋白酶更易切割以便得到GLP-1类似物肽，但每种类似物肽的表达都是以单个多肽序列的形式插入至表达载体中进行表达，因此限制了表达宿主的潜能。(3)在通过酵母自身释放的Kex2蛋白酶酶切后产生的GLP-1类似物肽也无可避免地在N端和C端含有突出端，还需要额外的酶切处理。

现有技术CN110128521A使用大肠杆菌作为表达宿主，公开了一种辅助蛋白用于生产重组融合蛋白，即辅助蛋白串联肠激酶的酶切位点和GLP-1类似物。该技术中虽表达出可溶性融合蛋白，但该融合蛋白只包含一个目标多肽单元，随着目标多肽串联数量增多，辅助蛋白需要有促表达和助溶两个功能，有些辅助蛋白无法满足高串联度融合蛋白可溶性表达的需要。对于串联的多个目标多肽，尚需要开发能够保证可溶性高表达量的表达手段。

现有技术CN110305223A公开了一种融合蛋白包括串联的多个目标蛋白序列，融合蛋白在Kex2、CPB蛋白酶的作用下形成多个游离目标蛋白，实现了4个GLP-1类似物串联表达。但相邻两个GLP-1类似物多肽之间仅依靠“KR”连接，仅有4个“KR”酶切位点的融合蛋白需要过夜酶切而得到游离目标蛋白，严重影响了酶切速率。另外，该技术中融合蛋白虽有“EEAEAEARG”促进肽，还是无法避免有较多不可溶融合蛋白的产生。

因此，本领域需要开发一种便捷高效的多肽序列生产系统。

发明内容

本发明的目的就是提供一种重组融合蛋白生产多肽的方法及其应用。

在本发明的第一方面，提供了一种重组融合蛋白，其包括相互连接的：

a)蛋白伴侣，所述蛋白伴侣为硫氧还蛋白；

b)串联的n个目标多肽；

c)蛋白酶识别序列，所述蛋白酶识别序列用于将所述重组融合蛋白通过蛋白酶切割为n个独立目标多肽，

其中，n为2-20的整数，优选为3-15，更优选为5-10。

在另一优选例中，所述的重组融合蛋白从N端到C端具有依次连接的：

蛋白伴侣-{N端蛋白酶识别序列-目标多肽-C端蛋白酶识别序列-连接肽}_n-1-N端蛋白酶识别序列-目标多肽。

在另一优选例中，所述的硫氧还蛋白来自于温泉菌，优选为Pyrodictiumoccultum菌株、Hyperthermus butylicus菌株、Pyrolobus fumarii菌株、或Aeropyrumpernix K1菌株。

在另一优选例中，所述的硫氧还蛋白选自下组:

(1)氨基酸序列如SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQID NO:16、或SEQ ID NO:18所示；

(2)与SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、或SEQ ID NO:18具有至少80％以上、或至少85％以上、或至少90％、93％、95％、96％、97％、98％、99％或以上氨基酸序列同一性且具有促进融合蛋白可溶性功能的蛋白。

在另一优选例中，所述的N端蛋白酶识别序列为可被选自下组的蛋白酶识别并切割的序列：肠激酶(Enteropeptidase)、凝血酶(Thrombin)、SUMO蛋白酶、TEV蛋白酶、FactorXa蛋白酶、或其组合。

在另一优选例中，所述的N端蛋白酶识别序列的氨基酸序列如SEQ ID NO:1、SEQID NO:2、SEQ ID NO:3、SEQ ID NO:4、或SEQ ID NO:5所示。

在另一优选例中，所述的C端蛋白酶识别序列为可被选自下组的蛋白酶识别并切割的序列：Kex2蛋白酶、羧肽酶B(CPB)，或为其串联而成的双酶识别序列。

在另一优选例中，所述的C端蛋白酶识别序列选自下组：KR、或RR。

在另一优选例中，所述的连接肽为柔性连接肽。

在另一优选例中，所述的连接肽的氨基酸序列选自下组：GGGGS、GSGSG、GSGG、GSGS、GSG、或其组合；优选为GSGSG。

在另一优选例中，所述的目标多肽氨基酸个数为10-100个，优选20-80个，更优选20-60个，最优选30-40个。

在另一优选例中，所述的目标多肽等电点范围为2-10。

在另一优选例中，所述的目标多肽选自下组：胰高血糖素样肽、甲状旁腺素、生长因子、胶原蛋白、或其组合。

在另一优选例中，所述的目标多肽为胰高血糖素样肽-1(GLP-1)或其类似物、胰高血糖素样肽GLP-2或其类似物、抑胃肽GIP、酪酪肽PYY、甲状旁腺素PTH、生长因子、胶原蛋白；

优选胰高血糖素样肽-1(GLP-1)或其类似物、胰高血糖素样肽GLP-2或其类似物、抑胃肽GIP、酪酪肽PYY、生长因子、胶原蛋白；

最优选胰高血糖素样肽-1(GLP-1)或其类似物。

在另一优选例中，所述的重组融合蛋白是可溶的。

在另一优选例中，所述的重组融合蛋白包含如SEQ ID NO.20、SEQ ID NO:22、SEQID NO24、SEQ ID NO:26、SEQ ID NO:28所示的氨基酸序列；优选地，所述的重组融合蛋白包含如SEQ ID NO:20所示的氨基酸序列。

在本发明的第二方面，提供了一种多核苷酸，所述多核苷酸编码如本发明第一方面所述的融合蛋白。

在另一优选例中，所述的多核苷酸包含如SEQ ID NO:9、SEQ ID NO:11、SEQ IDNO:13、SEQ ID NO:15、SEQ ID NO:17所示的蛋白伴侣基因编码序列。

在另一优选例中，所述的多核苷酸包含如SEQ ID NO.21、SEQ ID NO:23、SEQ IDNO25、SEQ ID NO:27、SEQ ID NO:29所示的核苷酸序列。

在本发明的第三方面，提供了一种载体，所述载体中含有如本发明第二方面所述的多核苷酸。

在另一优选例中，所述的载体含有编码硫氧还蛋白的基因。

在另一优选例中，所述的载体选自下组：pET系列表达载体、pQE系列表达载体、或其组合。

在另一优选例中，所述的载体为pET32b(+)表达载体，优选为pET32b(+)-kan表达载体。

在本发明的第四方面，提供了一种工程化的宿主细胞，所述宿主细胞中含有如本发明第三方面所述的载体，或基因组中整合有如本发明第二方面所述的多核苷酸。

在另一优选例中，所述的宿主细胞选自下组：大肠杆菌、酵母、或其组合。

在另一优选例中，所述的宿主细胞为大肠杆菌BL21(DE3)。

在本发明的第五方面，提供了一种合成目标多肽的方法，包括步骤：

S1)在合适的条件下，培养如本发明第四方面所述的工程化宿主细胞，从而获得如本发明第一方面所述的融合蛋白；和

S2)对步骤S1)中得到的融合蛋白，使用特异性切割所述融合蛋白中蛋白酶识别序列的酶对所述融合蛋白进行酶切，从而获得单独的目标多肽。

在另一优选例中，所述的步骤S1)中包括步骤：

S1a)将所述工程化宿主细胞接种于含有相应抗生素的培养基中摇瓶培养，从而获得宿主细胞菌液。

S1b)将所述菌液与培养基共同接种于含相应抗生素的培养基中摇瓶培养，随后加入发酵诱导剂进行诱导表达，从而得到所述融合蛋白。

在另一优选例中，所述的步骤S1a)中，所述培养在33-40℃下进行，优选35-38℃，更优选36-37℃。

在另一优选例中，所述的步骤S1a)中，所述摇瓶培养转速为180-260rpm，优选为200-240rpm，更优选为210-220rpm。

在另一优选例中，所述的步骤S1a)中，所述培养的时间为1-48小时，优选8-24小时，更优选15-16小时。

在另一优选例中，所述的步骤S1b)中，将菌液与培养基按1:1-1000(v:v)接种，优选1:50-500，更优选1:100-200。

在另一优选例中，所述的步骤S1b)中，所述抗生素浓度为1-100ug/ml，优选20-70ug/ml，更优选30-50ug/ml。

在另一优选例中，所述的步骤S1b)中，所述培养在33-40℃下进行，优选35-38℃，更优选36-37℃。

在另一优选例中，所述的步骤S1b)中，所述摇瓶培养转速为180-260rpm，优选为200-240rpm，更优选为210-220rpm。

在另一优选例中，所述的步骤S1b)中，培养至OD600值约为0.4-1.2时加入发酵诱导剂，优选OD600为0.8-1。

在另一优选例中，所述的发酵诱导剂为IPTG。

在另一优选例中，所述的发酵诱导剂添加至终浓度为0.05-5mM，优选0.1-3mM，更优选0.5-1mM。

在另一优选例中，所述的诱导在16-40℃下进行，优选25-35℃，更优选28-30℃。

在另一优选例中，所述的诱导时间为1-48小时，优选8-32小时，更优选16-20小时。

在另一优选例中，所述的步骤S1)中，还包括步骤：破碎培养的菌体，从而得到所述融合蛋白。

在另一优选例中，所述的步骤S1)中，还包括对所述融合蛋白进行捕获的步骤。

在另一优选例中，所述的步骤S2)中，使用的蛋白酶包括：0.1-5％(优选0.5-3％，更优选1-2％)EK、0.1-10％(优选0.5-5％，更优选2-4％)kex2、0.1-10％(优选1-5％，更优选2-4％)CPB、或其组合。

在另一优选例中，所述的酶切在15-35℃下进行，优选20-30℃，更优选25-28℃。

在另一优选例中，所述的酶切在pH 7-10条件下进行，优选pH 7.5-9，更优选pH 8-8.5。

在另一优选例中，所述的酶切时间为0.5-3小时，优选1-2.5小时，更优选1.5-2小时。

应理解，在本发明范围内中，本发明的上述各技术特征和在下文(如实施例)中具体描述的各技术特征之间都可以互相组合，从而构成新的或优选的技术方案。限于篇幅，在此不再一一累述。

附图说明

下列附图用于说明本发明的具体实施方案，而不用于限定由权利要求书所界定的本发明范围。

图1A显示了本发明的表达载体中蛋白伴侣、蛋白酶识别序列、目标多肽依次连接的组合顺序。

图1B显示了抗性替换后的表达载体pET32b(+)-kan的谱图。

图2显示了表达载体pET32b(+)-kan-GLP110酶切验证的DNA电泳图，其中1、2、3、4、5泳道分别为筛选的5个载体用KpnI和EcoRI双酶切，均得到约1.2kb的正确电泳条带，6为DNA maker。该图用以表明表达载体构建的正确性。

图3显示了不同处理样品的蛋白电泳图。其中1泳道为未诱导全细胞处理样品；2泳道为IPTG诱导的全细胞处理样品；3泳道为IPTG诱导的菌体超声破碎细胞上清(浓缩1倍)；4泳道为IPTG诱导的菌体超声破碎沉淀；5泳道为蛋白Maker。该图显示在超声破碎沉淀的样品中几乎没有目标蛋白(59.6KD)的条带，因此蛋白伴侣TR1可增加目标蛋白的可溶性表达。

图4显示了SM37摇瓶小规模发酵获得菌体高压匀浆机破碎细胞后，滤膜澄清后的澄清液的HPLC检测结果。

图5显示了融合蛋白捕获洗脱液的HPLC检测结果。结果显示疏水层析可有效捕获并纯化融合蛋白。

图6A、图6B、图6C、图6D分别显示了SM37融合蛋白利用蛋白酶酶切前、酶切30min、酶切1h、酶切1.5h的酶切液的HPLC检测结果。表明酶切0.5h、酶切1h时反应还在继续，1.5h酶切反应完成，融合蛋白全部转化成目标蛋白GLP-1类似物和蛋白伴侣。

图7显示了酶切融合蛋白获得的目标多肽捕获洗脱液的HPLC检测结果。结果显示疏水层析可有效捕获并纯化GLP-1。

图8显示了目标多肽的质谱检测结果。

图9显示了SM38摇瓶小规模发酵获得菌体高压匀浆机破碎细胞后，滤膜澄清后的澄清液的HPLC检测结果。

图10A-10D分别显示了SM33-SM36摇瓶小规模发酵获得菌体高压匀浆机破碎细胞后，滤膜澄清后的澄清液的HPLC检测结果。

图11A-11D分别显示了SM39-SM42摇瓶小规模发酵获得菌体高压匀浆机破碎细胞后，滤膜澄清后的澄清液的HPLC检测结果。

图12显示了SM43摇瓶小规模发酵获得菌体高压匀浆机破碎细胞后，滤膜澄清后的澄清液的HPLC检测结果，SM43融合蛋白产量略低于SM37。

图13A-13H分别显示了SM43融合蛋白利用蛋白酶酶切前、酶切30min、酶切1h、酶切1.5h、酶切2h、酶切2.5h、酶切3h、酶切3.5h的酶切液的HPLC检测结果。表明酶切反应需要3-4h，融合蛋白全部转化成目标蛋白GLP-1类似物和蛋白伴侣。

具体实施方式

本发明人经过广泛而深入的研究，首次开发了一种重组融合蛋白生产多肽的方法。本发明的方法在特定蛋白伴侣的辅助下由多个蛋白酶酶切位点与目标多肽串联组合得到重组融合蛋白，后经酶切制备多肽。本发明构建了具有高表达量的含有多达10个GLP-1类似物(中间体)的多肽串联的融合蛋白重组菌株，优化了发酵诱导表达条件及酶切反应体系、开发了融合蛋白及中间体多肽捕获方法，最终获得了可量产的GLP-1类似物(中间体)多肽，从而完成了本发明。采用基因工程获取重组融合蛋白高产工程菌，经酶切后得到目标多肽，低成本高产量，解决现有化学合成方法反应效率低、杂质多、成本高的问题。在此基础上，完成了本发明。

本发明发现，对于多个串联多肽构成的融合蛋白，在不使用蛋白伴侣的情况下其几乎不溶，难以用于目的多肽的生产。在融合蛋白中引入蛋白伴侣后，可以大大提升高度串联(例如10个)的融合蛋白的可溶性和表达量。同时，本发明发现引入特定的来自温泉菌的硫氧还蛋白作为蛋白伴侣，能够提高重组融合蛋白的酶切速率，进一步提高生产效率。

融合蛋白

如本发明所用的术语“重组融合蛋白”、“融合蛋白”可互换使用，均指本发明第一方面的重组融合蛋白。本发明提供的重组融合蛋白是一种在特定蛋白伴侣的辅助下由多个蛋白酶酶切位点与目标多肽串联组合，其作为一种表达系统，能够用于高效率地表达目标多肽。本发明的融合蛋白可选地由2-20个目标多肽序列串联，优选地，由10个GLP-1类似物多肽串联。并且，所述的重组融合蛋白能够通过酶切形成独立的目标多肽。在优选的实施方式中，蛋白酶识别序列包括从N端到C端依次连接的组合顺序如图1所示，其包含结构：{N端蛋白酶识别序列+目标多肽+C端蛋白酶识别序列+连接肽}_2-20+N端蛋白酶识别序列+目标多肽。

如本发明所用的术语“目标多肽”、“目的多肽”可互换使用，均指使用本发明的表达系统或制备方法所要制备的多肽。根据本发明的教导，本领域技术人员可以利用本发明的表达系统产生所需的各种多肽。在具体的实施方式中，本发明的表达系统可用于生产多种氨基酸个数为10-100个和/或等电点范围为2-10的多肽，例如胰高血糖素样肽、甲状旁腺素、生长因子、胶原蛋白等医药医美多肽。在优选的实施方式中，本发明的表达系统可用于生产胰高血糖素样肽-1(GLP-1)或其类似物、胰高血糖素样肽GLP-2或其类似物、抑胃肽GIP、酪酪肽PYY、甲状旁腺素PTH、生长因子、胶原蛋白；优选胰高血糖素样肽-1(GLP-1)或其类似物、胰高血糖素样肽GLP-2或其类似物、抑胃肽GIP、酪酪肽PYY、生长因子、胶原蛋白；更优选胰高血糖素样肽-1(GLP-1)或其类似物。

如本发明所用的术语“编码序列”，是指编码本发明第一方面的重组融合蛋白的序列，包括目标多肽(如GLP-1类似物(中间体)多肽)串联表达的氨基酸编码序列及核苷酸编码序列。

本发明的融合蛋白中还包含连接肽，所述连接肽用于串联多个目标多肽。其中所用的连接肽可以是2-20个非酸性氨基酸的序列，优选为柔性连接肽。所述连接肽的蛋白序列选自GGGGS、GSGSG、GSGG、GSGS、或GSG，优选地，采用GSGSG作为连接肽。

如本发明所用的术语“蛋白酶识别序列”或“蛋白酶识别位点”均是指本发明第一方面的重组融合蛋白中包含的、能够在其氨基端(N)端或羧基端(C端)被特异性蛋白酶识别并切割的序列。在本发明中，在目标多肽的N端串联有N端蛋白酶识别序列，该N端蛋白酶识别序列可以被识别并在其C末端被切割；目标多肽的C端串联有C端蛋白酶识别序列，该C端蛋白酶识别序列可以被识别并在其N末端被切割，以确保切割后的目的多肽两端不含有多余的氨基酸残基。所使用的蛋白酶可以是任意蛋白酶，前提是保证该蛋白酶不会对目标多肽产生切割。

在本发明的一种实施方式中，所用的N端蛋白酶识别序列可以是选自下组的一种或多种蛋白酶的识别序列：肠激酶(Enteropeptidase)、凝血酶(Thrombin)、SUMO蛋白酶、TEV蛋白酶和Factor Xa蛋白酶；其蛋白序列为选自下组的一种或多种的串联：SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5。优选的，采用肠激酶(Enteropeptidase)蛋白识别位点。

在本发明的一种实施方式中，所用的C端蛋白酶识别序列可以是Kex2蛋白酶、羧肽酶B(CPB)的识别位点、或其串联序列。为使得酶切后的多肽产物无任何多余氨基酸残留，优选地，采用羧肽酶B(CPB)识别位点串联Kex2蛋白酶识别序列。其蛋白序列可以为KR、RR。

蛋白伴侣

如本发明所用，术语“蛋白伴侣”是指能够用于提高重组融合蛋白的可溶性和表达效率的肽段，一般来源于硫氧还蛋白(TRX)。所述蛋白伴侣优选地连接在融合蛋白的N端。

在一些实施方式中，硫氧还蛋白的氨基酸序列选自如SEQ ID NO:8、10、12、14、16、或18所示的氨基酸序列，或是与SEQ ID NO:8、10、12、14、16、或18具有80％、85％、90％、95％、96％、97％、98％、99％或更高的序列同源性的氨基酸序列。编码硫氧还蛋白的核苷酸序列优选地选自SEQ ID NO:9、11、13、15、17、或19。

本发明通过在重组融合蛋白中引入硫氧还蛋白以促进其可溶性。为便于构建表达载体，本发明的硫氧还蛋白可以选择表达载体上固有的硫氧还蛋白(如pET系列表达载体上固有的TrxA)，也可以选择本发明人分离自温泉菌的硫氧还蛋白TR1、TR2、TR3、TR4、TR5，并将其构建入表达载体中。在一些实施方式中，蛋白伴侣为SEQ ID NO:8所示多肽(TR1)或pET系列表达载体上的硫氧还蛋白TrxA。

本发明还意外地发现了选择特定的硫氧还蛋白能够促进重组融合蛋白酶切获得目的多肽的效率。相比于TrxA，使用来自温泉菌的TR1-TR5能够获得更高的酶切效率。在一些实施方式中，蛋白伴侣为SEQ ID NO:8所示多肽。

编码核酸及其组合

在本发明融合蛋白的基础上，本发明还提供了编码该融合蛋白的分离的多核苷酸或其简并的变异体。本发明的多核苷酸可以是DNA形式或RNA形式。DNA形式包括cDNA、基因组DNA或人工合成的DNA。DNA可以是单链的或是双链的。DNA可以是编码链或非编码链。编码成熟多肽的编码区序列可以与编码本发明实施例中的融合蛋白的核苷酸序列相同或者是简并的变异体。如本文所用，“简并的变异体”在本发明中是指编码本发明权利要求中的融合蛋白，但与本发明实施例中的融合蛋白的编码核苷酸序列有差别的核酸序列。

载体、宿主细胞

编码多核苷酸序列可插入重组表达载体或基因组。术语“重组表达载体”指本领域熟知的细菌质粒、噬菌体、酵母质粒、植物细胞病毒、哺乳动物细胞病毒或其他载体。总之，只要能在宿主体内复制和稳定，任何质粒和载体都可以用。表达载体的一个重要特征是通常含有复制起点、启动子、标记基因和翻译控制元件。

用于表达本发明融合蛋白的表达载体可以选用pQE系列的表达载体，也可以是pET系列的表达载体。在优选的实施方式中，采用pET-32a/b系列表达载体。典型的表达载体如pET-32(+)-kan表达载体，其通过将pET-32b(+)载体上的氨苄青霉素抗性基因替换为卡那霉素抗性基因而得。本发明融合蛋白的编码基因可以插入至pET-32b(+)-kan表达载体的XbaI/EcoRI或者KpnI/EcoRI酶切位点。

本领域的技术人员可采用熟知的方法能用于构建含编码本发明融合蛋白DNA序列和合适的转录/翻译控制信号的表达载体，包括体外重组DNA技术、DNA合成技术、体内重组技术等。所述的DNA序列可有效连接到表达载体中的适当启动子上，以指导mRNA合成。表达载体还包括翻译起始用的核糖体结合位点和转录终止子。

本文所述的宿主细胞包括包含上述表达载体或基因组上整合了本发明融合蛋白编码序列的宿主细胞。宿主细胞可以是原核细胞，如细菌细胞；或是低等真核细胞，如酵母细胞；或是高等真核细胞，如哺乳动物细胞。代表性例子有：大肠杆菌，链霉菌属；鼠伤寒沙门氏菌的细菌细胞；真菌细胞如酵母、植物细胞(如人参细胞)。在优选的实施方式中，用于表达本发明融合蛋白的宿主细胞为大肠杆菌，典型地例如大肠杆菌BL21(DE3)。

制备方法

本发明提供了一种采用生物合成GLP-1类似物(中间体)多肽的方法。所涉及到的步骤如下：

(1)编码基因的获取。

(2)将串联表达的编码基因插入表达载体上。

(3)表达载体转化至大肠杆菌或酵母表达宿主。

(4)摇瓶发酵小规模诱导蛋白表达。

(5)收集菌体、破碎菌体。

(6)融合蛋白捕获。

(7)融合蛋白酶切。

(8)GLP-1类似物捕获。

本发明提供了改进的培养方法以提高宿主细胞对融合蛋白的表达效率。优选的培养方法为摇瓶发酵，具体过程为取5ul甘油菌接种于5ml含有相应抗生素的LB液体培养基中，37℃，220rpm培养16h。将菌液按菌液：培养基＝1：100(v:v)接种于100ml含有50ug/mlKan的LB液体培养基中，37℃，220rpm培养至OD600约为1，加入IPTG至终浓度为0.5mM，30℃诱导20h。

本发明的融合蛋白可以在细胞内、或在细胞膜上表达、或分泌到细胞外。如果需要，可通过各种细胞破碎方法破碎宿主细胞以获得表达的融合蛋白。这些方法是本领域技术人员所熟知的。这些方法的例子包括但并不限于：沉淀剂处理(盐析方法)、离心、热破壁、反复冻融、超声波破碎、溶菌酶破壁、渗透破菌、高压匀浆、超离心及这些方法的结合。

在优选的实施方式中，本发明的方法采用高压匀浆和/或超声波破碎进行菌体破碎。

表达的融合蛋白经捕获及纯化处理后，通过酶切将融合蛋白切割为多个独立的目的多肽。融合蛋白酶切优选采用肠激酶、羧肽酶B、Kex2蛋白酶三个酶共酶切。

对于表达的融合蛋白和/或酶切得到的目的多肽，如果需要，可利用其物理的、化学的和其它特性通过各种分离方法分离和纯化。这些方法是本领域技术人员所熟知的。这些方法的例子包括但并不限于：分子筛层析(凝胶过滤)、吸附层析、离子交换层析、亲和层析、低压层析、高效液相层析(HPLC)和其它各种液相层析技术及这些方法的结合。在优选的实施方式中，本发明的方法采用疏水层析进行融合蛋白或目的多肽的捕获。所述疏水层析优选地采用流动相A(氯化钠、二水合磷酸二氢钠、十二水合磷酸氢二钠)上样，并采用流动相B(纯水)洗脱以捕获融合蛋白。

本发明的主要优点包括：

1)本发明采用硫氧还蛋白融合表达系统，获取含有高串联数多肽的重组融合蛋白工程菌，其所表达的重组融合蛋白表达量高，杂蛋白少，可溶性强，无包涵体。同时，本发明的特定的蛋白伴侣能够提高重组融合蛋白的酶切速率。

2)本发明在融合表达载体中融入三种蛋白酶切割位点以及柔性连接肽，使得蛋白酶对融合蛋白的切割作用更快速，经优化的酶切反应体系，可在1-2h内完成融合蛋白的酶切得到目标多肽单体。

3)本发明采用了改进的从融合蛋白到GLP-1类似物捕获纯化的工艺，捕获纯化的收率可达90％以上，最终GLP-1类似物纯度可达97％以上，有利于下游的修饰加工。

下面结合具体实施例，进一步阐述本发明。应理解，这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法，通常按照常规条件，例如Sambrook等人，分子克隆：实验室手册(New York:Cold Spring HarborLaboratory Press,1989)中所述的条件，或按照制造厂商所建议的条件。除非另外说明，否则百分比和份数是重量百分比和重量份数。

在以下实施例中，表达载体pET32b(+)属于pET32系列的表达载体，购自丰晖生物。硫氧还蛋白TrxA存在于pET32系列载体上。表达载体pET32b(+)-kan是本实验室技术人员将pET32b(+)载体上氨苄青霉素抗性基因替换为卡纳霉素抗性基因，载体谱图见图1B。

实施例1：

目标基因的获取

串联表达的10联GLP-1类似物多肽的序列为：{DDDK+GLP-1类似物多肽序列+KR+GSGSG}₉+DDDK+GLP-1类似物多肽序列，其氨基酸序列如SEQ ID NO:20所示，该氨基酸序列的编码基因的序列如SEQ ID NO:21所示。编码基因是由苏州金唯智生物科技有限公司负责密码子优化并进行合成。

实施例2：

带有卡那霉素抗性基因的表达载体(pET32b(+)-kan)的构建。pET32系列载体筛选标记氨苄青霉素抗性基因，考虑到工业生产偏好用卡那霉素，将pET32b(+)载体上的抗性筛选标记更改为卡那霉素抗性基因。

所需的引物如下：

正向引物P1：CAGTTTTATTGTtcatgaccaaaatcccttaacgtga(SEQ ID NO.6)

反向引物P2：CTAAGAATTAATtcatgagcggatacatatttgaatgtatt(SEQ ID NO.7)

正向引物P3：atccgctcatgaATTAATTCTTAGAAAAACTCATCGAGCATC(SEQ ID NO.30)

反向引物P4：attttggtcatgaACAATAAAACTGTCTGCTTACATAAACAG(SEQ ID NO.31)

通过以下步骤构建相应载体：

首先以商业化pET32b(+)作为模板，用引物P1和P2进行pcr扩增载体，用1.0％琼脂糖凝胶电泳进行分离，得到约5Kb条带。将条带从凝胶中切出，使用凝胶提取试剂盒进行纯化。

以商业化pET28a(+)作为模板，用引物P3和P4进行pcr扩增卡那霉素抗性基因，用1.0％琼脂糖凝胶电泳进行分离，得到约0.9Kb条带。将条带从凝胶中切出，使用凝胶提取试剂盒进行纯化。

然后按照pET32b(+)50ng、卡那霉素抗性基因50ng、2*无缝克隆试剂5uL的体系的进行无缝连接，得到pET32b(+)-kan，见图1b，并将载体进行测序分析以确保整个载体元件无任何突变。

在以下实施例3-11中，使用的表达载体pET32b(+)-kan进行KpnI/XbaI双酶切时，自身带有的TrxA蛋白伴侣编码基因被切除，替换为本发明人从温泉菌中分离出的硫氧还蛋白的编码基因。对比例1中用KpnI/EcoRI双酶切表达载体该pET32b(+)-kan时，自身TrxA蛋白编码基因不受影响，仍留在该载体上。对比例2中，用XbaI/HindIII双酶切表达载体pET32b(+)-kan时，自身TrxA蛋白编码基因被切除，得到无硫氧还蛋白编码基因的载体。

实施例3：

包含实施例1编码基因的表达载体的建立。

本实施例使用从温泉菌中分离的硫氧还蛋白酶，氨基酸序列为SEQ ID NO:8，编码基因为SEQ ID NO:9，其编码基因由苏州金唯智生物科技有限公司负责密码子优化并进行合成。将此硫氧还蛋白编码基因与实施例1的编码基因串联进行重组融合蛋白表达。

所需引物如下：

正向引物P5：GCtctagaaataattttgtttaactttaagaaggagatatacatATGAGCCCGATTAAAGAAGA(SEQ ID NO.32)

反向引物P6：GGggtaccAATCTCGCCGCATTCGGCGT(SEQ ID NO.33)

将表达载体pET32b(+)-kan用KpnI/XbaI双酶切，酶切反应体系为30μg质粒(84uL)、3uLKpnI、3uLXbaI、10uL 10*cutsmart，在37度酶切1.5h后，用1.0％琼脂糖凝胶电泳进行分离，其中载体的约5.2Kb条带从凝胶中切出，使用凝胶提取试剂盒进行纯化。

以合成基因SEQ ID NO:9作为模板，用引物P5和P6pcr扩增目的片段，用1.0％琼脂糖凝胶电泳进行分离，得到约0.5Kb条带。将条带从凝胶中切出，使用凝胶提取试剂盒进行回收，回收后的片段用KpnI/XbaI双酶切，酶切反应体系为3μg片段(43uL)、1uLKpnI、1uLXbaI、5uL 10*cutsmart，在37度酶切1.5h后，用1.0％琼脂糖凝胶电泳进行分离，约0.5Kb条带从凝胶中切出，使用凝胶提取试剂盒进行回收。然后按照KpnI/XbaI双酶切后的载体pET32b(+)-kan 50ng、KpnI/XbaI双酶切后的插入片段50ng、10*T4连接酶buffer 1uL、T4连接酶0.5uL的体系进行T4连接，得到表达载体并命名为pET32b(+)-kan-TR1。

将载体pET32b(+)-kan-TR1以及实施例1的编码基因分别用KpnI/EcoRI双酶切，酶切反应体系为30μg质粒(84uL)、3uLKpnI、3uLXbaI、10uL 10*cutsmart，在37度酶切1.5h后，用1.0％琼脂糖凝胶电泳进行分离，其中载体约5.7Kb，编码基因约1.2Kb条带从凝胶中切出，使用凝胶提取试剂盒进行纯化。然后按照KpnI/EcoRI双酶切后的载体pET32b(+)-kan-TR1 50ng、KpnI/EcoRI双酶切后的插入片段100ng、10*T4连接酶buffer 1uL、T4连接酶0.5uL的体系进行T4连接，得到重组表达载体并命名为pET32b(+)-kan-TR1-GLP1¹⁰。挑取5个载体用KpnI/EcoRI双酶切验证，可酶切出约1.2kb的条带。将载体用通用引物T7/T7t进行测序分析以确保插入序列无任何突变。

实施例4：

将实施例3中正确的重组表达载体转化至宿主细胞建立大肠杆菌基因工程表达菌。

所述的宿主细胞为大肠杆菌BL21(DE3)化转感受态，转化方法为：将感受态从-80℃冰箱中取出放在冰上，感受态融化后加入约200ng～500ng实施例3获取的表达载体，枪头缓慢搅匀后冰浴15min，用42℃热激90s，冰浴3min，加入500uLLB培养液，37℃220rpm孵育45min，取50uL均匀涂布于含有50μg/ml的LB固体培养基上，倒置培养过夜获取单克隆，扩培后用20％终浓度甘油保存与-80℃，测序分析验证正确后，即为重组表达转化体，命名为SM37。

实施例5：

摇瓶小规模发酵生产融合蛋白

从实施例4获取的包含编码含有10联GLP-1类似物多肽的融合蛋白的基因的重组表达菌株的甘油管中取5ul甘油菌接种于5ml含有50μg/ml Kan的LB液体培养基中，37℃，220rpm培养16h。按菌液：培养基＝1：100(v:v)接种于100ml含有50μg/ml Kan的LB液体培养基中，37℃，220rpm培养至OD₆₀₀约为1，加入异丙基硫代半乳糖苷(IPTG)至终浓度为0.5mM，30℃诱导20h。用此方法平行做20瓶，以获取1L-2L发酵液。同时以未加入IPTG的2瓶作为未诱导发酵的对照组。

实施例6

收集实施例5中获取的发酵液离心收集菌体并破碎。

先取少量菌体用20mL 50mM pH8.0 Tris-HCl重悬，采用超声波破碎细胞，4℃、8000rpm离心20min，分离上清和沉淀，进行SDS-PAGE电泳，见图3，在超声破碎沉淀的样品中几乎没有目标蛋白(59.6KD)的条带，即几乎无包涵体形式的融合蛋白，说明蛋白伴侣TR1可增加蛋白的可溶性表达。未添加IPTG诱导组几乎无目标蛋白条带，说明IPTG显著诱导宿主细胞表达目标蛋白。

随后将所有IPTG诱导的菌体用50mM pH8.0 Tris-HCl重悬，控制菌浓在10％，然后用高压匀浆机破碎细胞，4℃、8000rpm离心收集菌体破碎上清，并用0.45μm滤膜澄清，将澄清液送HPLC检测，见图4。

实施例7：

含有10联GLP-1类似物多肽的融合蛋白的捕获。

将实施例6获取的含有融合蛋白的澄清液进行疏水层析捕获，所需的流动相为：流动相A：氯化钠1.7532g/L、二水合磷酸二氢钠0.0605g/L、十二水合磷酸氢二钠7.0205g/L；流动相B：纯水。流动相A平衡上样，流动相B洗脱。洗脱液的液相结果如图5，该疏水层析方法可有效捕获并纯化融合蛋白，捕获纯化收率可达90％以上。

实施例8

含有10联GLP-1类似物多肽的融合蛋白的酶切。

向实施例7获得的洗脱液中按照9:1的体积比例加入500mM、pH＝8.5的Tris，随后加入1％ EK、2％kex2、2％CPB蛋白酶，整个酶切过程控制在25℃pH为8～8.5的缓冲条件，酶切过程中，每隔30min取样检测一次，HPLC检测结果表明酶切30min时反应还在继续，1.5小时酶切反应完成，融合蛋白基本全部转化成目标蛋白GLP-1类似物和硫氧还蛋白伴侣，见图6A～6D。

实施例9：

目标多肽GLP-1类似物的捕获。

将实施例8获取的含有目标多肽GLP-1类似物的澄清液进行疏水层析捕获，流动相：流动相A：氯化钠1.7532g/L、二水合磷酸二氢钠0.0605g/L、十二水合磷酸氢二钠7.0205g/L；流动相B：纯水。流动相A平衡上样，流动相B洗脱。洗脱液的液相结果如图7所示，纯化的目标多肽的质谱检测结果如图8所示，说明该疏水层析方法可有效捕获并纯化GLP-1类似物，捕获纯化收率可达90％以上，纯度可达97％以上。

实施例10：

使用本发明所述的一种目标多肽串联组合的重组融合蛋白编码基因的组成形式，设计出串联表达的3联GLP-1类似物多肽的序列：{DDDK+GLP-1类似物多肽序列+KR+GSGSG}₂+DDDK+GLP-1类似物多肽序列，其氨基酸序列如SEQ ID NO:22所示，该氨基酸序列的编码基因的序列如SEQ ID NO:23所示。编码基因是由苏州金唯智生物科技有限公司负责密码子优化并进行合成。

采用实施例3的方法，将载体与插入片段用KpnI和EcoRI双酶切及T4连接酶连接，构建重组表达载体pET32b(+)-kan-TR1-GLP1³，并根据实施例4所述转化至BL21(DE3)中，获得重组表达转化体，命名为SM-33。

同上述方法设计出串联表达的4联GLP-1类似物多肽的序列：{DDDK+GLP-1类似物多肽序列+KR+GSGSG}₃+DDDK+GLP-1类似物多肽序列，其氨基酸序列如SEQ ID NO:24所示，该氨基酸序列的编码基因的序列如SEQ ID NO:25所示，构建重组表达载体pET32b(+)-kan-TR1-GLP1⁴，并根据实施例4所述转化至BL21(DE3)中，获得重组表达转化体，命名为SM34。

同上述方法设计出串联表达的5联GLP-1类似物多肽的序列：{DDDK+GLP-1类似物多肽序列+KR+GSGSG}₄+DDDK+GLP-1类似物多肽序列，其氨基酸序列如SEQ ID NO:26所示，该氨基酸序列的编码基因的序列如SEQ ID NO:27所示，构建重组表达载体pET32b(+)-kan-TR1-GLP1⁵，并根据实施例4所述转化至BL21(DE3)中，获得重组表达转化体，命名为SM35。

同上述方法设计出串联表达的6联GLP-1类似物多肽的序列：{DDDK+GLP-1类似物多肽序列+KR+GSGSG}₅+DDDK+GLP-1类似物多肽序列，其氨基酸序列如SEQ ID NO:28所示，该氨基酸序列的编码基因的序列如SEQ ID NO:29所示，构建重组表达载体pET32b(+)-kan-TR1-GLP1⁶，并根据实施例4所述转化至BL21(DE3)中，获得重组表达转化体，命名为SM36。

将SM33-SM36重组表达转化体分别进行摇瓶小规模发酵生产融合蛋白，用终浓度为0.5mMIPTG诱导表达20h，随后将IPTG诱导的菌体用50mM pH8.0Tris-HCl重悬，控制菌浓在10％，然后用高压匀浆机破碎细胞，4℃、8000rpm离心收集菌体破碎上清，并用0.45μm滤膜澄清，将澄清液送HPLC检测，结果分别见图10A、图10B、图10C、图10D。

串联数目越多，融合蛋白表达的难度越大，HPLC检测表明融合蛋白表达量依次为SM34<SM35<SM37<SM36<SM33，SM37、SM36、SM33融合蛋白表达量相差不大，而SM37所表达的融合蛋白为10个GLP-1类似物肽串联的形式，因此SM37所表达的融合蛋白在酶切后GLP-1类似物的产量会比其它串联数融合蛋白酶切后GLP-1类似物的产量更高。

实施例11

本实施例使用从温泉菌中分离出的另外4种硫氧还蛋白酶TR2、TR3、TR4和TR5，氨基酸序列分别如SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16所示，其编码基因是由苏州金唯智生物科技有限公司负责密码子优化并进行合成。编码基因分别为：SEQID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17。将此4种硫氧还蛋白酶替代pET32b(+)-kan-TR1-GLP1¹⁰中的硫氧还蛋白蛋白伴侣TR1进行融合蛋白表达。所需的引物如下：

正向引物P7：GCtctagaaataattttgtttaactttaagaaggagatatacatATGACCCCGGATGCATGGGA(SEQ ID NO.34)

反向引物P8：GGggtaccTTCATCTTCTTCACCTTCTTC(SEQ ID NO.35)

正向引物P9：GCtctagaaataattttgtttaactttaagaaggagatatacatATGGCAACCTGTATTGTTCT(SEQ ID NO.36)

反向引物P10：GGggtaccCCAATACAGACCACCATACAG(SEQ ID NO.37)

正向引物P11：GCtctagaaataattttgtttaactttaagaaggagatatacatATGCGTGGTTGGCATCGCAT(SEQ ID NO.38)

反向引物P12：GGggtaccTTTACCACCAACAACTTCTTT(SEQ ID NO.39)

正向引物P13：GCtctagaaataattttgtttaactttaagaaggagatatacatATGCTGTTTAAACGCCGCGA(SEQ ID NO.40)

反向引物P14：GGggtaccCAGATATTCTTCCACAATGCG(SEQ ID NO.41)

将表达载体pET32b(+)-kan-TR1-GLP1¹⁰用KpnI/XbaI双酶切，酶切反应体系为30μg质粒(84uL)、3uLKpnI、3uLXbaI、10uL 10*cutsmart，在37度酶切1.5h后，用1.0％琼脂糖凝胶电泳进行分离，其中载体的约6.4k条带从凝胶中切出，使用凝胶提取试剂盒进行纯化。

以合成基因SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17作为模板，分别用引物对P7和P8、P9和P10、P11和P12、P13和P14进行pcr扩增目的片段，用1.0％琼脂糖凝胶电泳进行分离，得到约0.4-0.5Kb条带。将条带从凝胶中切出，使用凝胶提取试剂盒进行回收，回收后的片段用KpnI/XbaI双酶切，酶切反应体系为3μg片段(43uL)、1uLKpnI、1uLXbaI、5uL 10*cutsmart，在37度酶切1.5h后，用1.0％琼脂糖凝胶电泳进行分离，0.4-0.5Kb条带从凝胶中切出，使用凝胶提取试剂盒进行回收。

然后按照KpnI/XbaI双酶切后的载体pET32b(+)-kan-TR1-GLP1¹⁰ 50ng、插入片段50ng、10*T4连接酶buffer 1uL、T4连接酶1uL的体系进行T4连接，得到重组表达载体并命名为pET32b(+)-kan-TR2-GLP1¹⁰、pET32b(+)-kan-TR3-GLP1¹⁰、pET32b(+)-kan-TR4-GLP1¹⁰、pET32b(+)-kan-TR5-GLP1¹⁰。各挑取3个载体，做XbaI/KpnI双酶切验证，并将载体进行测序分析以确保插入片段无任何突变。正确的重组表达载体转化至宿主细胞BL21(DE3)，建立大肠杆菌基因工程表达菌，命名SM39、SM40、SM41、SM42。

将SM39-SM42重组表达转化体分别进行摇瓶小规模发酵生产融合蛋白，用终浓度为0.5mMIPTG诱导表达20h，随后将IPTG诱导的菌体用50mM pH8.0Tris-HCl重悬，控制菌浓在10％，然后用高压匀浆机破碎细胞，4℃、8000rpm离心收集菌体破碎上清，并用0.45μm滤膜澄清，将澄清液送HPLC检测，结果分别见图11A、图11B、图11C、图11D。根据HPLC检测结果，5个表达转化体的融合蛋白都有可溶性表达，其中SM39、SM42表达量较高。虽然不同的硫氧还蛋白所对应的融合蛋白表达量有一定差异，但与对比例2相比不同的硫氧还蛋白伴侣都具有一定的促表达和助溶的作用。

以上实施例验证了，本发明构建了由特定蛋白伴侣辅助的、多个蛋白酶酶切位点与多个目标多肽串联组合得到重组融合蛋白，及制备该融合多肽并经相应蛋白酶酶切以制备小分子多肽的方法，并依此方法构建了具有高表达量的含有10个串联GLP-1的融合蛋白重组菌株，高表达量的融合蛋白代表着高产的GLP-1类似物。本发明由大肠杆菌作为表达宿主，采用10联GLP-1类似物串联表达，充分发挥了宿主的潜能。融合蛋白经过EK、Kex2、CPB蛋白酶共酶切，可在1-2h内快速完成酶切反应，获取的GLP-1类似物无论在N端还是在C端都无任何氨基酸残留，GLP-1类似物终样纯度可达97％以上，有利于下游的修饰加工。

对比例1：

使用pET32a/b系列硫氧还蛋白TrxA作为蛋白伴侣。

通过以下步骤构建相应载体：将表达载体pET32b(+)-kan与合成的编码基因分别用KpnI/EcoRI双酶切，形成互补的粘性末端。酶切反应体系为30μg质粒(84uL)、3uLKpnI、3uLEcoRI，10uL 10*cutsmart，在37度酶切1.5h后，用1.0％琼脂糖凝胶电泳进行分离，其中载体的约5.7k条带以及编码基因约1.2kb条带从凝胶中切出，使用凝胶提取试剂盒进行纯化。然后按照载体pET32b(+)-kan 50ng、插入片段100ng、10*T4连接酶buffer 1uL、T4连接酶1uL的体系进行T4连接，得到重组表达载体并命名为pET32b(+)-kan-TrxA-GLP1¹⁰。挑取3个载体用KpnI/EcoRI双酶切验证，可检测到约1.2kb的正确条带验证。将载体用通用引物T7/T7t进行测序分析以确保插入序列无任何突变。正确的重组表达载体转化至宿主细胞BL21(DE3)，建立大肠杆菌基因工程表达菌，命名SM43。

按照实施例5-8所述的方法做重组融合蛋白的表达、捕获、融合酶切。收集的菌体用高压破碎后离心获取上清，用0.45μm滤膜澄清，将澄清液送HPLC检测，结果见图12，SM43融合蛋白表达量较SM37表达量稍低。融合蛋白捕获后加入相同比例的蛋白酶，每隔30min取样检测一次，HPLC检测结果见图13A-13H，1.5h时酶切反应还在继续，3.5h时酶切反应结束，该对比例融合蛋白酶切实验经过多次重复，均需3-4h完成酶切。

该对比例验证了SM43所表达的重组融合蛋白酶切反应需要的时间更久，并且在酶切反应的后期，反应速率减缓更多。该对比例表明，蛋白伴侣TrxA也具有促进融合蛋白溶解及表达的作用，但融合蛋白中蛋白伴侣TrxA蛋白结构可能会限制了蛋白酶与识别位点的作用，造成酶切反应减慢。使用本发明人自温泉菌分离出的TR1-TR5作为蛋白伴侣，能够进一步获得提高融合蛋白酶切速率的意外技术效果。

对比例2：

使用实施例2所述的载体构建无硫氧还蛋白伴侣的包含实施例1编码基因的表达载体。

设计的引物如下：

正向引物P15：ataacaattcccctctagaaataattttgtttaactttaagaaggagatatacatatgGGTACCGACGACGATGACAAA(SEQ ID NO.42)

反向引物P16：tgcggccgcaagcttgtcgacggagctcGAATTCTTATTAGCCGCGGCCACGA(SEQID NO.5)

首先以实施例1合成基因作为模板，用引物P15和P16进行pcr扩增目的片段，用1.0％琼脂糖凝胶电泳进行分离，得到约1.2Kb条带。将条带从凝胶中切出，使用凝胶提取试剂盒进行纯化。

然后将pET32b(+)-kan用XbaI/HindIII双酶切，形成互补的粘性末端。酶切反应体系为32μg质粒(84uL)、3uLXbaI、3uLHindIII，10uL 10*cutsmart，在37度酶切1.5h后，用1.0％琼脂糖凝胶电泳进行分离，约5.2k条带从凝胶中切出，使用凝胶提取试剂盒进行纯化。

按照pET32b(+)-kan双酶切回收产物50ng、引物P15和P16的pcr扩增产物100ng、2*无缝克隆试剂5uL的体系的进行无缝连接，得到重组表达载体并命名pET32b(+)-kan-GLP1¹⁰，挑取5个载体，做XbaI/HindIII双酶切验证，并将载体进行测序分析以确保插入片段无任何突变。

按照实施例4的方法将pET32b(+)-kan-GLP1¹⁰阳性表达载体转化至BL21(DE3)中得到重组转化体命名为SM38。

按照实施例5的方法进行摇瓶小规模诱导发酵，发酵液离心收集菌体，部分菌体破碎进行超声破壁并送HPLC检测，见图9。

HPLC检测结果表明SM38可溶性表达量极低，无法用于后续大量的蛋白捕获、酶切等获取GLP-1类似物肽的操作。而其它因有硫氧还蛋白蛋白伴侣存在的重组转化子，其可溶性表达量都较高，因此硫氧还蛋白伴侣对多串联GLP-1类似物融合表达至关重要。

本发明融合蛋白涉及的序列如下：

SEQ ID NO:1

名称：肠激酶EK酶切位点

序列：DDDDK

SEQ ID NO:2

名称：SUMO蛋白酶切位点

序列：EQIGG

SEQ ID NO:3

名称：Thrombin酶切位点

序列：LVPRGS

SEQ ID NO:4

名称：TEV酶切位点

序列：ENLYFQG(S)

名称：Factor Xa酶切位点

序列：IXGR(X为E或D)

名称：Kex2酶切位点

序列：KR/RR

名称：羧肽酶B酶切位点

序列：K/R/H

SEQ ID NO:8

MSPIKEDPINEIDELDSILNTMAQNIIRTSYSRDKTFSNIQTKCCNTVIEGGISIRSYSEFIQLINSCRVAFVLITTTYCPYCQLFKPVFFRVAREFAGKAVFIEANADYVPEVAETFNVYSTPTTVIIIDKRPIDAILGYIPYNHFKRYVNDIVSYAECGEI

SEQ ID NO:9

ATGAGCCCGATTAAAGAAGATCCGATCAACGAAATTGATGAACTGGATAGCATTCTGAACACCATGGCCCAGAATATTATCCGTACCTCCTATAGCCGCGATAAAACCTTTAGCAACATCCAGACCAAATGCTGCAACACCGTGATCGAGGGTGGCATTAGCATCCGCAGCTACAGCGAATTTATCCAGCTGATCAACAGCTGCCGCGTGGCGTTTGTGCTGATCACCACCACCTACTGCCCGTATTGCCAGCTGTTTAAACCGGTGTTTTTCCGCGTGGCCCGCGAATTTGCCGGCAAAGCCGTTTTCATCGAAGCCAACGCCGATTATGTGCCCGAAGTGGCGGAAACCTTTAACGTGTATAGCACCCCGACCACGGTGATCATTATCGACAAACGCCCGATTGATGCGATTCTGGGCTACATCCCGTATAACCATTTTAAACGCTATGTGAACGATATTGTGAGCTACGCCGAATGCGGCGAGATT

SEQ ID NO:10

MTPDAWDEFDSLWDEYVAKAVEAAKRAGVVLARSYDEYRKAICSKPVAVVVFTSPTCPACAAYRPIFYEYARRMSQYRGKVAFVEVDSYSAYEAAMEAGVMATPTTVVYLKCKPVDGFIGLADEETLDEIVRPYITKAVEEGEEDE

SEQ ID NO:11

ATGACCCCGGATGCATGGGATGAATTTGATAGCCTGTGGGATGAATATGTTGCAAAAGCAGTTGAAGCAGCAAAACGTGCAGGTGTTGTTCTGGCACGTAGCTATGATGAATATCGTAAAGCAATTTGTAGCAAACCGGTGGCAGTTGTTGTTTTTACCAGCCCGACCTGTCCGGCATGTGCAGCATATCGTCCGATTTTCTATGAATATGCACGTCGTATGAGCCAGTATCGTGGTAAAGTTGCATTTGTTGAAGTTGATAGCTATAGCGCATATGAAGCAGCAATGGAAGCAGGTGTTATGGCAACCCCGACCACCGTTGTTTATCTGAAATGTAAACCGGTTGATGGTTTTATTGGTCTGGCAGATGAAGAAACCCTGGATGAAATTGTTCGTCCGTATATTACCAAAGCAGTTGAAGAAGGTGAAGAAGATGAA

SEQ ID NO:12

MATCIVLRLHQGEGLGLLRLTSKSELDRVIRGSRFALVVFTGLACPACEMYKPVLEKLAELVGKDMPVVEYVVDYDPEPALELGIMGTPTTVVYVDGKPVEGFVGAVDLPDLLEFLAKVASKSDKQLAEKLEKLAEKVKPLYGGLYW

SEQ ID NO:13

ATGGCAACCTGTATTGTTCTGCGTCTGCATCAGGGTGAAGGTCTGGGTCTGCTGCGTCTGACCAGCAAAAGCGAACTGGATCGTGTTATTCGTGGTAGCCGTTTTGCACTGGTTGTGTTTACCGGTCTGGCATGTCCGGCATGTGAAATGTATAAACCGGTTCTGGAAAAACTGGCAGAACTGGTTGGTAAAGATATGCCGGTTGTTGAATATGTTGTTGATTATGATCCGGAACCGGCACTGGAACTGGGTATTATGGGTACACCGACCACCGTTGTTTATGTTGATGGTAAACCGGTTGAAGGTTTTGTTGGTGCAGTTGATCTGCCGGATCTGCTGGAATTTCTGGCAAAAGTTGCAAGCAAAAGCGATAAACAGCTGGCAGAAAAACTGGAAAAACTGGCCGAAAAAGTTAAACCGCTGTATGGTGGTCTGTATTGG

SEQ ID NO:14

MRGWHRMSSVDEVAAELRKLVEQKIRRIEQDLGDPLYYIEKDFDKVIERYPVAVVEFSAPWCNPCKAYTPVFRRVARRLIEEYNGKVLFAYLDTDKLPETADRYNVENIPTTIIFVNGHVADVIMGATTESRLEDKVRSILKEVVGGK

SEQ ID NO:15

ATGCGTGGTTGGCATCGCATGAGCAGCGTTGATGAAGTTGCAGCAGAACTGCGTAAACTGGTTGAACAGAAAATTCGTCGTATTGAACAGGATCTGGGTGATCCGCTGTATTATATTGAAAAAGATTTTGATAAAGTTATTGAACGTTATCCGGTTGCAGTTGTTGAATTTAGCGCACCGTGGTGTAATCCGTGTAAAGCATATACCCCGGTTTTTCGTCGTGTTGCCCGTCGTCTGATTGAAGAATATAATGGTAAAGTTCTGTTTGCATATCTGGATACCGATAAACTGCCGGAAACCGCAGATCGTTATAATGTTGAAAATATTCCGACCACCATTATTTTTGTTAATGGTCATGTTGCAGATGTTATTATGGGTGCAACCACCGAAAGCCGTCTGGAAGATAAAGTTCGTAGCATTCTGAAAGAAGTTGTTGGTGGTAAA

SEQ ID NO:16

MLFKRREKEGNIVEIPCDSKEFKKIIEENKVVVVDFWAKWCFPCLIYARSFKKAANRLVGRALFAKVNVGECYSLARKYNIFGVPTTMIFVNGKPKRRILGPVSDKALVRIVEEYL

SEQ ID NO:17

ATGCTGTTTAAACGCCGCGAAAAAGAAGGCAACATTGTGGAAATCCCGTGCGATAGCAAAGAATTTAAGAAAATTATCGAAGAGAACAAAGTGGTGGTGGTGGATTTTTGGGCGAAATGGTGCTTTCCGTGCCTGATTTATGCCCGCAGCTTTAAAAAAGCCGCCAATCGCCTGGTGGGCCGCGCGCTGTTTGCCAAAGTGAATGTGGGCGAATGCTATAGCCTGGCCCGCAAATACAACATTTTTGGCGTGCCGACCACCATGATCTTTGTGAACGGCAAACCGAAACGCCGCATCCTGGGCCCGGTGAGCGATAAAGCGCTGGTGCGCATTGTGGAAGAATATCTG

SEQ ID NO:18

MSDKIIHLTDDSFDTDVLKADGAILVDFWAEWCGPCKMIAPILDEIADEYQGKLTVAKLNIDQNPGTAPKYGIRGIPTLLLFKNGEVAATKVGALSKGQLKEFLDANLA

SEQ ID NO:19

ATGAGCGATAAAATTATTCACCTGACTGACGACAGTTTTGACACGGATGTACTCAAAGCGGACGGGGCGATCCTCGTCGATTTCTGGGCAGAGTGGTGCGGTCCGTGCAAAATGATCGCCCCGATTCTGGATGAAATCGCTGACGAATATCAGGGCAAACTGACCGTTGCAAAACTGAACATCGATCAAAACCCTGGCACTGCGCCGAAATATGGCATCCGTGGTATCCCGACTCTGCTGCTGTTCAAAAACGGTGAAGTGGCGGCAACCAAAGTGGGTGCACTGTCTAAAGGTCAGTTGAAAGAGTTCCTCGACGCTAACCTGGCC

SEQ ID NO:20

DDDDKEGTFTSDVSSYLEGQAAKEFIAWLVRGRGKRGSGSGDDDDKEGTFTSDVSSYLEGQAAKEFIAWLVRGRGKRGSGSGDDDDKEGTFTSDVSSYLEGQAAKEFIAWLVRGRGKRGSGSGDDDDKEGTFTSDVSSYLEGQAAKEFIAWLVRGRGKRGSGSGDDDDKEGTFTSDVSSYLEGQAAKEFIAWLVRGRGKRGSGSGDDDDKEGTFTSDVSSYLEGQAAKEFIAWLVRGRGKRGSGSGDDDDKEGTFTSDVSSYLEGQAAKEFIAWLVRGRGKRGSGSGDDDDKEGTFTSDVSSYLEGQAAKEFIAWLVRGRGKRGSGSGDDDDKEGTFTSDVSSYLEGQAAKEFIAWLVRGRGKRGSGSGDDDDKEGTFTSDVSSYLEGQAAKEFIAWLVRGRG*

*代表终止密码子(下同)。

SEQ ID NO:21

GACGACGATGACAAAGAAGGTACGTTTACGAGCGACGTTAGCAGTTATCTGGAAGGCCAAGCGGCGAAAGAATTTATCGCCTGGCTGGTGCGCGGTCGTGGCAAACGTGGCAGCGGTAGCGGCGATGACGATGACAAGGAGGGCACCTTCACGAGCGACGTTAGCAGTTATTTAGAAGGCCAAGCCGCCAAAGAGTTTATTGCGTGGCTGGTTCGCGGTCGTGGCAAACGTGGTAGTGGCAGCGGCGACGACGACGACAAAGAAGGCACGTTCACGAGCGACGTTAGCAGCTATCTGGAAGGCCAAGCGGCCAAAGAGTTTATTGCCTGGCTGGTGCGCGGCCGTGGCAAGCGCGGCAGCGGCAGTGGTGACGATGACGATAAAGAGGGCACCTTTACGAGCGATGTGAGCAGCTATTTAGAGGGTCAAGCGGCGAAGGAGTTTATTGCGTGGTTAGTGCGCGGCCGCGGCAAACGCGGTAGCGGCAGTGGCGACGACGACGATAAGGAAGGCACGTTTACGAGCGACGTGAGTAGCTACCTGGAAGGTCAAGCCGCCAAGGAGTTTATTGCGTGGTTAGTTCGTGGCCGTGGCAAACGCGGTAGTGGCAGTGGCGACGATGATGACAAAGAGGGCACCTTCACGAGCGATGTGAGTAGCTATCTGGAAGGCCAAGCGGCCAAAGAATTTATCGCGTGGCTGGTGCGTGGCCGTGGCAAACGCGGCAGCGGCAGCGGCGATGATGACGATAAAGAGGGCACCTTCACGAGCGATGTTAGTAGTTATCTGGAGGGCCAAGCGGCGAAAGAGTTTATTGCCTGGCTGGTGCGTGGTCGTGGCAAACGTGGCAGTGGCAGTGGCGATGACGATGACAAAGAGGGCACCTTTACGAGCGATGTGAGTAGCTATCTGGAAGGCCAAGCGGCGAAAGAGTTTATCGCCTGGCTGGTGCGCGGTCGTGGTAAGCGCGGCAGCGGCAGTGGCGATGACGACGATAAGGAAGGCACCTTCACGAGCGATGTGAGCAGTTATCTGGAAGGCCAAGCGGCGAAAGAGTTTATTGCGTGGTTAGTTCGCGGTCGTGGCAAACGCGGCAGCGGTAGCGGTGATGACGATGATAAAGAGGGCACGTTTACGAGCGACGTGAGCAGCTACCTGGAGGGTCAAGCGGCCAAAGAATTTATTGCGTGGCTGGTTCGTGGCCGCGGCTAA

SEQ ID NO:22

DDDDKEGTFTSDVSSYLEGQAAKEFIAWLVRGRGKRGSGSGDDDDKEGTFTSDVSSYLEGQAAKEFIAWLVRGRGKRGSGSGDDDDKEGTFTSDVSSYLEGQAAKEFIAWLVRGRG*

SEQ ID NO:23

GACGACGACGATAAAGAAGGTACTTTTACCTCCGATGTATCTTCCTACCTGGAGGGCCAGGCTGCTAAAGAATTCATCGCATGGCTGGTGCGTGGTCGTGGTAAGCGTGGCTCTGGCTCCGGCGACGACGACGACAAAGAAGGCACGTTTACCTCCGACGTTAGCTCTTACCTGGAAGGTCAAGCTGCTAAAGAATTTATCGCGTGGCTGGTGCGTGGCCGTGGTAAACGTGGTTCCGGCTCTGGTGACGATGACGACAAAGAAGGCACCTTCACGTCTGATGTTTCCTCCTATCTGGAAGGCCAGGCCGCCAAAGAGTTCATCGCGTGGCTGGTTCGTGGTCGTGGTAAACGTGGTTCCGGTAGCGGCTAA

SEQ ID NO:24

DDDDKEGTFTSDVSSYLEGQAAKEFIAWLVRGRGKRGSGSGDDDDKEGTFTSDVSSYLEGQAAKEFIAWLVRGRGKRGSGSGDDDDKEGTFTSDVSSYLEGQAAKEFIAWLVRGRGKRGSGSGDDDDKEGTFTSDVSSYLEGQAAKEFIAWLVRGRG*

SEQ ID NO:25

GACGATGACGACAAAGAAGGCACCTTCACGAGCGATGTTAGCAGTTATCTGGAAGGTCAAGCCGCCAAAGAGTTCATTGCCTGGTTAGTTCGCGGCCGCGGCAAACGCGGTAGTGGCAGCGGCGACGATGATGACAAAGAAGGCACCTTCACGAGCGATGTGAGCAGCTATCTGGAAGGCCAAGCGGCGAAGGAGTTTATCGCGTGGCTGGTTCGCGGCCGCGGCAAACGCGGCAGCGGCAGTGGCGATGACGATGATAAGGAGGGCACGTTTACGAGCGATGTGAGCAGTTACCTGGAAGGCCAAGCGGCGAAGGAGTTCATTGCGTGGCTGGTGCGTGGCCGTGGTAAGCGTGGCAGCGGTAGCGGCGACGATGATGACAAAGAGGGCACCTTCACGAGTGACGTTAGTAGCTATTTAGAAGGCCAAGCGGCCAAAGAATTTATCGCCTGGTTAGTGCGCGGTCGTGGCTAA

SEQ ID NO:26

DDDDKEGTFTSDVSSYLEGQAAKEFIAWLVRGRGKRGSGSGDDDDKEGTFTSDVSSYLEGQAAKEFIAWLVRGRGKRGSGSGDDDDKEGTFTSDVSSYLEGQAAKEFIAWLVRGRGKRGSGSGDDDDKEGTFTSDVSSYLEGQAAKEFIAWLVRGRGKRGSGSGDDDDKEGTFTSDVSSYLEGQAAKEFIAWLVRGRG*

SEQ ID NO:27

GACGATGATGACAAAGAAGGCACCTTTACGAGCGACGTGAGCAGTTACCTGGAAGGCCAAGCCGCGAAAGAGTTTATTGCCTGGCTGGTGCGCGGCCGTGGCAAACGTGGCAGTGGCAGCGGCGACGATGACGACAAGGAGGGCACCTTTACGAGCGACGTTAGCAGCTACTTAGAAGGCCAAGCGGCCAAGGAATTTATCGCCTGGCTGGTGCGCGGTCGCGGCAAACGCGGTAGCGGCAGTGGTGATGACGATGACAAGGAAGGCACCTTCACGAGCGATGTGAGTAGTTATCTGGAAGGCCAAGCCGCGAAGGAATTTATCGCGTGGTTAGTTCGCGGCCGTGGTAAACGCGGCAGCGGCAGCGGCGACGATGACGATAAGGAAGGCACCTTCACGAGCGACGTTAGCAGCTACCTGGAAGGCCAAGCGGCCAAAGAGTTCATCGCGTGGCTGGTGCGTGGTCGCGGTAAACGCGGTAGTGGCAGCGGCGATGACGATGATAAGGAGGGCACCTTCACGAGCGATGTTAGTAGTTACCTGGAAGGTCAAGCGGCGAAAGAATTTATTGCCTGGTTAGTGCGTGGCCGCGGTTAA

SEQ ID NO:28

DDDDKEGTFTSDVSSYLEGQAAKEFIAWLVRGRGKRGSGSGDDDDKEGTFTSDVSSYLEGQAAKEFIAWLVRGRGKRGSGSGDDDDKEGTFTSDVSSYLEGQAAKEFIAWLVRGRGKRGSGSGDDDDKEGTFTSDVSSYLEGQAAKEFIAWLVRGRGKRGSGSGDDDDKEGTFTSDVSSYLEGQAAKEFIAWLVRGRGKRGSGSGDDDDKEGTFTSDVSSYLEGQAAKEFIAWLVRGRG*

SEQ ID NO:29

GATGATGACGATAAAGAGGGCACCTTCACGAGCGACGTTAGTAGTTACTTAGAGGGTCAAGCGGCGAAGGAATTTATTGCCTGGTTAGTTCGCGGCCGTGGTAAGCGTGGTAGTGGCAGTGGCGACGATGACGATAAAGAAGGTACGTTCACGAGTGACGTTAGTAGCTACCTGGAGGGCCAAGCGGCCAAAGAGTTCATCGCCTGGCTGGTTCGCGGTCGTGGCAAGCGCGGCAGCGGCAGCGGCGATGACGATGATAAAGAAGGCACCTTTACGAGCGACGTGAGCAGCTATCTGGAGGGTCAAGCGGCGAAAGAATTTATCGCGTGGCTGGTTCGCGGCCGTGGTAAACGTGGCAGCGGCAGCGGTGACGACGACGATAAAGAAGGCACGTTCACGAGCGATGTGAGCAGTTATTTAGAAGGCCAAGCGGCGAAGGAGTTTATCGCGTGGCTGGTGCGTGGTCGTGGCAAACGCGGCAGCGGTAGTGGCGATGATGACGACAAAGAAGGCACGTTTACGAGTGATGTGAGTAGTTATTTAGAGGGTCAAGCGGCGAAAGAGTTCATCGCGTGGCTGGTGCGCGGCCGCGGTAAACGTGGCAGCGGCAGTGGCGATGACGATGATAAAGAGGGCACCTTTACGAGCGATGTGAGCAGCTATTTAGAAGGCCAAGCGGCGAAAGAATTTATTGCGTGGCTGGTTCGCGGTCGTGGCTAA

在本发明提及的所有文献都在本申请中引用作为参考，就如同每一篇文献被单独引用作为参考那样。此外应理解，在阅读了本发明的上述讲授内容之后，本领域技术人员可以对本发明作各种改动或修改，这些等价形式同样落于本申请所附权利要求书所限定的范围。

Claims

1.一种重组融合蛋白，其特征在于，所述的重组融合蛋白从N端到C端的结构如下式所示：

蛋白伴侣-{N端蛋白酶识别序列-目标多肽-C端蛋白酶识别序列-连接肽}_n-1-N端蛋白酶识别序列-目标多肽；

其中，所述蛋白伴侣为硫氧还蛋白，其氨基酸序列如SEQ ID NO:8，并且所述{N端蛋白酶识别序列-目标多肽-C端蛋白酶识别序列-连接肽}_n-1-N端蛋白酶识别序列-目标多肽的氨基酸序列如SEQ ID NO:20、SEQ ID NO:22、SEQ IDNO:24、SEQ ID NO:26、或SEQ ID NO:28所示；或者

所述蛋白伴侣为硫氧还蛋白，其氨基酸序列如SEQ ID NO:10、SEQ IDNO:12、SEQ IDNO:14、或SEQ ID NO:16所示，并且所述{N端蛋白酶识别序列-目标多肽-C端蛋白酶识别序列-连接肽}_n-1-N端蛋白酶识别序列-目标多肽的氨基酸序列如SEQ ID NO:20所示。

2.一种多核苷酸，其特征在于，所述多核苷酸编码如权利要求1所述的融合蛋白。

3.一种载体，其特征在于，所述载体中含有如权利要求2所述的多核苷酸。

4.一种工程化的宿主细胞，其特征在于，所述宿主细胞中含有如权利要求3所述的载体，或基因组中整合有如权利要求2所述的多核苷酸。