CN114292338A

CN114292338A - 一种融合蛋白及其制备司美格鲁肽中间体多肽的方法

Info

Publication number: CN114292338A
Application number: CN202111664146.2A
Authority: CN
Inventors: 王璟; 汤传根; 张腾; 范晓阳; 陈松; 金波
Original assignee: Nanjing Hanxin Pharmaceutical Technology Co ltd
Current assignee: Nanjing Hanxin Pharmaceutical Technology Co ltd
Priority date: 2021-12-31
Filing date: 2021-12-31
Publication date: 2022-04-08
Anticipated expiration: 2041-12-31
Also published as: CN114292338B; WO2023125178A1

Abstract

本发明公开了一种融合蛋白及其制备司美格鲁肽中间体多肽的方法，属于基因工程及多肽制备技术领域。所述融合蛋白包括一段融合肽，蛋白酶酶切位点和目的主分子序列。通过优化融合肽序列，改变蛋白等电点及亲水性等性质，有效提高了融合蛋白的表达量，最高可达13.1g/L；同时，也改善了融合蛋白的性状，利于后续提取、酶切及纯化工艺的开发，酶切后中间体多肽的量为3.62g/L。从源头降低了司美格鲁肽中间体多肽Arg34GLP‑1(9‑37)的生产成本，有利于工业化放大，适用于工业化生产。

Description

一种融合蛋白及其制备司美格鲁肽中间体多肽的方法

技术领域

本发明涉及一种融合蛋白及其制备司美格鲁肽中间体多肽的方法，具体涉及一种可高效制备司美格鲁肽中间体多肽Arg34GLP-1(9-37)的融合蛋白序列，属于基因工程及多肽制备技术领域。

背景技术

2型糖尿病(T2DM)是由多种病因造成人体胰岛β细胞功能受损、胰岛素分泌不足或者靶组织的胰岛素抵抗力增强引起的慢性代谢性紊乱综合症，临床上主要表现为多饮、多食、多尿及体重减轻等症状，并具有突发糖尿酮症酸中毒、高渗性昏迷等并发症的风险。T2DM是一种慢性代谢疾病，多在35～40岁之后发病，占糖尿病患者90％以上。目前，临床上治疗糖尿病的药物主要集中在各类胰岛素和四大类口服降糖药。为了让糖尿病患者在治疗时有更多的选择，一些新型的治疗糖尿病药物在21世纪初应运而生，如胰高糖素样肽-1(GLP-1)类似物，这类药物是在内源GLP-1的基础上经过结构改变而成的。内源性的GLP-1是由肠道L细胞分泌的一种肠促降糖激素，含有30多个氨基酸，能通过广泛分布人体心脏、肝脏、肾脏、胰腺、胃肠道等多器官组织的细胞膜表面的GLP-1受体结合，引发细胞内部相关信号传导路径发生改变，从而发挥相应的调节机体的功能，所以GLP-1具有多功能、多靶点的作用特点，尤其对胰岛细胞的调节功能尤为显著，能根据体内葡萄糖水平按需促进胰岛素分泌。但唯一的不足是GLP-1在人体内很容易被二肽基肽酶IV降解，半衰期大约2min，这就限制了其临床运用。结构改造后的GLP-1制剂既保留了GLP-1的药理作用，又大大提高了药物的作用时间。

司美格鲁肽(Semaglutide)是由Nove Nordisk公司研发的长效GLP-1类似物，通过基因重组技术，利用酵母生产获得，该药物只需要进行每周一次的皮下注射给药。司美格鲁肽作为GLP-1类似物的代表药物之一，在多个临床试验研究已经证明联合不同的口服降糖药可以有效控制血糖，并能够使患者减轻体重、减少收缩压及改善胰岛β细胞功能。

司美格鲁肽的主链结构为一个含有29个氨基酸的中间体多肽Arg34GLP-1(9-37)或含有27个氨基酸的中间体多肽Arg34GLP-1(11-37)，其氨基酸序列分别为EGTFTSDVSSYLEGQAAKEFIAWLVRGRG(SEQ ID NO:1)和TFTSDVSSYLEGQAAKEFIAWLVRGRG(SEQID NO:2)。目前现有技术中该中间体多肽主要通过化学合成的方法制备(公开号为CN105753964A的专利文献，公开于2016年)，但是化学法工艺步骤多，合成过程中需要使用多种的有机溶剂且使用量较大，不利于工业化放大且对环境不友好，且化学合成多肽中潜在的氨基酸消旋体杂质给该药的长期使用带来一定风险。而其他生物法制备该中间体多肽的方法包括胞内可溶性表达、包涵体表达以及包涵体形式的串联表达。其中，胞内可溶性表达(公开号为CN104745597A的专利文献，公开于2015年)的表达量较低，不具备工业化放大价值；涉及包涵体表达的专利CN110498849A(公开于2019年)公开了一种高纯度和高收率的制备司美格鲁肽主肽链的方法，但是其中公开的优选前导肽序列KPSTYI属于短肽序列，无法有效提高融合蛋白的表达量；另外，在专利公开号为CN111378027A(公开于2020年)的专利文献中针对司美格鲁肽的中间体多肽进行了串联表达，利用KexII蛋白酶酶切位点KR作为linker，需要经过KexII酶以及羧肽酶B两步酶切得到司美格鲁肽的中间体多肽，步骤繁琐且KexII酶价格昂贵，不具备工业化放大意义。

基于现有技术存在上述技术问题，因此迫切需要寻找一种融合蛋白表达量更高、工艺步骤更简单、更适合工业化生产的方法。

发明内容

针对目前在司美格鲁肽制备中存在的问题，本发明公开了一种可高效制备司美格鲁肽中间体多肽Arg34GLP-1(9-37)或Arg34GLP-1(11-37)的融合蛋白序列。该融合蛋白包括一段融合肽，蛋白酶酶切位点和目的主分子序列，并以遗传背景清晰、易于培养、发酵周期短的大肠杆菌表达系统为基础，构建重组菌株。通过优化融合肽序列，改变蛋白等电点及亲水性等性质，有效提高了融合蛋白的表达量。随后对融合蛋白序列进行酶切，得到司美格鲁肽中间体多肽Arg34GLP-1(9-37)或Arg34GLP-1(11-37)。

为了实现上述发明目的，本发明所公开的技术方案如下：

本发明的第一个目的是提供一种融合肽，所述融合肽序列如下所示：

MATKAVSVLKGDGPVQGIINFEQKESNGPVKVWGSIKGLTX₁GLHGFHVHKX₂FVNQHLCGSHLVALYLVX₃；

所述X₁为谷氨酸和组氨酸中的任意一个氨基酸；

所述X₂为色氨酸、亮氨酸、缬氨酸中的任意0个、1个、2个或3个的排列组合；

所述X₃为组氨酸、丙氨酸中的任意0个、1个或2个的排列组合。

在一种实施方式中，所述的融合肽序列如SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10或SEQ ID NO:11所示任一，具体如下：

MATKAVSVLKGDGPVQGIINFEQKESNGPVKVWGSIKGLTEGLHGFHVHKFVNQHLCGSHLVALYLV(SEQ ID NO:3)；

MATKAVSVLKGDGPVQGIINFEQKESNGPVKVWGSIKGLTEGLHGFHVHKFVNQHLCGSHLVALYLVHA(SEQ ID NO:4)；

MATKAVSVLKGDGPVQGIINFEQKESNGPVKVWGSIKGLTHGLHGFHVHKFVNQHLCGSHLVALYLV(SEQ ID NO:5)；

MATKAVSVLKGDGPVQGIINFEQKESNGPVKVWGSIKGLTEGLHGFHVHKFVNQHLCGSHLVALYLVH(SEQ ID NO:6)；

MATKAVSVLKGDGPVQGIINFEQKESNGPVKVWGSIKGLTEGLHGFHVHKWLVFVNQHLCGSHLVALYLVH(SEQ ID NO:7)；

MATKAVSVLKGDGPVQGIINFEQKESNGPVKVWGSIKGLTHGLHGFHVHKWLVFVNQHLCGSHLVALYLV(SEQ ID NO:8)；

MATKAVSVLKGDGPVQGIINFEQKESNGPVKVWGSIKGLTHGLHGFHVHKWLFVNQHLCGSHLVALYLV(SEQ ID NO:9)；

MATKAVSVLKGDGPVQGIINFEQKESNGPVKVWGSIKGLTHGLHGFHVHKWVFVNQHLCGSHLVALYLV(SEQ ID NO:10)；

MATKAVSVLKGDGPVQGIINFEQKESNGPVKVWGSIKGLTHGLHGFHVHKWFVNQHLCGSHLVALYLV(SEQ ID NO:11)。

本发明的第二个目的是提供一种融合蛋白，所述融合蛋白包含权利要求1所述的融合肽，所述融合蛋白包括融合肽-DDDDK-Arg34GLP-1(9-37)或融合肽-DDDDK-Arg34GLP-1(11-37)；

所述Arg34GLP-1(9-37)的氨基酸序列如SEQ ID NO:1所示；

所述Arg34GLP-1(11-37)的氨基酸序列如SEQ ID NO:2所示。

本发明的第三个目的是提供了编码所述融合蛋白的基因。

本发明的第四个目的是提供了一种重组表达载体，所述重组表达载体含有编码所述融合蛋白的基因。

在一种实施方式中，所述重组表达载体包括但不限于pET系列、Duet系列、pGEX系列、pHY300、pHY300PLK、pPIC3K、pPIC9K或pTrc系列载体。

在一种实施方式中，所述pET系列载体包括pET-24a(+)、pET-28a(+)、pET-29a(+)、pET-30a(+)；所述Duet系列载体包括pRSFDuet-1、pCDFDuet-1；所述pTrc系列系列载体包括pTrc99a。

本发明的第四个目的是提供了表达所述融合蛋白，或含有编码所述融合蛋白的基因的重组微生物细胞。

在一种实施方式中，所述微生物细胞的宿主包括但不限于大肠杆菌、枯草芽孢杆菌或毕赤酵母。

在一种实施方式中，所述大肠杆菌包括大肠杆菌JM109(DE3)、大肠杆菌HMS174(DE3)、大肠杆菌BL21(DE3)、大肠杆菌Rostta2(DE3)、大肠杆菌Rosttagami(DE3)、大肠杆菌Rostta2(DE3)、大肠杆菌DH5α、大肠杆菌W3110和/或大肠杆菌K12。

本发明的第五个目的是提供了制备司美格鲁肽中间体多肽Arg34GLP-1(9-37)或Arg34GLP-1(11-37)的方法，利用所述重组微生物细胞发酵生产司美格鲁肽中间体多肽Arg34GLP-1(9-37)或Arg34GLP-1(11-37)。

在一种实施方式中，将所述重组微生物细胞在35～40℃下培养10～12h，得到种子液，然后按照0.1％～2％(v/v)的接种量接入TB培养基中培养至发酵液OD₆₀₀值达到6～8时，加入终浓度为0.05～1mM的IPTG进行诱导，在25～40℃下诱导14～18h后结束发酵，将发酵后的菌体破碎并提取、酶切得到司美格鲁肽中间体多肽Arg34GLP-1(9-37)或Arg34GLP-1(11-37)。

优选地，将所述重组微生物细胞在37℃下培养12h，得到种子液，然后按照0.2％(v/v)的接种量接入TB培养基中培养至发酵液OD₆₀₀值达到6～8时，加入终浓度为0.1mM的IPTG进行诱导，在37℃下诱导16h后结束发酵。

在一种实施方式中，将所述重组微生物细胞在LB培养基中35～40℃下培养8～12h，得到细胞种子液，将细胞种子液接入基础发酵培养基进一步培养8～12h得到二级种子液，然后接入含有基础发酵培养基中进行培养；当发酵液OD₆₀₀的值达到100～200时，加入终浓度为0.05～1mM的IPTG进行诱导，在25～40℃下诱导8～18h后结束发酵，收集菌体，将菌体破碎并提取、酶切得到司美格鲁肽中间体多肽Arg34GLP-1(9-37)或Arg34GLP-1(11-37)。

优选地，将所述重组微生物细胞在LB培养基中37℃下培养8h，得到细胞种子液，将细胞种子液接入基础发酵培养基进一步培养8h得到二级种子液，然后接入含有6L的基础发酵培养基(BFM培养基)中进行培养；当发酵液OD₆₀₀的值达到150时，加入终浓度为0.1mM的IPTG进行诱导，在37℃下诱导12h后结束发酵，收集菌体，将菌体破碎并提取、酶切得到司美格鲁肽中间体多肽Arg34GLP-1(9-37)或Arg34GLP-1(11-37)。

在一种实施方式中，将菌体破碎后离心收集得到包涵体沉淀，将包涵体利用洗涤缓冲液进行洗涤，将洗涤后的包涵体在pH为6.0～10.0的条件下，按照蛋白浓度为5～55g/L加入包涵体溶解缓冲液，进一步优选为按照蛋白浓度为20～30g/L加入包涵体溶解缓冲液，进行溶解，将溶解后的融合蛋白经肠激酶在30～35℃下酶解20～24h后即可得到中间体多肽、标签和连接肽的混合液，混合液使用离子交换分离即可获得纯度符合要求的中间体多肽样品，纯化后的司美格鲁肽中间体多肽HPLC纯度最高可以达到92.5％以上。

在一种实施方式中，所述溶解缓冲液成分为25mM Tris，0.1mM EDTA-2Na，调节pH至7.5～8.0对包涵体进行溶解。

在一种实施方式中，将菌体与破碎缓冲液按照体积比1:2的量混合，通过高压均质机破碎菌体，离心收集包涵体沉淀；将包涵体沉淀按体积比1:2加入洗涤缓冲液进行洗涤，将洗涤后的包涵体按照蛋白浓度为25g/L加入包涵体溶解缓冲液，进行溶解，将溶解后的融合蛋白经肠激酶在35℃下酶解24h后即可得到中间体多肽、标签和连接肽的混合液。

在一种实施方式中，所述破碎缓冲液的成分为25mM Tris，10mM EDTA-2Na，pH7.5～8.0。

在一种实施方式中，所述洗涤缓冲液的成分为25mM Tris，0.25M尿素，1％吐温20，pH7.5。

本发明提供了所述融合肽，或所述融合蛋白，或编码所述融合蛋白的基因，或所述重组表达载体，或所述微生物细胞在制备司美格鲁肽中间体多肽Arg34GLP-1(9-37)中的应用。

本发明中包涵体表达量较佳的是SEQ ID NO:4、SEQ ID NO:5和SEQ ID NO:11这三条序列。推测可能原因是大肠杆菌BL21体系更易表达中性蛋白，提高融合蛋白的等电点，可以有效提高外源融合蛋白在大肠杆菌里的表达效率，但当等电点过高时，也会影响融合蛋白的表达效率。同时，在提取过程中，平均亲水性较高的蛋白容易溶解在上清里，导致包涵体提取过程中的损失。虽然通过降低融合蛋白的平均亲水性可以降低包涵体提取过程中的损失，但是平均亲水性过低，及疏水性较强会导致融合蛋白在大肠杆菌的胞内体系中无法有效地翻译及表达，因此，当融合蛋白的平均亲水性控制在一个合适的范围内时，可以得到较高的包涵体表达量。

本发明相对现有技术，具有以下优势：

(1)通过改变融合肽序列，提高融合蛋白(融合肽-DDDDK-Arg34GLP-1(9-37))的等电点，表达量显著增加；且后处理仅需单步酶切，减少工艺步骤；中间体多肽的收率和纯度均比现有技术有所提高；

(2)平衡融合蛋白疏水性，减少包涵体提取过程中因亲水性引起的溶解损失，显著提高提取及酶切收率，降低成本，有利于工业化放大；

(3)本发明制备的融合蛋白的表达量最高可达13.1g/L，酶切后司美格鲁肽中间体多肽的粗品含量可以达到3.62g/L，纯化后纯度达到92.5％，收率大于86.2％。

附图说明

图1是实施例1中重组质粒的构建图。

图2是实施例19离子交换目的峰的HPLC图谱。

具体实施方式

为便于本领域技术人员理解本发明内容，下面将结合具体实施例进一步描述本发明的技术方案，但以下内容不应以任何方式限制本发明权利要求书请求保护的范围。

下述实施例中所用的材料、试剂等，如无特殊说明，均可从商业途径得到。

BFM-培养基：磷酸氢二铵6g/L，氯化铵4g/L，磷酸二氢钾13.5g/L，7水合硫酸镁1.39g/L，1水柠檬酸2.8g/L，酵母粉(安琪802)3g/L，微量元素(大肠)10mL/L，用10M NaOH调节pH至7.0。

实施例1：构建表达司美格鲁肽中间体多肽融合蛋白的重组工程菌

设计一个用于在大肠杆菌中表达的融合蛋白序列：融合肽-DDDDK-Arg34GLP-1(9-37)。

融合肽的氨基酸序列首先可以增强表达，其次可以保护中间体多肽Arg34GLP-1(9-37)，防止其被大肠杆菌自身的蛋白酶降解。融合肽的氨基酸序列是MATKAVSVLKGDGPVQGIINFEQKESNGPVKVWGSIKGLTEGLHGFHVHKFVNQHLCGSHLVALYLV(SEQ ID NO:3)。所述融合肽序列的C末端通过DDDDK残基连接司美格鲁肽的中间体多肽Arg34GLP-1(9-37)，因此完整的融合蛋白氨基酸序列为MATKAVSVLKGDGPVQGIINFEQKESNGPVKVWGSIKGLTEGLHGFHVHKFVNQHLCGSHLVALYLVDDDDKEGTFTSDVSSYLEGQAAKEFIAWLVRGRG(SEQ ID NO:12)，该序列等电点为6.2，平均亲水性为0。

利用融合PCR技术合成编码上述融合蛋白的核苷酸序列，将获得的核酸序列通过Nco I/Hind III酶切位点插入到质粒pET-28a(+)的相应的酶切位点中，重组质粒图谱如图1所示。将该重组质粒转入到宿主大肠杆菌BL21(DE3)中，获得表达司美格鲁肽中间体多肽融合蛋白的重组工程菌S1。

实施例2：摇瓶体系司美格鲁肽中间体多肽融合蛋白的表达

将实施例1得到的重组工程菌S1在LB培养基中37℃下培养12h，得到种子液，然后按照0.2％(v/v)的接种量接入TB培养基中进行培养。当发酵液OD₆₀₀的值达到6～8时，加入终浓度为0.1mM的IPTG进行诱导，37℃下诱导16h后结束发酵，离心收集菌体。

实施例3：摇瓶体系中司美格鲁肽中间体多肽融合蛋白的表达及表达量检测

将实施例2中得到的发酵菌体洗涤，利用超声破碎仪破碎菌体，将破碎混悬液离心，收集包涵体。对全菌体和包涵体进行SDS-PAGE检测，并利用光密度仪检测目的蛋白的电泳纯度。同时利用BCA试剂盒检测全菌体和包涵体的总蛋白量。将总蛋白量和电泳纯度相乘得到中间体多肽融合蛋白的表达量。经检测，重组工程菌S1经发酵诱导表达后，得到1.56g/L的融合蛋白，破碎洗涤后得到0.95g/L包涵体。

实施例4：重组菌株的构建及在摇瓶体系中表达司美格鲁肽中间体多肽融合蛋白

采用融合肽的氨基酸序列如SEQ ID NO:4所示，在C末端通过DDDDK残基连接司美格鲁肽的中间体多肽Arg34GLP-1(9-37)，得到含有SEQ ID NO:4融合肽序列的融合蛋白，其等电点为6.4，平均亲水性为0。按照实施例1的操作构建重组工程菌S2，并按照实施例2和实施例3的操作进行表达，测得重组工程菌S2经发酵诱导表达后，得到1.44g/L的融合蛋白，破碎洗涤后得到1.32g/L包涵体。

实施例5：重组菌株的构建及在摇瓶体系中表达司美格鲁肽中间体多肽融合蛋白

采用融合肽的氨基酸序列为SEQ ID NO:5所示，在C末端通过DDDDK残基连接司美格鲁肽的中间体多肽Arg34GLP-1(9-37)，得到含有SEQ ID NO:5融合肽序列的融合蛋白，其等电点为6.7，平均亲水性为0。按照实施例1的操作构建重组工程菌S3，并按照实施例2～3的操作进行表达，测得重组工程菌S3经发酵诱导表达后，得到1.73g/L的融合蛋白，破碎洗涤后得到1.43g/L包涵体。

实施例6：重组菌株的构建及在摇瓶体系中表达司美格鲁肽中间体多肽融合蛋白

采用融合肽的氨基酸序列为SEQ ID NO:6，在C末端通过DDDDK残基连接司美格鲁肽的中间体多肽Arg34GLP-1(9-37)，得到含有SEQ ID NO:6融合肽序列的融合蛋白，其等电点为6.4，平均亲水性为0。按照实施例1的操作构建重组工程菌S4，并按照实施例2～3的操作进行表达，测得重组工程菌S4经发酵诱导表达后，得到1.36g/L的融合蛋白，破碎洗涤后得到1.17g/L包涵体。

实施例7：重组菌株的构建及在摇瓶体系中表达司美格鲁肽中间体多肽融合蛋白

采用融合肽的氨基酸序列为SEQ ID NO:7，在C末端通过DDDDK残基连接司美格鲁肽的中间体多肽Arg34GLP-1(9-37)，得到含有SEQ ID NO:7融合肽序列的融合蛋白，其等电点为6.4，平均亲水性为-0.1。按照实施例1的操作构建重组工程菌S5，并按照实施例2～3的操作进行表达，测得重组工程菌S5经发酵诱导表达后，得到0.93g/L的融合蛋白，破碎洗涤后得到0.87g/L包涵体。

实施例8：重组菌株的构建及在摇瓶体系中表达司美格鲁肽中间体多肽融合蛋白

采用融合肽的氨基酸序列为SEQ ID NO:8，在C末端通过DDDDK残基连接司美格鲁肽的中间体多肽Arg34GLP-1(9-37)，得到含有SEQ ID NO:8融合肽序列的融合蛋白，其等电点为6.7，平均亲水性为-0.1。按照实施例1的操作构建重组工程菌S6，并按照实施例2～3的操作进行表达，测得重组工程菌S6经发酵诱导表达后，得到1.16g/L的融合蛋白，破碎洗涤后得到1.08g/L包涵体。

实施例9：重组菌株的构建及在摇瓶体系中表达司美格鲁肽中间体多肽融合蛋白

采用融合肽的氨基酸序列为SEQ ID NO:9，在C末端通过DDDDK残基连接司美格鲁肽的中间体多肽Arg34GLP-1(9-37)，得到含有SEQ ID NO:9融合肽序列的融合蛋白，其等电点为其等电点为6.7，平均亲水性为-0.1。按照实施例1的操作构建重组工程菌S7，并按照实施例2～3的操作进行表达，测得重组工程菌S7经发酵诱导表达后，得到1.24g/L的融合蛋白，破碎洗涤后得到1.14g/L包涵体。

实施例10：重组菌株的构建及在摇瓶体系中表达司美格鲁肽中间体多肽融合蛋白

采用融合肽的氨基酸序列为SEQ ID NO:10，在C末端通过DDDDK残基连接司美格鲁肽的中间体多肽Arg34GLP-1(9-37)，得到含有SEQ ID NO:10融合肽序列的融合蛋白，其等电点为其等电点为6.7，平均亲水性为-0.1。按照实施例1的操作构建重组工程菌S8，并按照实施例2～3的操作进行表达，测得重组工程菌S8经发酵诱导表达后，得到1.15g/L的融合蛋白，破碎洗涤后得到1.04g/L包涵体。

实施例11：重组菌株的构建及在摇瓶体系中表达司美格鲁肽中间体多肽融合蛋白

采用融合肽的氨基酸序列为SEQ ID NO:11，在C末端通过DDDDK残基连接司美格鲁肽的中间体多肽Arg34GLP-1(9-37)，得到含有SEQ ID NO:11融合肽序列的融合蛋白，其等电点为其等电点为6.7，平均亲水性为0。按照实施例1的操作构建重组工程菌S9，并按照实施例2～3的操作进行表达，测得重组工程菌S9经发酵诱导表达后，得到1.45g/L的融合蛋白，破碎洗涤后得到1.25g/L包涵体。

实施例12：构建表达司美格鲁肽中间体多肽融合蛋白的重组工程菌

设计一个用于在大肠杆菌中表达的融合蛋白序列：融合肽-DDDDK-Arg34GLP-1(11-37)。

融合肽的氨基酸序列首先可以增强表达，其次可以保护中间体多肽Arg34GLP-1(11-37)，防止其被大肠杆菌自身的蛋白酶降解。融合肽的氨基酸序列是MATKAVSVLKGDGPVQGIINFEQKESNGPVKVWGSIKGLTEGLHGFHVHKFVNQHLCGSHLVALYLVHA(SEQ ID NO:4)。所述融合肽序列的C末端通过DDDDK残基连接司美格鲁肽的中间体多肽Arg34GLP-1(11-37)，因此完整的融合蛋白氨基酸序列为MATKAVSVLKGDGPVQGIINFEQKESNGPVKVWGSIKGLTEGLHGFHVHKFVNQHLCGSHLVALYLVHADDDDKTFTSDVSSYLEGQAAKEFIAWLVRGRG(SEQ ID NO:13)，该序列等电点为6.7，平均亲水性为0。

按照实施例1的操作构建重组工程菌S10，并按照实施例2～3的操作进行表达，测得重组工程菌S10经发酵诱导表达后，得到1.69g/L的融合蛋白，破碎洗涤后得到1.40g/L包涵体。

实施例13：重组菌株的构建及在摇瓶体系中表达司美格鲁肽中间体多肽融合蛋白

采用融合肽的氨基酸序列为SEQ ID NO:5，在C末端通过DDDDK残基连接司美格鲁肽的中间体多肽Arg34GLP-1(11-37)，得到含有SEQ ID NO:5融合肽序列的融合蛋白，其等电点为其等电点为7.6，平均亲水性为-0.1。按照实施例1的操作构建重组工程菌S11，并按照实施例2～3的操作进行表达，测得重组工程菌S11经发酵诱导表达后，得到1.17g/L的融合蛋白，破碎洗涤后得到1.11g/L包涵体。

实施例14：重组菌株的构建及在摇瓶体系中表达司美格鲁肽中间体多肽融合蛋白

采用融合肽的氨基酸序列为SEQ ID NO:11，在C末端通过DDDDK残基连接司美格鲁肽的中间体多肽Arg34GLP-1(11-37)，得到含有SEQ ID NO:11融合肽序列的融合蛋白，其等电点为其等电点为7.6，平均亲水性为-0.1。按照实施例1的操作构建重组工程菌S12，并按照实施例2～3的操作进行表达，测得重组工程菌S12经发酵诱导表达后，得到1.21g/L的融合蛋白，破碎洗涤后得到1.13g/L包涵体。以上实施例结果汇总如下表1所示。

表1

重组工程菌	融合肽序列	等电点	平均亲水性	融合蛋白量(g/L)	包涵体量(g/L)
						S1	SEQ ID NO:3	6.2	0	1.56	0.95
S2	SEQ ID NO:4	6.4	0	1.44	1.32
						S3	SEQ ID NO:5	6.7	0	1.73	1.43
S4	SEQ ID NO:6	6.4	0	1.36	1.17
						S5	SEQ ID NO:7	6.4	-0.1	0.93	0.87
S6	SEQ ID NO:8	6.7	-0.1	1.16	1.08
						S7	SEQ ID NO:9	6.7	-0.1	1.24	1.14
S8	SEQ ID NO:10	6.7	-0.1	1.15	1.04
						S9	SEQ ID NO:11	6.7	0	1.45	1.25
S10	SEQ ID NO:4	6.7	0	1.69	1.4
						S11	SEQ ID NO:5	7.6	-0.1	1.17	1.11
S12	SEQ ID NO:11	7.6	-0.1	1.21	1.13

实施例15：重组工程菌发酵罐发酵培养

将实施例5得到的重组工程菌S3在LB培养基中37℃下培养8h，得到细胞种子液，接入基础发酵培养基(BFM培养基)进一步培养8h得到二级种子液，然后接入6L的基础发酵培养基(BFM培养基)中进行培养。当发酵液OD₆₀₀的值达到150时，加入终浓度为0.1mM的IPTG进行诱导，37℃下诱导12h后放罐。离心收集菌体。

实施例16：司美格鲁肽中间体多肽融合蛋白的提取及酶切

将实施例15中得到的菌体，按照体积比1:2加入破碎缓冲液(即1L发酵液获得的菌体中添加2L的破碎缓冲液)，其中，破碎缓冲液的成分为25mM Tris，10mM EDTA-2Na，pH7.5～8.0。通过高压均质机破碎菌体，离心收集包涵体沉淀。将沉淀按体积比1:2加入洗涤缓冲液(即1L发酵液获得的沉淀中添加2L的洗涤缓冲液)，其中，洗涤缓冲液的成分为25mMTris，0.25M尿素，1％吐温20，pH7.5。洗涤后离心收集的包涵体沉淀用洗涤液洗涤1次。将洗涤后的包涵体按照蛋白浓度为25g/L加入包涵体溶解缓冲液，其中溶解缓冲液的成分为25mM Tris，0.1mM EDTA-2Na，调节pH至7.5～8.0进行溶解0.5h。溶解后的包涵体溶液加入肠激酶，在35℃下酶解24h后即可得到中间体多肽、标签和连接肽的混合液。经HPLC检测，溶解后的包涵体含量为13.1g/L，酶切后的中间体多肽含量为3.62g/L。

实施例17：重组菌株在发酵罐体系中表达司美格鲁肽中间体多肽

将实施例4中得到的重组工程菌S2按照实施例15～16进行发酵、诱导、提取及酶切。经HPLC检测，溶解后的包涵体含量为11.4g/L，酶切后的中间体多肽含量为3.08g/L。

实施例18：重组菌株在发酵罐体系中表达司美格鲁肽中间体多肽

将实施例11中得到的重组工程菌S9按照实施例15～16进行发酵、诱导、提取及酶切。经HPLC检测，溶解后的包涵体含量为10.3g/L，酶切后的中间体多肽含量为2.77g/L。

实施例19：司美格鲁肽中间体多肽的纯化

取实施例16得到的含20.3g目的蛋白的混合液，使用离子交换纯化，依次得到洗杂峰1，目的峰和再生峰，取目的峰样品进行HPLC，HPLC检测洗脱时间为15.833min，目的蛋白的纯度为92.5％，HPLC图谱如图2所示。收集到的司美格鲁肽中间体多肽样品为17.5g，收率为86.2％。

对比例1

采用目前已经公开的融合肽序列，此融合肽的序列与本申请融合肽序列类似，序列具体为：MATHAVSVLKGDGPVQGIINFEQHESNGPVKVWGSIHGLTEGLHGFHVHKFVNQHLCGSHLVALYLV(SEQ ID NO:14)作为前导肽，其它步骤均同实施例1～3，重组工程菌S13经发酵诱导表达后，得到0.85g/L的融合蛋白，破碎洗涤后得到0.61g/L包涵体。然后参考实施例15～16进行发酵、诱导、提取及酶切。经HPLC检测，溶解后的包涵体含量为6.5g/L，酶切后的中间体多肽含量为1.75g/L。采用本发明中的融合肽序列，酶切后的中间体多肽的含量为2.77～3.62g/L，均高于对比例中的数据。

本申请中在制备利拉鲁肽中间体多肽中使用的前导肽序列并不适用于所有的GLP-1类多肽产品的前肽表达，比如司美格鲁肽项目。

虽然本发明已以较佳实施例公开如上，但其并非用以限定本发明，任何熟悉此技术的人，在不脱离本发明的精神和范围内，都可做各种的改动与修饰，因此本发明的保护范围应该以权利要求书所界定的为准。

SEQUENCE LISTING

<110> 南京汉欣医药科技有限公司

<120> 一种融合蛋白及其制备司美格鲁肽中间体多肽的方法

<130> BAA211758A

<160> 14

<170> PatentIn version 3.3

<210> 1

<211> 29

<212> PRT

<213> 人工序列

<400> 1

Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly Gln Ala

1 5 10 15

Ala Lys Glu Phe Ile Ala Trp Leu Val Arg Gly Arg Gly

20 25

<210> 2

<211> 27

<212> PRT

<213> 人工序列

<400> 2

Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly Gln Ala Ala Lys

1 5 10 15

Glu Phe Ile Ala Trp Leu Val Arg Gly Arg Gly

20 25

<210> 3

<211> 67

<212> PRT

<213> 人工序列

<400> 3

Met Ala Thr Lys Ala Val Ser Val Leu Lys Gly Asp Gly Pro Val Gln

1 5 10 15

Gly Ile Ile Asn Phe Glu Gln Lys Glu Ser Asn Gly Pro Val Lys Val

20 25 30

Trp Gly Ser Ile Lys Gly Leu Thr Glu Gly Leu His Gly Phe His Val

35 40 45

His Lys Phe Val Asn Gln His Leu Cys Gly Ser His Leu Val Ala Leu

50 55 60

Tyr Leu Val

65

<210> 4

<211> 69

<212> PRT

<213> 人工序列

<400> 4

Met Ala Thr Lys Ala Val Ser Val Leu Lys Gly Asp Gly Pro Val Gln

1 5 10 15

Gly Ile Ile Asn Phe Glu Gln Lys Glu Ser Asn Gly Pro Val Lys Val

20 25 30

Trp Gly Ser Ile Lys Gly Leu Thr Glu Gly Leu His Gly Phe His Val

35 40 45

His Lys Phe Val Asn Gln His Leu Cys Gly Ser His Leu Val Ala Leu

50 55 60

Tyr Leu Val His Ala

65

<210> 5

<211> 67

<212> PRT

<213> 人工序列

<400> 5

Met Ala Thr Lys Ala Val Ser Val Leu Lys Gly Asp Gly Pro Val Gln

1 5 10 15

Gly Ile Ile Asn Phe Glu Gln Lys Glu Ser Asn Gly Pro Val Lys Val

20 25 30

Trp Gly Ser Ile Lys Gly Leu Thr His Gly Leu His Gly Phe His Val

35 40 45

His Lys Phe Val Asn Gln His Leu Cys Gly Ser His Leu Val Ala Leu

50 55 60

Tyr Leu Val

65

<210> 6

<211> 68

<212> PRT

<213> 人工序列

<400> 6

Met Ala Thr Lys Ala Val Ser Val Leu Lys Gly Asp Gly Pro Val Gln

1 5 10 15

Gly Ile Ile Asn Phe Glu Gln Lys Glu Ser Asn Gly Pro Val Lys Val

20 25 30

Trp Gly Ser Ile Lys Gly Leu Thr Glu Gly Leu His Gly Phe His Val

35 40 45

His Lys Phe Val Asn Gln His Leu Cys Gly Ser His Leu Val Ala Leu

50 55 60

Tyr Leu Val His

65

<210> 7

<211> 71

<212> PRT

<213> 人工序列

<400> 7

Met Ala Thr Lys Ala Val Ser Val Leu Lys Gly Asp Gly Pro Val Gln

1 5 10 15

Gly Ile Ile Asn Phe Glu Gln Lys Glu Ser Asn Gly Pro Val Lys Val

20 25 30

Trp Gly Ser Ile Lys Gly Leu Thr Glu Gly Leu His Gly Phe His Val

35 40 45

His Lys Trp Leu Val Phe Val Asn Gln His Leu Cys Gly Ser His Leu

50 55 60

Val Ala Leu Tyr Leu Val His

65 70

<210> 8

<211> 70

<212> PRT

<213> 人工序列

<400> 8

Met Ala Thr Lys Ala Val Ser Val Leu Lys Gly Asp Gly Pro Val Gln

1 5 10 15

Gly Ile Ile Asn Phe Glu Gln Lys Glu Ser Asn Gly Pro Val Lys Val

20 25 30

Trp Gly Ser Ile Lys Gly Leu Thr His Gly Leu His Gly Phe His Val

35 40 45

His Lys Trp Leu Val Phe Val Asn Gln His Leu Cys Gly Ser His Leu

50 55 60

Val Ala Leu Tyr Leu Val

65 70

<210> 9

<211> 69

<212> PRT

<213> 人工序列

<400> 9

Met Ala Thr Lys Ala Val Ser Val Leu Lys Gly Asp Gly Pro Val Gln

1 5 10 15

Gly Ile Ile Asn Phe Glu Gln Lys Glu Ser Asn Gly Pro Val Lys Val

20 25 30

Trp Gly Ser Ile Lys Gly Leu Thr His Gly Leu His Gly Phe His Val

35 40 45

His Lys Trp Leu Phe Val Asn Gln His Leu Cys Gly Ser His Leu Val

50 55 60

Ala Leu Tyr Leu Val

65

<210> 10

<211> 69

<212> PRT

<213> 人工序列

<400> 10

Met Ala Thr Lys Ala Val Ser Val Leu Lys Gly Asp Gly Pro Val Gln

1 5 10 15

Gly Ile Ile Asn Phe Glu Gln Lys Glu Ser Asn Gly Pro Val Lys Val

20 25 30

Trp Gly Ser Ile Lys Gly Leu Thr His Gly Leu His Gly Phe His Val

35 40 45

His Lys Trp Val Phe Val Asn Gln His Leu Cys Gly Ser His Leu Val

50 55 60

Ala Leu Tyr Leu Val

65

<210> 11

<211> 68

<212> PRT

<213> 人工序列

<400> 11

Met Ala Thr Lys Ala Val Ser Val Leu Lys Gly Asp Gly Pro Val Gln

1 5 10 15

Gly Ile Ile Asn Phe Glu Gln Lys Glu Ser Asn Gly Pro Val Lys Val

20 25 30

Trp Gly Ser Ile Lys Gly Leu Thr His Gly Leu His Gly Phe His Val

35 40 45

His Lys Trp Phe Val Asn Gln His Leu Cys Gly Ser His Leu Val Ala

50 55 60

Leu Tyr Leu Val

65

<210> 12

<211> 101

<212> PRT

<213> 人工序列

<400> 12

Met Ala Thr Lys Ala Val Ser Val Leu Lys Gly Asp Gly Pro Val Gln

1 5 10 15

Gly Ile Ile Asn Phe Glu Gln Lys Glu Ser Asn Gly Pro Val Lys Val

20 25 30

Trp Gly Ser Ile Lys Gly Leu Thr Glu Gly Leu His Gly Phe His Val

35 40 45

His Lys Phe Val Asn Gln His Leu Cys Gly Ser His Leu Val Ala Leu

50 55 60

Tyr Leu Val Asp Asp Asp Asp Lys Glu Gly Thr Phe Thr Ser Asp Val

65 70 75 80

Ser Ser Tyr Leu Glu Gly Gln Ala Ala Lys Glu Phe Ile Ala Trp Leu

85 90 95

Val Arg Gly Arg Gly

100

<210> 13

<211> 101

<212> PRT

<213> 人工序列

<400> 13

Met Ala Thr Lys Ala Val Ser Val Leu Lys Gly Asp Gly Pro Val Gln

1 5 10 15

Gly Ile Ile Asn Phe Glu Gln Lys Glu Ser Asn Gly Pro Val Lys Val

20 25 30

Trp Gly Ser Ile Lys Gly Leu Thr Glu Gly Leu His Gly Phe His Val

35 40 45

His Lys Phe Val Asn Gln His Leu Cys Gly Ser His Leu Val Ala Leu

50 55 60

Tyr Leu Val His Ala Asp Asp Asp Asp Lys Thr Phe Thr Ser Asp Val

65 70 75 80

Ser Ser Tyr Leu Glu Gly Gln Ala Ala Lys Glu Phe Ile Ala Trp Leu

85 90 95

Val Arg Gly Arg Gly

100

<210> 14

<211> 67

<212> PRT

<213> 人工序列

<400> 14

Met Ala Thr His Ala Val Ser Val Leu Lys Gly Asp Gly Pro Val Gln

1 5 10 15

Gly Ile Ile Asn Phe Glu Gln His Glu Ser Asn Gly Pro Val Lys Val

20 25 30

Trp Gly Ser Ile His Gly Leu Thr Glu Gly Leu His Gly Phe His Val

35 40 45

His Lys Phe Val Asn Gln His Leu Cys Gly Ser His Leu Val Ala Leu

50 55 60

Tyr Leu Val

65

Claims

1.一种融合肽，其特征在于：所述融合肽序列如下所示：

所述X₁为谷氨酸和组氨酸中的任意一个氨基酸；

2.根据权利要求1所述的融合肽，其特征在于：所述的融合肽序列如SEQ ID NO:3、SEQID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ IDNO:10或SEQ ID NO:11所示任一。

3.一种融合蛋白，其特征在于：所述融合蛋白包含权利要求1所述的融合肽，所述融合蛋白包括融合肽-DDDDK-Arg34GLP-1(9-37)或融合肽-DDDDK-Arg34GLP-1(11-37)；

所述Arg34GLP-1(9-37)的氨基酸序列如SEQ ID NO:1所示；

所述Arg34GLP-1(11-37)的氨基酸序列如SEQ ID NO:2所示。

4.编码权利要求3所述融合蛋白的基因。

5.一种重组表达载体，其特征在于：含有权利要求4所述基因。

6.根据权利要求5所述的重组表达载体，其特征在于：所述重组表达载体包括但不限于pET系列、Duet系列、pGEX系列、pHY300、pHY300PLK、pPIC3K、pPIC9K或pTrc系列载体；所述pET系列载体包括pET-24a(+)、pET-28a(+)、pET-29a(+)、pET-30a(+)；所述Duet系列载体包括pRSFDuet-1、pCDFDuet-1；所述pTrc系列载体包括pTrc99a。

7.表达权利要求3所述融合蛋白，或含有权利要求4所述基因的重组微生物细胞。

8.根据权利要求7所述的微生物细胞，其特征在于，所述微生物细胞的宿主包括但不限于大肠杆菌、枯草芽孢杆菌或毕赤酵母；所述大肠杆菌包括大肠杆菌JM109(DE3)、大肠杆菌HMS174(DE3)、大肠杆菌BL21(DE3)、大肠杆菌Rostta2(DE3)、大肠杆菌Rosttagami(DE3)、大肠杆菌Rostta2(DE3)、大肠杆菌DH5α、大肠杆菌W3110和/或大肠杆菌K12。

9.制备司美格鲁肽中间体多肽Arg34GLP-1(9-37)的方法，其特征在于，利用权利要求7或8所述重组微生物细胞发酵生产司美格鲁肽中间体多肽Arg34GLP-1(9-37)。

10.根据权利要求9所述的方法，其特征在于：将所述重组微生物细胞在35～40℃下培养10～12h，得到种子液，然后按照0.1％～2％(v/v)的接种量接入TB培养基中培养至发酵液OD₆₀₀值达到6～8时，加入终浓度为0.05～1mM的IPTG进行诱导，在25～40℃下诱导14～18h后结束发酵，将发酵后的菌体破碎并提取、酶切得到司美格鲁肽中间体多肽Arg34GLP-1(9-37)。

11.根据权利要求9所述的方法，其特征在于：将所述重组微生物细胞在LB培养基中35～40℃下培养8～12h，得到细胞种子液，将细胞种子液接入基础发酵培养基进一步培养8～12h得到二级种子液，然后接入含有基础发酵培养基中进行培养；当发酵液OD₆₀₀的值达到100～200时，加入终浓度为0.05～1mM的IPTG进行诱导，在25～40℃下诱导8～18h后结束发酵，收集菌体，将菌体破碎并提取、酶切得到司美格鲁肽中间体多肽Arg34GLP-1(9-37)。

12.根据权利要求10或11的方法，其特征在于，将菌体破碎后离心收集得到包涵体沉淀，将包涵体利用洗涤缓冲液进行洗涤，将洗涤后的包涵体在pH为6.0～10.0的条件下，按照蛋白浓度为5～55g/L加入包涵体溶解缓冲液，进行溶解，将溶解后的融合蛋白经肠激酶在30～35℃下酶解20～24h后即可得到中间体多肽、标签和连接肽的混合液，将混合液分离后即可获得纯度符合要求的中间体多肽样品。

13.权利要求1或2所述融合肽，或权利要求3所述融合蛋白，或权利要求4所述基因，或权利要求5或6所述重组表达载体，或权利要求7或8所述微生物细胞在制备司美格鲁肽中间体多肽Arg34GLP-1(9-37)中的应用。