CN114686504B

CN114686504B - Lpp或其突变体作为分子伴侣在大肠杆菌中分泌表达重组蛋白的应用

Info

Publication number: CN114686504B
Application number: CN202011620414.6A
Authority: CN
Inventors: 黄国周; 刘合栋; 曹春来; 梁雄基; 杨晓纯; 李张万金; 樊昌; 李素雯; 周翠; 何秀仪
Original assignee: Zhuhai United Laboratories Co Ltd
Current assignee: Zhuhai United Laboratories Co Ltd
Priority date: 2020-12-30
Filing date: 2020-12-30
Publication date: 2023-11-17
Anticipated expiration: 2040-12-30
Also published as: CN114686504A

Abstract

本发明公开了Lpp或其突变体作为分子伴侣在大肠杆菌中分泌表达重组蛋白的应用。本发明发明人意外发现Lpp作为目的蛋白的分子伴侣，有利于包含分子伴侣和目的蛋白的重组蛋白的分泌表达，产量高，且对大肠杆菌菌体生长的影响小，无显著的菌体裂解情况，易于实现高密度发酵，便于工业化生产。通过该应用，本发明还提供了一种用于大肠杆菌分泌表达的融合蛋白以及一种大肠杆菌分泌表达融合蛋白的方法。

Description

Lpp或其突变体作为分子伴侣在大肠杆菌中分泌表达重组蛋白的应用

技术领域

本发明属于生物医药领域，特别涉及Lpp或其突变体作为分子伴侣在大肠杆菌中分泌表达重组蛋白的应用。

背景技术

诺和诺德专利US20090156478介绍了一种GLP-1受体激动剂(利拉鲁肽，Victoza)的制备方法，34位赖氨酸突变成精氨酸避免修饰，在第26位赖氨酸位点酰化连接脂肪酸链，便可以与人血清白蛋白(HSA)非共价结合，可以延长半衰期至1天左右，每天只需注射一次，同时具有心血管保护和减肥效果。

诺和诺德专利US9732137介绍了另一种新的GLP-1受体激动剂(索玛鲁肽，Ozempic)的制备方法，34位赖氨酸突变成精氨酸避免修饰，DPP-IV的识别位点第八位氨基酸由丙氨酸突变成非天然氨基酸α-氨基异丁酸减少DPP-Ⅳ降解，同时在26位赖氨酸通过酰化连接脂肪酸链，可以将半衰期延长到1周左右，每周注射一次，同时具有保护心血管和减肥效果。

利拉鲁肽和索玛鲁肽表达宿主为诺和诺德专利酿酒酵母(S.cerevisiae ME1719)(MATa/αleu2/1eu2pep-4-3/pep-4-3Δtpi::LEU2/Δtpi::LEU2Δura3/Δura3Δyps 1::URA3/Δyps1::ura3 Cir+)，经过多年改造，多个蛋白酶被敲除，减少蛋白酶降解，但这类复杂的基因改造在其他酵母上难以实现。同时还使用了专利小片段前导肽，形成GLP-1融合蛋白，可以进一步减少蛋白酶降解，并减少错误修饰，但这类小分子前导肽设计难度大，有极大概率会被降解，无法保护易被蛋白酶降解的GLP-1受体激动剂。因此，诺和诺德也是世界上唯一一家以酵母为宿主菌表达GLP-1受体激动剂的公司。

除了酵母外，大肠杆菌也是常用的宿主菌，常见的表达方式为胞内表达。由于GLP-1及其类似物分子量小，极易被胞内蛋白酶降解，因此无法使用常规信号肽如OmpA(CN109825488A)、PelB、PhoA、OmpF、LamB等(Secretory and extracellular productionof recombinant proteins using Escherichia coli)直接表达，需要使用大分子量的分子伴侣形成融合蛋白。常见分子伴侣有TrxA(CN106434717A)、KSI(CN107881187A)、GST(Astrategy for fusion expression and preparation of functional glucagon-likepeptide-1(GLP-1)analogue by introducing an enterokinase cleavage site)等，主要表达方式为胞内表达。

但大肠杆菌胞内表达涉及到细胞破碎，破碎后细胞内源蛋白释放出来，大大增加了纯化压力。为了获得纯度较高的目的蛋白需要多步纯化工艺，同时为了减少胞内蛋白酶降解目的蛋白，需要设计大分子量的分子伴侣进行保护，造成目的蛋白在融合蛋白占比低，产量低。

胞外分泌表达可以直接分泌到胞外培养基，无需破碎，纯化更方便。纤维素酶蛋白(CN201210264387)、细胞素释放蛋白Kil(High-level expression of a recombinantprotein in Klebsiella planticola owing to induced secretion into the culturemedium)、角质酶(重组Thermobifida fusca角质酶的高效胞外表达及其分子机制)、外膜蛋白OmpF(Excretion of Human-Endorphin into Culture Medium by Using OuterMembrane Protein F as a Fusion Partner in Recombinant Escherichia coli)等通过共表达或融合蛋白可促进外源蛋白分泌至发酵液上清。Lpp'-OmpA'(Display of beta-lactamase on the Escherichia coli surface:outer membrane phenotypes conferredby Lpp'-OmpA'-beta-lactamase fusions)可将融合蛋白定位到外膜表面，少量可以渗漏到胞外。

胞外分泌使用的分子伴侣多数为促裂解蛋白或外膜蛋白，促裂解蛋白大量表达加速细菌裂解死亡，从而释放融合蛋白到胞外，但细胞密度难以积累。外膜蛋白定位到细胞外膜，大量表达会有部分分泌到胞外。尽管对大肠杆菌生长影响小，但分子量较大(多数在20KDa以上)，融合蛋白中目的蛋白占比低，造成产量偏低；且大分子量的分子伴侣由于序列更长，酶切分离目的基因时错切概率增加，会产生更多杂质；另外更长的序列也会形成更复杂的空间结构，容易与目的蛋白发生共价结合，封闭酶切位点，增加分离难度。

发明内容

本发明的首要目的在于克服现有技术的缺点与不足，提供Lpp或其突变体作为分子伴侣在大肠杆菌中分泌表达重组蛋白的应用。

本发明的另一目的在于提供一种用于大肠杆菌分泌表达的融合蛋白，所述融合蛋白由分子伴侣、连接肽、目的蛋白依次连接组成，所述分子伴侣为Lpp或其突变体。

本发明的再一目的在于提供一种大肠杆菌分泌表达融合蛋白的方法，该方法使用大肠杆菌Lpp蛋白或其突变体作为分子伴侣，在大肠杆菌中分泌表达外源蛋白。相比传统的全固相合成，步骤简单，成本更低，环保压力更小。相比目前国内常用的大肠杆菌胞内可溶表达和包涵体表达方式，本发明表达的融合蛋白可直接分泌到胞外培养基，下游纯化步骤少，产量高。相比诺和诺德酿酒酵母表达方式，本发明使用的大肠杆菌生长快，发酵周期短，生产成本更低。

本发明的目的通过下述技术方案实现：Lpp或其突变体作为分子伴侣在大肠杆菌中分泌表达重组蛋白的应用，是基于本发明发明人意外发现Lpp作为目的蛋白的分子伴侣，有利于包含分子伴侣和目的蛋白的重组蛋白的分泌表达，产量高，且对大肠杆菌菌体生长的影响小，无显著的菌体裂解情况，易于实现高密度发酵，便于工业化生产。

所述的Lpp为脂质蛋白，其氨基酸序列如下所示：

MKATKLVLGAVILGSTLLAGCSSNAKIDQLSSDVQTLNAKVDQLSNDVNAMRSDVQAAKDDAARANQRLDNMATKYRK。

所述的重组蛋白的结构如下：A-B-C；其中，

A为分子伴侣，主要作用是减少目的蛋白降解，协助目的蛋白转运到周质空间，进而分泌到胞外；选自Lpp或mLpp，m表示突变体；

B为缺失或用于蛋白酶识别的连接肽；缺失表示不存在，即重组蛋白的结构为A-C；连接肽的主要作用是提供蛋白酶识别位点，以便分子伴侣和目的基因的分离，优选DDDDK；

C为目的蛋白，优选长度为20～50个氨基酸的目的蛋白；更优选长度为27～31个氨基酸的目的蛋白。

一种用于大肠杆菌分泌表达的融合蛋白，是基于上述应用设计得到，其结构式如下：A-B-C；其中，

A为分子伴侣，选自Lpp或mLpp，m表示突变体；

B为缺失或用于蛋白酶识别的连接肽，优选为DDDDK；

C为目的蛋白，优选长度为20～50个氨基酸的目的蛋白；更优选长度为27～31个氨基酸的目的蛋白；包括但不限于GLP-1或其类似物、胰岛素类、蛋白酶类，优选为GLP-1或其类似物，包括但不限于GLP-1(7-37)、GLP-1(9-37)或GLP-1(11-37)。

一种大肠杆菌分泌表达融合蛋白的方法，包括以下步骤：

(1)获得编码上述用于大肠杆菌分泌表达的融合蛋白的融合基因，将上述融合基因构建到表达载体，得到重组载体；

(2)将重组载体转化宿主细胞；

(3)将含有重组载体的宿主细胞发酵、纯化，获得融合蛋白。

所述的大肠杆菌分泌表达融合蛋白的方法，还包括以下步骤：

(4)对得到的融合蛋白进行脂肪酸侧链修饰；

(5)蛋白酶酶切脂肪酸侧链修饰后的融合蛋白的连接肽，获得侧链修饰的融合蛋白；

(6)如有必要，对侧链修饰的融合蛋白进行转肽，连接另外一段多肽。

步骤(1)中所述的融合基因可通过直接合成法获得，或是通过片段拼接得到。

步骤(1)中所述的表达载体可选自大肠杆菌常用载体或将tac启动子替换pET载体中的T7启动子得到的载体。

所述的pET载体是pET系列表达载体；优选为pET-28a(+)载体。

步骤(2)中所述的宿主细胞为野生型或改造型大肠杆菌，如大肠杆菌BL21(DE3)或其改造菌、大肠杆菌W3110或其改造菌。

步骤(3)中所述的发酵优选为在发酵后期添加诱导剂，诱导表达。

所述的诱导剂优选为IPTG。

步骤(4)中所述的脂肪酸侧链修饰优选为使用利拉鲁肽或索玛鲁肽脂肪酸酰化剂进行修饰。

步骤(5)中所述的蛋白酶优选为肠激酶、胰蛋白酶和赖氨酰内切酶中的至少一种。

本发明相对于现有技术具有如下的优点及效果：

1、本发明使用商业化大肠杆菌作为宿主菌，生长快速，产量高，发酵密度高。重组蛋白的表达形式为分泌到胞外培养基，无需破碎细胞，直接纯化发酵液上清即可，纯度更高，工艺更简单。相比全固相合成，更加经济环保；相比大肠杆菌胞内可溶或包涵体表达，无需破碎细胞。对宿主菌要求低，直接使用商业化菌株即可，免去繁琐的菌种突变及筛选操作。

2、本发明使用Lpp作为分子伴侣，利用其高度可溶性和高转录表达，可以增加GLP-1及其类似物受体激动剂对蛋白酶的抵抗能力，从而增加产量；Lpp可以定位到周质空间，协助目的蛋白转运；Lpp等电点和GLP-1及其类似物相差较大，空间构象上与Lpp可以紧密结合；Lpp分子量小，GLP-1及其类似物受体激动剂占比高，进一步增加GLP-1及其类似物的产量，Lpp融合蛋白对大肠杆菌菌体生长的影响小，无显著的菌体裂解情况。Lpp内部碱性氨基酸少，可以使用常规的胰蛋白酶，赖氨酰内切酶，肠激酶等切割分离分子伴侣和目的蛋白，产生的杂质更少，便于纯化。重组蛋白为分泌性表达，对宿主菌体生长影响较小，易于实现高密度发酵，便于工业化生产。

附图说明

图1是pETFLAG-CTC-Lpp-GLP-1(7-37)质粒图谱图。

图2是Lpp-ARG34-GLP-l(7-37)融合蛋白的SDS-PAGE图；其中，泳道M为蛋白marker，至上而下的分子量(KDa)为40、25、15、10、4.6、1.7；泳道1为W3110/pETFLAG-CTC-Lpp-GLP-1诱导0h的发酵液上清；泳道2为W3110/pETFLAG-CTC-Lpp-GLP-1诱导0h的细胞破碎上清；泳道3为W3110/pETFLAG-CTC-Lpp-GLP-1诱导0h的细胞破碎沉淀；泳道4为W3110/pETFLAG-CTC-Lpp-GLP-1诱导72h的发酵液上清；泳道5为W3110/pETFLAG-CTC-Lpp-GLP-1诱导72h的细胞破碎上清；泳道6为W3110/pETFLAG-CTC-Lpp-GLP-1诱导72h的细胞破碎沉淀；泳道7为BL21(DE3)/pETFLAG-CTC-Lpp-GLP-1诱导72h的发酵液上清；泳道8是BL21(DE3)/pETFLAG-CTC-Lpp-GLP-1诱导72h的细胞破碎上清；泳道9是BL21(DE3)/pETFLAG-CTC-Lpp-GLP-1诱导72h的细胞破碎沉淀。

图3是利拉鲁肽质谱图。

图4是索玛鲁肽质谱图。

图5是检测Lpp信号肽-DDDDK-ARG34-GLP-l(7-37)融合蛋白的SDS-PAGE图；其中，泳道M为蛋白Marker，至上而下的分子量(KDa)为40、25、15、10、4.6、1.7；泳道1为BL21(DE3)/pETFLAG-CTC-Lpp信号肽-GLP-1诱导0h的发酵液上清；泳道2为BL21(DE3)/pETFLAG-CTC-Lpp信号肽-GLP-1诱导24h的发酵液上清；泳道3为BL21(DE3)/pETFLAG-CTC-Lpp信号肽-GLP-1诱导48h的发酵液上清；泳道4为BL21(DE3)/pETFLAG-CTC-Lpp信号肽-GLP-1诱导72h的发酵液上清；泳道5为BL21(DE3)/pETFLAG-CTC-Lpp信号肽-GLP-1诱导72h的细胞破碎上清；泳道6为BL21(DE3)/pETFLAG-CTC-Lpp信号肽-GLP-1诱导72h的细胞破碎沉淀。

图6是检测Lpp'-OmpA(46-66)-DDDDK-ARG34-GLP-1(11-37)和Lpp'-OmpA(46-159)-DDDDK-ARG34-GLP-1(11-37)的SDS-PAGE图；泳道1为W3110/pETFLAG-CTC-Lpp'-OmpA(46-66)-GLP-1诱导0h的发酵液上清；泳道2为W3110/pETFLAG-CTC-Lpp'-OmpA(46-66)-GLP-1诱导17h的发酵液上清；泳道3为W3110/pETFLAG-CTC-Lpp'-OmpA(46-66)-GLP-1诱导24h的发酵液上清；泳道4为W3110/pETFLAG-CTC-Lpp'-OmpA(46-66)-GLP-1诱导40h的发酵液上清；泳道5为W3110/pETFLAG-CTC-Lpp'-OmpA(46-66)-GLP-1诱导64h的发酵液上清；泳道6为W3110/pETFLAG-CTC-Lpp'-OmpA(46-66)-GLP-1诱导64h的细胞破碎上清；泳道M为蛋白Marker，至上而下的分子量(KDa)为40、25、15、10、4.6、1.7；泳道7为W3110/pETFLAG-CTC-Lpp'-OmpA(46-159)-GLP-1诱导0h的发酵液上清；泳道8为W3110/pETFLAG-CTC-Lpp'-OmpA(46-159)-GLP-1诱导17h的发酵液上清；泳道9为W3110/pETFLAG-CTC-Lpp'-OmpA(46-159)-GLP-1诱导24h的发酵液上清；泳道10为W3110/pETFLAG-CTC-Lpp'-OmpA(46-159)-GLP-1诱导40h的发酵液上清；泳道11为W3110/pETFLAG-CTC-Lpp'-OmpA(46-159)-GLP-1诱导64h的发酵液上清；泳道12为W3110/pETFLAG-CTC-Lpp'-OmpA(46-159)-GLP-1诱导64h的细胞破碎上清。

具体实施方式

下面结合实施例及附图对本发明作进一步详细的描述，但本发明的实施方式不限于此。

实施例1

技术服务公司合成基因序列，其翻译氨基酸序列具有如表1所示的以下特征：

表1

pET-28a(+)载体改造：PCR扩增pFLAG–CTC载体(Sigma)的tac启动子区域，引物两端加上BlpI和SphI酶切位点，BlpI和SphI双酶切PCR产物和pET-28a(+)载体，T4 DNA连接酶连接后化转大肠杆菌top10感受态细胞，PCR鉴定阳性克隆。提取质粒后获得启动子更换的pET-28a(+)载体，该载体命名为pETFLAG-CTC。

参照大肠杆菌密码子偏好性合成编码上述氨基酸序列的基因序列(如下所示，由技术服务公司合成)。以SEQ ID NO.4为例，引物两端加上BamHI和NdeI酶切位点，PCR扩增，BamHI和NdeI双酶切PCR产物和pETFLAG-CTC，T4 DNA连接酶连接后化转大肠杆菌top10感受态细胞，PCR鉴定阳性克隆，最后测序获得目的克隆。提取质粒后获得带有融合蛋白基因的pETFLAG-CTC载体，该重组表达载体命名为pETFLAG-CTC-Lpp-GLP-1(7-37)，质粒图谱如图1所示。含有如下其他基因序列的重组表达载体的构建如前所述。

编码Lpp-DDDDK-ARG₃₄-GLP-1(7-37)融合蛋白的核酸序列(SEQ ID NO.4)：

ATGAAAGCGACCAAACTGGTGCTGGGCGCGGTGATTCTGGGCAGCACCCTGCTGGCGGGCTGCAGCAGCAACGCGAAAATTGATCAGCTGAGCAGCGATGTGCAGACCCTGAACGCGAAAGTGGATCAGCTGAGCAACGATGTGAACGCGATGCGCAGCGATGTGCAGGCGGCGAAAGATGATGCGGCGCGCGCGAACCAGCGCCTGGATAACATGGCGACCAAATATCGCAAAGATGATGATGATAAACATGCGGAAGGCACCTTTACCAGCGATGTGAGCAGCTATCTGGAAGGCCAGGCGGCGAAAGAATTTATTGCGTGGCTGGTGCGCGGCCGCGGC；

编码Lpp-DDDDK-ARG₃₄-GLP-1(9-37)融合蛋白的核酸序列(SEQ ID NO.5)：

ATGAAAGCGACCAAACTGGTGCTGGGCGCGGTGATTCTGGGCAGCACCCTGCTGGCGGGCTGCAGCAGCAACGCGAAAATTGATCAGCTGAGCAGCGATGTGCAGACCCTGAACGCGAAAGTGGATCAGCTGAGCAACGATGTGAACGCGATGCGCAGCGATGTGCAGGCGGCGAAAGATGATGCGGCGCGCGCGAACCAGCGCCTGGATAACATGGCGACCAAATATCGCAAAGATGATGATGATAAAGAAGGCACCTTTACCAGCGATGTGAGCAGCTATCTGGAAGGCCAGGCGGCGAAAGAATTTATTGCGTGGCTGGTGCGCGGCCGCGGC；

编码Lpp-DDDDK-ARG₃₄-GLP-1(11-37)融合蛋白的核酸序列(SEQ ID NO.6)：

ATGAAAGCGACCAAACTGGTGCTGGGCGCGGTGATTCTGGGCAGCACCCTGCTGGCGGGCTGCAGCAGCAACGCGAAAATTGATCAGCTGAGCAGCGATGTGCAGACCCTGAACGCGAAAGTGGATCAGCTGAGCAACGATGTGAACGCGATGCGCAGCGATGTGCAGGCGGCGAAAGATGATGCGGCGCGCGCGAACCAGCGCCTGGATAACATGGCGACCAAATATCGCAAAGATGATGATGATAAAACCTTTACCAGCGATGTGAGCAGCTATCTGGAAGGCCAGGCGGCGAAAGAATTTATTGCGTGGCTGGTGCGCGGCCGCGGC。

实施例2大肠杆菌转化及筛选

将实施例1得到的重组表达载体转化到大肠杆菌复制扩增，具体过程为：按照氯化钙法(参照《分子克隆实验指南》第三版)制备大肠杆菌top10感受态，取1μL重组表达载体加入到top10感受态中，冰浴30min，42℃热激90s，冰浴5min，加入1ml液体SOC培养基(2％w/v胰蛋白胨、0.5％w/v酵母提取物、0.05％w/v NaCl、2.5mM KCl、10mM MgCl₂、20mM葡萄糖)，在37℃摇床中振荡培养1h后涂布到LB固体培养基(含有50mg/L卡那霉素kan)，37℃培养箱培养过夜，直至出现肉眼可见菌落。挑菌到LB液体培养基(蛋白胨10g/L，酵母提取物5g/L，氯化钠5g/L，pH7.0～7.5，含有50mg/L卡那霉素kan)，37℃摇床中振荡培养至OD₆₀₀＝1-3，使用omega质粒提取试剂盒，按照说明书提取质粒。

按照相同的方法制备大肠杆菌BL21(DE3)和W3110化转感受态，转入重组表达载体。涂布到LB固体培养基(含有50mg/L kan)，37℃培养箱培养过夜，直至出现肉眼可见菌落，得到的工程菌命名为BL21(DE3)/pETFLAG-CTC-Lpp-GLP-1(X)和W3110/pETFLAG-CTC-Lpp-GLP-1(X)，X表示分别含有如SEQ ID NO.4～6序列的三种重组表达载体。挑菌到LB液体培养基(蛋白胨10g/L，酵母提取物5g/L，氯化钠5g/L，pH7.0～7.5，含有50mg/L kan)，37℃摇床中振荡培养至OD₆₀₀＝1-3，加入甘油至终浓度15％v/v，保存于-70℃冰箱。

实施例3、大肠杆菌发酵及纯化

实施例2保存的菌种制备种子培养物和20L发酵罐发酵工艺：

①制备种子培养物

取20μL在-70℃冷冻保存的菌种BL21(DE3)/pETFLAG-CTC-Lpp-GLP-1(X)和W3110/pETFLAG-CTC-Lpp-GLP-1(X)，分别接种至50mL添加了卡那霉素(Kanamycin，终浓度为50μg/mL)的LB液体培养基，在28℃，250rpm的摇床中培养16小时，从而活化菌种。再将50mL活化过的菌种接种到400mL添加了50μg/mL卡那霉素的LB液体培养基中，在28℃、250rpm的条件下继续培养3h，获得种子培养物，控制它的菌体浓度OD600在0.8～1.2之间。

②20L发酵罐中的发酵培养

使用20L搅拌式发酵罐(南京华龙公司)，按照发酵培养基配方进行投料，投料体积为8L。严格控制发酵条件：温度控制在28℃～32℃之间，pH控制在6.5～7.0之间，发酵转速控制在150rpm～700rpm(根据DO的变化调控)之间，空气流速控制在200L/h～1600L/h之间(根据DO的变化调控)，溶解氧(DO)控制在5～50％的最大氧饱和度之间。培养至碳源耗尽时开始补料，采用匀速补料(补料速率控制在0.6mL·min^-1·L^-1)，补料的用量为4L。当培养至菌体浓度OD600≈30时，开始添加IPTG至终浓度0.3mM，开始诱导，诱导时间为72h。发酵培养基的配方如下：每升含有酵母粉2～5g、蛋白胨3～8g、氯化钠1～2g、磷酸二氢钾2～5g、磷酸氢二钠2～5g、二水合氯化钙0.01～0.02g、硫酸镁1～2g、甘油4～7g、硫酸铵5～7g、微量元素0.875mL；用水定容至1L，pH6.5～7.0；微量元素的组成如下：每升含有四水合氯化亚铁20～30g、氯化锌1～3g、六水合氯化钴2～4g、二水合钼酸钠2～4g、二水合氯化钙1～2g、二水合氯化铜1～2g、硼酸0.4～0.6g、一水合硫酸锰2～3g、浓度为质量百分比37％的浓盐酸10mL，用水定容至1L。补料培养基每L含有500g甘油、25g酵母粉、40g蛋白胨，水定容至1L。

取W3110/pETFLAG-CTC-Lpp-GLP-1(7-37)和BL21(DE3)/pETFLAG-CTC-Lpp-GLP-1(7-37)发酵液上清稀释5倍后进行SDS-PAGE电泳，电泳结果见图2，其中泳道4的融合蛋白浓度为300mg/L，对应的发酵液上清融合蛋白浓度为1.5g/L，根据目的蛋白在融合蛋白中的占比可计算出目的蛋白ARG34-GLP-l(7-37)浓度为0.49g/L；泳道7的融合蛋白浓度为250mg/L，对应的发酵液上清融合蛋白浓度为1.25g/L，根据目的蛋白在融合蛋白中的占比可计算出目的蛋白ARG34-GLP-l(7-37)浓度为0.41g/L。从图2可知，Lpp作为分子伴侣融合目的蛋白得到的重组蛋白多数分泌到胞外培养基。发酵液离心后收集上清，使用离子交换层析纯化。纯化方法参考诺和诺德专利US6444788B1实施例1。根据在线网站(https://web.expasy.org/compute_pi/)计算等电点，成熟的Lpp-GLP-l融合蛋白具有和ARG34-GLP-l(7-37)接近的等电点，分别为4.98和5.53。

同样，对于W3110/pETFLAG-CTC-Lpp-GLP-1(9-37)、BL21(DE3)/pETFLAG-CTC-Lpp-GLP-1(9-37)、W3110/pETFLAG-CTC-Lpp-GLP-1(11-37)、BL21(DE3)/pETFLAG-CTC-Lpp-GLP-1(11-37)的发酵上清进行检测和纯化，目的蛋白ARG34-GLP-l(9-37)和ARG34-GLP-l(11-37)亦为分泌性表达，可以得到目的蛋白ARG34-GLP-l(9-37)浓度为0.40g/L，目的蛋白ARG34-GLP-l(11-37)浓度为0.38g/L。可见，Lpp作为分子伴侣有利于重组蛋白进行分泌性表达。

实施例4、脂肪酸酰化剂合成及修饰

利拉鲁肽脂肪酸酰化剂合成参照专利CN97198413.1中例35，索玛鲁肽脂肪酸酰化剂合成参照专利CN201510459093.9实施例6。

利拉鲁肽脂肪酸酰化剂修饰实施例3获得的ARG₃₄-GLP-1(7-37)融合蛋白参照专利CN97198413.1中例37，得到赖氨酸侧链酰化修饰的ARG₃₄-GLP-1(7-37)融合蛋白。

索玛鲁肽脂肪酸酰化剂修饰实施3获得的ARG₃₄-GLP-1(9-37)融合蛋白参照专利CN201510459093.9实施例9，得到赖氨酸侧链酰化修饰的ARG₃₄-GLP-1(9-37)融合蛋白。

实施例5、修饰后融合蛋白酶切工艺及纯化

将实施例4中获得的经脂肪酸酰化剂修饰的融合蛋白收集液稀释后，用重组赖氨酰内切酶(购自wako日本和光纯药株式会社)进行酶切(按照说明书操作)，25℃反应2h后调酸终止反应，经酶切即可得到利拉鲁肽单体，索玛鲁肽前体ARG34-GLP-1(9-37)。

将100mL含利拉鲁肽单体的酶切样品，含索玛鲁肽前体ARG34-GLP-1(9-37)的酶切样品上样到装有20mL Uni ps30-500填料(购自苏州纳微科技有限公司)的层析柱上(其预先用缓冲液1平衡，配方为含0.1％v/v TFA的20％v/v异丙醇的水溶液，上样结束后用平衡缓冲液2(含0.1％v/v TFA的20％v/v异丙醇的水溶液)冲洗至基线平稳。再以100ml的20～80％异丙醇线性梯度(含0.1％v/v TFA缓冲液)洗脱，收集洗脱峰，用等电点法调沉，冷冻干燥即得到利拉鲁肽成品，索玛鲁肽前体ARG₃₄-GLP-1(9-37)。

实施例6保护二肽合成

Boc-His(Boc)-Aib-OH合成按照专利CN201510459093.9实施例26的方法合成。

实施例7转肽连接获得索玛鲁肽

实施例5获得的侧链修饰的索玛鲁肽前体ARG34-GLP-1(9-37)与实施例6获得的保护二肽转肽连接方法和纯化方法参照专利CN201510459093.9实施例10，制备得到索玛鲁肽成品。

实施例8利拉鲁肽，索玛鲁肽成品的鉴定

以利拉鲁肽注射液(购自丹麦诺和诺德公司)为对照品，用超高效液相色谱进行分析，发现本发明的利拉鲁肽成品与诺和诺德公司生产的利拉鲁肽对照品出峰时间一致。经赛默飞高分辨液质联用仪取主峰进行高分辨质谱分析，使用Thermo Biopharma Finder2.0解卷积，测得单同位素分子量为3748.9，质谱分析结果与利拉鲁肽对照一致，质谱图见图3。

以索玛鲁肽注射液(购自丹麦诺和诺德公司)为对照品，用超高效液相色谱进行分析，发现本发明的索玛鲁肽成品与诺和诺德公司生产的索玛鲁肽对照品出峰时间一致。经赛默飞高分辨液质联用仪取主峰进行高分辨质谱分析，使用Thermo Biopharma Finder2.0解卷积，测得单同位素分子量为4111.1，质谱分析结果与索玛鲁肽对照一致，质谱图见图4。

对比例1

使用Lpp信号肽或是Lpp'-OmpA(46-66)、Lpp'-OmpA(46-159)作为分子伴侣，目的蛋白为ARG34-GLP-l(7-37)，连接肽为DDDDK，参照大肠杆菌密码子偏好性合成如下序列：

Lpp信号肽-DDDDK-ARG34-GLP-l(7-37)融合蛋白的氨基酸序列如下：

编码Lpp信号肽-DDDDK-ARG34-GLP-l(7-37)融合蛋白的核酸序列如下：

ATGAAAGCGACCAAACTGGTGCTGGGCGCGGTGATTCTGGGCAGCACCCTGCTGGCGGGCGATGATGATGATAAACATGCGGAAGGCACCTTTACCAGCGATGTGAGCAGCTATCTGGAAGGCCAGGCGGCGAAAGAATTTATTGCGTGGCTGGTGCGCGGCCGCGGC。

Lpp'-OmpA(46-66)-DDDDK-ARG34-GLP-1(11-37)(Lpp信号肽+Lpp蛋白1-9氨基酸+OmpA蛋白的第46-66位氨基酸)融合蛋白的氨基酸序列如下：

其中，Lpp信号肽为第1～20位，Lpp蛋白1-9氨基酸为第21～29位，连接Lpp’和OmpA的连接肽为第30～31位。

编码Lpp'-OmpA(46-66)-DDDDK-ARG34-GLP-1(11-37)融合蛋白的核酸序列如下：

ATGAAAGCGACCAAACTGGTGCTGGGCGCGGTGATTCTGGGCAGCACCCTGCTGGCGGGCTGCAGCAGCAACGCGAAAATTGATCAGGGCATTAACCCGTATGTGGGCTTTGAAATGGGCTATGATTGGCTGGGCCGCATGCCGTATAAAGGCAGCGATGATGATGATAAAACCTTTACCAGCGATGTGAGCAGCTATCTGGAAGGCCAGGCGGCGAAAGAATTTATTGCGTGGCTGGTGCGCGGCCGCGGC。

Lpp'-OmpA(46-159)-DDDDK-ARG34-GLP-1(11-37)(Lpp信号肽+Lpp蛋白1-9氨基酸+OmpA蛋白的第46-159位氨基酸)融合蛋白的序列如下：

编码Lpp'-OmpA(46-159)-DDDDK-ARG34-GLP-1(11-37)融合蛋白的核酸序列如下：

ATGAAAGCGACCAAACTGGTGCTGGGCGCGGTGATTCTGGGCAGCACCCTGCTGGCGGGCTGCAGCAGCAACGCGAAAATTGATCAGGGCATTAACCCGTATGTGGGCTTTGAAATGGGCTATGATTGGCTGGGCCGCATGCCGTATAAAGGCAGCGTGGAAAACGGCGCGTATAAAGCGCAGGGCGTGCAGCTGACCGCGAAACTGGGCTATCCGATTACCGATGATCTGGATATTTATACCCGCCTGGGCGGCATGGTGTGGCGCGCGGATACCAAAAGCAACGTGTATGGCAAAAACCATGATACCGGCGTGAGCCCGGTGTTTGCGGGCGGCGTGGAATATGCGATTACCCCGGAAATTGCGACCCGCCTGGAATATCAGTGGACCAACAACATTGGCGATGCGCATACCATTGGCACCCGCCCGGATAACGATGATGATGATAAAACCTTTACCAGCGATGTGAGCAGCTATCTGGAAGGCCAGGCGGCGAAAGAATTTATTGCGTGGCTGGTGCGCGGCCGCGGC。

依据实施例1的步骤得到重组表达载体，依据实施例2得到表达菌种BL21(DE3)/pETFLAG-CTC-Lpp信号肽-GLP-1、W3110/pETFLAG-CTC-Lpp'-OmpA(46-66)-GLP-1、W3110/pETFLAG-CTC-Lpp'-OmpA(46-159)-GLP-1，依据实施例3进行表达，结果如图5和图6所示：图5的结果表明Lpp信号肽无法表达GLP-1；图6的结果表明Lpp信号肽+部分Lpp蛋白+OmpA部分蛋白作为分子伴侣无法表达GLP-1。

上述实施例为本发明较佳的实施方式，但本发明的实施方式并不受上述实施例的限制，其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化，均应为等效的置换方式，都包含在本发明的保护范围之内。

序列表

<110> 珠海联邦制药股份有限公司

<120> Lpp或其突变体作为分子伴侣在大肠杆菌中分泌表达重组蛋白的应用

<160> 13

<170> SIPOSequenceListing 1.0

<210> 1

<211> 114

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> Lpp – DDDDK-ARG34-GLP-l(7-37)融合蛋白

<400> 1

Met Lys Ala Thr Lys Leu Val Leu Gly Ala Val Ile Leu Gly Ser Thr

1 5 10 15

Leu Leu Ala Gly Cys Ser Ser Asn Ala Lys Ile Asp Gln Leu Ser Ser

20 25 30

Asp Val Gln Thr Leu Asn Ala Lys Val Asp Gln Leu Ser Asn Asp Val

35 40 45

Asn Ala Met Arg Ser Asp Val Gln Ala Ala Lys Asp Asp Ala Ala Arg

50 55 60

Ala Asn Gln Arg Leu Asp Asn Met Ala Thr Lys Tyr Arg Lys Asp Asp

65 70 75 80

Asp Asp Lys His Ala Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr

85 90 95

Leu Glu Gly Gln Ala Ala Lys Glu Phe Ile Ala Trp Leu Val Arg Gly

100 105 110

Arg Gly

<210> 2

<211> 112

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> Lpp – DDDDK-ARG34-GLP-l(9-37)融合蛋白

<400> 2

Met Lys Ala Thr Lys Leu Val Leu Gly Ala Val Ile Leu Gly Ser Thr

1 5 10 15

Leu Leu Ala Gly Cys Ser Ser Asn Ala Lys Ile Asp Gln Leu Ser Ser

20 25 30

Asp Val Gln Thr Leu Asn Ala Lys Val Asp Gln Leu Ser Asn Asp Val

35 40 45

Asn Ala Met Arg Ser Asp Val Gln Ala Ala Lys Asp Asp Ala Ala Arg

50 55 60

Ala Asn Gln Arg Leu Asp Asn Met Ala Thr Lys Tyr Arg Lys Asp Asp

65 70 75 80

Asp Asp Lys Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu

85 90 95

Gly Gln Ala Ala Lys Glu Phe Ile Ala Trp Leu Val Arg Gly Arg Gly

100 105 110

<210> 3

<211> 110

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> Lpp – DDDDK-ARG34-GLP-l(11-37)融合蛋白

<400> 3

Met Lys Ala Thr Lys Leu Val Leu Gly Ala Val Ile Leu Gly Ser Thr

1 5 10 15

Leu Leu Ala Gly Cys Ser Ser Asn Ala Lys Ile Asp Gln Leu Ser Ser

20 25 30

Asp Val Gln Thr Leu Asn Ala Lys Val Asp Gln Leu Ser Asn Asp Val

35 40 45

Asn Ala Met Arg Ser Asp Val Gln Ala Ala Lys Asp Asp Ala Ala Arg

50 55 60

Ala Asn Gln Arg Leu Asp Asn Met Ala Thr Lys Tyr Arg Lys Asp Asp

65 70 75 80

Asp Asp Lys Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly Gln

85 90 95

Ala Ala Lys Glu Phe Ile Ala Trp Leu Val Arg Gly Arg Gly

100 105 110

<210> 4

<211> 342

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 编码Lpp- DDDDK-ARG34-GLP-1（7-37）融合蛋白的核酸序列

<400> 4

atgaaagcga ccaaactggt gctgggcgcg gtgattctgg gcagcaccct gctggcgggc 60

tgcagcagca acgcgaaaat tgatcagctg agcagcgatg tgcagaccct gaacgcgaaa 120

gtggatcagc tgagcaacga tgtgaacgcg atgcgcagcg atgtgcaggc ggcgaaagat 180

gatgcggcgc gcgcgaacca gcgcctggat aacatggcga ccaaatatcg caaagatgat 240

gatgataaac atgcggaagg cacctttacc agcgatgtga gcagctatct ggaaggccag 300

gcggcgaaag aatttattgc gtggctggtg cgcggccgcg gc 342

<210> 5

<211> 336

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 编码Lpp- DDDDK- ARG34-GLP-1（9-37）融合蛋白的核酸序列

<400> 5

atgaaagcga ccaaactggt gctgggcgcg gtgattctgg gcagcaccct gctggcgggc 60

tgcagcagca acgcgaaaat tgatcagctg agcagcgatg tgcagaccct gaacgcgaaa 120

gtggatcagc tgagcaacga tgtgaacgcg atgcgcagcg atgtgcaggc ggcgaaagat 180

gatgcggcgc gcgcgaacca gcgcctggat aacatggcga ccaaatatcg caaagatgat 240

gatgataaag aaggcacctt taccagcgat gtgagcagct atctggaagg ccaggcggcg 300

aaagaattta ttgcgtggct ggtgcgcggc cgcggc 336

<210> 6

<211> 330

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 编码Lpp- DDDDK- ARG34-GLP-1（11-37）融合蛋白的核酸序列

<400> 6

atgaaagcga ccaaactggt gctgggcgcg gtgattctgg gcagcaccct gctggcgggc 60

tgcagcagca acgcgaaaat tgatcagctg agcagcgatg tgcagaccct gaacgcgaaa 120

gtggatcagc tgagcaacga tgtgaacgcg atgcgcagcg atgtgcaggc ggcgaaagat 180

gatgcggcgc gcgcgaacca gcgcctggat aacatggcga ccaaatatcg caaagatgat 240

gatgataaaa cctttaccag cgatgtgagc agctatctgg aaggccaggc ggcgaaagaa 300

tttattgcgt ggctggtgcg cggccgcggc 330

<210> 7

<211> 78

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> Lpp的氨基酸序列

<400> 7

Met Lys Ala Thr Lys Leu Val Leu Gly Ala Val Ile Leu Gly Ser Thr

1 5 10 15

Leu Leu Ala Gly Cys Ser Ser Asn Ala Lys Ile Asp Gln Leu Ser Ser

20 25 30

Asp Val Gln Thr Leu Asn Ala Lys Val Asp Gln Leu Ser Asn Asp Val

35 40 45

Asn Ala Met Arg Ser Asp Val Gln Ala Ala Lys Asp Asp Ala Ala Arg

50 55 60

Ala Asn Gln Arg Leu Asp Asn Met Ala Thr Lys Tyr Arg Lys

65 70 75

<210> 8

<211> 56

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> Lpp信号肽- DDDDK- ARG34-GLP-l(7-37)融合蛋白

<400> 8

Met Lys Ala Thr Lys Leu Val Leu Gly Ala Val Ile Leu Gly Ser Thr

1 5 10 15

Leu Leu Ala Gly Asp Asp Asp Asp Lys His Ala Glu Gly Thr Phe Thr

20 25 30

Ser Asp Val Ser Ser Tyr Leu Glu Gly Gln Ala Ala Lys Glu Phe Ile

35 40 45

Ala Trp Leu Val Arg Gly Arg Gly

50 55

<210> 9

<211> 168

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 编码Lpp信号肽- DDDDK- ARG34-GLP-l(7-37)融合蛋白的核酸序列

<400> 9

atgaaagcga ccaaactggt gctgggcgcg gtgattctgg gcagcaccct gctggcgggc 60

gatgatgatg ataaacatgc ggaaggcacc tttaccagcg atgtgagcag ctatctggaa 120

ggccaggcgg cgaaagaatt tattgcgtgg ctggtgcgcg gccgcggc 168

<210> 10

<211> 84

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> Lpp'-OmpA(46-66)- DDDDK-ARG34-GLP-1(11-37)融合蛋白

<400> 10

Met Lys Ala Thr Lys Leu Val Leu Gly Ala Val Ile Leu Gly Ser Thr

1 5 10 15

Leu Leu Ala Gly Cys Ser Ser Asn Ala Lys Ile Asp Gln Gly Ile Asn

20 25 30

Pro Tyr Val Gly Phe Glu Met Gly Tyr Asp Trp Leu Gly Arg Met Pro

35 40 45

Tyr Lys Gly Ser Asp Asp Asp Asp Lys Thr Phe Thr Ser Asp Val Ser

50 55 60

Ser Tyr Leu Glu Gly Gln Ala Ala Lys Glu Phe Ile Ala Trp Leu Val

65 70 75 80

Arg Gly Arg Gly

<210> 11

<211> 252

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 编码Lpp'-OmpA(46-66)- DDDDK-ARG34-GLP-1(11-37)融合蛋白的核酸序列

<400> 11

atgaaagcga ccaaactggt gctgggcgcg gtgattctgg gcagcaccct gctggcgggc 60

tgcagcagca acgcgaaaat tgatcagggc attaacccgt atgtgggctt tgaaatgggc 120

tatgattggc tgggccgcat gccgtataaa ggcagcgatg atgatgataa aacctttacc 180

agcgatgtga gcagctatct ggaaggccag gcggcgaaag aatttattgc gtggctggtg 240

cgcggccgcg gc 252

<210> 12

<211> 177

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> Lpp'-OmpA(46-159)- DDDDK-ARG34-GLP-1(11-37)融合蛋白

<400> 12

Met Lys Ala Thr Lys Leu Val Leu Gly Ala Val Ile Leu Gly Ser Thr

1 5 10 15

Leu Leu Ala Gly Cys Ser Ser Asn Ala Lys Ile Asp Gln Gly Ile Asn

20 25 30

Pro Tyr Val Gly Phe Glu Met Gly Tyr Asp Trp Leu Gly Arg Met Pro

35 40 45

Tyr Lys Gly Ser Val Glu Asn Gly Ala Tyr Lys Ala Gln Gly Val Gln

50 55 60

Leu Thr Ala Lys Leu Gly Tyr Pro Ile Thr Asp Asp Leu Asp Ile Tyr

65 70 75 80

Thr Arg Leu Gly Gly Met Val Trp Arg Ala Asp Thr Lys Ser Asn Val

85 90 95

Tyr Gly Lys Asn His Asp Thr Gly Val Ser Pro Val Phe Ala Gly Gly

100 105 110

Val Glu Tyr Ala Ile Thr Pro Glu Ile Ala Thr Arg Leu Glu Tyr Gln

115 120 125

Trp Thr Asn Asn Ile Gly Asp Ala His Thr Ile Gly Thr Arg Pro Asp

130 135 140

Asn Asp Asp Asp Asp Lys Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu

145 150 155 160

Glu Gly Gln Ala Ala Lys Glu Phe Ile Ala Trp Leu Val Arg Gly Arg

165 170 175

Gly

<210> 13

<211> 531

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 编码Lpp'-OmpA(46-159)- DDDDK-ARG34-GLP-1(11-37) 融合蛋白的核酸序列

<400> 13

atgaaagcga ccaaactggt gctgggcgcg gtgattctgg gcagcaccct gctggcgggc 60

tgcagcagca acgcgaaaat tgatcagggc attaacccgt atgtgggctt tgaaatgggc 120

tatgattggc tgggccgcat gccgtataaa ggcagcgtgg aaaacggcgc gtataaagcg 180

cagggcgtgc agctgaccgc gaaactgggc tatccgatta ccgatgatct ggatatttat 240

acccgcctgg gcggcatggt gtggcgcgcg gataccaaaa gcaacgtgta tggcaaaaac 300

catgataccg gcgtgagccc ggtgtttgcg ggcggcgtgg aatatgcgat taccccggaa 360

attgcgaccc gcctggaata tcagtggacc aacaacattg gcgatgcgca taccattggc 420

acccgcccgg ataacgatga tgatgataaa acctttacca gcgatgtgag cagctatctg 480

gaaggccagg cggcgaaaga atttattgcg tggctggtgc gcggccgcgg c 531

Claims

1.Lpp作为分子伴侣在大肠杆菌中分泌表达重组蛋白的应用，其特征在于：

所述的重组蛋白的结构如下： A-B-C；其中，

A为分子伴侣，选自Lpp；

B为用于蛋白酶识别的连接肽DDDDK；

C为目的蛋白；

所述的Lpp的氨基酸序列如下所示：

MKATKLVLGAVILGSTLLAGCSSNAKIDQLSSDVQTLNAKVDQLSNDVNAMRSDVQAAKDDAARANQRLDNMATKYRK；

所述的重组蛋白的氨基酸序列如SEQ ID NO.1、SEQ ID NO.2或SEQ ID NO.3所示。

2.一种用于大肠杆菌分泌表达的融合蛋白，其特征在于：是基于权利要求1所述的应用设计得到；所述的融合蛋白的结构式如下：A-B-C；其中，

A为分子伴侣，选自Lpp；

B为用于蛋白酶识别的连接肽DDDDK；

C为目的蛋白；

所述的Lpp的氨基酸序列如下所示：

3.一种大肠杆菌分泌表达融合蛋白的方法，其特征在于包括以下步骤：

（1）获得编码权利要求2所述用于大肠杆菌分泌表达的融合蛋白的融合基因，将融合基因构建到表达载体，得到重组载体；

（2）将重组载体转化宿主细胞；

（3）将含有重组载体的宿主细胞发酵、纯化，获得融合蛋白。

4.根据权利要求3所述的大肠杆菌分泌表达融合蛋白的方法，其特征在于还包括以下步骤：

（4）对得到的融合蛋白进行脂肪酸侧链修饰；

（5）蛋白酶酶切脂肪酸侧链修饰后的融合蛋白的连接肽，获得侧链修饰的融合蛋白；

（6）如有必要，对侧链修饰的融合蛋白进行转肽，连接另外一段多肽。

5.根据权利要求3或4所述的大肠杆菌分泌表达融合蛋白的方法，其特征在于：

步骤（1）中所述的融合基因通过直接合成法获得，或是通过片段拼接得到；

步骤（1）中所述的表达载体选自大肠杆菌常用载体或将tac启动子替换pET载体中的T7启动子得到的载体；

步骤（2）中所述的宿主细胞为野生型或改造型大肠杆菌；

步骤（3）中所述的发酵是在发酵后期添加诱导剂，诱导表达。

6.根据权利要求5所述的大肠杆菌分泌表达融合蛋白的方法，其特征在于：

所述的pET载体为pET-28a(+)载体；

所述的宿主细胞为大肠杆菌BL21(DE3)或其改造菌、大肠杆菌W3110或其改造菌；

所述的诱导剂为IPTG。

7.根据权利要求4所述的大肠杆菌分泌表达融合蛋白的方法，其特征在于：

步骤（4）中所述的脂肪酸侧链修饰为使用利拉鲁肽或索玛鲁肽脂肪酸酰化剂进行修饰；

步骤（5）中所述的蛋白酶为肠激酶、胰蛋白酶和赖氨酰内切酶中的至少一种。