WO2016161983A1

WO2016161983A1 - 一种融合载体蛋白及其在促进目的蛋白或多肽表达中的应用

Info

Publication number: WO2016161983A1
Application number: PCT/CN2016/078938
Authority: WO
Inventors: 王楠
Original assignee: 中国医学科学院药物研究所
Priority date: 2015-04-10
Filing date: 2016-04-11
Publication date: 2016-10-13

Abstract

公开了一种作为包涵体标签的融合载体蛋白，所述的融合载体蛋白的氨基酸序列来源于胰岛素。还公开了编码该融合载体蛋白的核酸分子、含有该核酸分子的表达载体和宿主细胞、以及其在促进异源性蛋白或多肽表达中的应用。

Description

一种融合载体蛋白及其在促进目的蛋白或多肽表达中的应用

技术领域

本发明属于生物工程领域，具体涉及一种新型的融合载体蛋白，及编码该融合载体蛋白的核酸分子、含有该核酸分子的表达载体和宿主细胞，以及它们在促进异源性蛋白或多肽表达中的应用；本发明还涉及含有该融合载体蛋白的融合蛋白，及编码该融合蛋白的核酸分子、含有该核酸分子的表达载体和宿主细胞。

背景技术

基因重组技术将目的基因克隆至表达载体，并在宿主细胞中表达目的蛋白或多肽。这是目前生产异源性蛋白或多肽最为常用的方法。已有多种重组蛋白表达系统，成功应用于原核细胞、酵母细胞、植物细胞、昆虫细胞、哺乳动物细胞等不同宿主；每种表达系统各有其相应的优势和局限性。大肠杆菌原核表达系统因其遗传背景清楚、技术成熟、生产高效、操作简单等优势，成为蛋白重组技术中发展最早及目前应用最为广泛的经典表达系统。

异源性蛋白或多肽的重组表达效率受到很多因素的影响。常见因素有：构建表达载体时表达元件的组成(Kim KJ，Kim HE，Lee KH，et al.Two-promoter vector is highly efficient for overproduction of protein complexes.Protein Sci.2004；13：1698-703)、目的基因mRNA的稳定性(Tanaka M，Tokuoka M，Shintani T，et al.Transcripts of a heterologous gene encoding mite allergen Der f 7 are stabilized by codon optimization in Aspergillus oryzae.Appl Microbiol Biotechnol.2012；96：1275-82)、宿主细胞稀有密码子的偏爱性(Kane JF.Effects of rare codon clusters on high-level expression of heterologous proteins in Escherichia coli.Curr Opin Biotechnol.1995；6：494-500)、重组蛋白或多肽稳定性(Gottesman S，Zipser D.Deg phenotype of Escherichia coli lon mutants.J Bacteriol.1978；133：844-51)、重组蛋白细胞毒性(

M，

J，

G，et al.High-yield expression in Escherichia coli，purification and application of budding yeast K2 killer protein.Mol Biotechnol.2014；56：644-52)、蛋白表达定位(Choi JH，Lee SY.Secretory and extracellular production of recombinant proteins using Escherichia coli.Appl Microbiol Biotechnol.2004；64：625-35)、宿主细胞培养条件(País-Chanfrau JM，García Y，Licor L，et al.Improving the expression of mini-proinsulin in Pichia pastoris.Biotechnol Lett.2004；26：1269-72)等。为了提高重组蛋白或多肽的表达水平，可以采取一些表达策略，如通过替换稀有密码子或改造宿主细胞等方式进行密码子优化(Lakey DL，Voladri RK，Edwards KM，et al.Enhanced production of recombinant Mycobacterium tuberculosis antigens in Escherichia coli by replacement of low-usage codons.Infect Immun.2000；68：233-8；Brinkmann U，Mattes RE，Buckel P.High-level expression of recombinant genes in Escherichia coli is dependent on the availability of the dnaY gene product.Gene，1989；85：109-14)、优化mRNA二级结构(Punginelli C，Ize B，Stanley NR，et al.mRNA secondary structure modulates translation of Tat-dependent formate dehydrogenase N.J Bacteriol，2004；186：6311-5)、选用蛋白酶缺失的宿主细胞以增强重组蛋白稳定性(Gottesman S，Zipser D.Deg phenotype of Escherichia coli lon mutants.J Bacteriol.1978；133：844-51)、蛋白融合技术(LaVallie ER，Lu Z，Diblasio-Smith EA，et al.Thioredoxin as a fusion partner for production of soluble recombinant proteins in Escherichia coli.Methods Enzymol.2000；326：322-40)等。

蛋白融合技术，是将一种融合载体蛋白或多肽标签与目的蛋白或多肽通过基因融合，使目的蛋白在宿主细胞中以融合蛋白形式表达；融合表达可以提高目的蛋白或多肽的表达水平，改善目的蛋白的理化特征，或为目的蛋白或多肽附加特殊标记以利于后续的纯化或检测，其应用非常广泛。通过酶切或化学裂解等方法，可以特异性切割以移除融合载体蛋白或融合标签，经进一步分离纯化从而得到目的蛋白或多肽。

常用的促进表达的融合载体蛋白主要分为四类：(1)促可溶性表达的融合载体蛋白，如硫氧还蛋白(Levarski Z，

A，Krahulec J，et al.High-level expression and purification of recombinant human growth hormone produced in soluble form in Escherichia coli.Protein Expr Purif.2014；100：40-7)、SUMO(Malakhov MP，Mattern MR，Malakhova OA，et al.SUMO fusions and SUMO-specific protease for efficient expression and purification of proteins.J Struct Funct Genomics.2004；5：75-86)、谷胱甘肽转移酶(Jung JG，Lee YJ，Velmurugan N，et al.High-yield production of the VP1 structural protein epitope from serotype O foot-and-mouth disease virus in Escherichia coli.J Ind Microbiol Biotechnol.2013；40：705-13)、麦芽糖结合蛋白(Vu TT，Jeong B，Yu J，et al.Soluble prokaryotic expression and purification of crotamine using an N-terminal maltose-binding protein tag.Toxicon.2014；92：157-65)等。此类融合载体蛋白水溶性很好，可以有效阻止目的蛋白或多肽折叠中间体发生聚集，从而有利于其形成正确的空间结构，对于含有二硫键的蛋白或多肽，此类融合载体蛋白也可能会发挥很好的作用，如硫氧还原蛋白等(Lauber T，Marx UC，Schulz A，et al.Accurate disulfide formation in Escherichia coli：overexpression and characterization of the first domain(HF6478)of the multiple Kazal-type inhibitor LEKTI.Protein Expr Purif.2001；22：108-12)。(2)促包涵体表达的融合载体蛋白，如ThiS(Yuan S，Xu J，Ge Y，Yan Z，et al.Prokaryotic ubiquitin-like ThiS fusion enhances the heterologous protein overexpression and aggregation in Escherichia coli.PLoS One.2013；8：e62529)、MoaD(Yuan S，Wang X，Xu J，et al.Ubiquitin-like prokaryotic MoaD as a fusion tag for expression of heterologous proteins in Escherichia coli.BMC Biotechnol.2014；14：5)、PurF片段(Lee JH，Kim JH，Hwang SW，et al.High-level expression of antimicrobial peptide mediated by a fusion partner reinforcing formation of inclusion bodies.Biochem Biophys Res Commun.2000；277：575-80)等。与可溶性表达相比，包涵体表达具有产量高、稳定性强、易于分离纯化等优势，而且减轻了目的蛋白或多肽对宿主细胞的毒性作用，但是包涵体蛋白需要通过复杂的复性过程才能得到正确折叠的功能蛋白，这在一定程度上会抵消包涵体表达量高的优势。(3)可自我剪切的融合表达，如内含肽(Xie YG，Han FF，Luan C，et al.High-yield soluble expression and simple purification of the antimicrobial peptide OG2 using the intein system in Escherichia coli.Biomed Res Int.2013；2013：754319)等。融合蛋白表达以后通过改变温度、pH等条件诱导内含肽自我剪切，从而避免了外源蛋白酶及化学试剂的使用，简化了目的蛋白或多肽的纯化过程(Mee C，Banki MR，Wood DW.Towards the elimination of chromatography in protein purification：expressing proteins engineered to purify themselves.Chem Eng J.2008；135：56-62)。(4)引导分泌表达的融合载体蛋白，如PelB(Wu D，Lu Y，Huang H，et al.High-level secretory expression of metchnikowin in Escherichia coli.Protein Expr Purif.2013；91：49-53)、蛋白A信号肽(

A，Blingsmo OR，Saether O，et al.Expression and characterization of a recombinant human parathyroid hormone secreted by Escherichia coli employing the staphylococcal protein A promoter and signal sequence.J Biol Chem.1990；265：7338-44)等。对大肠杆菌表达系统而言，融合蛋白表达以后可以被信号序列引导分泌至细胞周质，防止细胞内蛋白酶的降解；细胞周质氧化性强于细胞质，有利于含二硫键目的蛋白或多肽的正确折叠。但细胞周质表达通常获得的表达量较少。

由于现有的融合载体蛋白如谷胱甘肽转移酶(27kD)、麦芽糖结合蛋白(50kD)等大多分子量较大，目的蛋白，特别是低分子量多肽，在融合蛋白中所占比例偏低；尽管融合蛋白的表达量得到了提高，但是目的蛋白或多肽在宿主细胞中的表达效率仍然相对较低。开发新型小分子量融合载体蛋白，可以有效提高融合蛋白的表达量，并提高目的蛋白或多肽的表达效率，在工业化生产中更具有成本优势。

胰岛素(insulin)是动物体内促进糖原、脂肪、蛋白质的合成，降低血糖的激素，长期以来主要用于治疗糖尿病。胰岛素在动物胰岛β细胞合成和分泌，由B、A两个亚基组成，其中B亚基有30个氨基酸残基，A亚基含有21个氨基酸残基；两个亚基之间由两对二硫键连接，A亚基内另含一对二硫键。在体内，胰岛β细胞首先合成出含有前导肽的单链前胰岛素原；经过加工生成的胰岛素原，是由B亚基、A亚基与间隔二者的C肽连接，形成的单链蛋白分子，需要通过蛋白酶作用切去C肽，形成B亚基、A亚基组成的双链胰岛素的成熟分子。不同动物种属(人、牛、羊、猪等)胰岛素的氨基酸序列和结构略有差异。

早期的药用胰岛素主要是动物胰岛素，如猪胰岛素。随着基因工程的发展，动物胰岛素逐渐被重组人胰岛素取代。重组技术除生产标准的人胰岛素外，还改变了人胰岛素序列上的一个或几个氨基酸残基，开发出了适合多种临床需要的人胰岛素类似物，如将B9的Ser变为Asp、B27的Thr变为Glu后制成速效胰岛素，将B27的Thr变为Arg、B亚基C端酰胺化、A21的Asn变为Gly后制成长效胰岛素等(Bristow AF.Recombinant-DNA-derived insulin analogues as potentially useful therapeutic agents.Trends Biotechnol.1993；11：301-5)。

生产重组胰岛素的方法，按胰岛素B、A亚基表达方式的不同，主要可以分为两种。(1)单亚基合成法：通过基因工程分别表达胰岛素B、A亚基，二者混合使B、A亚基在一定条件下氧化复性形成正确二硫键，制得成熟胰岛素。但胰岛素B、A亚基分子量小，无法直接重组表达，需要与融合载体蛋白，如β-半乳糖苷酶组成融合蛋白进行表达(Goeddel DV，Kleid DG，Bolivar F，et al.Expression in Escherichia coli of chemically synthesized genes for human insulin.Proc Natl Acad Sci U S A.1979；76：106-10)，分子量很大的融合载体蛋白，使得胰岛素B、A亚基的直接产量极低；加之后续的复性率低，使得该方法胰岛素产率太低，成本很高，现已被淘汰。(2)胰岛素原法：通过基因工程首先表达B亚基、C肽和A亚基组成的胰岛素原单链分子，氧化复性后再经胰蛋白酶、羧肽酶B酶解切除C肽，制得成熟胰岛素。类似的小胰岛素原法，则缩短或去掉C肽，直接由几个氨基酸残基连接胰岛素B、A亚基组成小胰岛素原，进行重组表达后，经正确氧化复性，再经胰蛋白酶、羧肽酶B酶切处理，制得胰岛素。但通常认为胰岛素原和小胰岛素原的分子稳定性差，容易被宿主降解而致表达产量降低，需采用与各种融合载体蛋白进行融合表达的方法(Castellanos-Serra LR，Hardy E，Ubieta R，Vispo NS，et al.Expression and folding of an interleukin-2-proinsulin fusion protein and its conversion into insulin by a single step enzymatic removal of the C-peptide and the N-terminal fused sequence.FEBS Lett.1996；378：171-6；Wetzel R，Kleid DG，Crea R，et al.Expression in Escherichia coli of a chemically synthesized gene for a″mini-C″analog of human proinsulin.Gene.1981；16：63-71；Trabucchi A1，Guerra LL，Faccinetti NI，et al.Expression and characterization of human proinsulin fused to thioredoxin in Escherichia coli.Appl Microbiol Biotechnol.2012；94：1565-76；Malik A1，Jenzsch M，Lübbert A，et al.Periplasmic production of native human proinsulin as a fusion to E.coli ecotin.Protein Expr Purif.2007；55：100-11)。需要注意的是，作为小分子多肽，胰岛素原和小胰岛素原在N端只融合含His Tag纯化标签的短前导肽序列情况下也可以直接以包涵体形式实现原核表达，从而有效避免了蛋白酶解及对宿主细胞的毒性伤害作用(Tikhonov RV，Pechenov SE，Belacheu IA，et al.Recombinant human insulin IX.Investigation of factors，influencing the folding of fusion protein-S-sulfonates，biotechnological precursors of human insulin.Protein Expr Purif.2002；26：187-93；Shin CS1，Hong MS，Bae CS，et al.Enhanced production of human mini-proinsulin in fed-batch cultures at high cell density of Escherichia coli BL21(DE3)[pET-3aT2M2].Biotechnol Prog.1997；13：249-57)。这提示我们，胰岛素相关序列可能是一种潜在的小分子量融合载体蛋白，可以有效促进异源性蛋白或多肽的重组表达。

发明内容

本发明解决的技术问题：一方面提供一种新型融合载体蛋白、编码该融合载体蛋白的基因序列、含有该基因序列的表达载体和/或宿主细胞、以及融合载体蛋白、其基因序列、表达载体或宿主细胞在促进目的蛋白或多肽表达中的应用；另一方面提供一种包含上述融合载体蛋白的融合蛋白、编码融合蛋白的基因序列、含有该基因序列的表达载体和/或宿主细胞，并提供一种表达融合蛋白的方法。

本发明的技术方案，第一方面是提供了一种用于表达目的蛋白或多肽的融合载体蛋白，其特征在于，所述的融合载体蛋白的氨基酸序列来源于胰岛素的氨基酸序列或其经过取代、缺失和/或增加一个或几个氨基酸的氨基酸序列，或上述氨基酸序列经过常规修饰后形成的氨基酸序列、或上述氨基酸序列加入标签后形成的氨基酸序列；其中，所述的常规修饰包括乙酰化、酰胺化、环化、糖基化、磷酸化、烷基化、生物素化、荧光基团修饰、聚乙二醇PEG修饰、固定化修饰；所述的标签包括6×His、GST、EGFP、MBP、Nus、HA、IgG、FLAG、c-Myc、Profinity eXact。。

上述融合载体蛋白，其特征在于，所述的融合载体蛋白包括：(1)人胰岛素A亚基，即SEQ ID No：2所示的氨基酸序列；或(2)在(1)中的氨基酸序列经过取代、缺失和/或增加一个或几个氨基酸，且编码可融合表达的氨基酸序列。

上述融合载体蛋白，其特征在于，所述的融合载体蛋白包括：(1)人胰岛素B亚基，即SEQ ID No：4所示的氨基酸序列；或(2)在(1)中的氨基酸序列经取代、缺失和/或增加一个或几个氨基酸，且编码可融合表达的氨基酸序列，优选SEQ ID No：6所示的氨基酸序列。

上述融合载体蛋白，其特征在于，所述的融合载体蛋白包括：(1)是同时含有人胰岛素A亚基与B亚基的单链蛋白分子，优选SEQ ID No：8、SEQ ID No：9所示的氨基酸序列；或(2)是在(1)中之单链分子变体，其含有人胰岛素A亚基和/或B亚基，经取代、缺失和/或增加一个或几个氨基酸，且编码可融合表达的氨基酸序列，优选SEQ ID No：25所示的氨基酸序列。

本发明的技术方案，第二方面是提供了一种编码第一方面所述融合载体蛋白的核酸分子、含有该核酸分子的表达载体或宿主细胞。

上述核酸分子，其特征在于，所述核酸分子含有编码本发明第一方面所述融合载体蛋白的基因序列，优选SEQ ID No：1、SEQ ID No：3、SEQ ID No：5、SEQ ID No：7、SEQ ID No：24所示的基因序列。

上述表达载体，其特征在于，所述表达载体包含本方面所述的核酸分子，连接于载体的启动子用于核酸分子编码蛋白的表达。

上述宿主细胞，其特征在于，所述宿主细胞含有本方面所述的核酸分子或表达载体。

本发明的技术方案，第三方面是提供了一种本发明第一方面所述融合载体蛋白以及第二方面所述核酸分子、表达载体或宿主细胞在促进目的蛋白或多肽表达中的应用。

本发明的技术方案，第四方面是提供了一种融合蛋白，其特征在于，所述的融合蛋白，含有本发明第一方面所述融合载体蛋白以及至少一个目的蛋白或多肽，且该目的蛋白或多肽不是胰岛素。

上述的融合蛋白，可进行常规修饰或加入表达纯化标签；所述的常规修饰包括乙酰化、酰胺化、环化、糖基化、磷酸化、烷基化、生物素化、荧光基团修饰、聚乙二醇PEG修饰、固定化修饰；所述的标签包括6×His、GST、EGFP、MBP、Nus、HA、IgG、FLAG、c-Myc、Profinity eXact。

上述的融合蛋白，可以含有1、2、3、4个目的蛋白或多肽。

上述融合蛋白，其特征在于，所述的融合蛋白中融合载体蛋白与目的蛋白或多肽之间含有特异性多肽切割位点或序列。

上述融合蛋白，其特征在于，所述的融合蛋白中目的蛋白或多肽含有5-1000个氨基酸残基。

上述融合蛋白，其特征在于，所述的融合蛋白中目的蛋白或多肽选自GLP-1、胃泌酸调节素、恩夫韦肽、利那洛肽、人转甲状腺素蛋白，及它们的变体。

上述融合蛋白，优选的氨基酸序列选自SEQ ID No：12、SEQ ID No：13、SEQ ID No：14、SEQ ID No：17、SEQ ID No：18、SEQ ID No：21、SEQ ID No：27、SEQ ID No：30、SEQ ID No：31、SEQ ID No：32、SEQ ID No：36、SEQ ID No：39所示的氨基酸序列。

本发明的技术方案，第五方面是提供了一种编码第四方面所述融合蛋白的核酸分子、含有该核酸分子的表达载体或宿主细胞。

上述核酸分子，其特征在于，所述核酸分子含有编码本发明第四方面所述融合蛋白的基因序列。

本发明的技术方案，第六方面是提供了一种采用如下步骤生产目的蛋白或多肽的方法：(1)扩增适宜的宿主细胞；(2)诱导宿主细胞表达融合蛋白；(3)分离制备融合蛋白；和/或(4)对特异性的多肽切割位点或序列进行化学切割或生物酶解，分离融合载体蛋白与目的蛋白或多肽，以获取目的蛋白或多肽；其特征在于，该步骤(1)中的宿主细胞是本发明第二方面或第五方面所述的宿主细胞。

本发明中序列表中各序列对应的蛋白名称如下表所示：

发明详述：

对于许多小分子量的异源性多肽，在宿主细胞内表达时极易被蛋白酶降解；一些表达的蛋白分子对宿主细胞具有一定毒性作用，而导致宿主细胞生长停滞或死亡；所以直接表达目的蛋白或多肽时常遇到困难。本发明发现，胰岛素B、A亚基单链，和由B、A亚基单链融合的蛋白片段，以及他们的各种变异体，作为新型融合载体蛋白，能有效提高目的蛋白或多肽的表达量。特别在细菌宿主中，这类融合载体蛋白可以促进多种目的蛋白以包涵体形式表达。提高目的蛋白的稳定性，可能是其有效提高目的蛋白或多肽表达量的重要因素。

实施本发明，需要首先获得编码胰岛素B或/和A亚基的基因克隆。通常，根据已知的基因序列设计PCR引物，用从人或多种动物胰腺组织中或胰岛细胞中提取的RNA，进行反转录PCR可直接获得cDNA克隆；更简单的，可以人工合成与天然编码DNA序列相同基因序列；也可以按照其氨基酸序列，用公知的设计方法，依宿主的基因偏好，合成不同密码子偏好的基因序列；也容易从其它商业途径获得含有胰岛素B、A亚基的基因克隆。

可以按公知的方法，构建编码本发明所述的融合载体蛋白与既定目的蛋白形成的融合蛋白表达载体。用常规的分子生物学手段，首先将编码既定目的蛋白的基因，与编码胰岛素B亚基的基因、或编码A亚基的基因，或编码由B、A亚基单链融合的蛋白片段的基因，直接共码连接。它们的连接顺序可以根据需要进行调整，以获得诸如B-T、T-B、A-T、T-A、A-B-T、B-A-T、T-A-B、T-B-A等等多种形式的融合蛋白产物；其融合蛋白中包含的B、A可以是人胰岛素B亚基单链序列(SEQ ID No：4)、人胰岛素A亚基单链序列(SEQ ID No：2)，或其它动物种属的胰岛素B链、A链序列，也可以是人胰岛素氨基酸残基取代、缺失或添加变异体，但仍保持与人胰岛素序列至少具有70％同源性，或至少具有75％、至少具有80％、至少具有85％、至少具有90％、至少具有95％同源性，并能有效融合表达的序列；其中的目的蛋白T可以有一个或多个相同或不同的分子。上述基因片段也可以通过含有编码间隔序列的基因片段连接，融合载体蛋白与目的蛋白的间隔序列可以含有能被特异性化学切割或生物酶解的特定序列，如Met(蛋氨酸)残基可被CNBr化学切割，Lys(赖氨酸)或Arg(精氨酸)残基可被胰蛋白酶切割，LysArg或ArgArg可被双碱基蛋白酶类如Kex2切割，GluAsnLeuTyrPheGln可被烟草蚀纹病毒蛋白酶(TEV蛋白酶)识别和切割，IeuGluGlyArg可被Xa因子(Xa蛋白酶)识别和切割，以及其它合适的蛋白酶切位点。上述获得的融合蛋白编码基因，按公知的方法插入合适的表达载体，得到表达上述融合蛋白的重组载体。也可以将需要的基因片段按合适的顺序依次连接到表达载体上。上述表达载体包括但不限于原核表达载体和各种真核表达载体。各种商品化的表达载体，可提供选择，如表达载体pQE系列，pET系列等。按公知的方法将重组载体转入宿主细胞，所述宿主细胞包括但不限于大肠杆菌、其它原核细胞、各种真核生物细胞。在合适的条件下进行诱导表达，表达的宿主细胞经破碎裂解，收取融合蛋白产物。表达产物可以通过公知的方法纯化；融合蛋白中，作为融合载体蛋白的胰岛素B、A亚基序列，可以用合适的化学切割或蛋白酶切割去除。

本发明可用于融合表达多种在疾病诊断、治疗、预防或其它领域用途的目标蛋白或多肽。含50及以上氨基酸残基数的蛋白分子一般称为蛋白，50以下氨基酸残基数的蛋白分子常称为多肽；但二者名称经常混用。目标蛋白可包括生长因子、细胞因子、配体、受体、转运体、抗原、抗体及其片段。特别对目标多肽，本发明具有更多的优势；常见的目标多肽有胰高血糖素样肽1(glucagon-like peptide 1，GLP-1)、艾塞那肽(Exendin-4)、胃泌酸调节素(Oxyntomodulin)、多种抗菌肽、抗病毒肽如恩夫韦肽(enfuvirtide，T-20)、心房肽、奥曲肽(octreotide)、利那洛肽(linaclotide)等。

有益技术效果：

本发明的优点在于，本发明的融合载体蛋白及其构建的重组表达系统，对多种不同蛋白或多肽均具有良好的促表达作用。由于其分子量较小，如胰岛素B、A亚基单链，仅由30或20个左右的氨基酸残基组成；由B、A亚基单链融合的蛋白片段，也可仅含有50个左右的氨基酸残基；与已知的融合载体蛋白相比，他们作为融合载体蛋白，在融合蛋白中与目的蛋白或多肽的占比明显下降；由此，可以获得目的蛋白，特别是小分子量多肽的高效重组表达，有效降低其生产成本。

本发明的另一个优点是，胰岛素作为人类历史上第一个生物工程产品，以及它所衍生出的众多的结构变异产品，其结构、序列变异和重组表达等特征已为人们熟知。作为融合载体蛋白，其不需要具有胰岛素的生物活性，这也为构建多种氨基酸残基取代、缺失或添加的变异型融合载体蛋白，使其获得额外的理化特征，如离子结合特征，提供了多种可能。

本发明的另一个优点是，胰岛素在临床实践中具有极好的体内顺应性，不会引起机体的明显毒性；这使得来源于胰岛素的融合载体蛋白，在与目的蛋白或多肽形成的融合蛋白活性产物中，有可能不需切割除去，而直接应用于体内。

附图说明

图1.融合载体蛋白BA的原核重组表达。

融合载体蛋白BA与表达载体pQE80L的His Tag融合表达产物，进行Tricine-SDS-PAGE及Western blot检测。左图A中，未诱导全菌样品(-)、IPTG诱导全菌样品(+)在16.5％Tricine-SDS-PAGE电泳检测，在未诱导宿主菌内约10kD以下的多肽很少存在；右图B中，未诱导全菌样品(-)、IPTG诱导全菌样品(+)、诱导菌可溶性上清样品(S)、和不溶性包涵体样品(I)在13％Tricine-SDS-PAGE电泳(左)及其Western blot(右)检测，诱导后融合蛋白以包涵体形式在宿主菌内有效蓄积。M为蛋白电泳marker及其分子量(kD)；箭头所指为表达产物BA条带位置。

图2.融合载体蛋白BA与GLP-E的融合表达。

融合载体蛋白BA融合于GLP-E的N端，表达载体BA-GLP-E/pQE80L，在E.coli TG1中表达样品：未诱导全菌样品(-)、经IPTG诱导全菌样品(+)、诱导上清样品(S)、诱导包涵体样品(I)，进行13％Tricine-SDS-PAGE(左)及Western blot(右)检测。融合蛋白无明显降解，以包涵体形式高效表达。M为蛋白电泳marker及其分子量(kD)；箭头所指为融合蛋白BA-GLP-E条带位置。

图3.融合载体蛋白B与GLP-E的融合表达。

融合载体蛋白B融合于GLP-E的N端，表达载体B-GLP-E/pQE80L，在E.coli TG1中表达样品：未诱导全菌样品(-)、经IPTG诱导全菌样品(+)、诱导上清样品(S)、诱导包涵体样品(I)，进行13％Tricine-SDS-PAGE(左)及Western blot(右)检测。融合蛋白无明显降解，以包涵体形式有效表达。M为蛋白电泳marker及其分子量(kD)；箭头所指为融合蛋白B-GLP-E条带位置。

图4.融合载体蛋白A与GLP-E的融合表达。

融合载体蛋白A融合于GLP-E的N端，表达载体A-GLP-E/pQE80L，在E.coli TG1中表达样品：未诱导全菌样品(-)、经IPTG诱导全菌样品(+)、诱导上清样品(S)、诱导包涵体样品(I)，进行13％Tricine-SDS-PAGE(左)及Western blot(右)检测。融合蛋白无明显降解，以包涵体形式有效表达。M为蛋白电泳marker及其分子量(kD)；箭头所指为融合蛋白A-GLP-E条带位置。

图5.融合载体蛋白BA与GLP-1的融合表达。

融合载体蛋白BA与GLP-1的N端融合，其表达载体BA-GLP/pQE80L，在E.coli TG1中的表达样品：未诱导全菌样品(-)、经IPTG诱导全菌样品(+)、诱导上清样品(S)、诱导包涵体样品(I)，进行13％Tricine-SDS-PAGE电泳(左)及Western blot(右)检测。融合蛋白无明显降解，以包涵体形式高效表达。M为蛋白电泳marker及其分子量(kD)；箭头所指为融合蛋白BA-GLP条带位置。

图6.融合载体蛋白B与GLP-1的融合表达。

融合载体蛋白B融合于GLP-1的N端，表达载体B-GLP/pQE80L，在E.coli TG1中表达样品：未诱导全菌样品(-)、经IPTG诱导全菌样品(+)、诱导上清样品(S)、诱导包涵体样品(I)，进行13％Tricine-SDS-PAGE(左)及Western blot(右)检测。融合蛋白无明显降解，以包涵体形式有效表达。M为蛋白电泳marker及其分子量(kD)；箭头所指为融合蛋白B-GLP条带位置。

图7.融合载体蛋白BA与恩夫韦肽T-20的融合表达。

融合载体蛋白BA融合于恩夫韦肽T-20的N端，表达载体BA-T/pQE80L，在E.coli TG1中表达样品：未诱导全菌样品(-)、经IPTG诱导全菌样品(+)、诱导上清样品(S)、诱导包涵体样品(I)，进行13％Tricine-SDS-PAGE(左)及Western blot(右)检测。融合蛋白无明显降解，以包涵体形式有效表达。M为蛋白电泳marker及其分子量(kD)；箭头所指为融合蛋白BA-T条带位置。

图8.包涵体标签BA变体与胃泌酸调节素的融合表达。

包涵体标签BA变体B′A′融合于胃泌酸调节素OXN的N端，表达载体B′A′-OXN/pQE80L，在E.coli TG1中表达样品：未诱导全菌样品(-)、经IPTG诱导全菌样品(+)、诱导上清样品(S)、诱导包涵体样品(I)，进行16.5％Tricine-SDS-PAGE(左)及Western blot(右)检测。融合蛋白无明显降解，以包涵体形式高效表达。M为蛋白电泳marker及其分子量(kD)；箭头所指为融合蛋白B′A′-OXN条带位置。

图9.融合载体蛋白BA与单拷贝利那洛肽的融合表达。

融合载体蛋白BA融合于单拷贝利那洛肽的N端，表达载体BA-LN1/pQE80L，在E.coliBL21(DE3)pLysS中表达样品：未诱导全菌样品(-)、经IPTG诱导全菌样品(+)、诱导上清样品(S)、诱导包涵体样品(I)，进行13％Tricine-SDS-PAGE(左)及Western blot(右)检测。融合蛋白无明显降解，以包涵体形式高效表达。M为蛋白电泳marker及其分子量(kD)；箭头所指为融合蛋白BA-LN1条带位置。

图10.融合载体蛋白BA与三拷贝利那洛肽的融合表达。

融合载体蛋白BA融合于三拷贝利那洛肽的N端，表达载体BA-LN3/pQE80L，在E.coli BL21(DE3)pLysS中表达样品：未诱导全菌样品(-)、经IPTG诱导全菌样品(+)、诱导上清样品(S)、诱导包涵体样品(I)，进行13％Tricine-SDS-PAGE(左)及Western blot(右)检测。融合蛋白无明显降解，以包涵体形式有效表达。M为蛋白电泳marker及其分子量(kD)；箭头所指为融合蛋白BA-LN3条带位置。

图11.融合载体蛋白B变体与双拷贝利那洛肽的融合表达。

融合载体蛋白B变体融合于双拷贝利那洛肽的N端，表达载体B′-LN2/pQE80L，在E.coli BL21(DE3)pLysS中表达样品：未诱导全菌样品(-)、经IPTG诱导全菌样品(+)、诱导上清样品 (S)、诱导包涵体样品(I)，进行13％Tricine-SDS-PAGE(左)及Western blot(右)检测。融合蛋白无明显降解，以包涵体形式高效表达。M为蛋白电泳marker及其分子量(kD)；箭头所指为融合蛋白B′-LN2条带位置。

图12.B′-LN2包涵体质谱分析。

图A为B′-LN2包涵体一级质谱检测结果，图B为B′-LN2包涵体的胰酶酶切样品检测结果，图C为B′-LN2包涵体的胰酶酶切还原样品检测结果，图D为B′-LN2包涵体的胰酶-羧肽酶B双酶切样品检测结果，图E为B′-LN2包涵体的胰酶酶切还原样品中利那洛肽所在酶切肽段(氨基酸序列为CysCysGluTyrCysCysAsnProAlaCysThrGlyCysTyrArg)的二级质谱检测结果。峰位归属结果均符合理论预期。图E中M+H表示准分子离子，b、y分别表示二级质谱中产生的b系列、y系列特征碎片离子。

图13.融合载体蛋白BA与人转甲状腺素蛋白的融合表达。

融合载体蛋白BA融合于人转甲状腺素蛋白的N端，表达载体BA-TT/pQE80L，与非融合表达载体TT/pQE80L分别在E.coli TG1中表达样品：未诱导全菌样品(-)、经IPTG诱导全菌样品(+)、诱导上清样品(S)、诱导包涵体样品(I)，进行15％SDS-PAGE检测。融合蛋白BA-TT表达量明显高于TT；非融合蛋白TT主要为可溶性表达，但提取上清可溶蛋白时，收取率明显低于预期应收取的产量；而融合蛋白BA-TT主要以包涵体形式表达，无明显损失。TT、BA-TT分别为载体TT/pQE80L和BA-TT/pQE80L的表达产物；M为蛋白电泳marker及其分子量(kD)；箭头所指为相应表达产物条带位置。

图14.融合载体蛋白BA与随机多肽X的融合表达。

融合载体蛋白BA融合于随机多肽X的N端，表达载体BA-X/pQE80L，在E.coli TG1中表达样品：未诱导全菌样品(-)、经IPTG诱导全菌样品(+)、诱导上清样品(S)、诱导包涵体样品(I)，进行13％Tricine-SDS-PAGE(左)及Western blot(右)检测。融合蛋白无明显降解，以包涵体形式高效表达。M为蛋白电泳marker及其分子量(kD)：箭头所指为融合蛋白BA-X条带位置。

具体实施方式

下面结合附图，通过实施例对本发明进行具体描述或进一步说明，其目的在于更好地理解本发明的技术内涵，具体说明本发明中，新型融合载体蛋白的使用方法及相应融合表达系统的效果，但是本实施例并不限定本发明的保护范围。

实验方法：

常规质粒构建所涉及的PCR、酶切、连接等实验，以及蛋白质表达所涉及的转化、细菌培养等实验为本领域研究人员所熟悉，所以具体相关实验细节没有详细注明，具体可参照《分子克隆实验指南》(J.萨姆布鲁克，E.F.弗里奇，T.曼尼阿蒂斯著)所述常规实验条件。

1、基因克隆与表达载体构建：

目的蛋白或多肽编码基因通过人工合成及PCR扩增获得，经酶切后插入表达载体pQE80L 相应酶切位点，构建相关重组表达载体，其表达产物的N端融合有His-6序列。所有载体的目的基因序列均经核酸序列测定验证。

2、融合蛋白的诱导表达：

将相关重组质粒转化到E.coli TG1或BL21(DE3)pLysS感受态，得到目的工程菌株。具体实施例均采用实验室小规模摇瓶表达。在37℃条件下含氨苄青霉素抗性的LB液体培养基中振荡活化过夜，之后将过夜培养物按1∶100比例转到新的含有氨苄青霉素抗性的LB培养基(20-30mL)中，37℃振荡培养至合适对数生长期，经0.1mM或1mM IPTG诱导表达一定时间。

取未诱导、诱导菌液各1mL，7000rpm于4℃离心5min后弃上清，收集菌体，用200μL体积的PBS重悬后直接加入50μL体积的5×SDS上样缓冲液(300mM Tris-HCl(pH 6.8)、20％β-巯基乙醇、20％SDS、25％甘油、0.05％溴酚蓝)，沸水浴孵育20min，-20℃保存，作为未诱导、诱导全菌样品。取诱导样品14mL，7000rpm于4℃离心5min后弃上清，收集菌体，用2.66mL体积的PBS重悬，加入140μL 20％Triton X-100后混匀，反复冻融三次，超声破菌10min。取2.4mL全菌裂解样品12000rpm于4℃离心15min，上清、沉淀分离。取200μL体积的上清，加入50μL体积的5×SDS上样缓冲液，沸水浴孵育20min，-20℃保存，作为诱导上清样品。将沉淀用1mL包涵体洗液(含1％Triton X-100和5mM EDTA的PBS)重悬后12000rpm于4℃离心15min，弃上清，重复洗涤三次，再用1mL体积PBS重悬后12000rpm于4℃离心15min，弃上清，即得较纯包涵体。包涵体沉淀用960μL体积的PBS重悬后取其中80μL加入120μL体积PBS和50μL体积5×SDS上样缓冲液，沸水浴孵育20min，-20℃保存，作为诱导包涵体样品。上述各种样品在电泳检测中的稀释度相同，其蛋白含量具有直接可比性。

3、蛋白电泳(SDS-PAGE/Tricine-SDS-PAGE)与定量：

SDS-PAGE凝胶按常规方法配制，Tricine-SDS-PAGE凝胶按文献(

H.Tricine-SDS-PAGE.Nat Protoc.2006；1：16-22)方法配制。对已制备好的未诱导全菌样品、诱导全菌样品、诱导上清样品、诱导包涵体样品等体积上样，进行15％SDS-PAGE或13％(或特定浓度)Tricine-SDS-PAGE检测。先恒压50V电泳50min，再恒压150V，全程冰水浴电泳。电泳结束后进行考马斯亮蓝R-250染色(Tricine-SDS-PAGE电泳结束后，电泳胶用5％戊二醛固定30min后再进行考马斯亮蓝R-250染色)，经脱色后得电泳结果。

以牛血清白蛋白(bovine serum albumin，BSA)作为标准品，上样0.5、1、2、4μg BSA及合适量的诱导包涵体样品，同时进行电泳检测，对脱色后的凝胶蛋白条带用QuantiScan软件进行灰度扫描，依据BSA定量的标准曲线计算融合蛋白含量。

4、免疫印迹检测：

蛋白电泳结束后，取分离胶部分用于Western blot。分离胶经湿法转印至PVDF膜上，之后将膜放入含5％脱脂奶粉的PBST(含0.1％Tween-20的PBS)中，室温振摇封闭2h。用含2.5％脱脂奶粉的PBST按1∶2000稀释抗His标签鼠单克隆抗体，4℃孵育过夜。PBST漂洗4次(15min/次)后，用含2.5％脱脂奶粉的PBST按1∶2000稀释HRP标记山羊抗小鼠IgG，室温振摇孵育1.5h，PBST漂洗4次(15min/次)。配1mL ECL显影液均匀滴加于取出的PVDF膜上，曝光。

5、蛋白样品的酶切及质谱分析：

用包涵体溶解液(含8M脲的20mM Tris-HCl，pH 8.0)将包涵体样品溶解，加入终浓度5mM DTT，振荡溶解，室温放置20min，12000rpm于4℃离心10min，取上清用20mM Tris-HCl(pH 8.0)缓冲液稀释20倍，用胰酶(终浓度4mg/L)37℃孵育过夜；或羧肽酶B(终浓度0.5mg/L)37℃孵育30min；醋酸酸化终止。上述酸化后的酶切样品与CHCA基质(30g/L；70％乙腈/30％甲醇/0.1％三氟乙酸)等体积混合，取混合液1μL点样于质谱板，自然晾干，经基质辅助激光解析电离飞行时间质谱(MALDI-TOF-MS)(MALDI-TOF/TOF Analyzer 4800plus，Applied Biosystem)，在激光强度4800W/cm2条件下，对样品进行线性模式或反射模式测定以定性分析，观察酶切片段的分子量。

实施例1：包涵体标签BA的原核重组表达

用正向引物ataagatctatgtttgtgaaccagcatctgtg和反向引物atactcgagttaggttttcggggtataaaaaaag扩增融合载体蛋白B基因(SEQ ID No：3)，用正向引物ataggatccatgggcattgtggaacagtgc和反向引物ataagatctgttgcaatagttttccagctg扩增融合载体蛋白A基因(SEQ ID No：1)；通过B基因、A基因的PCR产物与引物ctttttttataccccgaaaacccgccgcggcattgtggaacagtgc混合，采用overlap PCR，用正向引物ataagatctatgtttgtgaaccagcatctgtg及反向引物atactcgagttagttgcaatagttttccagctg获得包涵体标签BA基因(SEQ ID No：7)，编码蛋白序列为SEQ ID No：8。经BglII和XhoI双酶切，插入表达载体pQE80L的BamHI和SalI酶切位点，构建成BA/pQE80L载体，编码一个蛋白序列SEQ ID No：9。

将构建的表达载体BA/pQE80L，转入E.coli TG1感受态细胞，得到目的工程菌株；在对数生长期(OD₆₀₀＝0.4)，经0.1mM IPTG诱导表达20h，收取样品进行Tricine-SDS-PAGE及Western blot检测。16.5％Tricine-SDS-PAGE检测蛋白分子量范围为3-70kD，如图1A的检测中，在未诱导宿主菌内约10kD以下的多肽基本不存在，而表达产物BA的表观分子量明显低于10kD；13％Tricine-SDS-PAGE(图1B左)结果显示，BA的表观分子量与理论分子量(7637.7Da)符合，且无明显降解产物，BA以包涵体形式有效表达；Western blot(图1B右)结果显示，表达条带为含有His Tag的目的蛋白。BA表达量为16.3±1.3mg/L(n＝3)。

本例说明胰岛素BA单链能够在原核宿主细胞中以包涵体形式稳定表达。

实施例2：包涵体标签BA与GLP-E的融合表达

胰高血糖素样肽-1，是有效治疗2型糖尿病的多肽药物。GLP-1(7-37)是GLP-1体内活性形式之一，含有31个氨基酸残基；其第二位Ala突变为Gly的GLP-1(A2G)变体(SEQ ID No：16)，可耐受DPPIV对GLP-1的降解作用。设计了含有编码GLP-1(A2G)的基因序列(SEQ ID No：10)，该基因编码的多肽GLP-E(SEQ ID No：11)，其C端为10个氨基酸残基延长的柔性序列，其最末端为Cys残基，可用于与其它分子的连接。通过下列引物，采用overlap PCR，合成了该基因。

包涵体标签BA基因用引物ataagatctatgtttgtgaaccagcatctgtg和ataggatccgttgcaatagttttccagctg扩增，经BglII和BamHI双酶切，插入表达载体pQE80L的BamHI酶切位点，构建成BA-/pQE80L载体；GLP-E基因用引物ataagatctcgccgccacggtgaaggtac和ataaagcttagcaagaaccaccaccaccagaac扩增后，经BglII和HindIII双酶切，插入表达载体BA-/pQE80L的BamHI和HindIII酶切位点，构建成BA-GLP-E/pQE80L载体，编码一个融合蛋白序列SEQ ID No：12。BA与GLP-E的间隔序列含有ArgArg，可被双碱基蛋白酶识别和切割，释放出完整的GLP-E分子。将构建的表达载体BA-GLP-E/pQE80L，转入E.coli TG1感受态细胞，得到目的工程菌株；在对数生长期(OD₆₀₀＝0.8)，经0.1mM IPTG诱导表达8h。Tricine-SDS-PAGE(图2左)结果显示，融合蛋白BA-GLP-E的表观分子量与理论分子量(12094.5Da)符合，且无明显降解产物，BA-GLP-E以包涵体形式高效表达；Western blot(图2右)结果显示，表达条带为含有His Tag的目的蛋白。融合蛋白BA-GLP-E表达量为131.8±2.2mg/L(n＝3)。

本例说明胰岛素BA单链与小分子多肽GLP-E融合，能够在原核宿主细胞中以包涵体形式高效稳定表达。

实施例3：包涵体标签B与GLP-E的融合表达

GLP-E基因用引物accccgaaaacccgccgccacggtgaaggtaccttc和ataaagcttagcaagaaccaccaccaccagaac扩增，产物与包涵体标签B基因扩增产物混合后，采用overlap PCR，由引物ataagatctatgtttgtgaaccagcatctgtg和ataaagcttagcaagaaccaccaccaccagaac扩增，经BglII和HindIII双酶切，插入表达载体pQE80L的BamHI和HindIII酶切位点，构建成B-GLP-E/pQE80L载体，编码一个融合蛋白序列SEQ ID No：13。融合载体蛋白B与GLP-E的N端融合，其间隔序列为ArgArg，可被双碱基蛋白酶识别和切割，释放出完整的GLP-E分子。将构建的表达载体B-GLP-E/pQE80L，转入E.coli TG1感受态细胞，得到目的工程菌株；在对数生长期(OD₆₀₀＝0.4)，经0.1mM IPTG诱导表达8h。Tricine-SDS-PAGE(图3左)结果显示，融合蛋白B-GLP-E的表观分子量与理论分子量(9272.3Da)符合，且无明显降解产物，B-GLP-E以包涵体形式有效表达；Western blot(图3右)结果显示，表达条带为含有His Tag的目的蛋白。融合蛋白B-GLP-E表达量为22.8±0.3mg/L(n＝3)。

本例说明胰岛素B链与小分子多肽GLP-E融合，能够在原核宿主细胞中以包涵体形式稳定表达。

实施例4：包涵体标签A与GLP-E的融合表达

融合蛋白A-GLP-E基因用引物ataagatctatgggcattgtggaacagtgctgcac和ataaagcttagcaagaaccaccaccaccagaac从载体BA-GLP-E/pQE80L扩增后，经BglII和HindIII双酶切，插入表达载体pQE80L的BamHI和HindIII酶切位点，构建成A-GLP-E/pQE80L载体，编码一个融合蛋白序列SEQ ID No：14。融合载体蛋白A与GLP-E的N端融合，其间隔序列含有ArgArg，可被双碱基蛋白酶识别和切割，释放出完整的GLP-E分子。将构建的表达载体A-GLP-E/pQE80L，转入E.coli TG1感受态细胞，得到目的工程菌株；在对数生长期(OD₆₀₀＝0.4)，经0.1mM IPTG诱导表达8h，收取样品。Tricine-SDS-PAGE(图4左)结果显示，融合蛋白A-GLP-E的表观分子量与理论分子量(8370.2Da)符合，且无明显降解产物，A-GLP-E以包涵体形式有效表达；Western blot(图4右)结果显示，表达条带为含有His Tag的目的蛋白。融合蛋白A-GLP-E表达量为22.6±0.1mg/L(n＝3)。

本例说明胰岛素A链与小分子多肽GLP-E融合，能够在原核宿主细胞中以包涵体形式稳定表达。

实施例5：包涵体标签BA与GLP-1的融合表达

本实施例直接表达GLP-1的融合蛋白BA-GLP。GLP-1基因序列(SEQ ID No：15)从载体BA-GLP-E/pQE80L中用引物ataagatctcgccgccacggtgaaggtac和ataaagcttaaccacgacctttaaccagc扩增后，经BglII和HindIII双酶切，插入表达载体BA-/pQE80L的BamHI和HindIII酶切位点，构建成BA-GLP/pQE80L载体，编码一个融合蛋白序列SEQ ID No：17。BA与GLP-1的间隔序列含有ArgArg，可被双碱基蛋白酶识别和切割，释放出完整的GLP-1分子。将构建的表达载体BA-GLP/pQE80L，转入E.coli TG1感受态细胞，得到目的工程菌株；在对数生长期(OD₆₀₀＝0.4)，经0.1mM IPTG诱导表达20h，收取样品。Tricine-SDS-PAGE(图5左)结果显示，融合蛋白BA-GLP表观分子量与理论分子量(11417.8Da)符合，且无明显降解产物，BA-GLP以包涵体形式高效表达；Western blot(图5右)结果显示，表达条带为含有His Tag的目的蛋白。融合蛋白BA-GLP表达量为162.9±3.5mg/L(n＝3)。

本例说明胰岛素BA单链与小分子多肽GLP融合，能够在原核宿主细胞中以包涵体形式高效稳定表达。

实施例6：包涵体标签B与GLP-1的融合表达

从载体B-GLP-E/pQE80L中由引物ataagatctatgtttgtgaaccagcatctgtg和ataaagcttaaccacgacctttaaccagc扩增，经BglII和HindIII双酶切，插入表达载体pQE80L的BamHI和HindIII酶切位点，将包涵体标签B与GLP-1的N端融合，构建成B-GLP/pQE80L载体，编码一个融合蛋白序列SEQ ID No：18，其表达产物中B与GLP-1的间隔序列为ArgArg，可被双碱基蛋白酶识别和切割，释放出完整的GLP-1分子。将构建的表达载体B-GLP/pQE80L，转入E.coli TG1感受态细胞，得到目的工程菌株；在对数生长期(OD₆₀₀＝0.4)，经0.1mM IPTG 诱导表达20h。Tricine-SDS-PAGE(图6左)结果显示，融合蛋白B-GLP的表观分子量与理论分子量(8595.6Da)符合，且无明显降解产物，B-GLP以包涵体形式有效表达；Western blot(图6右)结果显示，表达条带为含有His Tag的目的蛋白。融合蛋白B-GLP表达量为20.1±2.0mg/L(n＝3)。

实施例7：包涵体标签BA与恩夫韦肽的融合表达

HIV融合抑制性多肽恩夫韦肽T-20(SEQ ID No：20)，是由36个氨基酸残基组成的人工多肽，是有效的抗艾滋病治疗药物。

通过下列引物，合成含有编码恩夫韦肽的基因序列((SEQ ID No：19)，

其PCR产物含有特定的酶切位点BglII和HindIII，经BglII和HindIII双酶切，插入表达载体BA-/pQE80L的BamHI和HindIII酶切位点，构建成BA-T/pQE80L载体，编码一个融合蛋白序列SEQ ID No：21，其表达产物的BA与T-20的间隔序列含有ArgArg，可被双碱基蛋白酶识别和切割，释放出完整的T-20分子。将构建的表达载体BA-T/pQE80L，转入E.coli TG1感受态细胞，得到目的工程菌株；在对数生长期(OD₆₀₀＝0.4)，经0.1mM IPTG诱导表达20h，收取样品.Tricine-SDS-PAGE(图7左)结果显示，融合蛋白BA-T的表观分子量与理论分子量(12626.2Da)符合，且无明显降解产物，BA-T以包涵体形式有效表达；Western blot(图7右)结果显示，表达条带为含有His Tag的目的蛋白。融合蛋白BA-T表达量为37.6±0.9mg/L(n＝3)。

本例说明胰岛素BA单链与小分子多肽恩夫韦肽融合，能够在原核宿主细胞中以包涵体形式稳定表达。

实施例8：融合载体蛋白BA变体与胃泌酸调节素的融合表达

胃泌酸调节素Oxyntomodulin(OXN，SEQ ID No：22)是含有37个氨基酸残基的多肽；它同时具有GLP-1和胰高血糖素的作用，可能作为糖尿病和肥胖的治疗药物。设计了编码OXN的基因序列(SEQ ID No：23)。通过下列引物，采用overlap PCR，合成了含有该基因的DNA片段：

其5′端含有延长序列，编码部分胰岛素A链和蛋白酶识别的多肽间连接序列。

融合载体蛋白BA基因载体BA-/pQE80L用引物cgaacgcggcttttgttataccccgaaaacc和ggttttcggggtataacaaaagccgcgttcg进行PCR定点突变，使其B链发生F25C变异；以此为模板，再用引物ataagatctatgtttgtgaaccagcatctgtg和gttgcaatagttttccagctgatacaggctgtgaatgctggtgcagtgctgttcca扩增，获得载体蛋白BA变体基因B′A′(SEQ ID No：24)，该变体B′A′(SEQ ID No：25)的B链含有F25C变异，A链含有C6H和C11H变异。

将上述扩增的两种PCR产物混合，用引物ataggatccatgtttgtgaaccagcatctgtg和ataaagctttaagcgatgttgttacggttac扩增，PCR片段经BamHI和HindIII双酶切，插入表达载体pQE80L的BamHI和HindIII酶切位点，构建成B′A′-OXN/pQE80L载体，其ORF序列(SEQ ID No：26)编码一个融合蛋白序列SEQ ID No：27。BA与OXN的间隔序列含有LysThrLysArg，可被三碱基蛋白酶Furilisin(Ballinger MD，Tom J，Wells JA(1996)Furilisin：a variant of subtilisin BPN′engineered for cleaving tribasic substrates.Biochemistry 35：13579-13585)识别和切割，释放出完整的OXN分子。将构建的表达载体B′A′-OXN/pQE80L，转入E.coli TG1感受态细胞，得到目的工程菌株；在对数生长期(OD600＝0.6)，经1mM IPTG诱导表达8h。Tricine-SDS-PAGE(图8左)结果显示，融合蛋白B′A′-OXN的表观分子量与理论分子量(12577.1Da)符合，以包涵体形式高效表达；Western blot(图8右)结果显示，表达条带为含有His Tag的目的蛋白。融合蛋白B′A′-OXN表达量为157.7±2.9mg/L(n＝3)。

本例说明胰岛素BA单链，在其氨基酸序列发生取代突变时，与小分子多肽胃泌酸调节素融合，仍能够在原核宿主细胞中以包涵体形式高效稳定表达。

实施例9：包涵体标签BA与单拷贝利那洛肽的融合表达

利那洛肽(SEQ ID No：28)由14个氨基酸残基组成，富含Cys，是首个鸟苷酸环化酶激动剂类药物，用于治疗成人慢性特发性便秘和便秘型肠易激综合症。

通过下列引物，合成含有编码利那洛肽的基因序列(SEQ ID No：29)，

其PCR产物含有特定的酶切位点BamHI、PstI和BglII，经PstI和BamHI双酶切，插入表达载体BA-/pQE80L的BamHI和PstI酶切位点，构建成BA-LN1/pQE80L载体，编码一个融合蛋白序列SEQ ID No：30，其表达产物的BA与单拷贝利那洛肽的间隔序列含有Arg，可被胰蛋白酶识别和切割，释放出利那洛肽C端含有额外的Arg残基的分子。将构建的表达载体BA-LN1/pQE80L，转入E.coli BL21(DE3)pLysS感受态细胞，得到目的工程菌株；在对数生长期(OD₆₀₀＝0.8)，经0.1mM IPTG诱导表达20h。Tricine-SDS-PAGE(图9左)结果显示，融合蛋白BA-LN1的表观分子量与理论分子量(10292.7Da)符合，且无明显降解产物，BA-LN1以包涵体形式高效表达；Western blot(图9右)结果显示，表达条带为含有His Tag的目的蛋白。融合蛋白BA-LN1表达量为85.0±4.8mg/L(n＝3)。

本例说明胰岛素BA单链与小分子多肽利那洛肽融合，能够在原核宿主细胞中以包涵体形式高效稳定表达。

实施例10：包涵体标签BA与三拷贝利那洛肽的融合表达

利那洛肽基因序列的PCR产物含有特定的酶切位点，经BamHI和BglII酶切，自身连接，用引物ataggatcccgctgctgcgaatactgctgcaacccggcttgc与atactgcagatctgtagcaaccggtgcaagccgggttgcagcag扩增获得多拷贝基因，按实施例9方法酶切并插入BA-/pQE80L载体，获得表达三拷贝利那洛肽载体BA-LN3/pQE80L，编码一个融合蛋白序列SEQ ID No：31，其表达产物的BA与三拷贝利那洛肽及各拷贝间的间隔序列含有Arg，可被胰蛋白酶识别和切割，释放出利那洛肽C端含有额外的Arg残基的分子。将获得的表达载体BA-LN3/pQE80L，转入E.coli BL21(DE3)pLysS感受态细胞，得到目的工程菌株；在对数生长期(OD₆₀₀＝0.8)，经0.1mM IPTG诱导表达8h，收取样品进行13％Tricine-SDS-PAGE及Western blot检测。Tricine-SDS-PAGE(图10左)结果显示，融合蛋白BA-LN3的表观分子量与理论分子量(14121.1Da)符合，且无明显降解产物，BA-LN3以包涵体形式有效表达；Western blot(图10右)结果显示，表达条带为含有His Tag的目的蛋白。融合蛋白BA-LN3表达量为36.1±0.6mg/L(n＝3)。

本例说明胰岛素BA单链与多拷贝小分子多肽利那洛肽融合，也能够在原核宿主细胞中以包涵体形式稳定表达。

实施例11：包涵体标签B′与双拷贝利那洛肽的融合表达

用引物ataagatctatgtttgtgaaccagcatctgtg和ataagatctcggggtataaaaaaagccgcgttc扩增的包涵体标签B基因变体(SEQ ID No：5)，编码一个蛋白序列B′(SEQ ID No：6)，其C末端缺失KT。用BglII酶切；与实施例8获得的多拷贝基因的BamHI酶切片段连接，再用引物ataagatctatgtttgtgaaccagcatctgtg和atactgcagatctgtagcaaccggtgcaagccgggttgcagcag扩增，经BglII和PstI双酶切并插入pQE80L载体BamHI和PstI位点，获得表达双拷贝利那洛肽载体B′-LN2/pQE80L，编码一个融合蛋白序列SEQ ID No：32，其表达产物B′与双拷贝利那洛肽及各拷贝间的间隔序列含有Arg残基，可被胰蛋白酶识别和切割，释放出利那洛肽C端含有额外的Arg残基的分子。将获得的表达载体B′-LN2/pQE80L，转入E.coli BL21(DE3)pLysS感受态细胞，得到目的工程菌株；在对数生长期(OD₆₀₀＝0.4)，经0.1mM IPTG诱导表达20h，收取样品。Tricine-SDS-PAGE(图11左)结果显示，融合蛋白B′-LN2的表观分子量与理论分子量(9299.6Da)符合，且无明显降解产物，B′-LN2以包涵体形式高效表达；Western blot(图11右)结果显示，表达条带为含有His Tag的目的蛋白。融合蛋白B′-LN2表达量为70.9±0.3mg/L(n＝3)。

本例说明胰岛素B链发生氨基酸残基缺失时，与多拷贝小分子多肽利那洛肽融合，也能够在原核宿主细胞中以包涵体形式高效稳定表达。

实施例12.利那洛肽融合蛋白的加工

融合蛋白B′-LN2经质谱检测，其9299.0840峰与B′-LN2预测理论分子量(9299.6)相符，4647.9067很可能为B′-LN2的双电荷峰，如图12A所示。B′-LN2包涵体样品经胰酶消化，可去除载体蛋白序列，将其双拷贝利那洛肽序列分割成为单拷贝序列，但其C端含有额外的Arg残基；酶切样品的质谱图12B显示，峰位3728.7019对应酶切肽段GlySerHisHisHisHisHisHisGlySerMetPheValAsnGlnHisLeuCysGlySerHisLeuValGluAlaLeuTyrLeuValCysGlyGluArg(理论分子量3730.1，含2个Cys)，峰位1682.4679对应酶切肽段CysCysGluTyrCysCysAsnProAlaCysThrGlyCysTyrArg(理论分子量1688.9，含6个Cys)。对包含目的多肽的峰位1688.5183进行二级质谱检测，结果如图12E所示，其氨基酸序列归属结果符合预期。经羧肽酶B进一步酶切，可去除上述利那洛肽片段C端含有的额外Arg残基；如质谱图12C结果所示，羧肽酶B切除酶切肽段(CysCysGluTyrCysCysAsnProAlaCysThrGlyCysTyrArg)C端Arg残基后可以得到目的多肽利那洛肽(理论分子量1532.7)，对应峰位为1526.3960。推测胰酶酶切过程中存在空气氧化，导致上述质谱结果与预测理论值存在较大差值。如图12D所示，将胰酶酶切样品经DTT进一步还原，出现预测理论峰位1688.5183，证实了上述推测。

实施例13：包涵体标签BA与人转甲状腺素蛋白的融合表达

人转甲状腺素蛋白(transthyretin，TTR)单体(SEQ ID No：34)，含有127个氨基酸残基，该蛋白由细菌表达时可能存在对宿主细胞的毒性作用，导致其表达水平很低(Murrell JR，Schoner RG，Liepnieks JJ，et al.Production and functional analysis of normal and variant recombinant human transthyretin proteins.J Biol Chem.1992；267：16595-600)，需要其它策略提高表达(Liu L，Hou J，Du J，et al.Differential modification of Cys10 alters transthyretin’s effect on beta-amyloid aggregation and toxicity.Protein Eng Des Sel.2009；22：479-88)，我们尝试使用新型包涵体标签对其进行融合表达。

TTR基因(SEQ ID No：33)的三个外显子，以人HeLa细胞基因组DNA为模板，分别用引物ggcaccggtgaatccaag与ctccagactcactggttttcccagaggcaaatggctcc、ggagccatttgcctctgggaaaaccagtgagtctggag与cgttggctgtgaataccacctctgcatgctcatggaatg、cattccatgagcatgcagaggtggtattcacagccaacg与ataaagcttaagatctttccttgggattggtgacg扩增，并混合后用引物ataggatccggccctacgggcaccggtgaatccaag和ataaagcttaagatctttccttgggattggtgacg进行overlap PCR，获得的TTR基因的PCR产物经BamHI和HindIII双酶切，插入表达载体pQE80L或BA-/pQE80L的BamHI和HindIII酶切位点，获得TT/pQE80L和BA-TT/pQE80L表达载体，分别编码蛋白序列SEQ ID No：35和SEQ ID No：36。

将获得的表达载体TT/pQE80L和BA-TT/pQE80L，转入E.coli TG1感受态细胞，得到目的工程菌株；在对数生长期(OD₆₀₀＝0.8)，经1mM IPTG诱导表达21h，收取样品。图12结果显示，非融合蛋白TT的表观分子量与理论分子量(15403.1Da)符合，融合蛋白BA-TT的表观分子量与理论分子量(28145.5Da)符合。诱导全菌样品中TT和BA-TT相比，融合蛋白BA-TT表达量明显高于TT；非融合蛋白TT主要为可溶性表达，符合文献报道；但提取上清可溶蛋白时，收取率明显低于预期应收取的产量，如图13中TT诱导上清样品(S)所示。而融合蛋白BA-TT主要以包涵体形式表达，无明显损失。

实施例14：包涵体标签BA与随机多肽X的融合表达

我们在克隆融合蛋白的过程中，获得一个BA与一未知DNA序列融合的表达载体BA-X/pQE80L，编码一个融合蛋白序列SEQ ID No：39。序列测定显示，该未知DNA为大肠杆菌yrbF编码序列BamHI和HindIII酶切片段，反向插入上述载体，与BA共码融合表达，其DNA序列(SEQ ID No：37)编码随机多肽X(SEQ ID No：38)，它由39个氨基酸残基组成，其中多个Pro残基间隔存在。经计算机二级结构预测，该随机多肽是一种非天然、无结构的多肽。

将获得的表达载体BA-X/pQE80L，转入E.coli TG1感受态细胞，得到目的工程菌株；在对数生长期(OD₆₀₀＝0.4)，经0.1mM IPTG诱导表达20h。Tricine-SDS-PAGE(图14左)结果显示，融合蛋白BA-X的表观分子量与理论分子量(12069.7Da)符合，且无明显降解产物，BA-X以包涵体形式高效表达；Western blot(图14右)结果显示，表达条带为含有His Tag的目的蛋白。融合蛋白BA-X表达量为88.0±3.2mg/L(n＝3)。

本例表明，新型融合载体蛋白对多种多样的多肽包括非天然肽，同样具有很好的促表达作用。

Claims

一种用于表达目的蛋白或多肽的可作为包涵体标签的融合载体蛋白，其特征在于，所述的融合载体蛋白的氨基酸序列来源于胰岛素的氨基酸序列或其经过取代、缺失和/或增加一个或几个氨基酸的氨基酸序列、或上述氨基酸序列经过常规修饰后形成的氨基酸序列、或上述氨基酸序列加入标签后形成的氨基酸序列。
根据权利要求1的融合载体蛋白，其特征在于，所述的常规修饰包括乙酰化、酰胺化、环化、糖基化、磷酸化、烷基化、生物素化、荧光基团修饰、聚乙二醇PEG修饰、固定化修饰；所述的标签包括6×His、GST、EGFP、MBP、Nus、HA、IgG、FLAG、c-Myc、Profinity eXact。
根据权利要求1的融合载体蛋白，其特征在于，所述的融合载体蛋白包括：(1)人胰岛素A亚基，即SEQ ID No：2所示的氨基酸序列；或(2)在(1)中的氨基酸序列经过取代、缺失和/或增加一个或几个氨基酸，且编码可融合表达的氨基酸序列。
根据权利要求1的融合载体蛋白，其特征在于，所述的融合载体蛋白包括：(1)人胰岛素B亚基，即SEQ ID No：4所示的氨基酸序列；或(2)在(1)中的氨基酸序列经取代、缺失和/或增加一个或几个氨基酸，且编码可融合表达的氨基酸序列。
根据权利要求1的融合载体蛋白，其特征在于，所述的融合载体蛋白包括：(1)是同时含有人胰岛素A亚基与B亚基的单链蛋白分子；或(2)是在(1)中之单链分子变体，其含有人胰岛素A亚基和/或B亚基，经取代、缺失和/或增加一个或几个氨基酸，且编码可融合表达的氨基酸序列。
根据权利要求4的融合载体蛋白，其特征在于，所述的融合载体蛋白包括SEQ ID No：6所示的氨基酸序列。
根据权利要求5的融合载体蛋白，其特征在于，所述的融合载体蛋白包括SEQ ID No：8、SEQ ID No：9或SEQ ID No：25所示的氨基酸序列。
一种融合蛋白，其特征在于，所述的融合蛋白含有权利要求1所述融合载体蛋白以及至少一个目的蛋白或多肽，且该目的蛋白或多肽不是胰岛素。
根据权利要求8的融合蛋白，其特征在于，所述的融合蛋白中融合载体蛋白与目的蛋白或多肽之间可以含有特异性多肽切割位点或序列。
根据权利要求8的融合蛋白，其特征在于，所述的融合蛋白可进行常规修饰或加入表达纯化标签。
根据权利要求10的融合蛋白，其特征在于，所述的常规修饰包括乙酰化、酰胺化、环化、糖基化、磷酸化、烷基化、生物素化、荧光基团修饰、聚乙二醇PEG修饰、固定化修饰；所述的标签包括6×His、GST、EGFP、MBP、Nus、HA、IgG、FLAG、c-Myc、Profinity eXact。
根据权利要求8的融合蛋白，其特征在于，所述的融合蛋白中目的蛋白或多肽含有5-1000个氨基酸残基。
根据权利要求8的融合蛋白，其特征在于，所述的融合蛋白中，可以含有1、2、3、4个目的蛋白或多肽。
根据权利要求8的融合蛋白，其特征在于，所述的融合蛋白中目的蛋白或多肽选自GLP-1、胃泌酸调节素、恩夫韦肽、利那洛肽、人转甲状腺素蛋白，及它们的变体。
根据权利要求14的融合蛋白，其特征在于，所述的融合蛋白选自SEQ ID No：12、SEQ ID No：13、SEQ ID No：14、SEQ ID No：17、SEQ ID No：18、SEQ ID No：21、SEQ ID No：27、SEQ ID No：30、SEQ ID No：31、SEQ ID No：32、SEQ ID No：36、SEQ ID No：39所示的氨基酸序列。
一种核酸分子，其特征在于，所述核酸分子含有编码权利要求1-7任一项所述融合载体蛋白的基因序列。
根据权利要求16的核酸分子，其特征在于，所述核酸分子包括SEQ ID No：1、SEQ ID No：3、SEQ ID No：5、SEQ ID No：7、SEQ ID No：24所示的基因序列。
一种核酸分子，其特征在于，所述核酸分子含有编码权利要求8-15任一项所述融合蛋白的基因序列。
一种表达载体，其特征在于，所述表达载体包含权利要求16-17任一项所述核酸分子，连接于载体的启动子用于核酸分子编码蛋白的表达。
一种表达载体，其特征在于，所述表达载体包含权利要求18所述核酸分子，连接于载体的启动子用于核酸分子编码蛋白的表达。
一种宿主细胞，其特征在于，含有权利要求16-17任一项所述的核酸分子或权利要求19所述的表达载体。
一种宿主细胞，其特征在于，含有权利要求18所述的核酸分子或权利要求20所述的表达载体。
权利要求1-7所述的融合载体蛋白或权利要求16-17任一项所述的核酸分子或权利要求19所述的表达载体或权利要求21所述的宿主细胞在促进目的蛋白或多肽表达中的应用。