CN104619726B

CN104619726B - 由超折叠绿色荧光蛋白构成的融合蛋白及其用途

Info

Publication number: CN104619726B
Application number: CN201380016014.6A
Authority: CN
Inventors: 刘文设; 万为
Original assignee: WUHAN PEPTECH PHARMACEUTICAL CO Ltd
Current assignee: WUHAN PEPTECH PHARMACEUTICAL CO Ltd
Priority date: 2012-03-23
Filing date: 2013-03-25
Publication date: 2018-05-18
Anticipated expiration: 2033-03-25
Also published as: WO2013142859A2; US20150051374A1; US9714274B2; US10239922B2; US20180016310A1; US20190144512A1; CN104619726A; WO2013142859A3; US10662231B2

Abstract

本发明涉及使用源于超折叠绿色荧光蛋白及其变体的新的载体蛋白产生含有10到200个氨基酸残基重组肽的方法。

Description

由超折叠绿色荧光蛋白构成的融合蛋白及其用途

相关申请

本申请是要求在2012年3月23日递交的美国临时申请No.61/615,178的权益和优先权，该美国临时申请的全部内容以引用的方式并入本文中。

技术领域

本发明在广义上涉及含有小于200个氨基酸残基的重组肽和一个或多个源于超折叠绿色荧光蛋白或其变体的新的载体蛋白或变体，以及使用源于超折叠绿色荧光蛋白或其突变体的新的载体蛋白生产重组肽的方法。

背景技术

肽是一类生物分子，其被广泛地在许多生物医学研究领域中用作试剂、在疾病的治疗中用作治疗性药物、在检测病原菌中用作诊断剂以及用作生物标记物。合成肽通常有两种方法，一种是化学合成，另外一种是重组表达。化学合成已被用于制备多种治疗性肽，包括可的瑞林、甲状旁腺素(PTH)、胰高血糖素样肽(GLP-1)及其衍生物艾塞那肽和利拉鲁肽、恩夫韦肽、降血钙素、比伐卢定、齐考诺肽、舍莫瑞林、生长瑞林、分泌素、替度鲁肽和胰岛素。该方法需要氨基酸片段的多步缩合而形成肽，同时也需要繁琐的保护、去保护和纯化等步骤。到目前为止，大多数低于50个氨基酸残基的商业化肽是用这种方法生产。由于制药行业和生物医学研究中肽的需求在不断增加，用于化学合成的氨基酸片段的价格也在持续攀升。因此，日常使用的治疗性肽药物比如GLP-1类似物，在未来将难以保持可以承受的价格。尽管化学合成小于50个氨基酸残基的肽在技术上是可行的，但较低的产量以及合成过程中产生的大量的有机废物是相当不合算的。现在，大多数超过50个氨基酸残基的肽是在细菌、酵母、昆虫、哺乳动物等细胞宿主中重组表达的。多年来，使用融合蛋白表达多肽一直是比较常用的方法。可用的载体蛋白包括谷胱甘肽-s-转移酶(W094/04688 and Ray etal.,BioTechnology,11,64,1993)、核酮糖激酶(US patent No.5,206,154 and Callawayet al.,Antimicrob.Agents&Chemo.,37,1614-1919,1993)、gp-55蛋白(Gram H.et al.,Biotechnology,12,1017-1023,1994)、类固醇异构酶(Kuliopulos A.et al.,J.Am.Chem.Soc.,116,4599-4607,1994)、泛素(Pilon A.et al.,Biotecnol.Prog.374-379,1997)、牛凝乳酶原(Hauht et al.,Biotechnolo.Bioengineer.,7,55-61,1998)、GB1结构域(Darrinm et al.,Biochemistry,41,7267-7274,2003)、RNA结合蛋白(Sharon M.etal.,Protein Exp.And Purif.,24,374-383,2002)、SH2结构域(Fairlie W.et al.,Protein Exp.And Purif.26,171-178,2002)、纤维素酶结合蛋白、小泛素样修饰蛋白、内含肽、抗菌/增加通透性的蛋白、碳酸酐酶(US Patent No：5,962,270 and W097/29127)、乳清蛋白(W095/27782)、beta-牛乳糖(Shen S.,PNAS,281,4627-4631,1984)以及氯霉素乙酰转移酶(Dykes C.et al.,European Journal of Biochemistry,174,411-416,1988)。选择这些融合载体是因为它们在宿主细胞内具有相对高的表达水平和快速折叠的特性。虽然可用，但使用融合载体蛋白重组表达的肽的终产率一般不会超过100mg/L。此外，用于肽表达的现在可用的融合蛋白方法有许多技术上的问题，尤其对于产生小于50个氨基酸残基的肽(Vileghe et al.,Drug Discovery Today,15,40-56,2010)。

非常有必要研发一种新的载体蛋白，所述新的载体蛋白克服其它现有载体蛋白产生重组肽的限制。

发明内容

本发明至少部分基于这样的意外发现：超折叠绿色荧光蛋白或其变体当被用作载体蛋白时，在细菌细胞的细胞质或者包涵体中会得到高表达水平的重组肽。因此，本发明的一个方面涉及一种用于构建用于产生作为融合蛋白的重组肽的稳定表达系统的新的载体蛋白。具体而言，所述载体蛋白包括超折叠绿色荧光蛋白或其变体。

在一个实施方案中，所产生的融合蛋白以完整和稳定的形式表达。在一个实施方案中，所述新的载体蛋白容易通过方便的方法去除并且不会使后续的肽纯化步骤复杂化。在本发明的一个实施方案中，所述目标肽被靶向以通过对本发明的载体蛋白进行基因工程而形成包涵体，用于避免细胞内的蛋白水解式降解。依据本发明，提供了一种用于表达目标肽的融合载体蛋白，该融合载体蛋白来自于超折叠绿色荧光蛋白或者其变体，长度包括237个或者更多个氨基酸。优选地，所述的融合载体蛋白的氨基酸序列在结构式I中列出：

T1-A1-T2(I)

其中，

T1为不存在、甲硫氨酸、组氨酸标签或者至少一个肽裂解位点；

Al为超折叠绿色荧光蛋白；

T2为不存在、组氨酸标签或者至少一个肽裂解位点，条件是T1和T2至多有一个不存在。

在实施方案中，Al为超折叠绿色荧光蛋白，所述蛋白具有如下氨基酸序列：Ser-Lys-Gly-Glu-Glu-Leu-Phe-Thr-Gly-Val-Val-Pro-Ile-Leu-Val-Glu-Leu-Asp-Gly-Asp-Val-Asn-Gly-His-Lys-Phe-Ser-Val-Arg-Gly-Glu-Gly-Glu-Gly-Asp-Ala-Thr-Asn-Gly-Lys-Leu-Thr-Leu-Lys-Phe-Ile-Cys-Thr-Thr-Gly-Lys-Leu-Pro-Val-Pro-Trp-Pro-Thr-Leu-Val-Thr-Thr-Leu-Thr-Tyr-Gly-Val-Gln-Cys-Phe-Ser-Arg-Tyr-Pro-Asp-His-Met-Lys-Arg-His-Asp-Phe-Phe-Lys-Ser-Ala-Met-Pro-Glu-Gly-Tyr-Val-Gln-Glu-Arg-Thr-Ile-Ser-Phe-Lys-Asp-Asp-Gly-Thr-Tyr-Lys-Thr-Arg-Ala-Glu-Val-Lys-Phe-Glu-Gly-Asp-Thr-Leu-Val-Asn-Arg-Ile-Glu-Leu-Lys-Gly-Ile-Asp-Phe-Lys-Glu-Asp-Gly-Asn-Ile-Leu-Gly-His-Lys-Leu-Glu-Tyr-Asn-Phe-Asn-Ser-His-Asn-Val-Tyr-Ile-Thr-Ala-Asp-Lys-Gln-Lys-Asn-Gly-Ile-Lys-Ala-Asn-Phe-Lys-Ile-Arg-His-Asn-Val-Glu-Asp-Gly-Ser-Val-Gln-Leu-Ala-Asp-His-Tyr-Gln-Gln-Asn-Thr-Pro-Ile-Gly-Asp-Gly-Pro-Val-Leu-Leu-Pro-Asp-Asn-His-Tyr-Leu-Ser-Thr-Gln-Ser-Val-Leu-Ser-Lys-Asp-Pro-Asn-Glu-Lys-Arg-Asp-His-Met-Val-Leu-Leu-Glu-Phe-Val-Thr-Ala-Ala-Gly-Ile-Thr-His-Gly-Met-Asp-Glu-Leu-Tyr-Lys(SEQ ID NO：l)，或与SEQ ID NO：1至少80％，至少90％，至少95％，至少97％或者至少99％相同的氨基酸序列。

肽裂解位点可以选自例如：Met、Cys、Pro、Asn、Glu、Tyr、Trp、Lys、Arg、Asn-Gly、Asp-Met-Gln-Asp-Ile、Asp-Glu-Val-Asp-Ile、Leu-Glu-Val-Asp-Ile、Trp-Glu-His-Asp-Ile、Leu-Glu-His-Asp-Ile、Val-Glu-Ile-Asp-Ile、Val-Glu-His-Asp-Ile、Ile-Glu-Thr-Asp-Ile、Leu-Glu-Thr-Asp-Ile、Ile-Glu-Ala-Asp-Ile、Asp-Asp-Asp-Asp-Lys、Arg-Gly-Glu-lie、Arg-Gly-Asp-Ile、Arg-Gly-Asp-Ile、Arg-Gly-Asp-Ala、Ile-Glu-Pro-Asp-Ile、Glu-Asn-Leu-Tyr-Phe-Gln-Gly(SEQ ID NO：3)、Glu-Asn-Leu-Tyr-Phe-Gln-Ser(SEQ IDNO：5)，以及在这一领域内已知的任何其他蛋白水解位点。

组氨酸标签优选由三个至八个组氨酸残基组成。

在本发明的一个实施方案中，融合蛋白包括以上限定的融合载体蛋白，连接至少一个目标肽。所述目标肽可以连接到所述融合载体蛋白的C-末端或者N-末端。一般情况下，所述目标肽有10-200个氨基酸的序列长度。

在本发明的一个实施方案中，融合蛋白的DNA序列是经密码子优化的，用于在其细胞宿主中有效翻译。

在本发明的一个实施方案中，所述目标肽优选选自以下的肽：可的瑞林、甲状旁腺素、胰高血糖素样肽及其衍生物艾塞那肽和利拉鲁肽、恩夫韦肽、降血钙素、比伐卢定、齐考诺肽、舍莫瑞林、生长瑞林、分泌素、替度鲁肽和胰岛素原、水蛭素、生长激素、生长因子、生长激素释放因子、促肾上腺皮质激素、释放因子、德舍瑞林、去氨加压素、依降钙素、胰高血糖素、亮丙瑞林、促黄体(生成)激素释放激素、分泌素、生长激素抑制素、促甲状腺激素释放激素、曲普瑞林、血管活性肠肽、干扰素、甲状旁腺激素、BH3肽、β-淀粉样变肽或上述肽的片段。

所述融合蛋白优选还包含在所述融合载体蛋白与所述目标肽之间的裂解位点。

依据本发明，还提供了一种编码上述的融合蛋白的核酸序列。该核酸序列是经密码子优化的，用于在其细胞宿主中有效翻译。

仍依据本发明，提供了一种包括上述核酸序列的表达载体，所述序列连接至用于表达编码所述融合蛋白的所述核酸序列的启动子。所述启动子可以是例如pL启动子、lamda启动子、pBAD启动子、trc启动子或者T7启动子。

依据本发明，提供了一种宿主细胞，例如大肠杆菌(E.coli)Top10、DH5α、DH10b、BL21或者JM101细胞，所述宿主细胞转化有上述表达载体。优选地，所述宿主细胞为大肠杆菌或者枯草芽孢杆菌(B.subtilis)。或者，所述宿主细胞为酵母细胞、昆虫细胞或哺乳动物细胞。

依据本发明，提供了一种产生融合蛋白的方法，包括在适合表达所述表达载体的条件下培养上述宿主细胞，从而产生融合蛋白。所述合适条件可以包括用于诱导所述宿主细胞表达所述表达载体的诱导剂。该诱导剂可以是阿拉伯糖、IPTG或者温度。在本发明的一个实施方案中，所述方法还包括对所产生的融合蛋白进行纯化的步骤。

所述纯化步骤优选包括乙醇沉淀、离子交换、使用Ni-NTA琼脂糖树脂的亲和纯化中的至少一个。在该方法中，所述融合蛋白优选还被蛋白水解消化，以从所述融合蛋白中释放所述目标肽。所述蛋白水解消化可以例如通过溴化氰、甲酸、HCl、凝血酶或者蛋白酶(例如胰蛋白酶)实现。所释放的目标肽可以被HPLC更进一步纯化。

依据本发明，提供了上述融合载体蛋白或核酸用于表达目标肽的用途。所述核酸可以被用于表达载体中，用于表达目标蛋白。上述的宿主细胞也可以用于表达目标蛋白。

本发明中的相关术语定义如下。

本文使用的术语“sfGFP”或“超折叠绿色荧光蛋白”是指这样的多肽，即其来源于或者基于超折叠绿色荧光蛋白的蛋白序列和它的变体(Pedelacq J.D.et al.,NatureBiotechnology,1；79-88,2006；and Tansila N.et al.,Biotechnology Letters,30；1391-1396,2008)，以及其他重排的、截短的变体或其中一些氨基酸已被删除、替换的杂交形式，以及修饰例如其中一个或者多个氨基酸已被变成修饰的如糖基化的氨基酸或非常用氨基酸，条件是所述杂合形式或修饰形式的蛋白保持sfGFP作为载体蛋白的生物学活性。优选的变体中有保守的氨基酸替换，发生在一个或多个预测的非必需氨基酸残基处。“保守氨基酸替换”是指氨基酸残基被具有相似侧链的氨基酸残基替换。具有相似侧链的氨基酸残基的家族在本领域中已有定义。这些家族包括具有碱性侧链(如赖氨酸、精氨酸、组氨酸)、酸性侧链(如天冬氨酸、谷氨酸)、非带电极性侧链(甘氨酸、天冬酰胺、谷酰胺、丝氨酸、苏氨酸、酪氨酸、半胱氨酸)、非极性侧链(如丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、甲硫氨酸、色氨酸)、β-支链的侧链(如苏氨酸、缬氨酸、异亮氨酸)和芳香族侧链(如酪氨酸、苯丙氨酸、色氨酸、组氨酸)的氨基酸。这样，GFP中的预测的非必需氨基酸残基就被来自相同侧链家族的另外的氨基酸残基所替换。或者，在另外一个实施方案中，突变可以例如通过饱和诱变在部分或全部sfGFP编码序列中被随机引入，所得的变体可以被筛选出来以鉴定保持活性的变体。

不包含第一个甲硫氨酸的整个超折叠绿色荧光蛋白的氨基酸序列以及编码该蛋白的DNA的经密码子优化后的核酸序列分别如SEQ ID NO：1和SEQ ID NO：2所示。

所述目标肽是指作为产物的任何小蛋白或寡肽。为了本发明的实际应用，肽应当包括由肽键连接的最少10个氨基酸残基，或由肽键连接的最多200个氨基酸残基。

本文使用的“裂解位点”是指这样的氨基酸序列，其包括氨基酸或氨基酸的序列，该氨基酸或氨基酸的序列为化学试剂或者酶提供了识别位点，以使该肽链在该位点被所述化学试剂或酶裂解。

“转化的宿主细胞”是指包含重组体材料的细菌、酵母、昆虫或哺乳动物细胞，或包含表达重组产物所需的遗传物质的细菌、酵母、昆虫或哺乳动物细胞。遗传物质可以被任何已知的方法引入细胞，这些方法包括转化、转导、电穿孔和转染。通常情况下，在整个本发明中，术语“转化的”或“转化”不是特指以上提及的已知方法的任一种。

除非另有定义，本文使用的所有技术或科学术语与本发明所属的专业领域中的普通技术人员所理解的相同。虽然类似或等同于本文描述的方法和材料可以用于实施或测试本发明，合适的方法和材料如下所述。所有出版物、专利申请、专利和本文提及的其它参考文献都以其整体通过引用并入。在冲突的情况下，以本说明书，包括定义为准。此外，材料、方法和实施例仅是说明性的，而不是为了进行限制。

从以下的详细描述和权利要求书可以很明显地发现本发明的优点和其它特点。

附图说明

图1A和图1B显示了本发明的融合蛋白的可能排列，其中目标肽连接到所述C-末端(图1A)或所述N-末端(图1B)或所述载体蛋白。

图2A和图2B显示了图1A和图1B的融合蛋白的多个实施方案。其中裂解位点(C位点)连接所述载体蛋白和所述目标肽。

图3A和图3B显示了本发明的融合蛋白的其它两个实施方案，目标肽有一个(图3A)或多个(图3B)重复。

图4A和图4B分别显示了两个质粒pSFGFPN-NcoI和pSFGFPC-MCS表达载体，含有用作载体蛋白的超折叠绿色荧光蛋白。

图5显示了在以阿拉伯糖诱导4小时和21小时后，包涵体中的所表达的prolispro-sfGFP融合蛋白的SDS-PAGE。

图6显示了所表达的sfGFP-proinsulin赖脯胰岛素融合蛋白在用胰蛋白酶和羧基肽酶B消化后的SDS-PAGE。

图7显示了纯化的赖脯胰岛素的MOLDI-TOF质谱分析。

图8显示了所表达的sfGFP-PTH融合蛋白的SDS-PAGE。

图9显示了所表达的sfGFP-Calcitonin融合蛋白SDS-PAGE。

图10显示了所表达的sfGFP-GLP1融合蛋白SDS-PAGE。

具体实施方式

通过融合蛋白以可溶或包涵体的形式表达重组肽是公认的方法。本发明利用一种新的载体蛋白，以提供用于产生重组肽的另一种方法。所述载体蛋白源于超折叠绿色荧光蛋白。通过融合蛋白编码并从中释放的重组肽可以根据本文描述的这些方法回收。本发明提供了融合蛋白构建体，以建立一种新的、低成本的且高效率的方法，用于大规模制备重组肽。

依据本发明，因此提供了一种通过使用新的融合蛋白产生重组肽的方法。所述载体蛋白是超折叠绿色荧光蛋白或其变体之一。由超折叠绿色荧光蛋白引导的融合蛋白在大肠杆菌中高表达。所述超折叠的绿色荧光蛋白和所述目标肽可以通过蛋白水解敏感(裂解)位点连接。所述裂解位点通常是特定的氨基酸或氨基酸的特定序列以生成融合蛋白，所述融合蛋白被裂解剂选择性地裂解。裂解剂可以是化学试剂如溴化氰或酸。裂解剂也可以是内肽酶，如胰蛋白酶，、凝血酶，、肠激酶，或另一种其他特异性蛋白酶。

本发明的一个实施方案提供了一种改进的方法，用于在细菌细胞内表达不溶性的包涵体形式的融合蛋白后，获得来自所述细胞的重组肽。该融合蛋白以包涵体形式表达，增加了所述重组肽的产率，并保护了所述目标肽的完整性。

本发明的第二实施方案涉及一种改进的方法，以通过在超折叠绿色荧光蛋白中插入一个或多个组氨酸标签来简化纯化步骤。由化学试剂或内肽酶裂解所述融合蛋白后，所述超折叠绿色荧光蛋白标签可以通过重复组氨酸标签亲和纯化得以除去。籍此，一般可以减少来自其它细胞蛋白裂解过程的污染物。

第三实施方案涉及一种表达所述融合蛋白的方法，其中甲硫氨酸残基连接所述目标肽和所述载体超折叠绿色荧光蛋白。所述融合蛋白以包涵体形式表达，并在变性条件例如用尿素或盐酸胍下纯化。所述融合蛋白可以溶解于甲酸，然后用溴化氰裂解，以释放所述目标肽。在裂解所述融合蛋白后，包含超折叠绿色荧光蛋白的片段可以通过色谱法除去。

第四实施方案涉及一种表达含有甲硫氨酸残基的目标肽的方法。所述融合蛋白以包涵体形式表达，并在变性条件下例如用尿素或盐酸胍纯化。所述融合蛋白可以通过相对生理缓冲液透析而重折叠。然后，可以用蛋白水解酶如胰蛋白酶、TEV蛋白酶或凝血酶裂解所述融合蛋白以释放所述目标肽。在裂解所述融合蛋白后，可以通过色谱去除含有超折叠绿色荧光蛋白的片段。

本发明的第五实施方案涉及所述目标肽与载体蛋白超折叠绿色荧光蛋白的氮末端或碳末端的融合物，如图1A和图1B所示。所述目标肽的大小可以是10到200个氨基酸残基。所述载体蛋白具有SEQ ID NO：1中列出的氨基酸序列。

所述融合蛋白的大小会随着所述目标肽的性质和拷贝数量而有变化。所述融合蛋白应该足够大，以避免被内源性蛋白酶降解。所述融合蛋白可以如图1A和图1B中所示的两种方式进行排列。或者，所述目标肽与载体蛋白(超折叠绿色荧光蛋白)的N-末端或C-末端通过具体氨基酸序列的裂解位点(图2A和图2B)连接。在图2A和图2B中，裂解位点包含的氨基酸或氨基酸的序列，提供了化学反应或酶反应的识别位点，使得所述的化学试剂或酶裂解该位点的肽链。

所述目标肽可以由10到200氨基酸残基的一个或多个连续序列组成。大的肽特别是来源于没有独特三维结构的蛋白序列的那些。多种目标肽可以有如图3A和图3B所示的几种形式。在图3A中，一个包括单个拷贝的所述目标肽。在图3B中，另一个由多个串联重复的单个目标肽组成。每个重复序列可以是相同的或不同的肽，所述重复由“互连”序列连接，所述“互连”序列可以是Met、Lys、Arg、Glu-Asn-Leu-Tyr-Phe-Gln-Gly(SEQ ID NO：3)、Glu-Asn-Leu-Tyr-Phe-Gln-Ser(SEQ ID NO：5)或其他合适的氨基酸序列。所述互连序列不是必须与连接所述载体蛋白和所述目标肽的“连接”序列不同。使用不同的连接连接体提供了这样的优点，即两个或多个不同的裂解剂(如化学物质或酶)可以从所述融合蛋白中逐个地释放所述目标肽并将所述每个目标肽彼此分离。

所述融合的肽的具体实施方案是目标肽可以以单个的或多个连接的重复出现，其包括可的瑞林、甲状旁腺素、胰高血糖素样肽及其衍生物艾塞那肽和利拉鲁肽、恩夫韦肽、降血钙素、比伐卢定、齐考诺肽、舍莫瑞林、生长瑞林、分泌素、替度鲁肽和胰岛素原、水蛭素、生长激素、生长因子、生长激素释放因子、促肾上腺皮质激素、释放因子、德舍瑞林、去氨加压素、依降钙素、胰高血糖素、亮丙瑞林、促黄体(生成)激素释放激素、分泌素、生长激素抑制素、促甲状腺激素释放激素、曲普瑞林、血管活性肠肽、干扰素、甲状旁腺激素、BH3肽、β-淀粉样变肽。这些肽的一个共同特性是它们都具有柔性和脆弱的构象，使它们不稳定，容易蛋白水解式降解。

所述裂解位点和所述目标肽优选经过选择，以使所述目标肽不包含相同裂解位点。所述裂解位点包括Met、Lys、Arg、Glu-Asn-Leu-Tyr-Phe-Gln-Gly(SEQ ID NO：3)、Glu-Asn-Leu-Tyr-Phe-Gln-Ser(SEQ ID NO：5)或其他合适的氨基酸序列。可以设计新的裂解位点，以使用化学裂解剂或酶或这两者的组合。在某些情况下，可能需要利用裂解位点将具体的功能基团引入到所述目标肽的C-末端，比如通过溴化氰裂解。

编码所述目标肽的DNA序列可以获自天然来源(如基因组DNA)，也可以利用细菌细胞或其它宿主细胞的密码子偏爱性通过化学合成获得。

本发明的一个实施方案提供了一种从基因组DNA中扩增编码具体肽的DNA序列的方法。通常情况下，设计两个引物以在PCR产物的两端引入两个独特的限制性内切酶切位点。所述PCR反应在可以控制反应温度的PCR扩增设备上进行。PCR DNA聚合酶，例如Taq酶、Pfu酶、Phusion DNA聚合酶，被用于PCR反应中，反应条件采用供应商提供的方案。PCR产物用至少一种限制性内切酶直接消化，或者若有必要，在被限制性内切酶消化前进行清洗步骤。所述消化反应混合物用DNA纯化方法进行净化。DNA的纯化可以通过使用琼脂糖凝胶电泳或PCR纯化试剂盒来实现。所述纯化的PCR产物作为编码目标肽的插入物。在一些实例中，编码所述目标肽的插入物不能从天然来源获得。在该后一种情形中，编码所述目标肽的DNA片段通过化学合成制备。通常，至少两个寡核苷酸引物是化学合成的，且每一末端至少含有一个限制性内切酶位点。这两个寡核苷酸在中间区域有至少10个碱基对可以是互补或重叠的。PCR扩增可以用于通过重叠的寡核苷酸序列生成完整的插入物。

编码融合蛋白的DNA序列包含至少四个部分，包括亲和标签的DNA序列、载体蛋白(超折叠绿色荧光蛋白)的DNA序列、裂解位点的DNA序列和目标肽的DNA序列。典型地，DNA序列片段的排列可以与图2A和图2B中描述的相同。所述亲和标签的DNA序列可以被插入在融合蛋白DNA序列中的任何位置。该融合蛋白的DNA序列可以被连接到任何的细菌表达质粒中，以构建表达载体。该表达载体含有至少一个启动子，如lac、T7、Tac、lamda、pL或pBAD和一个抗生素标记，如氨苄青霉素，卡那霉素或四环素。

所构建的表达载体可以被转化到细菌宿主细胞以复制质粒，用于小规模DNA制备(小量制备)和测序。所述构建体通过DNA测序以对其进行确认，再将所述表达载体转化细菌宿主细胞以表达所述融合蛋白。含有所述融合蛋白表达载体的细胞可以在存在至少一种抗生素的LB培养基或基本培养基中培养。该融合蛋白的表达被诱导剂诱导，所述诱导剂例如IPTG、半乳糖苷、萘啶酸、温度或阿拉伯糖。

融合蛋白的纯化是指将该融合蛋白从宿主细胞中分离出来的过程。细胞一般通过离心或过滤收集。通常将细胞沉淀重悬在含有50mM磷酸盐、10mM Tris和50mM NaCl的裂解缓冲液中。所述裂解缓冲液可以包含离散剂，例如尿素或盐酸胍。悬浮的细胞可进一步经受French Press或超声处理，以彻底破坏细胞。将所述裂解物离心以从其它成分分离出所需的融合蛋白。在一些情况下，该融合蛋白是以纯包涵体的形式从细胞中分离出来的。所述包涵体可通过常规技术从粗制细胞裂解物中分离，例如通过离心。所述粗制包涵体可以经过初步纯化步骤，例如以50mM磷酸盐、1mM EDTA，pH为7.5的溶液洗一次，然后以含低浓度离散计例如尿素或盐酸胍的相同缓冲液洗涤至少两次。将纯包涵体溶解在高浓度的离散缓冲液中，然后进行重折叠。重折叠过程可以通过在生理缓冲液中进行透析所述悬浮的样品，或通过反相色谱柱除盐，再进行冷冻干燥。在一些情况下，所述融合蛋白以细胞内不溶包涵体形式产生，但没有设计亲和标签。在这种情况下，在裂解物中的所述融合蛋白通过溶剂提取粗纯后再用离子交换色谱法进一步纯化。如果有必要，该融合蛋白可通过反相HPLC进行纯化。在其它情况下，该融合蛋白可以通过亲和色谱法，如作为组氨酸标签结合的Ni-NTA亲和珠，在天然条件下或在变性条件下进行纯化。

在裂解后，所述混合物被用来将所述目标肽从所述载体蛋白分离出来。在一些实例中，该混合物可以直接用于HPLC纯化。将所述混合物的pH值调节到低于3.0，在HPLC纯化之前将样品过滤，以去除固体颗粒。在一些实例中，该混合物用水稀释(如至大约10倍)，并冷冻以干燥，然后用反相HPLC柱纯化，使用含0.1％TFA的乙腈-水梯度。在其他实例中，该混合物最初通过组氨酸标签亲和色谱法和反相色谱法纯化，以除去盐、载体蛋白、未消化的融合蛋白以及非特异性消化的肽。最后，将纯的肽冻干，并由质谱进行确认。

表1列出了下文示例的一些重组肽，它们在本发明中已经被表达。数据显示，目前表达系统可以高效地、高产量地产生纯肽。

表1所表达的重组肽的实例

术语“分离的”或“纯化的”物质指的是大体上或基本上不含在其天然状态正常与其共存的组分的物质。例如，这指原始分离的DNA片段，不排除其他分离的蛋白、基因或者人工后加入的编码区。纯度和均匀度通常用化学分析技术例如聚丙烯酰胺凝胶电泳或高效液相色谱确定。如果蛋白是制品中的主要成分，那么它就是基本纯化的。分离的核酸是与位于基因侧翼且编码所述基因之外的蛋白的其他开放阅读框分离。

本文使用的“分离的”或“纯化的”蛋白或其生物活性部分基本上不含细胞物质或用于获取所述目标蛋白的细胞或组织源中的其它污染蛋白，或者基本不含化学合成时的化学前体或其他化学物。词组“基本不含细胞物质”包括这样的融合蛋白或目标蛋白的制品，即其中所述蛋白已经从其被分离或重组产生的细胞的细胞组分分离。在一个实施方案中，词组“基本不含细胞物质”包括目标蛋白制品，其含有低于约30％(干重)的非目标蛋白(在本文中也称为“污染蛋白”)，更优选低于约20％的非目标蛋白，还更优选低于约10％的非目标蛋白。最优选低于约5％的非目标蛋白。当所述目标蛋白或其生物活性部分是重组生产时，还优选基本上不含培养基，即培养基含量要约少于约20％，更优选少于约10％，最优选少于约5％的蛋白制品的体积。在实施方案中，所述优化的目标蛋白为至少为80％，至少90％，至少95％，或至少98％。

本发明还涉及编码本发明中所述的融合蛋白的核酸。获得该编码所述融合蛋白的核酸可以通过使用已知的任何方法获得(例如，通过使用可与所述序列的3'和5'末端杂交的合成引物的PCR扩增，和/或通过使用所述给定基因需要特异的寡核苷酸序列从cDNA或基因组文库克隆)。

对于所述目标蛋白的重组表达，含有编码该蛋白全部或部分的核苷酸序列的核酸可被插入合适的表达载体中(即包含对所插入的肽编码序列进行转录和翻译的必需元件的载体)。在一些实施方案中，所述调节元件是异源的(即不是其天然基因启动子)。或者，所述必要的转录和翻译信号也可以由所述基因和/或它们的两侧区域的天然启动子提供。

多种宿主载体系统可用于表达所述一个或多个肽编码序列的。这些宿主载体系统包括(但不限于)：(ⅰ)被牛痘病毒、腺病毒等感染的哺乳动物细胞系统；(ⅱ)感染杆状病毒等的昆虫细胞系统；(ⅲ)含有酵母载体的酵母；或(iv)感染噬菌体、DNA、质粒DNA、粘粒DNA的细菌。根据所用的宿主载体系统，可以使用大量的合适转录和翻译元件的任何一个。

表达载体内的启动子/增强子可以利用植物、动物、昆虫或真菌的调控序列，如本发明所提供的。例如，可以使用来自酵母和其它真菌的启动子/增强子元件(如GAL4启动子、醇脱氢酶启动子、磷酸甘油激酶启动子、碱性磷酸酶启动子)。或者或另外，它们可以包括动物转录调控区，例如：(i)胰岛β细胞内有活性的胰岛素基因控制区(参见例如Hanahan,etal.,1985.Nature 315：115122)；(ii)淋巴样细胞内有活性的免疫球蛋白基因控制区(参见例如Grosschedl,et al.,1984.Cell 38：647658)；(iii)肝内有活性的白蛋白基因控制区(参见例如Pinckert,et al.,1987.Genes and Dev 1：268276)；(iv)脑少突胶质细胞内有活性的本髓鞘碱性蛋白基因控制区(参见例如Readhead,et al.,1987.Cell 48：703712)；以及(v)下丘脑内有活性的促性腺激素释放激素基因控制区(参见例如Mason,et al.,1986.Science 234：13721378)，等等。

表达载体或它们的衍生物包括，例如人或动物病毒(如牛痘病毒或腺病毒)、昆虫病毒(例如，杆状病毒)、酵母载体、噬菌体载体(例如λ噬菌体)、质粒载体和粘粒载体。

可以选择这样的宿主细胞株，即其调节插入的目标序列的表达，或按照所需的具体方式对所述序列编码的表达肽进行修饰或加工。另外，在选择的宿主株中在存在某些诱导剂下可以增强某些启动子的表达，从而有利于对基因工程肽表达的控制。此外，对于表达的肽的翻译和翻译后的加工和修饰(例如，糖基化、磷酸化等)，不同的宿主细胞具有特征的或特性的机制。因此可以选择合适的细胞系或宿主系统，以确保实现外源肽的所需的修饰和加工。例如，细菌系统内的肽表达可用于产生非糖基化的核心肽。而在哺乳动物细胞内表达可确保外源肽的“天然的”糖基化。

如上所述，本发明还包括用作载体蛋白的sfGFP的衍生物、片段、同系物、类似物和变体，以及编码这些蛋白或多肽的核酸。对于核酸而言，本文提供的衍生物、片段和类似物被定义为至少有6个(连续的)核酸的序列，并且其具有足够的长度以进行特异性杂交。对于氨基酸而言，本文提供的衍生物、片段以及类似物被定义为至少含有4个(连续的)氨基酸的序列，其长度足以进行表位的特异性识别。

所述片段的长度应小于sfGFP或编码其的核酸所源自的相应全长核酸或多肽的长度。如果衍生物或类似物包含修饰的核酸或氨基酸，所述衍生物和类似物可以是全长的也可以不是全长的。sfGFP的衍生物或类似物包括，例如包括大体上与该蛋白同源的区域的分子，在多个实施方案中，当与比对序列进行对比时，在氨基酸序列上至少约30％、50％、70％、80％、95％、98％或甚至99％的同一性，其中比对通过本领域中已知的计算机同源性程序进行。例如，计算序列同一性可以使用序列分析软件(Sequence Analysis SoftwarePackage of the Genetics Computer Group,University of Wisconsin BiotechnologyCenter,1710 University Avenue,Madison,Wis.53705)来测量，采用其默认参数。

在多肽序列与参照序列的同一性小于100％的情况下，所述不同位置优选是参照序列的保守替换，但不是必须的。保守替换通常包括以下组内的替换：甘氨酸和丙氨酸；缬氨酸、异亮氨酸和亮氨酸；天冬氨酸和谷氨酸；天冬酰胺和谷氨酰胺；丝氨酸和苏氨酸；赖氨酸和精氨酸；以及苯丙氨酸和酪氨酸。因此，本发明包括这样的肽，即其具有突变序列，使得它们保持与具有相应亲本序列的蛋白同源，例如在序列上、在功能上以及在抗原性或其它功能上。例如，这种突变可以是涉及保守氨基酸改变的突变，如广义上相似分子性质的氨基酸之间的改变。例如，脂肪族丙氨酸、缬氨酸、亮氨酸和异亮氨酸内的互换可以认为是保守的。有时甘氨酸替换其中一个也可以被认为是保守的。其他保守互换包括脂肪族天冬氨酸和谷氨酸的替换；酰胺基族天冬酰胺和谷氨酰胺的替换；羟基氨基酸丝氨酸和苏氨酸的替换；芳香族氨基酸苯丙氨酸、酪氨酸和色氨酸的替换；碱性氨基酸赖氨酸、精氨酸和组氨酸的替换；含硫氨基酸甲硫氨酸和半胱氨酸的替换。有时甲硫氨酸和亮氨酸的替换也可以认为是保守的。优选的保守替换组是天冬氨酸-谷氨酸；天冬酰胺-谷氨酰胺；缬氨酸-亮氨酸-异亮氨酸；丙氨酸-缬氨酸；苯丙氨酸-酪氨酸；和赖氨酸-精氨酸。

在具体多肽被认为与确定长度的参照多肽有具体同一性百分比时，所述同一性百分比是相对于所述参照肽的。因此，与100个氨基酸长的参照肽链有50％同一性的肽可以是与所述参照肽的50个氨基酸长度部分完全相同的50个氨基酸多肽。它也可能是一个100个氨基酸长的多肽，与参考多肽在其全长上有50％相同。当然，其它多肽也会满足相同的标准。

在实施方案中，本发明的载体蛋白具有与SEQ ID NO：1至少80％(例如，至少85％，至少90％，至少95％，或至少97％)相同的序列。在实施方案中，本发明的融合蛋白包括目标蛋白和具有与SEQ ID NO：1至少80％(例如，至少85％，至少90％，至少95％，或至少97％)的序列的载体蛋白。在实施方案中，编码所述融合蛋白核酸包括。

本发明还包括所公开的多核苷酸或肽的等位变体；即天然产生的所述分离多核苷酸的替换形式，它们也编码与所述多核苷酸编码的肽相同的、同源或相关的肽。或者，非天然存在的变体可以通过诱变技术或直接合成来产生。

所公开的多核苷酸和肽的物种的同系物也由本发明提供。“变体”是指这样的多核苷酸或多肽，即其与本发明的多核苷酸或多肽不同，但保持它们基本的性质。通常，变体是极其相似的，并且许多区域与本发明的多核苷酸或多肽是相同的。所述变体可以含有编码区、非编码区或两者中的突变。

在一些实施方案中，改变的序列包括这样的插入物，即其使得总的氨基酸序列变长，而蛋白保持转运特性。此外，改变的序列可以包括这样的随机的或设计的内部缺失，即其使得整个氨基酸序列缩短，而蛋白保持运输特性。

本文引用的出版物和专利文件都通过引用并入本文，如同每个出版物或文件都被具体地和单独地指出通过引用并入本文一样。引用出版物和专利文件的目的不是承认任何属于现有技术，也不构成任何承认其内容或日期。本发明现在已经通过书面描述的形式进行描述，本领域技术人员应认识到，本发明可以以多种实施方案来实施，而前面的描述和下面的实施例是为了说明而不是限制后面权利要求。

实施例

实施例1.构建表达载体pSFGFPN-NcoI。

本发明中所有的质粒的构建都按照标准的克隆方法和QuikChange定点突变方法，使用新英格兰生物实验室的高保真DNA聚合酶。所有构建的质粒的序列都通过DNA测序进行验证。所有的寡核苷酸引物是从整合DNA技术公司(Integrated DNA Technologies)购买。

质粒pSFGFPN-NcoⅠ含有编码超折叠绿色荧光蛋白的经密码子优化的基因，所述超折叠绿色荧光蛋白C-末端有6x组氨酸标签。还有NcoⅠ限制性内切酶切位点，它与所述超折叠绿色荧光蛋白基因的编码核苷酸的前两个氨基酸重叠。生成这个位点是用于后续将目标肽基因克隆到质粒中，从而与超折叠绿色荧光蛋白在其C-末端形成融合基因。为了构建pSFGFPN-NcoI，两个寡核苷酸引物

5'-ATTAACCATGGTTAGCAAAGGTG-3'和5'-

GATCTCGAGCTTTAATGGTGATGATGATGGTGGCTGCCTTTATACAG-3'，用于使用聚合酶链反应(PCR)扩增合成的超折叠绿色荧光蛋白DNA。第一引物含有NcoⅠ限制性内切酶切位点；所述第二引物包含XhoI限制性内切酶切位点。SEQ ID NO：2所示的所述超折叠绿色荧光蛋白DNA由Epoch Biolabs公司合成，并被密码子优化，用于在大肠杆菌中有效翻译所编码的超折叠绿色荧光蛋白。将PCR扩增的DNA用NcoI和XhoI限制性内切酶消化三小时。最终消化的DNA通过琼脂糖电泳进行分离。将所述消化的DNA的所需条带切割，使用Qiagen凝胶提取试剂盒进行提取。然后，将所提取的消化的DNA使用T4 DNA连接酶连接到预切的pBAD/Myc-HisA载体(来自Invitrogen公司)上。通过NcoI和XhoI限制性内切酶消化pBAD/Myc-His A获得所述预切的pBAD/Myc-His A载体，并使用Qiagen PCR清洗试剂盒进行清洗。然后，将所述连接的产物以化学法转化Top10细胞中。将所述转化的细胞培养在含有100μg/ml的氨苄青霉素的溶菌肉汤(LB)平板上过夜。挑取5个活菌落，在5ml液体LB培养基中培养，用于使用Qiagen凝胶提取试剂盒进行质粒提取。然后，所述提取的质粒使用两个测序寡核苷酸引物进行测序

5'-CCTACCTGACGCTTTTTATCGCAACTC-3'，和

5'-GGCTGAAAATCTTCTCTCATCCGCC-3'，以确认正确插入。最终得到的质粒被命名为pSFGFPN-NcoⅠ。

实施例2：构建表达载体pSFGFPC-MCS。

质粒pSFGFPC-MCS含有编码超折叠绿色荧光蛋白的密码子优化的基因，所述超折叠绿色荧光蛋白有N-末端6x组氨酸标签。在所述超折叠绿色荧光蛋白基因的C-末端还有多克隆位点(MCS)，包含XhoI、BglⅡ、PstⅠ、KpnI、EcoRI和HindIII的限制性内切酶切位点。生成这个多克隆位点用于后续将目标肽基因克隆到所述质粒中，以与超折叠绿色荧光蛋白在其N-末端形成融合基因。为了获得pSFGFPC-MCS，两个引物5'-ACCATGGTTCACCATCATCATCACCATGCGGCGAGCAA-3'和

5'-ATCTCGAGCTTTATACAGTTCATCCATA-3'被用于使用PCR扩增相同的超折叠绿色荧光蛋白DNA。第一引物含有NcoⅠ限制性内切酶切位点；第二引物含有XhoI限制性内切酶切位点。将PCR扩增的DNA用NcoI和XhoI限制性内切酶消化三小时。最终消化的DNA通过琼脂糖电泳进行分离。将所述消化的DNA的所需条带切割，使用Qiagen凝胶提取试剂盒进行提取。然后，将所提取的消化DNA使用T4 DNA连接酶连接到预切的pBAD/Myc-His A载体(来自Invitrogen公司)上。通过NcoI和XhoI限制性内切酶消化pBAD/Myc-His A获得所述预切的pBAD/Myc-His A载体，并使用Qiagen PCR清洗试剂盒进行清洗。然后，将所述连接的产物以化学法转化Top10细胞中。将所述转化的细胞培养在含有100μg/ml的氨苄青霉素的LB平板上过夜。挑取5个活菌落，在5ml液体LB培养基中培养，用于使用Qiagen凝胶提取试剂盒进行质粒提取。然后，所述提取的质粒使用两个测序寡核苷酸引物进行测序

5'-CCTACCTGACGCTTTTTATCGCAACTC-3'

和5'-GGCTGAAAATCTTCTCTCATCCGCC-3'，以确认正确插入。最终得到的质粒被命名为pSFGFPC-MCS。

实施例3：构建表达载体pSFGFPN-prolispro。

表达载体pSFGFPN-prolispro包含编码人胰岛素类似物赖脯胰岛素的前体蛋白(prolispro；其氨基酸序列如SEQ ID NO：7所示)的基因，所述前体蛋白与超折叠绿色荧光蛋白的N-末端融合，所述超折叠绿色荧光蛋白还有C-末端的6x组氨酸标签。在prolispro基因的前面，插入三肽Met-Ala-Arg编码序列，为的是后续容易地以胰蛋白酶裂解该三肽。在prolispro和超折叠绿色荧光蛋白之间的连接肽是八肽Arg-Glu-Asn-Leu-Tyr-Phe-Gln-Gly。该八肽既可以在Arg之后被胰蛋白酶水解，也可以在Gln-Gly之间被TEV蛋白酶水解。该八肽的DNA序列也被密码子优化，用于在大肠杆菌中有效翻译。为了构建pSFGFPN-prolispro，两个引物5'-GAATTAACCATGGCGCGTTTCGTTAACCAACACCTG-3'和

5'-AACCCATGGCTCCCTGAAAATACAGGTTTTCACGATTACAGTAATTTTC-3'被用于使用PCR扩增合成的prolispro DNA。两个引物都含有NcoⅠ限制性内切酶切位点。所述合成的Prolispro DNA由Epoch Biolab公司提供，SEQ ID NO：8所示的其序列被优化，用于在大肠杆菌中有效翻译。将所述PCR扩增的DNA用NcoⅠ限制性内切酶消化三小时。最终消化的DNA通过琼脂糖电泳进行分离。将所述消化的DNA的所需条带切割，使用Qiagen凝胶提取试剂盒进行提取。然后，将所提取的消化的DNA使用T4 DNA连接酶连接到预切的psfGFPN-NcoI载体上。通过以NcoI和DpnI限制性内切酶消化psfGFPN-NcoI三小时获得所述预切的psfGFPN-NcoI载体，并使用Qiagen PCR清洗试剂盒清洗进行清洗。然后，将所述连接的产物以化学法转化Top10细胞。将所述转化的细胞培养在含有100μg/ml的氨苄青霉素的LB平板上过夜。挑取5个活菌落，在5ml液体LB培养基中培养，用于使用Qiagen凝胶提取试剂盒进行质粒提取。然后，所提取的质粒使用测序寡核苷酸引物5'-CCTACCTGACGCTTTTTATCGCAACTC-3'进行测序，以确认正确插入。最终得到的质粒被命名为pSFGFPN-prolispro。在该质粒中，所述融合基因编码具有如SEQ ID NO：9所示的序列的融合蛋白，具有如SEQ ID NO：10所示的DNA序列。

实施例4：构建表达载体pSFGFPN-proinsulin。

表达载体pSFGFPN-proinsulin含有编码人胰岛素前体蛋白(胰岛素原；其氨基酸序列如SEQ ID NO：11所示，其核苷酸序列如SEQ ID NO：12所示)的基因，所述前体蛋白与超折叠绿色荧光蛋白的N-末端融合，所述超折叠绿色荧光蛋白还有C-末端的6x组氨酸标签。在所述胰岛素原基因的前面，插入三肽的Met-Ala-Arg编码序列，为的是后续容易地以胰蛋白酶裂解该三肽。在胰岛素原和超折叠绿色荧光蛋白之间的连接肽是八肽Arg-Glu-Asn-Leu-Tyr-Phe-Gln-Gly。该八肽既可以在Arg之后被胰蛋白酶水解，也可以在Gln-Gly之间被TEV蛋白酶水解。该八肽的DNA序列也被密码子优化，用于在大肠杆菌中有效翻译。为了构建pSFGFPN-proinsulin，将两个引物5'-CCGAAAACTCGTCGCGAAGCAGAGG-3'

和5'-AGTATAGAAGAAGCCACGTTCACC-3'用于使用PCR扩增表达载体pSFGFPN-proinsulin。使用T4多核苷酸激酶将PCR扩增的DNA磷酸化，然后通过DpnI限制性内切酶消化，以除去原始的pSFGFPN-proinsulin。最终消化的DNA通过琼脂糖电泳进行分离。将所需的条带切割，并使用Qiagen凝胶提取试剂盒进行提取。然后，将所提取的DNA使用T4 DNA连接酶连接到其自身。然后，将所述连接的产物以化学法转化Top10细胞。将所述转化的细胞培养在含有100μg/ml的氨苄青霉素的LB平板上过夜。挑取5个活菌落，在5ml液体LB培养基中培养，用于使用Qiagen凝胶提取试剂盒进行质粒提取。然后，将所述提取的质粒使用测序寡核苷酸引物5'-CCTACCTGACGCTTTTTATCGCAACTC-3'进行测序，以确认正确插入。最终得到的质粒被命名为pSFGFPN-proinsulin。在该质粒中，所述融合基因编码具有如SEQ ID NO：13所示的序列的融合蛋白，具有如SEQ ID NO：14的DNA序列。

实施例5：构建表达载体pSFGFP-proglargine。

表达载体pSFGFPN-proglargine包含编码人胰岛素类似物甘精胰岛素(glargine)的前体蛋白(proglargine；其氨基酸序列如SEQ ID NO：15所示，其核苷酸序列如SEQ IDNO：16所示)的基因，所述前体蛋白与超折叠绿色荧光蛋白的N-末端融合，所述超折叠绿色荧光蛋白有C-末端的6x组氨酸标签。在胰岛素原基因的前面，插入三肽Met-Ala-Arg编码序列，为的是后续容易地以胰蛋白酶裂解该三肽。在proglargin和超折叠绿色荧光蛋白之间的连接肽是八肽Arg-Glu-Asn-Leu-Tyr-Phe-Gln-Gly。该八肽既可以在Arg之后被胰蛋白酶水解，也可以在Gln-Gly之间被TEV蛋白酶水解。该八肽的DNA序列也被密码子优化，用于在大肠杆菌中有效翻译。为了构建pSFGFPN-proglargine，将两个引物5'-CGTGAAAACCTGTATTTTCAGG-3'和5'-GCCACAGTAATTTTCCAGCTTATAC-3'用于使用PCR扩增表达载体pSFGFPN-proglargine。使用T4多核苷酸激酶将PCR扩增的DNA磷酸化，然后通过DpnI限制性内切酶消化，以除去原始的pSFGFPN-proinsulin。最终消化的DNA通过琼脂糖电泳进行分离。将所需的条带切割，并使用Qiagen凝胶提取试剂盒进行提取。然后，将所述提取的DNA使用T4 DNA连接酶连接到其自身。然后，将所述连接的产物以化学法转化Top10细胞。挑取5个活菌落，在5ml液体LB培养基中培养，用于使用Qiagen凝胶提取试剂盒进行质粒提取。然后，将所提取的质粒使用测序寡核苷酸引物5'-CCTACCTGACGCTTTTTATCGCAACTC-3'进行测序，以确认正确插入。最终得到的质粒被命名为pSFGFPN-proglargine。在该质粒中，所述融合基因编码具有如SEQ ID NO：17所示的序列的融合蛋白，具有如SEQ ID NO：18的DNA序列。

实施例6：构建表达载体pSFGFPC-PTH。

表达载体pSFGFPC-PTH包含编码PTH(其氨基酸序列如SEQ ID NO：19所示，其核苷酸序列如SEQ ID NO：20所示)的基因，所述PTH与超折叠绿色荧光蛋白的C-末端与融合，所述超折叠绿色荧光蛋白还有N-末端6x组氨酸标签。超折叠绿色荧光蛋白和PTH之间的连接肽是六肽Glu-Asn-Leu-Tyr-Phe-Gln。该六肽可以被识别，并通过TEV蛋白酶在Gln后水解。此六肽的DNA序列也被密码子优化，用于在大肠杆菌中有效翻译。为了构建pSFGFPC-PTH载体，将两个引物5'-ACCTCGAGATGAAAACCTGTATTTTCAGTCTGTTTCTGAAA-3'

和5'-TCTAATTCCCTTAGAAGTTGTTAAGCTCCTG-3'用于使用PCR的扩增合成的PTH基因。所述第一引物包含XhoI限制性内切酶切位点；所述第二引物包含EcoRⅠ限制性内切酶切位点。合成的PTH基因由Epoch Biolabs公司提供，并且序列被优化，用于在大肠杆菌中有效翻译。将所述PCR扩增的DNA用XhoI和EcoRI限制性内切酶消化三小时。最终消化的DNA通过琼脂糖电泳进行分离。将所述消化的DNA的所需条带切割，并使用Qiagen凝胶提取试剂盒提取。然后，将所提取的消化DNA使用T4 DNA连接酶连接到预切psfGFPC-MCS载体上。通过XhoI和EcoRI限制性内切酶消化psfGFPC-MCS三小时得到预切的psfGFPC-MCS载体，并使用Qiagen PCR清洗试剂盒进行清洗。然后，将所述连接的产物以化学法转化Top10细胞。将所述转化的细胞培养在含有100μg/ml的氨苄青霉素的LB平板上过夜。挑取5个活菌落，在5mlLB液体培养基中培养，用于使用Qiagen凝胶提取试剂盒进行质粒提取。所述提取的质粒使用测序寡核苷酸引物5'--GGCTGAAAATCTTCTCTCATCCGCC-3'进行测序，以确认正确插入。最终得到的质粒被命名为pSFGFPC-PTH。在该质粒中，所述融合基因编码具有如SEQ ID NO：21所示序列的融合蛋白，具有如SEQ ID NO：22的DNA序列。

实施例7：构建表达载体pSFGFPC-calcitonin。

表达载体pSFGFPC-calcitonin包含编码鲑鱼降钙素(其氨基酸序列如SEQ ID NO：23所示，其核苷酸序列如SEQ ID NO：24所示)的基因，所述鲑鱼降钙素与超折叠绿色荧光蛋白的C-末端融合，所述超折叠绿色荧光蛋白还有N-末端6x组氨酸标签。超折叠绿色荧光蛋白和降钙素之间的连接肽是六肽Glu-Asn-Leu-Tyr-Phe-Gln。该六肽可以被识别，并通过TEV蛋白酶在Gln后水解。此六肽的DNA序列也被密码子优化，用于在大肠杆菌中有效翻译。为了构建pSFGFPC-calcitonin，将两个引物

5'-AGCTCGAGATGAAAACCTGTATTTTCAGTGCTCTGCGCTGTC-3'

和5'-TCGAATTCCCTTACGGGGTACCAGA-3'用于使用PCR扩增合成的降钙素基因。所述第一引物包含XhoI限制性内切酶切位点；所述第二引物包含EcoRI限制性内切酶切位点。合成的降钙素DNA由Epoch Biolabs公司提供，并且序列被优化用于在大肠杆菌中有效表达。将所述PCR扩增的DNA以XhoI和EcoRI限制性内切酶消化三小时。最终消化的DNA通过琼脂糖电泳分离。将所述消化的DNA的所需条带切割，并使用Qiagen凝胶提取试剂盒进行提取。然后，将所提取的消化DNA使用T4 DNA连接酶连接到预切psfGFPC-MCS载体。通过以XhoI和EcoRI限制性内切酶消化psfGFPC-MCS三小时得到预切的psfGFPC-MCS载体，并使用QiagenPCR清洗试剂盒进行清洗。然后，将所述连接的产物以化学法转化Top10细胞。将所述转化的细胞培养在含有100μg/ml的氨苄青霉素的LB平板上过夜。挑取5个活菌落，在5 ml液体LB培养基中培养，用于使用Qiagen凝胶提取试剂盒进行质粒提取。然后，将所述提取的质粒使用测序寡核苷酸引物

5'-GGCTGAAAATCTTCTCTCATCCGCC-3'进行测序，以确认正确插入。最终获得的质粒被命名为pSFGFPC–calcitonin。在该质粒中，所述融合基因编码具有如SEQ ID NO：25所示的序列的融合蛋白，具有如SEQ ID NO：26的DNA序列。

实施例8：构建表达载体pSFGFPC-GLP1。

表达载体pSFGFPC-GLP1含有编码GLP-1(其氨基酸序列如SEQ ID NO：27所示，其核苷酸序列如SEQ ID NO：28所示)的基因，所述GLP-1与超折叠绿色荧光蛋白的C-末端融合，所述超折叠绿色荧光蛋白还有N-末端的6x组氨酸标签。超折叠绿色荧光蛋白和PTH之间的连接肽是六肽Glu-Asn-Leu-Tyr-Phe-Gln。该六肽可以被识别，并被TEV蛋白酶在Gln残基后水解。此六肽的DNA序列也被密码子优化，用于在大肠杆菌中有效翻译。为了构建pSFGFPC-GLP1，将两个引物5'-AGCTCGAGATGAAAACCTGTATTTTCAGCACGGTGGTGGTAC-3'

和5'-TCGAATTCCCTTAAGACGGCGGCGGCGCACC-3'用于使用PCR扩增合成的GLP-1基因。所述第一引物包含XhoI限制性内切酶切位点；所述第二引物包含EcoRⅠ限制性内切酶切位点。所述合成的GLP-1 DNA由Epoch Biolabs公司提供，并且所述序列被优化用于在大肠杆菌中有效翻译。将所述PCR扩增的DNA以XhoI和EcoRI限制性内切酶消化三个小时。最终消化的DNA通过琼脂糖电泳进行分离。将所述消化的DNA的所需条带切割，并使用Qiagen凝胶提取试剂盒进行提取。然后，将所提取的消化的DNA使用T4 DNA连接酶连接到预切的psfGFPC-MCS载体。通过以XhoI和EcoRI限制性内切酶消化psfGFPC-MCS三小时得预切的psfGFPC-MCS载体，并使用Qiagen PCR清洗试剂盒进行清洗。然后，将所述连接的产物以化学法转化Top10细胞。将所述转化的细胞培养在含有100μg/ml的氨苄青霉素的LB平板上过夜。挑取5个活菌落，在5ml液体LB培养基中培养，用于使用Qiagen凝胶提取试剂盒进行质粒提取。然后，将所述提取的质粒使用测序寡核苷酸引物

5'-GGCTGAAAATCTTCTCTCATCCGCC-3'进行测序，以确认正确插入。最终得到的质粒被命名为pSFGFPC-GLP-1，在该质粒中，所述融合基因编码具有如SEQ ID NO：29所示的序列的融合蛋白，具有如SEQ ID NO：30的DNA序列。

实施例9：prolispro的表达。

为了表达prolispro-sfGFP蛋白，将经测序确认的psfGFPN-prolispro质粒以化学法转化大肠杆菌Top10细胞。将所述转化的细胞培养在含有100μg/ml的氨苄青霉素的LB平板上过夜。挑选单菌落，在含有100μg/ml的氨苄青霉素的5ml LB培养基中培养过夜。然后，将所述过夜培养物接种到含有100μg/ml的氨苄青霉素的1L 2YT培养基中，并于37℃培养，直到OD600为0.7。然后，向所述培养基中加入20％阿拉伯糖溶液至0.2％的终浓度，以诱导所述融合蛋白的表达。将所述细胞继续培养22小时，然后离心(4500rpm，20min，4℃)收集。经诱导后3小后，整个细胞培养物变成了绿色。最后收集的细胞沉淀物即使在日光下也表现出强的荧光，这表明prolispro-sfGFP融合蛋白表达量在非常高的水平。

将所收集的细胞悬浮于20ml裂解缓冲液(50mM HEPES，pH 7.4、500mM NaCl、10mMDTT、10％甘油、0.1％的Triton X-100、5mM咪唑和1μg/ml溶菌酶)。将所述悬浮细胞超声处理，并使裂解物通过离心(10200rpm，60min，4℃)变澄清。上清液和细胞碎片的后SDS-PAGE分析表明：大部分的融合蛋白是以不溶形式的包涵体表达的，因此，发明人接着进行包涵体纯化方案，以纯化表达的prolispro-sfGFP融合蛋白。弃去上清液，将沉淀物重新悬浮于40ml洗涤缓冲液中，所述洗涤缓冲液含有50mM Tris-盐酸(pH8.0)、100 mM NaCl、0.1％NaN3和0.5％的Triton-X 100，并再次离心(10200rpm，20min，4℃)。此后，弃去上清液，将沉淀物再在不含Triton-X-100的相同40ml的洗涤缓冲液重新悬浮，并离心(10200rpm，20min，4℃)。将该过程再重复两次。SDS-PAGE分析表明为相当纯的包涵体。将最后的沉淀物重新悬浮在8M尿素，然后使用Ni-NTA树脂在变性条件下进行纯化。该prolispro-sfGFP融合蛋白的最终确定表达水平为1.5g/L，这相当于350mg/L的prolispro。还测试了prolispro-sfGFP融合蛋白表达的时间依赖。收集诱导4小时和21小时的细胞，然后纯化它们的包涵体。图5显示出了在两种情况下的相对表达水平。显而易见的是，21小时诱导得到了表达量要高得多的prolispro-sfGFP融合蛋白。

实施例10：对prolispro-sfGFP融合蛋白进行加工，以获得成熟的赖脯胰岛素。

为了获得成熟的赖脯胰岛素，对所述prolispro-sfGFP融合蛋白使用快速重折叠方法进行重折叠。将所述Ni-NTA纯化的prolispro-sfGFP存储在8M尿素和10mM Tris-HCl(pH为9.2)。然后，将含有10mM Tris-HCl(pH 9.2)、10mM甘氨酸、1mM EDTA和4.5mM胱氨酸的重折叠缓冲液缓慢加入到prolispro-sfGFP溶液中，达到1：1的最终体积比。接着，将半胱氨酸加入到上述溶液中，至0.5mM的终浓度，并通过反转管2-3次轻轻的混合，然后将管置于孵育箱中，不加搅拌在30℃下维持45min。在胱氨酸和半胱氨酸的存在下形成二硫键，引导prolispro的正确折叠。然后进行过夜透析，将所述折叠的prolispro-sfGFP蛋白的缓冲液改变为消化缓冲液(50mM Tris-HCl，pH 9.0)。

透析后，收集所述prolispro-sfGFP溶液，并浓缩至1mg/ml，然后用胰蛋白酶(E/S：1：600，W/W)和羧肽酶B(E/S：1：600，W/W)在4℃下消化5小时。然后，加入0.5μg/ml亮抑酶肽以终止消化反应。图6是显示了prolispro-sfGFP蛋白用胰蛋白酶和羧基肽酶B消化之前和之后的SDS-PAGE凝胶。所述凝胶清楚地显示了由prolispro-sfGFP融合蛋白变成赖脯胰岛素的所需过程。所述凝胶中的赖脯胰岛素带与市售胰岛素的带清楚地匹配。所述凝胶还显示了正确的折叠过程。另一方面，胰蛋白酶也识别B链中的精氨酸残基，得到了小得多的消化产物条带。

然后，将prolispro-sfGFP融合蛋白的胰蛋白酶和羧肽酶B消化的产物相对于含50mM磷酸钠(pH 8)的缓冲液透析，然后上柱在Sephedex G-25凝胶过滤柱(来自GEHealthcare)。使用相同缓冲液将不同消化产物从所述柱中洗脱。收集含有赖脯胰岛素的级分，并浓缩至1mg/ml。最终获得的纯赖脯胰岛素的产率大约为200mg/L。对所述纯化的赖脯胰岛素进行MALDI-TOF质谱分析。在图7中所示的检测出分子量为5733.6Da，这恰好与理论分子量相符合。

实施例11：proinsulin-sfGFP融合蛋白的表达。

为了表达所述proinsulin-sfGFP融合蛋白，将经测序确认的pSFGFPN-proinsulin的质粒以化学法转化大肠杆菌Top10细胞。将所述转化的细胞培养在含有100μg/ml的氨苄青霉素的LB平板上过夜。挑选单菌落，在含有100μg/ml的氨苄青霉素的5ml LB培养基中培养过夜。然后，将过夜培养物用于接种含有100μg/ml的氨苄青霉素的1L 2YT培养基中，并于37℃培养，直到OD600为0.7。然后，向所述培养基中加入20％阿拉伯糖溶液至0.2％的终浓度，以诱导所述融合蛋白的表达。来自所述包涵体的所述表达的融合蛋白的后续纯化步骤都与prolispro-sfGFP融合蛋白的步骤相同。所述proinsulin-sfGFP融合蛋白的最终确定的表达水平为145mg/L，这对应于约350mg/L的胰岛素原表达水平。

实施例12：proglargine-sfGFP融合蛋白的表达。

为了表达所述proglargine-sfGFP融合蛋白，将经序列确认的psfGFPN-proglargine的质粒用于以化学法转化大肠杆菌Top10细胞。将所述转化的细胞培养在含有100μg/ml的氨苄青霉素的LB平板上过夜。挑选单菌落，在含有100μg/ml的氨苄青霉素的5mlLB培养基中培养过夜。然后，将所述过夜培养物用于接种含有100μg/ml的氨苄青霉素的1L2YT培养基中，并于37℃培养，直到OD600为0.7。然后，向所述培养基中加入20％阿拉伯糖溶液至0.2％的终浓度，以诱导所述融合蛋白的表达。来自所述包涵体的所述表达的融合蛋白的后续纯化步骤都与prolispro-sfGFP融合蛋白的步骤相同。所述proglargine-sfGFP融合蛋白的最终确定的表达水平为140mg/L，这对应于约345mg/L的胰岛素原表达水平。

实施例13：sfGFP-PTH融合蛋白的表达。

为了表达所述sfGFP-PTH融合蛋白，将经测序确认的psfGFPC-PTH质粒用于以化学法转化大肠杆菌Top10细胞。将所述转化的细胞培养在含有100μg/ml的氨苄青霉素的LB平板上过夜。挑选单菌落，在含有100μg/ml的氨苄青霉素的5ml LB培养基中培养过夜。然后，将所述过夜培养物用于接种含有100μg/ml的氨苄青霉素的1L 2YT培养基中，并于37℃培养，直到OD600为0.7。然后，向所述培养基中加入20％阿拉伯糖溶液至0.2％的终浓度，以诱导所述融合蛋白的表达。将所述细胞继续培养16小时，然后通过离心(4500rpm，20min，4℃)收集。

将所述收集的细胞再悬浮于20ml裂解缓冲液(50mM HEPES，pH 7.4、500mM NaCl、10mM DTT、10％甘油、0.1％的Triton X-100、5mM咪唑和1μg/ml溶菌酶)。将所述再悬浮的细胞超声处理，并使裂解物通过离心(10200rpm，60min，4℃)变澄清。上清液和细胞碎片的后续SDS-PAGE分析表明：部分的所述融合蛋白在胞质中以可溶形式表达，部分的所述融合蛋白在包涵体中以不溶性形式表达。由于所述可溶性蛋白容易处理，发明人将所述上清液与Ni-NTA树脂混合，并通过以含有250mM咪唑的裂解缓洗脱所述树脂来纯化所述可溶性融合蛋白。图8显示出了从Ni-NTA树脂洗脱的sfGFP-PTH融合蛋白的不同组分，表明了高纯度。最终得到的sfGFP-PTH融合蛋白的确定的表达产率是600mg/L，这相当于PTH自身60mg/L的表达水平。鉴于部分的所述融合蛋白在包涵体中，所述sfGFP-PTH融合蛋白和PTH的真实表达水平更高。所述纯化的sfGFP-PTH融合物还被TEV蛋白酶消化，以释放PTH。将所述消化的产物用C18柱的反相HPLC进一步分离，使用含0.1％TFA的乙腈-水梯度，以获得纯的PTH。

实施例14：sfGFP-calcitonin融合蛋白的表达。

为了表达所述sfGFP-calcitonin融合蛋白，将经测序确认的psfGFPC-calcitonin质粒用于以化学法转化大肠杆菌Top10细胞。将所述转化的细胞培养在含有100μg/ml的氨苄青霉素的LB平板上过夜。挑选单菌落，在含有100μg/ml的氨苄青霉素的5ml LB培养基中培养过夜。然后，将所述过夜培养物用于接种含有100μg/ml的氨苄青霉素的1L 2YT培养基中，并于37℃培养，直到OD600为0.7。然后，向所述培养基中加入20％阿拉伯糖溶液至0.2％的终浓度，以诱导所述融合蛋白的表达。将所述细胞继续培养16小时，然后通过离心(4500rpm，20min，4℃)收集。

将所述收集的细胞再悬浮于20ml裂解缓冲液中(50mM HEPES，pH 7.4、500mMNaCl、10mM DTT、10％甘油、0.1％的Triton X-100、5mM咪唑和1μg/ml溶菌酶)。将所述再悬浮的细胞超声处理，并使裂解液通过离心(10200rpm，60min，4℃)变澄清。同PTH相似，上清液和细胞碎片的后续SDS-PAGE分析表明：部分的所述融合蛋白在胞质中以可溶形式表达，分的所述融合蛋白在包涵体中以不溶性形式表达。发明人对来自所述上清液的所述融合蛋白进行纯化。将所述上清液与Ni-NTA树脂混合，并通过以含有250mM咪唑的裂解缓洗脱所述树脂来纯化所述可溶性融合蛋白。最终得到的sfGFP-calcitonin融合物的确定的表达产率是500mg/L，这相当于降钙素自身50mg/L的表达水平。通过在不同时间收集细胞并分析来自细胞质的纯化的融合蛋白，还分析了所述融合蛋白表达的诱导时间依赖性。图9显示了约8-10诱导表达水平达到最高。所述纯化的sfGFP-calcitonin融合物也可通过TEV蛋白酶消化以释放降钙素。将所述消化的水解产物使用C18柱上的反相HPLC进一步分离，使用含0.1％TFA的乙腈-水梯度洗脱，能够以获得纯的降钙素。

实施例15：GLP-1的表达。

为了表达所述sfGFP-GLP-1融合蛋白，将经过测序确认的psfGFPC-GLP1质粒通过以化学法转化大肠杆菌Top10细胞。将所述转化的细胞培养在含有100μg/ml的氨苄青霉素的LB平板上过夜。挑选单菌落，在含有100μg/ml的氨苄青霉素的5ml LB培养基中培养过夜。然后，将所述过夜培养物用于接种含有100μg/ml的氨苄青霉素的1L 2YT培养基中，并于37℃培养，直到OD600为0.7。然后，向所述培养基中加入20％阿拉伯糖溶液至0.2％的终浓度，以诱导融合蛋白的表达。将所述细胞继续培养16小时，然后通过离心(4500rpm，20min，4℃)收集。

将所述收集的细胞再悬浮于20ml裂解缓冲液中(50mM HEPES，pH 7.4，、500mM氯化钠，、10mM DTT、10％甘油、0.1％的Triton X-100、5mM咪唑和1μg/ml溶菌酶)。将所述再悬浮的细胞超声处理，使所述裂解液通过离心(10200rpm，60min，4℃)变澄清。与PTH和降钙素类似，所述上清液和所述细胞碎片的后续SDS-PAGE分析表明：部分的所述融合蛋白在胞质中以可溶形式表达，部分的所述融合蛋白在包涵体中以不溶性形式表达。发明人对来自所述上清液的所述融合蛋白进行纯化。将所述上清液与Ni-NTA树脂混合，通过以含有250mM咪唑的裂解缓洗脱所述树脂来纯化所述可溶性融合蛋白。图10所示的所述纯化的融合蛋白的SDS-PAGE分析表明了高纯度。最终得到的sfGFP-GLP-1融合物的确定的表达产率是500mg/L，这相当于GPL-1自身65mg/L的表达水平。所述纯化的sfGFP-GLP-1融合物也可被TEV蛋白酶消化以释放降钙素。将所述消化的产物使用C18柱上的反相HPLC进一步分离，使用含0.1％TFA的乙腈-水梯度以获得纯的降钙素。

通过引用并入

本文提及的每篇专利文件和科学文章的整个公开物都通过引用并入，用于所有目的。

等价物

在背离其原则和基本特征的情况下，本发明能够以其他具体的形式具体实现。因此，前面所述的具体实施方案在所有方面被认为是用于说明，而不是对本文所述发明的限制。因此，本发明的范围不是由前面的描述而是由附加的权利要求书所阐明，并且落在权利要求的等价意义和范围内的所有改变都意欲被包含于其中。

Claims

1.一种融合蛋白，所述融合蛋白包括融合载体蛋白连接至至少一个目标肽，

其中所述融合载体蛋白具有结构式I中列出的氨基酸序列：

T1-A1-T2(I)，

其中，T1为不存在、甲硫氨酸、组氨酸标签或者至少一个肽裂解位点；

A1为超折叠绿色荧光蛋白，其氨基酸序列如下：Ser-Lys-Gly-Glu-Glu-Leu-Phe-Thr-Gly-Val-Val-Pro-Ile-Leu-Val-Glu-Leu-Asp-Gly-Asp-Va1-Asn-Gly-His-Lys-Phe-Ser-Val-Arg-Gly-Glu-Gly-Glu-Gly-Asp-Ala-Thr-Asn-Gly-Lys-Leu-Thr-Leu-Lys-Phe-Ile-Cys-Thr-Thr-Gly-Lys-Leu-Pro-Val-Pro-Trp-Pro-Thr-Leu-Val-Thr-Thr-Leu-Thr-Tyr-Gly-Val-Gln-Cys-Phe-Ser-Arg-Tyr-Pro-Asp-His-Met-Lys-Arg-His-Asp-Phe-Phe-Lys-Ser-Ala-Met-Pro-Glu-Gly-Tyr-Val-Gln-Glu-Arg-Thr-Ile-Ser-Phe-Lys-Asp-Asp-Gly-Thr-Tyr-Lys-Thr-Arg-Ala-Glu-Val-Lys-Phe-Glu-Gly-Asp-Thr-Leu-Val-Asn-Arg-Ile-Glu-Leu-Lys-Gly-Ile-Asp-Phe-Lys-Glu-Asp-Gly-Asn-Ile-Leu-Gly-His-Lys-Leu-Glu-Tyr-Asn-Phe-Asn-Ser-His-Asn-Val-Tyr-Ile-Thr-Ala-Asp-Lys-Gln-Lys-Asn-Gly-Ile-Lys-Ala-Asn-Phe-Lys-Ile-Arg-His-Asn-Val-Glu-Asp-Gly-Ser-Val-Gln-Leu-Ala-Asp-His-Tyr-Gln-Gln-Asn-Thr-Pro-Ile-Gly-Asp-Gly-Pro-Val-Leu-Leu-Pro-Asp-Asn-His-Tyr-Leu-Ser-Thr-Gln-Ser-Val-Leu-Ser-Lys-Asp-Pro-Asn-Glu-Lys-Arg-Asp-His-Met-Val-Leu-Leu-Glu-Phe-Val-Thr-Ala-Ala-Gly-Ile-Thr-His-Gly-Met-Asp-Glu-Leu-Tyr-Lys(SEQ ID N0:1)，

T2为不存在、组氨酸标签或者至少一个肽裂解位点，条件是T1和T2至多有一个不存在，

其中所述目标肽选自赖脯胰岛素的前体蛋白、人胰岛素前体蛋白、甘精胰岛素的前体蛋白、甲状旁腺素、降钙素、胰高血糖素样肽、艾塞那肽和利拉鲁肽。

2.权利要求1的融合蛋白，其中所述肽裂解位点选自：Arg-Glu-Asn-Leu-Tyr-Phe-Gln-Gly、Glu-Asn-Leu-Tyr-Phe-Gln。

3.权利要求1的融合蛋白，其中所述组氨酸标签由三个至八个组氨酸残基组成。

4.权利要求1的融合蛋白，其中所述融合蛋白为SEQ ID No：9、13、17、21、25或29的氨基酸序列。

5.权利要求1-3任一项的融合蛋白，其中所述目标肽连接至所述融合载体蛋白的N-末端。

6.权利要求1-3任一项的融合蛋白，其中所述目标肽连接至所述融合载体蛋白的C-末端。

7.权利要求1-3任一项的融合蛋白，还包括在所述融合载体蛋白和所述目标肽之间的肽裂解位点。

8.权利要求1-3任一项的融合蛋白，其中所述融合蛋白是分离的。

9.一种编码权利要求1-7任一项的融合蛋白的核酸。

10.权利要求9的核酸，其中所述核酸为SEQ ID No：10、14、18、22、26或30的序列。

11.权利要求9或10的核酸，其中所述核酸是分离的。

12.一种含有权利要求9或10的核酸的表达载体，所述核酸可操作地连接到用于表达编码所述融合蛋白的所述核酸序列的启动子。

13.权利要求12的表达载体，其中所述启动子是lac启动子、T7启动子、Tac启动子，lamda启动子、pL启动子、trc启动子或pBAD启动子。

14.一种以权利要求12或13的表达载体转化的宿主细胞。

15.权利要求14的宿主细胞，其中所述宿主细胞是大肠杆菌(E.coli)DH5α、DH10b、Top10、BL21、JM101、JM105或者NM522。

16.权利要求14的宿主细胞，其中所述宿主细胞来自于大肠杆菌或枯草芽孢杆菌(B.subtilis)。

17.一种用于产生融合蛋白方法，所述方法包括如下步骤：在适合表达所述表达载体的条件下培养权利要求14-16任一项限定的宿主细胞，从而产生细菌包涵体中的所述核酸编码的融合蛋白。

18.权利要求17的方法，其中所述适合表达所述表达载体的条件包括用于诱导所述宿主细胞表达所述表达载体的诱导剂。

19.权利要求18的方法，其中所述诱导剂是阿拉伯糖、IPTG、萘啶酸或温度。

20.权利要求17的方法，所述方法还包括纯化所产生的融合蛋白的步骤。

21.权利要求20的方法，其中所述纯化步骤包括乙醇沉淀、离子交换、使用Ni-NTA琼脂糖树脂亲和纯化中至少一个。

22.权利要求17的方法，其中对所述融合蛋白进一步进行蛋白水解消化，以从所述融合蛋白释放所述目标肽。

23.权利要求22的方法，其中所述蛋白水解消化通过溴化氰、甲酸或HCl来实现。

24.权利要求22的方法，其中所述蛋白水解消化通过胰蛋白酶、TEV蛋白酶、凝血酶或肠激酶来实现。

25.权利要求22的方法，其中将所述释放的目标肽通过凝胶过滤或HPLC进一步纯化。