CN111132996A

CN111132996A - 用于重组蛋白表达的融合标签

Info

Publication number: CN111132996A
Application number: CN201880062847.9A
Authority: CN
Inventors: M·赫克特; S·扎西特斯凯
Original assignee: Princeton University
Current assignee: Princeton University
Priority date: 2017-07-28
Filing date: 2018-07-27
Publication date: 2020-05-08
Also published as: WO2019023616A1; KR20200037819A; MX2020001058A; SG11202000775SA; AU2018307960B2; AU2018307960A1; JP2020529221A; EP3658574A1; CA3071419A1; US20200216512A1

Abstract

在某些实施方式中，本发明涉及一种融合蛋白，其包含DEEP融合标签和靶蛋白(例如感兴趣蛋白)。在各种其他实施方式中，本发明提供了生产包含DEEP融合标签和靶蛋白的融合蛋白的方法，包含编码DEEP融合标签的核苷酸序列和用于引入编码靶蛋白的核苷酸序列的克隆位点的构建体，以及包含这样的DNA构建体的试剂盒。

Description

用于重组蛋白表达的融合标签

相关申请

本申请要求2017年7月28日提交的美国临时申请号62/538,505的权益。该申请的全部教导内容通过引用并入本文。

通过引用并入ASCII文本文件的材料

该申请通过引用并入与之同时提交的以下ASCII文本文件中包含的序列表：

文件名：53911006001_SEQUENCELISTING.TXT；创建于2018年7月26日，大小为11KB。

背景技术

当前的生物技术时代始于重组DNA的产生和物种间基因的操纵。如今，从基础科学到大规模生产蛋白质药物，该技术已在各种环境中得到广泛实施。尽管操纵重组DNA并将其插入各种不同的宿主生物已变得相对简单，但由该DNA编码的蛋白的表达和纯化仍然具有挑战性。表达重组蛋白的最常用宿主是大肠杆菌。大肠杆菌中蛋白的生产相对快速、廉价、用户友好，并且可以进入不同的细胞区室，例如细胞质或周质，甚至分泌到细胞外。然而，许多期望的蛋白和肽的表达产量和溶解性是不可预测的，并且经常导致在大肠杆菌和/或其他表达宿主中的表达低或甚至没有表达。

解决这些问题的尝试通常涉及构建感兴趣蛋白(POI)与另一种称为融合标签的蛋白的融合体，所述融合标签在许多情况下可以提高表达水平，增强溶解性，降低降解并促进POI的折叠。迄今为止，用于蛋白表达的融合标签通常是来自特定蛋白的天然存在的序列，其在宿主细胞中以高水平表达。然而，没有已知的单个融合标签可以可靠地促进所有POI的产生。因此，通常针对每个新的POI测试许多不同的融合标签，以确定哪些(如果有的话)有助于POI的表达。当前，只有大约十二种天然存在的融合标签已经被很好地表征并且可以商购获得。然而，这些商购可得的融合标签不能促进所有POI的表达，因为即使作为与现有标签的融合体表达时，仍然难以产生一些POI。因此，需要新的融合标签，其通常可以改善POI的表达和纯化，包括难以使用现有标签生产的POI。

发明内容

本发明总体上涉及包含人工融合标签的融合蛋白以及编码这样的融合蛋白的DNA构建体和获得(例如产生)这样的融合蛋白的方法，所述人工融合标签在本文中称为从头(De novo)表达增强蛋白(DEEP)融合标签，其可以增强多种蛋白的表达。

因此，在一个实施方式中，本发明涉及一种融合蛋白，其包含DEEP融合标签和靶蛋白(例如，感兴趣蛋白(POI))。

在另一个实施方式中，本发明涉及一种融合蛋白，其包含DEEP融合标签、胰岛素A链多肽(例如，DEEP融合标签的C端)和胰岛素B链多肽(例如，DEEP融合标签的N端)。

在另一个实施方式中，本发明涉及一种核酸分子，其编码包含DEEP融合标签(例如，包含SEQ ID NO:1的氨基酸序列)和靶蛋白(例如，POI)的融合蛋白。在又一个实施方式中，本发明涉及包含一种宿主细胞(例如大肠杆菌)，其包含编码融合蛋白的核酸分子，所述融合蛋白包含DEEP融合标签(例如，包含SEQ ID NO:1的氨基酸序列)和靶蛋白。

在另一个实施方式中，本发明涉及一种获得靶蛋白的方法，其包括以下步骤：a)将编码融合蛋白的DNA构建体引入到宿主细胞中，其中所述融合蛋白包含DEEP融合标签和靶蛋白；b)在所述宿主细胞中表达所述融合蛋白；c)分离所述融合蛋白；和d)切割所述融合蛋白以将所述DEEP融合标签与所述靶蛋白分开。

在另一个实施方式中，本发明涉及一种构建体，其包含：i)编码DEEP融合标签的核苷酸序列，和ii)用于引入编码靶蛋白的核苷酸序列的克隆位点。

在另外的实施方式中，本发明涉及一种试剂盒，其包含一个或多个DNA构建体，其中DNA构建体各自包含编码DEEP蛋白的核苷酸序列和用于引入编码靶蛋白的核苷酸序列的克隆位点。

如本文所述，DEEP融合标签可以促进宿主细胞中，特别是在大肠杆菌中的多种不同蛋白的表达和产生，包括使用基于天然存在序列的现有融合标签难以表达的蛋白。另外，包含DEEP融合标签的融合蛋白通常在宽的pH值范围(例如4-10的pH)可溶且稳定，而基于天然序列的商购融合标签通常仅在生理pH附近稳定。此外，本文描述的DEEP融合标签也可以用作亲和标签，用于融合蛋白的快速纯化，而不需要另外的亲和标签。

附图说明

图1A-1E涉及DEEP的过表达和纯化。图1A)DEEP蛋白的IMAC纯化(插图：DEEP蛋白的结构，其具有突出显示的表面暴露的12个His残基、深色的亲水残基和浅色的疏水残基)。图1B)IMAC峰#5的SEC纯化和相应的图1C)SDS-PAGE分析(1-全细胞，2-裂解细胞，3-裂解细胞的可溶级分，4/5/6/7/8-IMAC和SEC峰)。图1D)使用分析性C8柱以20％到60％B的线性梯度(A-水，B-MeCN，均添加有0.1％v/v的TFA)对SEC纯化的DEEP进行RP HPLC分析，和图1E)峰的相应ESI-TOF MS分析。

图2A-2C涉及frGFP(折叠报告子GFP)的过表达和纯化。图2A)质粒设计以及接头残基和frGFP的相应序列。图2B)过表达和纯化的与N端融合至1-6xHis、2-DEEP和3-6xHis-SUMO的frGFP的SDS-PAGE。Sol-裂解细胞的可溶级分，HisTrap-IMAC(固定化的金属亲和色谱)和SEC-尺寸排阻色谱。图2C)DEEP-GFP和SUMO-GFP的荧光发射(Ex.：490nm)。

图3A-3D涉及Trp笼的过表达和纯化。图3A)质粒设计和接头残基和Trp笼的相应序列。图3B)在不包含(左凝胶)和包含(中间凝胶)具有以下切割位点：1-DEEP-Met-Trp，2-DEEP-TEV-Trp，3-SUMO-Met-Trp和4-SUMO-TEV-Trp的DEEP和SUMO融合标签的情况下过表达Trp笼。使用IMAC将DEEP-Met-Trp进一步纯化(右凝胶)。预期分子量为：1-14796、2-15460、3-16314和4-16948Da。图3C)IMAC纯化的可溶的和不可溶的级分的表达比较和相应的图3D)HPLC分析。

图4A-4C涉及Aβ_1-42的过表达和纯化。图4A)质粒设计以及接头残基和Aβ_1-42的相应序列。图4B)对1-Aβ_1-42、2-DEEP-Aβ_1-42和3-SUMO-Aβ_1-42过表达的全细胞进行SDS-PAGE分析(左凝胶)。从37℃和18℃诱导的细胞中纯化DEEP-Aβ_1-42(右凝胶)。WC-全细胞，Sol-裂解细胞的可溶级分，Pel-溶解于0.5％w/v十二烷基肌氨酸钠(sarcosyl)的不可溶蛋白级分。预期分子量为：1-4645、2-17465和3-18927Da。图4C)纯化过程的SDS-PAGE。

图5A-5C涉及DEEP-Met-LS3的过表达和纯化。图5A)质粒设计和接头残基和LS3的相应序列。图5B)为了提高蛋白产量，检测了葡萄糖的添加(±表示在添加了1％w/v葡萄糖的LB培养基中过表达)。使用Ni-NTA珠用如实验部分所述的缓冲液进行DEEP-Met-LS3纯化。DEEP-Met-LS3的预期分子量为14865Da。图5C)纯化过程的SDS-PAGE。右侧的凝胶总结了SUMO-LS3和DEEP-LS3的三个表达和纯化实验。

图6A-6D涉及DEEP-Met-Ins的过表达。图6A)质粒设计和相应的序列。图6B)表达和纯化过程的SDS-PAGE。WC-全细胞，Sup1/2/3-清洗步骤的上清液和IBs-重悬的包涵体。DEEP-Ins的预期分子量为18302Da。图6C)重折叠中间体的RP-HPLC色谱图和重折叠产量与βME的关系。图6D)V8蛋白酶的LC-MS分析。三角形是V8的切割位点(在谷氨酸的C端切割)。

具体实施方式

以下是示例性实施方式的描述。

本发明部分基于以下蛋白的发现：当将这些蛋白作为融合标签整合到融合蛋白中时，可以促进多种不同感兴趣蛋白在宿主细胞(尤其是大肠杆菌)中和/或从宿主细胞(尤其是大肠杆菌)的表达、生产和/或纯化。

因此，在一个实施方式中，本发明涉及包含DEEP融合标签和靶蛋白(例如，感兴趣蛋白)的融合蛋白。

“蛋白”、“肽”和“多肽”在本文中可互换使用，以表示具有通过酰胺键共价连接的至少两个氨基酸的聚合物，而不论其长度或翻译后修饰(例如糖基化或磷酸化)。蛋白、肽或多肽可包含任何合适的L-和/或D-氨基酸，例如常见的α-氨基酸(例如丙氨酸、甘氨酸、缬氨酸)，非α-氨基酸(例如β-丙氨酸、4-氨基丁酸、6-氨基己酸、肌氨酸、他汀类(statine))，和非常规氨基酸(例如瓜氨酸、高瓜氨酸、高丝氨酸、正亮氨酸、正缬氨酸、鸟氨酸)。肽上的氨基、羧基和/或其他官能团可以是游离的(例如，未修饰的)或被合适的保护基保护。用于氨基和羧基的合适的保护基团，以及添加或去除保护基团的方法是本领域已知的，并且公开于例如Green and Wuts,“Protecting Groups in Organic Synthesis,”John Wiley andSons,1991。蛋白、肽或多肽的官能团也可以使用本领域已知的方法衍生化(例如，烷基化)或标记(例如，用可检测的标记，例如氟或半抗原)。如果需要，蛋白、肽或多肽可包含一个或多个修饰(例如，氨基酸接头、酰化、乙酰化、酰胺化、甲基化、末端修饰子(例如，环化修饰)，N-甲基-α-氨基取代)。另外，蛋白、肽或多肽可以是已知和/或天然存在的肽的类似物，例如具有保守氨基酸残基置换的肽类似物。

术语“融合蛋白”是指合成的、半合成的或重组的单个蛋白分子，其包含两个或更多个不同蛋白和/或肽的全部或一部分。融合可以是N端融合(相对于DEEP融合标签)、C端融合(相对于DEEP融合标签)或内部融合(相对于DEEP融合标签和/或靶蛋白)。

如本文所用，术语“从头表达增强蛋白融合标签”或“DEEP融合标签”是指具有至少两个(例如2、3、4、5或6个)α-螺旋的多肽，其中α-螺旋各自包含由[PNPPNNP]_n定义的7个氨基酸残基或七肽序列的二元模式序列，其中“P”各自独立选自极性氨基酸残基Lys(K)，His(H)，Glu(E)，Gln(Q)，Asp(D)，Asn(N)，Thr(T)和Ser(S)，“N”各自独立地选自非极性氨基酸残基Phe(F)，Leu(L)，Ile(I)，Met(M)，Val(V)和Trp(W)，并且n是2到10的整数(例如2、3、4、5、6、7、8、9，10)。在DEEP融合标签的特定实施方式中，n＝3。

在包含多于一个七肽序列的α-螺旋中的七肽序列可以是相同的(即，相同七肽序列的重复)，也可以是不同的(即，在相同α-螺旋中的各个PNPPNNP七肽序列可以具有不同的氨基酸序列)。此外，DEEP融合标签中的α-螺旋的氨基酸组成可以在螺旋之间变化，使得例如标签中的每个α-螺旋将具有不同的氨基酸序列。

DEEP融合标签还可以包含另外的氨基酸残基，例如标签中第一个α-螺旋的N-末端和/或最后一个α-螺旋的C-末端。典型地，DEEP融合标签还将在α-螺旋之间包括螺旋间的转角(turn)，其中每个螺旋间的转角包括例如由简并DNA密码子VAN(V:A,G,或C；N:A,G,C,或T)编码的4、5或6个氨基酸残基(例如Gly(G)，His(H)，Gln(Q)，Asn(N)，Asp(D)，Glu(E)和Lys(K))。

DEEP融合标签的长度通常至少约70个氨基酸残基(例如74个氨基酸残基)。在一个特定的实施方式中，DEEP融合标签的长度为至少约100个氨基酸残基(例如102个氨基酸残基)。通常，DEEP融合标签的长度小于约500个氨基酸残基，例如，长度小于约450个氨基酸残基或长度小于约420个氨基酸残基。

在一个特定的实施方式中，DEEP融合标签包含暴露于适当折叠的融合蛋白的表面的多个组氨酸残基。在另一个实施方式中，DEEP融合标签中的每个α-螺旋包含至少一个(例如1、2、3、4、5、6或更多，例如12个)组氨酸残基。

在以下出版物中描述了适合用作本发明中的DEEP融合标签的多肽的具体实例，以及设计和制备这样的多肽的方法，其全部内容各自通过引用并入本文：

·Wei Y,Liu T,Sazinsky SL,Moffet DA,Pelczer I,and Hecht MH(2003),Stably folded de novo proteins from a designed combinatorial library.ProteinScience 12,92–102(参见例如，图2,指示为86,n86,S-23,S-213,S-285,S-824和S-836的蛋白)；

·Kamtekar S,Schiffer JM,Xiong H,Babik JM&Hecht MH(1993),ProteinDesign by Binary Patterning of Polar and Non-Polar Amino Acids.Science 262,1680-1685；

·Wei Y,Kim S,Fela D,Baum J,&Hecht MH(2003),Solution Structure of aDe Novo Protein From a Designed Combinatorial Library.Proc.Natl.Acad.Sci.(USA)100,13270-13273；

·Hecht MH,Das A,Go A,Bradley LH&Wei Y(2004),De Novo Proteins fromDesigned Combinatorial Libraries.Protein Science 13,1711-1723；

·Go A,Kim S,Baum J,&Hecht MH(2008),Structure and Dynamics of De novoProteins from a Designed Superfamily of 4-Helix Bundles.Protein Science 17,821-832；和

·Bradley LH,Kleiner RE,Wang AF,Hecht MH&Wood DW(2005),An Intein-Based Genetic Selection Enables Construction of a High-Quality Library ofBinary Patterned De Novo Sequences.Protein Engineering,Design&Selection(PEDS)18,201-207。

在一个特定的实施方式中，DEEP融合标签包含S-824蛋白的氨基酸序列MYGKLNDLLEDLQEVLKNLHKNWHGGKDNLHDVDNHLQNVIEDIHDFMQGGGSGGKLQEMMKEFQQVLDELNNHLQGGKHTVHHIEQNIKEIFHHLEELVHR(SEQ ID NO:1)或其功能性片段，例如缺少N末端甲硫氨酸残基的片段，基本上由其组成，或由其组成(例如包含)。

在另一个特定的实施方式中，DEEP融合标签包含氨基酸序列YGHLNDLLEDLQEVLHNLHHNWHGGHDNLHDVDNHLQNVIEDIHDFMQGGGSGGHLQEMMHEFQQVLDELNNHLQGGHHTVHHIEQNIHEIFHHLEELVHR(SEQ ID NO:10)或其功能性片段，基本上由其组成，或由其组成(例如包含)。

在其他实施方式中，DEEP融合标签包含SEQ ID NO:1或SEQ ID NO:10的S-824序列的变体氨基酸序列，其与SEQ ID NO:1或SEQ ID NO:10的氨基酸序列分别具有例如至少约70％、75％、80％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高的同一性。如本文所用，术语“序列同一性”是指当两个核苷酸或氨基酸序列例如通过使用默认缺口权重的GAP或BESTFIT程序进行最佳比对时，共享至少例如70％的序列同一性，或至少80％的序列同一性，或至少85％的序列同一性，或至少90％的序列同一性，或至少95％的序列同一性或更多。为了进行序列比较，通常将一个序列用作与测试序列进行比较的参考序列(例如，亲本序列)。可以在给定蛋白的整个长度上或在给定蛋白质的期望片段内检查序列同一性比较。当使用序列比较算法时，将测试序列和参考序列输入计算机，必要时指定子序列坐标，并指定序列算法程序参数。然后，序列比较算法根据指定的程序参数，计算测试序列相对于参考序列的序列同一性百分比。

用于比较的序列的最佳比对可以例如通过Smith&Waterman,Adv.Appl.Math.2:482(1981)的局部同源性算法，通过Needleman&Wunsch,J.Mol.Biol.48:443(1970)的同源性比对算法，通过Pearson&Lipman,Proc.Nat'l.Acad.Sci.USA 85:2444(1988)检索相似性方法，通过这些算法(在Wisconsin Genetics Software Package,Genetics ComputerGroup,575Science Dr.,Madison,Wis.的GAP,BESTFIT,FASTA和TFASTA)的计算机化实施，或通过目视检查(一般参见Ausubel等,Current Protocols in Molecular Biology)。适于确定序列同一性百分比和序列相似性的算法的一个实例是BLAST算法，其描述于Altschul等,J.Mol.Biol.215:403(1990)。进行BLAST分析的软件可通过国家生物技术信息中心公开获得(可通过国立卫生研究院NCBI互联网服务器公开获得)。通常，尽管也可以使用自定义参数，但是默认程序参数可以用于进行序列比较。对于氨基酸序列，BLASTP程序使用字长(W)为3，期望(E)为10和BLOSUM62评分矩阵作为默认值(请参见Henikoff&Henikoff,Proc.Natl.Acad.Sci.USA 89:10915(1989))。

如本文所用，术语“靶蛋白”是指在宿主系统中期望表达的肽或多肽。这样的蛋白在本文中也称为感兴趣蛋白或POI。可以包括在本发明的融合蛋白中的靶蛋白的实例是绿色荧光蛋白(GFP)，β淀粉样(Aβ)多肽，Trp笼蛋白，LS3多肽，胰岛素A链多肽和胰岛素B链多肽。可以包括在本发明的融合蛋白中的靶蛋白的另一个实例是胰岛素或其片段，例如胰岛素A链多肽、胰岛素B链多肽或胰岛素C链多肽或其组合。

在一个实施方式中，靶蛋白包含至少十个氨基酸。在一个实施方式中，靶蛋白包含至少二十个氨基酸。在另一个实施方式中，靶蛋白包含至少三十个氨基酸。在一个特定的实施方式中，靶蛋白包含至少五十个氨基酸。在某个实施方式中，靶蛋白包含至少一百个氨基酸。

通常，靶蛋白不是用于促进另一种异源蛋白的表达和/或纯化的肽标签或多肽结构域。在一个实施方式中，靶蛋白不是具有氨基酸序列DYKDDDDK(SEQ ID NO:2)的FLAG八肽。在一个实施方式中，靶蛋白不是弹性蛋白样蛋白(ELP)。在一个实施方式中，靶蛋白不是内含肽。在一个实施方式中，靶蛋白不是具有氨基酸序列GGC的三肽。

在一个实施方式中，DEEP融合标签位于靶蛋白的N端。在另一个实施方式中，DEEP融合标签位于靶蛋白的C端。

在一些实施方式中，本文公开的融合蛋白是内部融合体(相对于DEEP融合标签和/或靶蛋白)。例如，可以将DEEP融合标签插入靶蛋白中。或者，可以将靶蛋白插入DEEP融合标签中。在一个特定的实施方式中，将靶蛋白插入DEEP融合标签中的螺旋间转角。

除了DEEP融合标签和靶蛋白，本发明的融合蛋白可以包含其他氨基酸序列。在一些实施方式中，本发明的融合蛋白包含接头氨基酸序列(例如，位于DEEP融合标签和靶蛋白之间)。多种接头氨基酸序列是本领域已知的，并且可以用于本发明中。在一些实施方式中，接头序列包含选自Gly、Ser、Thr、His、Asp、Glu、Asn、Gln、Lys和Arg的一个或多个氨基酸残基。在一些实施方式中，接头序列包含聚甘氨酸序列(例如6X甘氨酸序列)。接头的其他实例包括GSAGSAAGSG(SEQ ID NO:12)，GGGGGGSR(SEQ ID NO:13)，KR和RR。在某些实施方式中，接头序列包含切割位点。

在一些实施方式中，本发明的融合蛋白包含切割位点。切割位点是被试剂(例如，诸如蛋白酶的生物试剂，或化学试剂)切割的特定氨基酸或氨基酸序列。

在一个实施方式中，切割位点是蛋白酶切割位点(例如，被TEV蛋白酶识别和切割的位点)。提供几种不同蛋白酶的蛋白酶切割位点的核苷酸序列是本领域已知的，并且包括例如肠肽酶切割位点：DDDDK/；烟草蚀纹病毒蛋白酶切割位点：ENLYFQ/G；Xa因子切割位点：IEGR/；和凝血酶切割位点：LVPR/GS。提供蛋白酶切割位点的其他核苷酸序列包括，例如于Lys和Arg的C端切割的胰蛋白酶；和通过从多肽的C端位置水解Lys和Arg而切割的羧肽酶。因此，本发明的融合蛋白中的切割位点可以被例如肠肽酶、烟草蚀刻病毒蛋白酶、因子Xa、凝血酶、胰蛋白酶或羧肽酶切割。

在另一个实施方式中，切割位点是化学切割位点(例如，被溴化氰(CNBr)识别和切割的位点)。提供用于各种化学试剂进行化学切割位点的核苷酸序列在本领域中是已知的，并且包括例如在甲硫氨酸的C端的CNBr切割：M/；天冬酰胺-甘氨酸上的羟胺切割：N/G；天冬氨酸脯氨酸的甲酸切割：D/P。

在一些实施方式中，本发明的融合蛋白在宽的pH范围内显示出稳定性和/或溶解性。在一个特定的实施方式中，本发明的融合蛋白在约4至约10的pH范围内显示出稳定性和/或溶解性。

通常，在本发明的适当折叠的融合蛋白中，DEEP融合标签的N末端和C末端将彼此紧邻，例如，在允许两个肽链之间的分子间相互作用(例如，二硫键形成)的距离。根据代表性的DEEP融合标签S-824(PDB条目1P68)的核磁共振结构，正确折叠的S-824的N末端和C末端之间的距离为约10埃至约12.4埃的范围。因此，在一些实施方式中，正确折叠的DEEP融合标签的N末端和C末端之间的距离小于约25埃，例如，小于约20埃，小于约15埃或小于约10埃。在一些实施方式中，正确折叠的DEEP融合标签的N末端和C末端之间的距离为约1埃至约25埃，约5埃至约20埃或约5埃至约15埃。

不希望被理论所束缚，据信具有这样的拓扑结构的DEEP融合标签可以用于诱导两个或更多个不同的肽/多肽链或靶蛋白之间的多聚化(例如，二聚化)、分子间折叠和/或二硫键形成。因此，在一些实施方式中，本发明的融合蛋白包含两个或更多个靶蛋白(例如，两个靶蛋白)。在一个实施方式中，DEEP融合标签位于两个靶蛋白之间(例如，第一靶蛋白的N端和第二靶蛋白的C端)。例如，本发明的融合蛋白可以在为胰岛素A链多肽的第一靶蛋白与为胰岛素B链多肽的第二靶蛋白之间包含DEEP融合标签。在这个实例中，DEEP融合标签可以像胰岛素C链多肽一样起作用，并诱导A链和B链之间的二硫化物形成。

在一些实施方式中，融合蛋白包含DEEP融合标签、胰岛素A链多肽和胰岛素B链多肽。在一些实施方式中，胰岛素A链多肽是在DEEP融合标签的C端。在一些实施方式中，胰岛素B链多肽是在DEEP融合标签的N端。在一些实施方式中，胰岛素A链多肽是在DEEP融合标签的C端，和胰岛素B链多肽是在DEEP融合标签的N端。

胰岛素被转录为110个氨基酸的链，有时被称为前胰岛素原(preproinsulin)。人前胰岛素原的氨基酸序列已被指定为UniProt登录号P01308(SEQ ID NO:11)。去除由氨基酸残基1-24组成的前胰岛素原的信号肽产生胰岛素原。具有生物活性的胰岛素是由去除对应于胰岛素C链氨基酸序列的SEQ ID NO:11的氨基酸残基57-87，以及在A链和B链之间形成二硫键而产生。因此，具有生物活性的胰岛素仅包含原始翻译产物的51个氨基酸。除非另有说明，否则本文所用的“胰岛素”涵盖前胰岛素原、胰岛素原和具有生物活性的胰岛素。在一些实施方式中，胰岛素是具有生物活性的胰岛素。在一些实施方式中，胰岛素是胰岛素原。在一些实施方式中，胰岛素是前胰岛素原。

如本文所用，“胰岛素A链多肽”可以是天然存在的或非天然存在的(例如，工程化的)。胰岛素A链多肽可以是重组的或合成的，并且可以是未修饰的或修饰的(例如，翻译后修饰的，例如通过糖基化或磷酸化)。适用于本文所述的融合蛋白和方法的胰岛素A链多肽的实例是本领域已知的，并且包括天然存在的胰岛素A链多肽的变体(例如，与天然存在的胰岛素A链多肽具有至少约70％、约75％、约80％、约85％、约90％、约95％、约96％、约97％、约98％或约99％同一性的变体)，例如来自人的胰岛素A链多肽。在一些实施方式中，胰岛素A链多肽是具有指定为UniProt登录号P01308(SEQ ID NO:11)的人胰岛素的氨基酸残基90-110的氨基酸序列的多肽，或与SEQ ID NO:11的氨基酸序列的氨基酸残基90-110具有至少约70％(例如约75％、约80％、约85％、约90％、约95％、约96％、约97％、约98％或约99％)同一性的其变体。SEQ ID NO:9的氨基酸序列对应于SEQ ID NO:11的氨基酸序列的氨基酸残基90-110。因此，在一些实施方式中，胰岛素A链多肽是具有SEQ ID NO:9的氨基酸序列的多肽，或与SEQ ID NO:9的氨基酸序列具有至少约70％(例如约75％、约80％、约85％、约90％、约95％、约96％、约97％、约98％或约99％)同一性的其变体。

如本文所用，“胰岛素B链多肽”可以是天然存在的或非天然存在的(例如，工程化的)。胰岛素B链多肽可以是重组的或合成的，并且可以是未修饰的或修饰的(例如，翻译后修饰的，例如通过糖基化或磷酸化)。适用于本文所述的融合蛋白和方法的胰岛素B链多肽的实例是本领域已知的，并且包括天然存在的胰岛素B链多肽的变体(例如，与天然存在的胰岛素B链多肽具有至少约70％、约75％、约80％、约85％、约90％、约95％、约96％、约97％、约98％或约99％同一性的变体)，例如来自人的胰岛素B链多肽。在一些实施方式中，胰岛素B链多肽是具有指定为UniProt登录号P01308(SEQ ID NO:11)的人胰岛素的氨基酸残基25-54的氨基酸序列的多肽，或与SEQ ID NO:11的氨基酸序列的氨基酸残基25-54具有至少约70％(例如约75％、约80％、约85％、约90％、约95％、约96％、约97％、约98％或约99％)同一性的其变体。SEQ ID NO:8的氨基酸序列对应于SEQ ID NO:11的氨基酸序列的氨基酸残基25-54。因此，在一些实施方式中，胰岛素B链多肽是具有SEQ ID NO:8的氨基酸序列的多肽，或与SEQ ID NO:8的氨基酸序列具有至少约70％(例如约75％、约80％、约85％、约90％、约95％、约96％、约97％、约98％或约99％)同一性的其变体。

如本文所用，“胰岛素C链多肽”可以是天然存在的或非天然存在的(例如，工程化的)。胰岛素C链多肽可以是重组的或合成的，并且可以是未修饰的或修饰的(例如，翻译后修饰的，例如通过糖基化或磷酸化)。适用于本文所述的融合蛋白和方法的胰岛素C链多肽的实例是本领域已知的，并且包括天然存在的胰岛素C链多肽的变体(例如，与天然存在的胰岛素C链多肽具有至少约70％、约75％、约80％、约85％、约90％、约95％、约96％、约97％、约98％或约99％同一性的变体)，例如来自人的胰岛素C链多肽。在一些实施方式中，胰岛素C链多肽是具有指定为UniProt登录号P01308(SEQ ID NO:11)的人胰岛素的氨基酸残基57-87的氨基酸序列的多肽，或与SEQ ID NO:11的氨基酸序列的氨基酸残基57-87具有至少约70％(例如约75％、约80％、约85％、约90％、约95％、约96％、约97％、约98％或约99％)同一性的其变体。

美国申请公开号US 2018/0194827描述了胰岛素肽和单链胰岛素肽激动剂，其包含相比于天然或天然存在的胰岛素A链和B链含有多种置换、添加和/或修饰的胰岛素A链和胰岛素B链。与胰岛素衍生物和类似物(例如，胰岛素A链多肽和胰岛素B链多肽)有关的US2018/0194827的教导的全部内容通过引用并入本文。因此，胰岛素A链多肽和胰岛素B链多肽的实例包括在US 2018/0194827中公开的胰岛素A链和胰岛素B链。

Mathieu,C.,Gillard,P.和Benhalima,K.,Nature Reviews Endocrinology 13,385-399(2017)(Mathieu等)和Zaykov,A.N.,Mayer,J.P.和DiMarchi,R.D.,NatureReviews Drug Discovery 15,425-439(2016)(Zaykov等)描述了胰岛素类似物。与胰岛素衍生物和类似物(例如胰岛素A链多肽和胰岛素B链多肽)有关的Mathieu等和Zaykov等的教导的全部内容通过引用并入本文。因此，胰岛素A链多肽和胰岛素B链多肽的实例包括Mathieu等和Zaykov等中公开的胰岛素A链和胰岛素B链。

DEEP-胰岛素A链多肽-胰岛素B链多肽融合体的一些实施方式还包含DEEP融合标签和胰岛素A链多肽之间的第一接头。DEEP-胰岛素A链多肽-胰岛素B链多肽融合体的一些实施方式还包含DEEP融合标签和胰岛素B链多肽之间的第二接头。DEEP-胰岛素A链多肽-胰岛素B链多肽融合体的一些实施方式还包含DEEP融合标签和胰岛素A链多肽之间的第一接头以及DEEP融合标签和胰岛素B链多肽之间的第二接头。在一些实施方式中，第一接头包含第一切割位点(例如，蛋白酶切割位点，化学切割位点)。在一些实施方式中，第二接头包含第二切割位点(例如，蛋白酶切割位点，化学切割位点)。

DEEP-胰岛素A链多肽-胰岛素B链多肽融合体的一些实施方式还包含DEEP融合标签和胰岛素A链多肽之间的第一切割位点。DEEP-胰岛素A链多肽-胰岛素B链多肽融合体的一些实施方式还包含DEEP融合标签和胰岛素B链多肽之间的第二切割位点。DEEP-胰岛素A链多肽-胰岛素B链多肽融合体的一些实施方式还包含DEEP融合标签和胰岛素A链多肽之间的第一切割位点以及DEEP融合标签和胰岛素B链多肽之间的第二切割位点。

在具有第一切割位点和第二切割位点的DEEP-胰岛素A链多肽-胰岛素B链多肽融合体的一些实施方式中，第一切割位点和第二切割位点是在相同条件下(例如，通过相同的蛋白酶，在相同的化学条件下)可切割的。在一些实施方式中，第一切割位点和第二切割位点是独立可切割的(例如，通过独立且不同的蛋白酶，在正交化学条件下)。

在本发明的融合蛋白的一个实施方式中，融合蛋白包含SEQ ID NO:7的氨基酸序列或与SEQ ID NO:7的氨基酸序列具有至少约70％(例如，约75％、约80％、约85％、约90％、约95％、约96％、约97％、约98％或约99％)同一性的其变体。

在本发明的融合蛋白的一个实施方式中，融合蛋白包含以下氨基酸序列：MRFVNQHLCGSHLVEALYLVCGERGFFYTPKTRRYGHLNDLLEDLQEVLHNLHHNWHGGHDNLHDVDNHLQNVIEDIHDFMQGGGSGGHLQEMMHEFQQVLDELNNHLQGGHHTVHHIEQNIHEIFHHLEELVHRKRGIVEQCCTSICSLYQLENYCN(SEQ ID NO:14)，或与SEQ ID NO:14的氨基酸序列具有至少约70％(例如，约75％、约80％、约85％、约90％、约95％、约96％、约97％、约98％或约99％)同一性的其变体。粗体中的SEQID NO:14对应于具有SEQ ID NO:10的氨基酸序列的DEEP融合标签。

在另一个实施方式中，本发明涉及编码本发明的融合蛋白的核酸分子。本文使用的术语“核酸”是指包含多个核苷酸单体(例如，核糖核苷酸单体或脱氧核糖核苷酸单体)的聚合物。“核酸”包括例如DNA(例如cDNA)、RNA和DNA-RNA杂合分子。核酸分子可以是天然存在的、重组的或合成的。另外，核酸分子可以是单链、双链或三链的。在一些方面，可以修饰核酸分子。核酸修饰包括，例如，甲基化，用核苷酸类似物取代一个或多个天然存在的核苷酸，核苷酸间修饰，例如不带电荷的键(例如，甲基膦酸酯、磷酸三酯、氨基磷酸酯、氨基甲酸酯等)，带电荷的键(例如，硫代磷酸酯、二硫代磷酸酯等)，侧(pendent)基(例如多肽)，嵌入剂(例如吖啶、补骨脂素等)，螯合剂，烷基化剂和修饰键(例如α异头核酸等)。在双链聚合物的情况下，“核酸”可以指分子的任一或双链。

尽管遗传密码是简并的，因为大多数氨基酸由多个密码子表示(称为“同义”或“同义的”密码子)，但是在本领域中应理解，特定生物体的密码子使用是非随机的并且偏向于特定密码子三联体。因此，在特定的实施方式中，编码本发明的融合蛋白的核酸包含已被优化用于在特定类型的宿主细胞中表达的核苷酸序列(例如，通过密码子优化)。密码子优化是指修饰编码感兴趣蛋白的多核苷酸以用编码相同氨基酸但在核酸被表达的宿主细胞中更普遍使用/识别的密码子替换该多核苷酸中的特定密码子的过程。在一些方面，对编码本发明融合蛋白的多核苷酸进行密码子优化以在大肠杆菌中表达。

在另一个实施方式中，本发明涉及包含编码本发明融合蛋白的核酸分子的宿主细胞。如本文所用，术语“宿主细胞”是指用于表达编码包含DEEP融合标签的融合蛋白的核酸的合适宿主。在一些实施方式中，宿主细胞是已经用使用本领域已知的重组DNA技术构建的载体转化或转染的细胞。合适的宿主细胞的实例包括酵母细胞(例如巴斯德毕赤酵母和酿酒酵母)，昆虫细胞(例如草地贪夜蛾Sf9细胞)，哺乳动物细胞(例如CHO细胞)，和细菌细胞(例如大肠杆菌和B.枯草杆菌；根癌农杆菌)。合适的宿主细胞的其他实例包括植物细胞(例如，本氏烟(Nicotiana benthamiana))。在一个特定方面，宿主细胞是大肠杆菌。

本发明的融合蛋白可以使用本领域众所周知的常规方法和试剂重组或合成产生。例如，可以根据本领域已知的方法在合适的宿主细胞(例如细菌、酵母、昆虫细胞、哺乳动物细胞)中重组产生本发明的融合蛋白。参见，例如，Current Protocols in MolecularBiology,Second Edition,Ausubel等eds.,John Wiley&Sons,1992；and MolecularCloning:a Laboratory Manual,2nd edition,Sambrook等,1989,Cold Spring HarborLaboratory Press。例如，可以将包含编码本文所述融合蛋白的核苷酸序列的核酸分子引入合适的宿主细胞(例如大肠杆菌)并在合适的宿主细胞(例如大肠杆菌)中表达，并且可以使用常规方法和现成的试剂从宿主细胞(例如在包涵体中)中分离/纯化表达的融合蛋白。

在某些实施方式中，本发明还涉及获得(例如表达、生产、纯化)靶蛋白的方法。在一个实施方式中，所述方法包括以下步骤：a)将编码融合蛋白的DNA构建体引入到宿主细胞中，其中所述融合蛋白包含DEEP融合标签和靶蛋白，b)在宿主细胞中表达融合蛋白，c)分离融合蛋白，和d)切割融合蛋白以将DEEP融合标签与靶蛋白分开。

用于将编码融合蛋白的DNA构建体引入到宿主细胞中的方法是本领域众所周知的，并且包括例如标准转化和转染技术(例如，电穿孔、化学转化)。本发明领域的普通技术人员可以容易地选择将DNA构建体引入到宿主细胞中的合适方法。

在宿主细胞中表达蛋白的多种方法是本领域众所周知的(例如，在大肠杆菌中IPTG诱导的表达)。本发明领域的普通技术人员可以容易地选择在宿主细胞中表达本发明融合蛋白的合适方法。

可以使用已知方法和试剂从宿主细胞中分离表达的融合蛋白，所述方法和试剂包括例如溶菌酶处理，超声，过滤，盐析，超速离心和色谱法。重组表达的融合蛋白可以从宿主细胞和/或宿主细胞培养基中回收。一旦从细胞中释放出来，融合蛋白就可以通过使用标准技术和试剂与亲和树脂结合而从细胞裂解物中纯化出来。在一个具体的实施方式中，通过融合蛋白中的DEEP融合标签与亲和树脂(例如，在固体支持物上)的结合来分离融合蛋白。在一些实施方式中，DEEP融合标签包含多个表面暴露的组氨酸残基，使得能够通过通常用于His标签蛋白的方法进行纯化。例如，可以使用固定化的金属离子亲和色谱法(IMAC)分离本发明的融合蛋白。用于IMAC应用的含有固定化过渡金属的合适IMAC树脂在本领域中是已知的，并且可以商购获得(例如

Superflow^TM resins,HisTrap^TM HighPerformance resins,GE Healthcare Life Sciences)，并且包括例如固定化镍树脂、固定化钴树脂，固定化铜树脂和固定化锌树脂。在一个特定的实施方式中，本发明的融合蛋白使用包含固定化的镍离子的亲和树脂纯化。

如本文所用，“分离的”是指基本上纯的。例如，分离的融合蛋白构成含有除融合蛋白外的其他物质(例如化学物质、蛋白、肽、其他生物物质)的混合物的重量的至少约50％、约60％、约70％、约80％、约90％、约95％、约97％、约98％、约99％或约99.5％。

从融合蛋白切割融合标签的方法是本领域已知的。例如，可以通过化学切割(例如，CNBr切割)或酶促切割(例如，蛋白酶切割)来切割融合蛋白以将DEEP融合标签与靶蛋白分开。

在另一个实施方式中，本发明涉及一种构建体，其包含编码DEEP融合标签的核苷酸序列和用于引入编码靶蛋白的核苷酸序列的克隆位点。在一个具体的实施方式中，所述构建体是DNA构建体。DEEP融合标签可以是本文所述的任何DEEP融合标签(例如，SEQ IDNO:1)。靶蛋白的实例包括本文所述的靶蛋白(例如，SEQ ID NO:1)。

在一些实施方式中，所述构建体是质粒。通常，术语“质粒”与术语“载体”可互换使用，并且是指用于将核酸序列引入到细胞中的核酸构建体。在一些方面，如本文所述，质粒是与能够在合适的宿主中影响表达的一个或多个合适的异源序列可操作地连接的表达质粒。“可操作地连接”在本文中定义为这样的构型，其中将异源序列适当地(例如，以功能关系)放置在相对于感兴趣的多核苷酸的位置处，从而使异源序列例如指导或调节编码感兴趣多肽的多核苷酸的表达，或相对于感兴趣多核苷酸的表达产物在框内表达。如本文所用，如果两个序列本质上不相关，则氨基酸或核苷酸序列与其可操作地连接的另一序列是“异源”的。

在一个方面，异源序列是启动子序列。如本文所用，“启动子序列”是指被宿主细胞内源的一种或多种蛋白识别并能够指导与宿主细胞中与启动子可操作地连接的核酸的转录的核酸序列。通常，启动子序列包含介导感兴趣多核苷酸表达的转录控制序列。启动子可以是在所选宿主细胞中显示转录活性的任何核酸序列，包括突变、截短和杂合启动子，并且可以从编码与宿主细胞同源或异源的细胞外或细胞内多肽的基因获得。对于细菌宿主细胞，用于指导本公开的核酸构建体转录的合适的启动子包括但不限于从大肠杆菌lac操纵子，天蓝链霉菌(Streptomyces coelicolor)琼脂酶基因(dagA)，枯草芽孢杆菌果聚糖蔗糖酶(Levansucrase)基因(sacB)，地衣芽孢杆菌α-淀粉酶基因(amyL)，嗜热脂肪芽孢杆菌麦芽糖淀粉酶基因(amyM)，解淀粉芽孢杆菌α-淀粉酶基因(amyQ)，地衣芽孢杆菌青霉素酶基因(penP)，枯草芽孢杆菌xy1A和xy1B基因，和原核β-内酰胺酶基因(参见，例如，Villa-Kamaroff等,Proc.Natl.Acad.Sci.USA 75:3727-3731,1978)获得的启动子，以及tac启动子(参见，例如DeBoer等,Proc.Natl.Acad.Sci.USA 80:21-25,1983)。丝状真菌宿主细胞的启动子的实例包括但不限于从米曲霉TAKA淀粉酶，米氏根瘤菌天冬氨酸蛋白酶，黑曲霉中性α-淀粉酶，黑曲霉酸稳定α-淀粉酶，黑曲霉或泡盛曲霉葡糖淀粉酶(glaA)，米氏根瘤菌脂肪酶，米曲霉碱性蛋白酶，米曲霉三糖磷酸异构酶，构巢曲霉乙酰酰胺酶和尖孢镰刀菌胰蛋白酶样蛋白酶(参见例如，WO 96/00787)的基因获得的启动子，以及NA2-tpi启动子(来自黑曲霉中性α-淀粉酶和米曲霉磷酸三糖磷酸异构酶的基因的启动子的杂合体)及其突变体、截短和杂合启动子。酵母细胞启动子的实例可以是来自酿酒酵母烯醇酶(ENO-1)，酿酒酵母半乳糖激酶(GAL1)，酿酒酵母乙醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)和酿酒酵母3-磷酸甘油酸激酶的基因。用于酵母宿主细胞的其他有用的启动子在本领域中是已知的(参见，例如，Romanos等,Yeast 8:423-488,1992)。

除启动子序列外，可与本发明的DNA构建体中编码DEEP融合标签和/或POI的核苷酸序列可操作地连接的其他异源序列的实例包括但不限于编码其他融合部分(例如，麦芽糖结合蛋白(MBP)，谷胱甘肽-S-转移酶(GST))的序列，编码信号肽的序列，编码前肽的序列，起始序列，终止子序列，转录和翻译终止信号以及可选择的标志物序列。

除编码DEEP融合标签的核苷酸序列外，本文所述的构建体包含一个或多个(例如1、2或3)克隆位点，用于引入核苷酸序列(例如，编码靶蛋白的序列)。克隆位点可以位于编码靶蛋白的核苷酸序列的上游或下游。包含在本发明的核酸构建体中的多种有用的克隆位点是本领域技术人员已知的。在一些实施方式中，克隆位点是被限制酶识别和/或切割的核苷酸序列。

在一些实施方式中，构建体还包含一个或多个编码接头氨基酸序列的核苷酸序列(例如，位于编码DEEP融合标签的核苷酸序列和克隆位点之间的接头核苷酸序列)。接头氨基酸序列的实例包括本文所述的任何接头(例如，聚甘氨酸接头)。

在一些实施方式中，所述构建体进一步包含可选择标志物，例如抗生素抗性基因(例如，卡那霉素抗性基因)。多种可选择标志物是本领域已知的，并且可以用于本发明中。

在另一个实施方式中，本发明涉及包含一个或多个本发明的DNA构建体的试剂盒，其中所述一个或多个构建体各自包含编码DEEP蛋白的核苷酸序列和用于引入核苷酸序列的克隆位点((例如，编码靶蛋白质/感兴趣蛋白质的异源序列)。合适的DNA构建体包括，例如，本文所述的任何DNA构建体。合适的克隆位点(例如限制位点)包括本文所述的那些。优选地，克隆位点位于相对于编码DEEP融合标签的序列的位置，所述位置允许框内插入编码靶蛋白的异源核苷酸序列。

在一个实施方式中，试剂盒包括单个DNA构建体，其包含编码DEEP蛋白的序列和克隆位点。在另一个实施方式中，试剂盒包含多个构建体，其包含编码DEEP蛋白的核苷酸序列和克隆位点。在一个特定的实施方式中，试剂盒包括多个DNA构建体，其中DNA构建体各自编码不同的DEEP融合标签。在另一个实施方式中，试剂盒包括多个DNA构建体，其中DNA构建体各自编码相同的DEEP融合标签。

试剂盒中的多个构建体可以包含相同的克隆位点或不同的克隆位点。在一个实施方式中，DNA构建体各自包含相同的克隆位点。克隆位点可以位于构建体中编码DEEP融合标签的核苷酸序列的上游或下游。

包括多个DNA构建体的本发明的试剂盒可用于例如高通量筛选方法中，所述方法设计用于鉴定在特定宿主中具有最佳表达的DEEP融合蛋白。

在一些实施方式中，试剂盒还包含一种或多种其他试剂，例如可用于分子克隆技术的试剂(例如，限制性内切酶)。

通常，试剂盒是分隔开的以便于使用，并且可以包括一个或多个装有试剂的容器。在一个实施方式中，所有试剂盒组分都包装在一起。或者，可以在与其他试剂盒组分分开的包装中提供试剂盒的一个或多个个体组分。

实施例

在本文图1A-6D中描述的实验中使用了以下材料和方法。

质粒和菌株的构建：

编码β淀粉样蛋白1-42(Aβ_1-42)，TRP笼(TRP)，胰岛素(INS)和(LSLLLSL)₃(LS3)的合成基因以大肠杆菌密码子优化的gBlocks(Integrated DNA Technologies)订购，然后用含有XbaI和HindIII限制性位点的正向和反向引物扩增。使用包含NdeI和XbaI限制性位点的正向和反向引物从先前报道的质粒中扩增编码S-824和SUMO蛋白的基因(SUMO:J.Am.Chem.Soc.2016,138,2162-2165,S824:Journal of Molecular Biology 428,399-411)。使用标准的基因工程技术，将消化的S-824、POI(感兴趣的蛋白质/肽)和线性化质粒进行连接得到pET30DEEP-POI质粒。对于GFP融合，使用NdeI和BamHI限制性位点将S-824和SUMO克隆到pET28GFP中，如先前所述(J.Molec.Biology 319,1279-1290)。将连接的质粒转化到DH5α细胞中，并在卡那霉素选择板上生长。对于质粒DNA提取和测序，将菌落接种到装有5mL添加有30mg/L卡那霉素(LB-kan)的新鲜LB的试管中，并在37℃，200RPM的振荡培养箱中生长过夜。

蛋白质表达和裂解：

将测序的质粒转化到BL21DE3细胞中，并在卡那霉素选择LB琼脂平板上生长。将新鲜菌落接种到50mL烧瓶中的15mL LB-kan中，在37℃，200RPM下孵育过夜。第二天，将10mL过夜生长的培养物接种到4L烧瓶中的1L LB-kan中。通过使细胞在37℃，200RPM下生长到OD₆₀₀为约0.6进行表达实验。通过添加IPTG(1或0.1mM)并在200RPM下在37℃进一步孵育约4小时或18℃过夜，从而开始蛋白质表达。通过在4℃，5000x g下离心收集细胞，并保存在-80℃下。将细胞沉淀重悬于pH＝8的50mM Tris，300mM NaCl和10％v/v甘油中，并使用至少三次通过于1000bar操作的Emulsiflex C3均质器进行裂解。通过在4℃，30000×g下离心30分钟来澄清裂解物。

可溶性蛋白的纯化：

在可溶性级分中发现了DEEP-GFP和DEEP-TRP两者。上清液通过0.45μm PVDF薄膜注射器过滤器过滤，并加载到在缓冲液A(TBS：50mM Tris，300mM NaCl，pH＝8)中预平衡的HisTrap(GE Healthcare)柱上。用10个柱体积的缓冲液A清洗柱。然后用75％的缓冲液B(TBS，500mM咪唑，pH＝8)洗脱蛋白。合并洗脱的级分以产生约10mL，并通过使用HiLoadSuperdex 75 26/600柱(GE Healthcare)的尺寸排阻色谱法(SEC)或通过使用3500MWCO管的渗析(dialysis)进一步纯化。

图1A-1E涉及DEEP的过表达和纯化，并表明DEEP可以用作纯化柄(handle)。由于有十二个表面暴露的组氨酸残基，DEEP以与His-标签相当的亲和力与Ni-IMAC柱结合。如HPLC色谱图(图1D)所示，可以将蛋白进一步纯化至超过95％的纯度。

图2A-2C涉及frGFP(折叠报告子GFP)的过表达和纯化，并且显示DEEP与表达良好的蛋白(例如GFP)的融合不损害该蛋白的表达。此外，与SUMO-GFP融合体相比，DEEP与GFP的融合产生了具有更高荧光的蛋白，这表明DEEP对GFP正确折叠的干扰小于SUMO。

图3A-3D涉及Trp笼的过表达和纯化，并且表明对于DEEP融合体，Trp笼的总体表达产量高于SUMO融合体。

表1提供了图2B中描绘的His-GFP，DEEP-GFP和SUMO-GFP的纯化的总结。

表1.GFP纯化总结

	MW(g/mol)	SEC峰(mg/mL)	荧光(RFU)
				His-GFP	28809	1.24	5450
DEEP-GFP	39534	1.05	4029
				SUMO-GFP	41021	1.04	3874

不溶蛋白的纯化：

在不溶级分中发现了DEEP-Aβ_1-42，DEEP-INS和DEEP-LS3。DEEP-Aβ_1-42或DEEP-INS的不可溶沉淀用添加了1％Triton X-100的裂解缓冲液清洗，在20℃，30000xg下离心20分钟，再用无菌Milli-Q水清洗两次。出人意料的是，尽管DEEP-Aβ_1-42和DEEP-INS形成了不溶于1％Triton X-100的包涵体，但DEEP-LS3可溶于该级分，表明DEEP-LS3优选与膜相关联。因此，省去了Triton X-100清洗，将沉淀用TBS清洗两次。最终将清洗过的DEEP-Aβ_1-42，DEEP-INS和DEEP-LS3沉淀溶解在含6M盐酸胍的TBS中，并在变性条件下使用HisTrap柱用添加6M盐酸胍的A和B缓冲液纯化。

图4A-4C涉及Aβ_1-42的过表达和纯化，并且表明当与DEEP融合时，Aβ_1-42主要在不溶级分中积累，与SUMO融合相比，产生更高的表达产量。

图5A-5C涉及DEEP-Met-LS3的过表达和纯化，并且显示出通过DEEP融合，在SDS-PAGE凝胶上可以看到对应于正确质量的蛋白条带。另一方面，对于SUMO融合，几乎没有观察到蛋白。

图6A-6D涉及DEEP-Met-Ins的过表达，并且表明胰岛素的A链和B链与DEEP的C端和N端两者的融合都导致高表达产量。此外，DEEP促进了胰岛素朝向形成正确二硫键模式的重折叠过程。

HPLC分析：

使用C4或C18柱用添加有0.1％TFA的溶剂A：水和溶剂B：乙腈进行反相HPLC。蛋白样品在加载到柱之前先用0.1％或1％TFA酸化。

DEEP-胰岛素重折叠和二硫化物模式表征

将在8M尿素中的50mg IMAC纯化的DEEP-胰岛素用50mM Gly缓冲液在pH＝10.5下稀释10倍。为了引发二硫键的重组(reshuffling)，加入βMe，将重折叠溶液在4℃温和搅拌下孵育。为了从DEEP融合体中释放胰岛素，用胰蛋白酶和羧肽酶B处理重折叠的DEEP胰岛素。使用C18柱在RP-HPLC上进一步纯化切割的胰岛素，将其冻干并用V8蛋白酶消化。

表2显示了用V8蛋白酶消化的DEEP-胰岛素的肽片段的计算和鉴定的质量。表2中描述的结果证实，DEEP-胰岛素融合体的A链和B链形成了天然胰岛素中观察到的二硫化物模式。图6D描绘了DEEP-胰岛素融合蛋白中V8的切割位点和在胰岛素的A链和B链之间形成的潜在的二硫键。

表2

保留时间(分钟)	肽	计算的质量(Da)	鉴定的质量(Da)
				14.3	A1	416.5	416.2
28	B3	1116.3	1115.6
				28.5	B2+A3	1377.6	1376.6
35.5	B1+A2	2969.4	2968.3
				36.2	B1+A1A2	3367.9	3367.5

除非另有定义，否则本文所用的所有技术和科学术语具有与本发明所属领域的普通技术人员通常所理解的相同含义。

如本文所用，除非明确相反地指出，不定冠词“一个/一种(a/an)”应被理解为意指“至少一个/一种”。

如本文所用，短语“和/或”应理解为是指如此结合的元素中的“任一者或两者”，即在某些情况下联合存在而在其他情况下不联合存在的元素。

还应理解，除非有相反的明确指示，否则在本文所述的包括多个步骤或动作的任何方法中，该方法的步骤或动作的顺序不必限于叙述该方法的步骤或动作中的顺序。

除非另有指示或从上下文和本领域普通技术人员的理解而言是显而易见，否则在各种实施方式中，表示为范围的值可以采用所述范围内的任何特定值或子范围，除非上下文另外明确指出。除非另外说明或从上下文明显看出，否则关于数值的“约”通常是指落入值的±8％，在一些实施方式中±6％，在一些实施方式中±4％，在一些实施方式中±2％，在一些实施例中±1％，在一些实施方式中±0.5％内的值的范围。

本文引用的所有专利、公开的申请和参考文献的教导的全部内容通过引用并入本文。

尽管已经具体示出和描述了示例性实施方式，但是本领域技术人员将理解，在不偏离所附权利要求所涵盖的实施方式的范围的情况下，可以在形式和细节上进行各种改变。

Claims

1.一种融合蛋白，其包含DEEP融合标签和靶蛋白。

2.根据权利要求1所述的融合蛋白，其中所述DEEP融合标签在所述靶蛋白的N端。

3.根据权利要求1或2所述的融合蛋白，其中所述DEEP融合标签包含多个表面暴露的组氨酸残基。

4.根据权利要求1、2或3所述的融合蛋白，其中所述DEEP融合标签包含氨基酸序列：MYGKLNDLLEDLQEVLKNLHKNWHGGKDNLHDVDNHLQNVIEDIHDFMQGGGSGGKLQEMMKEFQQVLDELNNHLQGGKHTVHHIEQNIKEIFHHLEELVHR(SEQ ID NO:1)。

5.根据权利要求1、2或3所述的融合蛋白，其中所述DEEP融合标签包含氨基酸序列：YGHLNDLLEDLQEVLHNLHHNWHGGHDNLHDVDNHLQNVIEDIHDFMQGGGSGGHLQEMMHEFQQVLDELNNHLQGGHHTVHHIEQNIHEIFHHLEELVHR(SEQ ID NO:10)。

6.根据前述权利要求中任一项所述的融合蛋白，其还包含所述DEEP融合标签和靶蛋白之间的接头氨基酸序列。

7.根据权利要求6所述的融合蛋白，其中所述接头氨基酸序列包含聚甘氨酸序列。

8.根据前述权利要求中任一项所述的融合蛋白，其还包含所述DEEP融合标签和所述靶蛋白之间的切割位点。

9.根据权利要求8所述的融合蛋白，其中所述切割位点是蛋白酶切割位点。

10.根据权利要求8所述的融合蛋白，其中所述切割位点是化学切割位点。

11.根据前述权利要求中任一项所述的融合蛋白，其中所述靶蛋白选自绿色荧光蛋白(GFP)、β淀粉样(Aβ)多肽、Trp笼蛋白、LS3多肽、胰岛素A链多肽和胰岛素B链多肽。

12.根据前述权利要求中任一项所述的融合蛋白，其包含第一靶蛋白和第二靶蛋白，其中所述第二靶蛋白不同于所述第一靶蛋白。

13.根据权利要求12所述的融合蛋白，其中所述第一靶蛋白是在所述DEEP融合标签的C端，和所述第二靶蛋白是在所述DEEP融合标签的N端。

14.根据权利要求12或13所述的融合蛋白，其中所述第一靶蛋白是胰岛素A链多肽，和所述第二靶蛋白是胰岛素B链多肽。

15.根据前述权利要求中任一项所述的融合蛋白，其中所述融合蛋白在约4至约10的pH范围是稳定的。

16.一种核酸分子，其编码前述权利要求中任一项所述的融合蛋白。

17.一种宿主细胞，其包含权利要求16所述的核酸。

18.根据权利要求17所述的宿主细胞，其中所述宿主细胞是大肠杆菌。

19.一种获得靶蛋白的方法，其包括以下步骤：

a.将编码融合蛋白的DNA构建体引入到宿主细胞中，其中所述融合蛋白包含DEEP融合标签和靶蛋白；

b.在所述宿主细胞中表达所述融合蛋白；

c.分离所述融合蛋白；和

d.切割所述融合蛋白以将所述DEEP融合标签与所述靶蛋白分开；

从而获得所述靶蛋白。

20.根据权利要求19所述的方法，其中所述融合蛋白通过所述DEEP融合标签与亲和树脂的结合而分离。

21.根据权利要求20所述的方法，其中所述亲和树脂是固定化的金属。

22.根据权利要求21所述的方法，其中所述固定化的金属是固定化的镍。

23.根据权利要求19-22中任一项所述的方法，其中切割所述融合蛋白以将所述DEEP融合标签与所述靶蛋白分开的步骤包括使所述融合蛋白与蛋白酶接触。

24.根据权利要求19-22中任一项所述的方法，其中切割所述融合蛋白以将所述DEEP融合标签与所述靶蛋白分开的步骤包括使所述融合蛋白与化学切割剂接触。

25.一种DNA构建体，其包含编码DEEP融合标签的核苷酸序列和用于引入编码靶蛋白的核苷酸序列的克隆位点。

26.根据权利要求25所述的DNA构建体，其中所述DNA构建体是质粒。

27.根据权利要求25或权利要求26所述的DNA构建体，其中编码所述DEEP融合标签的所述核苷酸序列在所述克隆位点的上游。

28.根据权利要求25、26或27所述的DNA构建体，其还包含在编码所述DEEP融合标签的所述核苷酸序列与所述克隆位点之间的编码接头氨基酸序列的核苷酸序列。

29.根据权利要求25-28中任一项所述的DNA构建体，其还包含可选择的标志物。

30.根据权利要求25-29中任一项所述的DNA构建体，其还包含编码靶蛋白的核苷酸序列。

31.根据权利要求25至30中任一项所述的DNA构建体，其中所述DEEP融合标签包含氨基酸序列：MYGKLNDLLEDLQEVLKNLHKNWHGGKDNLHDVDNHLQNVIEDIHDFMQGGGSGGKLQEMMKEFQQVLDELNNHLQGGKHTVHHIEQNIKEIFHHLEELVHR(SEQ ID NO:1)。

32.根据权利要求25-30中任一项所述的DNA构建体，其中所述DEEP融合标签包含氨基酸序列：YGHLNDLLEDLQEVLHNLHHNWHGGHDNLHDVDNHLQNVIEDIHDFMQGGGSGGHLQEMMHEFQQVLDELNNHLQGGHHTVHHIEQNIHEIFHHLEELVHR(SEQ ID NO:10)。

33.一种试剂盒，其包含多个DNA构建体，其中DNA构建体各自包含编码DEEP蛋白的核苷酸序列和用于引入编码靶蛋白的核苷酸序列的克隆位点。

34.根据权利要求33所述的试剂盒，其中DNA构建体各自编码不同的DEEP融合标签。

35.根据权利要求33或34所述的试剂盒，其中至少一个构建体编码包含以下氨基酸序列的DEEP融合标签：MYGKLNDLLEDLQEVLKNLHKNWHGGKDNLHDVDNHLQNVIEDIHDFMQGGGSGGKLQEMMKEFQQVLDELNNHLQGGKHTVHHIEQNIKEIFHHLEELVHR(SEQ ID NO:1)。

36.根据权利要求33或34所述的试剂盒，其中至少一个构建体编码包含以下氨基酸序列的DEEP融合标签：YGHLNDLLEDLQEVLHNLHHNWHGGHDNLHDVDNHLQNVIEDIHDFMQGGGSGGHLQEMMHEFQQVLDELNNHLQGGHHTVHHIEQNIHEIFHHLEELVHR(SEQ ID NO:10)。

37.根据权利要求33至36中任一项所述的试剂盒，其中DNA构建体各自包含相同的克隆位点。

38.根据权利要求33-37中任一项所述的试剂盒，其中编码所述DEEP融合标签的所述核苷酸序列在所述克隆位点的上游。

39.一种融合蛋白，其包含DEEP融合标签、胰岛素A链多肽和胰岛素B链多肽。

40.根据权利要求39所述的融合蛋白，其中所述胰岛素A链多肽是在所述DEEP融合标签的C端。

41.根据权利要求39或40所述的融合蛋白，其中所述胰岛素B链多肽是在所述DEEP融合标签的N端。

42.根据权利要求39、40或41所述的融合蛋白，其还包含在所述DEEP融合标签和所述胰岛素A链多肽之间的第一接头。

43.根据权利要求42所述的融合蛋白，其中所述第一接头包含第一切割位点。

44.根据权利要求39-43中任一项所述的融合蛋白，其还包含在所述DEEP融合标签和所述胰岛素B链多肽之间的第二接头。

45.根据权利要求44所述的融合蛋白，其中所述第二接头包含第二切割位点。

46.根据权利要求45所述的融合蛋白，其中所述第一切割位点和所述第二切割位点是在相同条件下可切割的。

47.根据权利要求45所述的融合蛋白，其中所述第一切割位点和所述第二切割位点是独立可切割的。

48.根据权利要求39-47中任一项所述的融合蛋白，其包含氨基酸序列：MRFVNQHLCGSHLVEALYLVCGERGFFYTPKTRRYGHLNDLLEDLQEVLHNLHHNWHGGHDNLHDVDNHLQNVIEDIHDFMQGGGSGGHLQEMMHEFQQVLDELNNHLQGGHHTVHHIEQNIHEIFHHLEELVHRKRGIVEQCCTSICSLYQLENYCN(SEQ IDNO:14)。

49.根据权利要求39-42和44中任一项所述的融合蛋白，其还包含在所述DEEP融合标签和所述胰岛素A链多肽之间的第一切割位点。

50.根据权利要求39-42、44和49中任一项所述的融合蛋白，其还包含在DEEP融合标签和所述胰岛素B链多肽之间的第二切割位点。

51.根据权利要求50所述的融合蛋白，其中所述第一切割位点和所述第二切割位点是在相同条件下可切割的。

52.根据权利要求50所述的融合蛋白，其中所述第一切割位点和所述第二切割位点是独立可切割的。