CN115605604A

CN115605604A - 用于靶肽产生的融合多肽

Info

Publication number: CN115605604A
Application number: CN202180031222.8A
Authority: CN
Inventors: 克里斯托夫·库茨纳
Original assignee: Ke LisituofuKucina
Current assignee: Ke LisituofuKucina
Priority date: 2020-04-27
Filing date: 2021-04-27
Publication date: 2023-01-13
Also published as: CA3180878A1; WO2021219585A2; WO2021219585A3; EP3904525A1; US20230203109A1; MX2022013416A; DE202021004299U1; EP4143331A2

Abstract

本发明涉及融合多肽、编码这样的融合多肽的核酸分子以及包含这样的核酸分子的经遗传修饰细胞。另外，本发明涉及用于制备靶肽和靶肽混合物的方法。

Description

用于靶肽产生的融合多肽

技术领域

本发明涉及融合多肽、编码这样的融合多肽的核酸分子以及包含这样的核酸分子的经遗传修饰细胞。另外，本发明涉及用于制备靶肽和靶肽混合物的方法。本发明的另一些方面在研究所附专利权利要求书和说明书(包括实施例)之后变得显而易见。

背景技术

在过去数年中，对用于多种工业和研究应用的具有高纯度的多肽和蛋白质的需求不断升高。因此，非常期望以经济高效的方式来产生具有预定序列的肽。迄今为止，工业的肽生产依赖于两种选择：通过化学合成的生产和通过生物技术方法的生产。化学合成的缺点是它是一个昂贵且耗时的过程，并且并非所有期望的肽均可以以工业规模来进行生产。例如，具有高含量疏水性氨基酸的肽无法通过化学合成来生产，并且生产具有N端脯氨酸的肽特别有挑战性。此外，化学合成需要使用苛刻的试剂和昂贵的纯化步骤。在另一方面，可以通过生物技术合成来克服这些缺点。生物技术系统(例如，经遗传修饰的大肠杆菌(E.coli))适用于以有成本效益且高度可扩展的基础来生产期望的靶肽或蛋白质。尽管如此，由于细胞(例如，大肠杆菌)产生多种不同的代谢物，其也是蛋白质和肽并且需要特别地与靶肽或蛋白质分离，因此纯化过程非常低效且昂贵。

WO 2006/113957公开了用于重组制备异源多肽的方法，其包括表达融合多肽，所述融合多肽包含瘟病毒的自体蛋白酶(autoprotease)N^pro的突变体和第二C端连接多肽，其中该第二多肽可经蛋白质自水解而切割。此外，在N端可存在用于与亲和色谱系统结合所需的另外的融合结构域，例如聚(氨基酸)，例如聚赖氨酸，或表位标签，即可用于特定抗体的短肽序列。尽管如此，所述方法公开了复杂的纯化步骤，例如亲和色谱和HPLC。由于有毒且昂贵的试剂被用于亲和色谱，因此所公开的方法不易可扩展且不具有成本效益。所得的肽还需要进一步纯化才能从亲和色谱中排除有毒化合物。

WO 2008/052387公开了淀粉结合结构域和包含其的重组多肽，其中该淀粉结合结构域布置在靶多肽的N端和/或C端方向。融合多肽可通过在淀粉载体上进行色谱而纯化。所公开的方法仅提供了公知的淀粉结合位点的使用，而用于纯化的结合结构域不能轻易分离。

更特别地，EP 2746390和AU 2011253661公开了与来自瘟病毒的自体蛋白酶N^pro的在亲和色谱系统中使用的融合多肽。这两个文件均未公开克服使用N^pro在非常具体的pH范围内和高度依赖反应条件(例如，沉降温度)下控制自体蛋白酶活性的方面的缺点的方法。另外，反应环境的微小变化将会导致蛋白质自水解结构域的激活或失活。

WO 2019/138125也公开了与来自N^pro的自体蛋白酶结构域的融合多肽。此外，公开了与CBM亲和结构域的融合多肽。该国际申请并未公开设计CBM或蛋白质自水解结构域以克服融合多肽在固定反应条件下工作的不稳定性和高依赖性的缺点的具体架构概念。对作用于固定反应条件的高依赖性可导致产物损失或产物中杂质。涉及使用N^pro作为自体蛋白酶的纯化过程在它们的性能中受到限制。每当自体蛋白酶N^pro原样或作为融合多肽的一部分在标准大肠杆菌表达系统中表达时，其以包涵体沉积。一旦自体蛋白酶N^pro从包涵体中回收并重折叠成其天然构象，蛋白质自水解随着用于包涵体重折叠所需的条件和用于N^pro的蛋白质自水解的条件匹配而将继续进行。因此，纯化过程的限制因素是CBM亲和结构域对纯化的结合动力学和亲和力以及同时的产率。不得不在产物的高产率与低纯度之间(N^pro未完全激活，但多肽可从包涵体中重新获得)或高纯度与低产率之间(N^pro已完全激活，但并非所有多肽均可从包涵体中重新获得)作出权衡决定。因此，本发明的主要目的是提供可用于产生靶肽的方法的改进的融合多肽，所述靶肽可以或只能借助于常用的化学或生物技术方法低效地产生。优选地，这样的多肽或方法允许避免一个或更多个缺点，优选地，从现有技术已知的先前方法的所有上述缺点。本发明的或本发明潜在的另一些目的可来源于说明书(包括实施例)和本文中提及的优势。

发明概述

这个主要目的通过提供在从N端到C端方向上包含以下或由以下组成的融合多肽而解决：纯化结构域；自体蛋白酶结构域；靶肽结构域；任选地，信号序列；以及任选地，接头序列，其中所述纯化结构域(i)与糖基质结合并且包含以下或由以下组成：根据SEQ IDNo.：1、SEQ ID No.：2、SEQ ID No.：3、SEQ ID No.：4、SEQ ID No.：5、SEQ ID No.：6、SEQ IDNo.：7、SEQ ID No.：8或SEQ ID No.：9的氨基酸共有基序序列中的至少一个。

此外，提供了编码这样的融合多肽的核酸和包含这样的融合多肽的经遗传修饰细胞。

在本发明的另一个方面，提供了用于产生靶肽的方法。这种方法包括以下步骤：提供根据本发明的经遗传修饰细胞；在适于根据本发明的融合多肽表达的条件下培养所述细胞；获得融合多肽，以及任选地将所获得的融合多肽解折叠并将所述融合多肽定向重折叠；使获得的融合多肽与糖基质接触；通过激活融合多肽中的自体蛋白酶结构域来切割融合多肽，从而获得靶肽；以及收集包含靶肽的混合物。

在本发明的另一个方面，提供了包含靶肽的混合物，所述混合物可根据本发明的方法生产。

序列简述

SEQ ID No.：1至9是编码纯化结构域的共有基序的人工氨基酸序列。

SEQ ID No.：10至13是编码纯化结构域的人工氨基酸序列。

SEQ ID No.：14至116是编码不同微生物的糖结合模块的氨基酸序列。

SEQ ID No.：117是编码自体蛋白酶结构域的共有结构域的人工氨基酸序列。

SEQ ID No.：118至120是编码自体蛋白酶结构域的人工氨基酸序列。

SEQ ID No.：121和122是编码优选接头序列的人工氨基酸序列。

SEQ ID No.：123至130是编码用于融合多肽的细胞内靶向并用于根据本发明在优选环境中恢复融合多肽的信号序列的人工氨基酸序列。

SEQ ID No.：131、133、135、137、139、141和143是编码根据本发明的融合多肽的人工氨基酸序列。

SEQ ID No.：132、134、136、138、140、142和144是编码根据本发明的融合多肽的人工核酸序列。

附图说明

图1示出了在包涵体级分中的GFP测量的结果。

图2示出了根据本发明的融合多肽与不同淀粉样品的结合。

图3示出了与以GFP作为靶多肽根据WO’125构建的融合多肽相比的具有SEQ IDNo.：131且以GFP作为靶多肽的融合多肽的表达的SDS-PAGE。

凝胶a)示出了未经诱导(泳道1)和经诱导(泳道2)的BL21细胞，所述细胞携带具有根据SEQ ID NO：131且以GFP作为产物的融合多肽的pET载体。在凝胶a)中，一个星号表示70kDa的包含产物GFP的融合多肽。两个星号表示43kDa的没有该产物的融合多肽。三个星号表示27kDa的产物GFP。少量的多肽已经被激活并被蛋白质自水解。

凝胶b)示出了未经诱导(泳道2)和经诱导(泳道3)的BL21细胞，所述细胞携带具有携带GFP的来自WO’125的融合多肽的pET载体。一个星号表示75kDa的包含产物GFP的融合多肽。两个星号表示48kDa的没有该产物的融合多肽。三个星号表示27kDa的产物GFP。在这种融合多肽的情况下，在用于根据SEQ ID No.：131的融合多肽的相同条件下，在包涵体中没有产生完整的融合多肽。

24kDa的条带是用于氯霉素抗性所需的酶。

图4示出了来自用于获得GFP作为靶多肽的纯化过程的不同级分的SDS-PAGE。将具有SEQ ID No.：131且以GFP作为靶多肽的融合多肽与根据WO’125的融合多肽构建体进行了比较。这些凝胶显示，当与具有SEQ ID No.：131的融合多肽相比时，WO’125的融合多肽在下游处理期间很难保持无活性。融合多肽在裂解期间需要无活性，因为在计划的激活步骤之前自体蛋白酶的任何活性均会导致产物产率的损失。凝胶a)示出了使用根据SEQ ID No.：131的融合多肽的纯化过程的样品。凝胶b)示出了来自WO’125的融合多肽构建体，以及凝胶c)示出了来自WO’125的另一融合多肽构建体。每个凝胶的泳道1显示了在细胞裂解之后的第一上清液，泳道2显示了在洗涤缓冲液中进行第二洗涤步骤之后的第二上清液。泳道3和4显示了在蒸馏水中的洗涤步骤，以及泳道5显示了包涵体沉淀级分。一个星号表示a)中70kDa、b)中75kDa和c)中85kDa的包含产物GFP的融合多肽。两个星号表示a)中43kDa、b)中48kDa和c)中58kDa的没有该产物的融合多肽。三个星号表示27kDa的产物GFP。从a)到c)的所有种类中，均有少量的多肽已被激活并被蛋白质自水解。然而，与WO’125的融合多肽相反，只有根据SEQ ID No.：131的融合多肽才允许对包涵体进行期望的处理。

图5示出了描绘了在不同pH值的变性和激活缓冲液中根据SEQ ID No.：131且以GFP作为靶多肽的融合多肽的稳定性的SDS-PAGE。泳道1显示了在洗涤之前的裂解物沉淀物。泳道2显示了溶解在包含2％十二烷基硫酸钠(sodium dodecyl sulphate，SDS)的变性缓冲液(III)中的经洗涤的包涵体。泳道2的样品是在将包涵体溶于变性缓冲液(III)并储存在室温下之后两周获取的。泳道3的样品是从相同融合多肽样品在去除SDS并将样品储存在4℃下之后两周获得的。在泳道2和3中，pH值远高于9.0。泳道4和5显示了与泳道3的样品来源于同一样品的样品。用pH 7.2的在激活缓冲液中具有低浓度精氨酸和蔗糖(泳道4)和用pH为7.2的高浓度精氨酸和蔗糖(泳道5)的激活缓冲液(II)稀释无SDS变性缓冲液。样品在室温下在缓冲液中浸没60分钟。泳道6显示了与泳道3相同的样品。其作为参照样品用于手头凝胶中。在泳道7中，与泳道6相同的样品用pH 10的激活缓冲液(I)进行稀释。

图6示出了用elugram检测多肽量和相应的SDS-PAGE的使用根据SEQ ID No：131且以GFP作为靶肽的融合多肽的纯化。将样品装载在pH9.4的缓冲液中，并使用pH 7.2的激活缓冲液将GFP从融合多肽和柱释放。

发明详述

本发明的第一方面涉及在从N端到C端的方向上包含以下或由以下组成的特异性融合多肽：

(i)纯化结构域，

(ii)自体蛋白酶结构域，

(iii)靶肽结构域，

(iv)任选地：信号序列，以及

(v)任选地：接头序列，

其中纯化结构域(i)与糖基质结合并且包含以下或由以下组成：如本文所述，特别是如权利要求书中所述的根据SEQ ID No.：1、SEQ ID No.：2、SEQ ID No.：3、SEQ ID No.：4、SEQ ID No.：5、SEQ ID No.：6、SEQ ID No.：7、SEQ ID No.：8或SEQ ID No.：9的至少一个，即一个、两个、三个、四个、五个、六个、七个、八个或九个氨基酸共有基序(即结合本发明使用的所有纯化结构域共有的基序)序列。

因此，本发明主要涉及在从N端到C端的方向上包含以下或由以下组成的融合多肽：

(i)纯化结构域，

(ii)自体蛋白酶结构域，

(iii)靶肽结构域，

(iv)任选地：信号序列，以及

(v)任选地：接头序列，

其中自体蛋白酶结构域(ii)包含以下或由以下组成：根据SEQ ID No.：117的氨基酸序列或与SEQ ID No.：117具有90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列，以及

其中纯化结构域(i)与糖基质结合并且包含以下或由以下组成：根据SEQ ID No.：1、SEQ ID No.：2、SEQ ID No.：3、SEQ ID No.：4、SEQ ID No.：5、SEQ ID No.：6、SEQ IDNo.：7、SEQ ID No.：8或SEQ ID No.：9的至少一个氨基酸共有基序序列。

根据本发明的融合多肽的一个优选实施方案涉及在从N端到C端的方向上包含以下或由以下组成的融合多肽：

(i)纯化结构域，

(ii)自体蛋白酶结构域，

(iii)靶肽结构域，

(iv)任选地：信号序列，以及

(v)任选地：接头序列，

其中纯化结构域(i)在缺乏或在盐酸胍浓度高达2M或脲浓度高达4M时和pH高于7.9时有活性并且与糖基质(例如，玉米淀粉、马铃薯淀粉和/或小麦淀粉)结合，和/或所述纯化结构域包含以下或由以下组成：根据SEQ ID No.：1、SEQ ID No.：2、SEQ ID No.：3、SEQID No.：4、SEQ ID No.：5、SEQ ID No.：6、SEQ ID No.：7、SEQ ID No.：8或SEQ ID No.：9的至少一个，即一个、两个、三个、四个、五个、六个、七个、八个或九个氨基酸共有基序(即结合本发明使用的所有纯化结构域共有的基序)序列。

优选地，在如上所述序列的N端位置放置根据SEQ ID No.：126、SEQ ID No.：127、SEQ ID No.：128和SEQ ID No.：129的信号序列将增强融合多肽以包涵体沉积和在碱性条件下重折叠的能力。

纯化结构域赋予了融合多肽与糖基质的结合。令人惊讶地发现，天然存在的淀粉酶的糖结合模块(CBM)可作为基础用于构建一组具有共有基序序列(即，序列SEQ ID No.：1至SEQ ID No.：9)的构建单元(building block)，其可以相互组合以使纯化结构域适应期望的反应条件。通过将单构建单元相互组合，可以增强纯化结构域与糖基质的结合强度、可以在特定的反应条件(例如，高离子强度)下稳定结合、以及纯化结构域的尺寸可以变化以适应期望的靶肽结构域。

不同的CBM实现不同的功能，因为它们与多糖中不同的多糖键或基序结合。CBM的功能目的是将融合多肽与多糖结合，在多糖中，单体通过D-或L-葡萄糖或其他糖单体之间的糖苷键连接。优选地，纯化结构域包含选自CBM类别26、53、41、35、48或58的至少一个共有序列或由其组成。

纯化结构域以包涵体沉积和在碱性环境中具有活性的能力可受信号序列的选择和糖结合部分的结构域的选择影响。根据SEQ ID No.：126至129的信号序列在表达期间以及在重折叠期间影响N端的溶解性。

自体蛋白酶结构域表现出蛋白质自水解切割位点的功能，其将靶肽与纯化结构域和自体蛋白酶结构域分隔开。该结构域在某些反应条件下被激活。根据本发明的自体蛋白酶结构域的优势是，其可以基于不同的天然存在的自体蛋白酶来构建但活化窗受到限制，这可以精确地控制。因此，根据本发明的自体蛋白酶结构域除其用于从纯化结构域切割靶肽的反应条件之外均具有非常低的活性，并且通过使用这样的自体蛋白酶，可以显著降低基于蛋白质自水解副活性的损失。

优选地(和有利地，特别是结合本文所述的一些优选实施方案)，自体蛋白酶结构域在pH值为6.8或更高时被激活(即，在低于6.8时不被激活)，更优选在pH值为6.8至7.2时被激活。优选地，当评估自体蛋白酶结构域在特定pH下是否被激活时，技术人员可先启动与淀粉的结合。将pH高于7.2的结合样品的上清液去除或洗脱并用等体积的pH为6.8至7.2，优选pH 7.2的激活缓冲液代替。pH的变化将转而启动蛋白质自水解。这可通过由技术人员公知的分析法对洗脱液或上清液级分进行蛋白质分析来观察。温度在自体蛋白酶的激活中不发挥作用。

自体蛋白酶N^pro可以被修饰，使得其环境的pH为激活诱因而不是离液剂浓度。因此，不需要考虑纯度与产物产率之间的权衡。

靶肽结构域包含待产生的靶肽或靶多肽的氨基酸序列或由其组成。所述结构域可以由具有2至多于1000个氨基酸的任何氨基酸序列组成。优选地，靶肽由2至1000个氨基酸，优选2至500个氨基酸，更优选2至100个氨基酸，尤其优选2至50个氨基酸的氨基酸序列组成。在本发明的一个实施方案中，基于氨基酸总数，靶肽的疏水性氨基酸的量可为≥10％，更优选≥20％，尤其优选≥30％，并且甚至更优选≥40％。在另一个实施方案中，同样基于氨基酸总数，靶肽的亲水性氨基酸的量可为≥10％，优选≥20％，尤其优选≥30％，并且甚至更优选≥40％。在另一个实施方案中，基于氨基酸的总数，靶肽的疏水性和亲水性氨基酸的量可为≥10％，更优选≥20％，尤其优选≥30％，并且甚至更优选≥40％。

本发明的一个实施方案涉及根据本发明的融合多肽，其中纯化结构域(i)包含选自以下的氨基酸序列或由其组成：根据SEQ ID No.：10至SEQ ID No.：116的序列以及与所述序列中任一个具有90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高的序列同一性的序列。

每当本公开内容涉及核酸或氨基酸序列相互之间的同一性百分比时，这些值限定为通过使用EMBOSS Water成对序列比对(核苷酸)程序或对氨基酸序列使用EMBOSS Water成对序列比对(蛋白质)程序所获得的那些值。如本文中使用的比对或序列比较是指在相互比较的两个序列的全长上的比对。那些由欧洲分子生物学实验室(European MolecularBiology Laboratory，EMBL)的欧洲生物信息学研究所(European BioinformaticsInstitute，EBI)提供的用于局部序列比对的工具使用了经修改的Smith-Waterman算法(参见Smith，T.E&Waterman，M.S.“Identification of common molecular subsequences”Journal of Molecular Biology，1981 147(1)：195-197)。当进行比对时，使用由EMBL-EBI限定的默认参数。这些参数是(i)对于氨基酸序列：矩阵＝BLOSUM62，空位开放罚分＝10，以及空位延伸罚分＝0.5，或者(ii)对于核酸序列：矩阵＝DNAfull，空位开放罚分＝10，以及空位延伸罚分＝0.5。技术人员将知晓这样的事实：例如，如果与分子来源于的原始生物体相比相应的序列待在另一生物体中使用，则编码多肽的序列可以是“经密码子优化的”。

纯化结构域包含如上所述的CBM的至少一个功能序列的组合或由其组成。出乎意料地发现，这种纯化结构域设计提供了数个在天然存在的糖结合酶形式中表现不出来的优势。显示，具有要求保护的序列的纯化结构域在宽温度范围内显示出较高的结合活性，而天然存在的糖结合多肽(例如，人淀粉酶)只在狭小的温度范围内有活性。与此相结合，当在操作生物过程时，另一个重要因素是pH值。还显示，根据本发明的纯化结构域还在宽pH范围内并且甚至更令人惊讶的是，在0至80℃的苛刻温度与在酸性方案中低至pH 3.5且在碱性方案中高至pH 12.0的苛刻pH值的组合中提供高结合活性。

一般来说，酶或尤其是酶的活性位点(例如，人淀粉酶的CBM)对离液剂或洗涤剂浓度高度敏感。与本发明有关显示，根据本发明的纯化结构域在宽离液剂和洗涤剂浓度范围内是稳定的。

如上所述，根据本发明的融合多肽的自体蛋白酶结构域(ii)包含以下或由以下组成：根据SEQ ID No.：117的氨基酸序列或与SEQ ID No.：117具有90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高的序列同一性的氨基酸序列。

蛋白质自水解结构域的蛋白质自水解活性是基于自体蛋白酶的活性位点中组氨酸和半胱氨酸的催化二体。这些酶是用于根据本发明的蛋白质自水解结构域的基础。用于这样的蛋白质自水解结构域的基础可以是来自瘟病毒的自体蛋白酶N^pro或来自马铃薯Y病毒属(potyvirus)、小核糖核酸病毒的自体蛋白酶或者任何其他病毒自体蛋白酶。通过这些序列的靶向重组或重设计，可以设计出自体蛋白酶结构域构件单元，所述构件单元单独或组合相比于它们的天然对应物显示出数种优势。在一方面，自体蛋白酶的pH敏感性可以被精确调整。这显示出可以控制自体蛋白酶的活性以适应期望的反应条件的优势。具有非常狭小的pH值范围以在期望pH下精确激活自体蛋白酶并避免靶肽的提早释放，或者也在苛刻的pH值下，在此情况下，天然存在的自体蛋白酶不再稳定。

在另一个实施方案中，本发明涉及根据本发明的融合多肽，其中自体蛋白酶结构域(ii)包含选自以下的氨基酸序列或由其组成：根据SEQ ID No.：118、SEQ ID No.：119或SEQ ID No.：120的序列以及与所述序列中任一个具有90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高的序列同一性的序列。通过自体蛋白酶构建单元的组合，获得了数个优选的自体蛋白酶结构域序列，其表现出高的pH和温度稳定性以及在经调整的pH值内被精确激活的能力。在一个优选的实施方案中，自体蛋白酶可在7.5至6的pH值下和/或4℃至40℃的温度范围内有活性。

本发明的另一个实施方案涉及包含信号序列(iv)的根据本发明的融合多肽，其中所述信号序列(iv)是包涵体促进序列或分泌序列，其优选为革兰氏阴性细菌的IV型或II型分泌的。优选地，在本发明的上下文中，使用了侧接苏氨酸、赖氨酸和亮氨酸的在N端信号肽中具有重现精氨酸基序的信号序列。

在本发明的上下文中，信号序列描述了将融合多肽引导至特定的细胞区室的功能序列。数种信号序列在本领域中是已知的。优选地，使用选自SEQ ID No.：123、SEQ ID No.：124、SEQ ID No.：125、SEQ ID No.：126、SEQ ID No.：127、SEQ ID No.：128、SEQ ID No.：129或SEQ ID No.：130的信号序列。令人惊讶的是，发现这些序列不仅控制包涵体促进，而且还指导在强碱性环境中的重折叠过程。

信号序列的选择总是基于它们对靶肽的再处理的影响。在一个实施方案中，使用将靶多肽引导至包涵体的包涵体信号序列。本领域公知的是，以包涵体产生的多肽在进一步下游处理之前需要重折叠。例如，可使用信号序列Cry4AaCter(SEQ ID No.：126)，其增强包涵体的碱处理。在本发明的一个实施方案中，可使用为细菌分泌系统的分泌信号的N端Tat信号。使用该信号序列，靶多肽被分泌。

本发明的另一个实施方案涉及包含接头序列(v)的根据本发明的融合多肽，其中所述接头序列包含N端α螺旋和/或无规卷曲结构的C端序列。

本发明的上下文中的接头序列意指功能结构域之间以及自体蛋白酶与靶肽之间的序列。接头的长度优选为1至50个或多于50个的氨基酸。在另一个实施方案中，纯化结构域和自体蛋白酶结构域是直接融合的，即没有接头。在本发明的一个实施方案中，可使用选自SEQ ID No.：121或SEQ ID No.：122的接头序列。

本发明的一个方面涉及编码根据本发明的融合多肽的重组核酸分子。

本发明的一个实施方案涉及选自SEQ ID No.：132、SEQ ID No.：134、SEQ ID No.：136、SEQ ID No.：138、SEQ ID No.：140、SEQ ID No.：142和SEQ ID No.：144的重组核酸分子。

本发明的另一个实施方案涉及选自SEQ ID No.：131、SEQ ID No.：133、SEQ IDNo.：135、SEQ ID No.：137、SEQ ID No.：139、SEQ ID No.：141和SEQ ID No.：143的重组氨基酸分子。

另一个方面涉及包含根据本发明的重组核酸分子的经遗传修饰细胞，其中所述细胞能够表达根据本发明的融合多肽。

本发明的一个实施方案涉及根据本发明的经遗传修饰细胞，其中所述细胞选自大肠杆菌(Escherichia coli)、需钠弧菌(Vibrio natrigens)、酿酒酵母(Saccheromycescerevisiae)、黑曲霉(Aspergillus niger)、绿藻、微藻、HEK T293和中国仓鼠卵巢细胞(Chinese hamster ovary cell，CHO)。

本发明的另一个方面涉及制备靶肽的方法，其包括以下步骤：

(a)提供根据本发明的经遗传修饰细胞；

(b)在适合根据本发明的融合多肽表达的条件下培养所述细胞；

(c)获得融合多肽以及任选地，将获得的融合多肽进行解折叠并将所述融合多肽定向重折叠；

(d)使步骤(c)中获得的融合多肽与糖基质接触；

(e)通过激活融合多肽中的自体蛋白酶结构域来切割融合多肽，从而获得靶肽；

(f)收集包含靶肽的混合物。

步骤(a)包括提供表达融合多肽的经遗传修饰细胞。这样的细胞可通过借助已知的方法(例如，如通过转染或转化)将包含编码融合多肽的序列的核酸分子(优选以载体的形式)引入到所述细胞中而获得。在步骤(b)中，在适于根据本发明的融合多肽表达的条件下培养该细胞，优选在高密度培养物中培养。培养条件并且特别是实现高密度培养物的条件和相应的培养基是本领域技术人员公知的。在本发明的一个实施方案中，融合多肽的表达是使用合适的信号序列随后转运到包涵体来实现的。如果融合多肽存在于包涵体中，则步骤(c)包括从培养液中获得融合多肽以及任选地将获得的融合多肽解折叠并对所述融合多肽进行定向重折叠。用于处理包涵体的增溶条件和用于定向重折叠的条件在本领域中是公知的。优选地，通过使用6M氯化胍、8M脲或2％十二烷基硫酸钠来溶解包涵体，并在中性或弱碱性条件下重折叠。

在步骤(d)中，使溶解的融合多肽与基于糖的基质接触，使得融合多肽通过其纯化结构域与基质结合。这个步骤是在其中自体蛋白酶结构域(ii)是无活性的条件下进行的，优选通过控制pH值而不是离液剂或变性剂的浓度来进行以在一方面避免靶肽结构域(iii)的过早切割并在另一方面诱发纯化结构域(i)的活性。在这些条件下，基于融合多肽的总量，经切割的融合多肽的量优选为＜10％，更优选＜5％，尤其优选＜3％，或甚至更优选＜1％。蛋白质自水解结构域的无活性的基本机制可以用下面两种情况来描述：

(1)条件，其中自体蛋白酶结构域是组成型无活性的并且只能通过环境条件的改变(例如，通过温度、pH和/或离子强度的适应，优选通过适应pH)来激活；或者

(2)条件，其中自体蛋白酶结构域是组成型有活性的，然而，其活性不足以实现在进行方法步骤(d)所必需的时间段期间靶肽结构域的过早切割，即在动力学上是无活性的，优选多至10分钟，更优选多至20分钟，并且尤其优选多至30分钟。

在一个实施方案中，步骤(d)是在天然条件下进行的，即在其中自体蛋白酶是组成型有活性的条件下进行的。令人惊讶的是，发现即使融合多肽以其原始状态存在，自体蛋白酶结构域在步骤(d)期间仍未有足够的活性。当使用根据SEQ ID NO.：120的杂合N^pro自体蛋白酶时，这种效果尤其存在。优选地，在步骤(d)中使用不溶性糖基质，这有利于杂质的分离。

在步骤(e)中，融合多肽被自体蛋白酶结构域切割且靶肽(iii)被释放。融合多肽的切割可来自于添加自体蛋白酶缓冲液，即提供了在其之下自体蛋白酶具有活性的条件例如酸性或碱条件的缓冲液。

步骤(f)通过从柱上洗脱经切割的靶肽而导致获得混合物。优选地，洗脱是通过使用选自以下的缓冲液来进行的：HEPES、PBS和TrisHCl，浓度为1至100mM，和30mM KCl，pH为6.5至7.5。此外，优选的缓冲液可由浓度为10至100mM的精氨酸或浓度为2至20mM的蔗糖来补充。

根据本发明的方法的一个实施方案涉及以下方法，其中步骤(d)中的糖基质由选自以下的物质组成或包含选自以下的物质：淀粉、木质素糖聚合物、具有葡萄糖的α-1，4-和α-1，6糖苷键的共聚物或其他糖及其混合物，以及糖基质优选存在于填充柱中，作为填充底物或作为由直链淀粉和支链淀粉组成的淀粉粒。

淀粉是来自于不同糖聚合物的糖的复杂混合物。植物细胞将它们产生的糖收集在称为液泡的储存细胞器中。当细胞和细胞器被机械地破坏时，淀粉颗粒就会被释放。根据植物物种，原淀粉有差异。淀粉可以具有不同的粒度，直径从小于25μm到大于100μm。直径超过75μm的比例越高，非特异性吸附的概率就越高，并因此在淀粉纯化之后产物中保留了杂质。另外，有淀粉颗粒(例如，小麦)是多孔的并且可以在内部通道中吸收淀粉酶。淀粉由组分直链淀粉和支链淀粉组成。与支链淀粉相反，直链淀粉是水溶性的。各自淀粉在水中的溶胀行为也取决于这两个种类的比例。因此，在水中的未经纯化的玉米淀粉取得了水泥样稠度，而食用马铃薯淀粉(table potato starch)仍然是水可渗透的。所有的糖结合酶均对它们的底物有高亲和力，这在苛刻的条件下也是存在的。优选地，淀粉粒在水中是不溶的。如果可溶性直链淀粉部分和多肽已经从淀粉中去除，则是进一步优选的。

根据本发明的方法的另一个实施方案涉及以下方法，其中步骤(e)中自体蛋白酶结构域的激活是在pH 6至pH 8，优选在pH 6.5至7.5，尤其优选在pH 6.8至pH 7.2，并且甚至更优选在pH 7至pH 7.4下进行。

本发明的一个方面涉及重组核酸分子，其任选地与表达控制序列有效连接，所述重组核酸分子编码根据本发明的融合多肽和用于并入根据本发明的重组核酸分子的克隆位点。优选地，使用选自以下的表达控制位点：IPTG控制的启动子，优选T5或T7，和鼠李糖控制的启动子以及额外tRNA的集合。

本发明的另一个方面涉及包含以下或由以下组成的混合物：靶肽，优选合成靶肽，以及基于钠(如果存在的话)、钾(如果存在的话)和靶肽之和的总重量的0.001至1wt.-％总量的钠和/或钾，其中混合物是通过或是能够通过根据本发明的方法获得的。根据本发明的方法的步骤(f)中获得的混合物除产生的靶肽之外还包含特定量的钠和/或钾。

在另一个方面，本发明涉及通过或能够通过根据本发明的方法获得的合成靶肽，其中所述肽包含N端脯氨酸；或者涉及根据本发明的混合物，其中靶肽是包含N端脯氨酸的肽。令人惊讶地发现，使用根据本发明的方法能够产生具有N端脯氨酸的合成靶肽。一般情况下，由于脯氨酸在空间上阻碍了本领域中已知方法中的肽产生过程，因而产生具有N端脯氨酸的合成肽是一项巨大的挑战。

在下文中，通过非限制性实施例进一步对本发明进行表征。

实施例

实施例1：靶肽蜂毒肽的产生

A.包含靶多肽核酸序列的质粒的克隆

将根据序列SEQ ID No.：132、SEQ ID No.：138、SEQ ID No.：140或SEQ ID No.：142中任一个的融合多肽与用于靶肽蜂毒肽的序列和包涵体促进序列一起克隆到表达载体pET28a中。以使得每个构建单元(例如纯化结构域或自体蛋白酶结构域)可以容易地互换的方式构建该融合多肽的遗传信息。表1中列出了限制性位点和相应的酶。使用pET28a载体的限制性位点NcoI或NdeI和EcoRI来插入融合多肽基因的标准克隆方案。将获得的质粒溶液储存用于进一步的处理。

表1：用于融合多肽的构建单元的限制性位点

B.蜂毒肽的肽产生

步骤1)：将5μl的DNA浓度为100ng/μl的在实施例1中获得的质粒溶液转移到含有50μl预解冻的大肠杆菌BL21 pLys的2ml反应容器中。将质粒和细胞的混合物在冰上孵育30分钟。孵育后，将质粒和细胞的混合物在水浴中在42℃下暴露于一分钟的热冲击。热冲击后，将细胞在冰上放松2分钟，然后用950μl的温SOC培养基处理。然后，将包含细胞的SOC培养基在37℃下在连续的轻微搅动下孵育一小时。然后，在室温下将细胞以5000rpm离心两分钟，并去除950μl上清液。将细胞重悬于剩余的液体中，并转移到具有25ml LB琼脂以及34μg/ml氯霉素和38μg/ml卡那霉素的培养皿上的固体LB-琼脂板上。然后，将琼脂板在37℃孵育过夜。

步骤2)：24小时后，挑选菌落并转移到具有34μg/ml氯霉素和38μg/ml卡那霉素的10ml LB培养基，并在37℃和轻微搅动下孵育8小时。将8ml培养物转移到具有34μg/ml氯霉素和38μg/ml卡那霉素的500ml LB培养基的摇瓶中并轻微搅动孵育过夜。保留2ml培养物用于制备质粒以及验证质粒和插入物。

步骤3)：将过夜孵育的培养物以1∶5(v/v)悬浮于2l摇瓶中的合适基本培养基中。该培养物生长至OD₆₀₀为5，然后用终浓度为1mM的IPTG诱导。将表达培养物运行六个小时，并离散地补充葡萄糖或甘油(均为20g/l)、硫胺、柠檬酸和合适的痕量元素溶液。溶液以0.1ml/分钟的速度添加持续3.5小时，以及以0.2ml/分钟的速度添加再持续1小时。通过在4℃和3000rpm离心20分钟来收获培养物并将细胞迅速用于进一步的下游处理或在干冰中冲击冻结并随后储存在-80℃。

步骤4)：将细胞重悬于裂解缓冲液中。该缓冲液可含有0mM至75mM的乙酸钠、0mM至20mM的HEPES、2mM氯化镁和1％Triton X-100。通过离心收获细胞之后，在已称皮重的反应容器中称重细胞。超声裂解需要相对于细胞质量的四倍过量的裂解缓冲液。用声处理和12”角杯尖端进行裂解。该方案在80W下以15秒脉冲和20秒暂停在冰上进行8分钟。通过在4℃和5000rpm离心25分钟，将裂解物混合物中的可溶性部分与携带包涵体的固相分离。通过聚丙烯酰胺凝胶检查上清液和沉淀的包涵体围截(containment)。当通过聚丙烯酰胺凝胶鉴定出的大多数融合多肽存在于沉淀中时，还检查凝胶的沉淀的污染物。如果这些污染物是显著的，则需要洗涤沉淀。再次将沉淀重悬于相同裂解缓冲液中，并在冰上保持10分钟。通过每两分钟涡旋将悬浮液均化。孵育后，再次重复该过程。在第三次离心步骤之后，将沉淀重悬于水中，并在冰上孵育10分钟，包括如上所述的规律涡旋。将悬浮液在4℃和5000rpm离心25分钟。现在第二次称重沉淀，并准备用于后续步骤。

步骤5)：将步骤4的经洗涤的包涵体解折叠。包涵体与使用的缓冲液(w/v)的比例不低于1∶10。离液缓冲液含有至少6M氯化胍或8M脲。基于洗涤剂的缓冲液含有5％(w/v)十二烷基硫酸钠(SDS)，以及任选地高至20mM HEPES。用乙酸钠、氢氧化钠和/或氢氧化钾控制pH值。在重悬时，将混合物在室温下孵育40至60分钟，同时每10分钟涡旋30秒。

步骤6)：使用作为柱材料的淀粉(其是融合多肽结合的底物)填充柱。淀粉可以是未经改变的或者是经筛过滤的，使得淀粉粒的粒度为25至50μm。为了从淀粉中去除蛋白质和可溶性直链淀粉，用水和/或用于蛋白质稳定的缓冲液将淀粉洗涤数次。淀粉优选为小麦或马铃薯淀粉。后者可以容易地被用作柱材料。在小麦和马铃薯淀粉的情况下，经洗涤和筛分的淀粉粒与液体一起填充在柱中。现在用激活缓冲液稀释仍浸没在解折叠缓冲液中的融合多肽。进行该稀释使得只有结合部分会重新折叠并允许与柱材料结合。对于氯化胍，离液剂的终浓度应为4.5M至5M。对于脲，稀释浓度对于任何融合多肽应为5M至6M。SDS无需从解折叠的融合多肽和变性缓冲液的混合物中去除。从溶液中去除SDS，通过将30mM氯化钾溶液滴定到混合物中、将混合物冷却至0至4℃或同时采取两种SDS去除措施来使其沉淀。可以将SDS浓度降低至混合物中的0.5％SDS，而不激活自体蛋白酶。然后，使混合物与柱材料接触，并使用氯化钾或冷却或者使用两种方法在不堵塞柱材料的情况下去除过多的SDS。

步骤7)：将经稀释的缓冲液释放并洗脱。丢弃洗涤洗脱液。用一个柱体积的水洗涤柱。使融合多肽与柱材料结合，并可以将其留在柱上，同时蛋白质自水解结构域变得激活。一旦去除变性缓冲液的残余物，结合的融合多肽就具有活性。柱材料浸没在比一个体积多一点的激活缓冲液中(表2)，其相当于5ml的缓冲液：500mg的柱材料。然后，将柱在2℃至37℃的温度下孵育。现在，在两种方法的淀粉基质中，自体蛋白酶均具有活性。孵育期可持续从2℃至8℃的80分钟到9℃至22℃的4小时和23℃至37℃的12小时。在此期间，靶肽从与淀粉材料结合的融合多肽释放。

步骤8)：收集在先前步骤中释放的靶肽。添加50％柱体积的激活缓冲液或水以从柱洗涤靶肽的总量。含有靶肽的洗脱液或上清液在1∶3(v/v)乙醇中沉淀。将产物和乙醇的混合物在5000rpm和4℃下离心10分钟。丢弃上清液，并将沉淀物冷冻干燥过夜。然后，将经冷冻干燥的样品溶解在合适的溶剂中(例如60％至80％甲醇、DMF、去离子水)，并在40W下在超声浴中在室温下声处理一小时。然后，将样品在5000rpm和25℃下离心10分钟。上清液包含纯靶肽。表3显示了与实现的细胞质量相比较的与不同融合多肽一起使用的蜂毒肽的不同目标产率。

表2：激活/蛋白质自水解缓冲液的组成

成分	浓度[mM]
		精氨酸	10至100
HEPES	20
		Tris HCl	0至100
蔗糖	2至20

表3：融合多肽的产率

实施例2：靶肽GFP的产生

A.包含靶多肽核酸序列的质粒的克隆

将根据序列SEQ ID No.：132、SEQ ID No.：138、SEQ ID No.：140或SEQ ID No.：142中任一个的融合多肽与用于靶肽绿色荧光多肽(GFP)的序列和包涵体促进序列一起克隆到表达载体pET28a中。融合多肽基因由三个主要构建单元和两个任选构建单元组成，这些构建单元从N端至C端以特定的顺序组织。所有构建单元在遗传水平上被限制性位点分开。表4中列出了限制性位点和相应的酶。

使用pET家族的任何载体的限制性位点NcoI或NdeI和EcoRI来插入融合多肽基因的标准克隆方案。将获得的质粒溶液储存用于进一步的处理。

表4：用于融合多肽的构建单元的限制性位点

B.GFP的多肽产生

对具有SEQ ID No.：131和137的融合多肽(其具有GFP作为靶多肽的氨基酸序列)执行了以下产生方案。与根据发明的融合多肽进行比较，构建了根据WO2019138125的融合多肽(WO’125)。这些融合多肽具有以下结构域结构：

·ssTorra(包涵体促进序列，WO’125的SEQ ID No.：2)-3x-CBM黑曲霉(结合结构域，WO’125的SEQ ID No.：10)-N^pro(蛋白质自水解结构域，WO’125的SEQ ID No.：12)

·ssTorra(包涵体促进序列，WO’125的SEQ ID No.：2)-淀粉酶-智人(homo-sapiens)(结合结构域，WO’125的SEQ ID No.：5)-N^pro(蛋白质自水解结构域，WO’125的SEQID No.：12)

步骤1)转化：

将5μl的DNA浓度为100ng/μl的在实施例2A中获得的质粒溶液转移到含有50μl预解冻的大肠杆菌BL21 pLys或任何其他BL21衍生物的2ml反应容器中。将质粒和细胞的混合物在冰上孵育30分钟。孵育后，将质粒和细胞的混合物在水浴中在42℃下暴露于一分钟热冲击。热冲击后，将细胞在冰上放松2分钟，然后用950μl的温SOC培养基处理。然后，将包含细胞的SOC培养基在37℃下在连续的轻微搅动下孵育一小时。然后，将细胞在室温下以5000rpm离心两分钟，并去除950μl上清液。将细胞重悬于剩余的液体中，并转移到具有25mlLB琼脂以及30μg/ml氯霉素和30μg/ml卡那霉素的培养皿上的固体LB-琼脂板上。然后，将琼脂板在37℃孵育过夜。

步骤2)菌落挑选和接种培养物制备：

24小时后，挑选菌落并转移到具有30μg/ml氯霉素和30μg/ml卡那霉素的10ml LB培养基中，并在37℃和轻微搅动下孵育8小时。将8ml培养物转移到摇瓶中具有30μg/ml氯霉素和30μg/ml卡那霉素的500ml LB培养基中或立即用作接种培养物并在从三小时表达到过夜表达的合适时间量内在轻微搅动下孵育。保留2ml培养物用于制备质粒以及验证质粒和插入物。

步骤3)融合多肽表达：

表达培养物在2l摇瓶中生长，并用合适量的化学诱导剂诱导，所述化学诱导剂包括乳糖、鼠李糖和异丙基-β-D-硫代半乳糖吡喃糖苷(IPTG)。该培养物在37℃的温度下生长，在150至250rpm的摇动下振荡至指数生长期，并诱导。将表达培养物运行六个小时，并离散地补充葡萄糖或甘油(均为20g/l)、硫胺、柠檬酸和合适的痕量元素溶液。溶液以0.1ml/分钟的速度添加持续3.5小时，以及以0.2ml/分钟的速度添加再持续l小时。通过在4℃和3000rpm离心20分钟来收获培养物并将细胞迅速用于进一步的下游处理或者在干冰中冲击冻结并随后储存在-80℃。

步骤4)细胞裂解和包涵体制备：

将细胞重悬于裂解缓冲液中。该缓冲液可含有0mM至75mM乙酸钠、0mM至20mM 2-[4-(2-羟乙基)哌嗪-1-基]乙烷磺酸(HEPES)、2mM氯化镁和1％Triton X-100。将裂解和洗涤缓冲液的pH设置为高于9.0的pH。通过离心收集细胞之后，将其在已称皮重的反应容器中称重。可以使用声处理、分散或弗氏压碎器(French press)进行裂解。通过在4℃和8000rpm离心10分钟，将裂解物混合物中的可溶性部分与携带包涵体的固相分离。在水中进行最后的洗涤步骤以清除Triton X-100痕迹并去除DNA和细胞质多肽残余物。通过聚丙烯酰胺凝胶检查上清液和沉淀的包涵体和活性融合多肽以检测污染。如果这些污染是显著的，则需要洗涤沉淀。再次将沉淀重悬于相同的裂解缓冲液中，并在4℃至0℃保持10分钟。通过涡旋将悬浮液均化(例如每5分钟30秒)。重复一次孵育和离心沉淀。最后，将沉淀重悬于水中，并在冰上孵育10分钟，包括涡旋(例如，如上所述)。将悬浮液在4℃和6000至7000rpm离心25分钟。包含DNA和不期望的多肽的污染物的密度比包涵体级分小，并且可作为上清液的一部分被丢弃。现在第二次称重沉淀，并准备用于以下步骤。

步骤5)包涵体变性：

步骤4的经洗涤的包涵体通过使其解折叠而变性。如果使用包含脲(II)和氯化胍(III)的离液缓冲液，包涵体与变性缓冲液(w/v)的比例不低于1∶10。离液缓冲液含有至少6M氯化胍或8M脲。基于洗涤剂的缓冲液含有多达2％(w/v)的十二烷基硫酸钠(SDS)，以及任选地含有多至20mM HEPES。用乙酸钠、乙酸、氢氧化钠和/或氢氧化钾控制pH值。将变性缓冲液(III)的pH设置为9.0或更高。包涵体与SDS缓冲液的比例为1∶8(g/ml)。当重悬时，将混合物在室温下孵育40至60分钟，同时每10分钟涡旋30秒。通过变性缓冲液(m)中存在的SDS使融合多肽变性。融合多肽可以以溶解在变性缓冲液(III)中在室温下储存至少两周(图5)。通过将溶液冷却降至4℃持续至少一小时，从含有该融合多肽的缓冲液中去除缓冲液中的SDS。SDS被沉淀，去除小百分比的与SDS结合的多肽。通过在4℃、2000rpm至5000rpm和4分钟至8分钟下离心去除SDS晶体。收集上清液并储存在4℃。如果SDS进一步沉淀的话，则再次如上所述离心悬浮液。检查无SDS缓冲液的pH值。观察到含有融合多肽的SDS去除缓冲液的pH范围为9.0至11.0。根据图5，融合多肽当在4℃下在无SDS缓冲液中储存至少两周时不会衰解。

也可以使用变性缓冲液(I)和(II)。但是，变性缓冲液(III)表现出数种优势，即容易去除洗涤剂SDS，SDS的低成本(SDS可在沉淀后循环使用)以及立即、无洗涤剂的使用或储存。与变性缓冲液(I)和(II)相比，未观察到产物损失。

表5：变性缓冲液的组成

步骤6)结合材料的制备和填充：

马铃薯淀粉和玉米淀粉被用于填充柱，二者的粒径均小于32μm。用去除可溶性淀粉缔合多肽的多肽收集缓冲液洗涤淀粉。淀粉与缓冲液的比例为1∶2w/v。缓冲液由50mM 2-氨基-2-(羟甲基)丙烷-1，3-二醇(Tris)和50mM氯化钠(NaCl)组成，pH 7.2。淀粉在37℃下不断搅动一小时以防止沉降。在孵育之后在20℃和6000rpm下离心12分钟。去除上清液，并将淀粉在45℃下干燥8小时。将经干燥的制备的淀粉在室温下储存。使用制备的玉米淀粉和马铃薯淀粉的混合物填充柱。玉米淀粉与马铃薯淀粉的合适混合物包括1∶1、2∶3和1∶4。通过涡旋将经干燥的淀粉以期望的比例混合。通过将淀粉混合物悬浮在激活缓冲液中来制备用于柱填充的淀粉浆。用于柱填充的激活缓冲液也用于装载融合多肽样品。用于制备淀粉浆的激活缓冲液称为激活缓冲液(I)(表7)。激活缓冲液(I)允许在不激活融合蛋白的自体蛋白酶的情况下使融合多肽的结合结构域与淀粉材料结合。

上述淀粉浆可以以不同的方式与融合多肽接触。可填充重力流柱，可填充FPLC柱，或者融合多肽与淀粉浆之间的接触在离心烧杯中进行，并通过离心去除激活缓冲液(I)。

表6：淀粉洗涤缓冲液(pH 7.2)的组成

成分	浓度[mM]
		氯化钠	50
Tris	50

表7：激活缓冲液(I)(pH 9.4)的组成

成分	浓度[mM]
		HEPES	20
精氨酸	100
		蔗糖	20

表8：激活缓冲液(II)(pH 7.2)的组成

成分	浓度[mM]
		HEPES	20
精氨酸	10
		蔗糖	2

步骤7)纯化：

将融合多肽溶解在不含洗涤剂的变性缓冲液(III)中(表5)。在步骤6中描述的方式之一中使用的柱材料是经平衡的。将具有融合多肽的无洗涤剂溶液与激活缓冲液(I)以1ml融合多肽溶液与4至6ml激活缓冲液(I)的比例混合。将该混合物装载在淀粉材料上。

在用于洗脱的激活缓冲液(II)(表8)的存在下，结合的融合多肽被激活。这在使用WO2019138125中描述的方法和融合多肽时是不可能的。在使用WO2019138125的方法时，必须完全去除离液物质才能激活糖结合部分。同时，自体蛋白酶已经有活性，这是产物显著损失的原因。在当前的发明中，已经发现了获得有活性纯化结构域(i)允许在激活自体蛋白酶之前容易地去除任何污染物的方式。另外的观察是指天然N^pro和EDDI突变体的温度依赖性。发现二者均在2℃至8℃是活性最高的。SEQ ID No.：131的新型纯pH敏感性自体蛋白酶并非如此。根据SEQ ID No.：131的融合多肽的自体蛋白酶的pH范围非常窄(pH 6.8至7.2)。在23℃进行的纯化中，产物GFP在与pH 7.2首次接触之后15分钟释放。作为融合多肽的一部分已被装载在柱上的完整GFP在30分钟内释放。对于先前已知的N^pro，孵育期可以持续从2℃至8℃的80分钟到9℃至22℃的4小时和从23℃至37℃的12小时。

步骤8)GFP收集

收集先前步骤中释放的靶肽。添加50％柱体积的激活缓冲液(II)或水以从柱洗涤靶肽的总量。含有靶肽的洗脱液或上清液在1∶1(v/v)乙醇中沉淀。将产物和乙醇的混合物以5000rpm和4℃离心10分钟。丢弃上清液，并将沉淀物冷冻干燥过夜。然后将经冷冻干燥的样品溶解在合适的溶剂中，并在40W下在超声浴中在室温下声处理一小时。然后将样品在5000rpm和25℃下离心10分钟。上清液包含纯的靶肽。

对于GFP，每升培养物500毫克是典型的产率。表9显示了与根据WO’125的融合多肽构建体相比的根据本发明(SEQ ID No.：131和137)的融合多肽的产率。描绘与来自WO’125的融合多肽构建体ssTorrA-3x-CBM黑曲霉-N^pro相比的根据SEQ IDNo.：131且以GFP作为靶蛋白的融合多肽的下游处理的结果的SDS凝胶示于图4中。

表9：不同靶多肽的纯化过程中不同级分的产率

实施例3：根据本发明的融合多肽的结合动力学

下表10显示了使用不同结合材料在纯化方面对五种不同融合多肽的比较。将包涵体用2％SDS变性或使用分泌的融合多肽。一体积的30mM KCl用于洗脱。相同的融合多肽在相同的条件下进行研究，并使其与玉蜀黍淀粉、小麦淀粉和离心、柱中小麦淀粉以及柱中马铃薯淀粉接触。该表显示了每种构建体以mg/l培养物计的靶肽产率(蜂毒肽)。

表10：五种融合多肽的比较

实施例4：使用GFP评估不同的产生过程步骤

使用GFP评估包涵体产生的效率。由于在各种条件下GFP的吸收和荧光特征是已知的，因此GFP吸收和荧光用于研究生产步骤。将超级折叠GFP用作靶多肽。将携带以携带GFP的融合多肽作为插入物的表达质粒的细菌的预培养物生长过夜。该预培养物用于接种表达培养物。在诱导之前，将培养物分开，并且只有一个培养物被IPTG诱导。未经诱导的培养物用作诱导培养物的空白。在每个时间点，收集1ml两种培养物以测量OD₆₀₀。对于两种培养物，均在TNG缓冲液中产生稀释系列，该缓冲液由100mM Tris HCl、50mM氯化钠和10％甘油(w/v)组成。稀释系列的未经诱导细胞用作同一稀释度的诱导细胞的空白。相同的样品用于测量600nm的吸收和GFP范围内的荧光。每个样品用相同量的作为内标的罗丹明处理。将荧光已测量的细胞等分试样在已称皮重的容器中离心，并去除上清液。细胞质量的重量被用于将细胞质量与吸收和荧光联系起来。将1ml样品的剩余等分试样与用于光测量的样品以相同的方式稀释。使这新的稀释系列经受细胞裂解。通过离心分离上清液和沉淀。如之前用罗丹明处理上清液。测量后，样品在乙醇中沉淀，并确定质量。这样，将在沉淀中与上清液中的GFP相互比较。超级折叠GFP也可以在包涵体中确定。在作为激发波长的491nm和作为发射波长的512nm处进行荧光测量。

在图1中显示了两个不同样品的GFP荧光。在左手侧，显示了裂解物样品中的荧光，其被预期没有荧光或荧光很少。在右手侧的图中，显示了说明GFP产生的清晰荧光。该图显示已产生GFP。

实施例5：融合多肽结合的测试

检测了融合多肽与淀粉基质的结合测试。因此，将柱或离心烧杯沉淀材料(100mg)的等分试样转移到2ml反应容器中，并用1％SDS和10mM巯基乙醇在水中的500μl溶液处理。将混合物在800rpm和37℃下搅动10分钟。然后，将样品在10000rpm和室温下离心5分钟。15μl上清液用于SDS聚丙烯酰胺凝胶样品制备和连续的聚丙烯酰胺凝胶分析。由于融合多肽的质量是已知的，因此可以鉴定凝胶中的确切质量。

图2显示了描绘融合多肽与小麦柱的结合的动力学观察的12％聚丙烯酰胺凝胶。将9种小麦淀粉样品与激活的融合多肽一起装载，并洗脱上清液。在特定时间点之后提取样品淀粉，并将所得的样品装载到12％聚丙烯酰胺凝胶上。因此，图2显示融合多肽与淀粉结合。

Claims

1.融合多肽，其在从N端至C端的方向上包含以下或由以下组成：

(i)纯化结构域，

(ii)自体蛋白酶结构域，

(iii)靶肽结构域，

(iv)任选地：信号序列，和

(v)任选地：接头序列，

其中所述自体蛋白酶结构域(ii)包含以下或由以下组成：根据SEQ ID No.：117的氨基酸序列或与SEQ ID No.：117具有90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的氨基酸序列，以及

其中所述纯化结构域(i)与糖基质结合并且包含以下或由以下组成：根据SEQ ID No.：1、SEQ ID No.：2、SEQ ID No.：3、SEQ ID No.：4、SEQ ID No.：5、SEQ ID No.：6、SEQ IDNo.：7、SEQ ID No.：8或SEQ ID No.：9的至少一个氨基酸共有基序序列。

2.根据权利要求1所述的融合多肽，其中所述纯化结构域(i)包含选自以下的至少一个氨基酸序列或由选自以下的至少一个氨基酸序列组成：根据SEQ ID No.：10至SEQ ID No.：116的序列，优选SEQ ID No.：10至SEQ ID No.：13的序列，以及与所述序列中任一个具有90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的序列。

3.根据权利要求1或2所述的融合多肽，其中所述自体蛋白酶结构域(ii)包含选自以下的氨基酸序列或由选自以下的氨基酸序列组成：根据SEQ ID No.：118、SEQ ID No.：119或SEQ ID No.：120的序列和与所述序列中任一个具有90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高序列同一性的序列。

4.根据前述权利要求中任一项所述的融合多肽，其包含信号序列(iv)，其中所述信号序列(iv)是包涵体促进序列或分泌序列，优选革兰氏阴性细菌的IV型或II型分泌的分泌序列。

5.根据前述权利要求中任一项所述的融合多肽，其包含接头序列(V)，其中所述接头序列包含N端α螺旋和/或无规卷曲结构的C端序列。

6.重组核酸分子，其编码根据前述权利要求中任一项所述的融合多肽。

7.经遗传修饰的细胞，其包含根据权利要求6所述的重组核酸分子，其中所述细胞能够表达根据权利要求1至5中任一项所述的融合多肽。

8.根据权利要求7所述的经遗传修饰的细胞，其中所述细胞选自：大肠杆菌(Escherichia coli)、需钠弧菌(Vibrio natrigens)、酿酒酵母(Saccheromycescerevisiae)、黑曲霉(Aspergillus niger)、绿藻、微藻、HEK T293和中国仓鼠卵巢细胞(CHO)。

9.制备靶肽的方法，其包括以下步骤：

(a)提供根据权利要求7或8所述的经遗传修饰的细胞，

(b)在适合根据权利要求1至5中任一项所述的融合多肽表达的条件下培养所述细胞，

(c)获得所述融合多肽以及任选地，将获得的融合多肽解折叠并将所述融合多肽定向重折叠，

(d)使在步骤(c)中获得的所述融合多肽与糖基质接触，

(e)通过激活所述融合多肽的所述自体蛋白酶结构域来切割所述融合多肽，从而获得靶肽，

(f)收集包含所述靶肽的混合物。

10.根据权利要求9所述的方法，其中步骤(d)中的所述糖基质由选自以下的物质组成或包含选自以下的物质：淀粉、木质素糖聚合物、具有葡萄糖的α-1，4-和α-1，6糖苷键的共聚物或其他糖及其混合物，以及所述糖基质优选作为填充底物或作为由直链淀粉和支链淀粉组成的淀粉粒存在于填充柱中。

11.根据权利要求9或10所述的方法，其中步骤(e)中所述自体蛋白酶结构域的激活是在pH 6至pH 8下，优选在pH 6.5至pH 7.5下，特别优选在pH 7至pH 7.4下进行的。

12.重组核酸分子，其任选地与表达控制序列有效连接，所述重组核酸分子编码根据权利要求1至5中任一项所述的融合多肽和用于并入根据权利要求6所述的重组核酸分子的克隆位点。

13.混合物，其包含以下或者由以下组成：靶肽，优选合成靶肽，以及基于钠(如果存在的话)、钾(如果存在的话)和靶肽之和的总重量的总量为0.001至1wt.-％的钠和/或钾，其中所述混合物通过或能够通过根据权利要求9至11所述的方法获得。

14.合成靶肽，其中所述肽包含N端脯氨酸，所述合成靶肽通过或能够通过根据权利要求9至11所述的方法获得；或者根据权利要求13所述的混合物，其中所述靶肽是包含N端脯氨酸的肽。