CN116981680A

CN116981680A - 用于肽生产的组合物和方法

Info

Publication number: CN116981680A
Application number: CN202280021649.4A
Authority: CN
Inventors: 贾姆希德·达沃迪; 穆罕默德·M·达沃迪
Original assignee: Biocatalyst Co ltd
Current assignee: Biocatalyst Co ltd
Priority date: 2021-01-14
Filing date: 2022-01-13
Publication date: 2023-10-31
Also published as: EP4277917A2; WO2022155389A2; US20230193342A1; US11802301B2; US20240026414A1; WO2022155389A3

Abstract

本公开内容涉及通过包含特异性蛋白酶识别位点或化学裂解序列的重组多肽的蛋白水解产生具有靶氨基酸序列的产物肽。在一些实施方案中，产物肽通过蛋白水解去除中间氨基酸序列从重组多肽中的重复肽单元释放，所述蛋白水解是通过识别中间氨基酸序列内位点的蛋白酶，以及羧肽酶、氨肽酶和/或其他蛋白酶。

Description

用于肽生产的组合物和方法

公开内容的领域

本公开内容总体上涉及用于改进重组多肽产生的系统、组合物和方法。在特定实施方案中，包含编码包含多于一个连接肽的多肽的开放阅读框的构建体可用于简化或减少产生纯化肽所需的步骤数量，和/或增加纯化肽产物的产量。因此，本发明涉及包含上述构建体的核酸分子、包含所述核酸分子的细胞、包含所述核酸分子和/或细胞的系统和生产设备，以及包含和/或使用任何和所有前述内容的重组肽生产方法。

背景

纯化肽在许多应用中是有用的；例如，在诊断应用中，作为治疗剂，作为食物成分/添加剂，以及作为病原体抑制剂。短和中等大小的肽通常通过化学合成方法产生。然而，这些方法仅对于最短的肽是最经济的，并且翻译后修饰在化学合成期间不容易实现。此外，化学合成需要使用极其危险的化学品。

重组DNA技术为化学合成提供了次优的替代品，尽管在某些情况下它是优选的。重组方法使用细胞的内源性蛋白质产生机构来生产异源肽。重组肽合成需要许多复杂的生化过程，包括转录、翻译、蛋白质折叠和翻译后修饰(例如，糖基化和二硫键形成)，这些过程通常由酶催化。使用这些内源性过程生产重组肽的技术仍然具有挑战性，例如，由于它们在不同细胞中对相同前体多肽的不同操作。

此外，常规重组肽生产可获得的产率不足够高以与化学合成方法竞争大多数中等大小肽的合成。生产含有期望肽的串联重复序列的多肽是设计为解决这些问题的一种策略，尤其是为了提高产量。然而，使用化学物质或蛋白酶将肽从翻译的多肽上裂解下来的现有裂解策略在最终的肽产物中留下了额外的氨基酸。这些额外的氨基酸具有许多显著的缺点，这些缺点阻碍了肽的预期用途；例如，额外的氨基酸可能通过引发免疫原性响应而为医学应用带来问题，并且额外的氨基酸还可能干扰肽的生理功能。因此，需要昂贵的临床试验来验证它们在医学应用中的用途，即使不含额外氨基酸的肽的使用已经被批准。

使用串联重复序列增加肽生产产量的另外的障碍是嵌合蛋白必须被设计成使得裂解位点都可被裂解剂接近，否则将无法实现肽产量的预期增加。

已经提出了几种解决方案来解决达到重组肽生产技术的全部前景的一些前述障碍，但是没有一种解决方案足以提供通常可用于以高产量、成本有效且环境友好的方式、独立于肽长度且不形成包涵体地产生基本上所有具有精确预期序列的期望肽的生产平台。

美国专利第6,051,399号描述了通过在接头肽的氨基末端引入异源半胱氨酸和在羧基末端引入甲硫氨酸，从串联重复序列生产重组C-末端酰胺化肽的方法。这要求得到的肽不含游离半胱氨酸或甲硫氨酸。当这些氨基酸中的任何一种存在于期望的肽中时，不可能产生肽的精确序列。例如，当接头序列的C-末端以半胱氨酸结束时，肽的N-末端在裂解反应期间被亚氨基噻唑烷-羧基基团修饰。或者，当接头肽以甲硫氨酸开始时，则高丝氨酸内酯被引入肽中。这些修饰干扰了肽的许多应用，并且因此这些方法不适合可适用于任何肽生产的一般生产系统。此外，串联重复序列的设计应使得裂解序列易于被化学剂和蛋白酶接近。否则，需要串联重复序列的变性以暴露裂解位点。这可能是有问题的，特别是对于串联重复序列的酶促裂解，因为酶本身在存在变性剂的情况下变性。

公开内容的概述

本公开内容描述了以增加产量的另外益处生产具有精确预期靶序列的重组产物肽的问题的解决方案，并且通过采用环境友好的试剂和方法以及通过消除方法步骤来限制所需的资源。因此，本公开内容提供了包含连接肽的构建体、系统和多肽，其在实施方案中用于有效地产生适用于许多应用(从营养到人类或动物的医疗和药物用途)的广泛的产物肽。

在实施方案中，酶催化的蛋白水解单独使用或与化学蛋白水解组合使用，以将包含多于一个肽重复序列的重组多肽裂解成由期望的靶氨基酸序列组成的产物肽。在特定的实施方案中，重组多肽可溶于水性环境；例如细胞(例如，细菌细胞诸如大肠杆菌(E.coli))的胞质溶胶。因此，本文的实施方案包括本文描述的含肽重复序列的多肽、编码这样的多肽的核酸、包含这样的构建体和/或多肽的宿主细胞和重组生产平台，以及使用前述生产由靶氨基酸序列组成的产物肽的方法。

因此，一些实施方案包括重组多肽(例如，翻译产物多肽)，其包含多于一个具有靶序列的产物肽，还包含每个产物肽之间的至少一个中间“接头序列”，其中接头序列包含第一蛋白水解反应中蛋白酶的裂解位点，以产生中间肽，该中间肽随后被酶促或化学加工成由靶序列组成的产物肽。实例包括，其中产物肽具有相同的靶氨基酸序列的多肽，其中多肽包含两个具有不同靶氨基酸序列的产物肽的实例，以及其中多肽包含多于两个具有不同靶氨基酸序列的产物肽的实例。

在特定方面，多于一个中间肽和中间接头序列包含至少一个包含识别两或四个连续的碱性氨基酸的蛋白酶裂解位点(P.C.S.)的接头序列(例如，多于一个或所有接头序列)。用这样的蛋白酶蛋白水解多肽产生中间肽，所述中间肽包含产物肽的靶氨基酸序列羧基末端的碱性氨基酸。在本文的实例中，羧肽酶对中间肽的蛋白水解消除了剩余的额外碱性残基，产生由靶氨基酸序列组成的产物肽。

在特定方面，在接头序列中使用小氨基酸，尤其是甘氨酸，结合使用识别大量带电氨基酸的蛋白酶，可以确保裂解位点暴露于裂解试剂。

在特定方面，多于一个中间肽和中间接头序列包括至少一个接头序列(例如，多于一个或所有接头序列)，所述接头序列包含氨基末端化学裂解序列(C.C.S.)和在P1’位置不留下无关(extraneous)氨基酸的蛋白酶裂解位点。在本文的实例中，用这样的蛋白酶蛋白水解多肽产生包含氨基末端C.C.S.的中间肽。在本文的实例中，中间肽的化学蛋白水解产生由靶氨基酸序列组成的产物肽。

在一些实施方案中，用一种或更多种逆转录病毒蛋白酶蛋白水解多肽可以单独使用或与一种或更多种另外蛋白酶组合使用。被逆转录病毒蛋白酶蛋白水解可以发生在分别在P1和P1’位置处具有芳香族残基和脯氨酸的1型裂解位点，或者在P1位置处具有疏水残基的2型裂解位点。依赖于固着键(sessile bond)的C-末端侧进行底物识别的逆转录病毒蛋白酶可以与在P1’位置处不留下氨基酸的其他蛋白酶组合用于多肽。

在实例中，重组多肽还包含至少一个肽单元，其不形成中间肽产物或接头序列的一部分；例如，在多肽的N-末端，或在多肽的C-末端。在某些实施方案中，多肽可以在多肽的N-末端和C-末端都包含这样的肽单元。这样的肽单元的非限制性实例包括改善检测、纯化和/或增溶的标签；N-末端或C-末端加帽单元；受体；信号结构域；和靶向结构域。在特定实例中，重组多肽包含促进多肽纯化(例如亲和纯化)和/或增溶的标签。

一些实施方案包括包含编码本文描述的重组多肽的多核苷酸的核酸分子。实例包括被翻译产生重组多肽的核糖核酸(RNA)分子；包含编码这样的RNA分子(例如，包含在表达盒中)的多核苷酸的脱氧核糖核酸(DNA)构建体；和/或DNA分子(例如，表达载体、转化载体、稳定复制质粒和基因组分子(例如，包含构建体的染色体))。本文的DNA构建体或分子可以包含一个或更多个调节序列；例如，在细胞或基于细胞的系统中起作用以启动可操作连接的多肽、转录终止序列、5’-非翻译区(5’-UTR)和/或3’-非翻译区(3’-UTR)的转录的启动子。

特定实施方案还包括识别两个或四个连续碱性氨基酸的蛋白酶和/或在P1’裂解位置处不留下无关氨基酸的蛋白酶，和/或编码所述蛋白酶的核酸构建体或分子。在特定实例中，本文描述编码重组多肽的DNA构建体或分子还包含编码蛋白酶的多核苷酸。然而，特定的实例包括重组多肽；编码重组多肽和蛋白酶的DNA构建体或分子；编码蛋白酶的DNA构建体或分子，或前述的任何组合(例如，在生产细胞、细胞裂解物、生物反应器或偶联的无细胞转录-翻译系统中)。在一个非限制性实例中，编码蛋白酶的多核苷酸可以可操作地定位在DNA分子中包含编码重组多肽的多核苷酸的构建体内，其中DNA分子还可包含位于编码蛋白酶的多核苷酸和编码重组多肽的多核苷酸之间的至少一种另外的调节序列(例如，启动子或内部核糖体进入位点序列)。

本文的另外实施方案还包括用于生产由靶序列组成的前述产物肽的重组生产系统。例如，本文的特定实施方案包括包含编码至少一种重组多肽的DNA构建体或分子的细胞、细胞裂解物、生物反应器和偶联的无细胞转录-翻译系统。在具体实例中，细胞、细胞裂解物、生物反应器或偶联的无细胞转录-翻译系统包含DNA构建体或分子，该DNA构建体或分子包含编码已被密码子优化以在细胞、细胞裂解物、生物反应器或偶联的无细胞转录-翻译系统中表达的重组多肽的多核苷酸(和/或编码另外肽单元的多核苷酸)。在这些和其他实例中，编码重组多肽的多核苷酸可以包含已经被密码子优化以编码具有相同靶氨基酸序列的产物肽的核苷酸序列；例如降低宿主细胞中RNAi沉默的作用。

与前述一致，本文的一些实施方案包括产生至少一种由靶氨基酸序列组成的产物肽的方法；例如，适于预期用途(例如，在人类或动物中的医疗和药物用途)的靶氨基酸序列。如先前提及的，相对于常规重组生产方法，这样的方法产生由靶氨基酸序列组成的产物肽，没有另外的氨基酸或不期望的内部修饰，并且具有增加的产率和期望的反应参数(例如，有限的步骤、廉价的试剂和/或环境友好的试剂)。在实施方案中，将本发明的重组(例如，可溶性)多肽与蛋白酶接触(例如，通过在反应混合物中混合多肽和蛋白酶，通过在包含蛋白酶的细胞或基于细胞的系统中表达多肽，或反之亦然，或者通过在细胞或基于细胞的系统中表达多肽和蛋白酶二者)，从而在蛋白酶的裂解位点裂解多肽，产生包含产物肽氨基酸序列的多于一个中间肽。蛋白酶可以是识别两个或四个连续碱性氨基酸的蛋白酶，或者是在P1’位置处不留下氨基酸的蛋白酶。在其中蛋白酶识别两个或四个连续碱性氨基酸的实施方案中，中间肽可以与去除第一蛋白水解步骤中剩余的碱性残基的第二蛋白酶(例如，羧肽酶)接触，从而产生由靶氨基酸序列组成的产物肽。在其中蛋白酶在P1’位置处不留下氨基酸的实施方案中，中间肽可以在适当的条件下与化学剂接触，从而通过化学蛋白水解产生由靶氨基酸序列组成的产物肽。

在一些实施方案中，重组多肽可以在细胞或基于细胞的系统中产生，并从其纯化以分离多肽；例如且不限于，通过用结合包含在多肽内的标签的固定化剂(例如，小分子和抗体)亲和纯化。在一些实施方案中，产物肽可以从由第二蛋白酶或化学剂催化的第二蛋白水解反应中纯化。

从下面参考附图进行的详细描述中，前述和其他特征将变得更加明显。

附图简述

图1包括有助于说明本文实施方案的其他方面的图。图1A显示了用于生产产物肽的重组多肽的线性表示。如图1中所描绘的方案，重组多肽可以包含TAG，如所示的，随后首先是包含在P1’位置处不留下氨基酸的蛋白酶(例如选自肠激酶、因子Xa、胱天蛋白酶和颗粒酶B)的裂解位点的肽，并且然后是重复单元(RU)，每个重复单元包含化学裂解序列(C.C.S.)、接头序列(L_nk)、在P1’位置处不留下氨基酸的蛋白酶裂解位点(P.C.S.)和产物肽(图1B)。如图1C所示，用蛋白酶(“酶”)进行蛋白水解，释放中间肽，每个中间肽包含具有羧基末端化学裂解序列(C.C.S.)、接头序列(L_nk)和蛋白酶裂解位点(P.C.S.)的产物肽。用合适的化学剂(“化学剂”)对中间肽进行化学裂解，产生由它们的靶氨基酸序列组成而不含无关氨基酸的产物肽。接头氨基酸被放置在C.C.S.和酶识别序列之间，并且对于每个重复单元可以是相同的或可变的。然而，Gly、Ala和Ser三种氨基酸优选作为接头序列的最后一个氨基酸。

图2包括有助于说明本文实施方案的其他方面的图。图2A显示了用于生产产物肽的重组多肽的线性表示。重组多肽可包含TAG，如所示的，随后首先是包含在P1’位置处不留下氨基酸的第一蛋白酶(例如选自肠激酶、因子Xa、胱天蛋白酶和颗粒酶B)的裂解位点(蛋白酶1裂解位点(P1.C.S.))的肽，并且然后是重复单元(RU)，每个重复单元包含第二蛋白酶(诸如HIV-1蛋白酶)的裂解位点(蛋白酶2裂解位点(P2.C.S.))、接头序列(L_nk)、在P1’位置处不留下氨基酸的第一蛋白酶的裂解位点和产物肽(图2B)。如图2C所示，用第一蛋白酶(“酶1”)进行蛋白水解，释放肽产物和中间肽，所述中间肽各自包含产物肽、P2.C.S.、L_nk和P1.C.S.。用第二蛋白酶(“酶2”)处理产生了由它们的靶氨基酸序列组成而不含无关氨基酸的产物肽。接头氨基酸被放置在P2.C.S.和P1.C.S.之间并且对于每个重复单元可以是相同的或可变的。然而，Gly、Ala和Ser三种氨基酸优选作为接头序列的最后一个氨基酸。酶的添加顺序可以互换，或者它们可以同时添加。

图3包括有助于说明本文实施方案的基本潜在方面的图。图3A显示了用于分离(例如，包括纯化)产物肽的重组多肽的线性表示。重组多肽可以包含TAG(例如选自亲和纯化标签和增溶标签)，如所示的，随后是重复单元(RU)(图3B)，每个重复单元都包含具有第一蛋白酶(“酶1”)(例如，选自弗林蛋白酶、蛋白质转化酶、神经内分泌转化酶和Kexin)的裂解位点的肽，该第一蛋白酶在偶数个连续的碱性残基(2个至4个)的C-末端侧裂解。如图3C所示，用酶1进行蛋白水解，释放中间肽，每个中间肽包含产物肽和羧基末端碱性氨基酸(B_m)。还如图3C所示，用羧肽酶(“酶2”)(例如选自CPN(也称为激肽酶I)、CPB、CPU和金属羧肽酶D(CPD))进一步蛋白水解中间肽，产生由它们的靶氨基酸序列组成而不含无关氨基酸的产物肽。

图4显示pET32a的质粒图，含有编码重组多肽的表达盒，所述重组多肽包含含有胰高血糖素产物肽的串联重复单元。

图5显示了加硫氧还蛋白标签的胰高血糖素(四个重复序列)的生产和加工以及通过MALDI-TOF质谱对产物质量的确认。图5A显示了加硫氧还蛋白标签的胰高血糖素的四个重复序列在被胱天蛋白酶-7水解之前和之后的SDS-PAGE分析(Tricine凝胶)。从左至右：蛋白质标志物、用胱天蛋白酶-7处理的加硫氧还蛋白标签的胰高血糖素、通过C18柱纯化的胰高血糖素和重复单元(RU—与接头序列和NTCB裂解序列以及胱天蛋白酶识别序列连接的胰高血糖素)、成熟胰高血糖素和加硫氧还蛋白标签的胰高血糖素。图5B显示了在胱天蛋白酶-7有限水解之前和之后加Trx标签的胰高血糖素的四个重复序列的SDS-PAGE分析(Tricine凝胶)，产生所有预期的片段，表明所有设计的胱天蛋白酶裂解位点对蛋白酶几乎同等地可及。图5C显示了使用CHCA作为基质，对胰高血糖素和胰高血糖素重复单元(RU—附接到NTCB裂解序列、接头肽和胱天蛋白酶识别序列的胰高血糖素)的线性模式MALDI-TOF质谱分析。具有预期分子量的肽片段的存在证明该酶已经在指定位点正确裂解了胰高血糖素的加Trx标签的串联重复序列。

图6显示了加硫氧还蛋白标签的特立帕肽(teriparatide)的四个重复序列在大肠杆菌中的生产和通过胱天蛋白酶-3、胱天蛋白酶-7和HIV1蛋白酶的加工。图6A显示了胱天蛋白酶-7处理前Trx-HIV特立帕肽(四个重复序列)(泳道1)，和通过胱天蛋白酶-7水解Trx-特立帕肽获得的HPLC纯化的特立帕肽及其重复单元(泳道2)的SDS-PAGE(Tricine)。图6B显示了Trx-HIV特立帕肽的胱天蛋白酶水解条件可以设置为以SDS-PAGE(Tricine)揭示的不溶性(泳道1)或可溶性(泳道2)形式产生特立帕肽和特立帕肽的重复单元。观察到的肽条带是在20.2分钟从Biorad Hipore C18柱洗脱的产物。泳道3显示成熟的特立帕肽。图6C显示了使用Biorad-Hipore C18柱对胱天蛋白酶-7处理后Trx-HIV特立帕肽、四个重复序列的HPLC分析。建立0.1％三氟乙酸中5％至90％乙腈的梯度持续30分钟的时间段。特立帕肽及其重复单元的混合物在20.2分钟洗脱。图6D显示了MALDI-TOF质谱证实了胱天蛋白酶-7对Trx-特立帕肽(四个重复序列)(具有胱天蛋白酶-3/-7和HIV1蛋白酶识别位点)的正确加工。将干燥的肽溶解在水中，并且根据制造商的方案用Rainin C18尖头清洗，并布点在MALDI平板上。添加等体积的CHCA基质并干燥，然后以线性模式进行MS分析。

图7显示了具有胱天蛋白酶-3(-7)和Ni²⁺裂解序列的加硫氧还蛋白标签的特立帕肽(四个重复序列)在大肠杆菌中的生产和加工。图7A显示了使用胱天蛋白酶-7完全水解Trx-特立帕肽产生硫氧还蛋白(Trx标签)、特立帕肽的重复单元和特立帕肽的SDS-PAGE分析(Tricine)。图7B显示了用胱天蛋白酶-3和胱天蛋白酶-7有限水解Trx-Ni-特立帕肽(四个重复序列)并在50℃使用1mM浓度的NiCl₂将特立帕肽的重复单元转化为成熟特立帕肽的SDS-PAGE分析(Tricine)。图7C显示了通过SDS-PAGE分析(甘氨酸)分析的通过与胱天蛋白酶-7在30℃孵育2小时，Trx-特立帕肽(四个重复序列)的剂量依赖性裂解。图7D显示了在50℃用1mM NiCl₂处理后特立帕肽的重复单元完全转化为成熟特立帕肽，经MALDI-TOF质谱证实。CHCA用作基质。图7E显示了使用Thermo Q-Exactive轨道阱质谱仪获得的特立帕肽及其包含Ni²⁺裂解序列的重复单元的ESI-MS分析。图7F和图7G分别显示了Tricine和甘氨酸凝胶的预染色蛋白质标志物的分子量。

图8显示了具有Ni²⁺裂解序列的加硫氧还蛋白标签的特立帕肽(四个重复序列)的水解及其被1mM和2mM NiCl₂、孵育时间为24小时，并且温度为23℃、37℃和50℃的裂解的SDS-PAGE(甘氨酸)分析(图8A)和产生的在2500Da和10000Da之间的肽的MALDI-TOF分析(图8B)。重复单元的单个质子化氧化形式的预期分子量为5246.9。

发明详述

(i)定义

除非另有说明，否则以下定义适用于本申请的所有方面和实施方案。

为了便于回顾本公开内容的各种实施方案，提供了特定术语的以下解释。除非另有明确指示，否则本文的所有术语都具有它们在本领域中的正常和习惯含义。

胱天蛋白酶：胱天蛋白酶是一个已知和确定的蛋白酶家族，基于其特定的半胱氨酸蛋白酶活性进行分类。除非特别说明或从上下文中清楚，否则本文使用的术语“胱天蛋白酶”是指胱天蛋白酶-1、胱天蛋白酶-2、胱天蛋白酶-3、胱天蛋白酶-4、胱天蛋白酶-5、胱天蛋白酶-6、胱天蛋白酶-7、胱天蛋白酶-8、胱天蛋白酶-9、胱天蛋白酶-10、胱天蛋白酶-14、颗粒酶B和CED-3。在本文的某些实例中特别感兴趣的是胱天蛋白酶-3和胱天蛋白酶-7。胱天蛋白酶共有在P1位置的某些天冬氨酸残基旁边的位点裂解蛋白质的精准的特异性。在整个家族中，胱天蛋白酶对P2位点的氨基酸变异具有耐受性。Talanian等人.(1997)J.Biol.Chem.272(15):9677-82。

从蛋白质组学研究已经确定了不同胱天蛋白酶的不同识别位点。胱天蛋白酶通常具有偏好的识别位点，尽管胱天蛋白酶耐受P2位置处的变异；例如，胱天蛋白酶-3和胱天蛋白酶-7表现出对DEXD(SEQ ID NO:33)的偏好，尽管它在酶的天然裂解位点中具有低频率。在本文的实例中特别偏好的是在可变P2位置包含V的胱天蛋白酶-3和胱天蛋白酶-7的识别位点(SEQ ID NO:34)。作为另外的实例，胱天蛋白酶-1在P4位置偏好Y或F(SEQ ID NO:36-37)，并且胱天蛋白酶-8在P4位置偏好T或V(SEQ ID NO:42)。本领域已知许多对应于不同胱天蛋白酶的另外裂解位点。下表1中提供了另外的实例。

分离的：“分离的”生物组分(诸如多核苷酸、重组多肽和产物肽)已经基本上与分子中的其他生物组分(例如DNA分子或重组多肽)和/或该组分天然存在的生物体的细胞中的其他生物组分(例如，其他染色体和染色体外DNA和RNA、以及蛋白质)分离或从其产生(例如从其纯化)，同时实现该组分的化学或功能变化(例如，可以通过破坏连接多核苷酸和染色体中剩余DNA的化学键从染色体中分离多核苷酸)。已经“分离”的多核苷酸、蛋白质(例如，重组多肽)和肽包括通过标准纯化方法纯化的核酸分子、蛋白质/多肽和肽。该术语还具体包括在宿主细胞中通过重组表达制备的分子和蛋白质，以及化学合成的核酸分子、蛋白质/多肽和肽。

多肽、蛋白质和肽：如本文所用，术语“多肽”和“蛋白质”可互换使用，以指氨基酸的聚合物。这些术语所涵盖的分子还包括那些具有翻译后修饰例如糖基化、乙酰化、磷酸化和二硫键的分子。出于描述本发明的目的，术语“肽”通常用于区分多肽重复单元中发现的氨基酸聚合物和多肽本身。然而，本领域的人将理解，在本公开内容的上下文中，这种区分仅仅是为了清晰的目的，并且将进一步理解，使用本文的组合物和方法产生的“肽”本身可以包含其本身可以被归类为肽的不同的结构域和单元。本文某些实施方案的多肽和肽可以完全由天然存在的氨基酸组成，或者它们可以掺入非天然和/或标记的氨基酸。非天然氨基酸的实例是β-氨基酸和仍然可以掺入肽或多肽中的修饰的天然氨基酸。Daniels等人.(2007)J.Am.Chem.Soc.129:1532-3；Hendrickson等人.(2004)Annu.Rev.Biochem.73:147-76。

本文实施方案的多肽和肽的氨基酸序列通常使用经典蛋白酶裂解命名法的术语来描述，将位于底物多肽的P1和P1’氨基酸之间的裂解位点括起来(<>)，将位点描述为：

Pn-P4-P3-P2-P1<>P1’-P2’-Pn’

核酸分子：如本文所用，术语“核酸分子”是指核苷酸的聚合形式，包括RNA、cDNA、基因组DNA以及上述的合成形式和混合聚合物。核苷酸可以指核糖核苷酸、脱氧核糖核苷酸或任一类型核苷酸的修饰形式。核酸分子可以包括通过天然存在和/或非天然存在的核苷酸键连接在一起的天然存在和修饰的核苷酸中的一种或两种。

核酸分子可以包含在本文中称为“多核苷酸”的结构单元，其区分聚合物中核苷酸的物理顺序，与“核苷酸序列”不同，“核苷酸序列”是指物理多核苷酸中包含的信息。

外源性：本文中应用于核酸分子、多核苷酸、多肽和肽的术语“外源性”是指通常不存在于其特定环境或背景中的一种或更多种核酸分子、多核苷酸、多肽和肽。例如，如果宿主细胞被转化为使得其包含在自然界中未转化的宿主细胞中不存在的多核苷酸或表达在自然界中未转化的宿主细胞中不存在的多肽，则该多核苷酸或多肽对宿主细胞是外源的。此外，当质粒或载体通常不存在于宿主细胞的基因组中时，存在于宿主细胞中的质粒或载体中的多核苷酸对宿主细胞是外源的。术语“核酸分子”的范围内具体包括基因组核酸分子，诸如染色体或自我复制质粒，其包含通常不存在于宿主细胞的天然存在的染色体或质粒中的多核苷酸。术语“多核苷酸”具体包括那些整合在宿主细胞基因组DNA中的多核苷酸；例如在转化事件之后。

异源：本文中应用于核酸分子、多核苷酸、多肽和肽的术语“异源”意指不同来源的。例如，如果宿主细胞用具有在自然界中未转化的宿主细胞中不存在的核苷酸序列的多核苷酸转化，则该多核苷酸对宿主细胞是异源的(和外源的)。此外，核酸构建体(例如，表达构建体)的不同元件(例如，启动子、增强子、编码序列、终止子等)可以彼此异源和/或与宿主细胞异源。本文使用的术语异源也可应用于一种或更多种多核苷酸、多肽或肽，它们在序列上与宿主细胞中已经存在的多核苷酸、多肽或肽相同，但现在连接到不同的另外多核苷酸或肽(例如，标签、标志物、报告基因或功能单元)和/或以不同的拷贝数、或细胞位置或区室存在。

如本文所用，“密码子优化”是指其中密码子已被选择为允许多肽在特定宿主生物或宿主细胞中有效表达的多核苷酸。用于表达多肽的示例性宿主生物体和宿主细胞(“表达宿主”)包括大肠杆菌、酿酒酵母(S.cerevisiae)、粟酒裂殖酵母(S.pombe)、巴斯德毕赤酵母(P.pastoris)、昆虫细胞、植物细胞和适用于该目的的许多哺乳动物细胞系的细胞(例如但不限于HeLa、Jurkat、293、CHO和COS细胞)。用于表达异源多肽的模式表达宿主是本领域已知的，并且密码子优化的异源核苷酸序列可以从这样的生物体中高表达的多肽的密码子使用频率推导。

序列同一性：如本文所用在两个多核苷酸、多肽或肽的上下文中的术语“序列同一性”或“同一性”是指两个序列中当在指定的比较窗口上为了最大对应性对齐时相同的核苷酸序列或氨基酸序列。

如本文所用，术语“序列同一性百分比”可以指通过在比较窗口上比较两个最佳对齐的序列而确定的值，其中为了两个序列的最佳对齐，比较窗口中的序列部分可以包括与参考序列(不包括添加或缺失)相比的添加或缺失(例如，缺口)。百分比通过如下计算：确定两个序列中出现相同核苷酸或氨基酸残基的位置的数目，以产生匹配位置的数目，将匹配位置的数目除以比较窗中位置的总数目，并将结果乘以100以得到序列同一性的百分比。

用于比对序列以进行比较的方法是本领域公知的。各种程序和比对算法描述于，例如：Smith和Waterman(1981)Adv.Appl.Math.2:482；Needleman和Wunsch(1970)J.Mol.Biol.48:443；Pearson和Lipman(1988)Proc.Natl.Acad.Sci.U.S.A.85:2444；Higgins和Sharp(1988)Gene 73:237-44；Higgins和Sharp(1989)CABIOS 5:151-3；Corpet等人.(1988)Nucleic Acids Res.16:10881-90；Huang等人.(1992)Comp.Appl.Biosci.8:155-65；Pearson等人.(1994)Methods Mol.Biol.24:307-31；Tatiana等人.(1999)FEMSMicrobiol.Lett.174:247-50。对序列比对方法和同源性计算的详细考虑可以在例如Altschul等人.(1990)J.Mol.Biol.215:403-10中找到。

美国国家生物技术信息中心(National Center for BiotechnologyInformation，NCBI)基本局部比对搜索工具(BLAST^TM；Altschul等人.(1990))可从若干个来源获得，包括美国国家生物技术信息中心(National Center for BiotechnologyInformation)(Bethesda，MD)和互联网上，用于与若干个序列分析程序结合使用。关于如何使用该程序确定序列同一性的描述可在互联网上BLAST^TM的“帮助”章节下获得。对于核酸序列的比较，可以使用默认参数采用BLAST^TM程序的“Blast 2序列”功能。当通过这种方法评估时，与参考序列相似性增加的核苷酸或氨基酸序列将显示出增加的百分比同一性。

如本文关于核苷酸序列所用的，术语“基本上相同”是指超过85％相同的序列。例如，基本上相同的核苷酸序列可以与参考序列至少85.5％；至少86％；至少87％；至少88％；至少89％；至少90％；至少91％；至少92％；至少93％；至少94％；至少95％；至少96％；至少97％；至少98％；至少99％；或至少99.5％相同。

作为序列同一性的等价物，“特异性杂交”的结构特性可用于定义具有基本上相同核苷酸序列的多核苷酸。“特异性杂交”指示寡核苷酸探针和由特异性结合限定的靶多核苷酸之间发生序列特异性稳定结合所需的互补程度。只有当寡核苷酸与非靶多核苷酸的非特异性结合在适当的条件下不发生时，探针寡核苷酸才是可特异性杂交的，这是本领域技术人员对于任何探针-靶对都已知的。

杂交条件随着杂交探针和靶多核苷酸的组成和长度、杂交温度、杂交缓冲液的离子强度和洗涤条件而变化。对于特定的探针序列，测定特异性杂交所需的杂交条件的计算是可确定的，并且是本领域普通技术人员已知的；例如，Sambrook等人.(ed.)MolecularCloning:ALaboratory Manual,2^nd ed.,vol.1-3,Cold Spring Harbor LaboratoryPress,Cold Spring Harbor,NY,1989,chapters 9and 11；以及Hames和Higgins(eds.)Nucleic Acid Hybridization,IRL Press,Oxford,1985中讨论了这样的计算。关于核酸杂交的另外详细说明和指导可以在例如Tijssen,“Overview of principles ofhybridization and the strategy of nucleic acid probe assays,”in LaboratoryTechniques in Biochemistry and Molecular Biology-Hybridization with NucleicAcid Probes,Part I,Chapter 2,Elsevier,NY,1993；以及Ausubel等人,Eds.,CurrentProtocols in Molecular Biology,Chapter 2,Greene Publishing and Wiley-Interscience,NY,1995中找到。

特异性杂交可以在“严格杂交条件”下进行测定，其中一个普遍适用的实例是在65℃在6x盐水-柠檬酸钠(SSC)缓冲液、5x Denhardt溶液、0.5％ SDS和100μg剪切的鲑鱼睾丸DNA中杂交，然后在65℃在2x SSC缓冲液和0.5％ SDS中，接着是1x SSC缓冲液和0.5％SDS，并且最后是0.2x SSC缓冲液和0.5％ SDS中顺序洗涤15-30分钟。

标签：如本文所用的术语“标签”是指不形成由本文方法产生的中间肽或接头序列的一部分的肽单元，尽管应当理解，产物肽本身可以含有氨基酸基序，其能够达到使用常规“标签”的目的；例如，在亲和纯化中。在这点上，标签相对于其所在的多肽的剩余部分以及其中串联的肽是异质的、非同源的序列基序。标签可以共价连接到多肽的N-末端、C-末端或内部位点(例如，氨基酸侧链)。标签可用于检测、鉴定、选择、富集或纯化与标签共价连接的多肽。在一些实例中，标签是作为最初在宿主细胞或系统中翻译的多肽的一部分翻译的前导肽。在一些实例中，本文中的重组多肽包含允许检测、选择或纯化多肽的标签(“亲和标签”)。本文使用的特定亲和标签包括例如但不限于多组氨酸(例如(His6))、硫氧还蛋白、麦芽糖结合蛋白、谷胱甘肽-S-转移酶(GST)、AviTag、钙调素标签、聚谷氨酸盐标签、FLAG-标签、HA-标签、Myc-标签、S-标签、SBP-标签、Softag 3、V5标签和Xpress标签。

如本文所用的“重组体”是指通过重组方法有意修饰的氨基酸序列或核苷酸序列。本文的术语“重组多核苷酸”意指通常在体外通过内切核酸酶操纵核酸形成，呈通常在自然界中找不到的形式的多核苷酸(例如，核酸分子)。因此，线性形式的分离多核苷酸或通过连接非正常连接的DNA分子在体外形成的表达载体都是重组多核苷酸的种类。据了解，在重组核酸分子被制造并引入宿主细胞后，它将非重组地复制；例如，使用宿主细胞的体内细胞机构而不是体外操作。然而，这样的核酸在重组产生后，尽管随后非重组地复制，出于本公开内容的目的仍然被认为是重组的。本文的术语“重组多肽”和“重组肽”具体地包括使用重组技术制备的多肽和肽；例如，通过在细胞或含有必要组分的无细胞系统中表达重组多核苷酸。

术语“载体”是指通常是双链的、可能插入了一段外源DNA的一段DNA。载体可以是例如质粒来源的。载体包含促进载体在宿主细胞中自主复制的“复制子”多核苷酸。载体通常用于将一种或更多种多核苷酸转运到合适的宿主细胞中。在宿主细胞中后，载体可以独立于宿主染色体DNA或与宿主染色体DNA一致地复制，并且可以产生载体及其插入的多核苷酸的若干个拷贝。此外，载体还可以含有必要的元件，这些元件允许插入的多核苷酸转录成mRNA分子，或者以其他方式导致插入的多核苷酸复制到RNA的多于一个拷贝中。一些表达载体还含有与插入的多核苷酸相邻的序列元件，其增加表达的mRNA的半衰期，和/或允许mRNA翻译成蛋白质分子。因此，由插入的多核苷酸编码的许多mRNA和多肽分子可以快速合成。

保守取代：如本文所用，术语“保守取代”是指一个氨基酸残基被同一类中的另一个氨基酸取代的取代。非保守氨基酸取代是残基不属于同一类别的取代，例如，碱性氨基酸取代中性或非极性氨基酸。为了进行保守取代而定义的氨基酸的类别是本领域已知的。出于本公开内容的目的，肽可以被定义为包含与参考氨基酸序列具有一定量序列同一性(例如，与参考氨基酸序列至少90％相同)的氨基酸序列。在这样的情况下，相应地意味着肽可以包含具有所述序列同一性的氨基酸序列，其中肽氨基酸序列和参考氨基酸序列之间的差异是保守取代。

在一些实施方案中，保守取代包括用第一脂肪族氨基酸取代第二、不同的脂肪族氨基酸。例如，如果第一氨基酸是Gly；Ala；Pro；Ile；Leu；Val和Met之一，则第一氨基酸可以被选自Gly；Ala；Pro；Ile；Leu；Val和Met的第二、不同氨基酸代替。在特定实例中，如果第一氨基酸是Gly；Ala；Pro；Ile；Leu和Val之一，则第一氨基酸可以被选自Gly；Ala；Pro；Ile；Leu和Val的第二、不同氨基酸代替。在涉及疏水脂肪族氨基酸取代的特定实例中，如果第一氨基酸是Ala；Pro；Ile；Leu和Val之一，则第一氨基酸可以被选自Ala；Pro；Ile；Leu和Val的第二、不同氨基酸代替。

在一些实施方案中，保守取代包括用第一芳香族氨基酸取代第二、不同的芳香族氨基酸。例如，如果第一氨基酸是His；Phe；Trp和Tyr之一，则第一氨基酸可以被选自His；Phe；Trp和Tyr的第二、不同氨基酸代替。在涉及取代不带电荷的芳香族氨基酸的特定实例中，如果第一氨基酸是Phe；Trp和Tyr之一，则第一氨基酸可被选自Phe；Trp和Tyr的第二、不同氨基酸代替。

在一些实施方案中，保守取代包括用第一疏水氨基酸取代第二、不同的疏水氨基酸。例如，如果第一氨基酸是Ala；Val；Ile；Leu；Met；Phe；Tyr和Trp之一，则第一氨基酸可以被选自Ala；Val；Ile；Leu；Met；Phe；Tyr和Trp的第二、不同氨基酸代替。在涉及取代非芳香族疏水性氨基酸的特定实例中，如果第一氨基酸是Ala；Val；Ile；Leu和Met之一，则第一氨基酸可以被选自Ala；Val；Ile；Leu和Met的第二、不同氨基酸代替。

在一些实施方案中，保守取代包括用第一极性氨基酸取代第二、不同极性氨基酸。例如，如果第一氨基酸是Ser；Thr；Asn；Gln；Cys；Gly；Pro；Arg；His；Lys；Asp和Glu之一，则第一氨基酸可以被选自Ser；Thr；Asn；Gln；Cys；Gly；Pro；Arg；His；Lys；Asp和Glu的第二、不同氨基酸代替。在涉及取代不带电荷的极性氨基酸的特定实例中，如果第一氨基酸是Ser；Thr；Asn；Gln；Cys；Gly和Pro之一，则第一氨基酸可以被选自Ser；Thr；Asn；Gln；Cys；Gly和Pro的第二、不同氨基酸代替。在涉及带电极性氨基酸取代的特定实例中，如果第一氨基酸是His；Arg；Lys；Asp和Glu之一，则第一氨基酸可以被选自His；Arg；Lys；Asp和Glu的第二、不同氨基酸代替。在涉及带电极性氨基酸取代的另外实例中，如果第一氨基酸是Arg；Lys；Asp和Glu之一，则第一氨基酸可以被选自Arg；Lys；Asp和Glu的第二、不同氨基酸代替。在涉及带正电荷(碱性)极性氨基酸取代的特定实例中，如果第一氨基酸是His；Arg和Lys之一，则第一氨基酸可以被选自His；Arg和Lys的第二、不同氨基酸代替。在涉及带正电荷的极性氨基酸取代的其他实例中，如果第一氨基酸是Arg或Lys，则第一氨基酸可以被Arg和Lys的另一氨基酸代替。在涉及带负电荷(酸性)极性氨基酸取代的特定实例中，如果第一氨基酸是Asp或Glu，则第一氨基酸可以被Asp和Glu的另一氨基酸代替。

在一些实施方案中，保守取代包括用第一电中性氨基酸取代第二、不同的电中性氨基酸。例如，如果第一氨基酸是Gly；Ser；Thr；Cys；Asn；Gln和Tyr之一，则第一氨基酸可被选自Gly；Ser；Thr；Cys；Asn；Gln和Tyr的第二、不同氨基酸代替。

在一些实施方案中，保守取代包括用第一非极性氨基酸取代第二、不同的非极性氨基酸。例如，如果第一氨基酸是Ala；Val；Leu；Ile；Phe；Trp；Pro和Met之一，则第一氨基酸可以被选自Ala；Val；Leu；Ile；Phe；Trp；Pro和Met的第二、不同氨基酸代替。

在许多实例中，保守取代中代替第一氨基酸的特定第二氨基酸可以选择为使第一和第二氨基酸都属于的前述类别的数量最大化。因此，如果第一氨基酸是Ser(极性、非芳香族和电中性氨基酸)，则第二氨基酸可以是另一极性氨基酸(例如，Thr；Asn；Gln；Cys；Gly；Pro；Arg；His；Lys；Asp或Glu)；另一非芳香族氨基酸(例如，Thr；Asn；Gln；Cys；Gly；Pro；Arg；His；Lys；Asp；Glu；Ala；Ile；Leu；Val或Met)；或者另一电中性氨基酸(例如，Gly；Thr；Cys；Asn；Gln或Tyr)。然而，在这种情况下，可以优选第二氨基酸是Thr；Asn；Gln；Cys和Gly之一，因为这些氨基酸共有所有根据极性、非芳香性和电中性的分类。本领域已知可任选用于选择保守取代中使用的特定第二氨基酸的另外标准。例如，当Thr；Asn；Gln；Cys和Gly可用于保守取代Ser时，Cys可从选择中排除，以避免形成不期望的交联和/或二硫键。同样，Gly可以从选择中排除，因为它缺少烷基侧链。在这种情况下，例如，为了保留侧链羟基基团的官能团，可以选择Thr。然而，在保守取代中使用的特定第二氨基酸的选择最终在技术人员的判断范围内。

反应混合物：如本文所用，术语“反应混合物”是指包含盐、辅因子和/或足以进行修饰底物的酶促和/或化学活性的其他组分的体外水性体积。该术语具体包括将发生特定反应或一组反应的生物反应器、细胞裂解物或无细胞系统的内容物；例如，重组多肽(例如，可溶性多肽)的蛋白水解裂解和/或随后从中间肽中酶促和/或化学去除无关氨基酸以产生产物肽。含有反应混合物的生物反应器和其它容器的内容物可以在本领域已知的反应或多步反应期间交换；例如，以替换耗尽的试剂或减缓或停止特定反应，或启动不同的反应。

MALDI-TOF：术语“MALDI”是指基质辅助的激光解吸/电离(Matrix-AssistedLaser Desorption/Ionization)，在该过程中分析物被嵌入光吸收分子(例如，烟酸、芥子酸或3-羟基吡啶甲酸)的固体或晶体“基质”中，然后通过激光照射解吸并从固相电离为气相或蒸汽相，并作为完整的分子离子向检测器加速。“基质”通常是在溶液中以10,000:1基质/分析物摩尔比与分析物混合的小有机酸。使用前可将基质溶液调节至中性pH。

术语“MALDI-TOF MS”是指基质辅助的激光解吸/电离飞行时间质谱。

液相色谱法。术语“液相色谱法”或“LC”是指当流体均匀地渗透通过精细分离物质的柱或通过毛细管通道时，选择性分离流体溶液的一种或更多种组分的过程。当该流体相对于固定相移动时，混合物的组分在一个或更多个固定相和主体流体(例如，流动相)之间的分布导致选择性分离。“液相色谱法”的实例包括高效液相色谱法(HPLC)。

高效液相色谱法：术语“高效液相色谱法”(“HPLC”)是指通过在压力下迫使流动相通过固定相(通常是密集填充的柱)来提高分离度的液相色谱法。本领域技术人员将理解，在这样的柱中的分离是一个分配过程，并且可以选择适用于使用的LC(包括HPLC)、仪器和柱。

实时PCR。术语“实时PCR”(“RT PCR”)用于表示定量PCR技术的子集，该技术允许在整个PCR反应期间或实时检测PCR产物。实时PCR的原理通常在例如Held等人."Real TimeQuantitative PCR"Genome Research 6:986-994(1996)中描述。通常，实时PCR在每个扩增循环测量信号。一些实时PCR技术依赖于在每个扩增循环完成时发出信号的荧光团。这样的荧光团的实例是在与双链DNA结合时发射限定波长的荧光的荧光染料，诸如SYBR绿。因此，由于PCR产物的积累，每个扩增循环期间双链DNA的增加导致荧光强度的增加。

(ii)本申请的序列和剂

随附序列表中列出的核酸序列使用核苷酸碱基的标准字母缩写显示。仅显示了每个核酸序列的一条链，但是互补链被理解为包含在所展示链的任何提及中。在随附的序列表中：

SEQ ID NO:1-29显示了在两个或四个碱性残基后裂解多肽的蛋白酶的代表性识别序列，在特定实施方案中用于释放中间肽。

SEQ ID NO:30-45显示了在多肽裂解后在P1’位置处不留下氨基酸的蛋白酶的代表性识别序列，在特定实施方案中用于释放中间肽。

SEQ ID NO:46-56显示了代表性的化学裂解序列，在特定实施方案中用于从中间肽释放具有靶氨基酸序列的产物肽。

SEQ ID NO:57-83显示了代表性接头序列，在特定实施方案中用于例如提高反应效率。

SEQ ID NO:84-121显示了使用本文的组合物和方法可产生的代表性产物肽的靶氨基酸序列。SEQ ID NO:84-109显示了包含Cys和/或Met残基的代表性产物肽的靶氨基酸序列，使得该肽不适于本领域中依赖于在接头肽的氨基末端引入异源半胱氨酸和在羧基末端引入甲硫氨酸的某些方法。

SEQ ID NO:122-124、195显示了包含在本文某些重组多肽中的肽标签的代表性序列。

SEQ ID NO:125-173、189-194、196-199、201-202示出了包含某些产物肽的靶氨基酸序列的重组多肽的实例，以及包含在被去除以释放产物肽的多肽中的氨基酸序列的实例。

SEQ ID NO:174显示了图4的质粒图的序列。

SEQ ID NO:175-188、200显示了逆转录病毒蛋白酶的代表性识别序列，在特定实施方案中用于释放中间肽或从中间肽释放具有靶氨基酸序列的产物肽。

(iii)用途

裂解融合蛋白以获得感兴趣的多肽或肽原则上可以通过化学或生物化学方法实现，诸如使用蛋白水解酶(蛋白酶)的酶促裂解。这些方法采用通过水解肽键起作用的剂，并且裂解剂的特异性由被裂解的肽键处或附近的氨基酸残基的身份决定。非特异性裂解可能对感兴趣的多肽或肽的使用产生不利影响，例如，通过影响多肽或肽的活性，或通过用代表脱靶裂解事件的片段污染产物。因此，由于裂解位点可能出现在感兴趣的多肽或肽本身中的事实，融合多肽的酶促裂解受到限制。融合蛋白的低效或不完全裂解也可能发生，降低产量并向产物引入异质性，使得仅纯化一小部分期望的蛋白质。因此，虽然使用一个蛋白酶家族的多肽或肽生产平台可能适用于一种或几种产物，但如果不进行修改，它就不能适用于其他多肽或肽的生产。

本文的组合物和方法解决了与肽生产相关的另一个问题；常规方法会将无关氨基酸附接到裂解的期望的肽。当连接期望的肽产物的接头序列被裂解时，这些氨基酸通常存在。这些氨基酸经常影响所得肽的特性和/或给使用带来监管难题(regulatorydifficulties)，特别是当肽预期用于人类受试者时。本文的组合物和方法可用于获得与在含有多于一种肽的融合多肽中重组表达肽相关的益处(例如，产量增加)，而不会在期望的肽产物中产生无关氨基酸。为了实现这些结果，本文的实施方案提供了具有酶可裂解接头序列的肽串联体，所述接头序列包含以特定方式布置的元件。

在一些实施方案中，串联体包含在两个或四个碱性残基(B_m)后裂解的蛋白酶的识别位点、接头序列(L_nk)、期望的肽产物(DP)、下一个两个或四个碱性残基蛋白酶识别位点(B_m)和另外的期望的肽产物(DP)，并且还可以包含不形成期望的肽或蛋白质或接头序列的一部分的至少一个肽单元；例如，促进纯化、增溶或二者的TAG。这样的实施方案中的串联体以下列布置包括这些元件：

[TAG]–L_nk-(B_m-L_nk-B_m-DP)_n

或者

Met–(DP-B_m-L_nk-B_m)_n–[TAG]，

其中重复序列的数目“n”在技术人员的判断范围内，并且取决于特定期望的肽产物的长度和融合蛋白表达系统。

在用在两个或四个碱性残基后裂解的蛋白酶(例如，弗林蛋白酶、蛋白质转化酶、神经内分泌转化酶1或Kexin)对串联体多肽进行蛋白水解裂解后，产生DP-B_m和DP(以及另外的Met-DP，如果使用TAG，则取决于TAG的位置)，以及不含DP的TAG-B_m和L_nk-B_m产物。用羧肽酶(例如，羧肽酶N、羧肽酶B、羧肽酶U或金属羧肽酶D)处理所得产物，从而转化DP-B_m到DP，不含无关氨基酸。在使用特定表达宿主(例如，大肠杆菌)的实例中，从重组多肽去除初始甲硫氨酸残基，这在使用串联体C-末端TAG的应用中可以是有用的。

在前述和另外的实施方案中，串联体包含识别特定的靶氨基酸序列并且在裂解后在P1’位置处不留下氨基酸的蛋白酶的识别位点、期望的肽产物(DP)、以及接头序列和化学裂解序列(C.C.S.-L_nk)，并且还可以包含不形成期望的肽或蛋白质或接头序列(例如，TAG)的一部分的至少一个肽单元。这样的实施方案中的串联体以下列布置包括这些元件：

[TAG]–L_nk-P.C.S.-DP–[(C.C.S.-L_nk)-P.C.S.-DP]_n

或者

Met-DP–[(C.C.S.-L_nk)-P.C.S.-DP]_n–C.C.S.–[TAG]，

在用裂解后在P1’位置处不留下氨基酸的蛋白酶(例如，肠激酶、凝血因子X(因子Xa)、胱天蛋白酶或颗粒酶B)对串联体多肽进行蛋白水解裂解后，产生Met-DP-(C.C.S.-L_nk-P.C.S.)和DP-(C.C.S.-L_nk-P.C.S.)。在使用特定表达宿主(例如，大肠杆菌)的实例中，从Met-DP-C.C.S.-P.C.S.肽去除初始甲硫氨酸，仅产生DP-(C.C.S.-L_nk-P.C.S.)。然后用适当的位点特异性蛋白水解化学剂(例如，2-硝基-5-硫氰酸(NTCB)、Ni²⁺或Pd²⁺)处理产物，从而转化DP-(C.C.S.-L_nk-P.C.S.)为期望的肽产物，不含不是靶氨基酸序列一部分的无关氨基酸。

与前述一致，本公开内容的实施方案提供了包含串联的中间肽和包含特定蛋白酶裂解位点的中间接头序列的重组多肽，以及编码其的多核苷酸。在特定的实施方案中，重组多肽可溶于水性环境；例如，使得它们不在重组生产细胞中形成包涵体。蛋白酶催化多肽序列特异性裂解成中间肽，中间肽随后被酶促或化学加工成由期望的靶序列组成的产物肽；例如，不含任何无关氨基酸的靶氨基酸序列。在特定实例中，前述多肽包含1-150个串联的肽单元(例如但不限于2-150个、3-150个、2-10个、2-20个、3-20个、2-10个或3-10个)，其选择根据技术人员的判断，并且可以取决于诸如肽的长度和所采用的特定宿主或表达系统的因素。特定的多肽可以包含含有相同产物肽的中间肽，或者它们可以包含具有不同产物肽的若干种中间肽，如下文描述布置在多肽中。

在第一方面，催化重组多肽序列特异性裂解成中间肽的蛋白酶在两个或四个碱性氨基酸残基(K或L)后裂解，并且中间肽包含产物肽和蛋白水解反应后剩余的两个或四个碱性氨基酸。可以在本文的实施方案中使用的具有两个或四个碱性氨基酸残基识别位点的蛋白酶的实例包括例如，具有[R/K]X_n[R/K]↓的一般识别位点的蛋白质转化酶，其中n是0或2或4或6(例如，SEQ ID NO:1和SEQ ID NO:27-29)(优选的序列是RX[R/K]R↓(SEQ ID NO:14)，其中X优选为碱性残基)，弗林蛋白酶(识别位点RX[R/K]R↓(SEQ ID No:14))，神经内分泌转化酶1(识别位点(R/K)R↓(SEQ ID NO:2))和Kexin(识别位点(R/K)R↓(SEQ ID NO:2))。因此，在特定实例中，重组多肽可包含蛋白酶识别位点，其包含选自由以下组成的组的氨基酸序列：RR(SEQ ID NO:3)(Kexin；神经内分泌转化酶1)、KR(SEQ ID NO:4)(Kexin；神经内分泌转化酶1)、[R/K][R/K][R/K]R(SEQ ID NO:17)(Kexin；神经内分泌转化酶1；蛋白质转化酶)、R[R/K][R/K]R(SEQ ID NO:18)(Kexin；神经内分泌转化酶1；弗林蛋白酶；蛋白质转化酶)、RRRR(SEQ ID NO:19)(Kexin；神经内分泌转化酶1；弗林蛋白酶；蛋白质转化酶)、RKRR(SEQ ID NO:20)(Kexin；神经内分泌转化酶1；弗林蛋白酶；蛋白质转化酶)、RRKR(SEQID NO:21)(Kexin；神经内分泌转化酶1；弗林蛋白酶；蛋白质转化酶)、RKKR(SEQ ID NO:22)(Kexin；神经内分泌转化酶1；弗林蛋白酶；蛋白质转化酶)、KRRR(SEQ ID NO:23)(Kexin；神经内分泌转化酶1；蛋白质转化酶)、KKRR(SEQ ID NO:24)(Kexin；神经内分泌转化酶1；蛋白质转化酶)、KRKR(SEQ ID NO:25)(Kexin；神经内分泌转化酶1；蛋白质转化酶)和KKKR(SEQID NO:26)(Kexin；神经内分泌转化酶1；蛋白质转化酶)。

在第二方面，催化重组多肽序列特异性裂解成中间肽的蛋白酶在裂解后在P1’位置处不留下氨基酸，并且中间肽包含产物肽和接头序列以及序列特异性化学裂解位点。可用于本文实施方案中的裂解多肽而不在P1’位置处留下氨基酸的蛋白酶的实例包括例如表1中列出的蛋白酶。

表1.裂解后在P1’位置处不留下氨基酸的蛋白酶。

*紧接裂解位点的氨基酸(例如，P4-P3-P2-P1↓、P5-P4-P3-P2-P1↓等)

因此，在特定实例中，重组多肽可以包含SEQ ID NO:30的蛋白酶识别位点。例如，重组多肽可以包含含有选自由以下组成的组的氨基酸序列的蛋白酶识别位点：SEQ ID NO:31-45(例如，SEQ ID NO:31、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:37、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:41、SEQ ID NO:44和SEQ ID NO:45中的任一个)。例如，用于通过肠激酶蛋白水解的重组多肽可以包含SEQ ID NO:31。作为另外的实例，用于通过胱天蛋白酶蛋白水解的重组多肽可以包含SEQ ID NO:32。在具体实例中，用于通过胱天蛋白酶-2、胱天蛋白酶-3、胱天蛋白酶-7或CED-3蛋白水解的重组多肽可以包含SEQ ID NO:33，例如，包含SEQ ID NO:34的多肽；用于通过胱天蛋白酶-1、胱天蛋白酶-4或胱天蛋白酶-5蛋白水解的重组多肽可以包含SEQ ID NO:35，例如包含SEQ ID NO:36、SEQ ID NO:37或SEQ ID NO:38的多肽；并且用于通过胱天蛋白酶-6、胱天蛋白酶-8、胱天蛋白酶-9或颗粒酶B蛋白水解的重组多肽可以包含SEQ ID NO:39，例如包含SEQ ID NO:40、SEQ ID NO:41或SEQ ID NO:42的多肽。在甚至另外的实例中，用于通过因子Xa进行蛋白水解的重组多肽可以包含SEQID NO:43(例如，SEQ ID NO:44或SEQ ID NO:45)。

由前述第一和第二方面展示的原理可以在本发明的一些实施方案中使用。在特定实例中，在两个或四个碱性残基后裂解的蛋白酶或裂解后在P1’位置处不留下氨基酸的蛋白酶可以与氨肽酶一起使用。本文参考作为氨肽酶实例的氨肽酶P来描述该实例。一种用于通过在两个或四个碱性残基后裂解的蛋白酶和氨肽酶P的蛋白水解产生期望的肽产物的重组多肽可以包含以下布置中的元件：

[TAG]–L_nk-(B_m-L_nk-B_m-DP)_n。

前述每个方面可以在单个重组多肽中组合，使得两种类型的中间肽都可以通过各自的蛋白酶活性产生。在本文的实施方案中，重组多肽包含选自由SEQ ID NO:1-45组成的组的多于一个蛋白酶裂解位点。

根据第一方面，重组多肽包含按顺序DP-[B_m-L_nk-B_m-DP]_n的元件，其中B_m代表两个或四个碱性氨基酸识别位点，L_nk代表长度为0-50个氨基酸的接头序列，并且DP代表产物肽靶序列。除了前述之外，重组多肽还可以包含至少一个肽单元；例如，促进纯化或增溶的标签，或靶向肽。重组多肽还可以包含第一产物肽前的N-末端甲硫氨酸残基。多肽在两个或四个碱性氨基酸识别位点后的蛋白水解产生中间肽DP-B_m。根据第一方面的识别位点包括SEQID NO:1；例如，识别位点可以包含选自由SEQ ID NO:2-29组成的组的氨基酸序列。在特定实例中使用的识别位点包括SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:15、SEQ ID NO:16和SEQ ID NO:19-26。这些中间肽(DP-B_m)可以经受羧肽酶活性以去除两个或四个碱性氨基酸识别位点残基，从而产生由其靶序列组成而不含无关氨基酸的产物肽。可在特定实施方案中用于去除两个或四个碱性氨基酸识别位点残基的羧肽酶的实例包括羧肽酶N、羧肽酶B、羧肽酶U和金属羧肽酶D。

根据第二方面，多肽包含按顺序DP-[(C.C.S.-L_nk)-P.C.S.-DP]_n的元件，其中C.C.S.-L_nk代表包含化学裂解序列的长度为0-50个氨基酸的接头序列，P.C.S代表在裂解产物中不留下P1’氨基酸残基的蛋白酶的识别位点，并且DP代表产物肽。除了前述之外，根据该第二方面的重组多肽还可以包含至少一个肽单元，并且同样还可以包含第一期望的肽产物之前的N-末端甲硫氨酸残基。在裂解产物中不留下P1’氨基酸残基的多肽蛋白酶的蛋白水解产生中间肽DP-(CSS-L_nk-P.C.S.)。然后可以将中间肽经受适当的化学裂解剂(例如，NTCB、Ni²⁺或Pd²⁺)以去除C-末端接头序列，从而产生不含无关氨基酸的期望的产物肽。

已知Ni²⁺在SXH的N-末端侧裂解，然而据报道在Ser残基之前的P₁位置处的Gly对于高裂解效率是至关重要的，如Dang等人.(2019)Nat Methods 16(4):320中描述的。在具体实例中，较大的氨基酸，例如在特立帕肽中在P₁处的Phe，也能实现高裂解效率。

根据第二方面的中间肽可以包含选自由以下组成的组的化学裂解序列：SEQ IDNO:46(NTCB裂解位点)；SEQ ID NO:49，其中P1’在中性至酸性pH是Pro，但在pH＝2可以是Gly(Pd²⁺裂解位点)；和SEQ ID NO:53，其中P2’和P4’优选为大体积/疏水的，并且P2’不是Pro(Ni²⁺识别位点)。例如，NTCB裂解位点可以包含选自由SEQ ID NO:47和SEQ ID NO:48组成的组的氨基酸序列，Pd²⁺裂解位点可以包含选自由SEQ ID NO:50-52组成的组的氨基酸序列，并且Ni²⁺裂解位点可以包含选自由SEQ ID NO:54-56组成的组的氨基酸序列。在特定实例中使用的化学裂解位点包括SEQ ID NO:47、SEQ ID NO:48、SEQ ID NO:50、SEQ ID NO:51、SEQ ID NO:54和SEQ ID NO:56。

因此，包含含有产物肽的串联单元的重组多肽由氨基酸序列限定，该氨基酸序列在特定实施方案中取决于串联单元中的第一蛋白酶(例如，具有两个或四个碱性氨基酸识别位点的蛋白酶，或在裂解产物中不留下P1’氨基酸的蛋白酶)和羧肽酶或化学裂解剂的选择。

在特定实例中，包含根据第一方面的单元的重组多肽包含氨基酸序列[产物肽_n]-[(SEQ ID NO:1)-L_nk-(SEQ ID NO:1)]-[产物肽_n+1]，其中n对应于该单元在多肽中的位置(例如，如果多肽中的第三和第四产物肽被(SEQ ID NO:1)-L_nk-(SEQ ID NO:1)分开，n＝3，并且n+1＝4)。在包含根据第一方面的单元的重组多肽的具体实例中，使用Kexin、神经内分泌转化酶1、弗林蛋白酶或蛋白质转化酶作为具有2个或4个碱性氨基酸识别位点的蛋白酶，重组多肽可以例如包括：[产物肽]-[(SEQ ID NO:18)-L_nk-(SEQ ID NO:18)]-[产物肽]。

在特定实例中，包含根据第二方面的单元的重组多肽可以包括例如[产物肽_n]-C.C.S.-L_nk-P.C.S.-[产物肽_n+1]，其中C.C.S.包括SEQ ID NO:46、SEQ ID NO:49或SEQ IDNO:53，并且P.C.S.是SEQ ID NO:30。在包含根据第二方面的单元的重组多肽的具体实例中，使用胱天蛋白酶-3或胱天蛋白酶-7作为在裂解产物中不留下P1’氨基酸残基的蛋白酶，重组多肽可以例如包括以下氨基酸序列中的至少一种：[产物肽_n]-[((SEQ ID NO:46)↓L_nk)-(SEQ ID NO:33)-产物肽_n+1](用于用NTCB的化学裂解)；[产物肽_n]-[(↓(SEQ ID NO:49)-L_nk)-(SEQ ID NO:33)-产物肽_n+1](用于用Pd²⁺的化学裂解)；和[产物肽_n]-[(↓(SEQ IDNO:53)-L_nk)-(SEQ ID NO:33)-产物肽_n+1](用于用Ni²⁺的化学裂解)。使用胱天蛋白酶-3或胱天蛋白酶-7作为在裂解产物中不留下P1’氨基酸残基的蛋白酶的前述实例中的P.C.S.可以是SEQ ID NO:34。在前述实例中，在裂解产物中不留下P1’氨基酸的不同蛋白酶的裂解位点的取代使多肽适应使用不同蛋白酶的应用。本文中的重组多肽可以包含前述元件的不同组合；例如，包含同一类蛋白酶的裂解位点(例如，同一蛋白酶的不同裂解位点)，或包含不同蛋白酶的裂解位点(例如，分别释放不同的产物肽)。此外，在特定实施方案中，包含在多肽的串联单元中的产物肽可以是相同的肽，但是在其他实施方案中，串联单元可以包含不同的产物肽。

本文实施方案中使用的接头序列可以包含0和50之间的任意数量的氨基酸。因此，在某些实例中，接头序列包含0、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、41、42、43、44、45、46、47、48、49或50个氨基酸。在具体实例中，接头序列的长度可以是1个或2个氨基酸。在特定实施方案中，接头序列包含小氨基酸(例如，Ala、Ser、Gly和聚甘氨酸)，例如，以增加识别位点对蛋白酶的暴露，和/或降低半胱氨酸之间二硫化物形成的可能性。例如，在Cys用于NTCB裂解的情况下，接头序列中Gly的存在和用于NTCB裂解的Cys除了改善暴露于蛋白水解裂解位点之外，还减少了二硫键的形成，从而使重组多肽更易于NTCB裂解。因此，我们可以说任何氨基酸，但更优选甘氨酸，并且优选丝氨酸或Ala。然而，在一些实施方案中不需要Ala、Ser和Gly的存在。对于许多应用，Ala、Ser和Gly是大多数蛋白酶偏好的，因为暴露增加，但这不是强制性的。因此，在特定实施方案中，接头序列可以包含任何氨基酸，并且优选包含Gly、Ser和/或Ala，更优选包含Gly。在本文的实施方案中有用的接头序列的实例包括SEQ ID NO:57-83和SEQ ID NO:123。本文的具体实例包括选自由Gly、SEQ ID NO:61、SEQ ID NO:62、SEQ ID NO:82、SEQ ID NO:83、SEQ ID NO:74和SEQ ID NO:123组成的组的接头序列。

在一些实施方案中，串联单元的接头序列是相同的。然而，在另外的实例中，接头序列是不同的。应当理解，除了特定应用的特定要求之外，接头序列中氨基酸的具体身份不是关于本文实施方案的一般描述的必要方面，如已知的和在技术人员的判断范围内。

在本文的某些实施方案中有用的包含在接头序列中的氨基酸序列的说明性和非限制性实例包括：G_nS_m，其中n＝1-4和m＝1-4(例如，[GGGGS(SEQ ID NO:67)]_n)；KESGSVSSEQLAQFRSLD(SEQ ID NO:77)；EGKSSGSGSESKST(SEQ ID NO:78)；GSAGSAAGSGE(F/G)(SEQ ID NO:79)，例如，GSAGSAAGSGEF(SEQ ID NO:80)或GSAGSAAGSGEG(SEQ ID NO:81)；A(EAAAK)_nA(例如，包含EAAAKA(SEQ ID NO:75)和AEAAAK(SEQ ID NO:76)的接头序列)；和(X/P)_n(S/G)，例如P(S/G)(SEQ ID NO:68)、PS(SEQ ID NO:57)、PG(SEQ ID NO:58)、PP(S/G)(SEQ ID NO:72)、PX(S/G)(SEQ ID NO:70)、(S/G)(SEQ ID NO:71)、Gly、Ser、PP(S/G)(SEQ ID NO:72)、(A/K/E)(S/G)(SEQ ID NO:73)、AS(SEQ ID NO:59)、AG(SEQ ID NO:60)、KS(SEQ ID NO:63)、KG(SEQ ID NO:64)、ES(SEQ ID NO:65)或EG(SEQ ID NO:66)。

具有一个或更多个带电残基的接头序列可有助于裂解序列的可及性，从而消除对变性剂的需要，从而去除对产物肽程序中使用的蛋白水解酶的任何变性作用。可选地，用于肽生产的接头和裂解序列可以共同具有至少一个带电残基和一个极性残基，以便在不使用变性剂的情况下维持裂解位点的可及性。在一些实施方案中，接头可以在裂解序列之间具有小氨基酸，诸如甘氨酸，其中裂解序列具有至少一个带电残基和一个极性残基。

根据本文实施方案的重组多肽的串联单元中包含的产物肽可以是任何感兴趣的肽。在特定实施方案中，产物肽包含生物活性，并对生物体或微生物具有直接或间接作用。例如，特定产物肽可以具有肽激素活性和/或受体结合活性、蛋白质或受体修饰活性，或者可以防止受体或蛋白质被另一个分子激活、抑制或修饰。在一些实例中，产物肽对代谢综合征具有直接或间接的作用(例如，调节胆固醇水平、血压水平、胰岛素水平、情绪、饱腹感和/或代谢疾病和/或与个人护理或治疗应用相关的生物活性)。

产物肽可以具有任何大小，但通常包含少于1500个氨基酸；例如，少于1000个氨基酸、少于800个氨基酸、少于700个氨基酸、少于600个氨基酸、少于500个氨基酸、少于400个氨基酸、少于300个氨基酸、少于250个氨基酸、少于200个氨基酸、少于150个氨基酸、甚至少于140个氨基酸、少于130个氨基酸、少于120个氨基酸、少于110个氨基酸、少于100个氨基酸、少于90个氨基酸、少于80个氨基酸、少于70个氨基酸、少于60个氨基酸、或少于或等于50个氨基酸。在具体实例中，产物肽具有少于50个氨基酸；例如49、48、47、46、45、44、43、42、41、40、39、38、37、36、35、34、33、32、31、30、29、28、27、26、25、24、23、22、21、20、19、18、17、16、15、14、13、12、11或10个或更少的氨基酸。在特定实施方案中，产物肽包含至少一个甲硫氨酸残基、至少一个半胱氨酸残基或甲硫氨酸和半胱氨酸残基两者中的至少一个；这样的肽不能通过使用在接头肽中引入N-末端半胱氨酸和C-末端甲硫氨酸从串联重复序列产生肽的某些方法有效地产生。

可使用本文的组合物和方法产生的代表性肽包括胰高血糖素、艾塞那肽、舍莫瑞林、奈西立肽(利尿钠肽B)、替度鲁肽、[Cys(Acm)20,31]表皮生长因子(20-31)、ACE2α1螺旋序列、T1肽、GTP结合蛋白片段,Gα、L-选择素肽、肽标准品1、ACTH(1-39)(Acthar)、ACTH(1-24)、西那普肽(Sinapultide)(KL4)、替度鲁肽、胸腺法新(Thymalfasin)、载脂蛋白B合成肽、甘丙肽、Tau肽(45-73)(外显子2/插入1结构域)、来匹卢定(lepirudin)、普兰利肽、降钙素、半胱氨酸蛋白酶抑制剂、生长抑素、Megainin 1、Megainin 2、促肾上腺皮质激素、特立帕肽、替莫瑞林、抑肽酶、比伐卢定、恩夫韦肽、促胰液素、短杆菌素D、格拉默、加压素和催产素。

如先前指示的，本文中的重组多肽还可以包含至少一个不形成中间肽产物一部分的肽单元；例如，在多肽的N-末端或C-末端，或在接头序列中(例如，在接头序列中的His₆标签，为生产和/或纯化过程提供灵活性)。在本文中称为“标签”的这样的肽单元可以赋予或增加重组多肽上的任何一种或更多种期望的功能；例如，检测、纯化、增溶、防止降解、适当折叠(伴侣活性)、翻译后修饰、N-末端或C-末端加帽(加帽单元优选比蛋白质的其余部分更亲水，并且因此屏蔽疏水部分以增加溶解性)((Kohl等人.(2003)Proc.Natl.Acad.SciU.S.A.100:1700-5))、受体活性、信号传导活性、分泌和靶向。在特定实例中，重组多肽包含促进多肽纯化(例如亲和纯化)和/或增溶的标签。在其中重组多肽将从宿主细胞分泌的应用中，可以向多肽中添加适当的信号肽，以便将合成的多肽导向宿主细胞的分泌途径。这样的信号肽是本领域已知的，并且通常可以使用异源信号肽和宿主细胞天然的信号肽。前述肽标签的非限制性实例是熟知的，并且是在本领域中通常使用的；例如硫氧还蛋白(TrxA)、His₆、myc、T7、HSV、V5、HA、FLAG、Strep-标签、GFP、几丁质结合蛋白、GST、MBT、NusA、IF2、纤维素结合模块、芽孢杆菌RNA酶、IgG结合结构域ZZ、GB1和SUMO。用于本文方法的重组多肽可以在任何重组表达系统中产生；例如，在细胞培养物中，或在无细胞系统中，诸如细胞裂解物或偶联转录/翻译系统中，并且然后从其纯化，例如但不限于，通过用结合包含在多肽内的标签的固定化剂(例如，小分子和抗体)亲和纯化。

在一些实施方案中，用包含编码重组多肽(例如，可溶于细胞胞质溶胶的多肽)的多核苷酸的表达或克隆载体转染或转化宿主细胞，并在常规营养培养基中培养宿主细胞。培养条件，诸如溶质组成、温度和pH，可以从许多已知支持特定宿主细胞生长的条件的任一种中选择。一般来说，最大化细胞培养生产率的原理、方案和实用技术是熟知的，并且对本领域技术人员来说是广泛可用的。

逆转录病毒蛋白酶通过在有限数量的位点水解病毒多聚蛋白在病毒复制中发挥重要作用。病毒蛋白酶的一般特征是缺乏不同的底物识别序列，尽管易切断键(scissilebond)侧翼的氨基酸必须具有一般特征才能被这些蛋白酶识别。在这种情况下，观察到逆转录病毒蛋白酶与其他病毒蛋白的交叉活性(如例如(2010)Viruses 2010 2(1):147中所描述)。为这些蛋白酶定义了两种类型的裂解位点；类型1在P1和P1’位置处具有芳香族残基和脯氨酸，并且类型2在P1位置处具有疏水残基。此外，可以鉴定占据P2和P2’位置的氨基酸的一般特性。该特征为底物结合口袋提供了一定的灵活性，底物结合口袋可用于水解多聚蛋白，而不随机裂解底物。例如，当HIV1蛋白酶表现为1型蛋白酶时，分别在p2和p1位置偏好Asn和Tyr或Phe。因此，在C-末端具有Asn-Phe的肽如特立帕肽的重复单元可以用在P1’、P2’和P3’位置处含有Pro-Val-Gln(SEQ ID NO:182)后跟许多氨基酸的接头肽来定制，以为在P1’位置处不留下氨基酸的另一种蛋白酶如胱天蛋白酶提供灵活性和识别。有趣的是，完全相同的HIV蛋白酶识别p2-P1位置处的Val-Leu、Ile-Met、Ile-Leu。这种底物识别的多样性可以在其他逆转录病毒蛋白酶中看到。因此，在HIV和其他逆转录病毒蛋白酶中观察到的对p2和p1位置处的两个连续疏水残基(SEQ ID NO:200)，特别是Val-Leu、Ile-Leu和Leu-Leu的偏好，可以用于生产肽如分泌素的串联重复序列。在例如/>(2010)Viruses2010 2(1):147的图2中列举了1型和2型裂解位点。

在一些实施方案中，多肽可以用具有蛋白水解识别序列的串联重复序列(经历有限水解)进行工程化，以产生肽标准品。例如，胱天蛋白酶在30℃大约两个小时失去活性。本领域技术人员将会理解，通过将酶应用于多肽，可以产生具有各种大小和精确分子量的肽。产生的肽标准品可用于SDS-PAGE凝胶、校准尺寸排阻和反相柱以及质谱应用。

提供以下实施例来说明某些特定特征和/或实施方案。这些实施例不应被解释为将公开内容限制于所示例的特定特征或实施方案。

多肽被工程化用于生产表2中列出的重组肽。多肽被工程化成包含元件“B_m”、“L_nk”和“DP”，其中B_m是在两个或四个碱性残基后裂解的蛋白酶的识别位点，L_nk是接头序列，并且DP是重组肽。多肽被工程化成包含一串具有序列B_m-L_nk-B_m-DP的单元的串联体，其中串联体串前面有序列B_m-DP或DP-B_m的单元，其中串联体串前面有Met残基。将多肽修饰为含有纯化标签(TAG)，使得多肽具有氨基酸序列[TAG]–L_nk-(B_m-L_nk-B_m-DP)_n或Met–(DP-B_m)_n–[TAG]。

表2.重组肽。

/>

(iv)实施例

实施例1：使用胱天蛋白酶-7和NTCB生产胰高血糖素

将重组多肽工程化为使用胱天蛋白酶-7和NTCB产生由靶氨基酸序列HSQGTFTSDYSKYLDSRRAQDFVQWLMNT(SEQ ID NO:84)组成而不含无关氨基酸的胰高血糖素。多肽被工程化成包含间隔的四个重复序列，其中三个肽重复序列分别具有半胱氨酸的化学裂解位点，随后是甘氨酸和DEVD序列作为胱天蛋白酶识别序列(图4)。在接头序列中使用小氨基酸，特别是甘氨酸，结合使用识别大量带电氨基酸(例如DEVD序列中四个氨基酸中的三个带电的(Asp和Glu)肽)的蛋白酶(例如胱天蛋白酶-3或-7)，可以促进裂解位点暴露于裂解试剂。由于胰高血糖素肽中不存在半胱氨酸，选择这种氨基酸来促进NTCB蛋白水解。选择胱天蛋白酶-7识别位点(SEQ ID NO:33)来指导酶促蛋白水解，而不在裂解产物中留下P1’氨基酸。选择包含NTCB裂解序列(SEQ ID NO:46)的氨基酸序列来指导从中间肽产物去除接头序列和胱天蛋白酶-7识别位点。在NTCB裂解序列和胱天蛋白酶-7识别位点之间放置Gly接头，以增加胱天蛋白酶-7识别序列的暴露，增加胱天蛋白酶裂解的效率，并降低重复序列的半胱氨酸之间二硫化物形成的可能性。在重组多肽中，蛋白酶识别位点用v形(<>)包围，化学裂解序列用大括号({})包围，并且接头用中括号([])包围：

然后将硫氧还蛋白标签添加到多肽以产生：

在30℃，加硫氧还蛋白标签的多肽在1L LB培养基中的BL21-DE3大肠杆菌细胞中从DNA构建体重组表达7小时。将细胞糊状物重悬于50mM Tris-HCl、100mM NaCl、5mM咪唑、0.5％ Triton X-100、pH 8.0中，然后轻柔超声处理。以20,000×g离心15分钟后，将上清液与Ni-NTA树脂在4℃孵育1小时。用50mM Tris-HCl、500mM NaCl、10mM咪唑、pH 8.0洗涤树脂。然后，用50mM Tris-HCl,pH 8.0中300mM咪唑、10mMβ-巯基乙醇、10％甘油洗脱多肽。如通过SDS-PAGE确定的，每1L培养物获得大约100mg蛋白质的产量(图5A、图5B)。

在30℃用1mg重组加组氨酸标签的胱天蛋白酶-7处理纯化的多肽4小时，在SEQ IDNO:34识别位点裂解多肽。使用配备有Biorad Hipore C18柱的Agilent 1260infinityHPLC系统从硫氧还蛋白标签和蛋白酶分离期望的肽。因此，在0.1％三氟乙酸或甲酸中以1ml/min的流量从5％到90％建立20分钟的乙腈梯度。在这些步骤结束时，成熟胰高血糖素和在其C-末端具有氨基酸序列CGDEVD(SEQ ID NO:128)的胰高血糖素的混合物在20.4分钟的时间点获得。将肽布点在MALDI平板上，然后添加等体积的饱和CHCA基质。然后在Irvine大学质谱设施中使用AB Sciex 5800MALDI-TOF质谱仪，使用TOF/TOF系列探索者软件V4build 8确定肽的质量(图5C)。质谱分析前，根据制造商方案，使用Rainin PT-C18-96 PSC18 10μL尖头对不是通过C18反相柱获得的样品进行脱盐。

为了从胰高血糖素中间肽的C-末端释放CGDEVD(SEQ ID NO:128)，在氩气下用1mM二硫苏糖醇(DTT)或10×至20×摩尔过量的Ekathiol还原半胱氨酸，同时在室温、pH＝8摇动2小时。将含有还原蛋白的上清液转移到含有5倍至10倍于巯基基团数量的NTCB的新试管中。将试管在氩气下密封，并在40℃孵育60分钟。然后，使用旋转柱或C18反相HPLC系统过滤出试剂。最后，通过Tris碱将pH增加到9并在37℃孵育16个小时后，在SEQ ID NO:48NTCB裂解位点完成氰基化肽或蛋白质的裂解。鉴于胰高血糖素以组氨酸开始，该实验显示，即使P1’残基不是小氨基酸如Gly、Ala、Ser或芳香族残基时，胱天蛋白酶-7也有效地裂解嵌合蛋白，如先前指示的(Fuentes-Prior&Salvesen Biochem J.2004Dec 1；384(Pt 2):201–232)。此外，前体蛋白几乎完全消化成三个主要片段，证实了所有设计的胱天蛋白酶-3/-7识别序列都被该酶加工。最后，有限水解产生所有预期的片段，指示所有设计的酶识别位点或多或少以相似的程度与蛋白酶接触，并且没有建立分子内和分子间的二硫键，二硫键将限制设计的蛋白水解序列对蛋白酶的接触。最后，以可溶形式生产蛋白质证实了蛋白质的正确设计，防止可能导致不溶性纠缠沉淀的分子间二硫键形成。

实施例2：使用胱天蛋白酶和化学裂解剂生产胰高血糖素

将多肽工程化为使用胱天蛋白酶和Pd²⁺产生不含无关氨基酸的胰高血糖素。由于胰高血糖素也缺乏脯氨酸，所以使用脯氨酸-组氨酸二肽代替选择半胱氨酸作为化学裂解位点。加硫氧还蛋白标签的胰高血糖素串联重复序列被工程化成包含胱天蛋白酶识别位点(SEQ ID NO:32)、包含Pd²⁺化学裂解序列的氨基酸序列(SEQ ID NO:50)和接头序列(SEQ IDNO:61)，产生如下加硫氧还蛋白标签的多肽氨基酸序列：

将含有胰高血糖素肽的加硫氧还蛋白标签的多肽在BL21-DE3大肠杆菌中表达，每1L培养物的产量为大约100mg蛋白质。如实施例1中描述的，用胱天蛋白酶-7进行多肽的纯化和处理：融合蛋白以可溶性形式产生，并使用Ni-NTA柱纯化。然后用胱天蛋白酶-7处理，胱天蛋白酶-7将蛋白质在SEQ ID NO:34识别位点裂解成其组分。使用Ni-NTA亲和柱从反应混合物去除硫氧还蛋白标签和胱天蛋白酶-7，两者都具有组氨酸标签。在这些步骤结束时，获得成熟胰高血糖素和胰高血糖素与在其C-末端包含胰高血糖素、胱天蛋白酶识别位点、接头序列和Pd²⁺裂解位点PHGGDEVD(SEQ ID NO:131)的中间肽产物的混合物。为了从胰高血糖素的C-末端释放PHGGDEVD(SEQ ID NO:131)，用等摩尔量的Pd(II)在pH 2处理混合物2小时，在Pro-His Pd²⁺化学裂解位点处裂解中间肽产物。然后，使用旋转柱或C18反相HPLC系统过滤试剂。

接下来，将多肽工程化为具有硫氧还蛋白标签和包含胰高血糖素肽、胱天蛋白酶-7识别序列(SEQ ID NO:33)、Ni²⁺化学裂解位点(SEQ ID NO:53)和Gly接头的四个重复序列，产生以下序列：

在用胱天蛋白酶-7处理以在SEQ ID NO:34处裂解，并去除硫氧还蛋白标签和蛋白酶之后，在50℃将20mM的重组蛋白与100mM Hepes缓冲液,pH 8.2中2mM NiCl₂和120mMNaCl中一起孵育过夜，在SEQ ID NO:56化学裂解位点处裂解中间肽产物以从胰高血糖素的C-末端去除无关氨基酸SRHWGDEVD(SEQ ID NO:134)。

实施例3：使用Kexin与羧肽酶生产利拉鲁肽

将多肽工程化为产生由靶氨基酸序列HAEGTFTSDVSSYLEGQAAKEEFIAWLVRGRG(SEQID NO:110)组成的利拉鲁肽。由于利拉鲁肽中不存在两个连续的碱性残基，该多肽被工程化成包含四个包含利拉鲁肽的肽重复序列和由Gly-Ser接头分开的两个Kexin识别位点(SEQ ID NO:2)。将硫氧还蛋白标签添加到N-末端以促进多肽的纯化：

用Kexin处理纯化的重组多肽以在蛋白酶识别位点裂解多肽，产生成熟形式的利拉鲁肽和中间肽产物的混合物，所述中间肽产物包含在C-末端具有两个碱性残基(RR或KR)的利拉鲁肽。用羧肽酶B处理这些中间肽去除了这些额外的碱性氨基酸，产生成熟的利拉鲁肽。

将包含利拉鲁肽的加硫氧还蛋白标签的多肽于37℃在1L LB培养基中在BL21-DE3细胞中表达7个小时。将细胞糊状物重悬于50mM Tris-HCl、100mM NaCl、5mM咪唑、0.5％Triton X-100、pH 8.0中，然后轻柔超声处理。以20,000×g离心15分钟后，将上清液与Ni-NTA树脂在4℃孵育1小时。用50mM Tris-HCl、500mM NaCl、10mM咪唑、pH 8.0洗涤树脂。接下来用50mM Tris-HCl中的300mM咪唑(pH，8.0)、10mMβ-巯基乙醇、10％甘油洗脱蛋白质。通过SDS-PAGE确定多肽的纯度。

用100U加组氨酸标签的kex2蛋白酶在37℃在200mM Bis-Tris缓冲液，pH＝7，加0.01％Triton X-100、1mM CaCl₂中处理纯化的多肽4小时，在Arg-Arg和Lys-Arg Kexin识别位点裂解多肽。将反应物与Ni-NTA柱孵育60分钟以去除标签和加His标签的蛋白酶。短暂离心后，将上清液转移到新试管中，在试管中添加羧化酶B，并在23℃孵育60分钟。最后，使用C8或C18柱通过反相HPLC从接头序列和个体氨基酸纯化利拉鲁肽。

实施例4：使用胱天蛋白酶和Pd2+生产利拉鲁肽

利拉鲁肽不具有脯氨酸，这允许该氨基酸被包含在Pd²⁺离子的裂解位点中。此外，不存在胱天蛋白酶识别位点。因此，工程化了用于使用胱天蛋白酶-3或胱天蛋白酶-7和Pd²⁺生产利拉鲁肽的多肽，并添加N-末端硫氧还蛋白纯化标签：

纯化的重组蛋白首先用胱天蛋白酶-3或胱天蛋白酶-7消化，以在胱天蛋白酶-3/胱天蛋白酶-7识别位点(SEQ ID NO:33)裂解多肽，并且由于在胱天蛋白酶和标签中都存在六组氨酸，用Ni-NTA柱去除标签和胱天蛋白酶。接下来，用Pd²⁺离子处理得到的中间产物肽HAEGTFTSDVSSYLEGQAAKEEFIAWLVRGRGPHGGDEVD(SEQ ID NO:140)，这在Pd²⁺化学裂解序列(SEQ ID NO:50)处裂解中间肽以从C-末端去除无关氨基酸，产生利拉鲁肽。

如实施例1中描述的产生和纯化含有串联重复序列与利拉鲁肽的加硫氧还蛋白标签的多肽：在30℃在50mM HEPES、pH 7.4、100mM NaCl、10％甘油、0.1mM EDTA、10mM二硫苏糖醇和0.1％ CHAPS中用1mg重组加His₆标签的胱天蛋白酶-7蛋白酶处理纯化的蛋白质4小时，这在SEQ ID NO:34处裂解多肽。将反应物与Ni-NTA树脂孵育60分钟以去除标签和蛋白酶。短暂离心后，将上清液转移到新试管中，向试管中添加等摩尔量的顺式-[Pd-(en)(H)₂O)₄]²⁺、Pd(II)试剂，并在60℃，pH 4孵育过夜，其在SEQ ID NO:51处裂解中间肽产物。最后，使用C8或C18柱通过反相HPLC从接头序列和个体氨基酸纯化利拉鲁肽。

在另一个实例中，Cys取代了Pro-His二肽，并且使用NTCB去除无关氨基酸。

实施例5：使用胱天蛋白酶和Ni²⁺生产胰岛素

胰岛素的成熟形式由通过两个二硫键连接的B链和A链组成。

胰岛素链-B：FVNQHLCGSHLVEALYLVCGERGFFYTPKT(SEQ ID NO:108)

胰岛素链-A：GIVEQCCTSICSLYQLENYCN(SEQ ID NO:107)

为了产生胰岛素，将含有两个重复链-A和两个重复链-B的多肽工程化为用胱天蛋白酶和Ni²⁺处理分离，其含有胱天蛋白酶识别位点(SEQ ID NO:32)、Ni²⁺化学裂解位点(SEQID NO:53)和Gly接头，使得多肽具有以下序列：

纯化的重组多肽首先在胱天蛋白酶识别位点用胱天蛋白酶-3或胱天蛋白酶-7消化，并且用Ni-NTA柱去除胱天蛋白酶。接下来，用Ni²⁺离子处理所得的中间肽产物，这从C-末端去除了无关的SRHWGDEVD(SEQ ID NO:134)氨基酸，产生胰岛素B-链肽和A-链肽的混合物。

于30℃在50mM HEPES、pH 7.4、100mM NaCl、10％甘油、0.1mM EDTA、10mM二硫苏糖醇和0.1％ CHAPS中用1mg重组加组氨酸标签的胱天蛋白酶-7蛋白酶处理纯化的多肽4小时，在SEQ ID NO:127处裂解多肽，产生包含胰岛素B-链或胰岛素A-链和SEQ ID NO:134的中间肽产物。将反应物与Ni-NTA树脂孵育60分钟以去除蛋白酶。短暂离心后，于45℃将上清液与100mM Hepes缓冲液，pH 8.2中0.5mM NiCl₂一起孵育过夜，在SEQ ID NO:56处裂解中间肽产物，从C-末端去除无关氨基酸(SEQ ID NO:134)。最后，使用C8或C18柱通过反相HPLC从接头序列和个体氨基酸纯化胰岛素肽。

实施例6：使用Kexin和羧肽酶生产胰岛素

为了使用Kexin和羧肽酶产生胰岛素，设计了包含链-A的两个重复和链-B的两个重复的多肽，其中重复序列在胰岛素链肽的C-末端包含被接头序列(SEQ ID NO:62)分开的两个Kexin识别位点(SEQ ID NO:2)。所得多肽包括以下氨基酸序列：

含有胰岛素B链和A链重复序列的多肽在1L LB培养基中于37℃在BL21-DE3细胞中表达7个小时。将细胞糊状物重悬于50mM Tris-HCl、100mM NaCl、5mM咪唑、0.5％ TritonX-100、pH 8.0中，然后轻柔超声处理。以20,000×g离心15分钟后，将上清液与Ni-NTA树脂在4℃孵育1小时。用50mM Tris-HCl、500mM NaCl、10mM咪唑、pH 8.0洗涤树脂。接下来用50mM Tris-HCl中的300mM咪唑(pH，8.0)、10mMβ-巯基乙醇、10％甘油洗脱蛋白质。通过SDS-PAGE确定多肽的纯度。

于37℃在200mM Bis-Tris缓冲液，pH 7，加0.01％ Triton X-100，1mM CaCl₂中用100U加组氨酸标签的kex2蛋白酶处理纯化的多肽4小时，在SEQ ID NO:3和SEQ ID NO:4处裂解多肽，得到中间肽产物FVNQHLCGSHLVEALYLVCGERGFFYTPKT<RR>(SEQ ID NO:143)和GIVEQCCTSICSLYQLENYCN<RR>(SEQ ID NO:144)。将反应物与Ni-NTA柱孵育60分钟，以去除加His标签的蛋白酶。短暂离心后，将上清液转移到新试管中，在试管中添加羧肽酶B，并在23℃孵育60分钟去除C-末端Arg-Arg二肽。最后，使用C8或C18柱通过反相HPLC从接头序列和个体氨基酸纯化胰岛素肽。

实施例7：使用蛋白酶生产特立帕肽

特立帕肽不具有脯氨酸，并且最后两个氨基酸以天冬酰胺和苯丙氨酸终止，天冬酰胺和苯丙氨酸是包括HIV-1蛋白酶在内的许多逆转录病毒蛋白酶的偏好序列。这允许在最后一个氨基酸后立即包含脯氨酸作为HIV-1蛋白酶的裂解位点。此外，不存在胱天蛋白酶裂解位点，因此将具有N-末端标签的重组多肽工程化为用于使用胱天蛋白酶-3或胱天蛋白酶-7和HIV蛋白酶生产特立帕肽，其包含胱天蛋白酶-3/胱天蛋白酶-7裂解位点(SEQ IDNO:33)、HIV-蛋白酶裂解位点和重复单元N-末端处的Pro-异亮氨酸-丝氨酸：

在本实施例中可以理解，Ser残基可以用作HIV1-蛋白酶识别序列的一部分和接头序列的一部分二者。特立帕肽C-末端处的NF二肽和作为接头序列的PIS设计的组合产生了HIV1-蛋白酶识别序列。因此，在大肠杆菌中设计并产生以下嵌合蛋白：

MSDKIIHLTDDSFDTDVLKADGAILVDFWAEWCGPCKMIAPILDEIADEYQGKLTVAKLNIDQNPGTAPKYGIRGIPTLLLFKNGEVAATKVGALSKGQLKEFLDANLAGSGSGHMHHHHHHSSGLVPRGSGMKETAAAKFERQHMDSPDLGTDDDDKAMADIGSGDEVDSVSEIQLMHNLGKHLNSMERVEWLRKKLQDVHNFPISDEVDSVSEIQLMHNLGKHLNSMERVEWLRKKLQDVHNFPISDEVDSVSEIQLMHNLGKHLNSMERVEWLRKKLQDVHNFPISDEVDSVSEIQLMHNLGKHLNSMERVEWLRKKLQDVHNF(SEQ ID NO:191)(图6A)。

使用胱天蛋白酶-3或胱天蛋白酶-7对SEQ ID NO:191的重组多肽进行蛋白水解，在SEQ ID NO:34处裂解多肽，产生成熟特立帕肽和中间肽产物SVSEIQLMHNLGKHLNSMERVEWLRKKLQDVHNFPISDEVD(SEQ ID NO:192)的混合物(图6A)。HIV-1蛋白酶催化的蛋白水解去除无关的PISDEVD(SEQ ID NO:193)氨基酸以产生成熟的特立帕肽(图6B)。胱天蛋白酶-3处理的用硫氧还蛋白加标签的特立帕肽的四个重复序列的HPLC分析产生五个峰(图6C)。在3.8分钟和5.9分钟的峰是杂质，而在20.2分钟、20.4分钟和22.8分钟的峰分别属于特立帕肽、其重复单元和硫氧还蛋白标签。通过MALDI-TOF质谱仪获得的20.2处和20.4处洗脱峰的质量证实了，特立帕肽及其重复单元确实在指定的时间点被洗脱(图6D)。

具有N-末端标签的多肽也被工程化为用于使用Kexin和羧肽酶B生产利拉鲁肽，其包含Kexin裂解位点(SEQ ID NO:3和SEQ ID NO:4)和羧肽酶C裂解位点：

使用Kexin对SEQ ID NO:148的重组多肽进行蛋白水解，在SEQ ID NO:3和SEQ IDNO:4处裂解多肽，产生成熟利拉鲁肽和中间肽产物HAEGTFTSDVSSYLEGQAAKEEFIAWLVRGRG(SEQ ID NO:110)和HAEGTFTSDVSSYLEGQAAKEEFIAWLVRGRG<RR>(SEQ ID NO:194)的混合物。羧肽酶C催化的蛋白水解去除无关的RR和KR氨基酸以产生成熟的利拉鲁肽。

具有N-末端标签的多肽也被工程化为用于使用肠激酶和Ni²⁺生产利拉鲁肽，其包含肠激酶裂解位点(SEQ ID NO:31)、Ni²⁺裂解位点和接头序列：

使用肠激酶对SEQ ID NO:153的重组多肽进行蛋白水解，在SEQ ID NO:31处裂解多肽，产生成熟利拉鲁肽和中间肽产物HAEGTFTSDVSSYLEGQAAKEEFIAWLVRGRGSRHWG<DDDDK>(SEQ ID NO:155)的混合物。Ni²⁺催化水解去除了无关的SRHWGDDDDK(SEQ ID NO:154)氨基酸以产生成熟的利拉鲁肽。

从上述重组多肽生产和纯化利拉鲁肽后，分别用胱天蛋白酶-3或胱天蛋白酶-7、Kexin或肠激酶以及羧肽酶C顺序或同时处理多肽，并将所得成熟肽与接头序列一起进行反相色谱以进一步纯化。

实施例8：使用胱天蛋白酶、Kexin和羧肽酶生产胰岛素

为了使用胱天蛋白酶、Kexin和羧肽酶产生胰岛素，将若干种加His标签的多肽工程化为包含两个、三个、四个或七个包含胰岛素B-链或A-链亚基、胱天蛋白酶识别位点(SEQID NO:32)、Kexin识别位点(SEQ ID NO:2)和接头序列(SEQ ID NO:82或SEQ ID NO:83)的重复序列。

2个A-链和B-链亚基：

3个A-链和B-链亚基：

4个A-链和B-链亚基：

7个A-链和B-链亚基：

当纯化的蛋白质附接到Ni-NTA柱时，用Kexin和羧肽酶B处理任何多肽。Kexin在SEQ ID NO:3和SEQ ID NO:4处裂解多肽以产生中间肽：

和成熟胰岛素A-链(SEQ ID NO:107)，而羧肽酶B也去除无关的C-末端氨基酸以产生以下产物混合物：

和成熟胰岛素A-链(SEQ ID NO:107)。

然后用PBS缓冲液洗涤柱。这去除了接头肽和碱性氨基酸。然后，将加His标签的胱天蛋白酶-7添加到柱，导致加His标签的前肽在SEQ ID NO:34处从成熟胰岛素水解。由于水解，成熟的胰岛素从柱释放。

实施例9：使用胱天蛋白酶和羧肽酶在经遗传修饰产生Kexin的宿主中生产胰岛素

为了在经遗传修饰以产生Kexin的宿主中使用胱天蛋白酶、Kexin和羧肽酶产生胰岛素，将含有B-链和A-链胰岛素亚基重复序列的几种多肽工程化为包含胱天蛋白酶识别序列(SEQ ID NO:32)、Kexin识别序列(SEQ ID NO:2)和接头序列(SEQ ID NO:74或SEQ IDNO:123)：

根据制造商的说明，使用Pichia^TM表达系统(VALIDOGEN)进行本实施例中成熟胰岛素的生产和加工。使用电穿孔将含有编码工程化多肽的多核苷酸的pic3.5载体克隆转化到Pichia^TM巴斯德毕赤酵母菌株中。通过实时PCR筛选转化体是否存在构建体的DNA序列，并将表现出最高水平的克隆用于扩大规模。对于大规模生产，于30℃将细胞在500mL缓冲的微量甘油培养基中培养过夜，通过离心收获，洗涤并重悬于50mL缓冲的微量甲醇培养基中。16小时后收获培养上清液，并如先前对胰高血糖素描述的纯化重组多肽。

因为遗传修饰的宿主菌株产生缺乏ER信号传导序列和跨膜区的Kexin(Kex2)，所以SEQ ID NO:164的多肽在宿主内部在SEQ ID NO:3处被裂解，产生中间肽产物GHHHHHHDEVDFVNQHLCGSHLVEALYLVCGERGFFYTPKTRR(SEQ ID NO:166)和HHHHHHDEVDGIVEQCCTSICSLYQLENYCNRR(SEQ ID NO:167)。

类似地，SEQ ID NO:165的多肽在宿主内部在SEQ ID NO:3处被裂解，产生中间肽GHHHHHHDEVDGIVEQCCTSICSLYQLENYCNRR(SEQ ID NO:168)和HHHHHHDEVDFVNQHLCGSHLVEALYLVCGERGFFYTPKTRR(SEQ ID NO:169)。

用羧肽酶B和胱天蛋白酶-7的组合顺序或同时处理前述所得肽混合物中的任一种，产生胰岛素链A和链B，没有任何无关氨基酸。

在另一个实例中，对宿主进行遗传修饰以除Kexin之外还表达羧肽酶B，使得在宿主中产生的中间肽包含氨基酸序列GHHHHHHDEVDFVNQHLCGSHLVEALYLVCGERGFFYTPKT(SEQID NO:170)和HHHHHHDEVDGIVEQCCTSICSLYQLENYCN(SEQ ID NO:171)；或者GHHHHHHDEVDGIVEQCCTSICSLYQLENYCN(SEQ ID NO:172)和HHHHHHDEVDFVNQHLCGSHLVEALYLVCGERGFFYTPKT(SEQ ID NO:173)。用胱天蛋白酶-3或胱天蛋白酶-7在SEQ ID NO:34处对这些肽的蛋白水解产生不含任何无关氨基酸的胰岛素链A和链B。

实施例10：使用胱天蛋白酶和Ni²⁺生产特立帕肽

多肽被工程化为含有硫氧还蛋白标签和四个包含特立帕肽的重复序列、胱天蛋白酶-7(-3)识别序列(SEQ ID NO:33)、Ni²⁺化学裂解位点(SEQ ID NO:53)和接头序列，产生以下序列：

于30℃在50mM HEPES、pH 7.4、100mM NaCl、10％甘油、0.1mM EDTA、5mMβME中用50微克重组加组氨酸标签的胱天蛋白酶-7处理5mg纯化的多肽过夜，在SEQ ID NO:34处裂解多肽以产生特立帕肽和与接头肽SEQ ID NO:201连接的特立帕肽(图7A)。取决于条件，产物可以以可溶或不可溶的形式获得。通过离心沉淀具有高浓度蛋白质的过夜消化样品，并将沉淀溶解在5％乙腈和0.1％三氟乙酸中。样品通过Hi-Pore C18 Bio-rad柱进行分析。特立帕肽及其重复单元通常在20.2分钟和20.4分钟洗脱。将含有特立帕肽和附接到接头序列的特立帕肽的级分置于Speedvac中以蒸发溶剂。于50℃将所得肽溶解在50mM Hepes缓冲液pH8.2中的2mM NiCl₂、120mM NaCl中过夜，在SEQ ID NO:56化学裂解位点处裂解中间肽产物以从特立帕肽的C-末端去除无关氨基酸SRHWSDEVD(SEQ ID NO:202)(图7B)。裂解的程度取决于酶的浓度和底物的量(图7C)。MALDI-TOF-MS分析证实产生了分子量为4117.76的正确特立帕肽。将从反相柱获得的总浓度为大约200ng/微升的特立帕肽及其重复单元的混合物以10μL/分钟的流量注入Thermo-Q-Exactive orbitrap质谱仪。原始数据由Xcalibur软件在400到2000的范围内获得，并由牛津大学的Unidec软件解卷积(图7E)(REF DOI:10.1021/acs.analchem.5b00140.)。获得的质量与计算的分子质量非常一致。为了评估设计的胱天蛋白酶裂解位点的可及性，进行纯化的Trx-Ni-特立帕肽的部分水解(图7B)。胱天蛋白酶-3或-7对多肽的有限水解产生12个可能的片段，指示所有设计的酶识别位点确实以相似的程度对蛋白酶是可及的。也进行用NiCl₂水解纯化的Trx-Ni-特立帕肽。(图8A)。在1mM浓度的NiCl₂的最佳水解温度为50℃。分子量低于10kDa的产物的MALDI-TOF质谱分析揭示了m/z值为5247.6和2989.7的两个主峰；前者属于特立帕肽重复单元的氧化形式，并且后者是杂质(图8B)。

实施例11：其他感兴趣肽的生产

含有包含下列肽的串联重复序列的重组多肽以上文针对胰高血糖素、利拉鲁肽和胰岛素详细描述的方式进行工程化。使用蛋白酶和羧肽酶或蛋白酶和蛋白水解化学剂的组合从多肽分离产物肽(也如所述进行)：

艾塞那肽、舍莫瑞林、奈西立肽(利尿钠肽B)和替度鲁肽；这些肽不能使用在含有串联重复序列的多肽的接头肽中引入N-末端半胱氨酸的方法来产生，因为肽的N-末端在裂解反应期间被亚氨基噻唑烷-羧基基团修饰以释放产物肽。

[Cys(Acm)20,31]表皮生长因子(20-31)；使用本文实施方案产生该肽在产物中保留了标签，如果接头序列中包含Kex2以外的蛋白酶，该标签可用于纯化。

ACE2α1螺旋序列；ACE2肽酶结构域(PD)α1螺旋对于结合刺突(S)蛋白的SARS-CoV-2-RBD是重要的。选自ACE2α1螺旋序列的23个残基IEEQAKTFLDKFNHEAEDLFYQS(SEQ ID NO:111)以亚纳摩尔结合特异性识别SARS-CoV-2-RBD。这种肽与SARS-CoV-2-RBD的结合可以阻断病毒进入宿主细胞。使用本文的实施方案生产该肽允许生产包含含有该肽的串联重复序列的多肽，该串联重复序列多肽可用于免疫以产生针对COVID-刺突蛋白受体的中和抗体。

T1肽、GTP结合蛋白片段Gα、L-选择素、肽标准品1(氨基酸分析)；这些肽都含有内部Cys和Met氨基酸两者，并且因此无法通过常规方法以它们的精确序列表达。

虽然说明书描述了本发明的特定实施方案，但是本领域普通技术人员可以在不脱离本发明概念的情况下设计本发明的变化形式。

序列表

<110> 贾姆希德·达沃迪

穆罕默德·M·达沃迪

<120> 用于肽生产的组合物和方法

<130> 670011.32249

<160> 202

<170> PatentIn version 3.5

<210> 1

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 蛋白酶识别位点

<220>

<221> VARIANT

<222> (1)..(2)

<223> 氨基酸1-2的任一个或所有可以不存在或存在

<220>

<221> VARIANT

<222> (3)..(3)

<223> Xaa是Arg或Lys

<220>

<221> VARIANT

<222> (4)..(4)

<223> Xaa是Arg或Lys

<400> 1

Xaa Xaa Xaa Xaa

1

<210> 2

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 蛋白酶识别位点

<220>

<221> VARIANT

<222> (1)..(2)

<223> 氨基酸1-2的任一个或所有可以不存在或存在

<220>

<221> VARIANT

<222> (3)..(3)

<223> Xaa是Arg或Lys

<400> 2

Xaa Xaa Xaa Arg

1

<210> 3

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 蛋白酶识别位点

<220>

<221> VARIANT

<222> (1)..(2)

<223> 氨基酸1-2的任一个或所有可以不存在或存在

<400> 3

Xaa Xaa Arg Arg

1

<210> 4

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 蛋白酶识别位点

<220>

<221> VARIANT

<222> (1)..(2)

<223> 氨基酸1-2的任一个或所有可以不存在或存在

<400> 4

Xaa Xaa Lys Arg

1

<210> 5

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 蛋白酶识别位点

<220>

<221> VARIANT

<222> (1)..(1)

<223> 氨基酸1可以不存在或存在

<220>

<221> VARIANT

<222> (2)..(2)

<223> Xaa是Gly、Ser或Ala

<220>

<221> VARIANT

<222> (3)..(3)

<223> Xaa是Arg或Lys

<220>

<221> VARIANT

<222> (4)..(4)

<223> Xaa是Arg或Lys

<400> 5

Xaa Xaa Xaa Xaa

1

<210> 6

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 蛋白酶识别位点

<220>

<221> VARIANT

<222> (1)..(1)

<223> Xaa是Gly、Ser或Ala

<220>

<221> VARIANT

<222> (2)..(2)

<223> Xaa是Gly、Ser或Ala

<220>

<221> VARIANT

<222> (3)..(3)

<223> Xaa是Arg或Lys

<220>

<221> VARIANT

<222> (4)..(4)

<223> Xaa是Arg或Lys

<400> 6

Xaa Xaa Xaa Xaa

1

<210> 7

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 蛋白酶识别位点

<220>

<221> VARIANT

<222> (1)..(1)

<223> 氨基酸1可以不存在或存在

<220>

<221> VARIANT

<222> (2)..(2)

<223> Xaa是Gly或Ser

<220>

<221> VARIANT

<222> (3)..(3)

<223> Xaa是Arg或Lys

<220>

<221> VARIANT

<222> (4)..(4)

<223> Xaa是Arg或Lys

<400> 7

Xaa Xaa Xaa Xaa

1

<210> 8

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 蛋白酶识别位点

<220>

<221> VARIANT

<222> (1)..(1)

<223> Xaa是Gly或Ser

<220>

<221> VARIANT

<222> (2)..(2)

<223> Xaa是Gly或Ser

<220>

<221> VARIANT

<222> (3)..(3)

<223> Xaa是Arg或Lys

<220>

<221> VARIANT

<222> (4)..(4)

<223> Xaa是Arg或Lys

<400> 8

Xaa Xaa Xaa Xaa

1

<210> 9

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 蛋白酶识别位点

<220>

<221> VARIANT

<222> (1)..(1)

<223> 氨基酸1可以存在或不存在

<220>

<221> VARIANT

<222> (2)..(2)

<223> Xaa是Gly、Ser或Ala

<220>

<221> VARIANT

<222> (3)..(3)

<223> Xaa是Arg或Lys

<400> 9

Xaa Xaa Xaa Arg

1

<210> 10

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 蛋白酶识别位点

<220>

<221> VARIANT

<222> (1)..(1)

<223> Xaa是Gly、Ser或Ala

<220>

<221> VARIANT

<222> (2)..(2)

<223> Xaa是Gly、Ser或Ala

<220>

<221> VARIANT

<222> (3)..(3)

<223> Xaa是Arg或Lys

<400> 10

Xaa Xaa Xaa Arg

1

<210> 11

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 蛋白酶识别位点

<220>

<221> VARIANT

<222> (1)..(1)

<223> 氨基酸1存在或不存在

<220>

<221> VARIANT

<222> (2)..(2)

<223> Xaa是Gly或Ser

<220>

<221> VARIANT

<222> (3)..(3)

<223> Xaa是Arg或Lys

<400> 11

Xaa Xaa Xaa Arg

1

<210> 12

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 蛋白酶识别位点

<220>

<221> VARIANT

<222> (1)..(1)

<223> Xaa是Gly或Ser

<220>

<221> VARIANT

<222> (2)..(2)

<223> Xaa是Gly或Ser

<220>

<221> VARIANT

<222> (3)..(3)

<223> Xaa是Arg或Lys

<400> 12

Xaa Xaa Xaa Arg

1

<210> 13

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 蛋白酶识别位点

<220>

<221> misc_feature

<222> (2)..(2)

<223> Xaa可以是任何天然存在的氨基酸

<220>

<221> VARIANT

<222> (3)..(3)

<223> Xaa是Arg或Lys

<220>

<221> VARIANT

<222> (4)..(4)

<223> Xaa是Arg或Lys

<400> 13

Arg Xaa Xaa Xaa

1

<210> 14

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 蛋白酶识别位点

<220>

<221> misc_feature

<222> (2)..(2)

<223> Xaa可以是任何天然存在的氨基酸

<220>

<221> VARIANT

<222> (3)..(3)

<223> Xaa是Arg或Lys

<400> 14

Arg Xaa Xaa Arg

1

<210> 15

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 蛋白酶识别位点

<220>

<221> misc_feature

<222> (2)..(2)

<223> Xaa可以是任何天然存在的氨基酸

<400> 15

Arg Xaa Arg Arg

1

<210> 16

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 蛋白酶识别位点

<220>

<221> misc_feature

<222> (2)..(2)

<223> Xaa可以是任何天然存在的氨基酸

<400> 16

Arg Xaa Lys Arg

1

<210> 17

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 蛋白酶识别位点

<220>

<221> VARIANT

<222> (1)..(1)

<223> Xaa是Arg或Lys

<220>

<221> VARIANT

<222> (2)..(2)

<223> Xaa是Arg或Lys

<220>

<221> VARIANT

<222> (3)..(3)

<223> Xaa是Arg或Lys

<400> 17

Xaa Xaa Xaa Arg

1

<210> 18

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 蛋白酶识别位点

<220>

<221> VARIANT

<222> (2)..(2)

<223> Xaa是Arg或Lys

<220>

<221> VARIANT

<222> (3)..(3)

<223> Xaa是Arg或Lys

<400> 18

Arg Xaa Xaa Arg

1

<210> 19

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 蛋白酶识别位点

<400> 19

Arg Arg Arg Arg

1

<210> 20

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 蛋白酶识别位点

<400> 20

Arg Lys Arg Arg

1

<210> 21

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 蛋白酶识别位点

<400> 21

Arg Arg Lys Arg

1

<210> 22

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 蛋白酶识别位点

<400> 22

Arg Lys Lys Arg

1

<210> 23

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 蛋白酶识别位点

<400> 23

Lys Arg Arg Arg

1

<210> 24

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 蛋白酶识别位点

<400> 24

Lys Lys Arg Arg

1

<210> 25

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 蛋白酶识别位点

<400> 25

Lys Arg Lys Arg

1

<210> 26

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 蛋白酶识别位点

<400> 26

Lys Lys Lys Arg

1

<210> 27

<211> 5

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 蛋白酶识别位点

<220>

<221> VARIANT

<222> (1)..(1)

<223> Xaa是Arg或Lys

<220>

<221> misc_feature

<222> (2)..(3)

<223> Xaa可以是任何天然存在的氨基酸

<220>

<221> VARIANT

<222> (4)..(4)

<223> Xaa是Arg或Lys

<220>

<221> misc_feature

<222> (5)..(5)

<223> Xaa可以是任何天然存在的氨基酸

<400> 27

Xaa Xaa Xaa Xaa Xaa

1 5

<210> 28

<211> 6

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 蛋白酶识别位点

<220>

<221> VARIANT

<222> (1)..(1)

<223> Xaa是Arg或Lys

<220>

<221> misc_feature

<222> (2)..(5)

<223> Xaa可以是任何天然存在的氨基酸

<220>

<221> VARIANT

<222> (6)..(6)

<223> Xaa是Arg或Lys

<400> 28

Xaa Xaa Xaa Xaa Xaa Xaa

1 5

<210> 29

<211> 8

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 蛋白酶识别位点

<220>

<221> VARIANT

<222> (1)..(1)

<223> Xaa是Arg或Lys

<220>

<221> misc_feature

<222> (2)..(7)

<223> Xaa可以是任何天然存在的氨基酸

<220>

<221> VARIANT

<222> (8)..(8)

<223> Xaa是Arg或Lys

<400> 29

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

1 5

<210> 30

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 蛋白酶识别位点

<220>

<221> VARIANT

<222> (1)..(1)

<223> Xaa是Tyr、Phe、Trp、Asp、Ile、Leu、Thr或Val

<220>

<221> VARIANT

<222> (2)..(2)

<223> Xaa是Glu、Asp或Val

<220>

<221> misc_feature

<222> (3)..(3)

<223> Xaa可以是任何天然存在的氨基酸

<220>

<221> VARIANT

<222> (4)..(4)

<223> Xaa是Asp、Arg或Lys

<400> 30

Xaa Xaa Xaa Xaa

1

<210> 31

<211> 5

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 蛋白酶识别位点

<400> 31

Asp Asp Asp Asp Lys

1 5

<210> 32

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 蛋白酶识别位点

<220>

<221> VARIANT

<222> (1)..(1)

<223> Xaa是Tyr、Phe、Trp、Asp、Ile、Leu、Thr或Val

<220>

<221> VARIANT

<222> (2)..(2)

<223> Xaa是Glu或Val

<220>

<221> misc_feature

<222> (3)..(3)

<223> Xaa可以是任何天然存在的氨基酸

<400> 32

Xaa Xaa Xaa Asp

1

<210> 33

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 蛋白酶识别位点

<220>

<221> misc_feature

<222> (3)..(3)

<223> Xaa可以是任何天然存在的氨基酸

<400> 33

Asp Glu Xaa Asp

1

<210> 34

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 蛋白酶识别位点

<400> 34

Asp Glu Val Asp

1

<210> 35

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 蛋白酶识别位点

<220>

<221> VARIANT

<222> (1)..(1)

<223> Xaa是Tyr、Phe或Trp

<220>

<221> misc_feature

<222> (3)..(3)

<223> Xaa可以是任何天然存在的氨基酸

<400> 35

Xaa Val Xaa Asp

1

<210> 36

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 蛋白酶识别位点

<220>

<221> misc_feature

<222> (3)..(3)

<223> Xaa可以是任何天然存在的氨基酸

<400> 36

Tyr Val Xaa Asp

1

<210> 37

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 蛋白酶识别位点

<220>

<221> misc_feature

<222> (3)..(3)

<223> Xaa可以是任何天然存在的氨基酸

<400> 37

Phe Val Xaa Asp

1

<210> 38

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 蛋白酶识别位点

<220>

<221> misc_feature

<222> (3)..(3)

<223> Xaa可以是任何天然存在的氨基酸

<400> 38

Trp Val Xaa Asp

1

<210> 39

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 蛋白酶识别位点

<220>

<221> VARIANT

<222> (1)..(1)

<223> Xaa是Ile、Leu、Thr或Val

<220>

<221> misc_feature

<222> (3)..(3)

<223> Xaa可以是任何天然存在的氨基酸

<400> 39

Xaa Glu Xaa Asp

1

<210> 40

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 蛋白酶识别位点

<220>

<221> misc_feature

<222> (3)..(3)

<223> Xaa可以是任何天然存在的氨基酸

<400> 40

Ile Glu Xaa Asp

1

<210> 41

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 蛋白酶识别位点

<220>

<221> misc_feature

<222> (3)..(3)

<223> Xaa可以是任何天然存在的氨基酸

<400> 41

Leu Glu Xaa Asp

1

<210> 42

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 蛋白酶识别位点

<220>

<221> VARIANT

<222> (1)..(1)

<223> Xaa是Thr或Val

<220>

<221> misc_feature

<222> (3)..(3)

<223> Xaa可以是任何天然存在的氨基酸

<400> 42

Xaa Glu Xaa Asp

1

<210> 43

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 蛋白酶识别位点

<220>

<221> VARIANT

<222> (2)..(2)

<223> Xaa是Glu或Asp

<400> 43

Ile Xaa Gly Arg

1

<210> 44

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 蛋白酶识别位点

<400> 44

Ile Glu Gly Arg

1

<210> 45

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 蛋白酶识别位点

<400> 45

Ile Asp Gly Arg

1

<210> 46

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> NTCB裂解序列

<220>

<221> VARIANT

<222> (2)..(4)

<223> 氨基酸2-4的任一个可以不存在或存在

<400> 46

Cys Xaa Xaa Xaa

1

<210> 47

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> NTCB裂解序列

<220>

<221> VARIANT

<222> (3)..(4)

<223> 氨基酸3-4的任一个可以存在或不存在

<400> 47

Cys Gly Xaa Xaa

1

<210> 48

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> NTCB裂解序列

<400> 48

Cys Gly Asp Glu

1

<210> 49

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> Pd2+裂解序列

<220>

<221> VARIANT

<222> (1)..(1)

<223> Xaa是Pro或Gly

<220>

<221> VARIANT

<222> (2)..(2)

<223> Xaa是His或Met

<220>

<221> VARIANT

<222> (3)..(4)

<223> 氨基酸3-4的任一个可以不存在或存在

<400> 49

Xaa Xaa Xaa Xaa

1

<210> 50

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> Pd2+裂解序列

<220>

<221> VARIANT

<222> (2)..(2)

<223> Xaa是His或Met

<220>

<221> VARIANT

<222> (3)..(4)

<223> 氨基酸3-4的任一个可以不存在或存在

<400> 50

Pro Xaa Xaa Xaa

1

<210> 51

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> Pd2+裂解序列

<220>

<221> VARIANT

<222> (3)..(4)

<223> 氨基酸3-4的任一个可以不存在或存在

<400> 51

Pro His Xaa Xaa

1

<210> 52

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> Pd2+裂解序列

<220>

<221> VARIANT

<222> (3)..(4)

<223> 氨基酸3-4的任一个可以不存在或存在

<400> 52

Pro Met Xaa Xaa

1

<210> 53

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> Ni2+裂解序列

<220>

<221> VARIANT

<222> (1)..(1)

<223> Xaa是Ser或Thr

<220>

<221> misc_feature

<222> (2)..(2)

<223> Xaa可以是任何天然存在的氨基酸

<220>

<221> misc_feature

<222> (4)..(4)

<223> Xaa可以是任何天然存在的氨基酸

<400> 53

Xaa Xaa His Xaa

1

<210> 54

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> Ni2+裂解序列

<220>

<221> misc_feature

<222> (2)..(2)

<223> Xaa可以是任何天然存在的氨基酸

<220>

<221> misc_feature

<222> (4)..(4)

<223> Xaa可以是任何天然存在的氨基酸

<400> 54

Ser Xaa His Xaa

1

<210> 55

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> Ni2+裂解序列

<220>

<221> VARIANT

<222> (1)..(1)

<223> Xaa是Ser或Thr

<220>

<221> VARIANT

<222> (2)..(2)

<223> Xaa是Arg、Trp、Phe、Ile、Leu、Met或Val

<220>

<221> VARIANT

<222> (4)..(4)

<223> Xaa是Arg、Trp、Phe、Ile、Leu、Met或Val

<400> 55

Xaa Xaa His Xaa

1

<210> 56

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> Ni2+裂解序列

<400> 56

Ser Arg His Trp

1

<210> 57

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 接头序列

<220>

<221> VARIANT

<222> (1)..(1)

<223> 氨基酸1可以不存在或存在

<220>

<221> VARIANT

<222> (4)..(4)

<223> 氨基酸4可以不存在或存在

<400> 57

Xaa Pro Ser Xaa

1

<210> 58

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 接头序列

<220>

<221> VARIANT

<222> (1)..(1)

<223> 氨基酸1可以不存在或存在

<220>

<221> VARIANT

<222> (4)..(4)

<223> 氨基酸4可以不存在或存在

<400> 58

Xaa Pro Gly Xaa

1

<210> 59

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 接头序列

<220>

<221> VARIANT

<222> (1)..(1)

<223> 氨基酸1可以不存在或存在

<220>

<221> VARIANT

<222> (4)..(4)

<223> 氨基酸4可以不存在或存在

<400> 59

Xaa Ala Ser Xaa

1

<210> 60

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 接头序列

<220>

<221> VARIANT

<222> (1)..(1)

<223> 氨基酸1可以不存在或存在

<220>

<221> VARIANT

<222> (4)..(4)

<223> 氨基酸4可以不存在或存在

<400> 60

Xaa Ala Gly Xaa

1

<210> 61

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 接头序列

<220>

<221> VARIANT

<222> (1)..(1)

<223> 氨基酸1可以不存在或存在

<220>

<221> VARIANT

<222> (4)..(4)

<223> 氨基酸4可以不存在或存在

<400> 61

Xaa Gly Gly Xaa

1

<210> 62

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 接头序列

<220>

<221> VARIANT

<222> (1)..(1)

<223> 氨基酸1可以不存在或存在

<220>

<221> VARIANT

<222> (4)..(4)

<223> 氨基酸4可以不存在或存在

<400> 62

Xaa Gly Ser Xaa

1

<210> 63

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 接头序列

<220>

<221> VARIANT

<222> (1)..(1)

<223> 氨基酸1可以不存在或存在

<220>

<221> VARIANT

<222> (4)..(4)

<223> 氨基酸4可以不存在或存在

<400> 63

Xaa Lys Ser Xaa

1

<210> 64

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 接头序列

<220>

<221> VARIANT

<222> (1)..(1)

<223> 氨基酸1可以不存在或存在

<220>

<221> VARIANT

<222> (4)..(4)

<223> 氨基酸4可以不存在或存在

<400> 64

Xaa Lys Gly Xaa

1

<210> 65

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 接头序列

<220>

<221> VARIANT

<222> (1)..(1)

<223> 氨基酸1不存在或存在

<220>

<221> VARIANT

<222> (4)..(4)

<223> 氨基酸4不存在或存在

<400> 65

Xaa Glu Ser Xaa

1

<210> 66

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 接头序列

<220>

<221> VARIANT

<222> (1)..(1)

<223> 氨基酸1不存在或存在

<220>

<221> VARIANT

<222> (4)..(4)

<223> 氨基酸4不存在或存在

<400> 66

Xaa Glu Gly Xaa

1

<210> 67

<211> 5

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 接头序列

<400> 67

Gly Gly Gly Gly Ser

1 5

<210> 68

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 接头序列

<220>

<221> VARIANT

<222> (1)..(1)

<223> 氨基酸1可以不存在或存在

<220>

<221> VARIANT

<222> (3)..(3)

<223> Xaa是Ser或Gly

<220>

<221> VARIANT

<222> (4)..(4)

<223> 氨基酸4可以不存在或存在

<400> 68

Xaa Pro Xaa Xaa

1

<210> 69

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 接头序列

<220>

<221> VARIANT

<222> (3)..(3)

<223> Xaa是Ser或Gly

<220>

<221> VARIANT

<222> (4)..(4)

<223> 氨基酸4可以不存在或存在

<400> 69

Pro Pro Xaa Xaa

1

<210> 70

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 接头序列

<220>

<221> misc_feature

<222> (2)..(2)

<223> Xaa可以是任何天然存在的氨基酸

<220>

<221> VARIANT

<222> (3)..(3)

<223> Xaa是Ser或Gly

<220>

<221> VARIANT

<222> (4)..(4)

<223> 氨基酸4可以不存在或存在

<400> 70

Pro Xaa Xaa Xaa

1

<210> 71

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 接头序列

<220>

<221> VARIANT

<222> (1)..(2)

<223> 氨基酸1-2的任一个可以不存在或存在

<220>

<221> VARIANT

<222> (3)..(3)

<223> Xaa是Ser或Gly

<220>

<221> VARIANT

<222> (4)..(4)

<223> 氨基酸4可以不存在或存在

<400> 71

Xaa Xaa Xaa Xaa

1

<210> 72

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 接头序列

<220>

<221> VARIANT

<222> (3)..(3)

<223> Xaa是Ser或Gly

<220>

<221> VARIANT

<222> (4)..(4)

<223> 氨基酸4可以不存在或存在

<400> 72

Pro Pro Xaa Xaa

1

<210> 73

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 接头序列

<220>

<221> VARIANT

<222> (1)..(1)

<223> 氨基酸1可以不存在或存在

<220>

<221> VARIANT

<222> (2)..(2)

<223> Xaa是Ala、Lys或Glu

<220>

<221> VARIANT

<222> (3)..(3)

<223> Xaa是Ser或Gly

<220>

<221> VARIANT

<222> (4)..(4)

<223> 氨基酸4可以不存在或存在

<400> 73

Xaa Xaa Xaa Xaa

1

<210> 74

<211> 7

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 接头序列

<400> 74

Gly His His His His His His

1 5

<210> 75

<211> 6

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 接头序列

<400> 75

Glu Ala Ala Ala Lys Ala

1 5

<210> 76

<211> 6

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 接头序列

<400> 76

Ala Glu Ala Ala Ala Lys

1 5

<210> 77

<211> 18

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 接头序列

<400> 77

Lys Glu Ser Gly Ser Val Ser Ser Glu Gln Leu Ala Gln Phe Arg Ser

1 5 10 15

Leu Asp

<210> 78

<211> 14

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 接头序列

<400> 78

Glu Gly Lys Ser Ser Gly Ser Gly Ser Glu Ser Lys Ser Thr

1 5 10

<210> 79

<211> 12

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 接头序列

<220>

<221> VARIANT

<222> (12)..(12)

<223> Xaa是Phe或Gly

<400> 79

Gly Ser Ala Gly Ser Ala Ala Gly Ser Gly Glu Xaa

1 5 10

<210> 80

<211> 12

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 接头序列

<400> 80

Gly Ser Ala Gly Ser Ala Ala Gly Ser Gly Glu Phe

1 5 10

<210> 81

<211> 12

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 接头序列

<400> 81

Gly Ser Ala Gly Ser Ala Ala Gly Ser Gly Glu Gly

1 5 10

<210> 82

<211> 31

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 接头序列

<400> 82

Glu Ala Glu Asp Leu Gln Val Gly Gln Val Glu Leu Gly Gly Gly Pro

1 5 10 15

Gly Ala Gly Ser Leu Gln Pro Leu Ala Leu Glu Gly Ser Leu Gln

20 25 30

<210> 83

<211> 26

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 接头序列

<400> 83

Gly Ala Gly Ala Gly Ala Met Ala Leu Trp Met Arg Leu Leu Pro Leu

1 5 10 15

Leu Ala Leu Leu Ala Leu Trp Gly Pro Asp

20 25

<210> 84

<211> 29

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 胰高血糖素肽

<400> 84

His Ser Gln Gly Thr Phe Thr Ser Asp Tyr Ser Lys Tyr Leu Asp Ser

1 5 10 15

Arg Arg Ala Gln Asp Phe Val Gln Trp Leu Met Asn Thr

20 25

<210> 85

<211> 39

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 艾塞那肽

<400> 85

His Gly Glu Gly Thr Phe Thr Ser Asp Leu Ser Lys Gln Met Glu Glu

1 5 10 15

Glu Ala Val Arg Leu Phe Ile Glu Trp Leu Lys Asn Gly Gly Pro Ser

20 25 30

Ser Gly Ala Pro Pro Pro Ser

35

<210> 86

<211> 30

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 舍莫瑞林肽

<400> 86

Tyr Ala Asp Ala Ile Phe Thr Asn Ser Tyr Arg Lys Val Leu Gly Gln

1 5 10 15

Leu Ser Ala Arg Lys Leu Leu Gln Asp Ile Met Ser Arg Gln

20 25 30

<210> 87

<211> 32

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 奈西立肽

<400> 87

Ser Pro Lys Met Val Gln Gly Ser Gly Cys Phe Gly Arg Lys Met Asp

1 5 10 15

Arg Ile Ser Ser Ser Ser Gly Leu Gly Cys Lys Val Leu Arg Arg His

20 25 30

<210> 88

<211> 33

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 替度鲁肽

<400> 88

His Gly Asp Gly Ser Phe Ser Asp Glu Met Asn Thr Ile Leu Asp Asn

1 5 10 15

Leu Ala Ala Arg Asp Phe Ile Asn Trp Leu Ile Gln Thr Lys Ile Thr

20 25 30

Asp

<210> 89

<211> 12

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> [Cys(Acm)20,31]表皮生长因子肽

<400> 89

Cys Met His Ile Glu Ser Leu Asp Ser Tyr Thr Cys

1 5 10

<210> 90

<211> 12

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> T1肽

<400> 90

Met Ser Arg Pro Ala Cys Pro Asn Arg Lys Tyr Gly

1 5 10

<210> 91

<211> 16

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> GTP结合蛋白片段, Gα

<400> 91

Cys Gly Ala Gly Glu Ser Gly Lys Ser Thr Ile Val Lys Gln Met Lys

1 5 10 15

<210> 92

<211> 12

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> L-选择素肽

<400> 92

Cys Gln Lys Leu Asp Lys Ser Phe Ser Met Ile Lys

1 5 10

<210> 93

<211> 18

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 肽标准品1

<400> 93

Cys Pro Asp Phe Gly His Ile Ala Met Glu Leu Ser Val Arg Thr Trp

1 5 10 15

Lys Tyr

<210> 94

<211> 39

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> ACTH (1-39) (Acthar)

<400> 94

Ser Tyr Ser Met Glu His Phe Arg Trp Gly Lys Pro Val Gly Lys Lys

1 5 10 15

Arg Arg Pro Val Lys Val Tyr Pro Asp Gly Ala Glu Asp Gln Leu Ala

20 25 30

Glu Ala Phe Pro Leu Glu Phe

35

<210> 95

<211> 24

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> ACTH (1-24)

<400> 95

Ser Tyr Ser Met Glu His Phe Arg Trp Gly Lys Pro Val Gly Lys Lys

1 5 10 15

Arg Arg Pro Val Lys Val Tyr Pro

20

<210> 96

<211> 65

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 来匹卢定

<400> 96

Leu Val Tyr Thr Asp Cys Thr Glu Ser Gly Gln Asn Leu Cys Leu Cys

1 5 10 15

Glu Gly Ser Asn Val Cys Gly Gln Gly Asn Lys Cys Ile Leu Gly Ser

20 25 30

Asp Gly Glu Lys Asn Gln Cys Val Thr Gly Glu Gly Thr Pro Lys Pro

35 40 45

Gln Ser His Asn Asp Gly Asp Phe Glu Glu Ile Pro Glu Glu Tyr Leu

50 55 60

Gln

65

<210> 97

<211> 32

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 降钙素

<400> 97

Cys Ser Asn Leu Ser Thr Cys Val Leu Gly Lys Leu Ser Gln Glu Leu

1 5 10 15

His Lys Leu Gln Thr Tyr Pro Arg Thr Asn Thr Gly Ser Gly Thr Pro

20 25 30

<210> 98

<211> 14

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 生长抑素

<400> 98

Ala Gly Cys Lys Asn Phe Phe Trp Lys Thr Phe Thr Ser Cys

1 5 10

<210> 99

<211> 23

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> Megainin 1

<400> 99

Gly Ile Gly Lys Phe Leu His Ser Ala Gly Lys Phe Gly Lys Ala Phe

1 5 10 15

Val Gly Glu Ile Met Lys Ser

20

<210> 100

<211> 23

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> Megainin 2

<400> 100

Gly Ile Gly Lys Phe Leu His Ser Ala Lys Lys Phe Gly Lys Ala Phe

1 5 10 15

Val Gly Glu Ile Met Asn Ser

20

<210> 101

<211> 39

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 促肾上腺皮质激素

<400> 101

Ser Tyr Ser Met Glu His Phe Arg Trp Gly Lys Pro Val Gly Lys Lys

1 5 10 15

Arg Arg Pro Val Lys Val Tyr Pro Asp Gly Ala Glu Asp Gln Leu Ala

20 25 30

Glu Ala Phe Pro Leu Glu Phe

35

<210> 102

<211> 34

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 特立帕肽

<400> 102

Ser Val Ser Glu Ile Gln Leu Met His Asn Leu Gly Lys His Leu Asn

1 5 10 15

Ser Met Glu Arg Val Glu Trp Leu Arg Lys Lys Leu Gln Asp Val His

20 25 30

Asn Phe

<210> 103

<211> 44

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 替莫瑞林

<400> 103

Tyr Ala Asp Ala Ile Phe Thr Asn Ser Tyr Arg Lys Val Leu Gly Gln

1 5 10 15

Leu Ser Ala Arg Lys Leu Leu Gln Asp Ile Met Ser Arg Gln Gln Gly

20 25 30

Glu Ser Asn Gln Glu Arg Gly Ala Arg Ala Arg Leu

35 40

<210> 104

<211> 58

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 抑肽酶

<400> 104

Arg Pro Asp Phe Cys Leu Glu Pro Pro Tyr Thr Gly Pro Cys Lys Ala

1 5 10 15

Arg Ile Ile Arg Tyr Phe Tyr Asn Ala Lys Ala Gly Leu Cys Gln Thr

20 25 30

Phe Val Tyr Gly Gly Cys Arg Ala Lys Arg Asn Asn Phe Lys Ser Ala

35 40 45

Glu Asp Cys Met Arg Thr Cys Gly Gly Ala

50 55

<210> 105

<211> 9

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 加压素

<400> 105

Cys Tyr Phe Gln Asn Cys Pro Arg Gly

1 5

<210> 106

<211> 9

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 催产素

<400> 106

Cys Tyr Ile Gln Asn Cys Pro Leu Gly

1 5

<210> 107

<211> 21

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 胰岛素链A

<400> 107

Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu

1 5 10 15

Glu Asn Tyr Cys Asn

20

<210> 108

<211> 30

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 胰岛素链B

<400> 108

Phe Val Asn Gln His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr

1 5 10 15

Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr

20 25 30

<210> 109

<211> 37

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 普兰利肽

<400> 109

Lys Cys Asn Thr Ala Thr Cys Ala Thr Gln Arg Leu Ala Asn Phe Leu

1 5 10 15

Val His Ser Ser Asn Asn Phe Gly Pro Ile Leu Pro Pro Thr Asn Val

20 25 30

Gly Ser Asn Thr Tyr

35

<210> 110

<211> 32

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 利拉鲁肽

<400> 110

His Ala Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly

1 5 10 15

Gln Ala Ala Lys Glu Glu Phe Ile Ala Trp Leu Val Arg Gly Arg Gly

20 25 30

<210> 111

<211> 23

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> ACE2α 1螺旋肽

<400> 111

Ile Glu Glu Gln Ala Lys Thr Phe Leu Asp Lys Phe Asn His Glu Ala

1 5 10 15

Glu Asp Leu Phe Tyr Gln Ser

20

<210> 112

<211> 20

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 西那普肽

<400> 112

Lys Leu Leu Leu Leu Lys Leu Leu Leu Leu Lys Leu Leu Leu Leu Lys

1 5 10 15

Leu Leu Leu Leu

20

<210> 113

<211> 28

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 胸腺法新

<400> 113

Ser Asp Ala Ala Val Asp Thr Ser Ser Glu Ile Thr Thr Lys Asp Leu

1 5 10 15

Lys Glu Lys Lys Glu Val Val Glu Glu Ala Glu Asn

20 25

<210> 114

<211> 21

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 载脂蛋白B合成肽

<400> 114

Lys Tyr Tyr Glu Leu Glu Glu Lys Ile Val Ser Leu Ile Lys Asn Leu

1 5 10 15

Leu Val Ala Leu Lys

20

<210> 115

<211> 30

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 甘丙肽

<400> 115

Gly Trp Thr Leu Asn Ser Ala Gly Tyr Leu Leu Gly Pro His Ala Val

1 5 10 15

Gly Asn His Arg Ser Phe Ser Asp Lys Asn Gly Leu Thr Ser

20 25 30

<210> 116

<211> 29

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> Tau肽(45-73) (外显子2/插入1结构域)

<400> 116

Glu Ser Pro Leu Gln Thr Pro Thr Glu Asp Gly Ser Glu Glu Pro Gly

1 5 10 15

Ser Glu Thr Ser Asp Ala Lys Ser Thr Pro Thr Ala Glu

20 25

<210> 117

<211> 20

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 比伐卢定

<400> 117

Phe Pro Arg Pro Gly Gly Gly Gly Asn Gly Asp Phe Glu Glu Ile Pro

1 5 10 15

Glu Glu Tyr Leu

20

<210> 118

<211> 36

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 恩夫韦肽

<400> 118

Tyr Thr Ser Leu Ile His Ser Leu Ile Glu Glu Ser Gln Asn Gln Gln

1 5 10 15

Glu Lys Asn Glu Gln Glu Leu Leu Glu Leu Asp Lys Trp Ala Ser Leu

20 25 30

Trp Asn Trp Phe

35

<210> 119

<211> 27

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 促胰液素

<400> 119

His Ser Asp Gly Thr Phe Thr Ser Glu Leu Ser Arg Leu Arg Asp Ser

1 5 10 15

Ala Arg Leu Gln Arg Leu Leu Gln Gly Leu Val

20 25

<210> 120

<211> 16

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 短杆菌素D

<220>

<221> misc_feature

<222> (16)..(16)

<223> Xaa可以是任何天然存在的氨基酸

<400> 120

Val Gly Ala Leu Ala Val Val Val Trp Leu Trp Leu Trp Leu Trp Xaa

1 5 10 15

<210> 121

<211> 52

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 格拉默

<400> 121

Glu Ala Tyr Lys Ala Ala Glu Lys Ala Tyr Ala Ala Lys Glu Ala Ala

1 5 10 15

Lys Glu Ala Ala Lys Ala Lys Ala Glu Lys Lys Ala Ala Tyr Ala Lys

20 25 30

Ala Lys Ala Ala Lys Tyr Glu Lys Lys Ala Lys Lys Ala Ala Ala Glu

35 40 45

Tyr Lys Lys Lys

50

<210> 122

<211> 127

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 硫氧还蛋白标签

<400> 122

Met Ile Ala Pro Ile Leu Asp Glu Ile Ala Asp Glu Tyr Gln Gly Lys

1 5 10 15

Leu Thr Val Ala Lys Leu Asn Ile Asp Gln Asn Pro Gly Thr Ala Pro

20 25 30

Lys Tyr Gly Ile Arg Gly Ile Pro Thr Leu Leu Leu Phe Lys Asn Gly

35 40 45

Glu Val Ala Ala Thr Lys Val Gly Ala Leu Ser Lys Gly Gln Leu Lys

50 55 60

Glu Phe Leu Asp Ala Asn Leu Ala Gly Ser Gly Ser Gly His Met His

65 70 75 80

His His His His Ser Ser Gly Leu Val Pro Arg Gly Ser Gly Met Lys

85 90 95

Glu Thr Ala Ala Ala Lys Phe Glu Arg Gln His Met Asp Ser Pro Asp

100 105 110

Leu Gly Thr Asp Asp Asp Asp Lys Ala Met Ala Asp Ile Gly Ser

115 120 125

<210> 123

<211> 6

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> His6标签

<400> 123

His His His His His His

1 5

<210> 124

<211> 26

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> His标签

<400> 124

Met His His His His His His Ala Leu Trp Met Arg Leu Leu Pro Leu

1 5 10 15

Leu Ala Leu Leu Ala Leu Trp Gly Pro Asp

20 25

<210> 125

<211> 134

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 重组多肽

<400> 125

His Ser Gln Gly Thr Phe Thr Ser Asp Tyr Ser Lys Tyr Leu Asp Ser

1 5 10 15

Arg Arg Ala Gln Asp Phe Val Gln Trp Leu Met Asn Thr Cys Gly Asp

20 25 30

Glu Val Asp His Ser Gln Gly Thr Phe Thr Ser Asp Tyr Ser Lys Tyr

35 40 45

Leu Asp Ser Arg Arg Ala Gln Asp Phe Val Gln Trp Leu Met Asn Thr

50 55 60

Cys Gly Asp Glu Val Asp His Ser Gln Gly Thr Phe Thr Ser Asp Tyr

65 70 75 80

Ser Lys Tyr Leu Asp Ser Arg Arg Ala Gln Asp Phe Val Gln Trp Leu

85 90 95

Met Asn Thr Cys Gly Asp Glu Val Asp His Ser Gln Gly Thr Phe Thr

100 105 110

Ser Asp Tyr Ser Lys Tyr Leu Asp Ser Arg Arg Ala Gln Asp Phe Val

115 120 125

Gln Trp Leu Met Asn Thr

130

<210> 126

<211> 266

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 重组多肽

<400> 126

Met Ile Ala Pro Ile Leu Asp Glu Ile Ala Asp Glu Tyr Gln Gly Lys

1 5 10 15

Leu Thr Val Ala Lys Leu Asn Ile Asp Gln Asn Pro Gly Thr Ala Pro

20 25 30

Lys Tyr Gly Ile Arg Gly Ile Pro Thr Leu Leu Leu Phe Lys Asn Gly

35 40 45

Glu Val Ala Ala Thr Lys Val Gly Ala Leu Ser Lys Gly Gln Leu Lys

50 55 60

Glu Phe Leu Asp Ala Asn Leu Ala Gly Ser Gly Ser Gly His Met His

65 70 75 80

His His His His Ser Ser Gly Leu Val Pro Arg Gly Ser Gly Met Lys

85 90 95

Glu Thr Ala Ala Ala Lys Phe Glu Arg Gln His Met Asp Ser Pro Asp

100 105 110

Leu Gly Thr Asp Asp Asp Asp Lys Ala Met Ala Asp Ile Gly Ser Gly

115 120 125

Asp Glu Val Asp His Ser Gln Gly Thr Phe Thr Ser Asp Tyr Ser Lys

130 135 140

Tyr Leu Asp Ser Arg Arg Ala Gln Asp Phe Val Gln Trp Leu Met Asn

145 150 155 160

Thr Cys Gly Asp Glu Val Asp His Ser Gln Gly Thr Phe Thr Ser Asp

165 170 175

Tyr Ser Lys Tyr Leu Asp Ser Arg Arg Ala Gln Asp Phe Val Gln Trp

180 185 190

Leu Met Asn Thr Cys Gly Asp Glu Val Asp His Ser Gln Gly Thr Phe

195 200 205

Thr Ser Asp Tyr Ser Lys Tyr Leu Asp Ser Arg Arg Ala Gln Asp Phe

210 215 220

Val Gln Trp Leu Met Asn Thr Cys Gly Asp Glu Val Asp His Ser Gln

225 230 235 240

Gly Thr Phe Thr Ser Asp Tyr Ser Lys Tyr Leu Asp Ser Arg Arg Ala

245 250 255

Gln Asp Phe Val Gln Trp Leu Met Asn Thr

260 265

<210> 127

<211> 5

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 包含接头和蛋白酶识别位点的肽

<400> 127

Gly Asp Glu Val Asp

1 5

<210> 128

<211> 6

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 包含接头和蛋白酶识别位点的肽

<400> 128

Cys Gly Asp Glu Val Asp

1 5

<210> 129

<211> 140

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 重组多肽

<400> 129

His Ser Gln Gly Thr Phe Thr Ser Asp Tyr Ser Lys Tyr Leu Asp Ser

1 5 10 15

Arg Arg Ala Gln Asp Phe Val Gln Trp Leu Met Asn Thr Pro His Gly

20 25 30

Gly Asp Glu Val Asp His Ser Gln Gly Thr Phe Thr Ser Asp Tyr Ser

35 40 45

Lys Tyr Leu Asp Ser Arg Arg Ala Gln Asp Phe Val Gln Trp Leu Met

50 55 60

Asn Thr Pro His Gly Gly Asp Glu Val Asp His Ser Gln Gly Thr Phe

65 70 75 80

Thr Ser Asp Tyr Ser Lys Tyr Leu Asp Ser Arg Arg Ala Gln Asp Phe

85 90 95

Val Gln Trp Leu Met Asn Thr Pro His Gly Gly Asp Glu Val Asp His

100 105 110

Ser Gln Gly Thr Phe Thr Ser Asp Tyr Ser Lys Tyr Leu Asp Ser Arg

115 120 125

Arg Ala Gln Asp Phe Val Gln Trp Leu Met Asn Thr

130 135 140

<210> 130

<211> 272

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 重组多肽

<400> 130

Met Ile Ala Pro Ile Leu Asp Glu Ile Ala Asp Glu Tyr Gln Gly Lys

1 5 10 15

Leu Thr Val Ala Lys Leu Asn Ile Asp Gln Asn Pro Gly Thr Ala Pro

20 25 30

Lys Tyr Gly Ile Arg Gly Ile Pro Thr Leu Leu Leu Phe Lys Asn Gly

35 40 45

Glu Val Ala Ala Thr Lys Val Gly Ala Leu Ser Lys Gly Gln Leu Lys

50 55 60

Glu Phe Leu Asp Ala Asn Leu Ala Gly Ser Gly Ser Gly His Met His

65 70 75 80

His His His His Ser Ser Gly Leu Val Pro Arg Gly Ser Gly Met Lys

85 90 95

Glu Thr Ala Ala Ala Lys Phe Glu Arg Gln His Met Asp Ser Pro Asp

100 105 110

Leu Gly Thr Asp Asp Asp Asp Lys Ala Met Ala Asp Ile Gly Ser Gly

115 120 125

Asp Glu Val Asp His Ser Gln Gly Thr Phe Thr Ser Asp Tyr Ser Lys

130 135 140

Tyr Leu Asp Ser Arg Arg Ala Gln Asp Phe Val Gln Trp Leu Met Asn

145 150 155 160

Thr Pro His Gly Gly Asp Glu Val Asp His Ser Gln Gly Thr Phe Thr

165 170 175

Ser Asp Tyr Ser Lys Tyr Leu Asp Ser Arg Arg Ala Gln Asp Phe Val

180 185 190

Gln Trp Leu Met Asn Thr Pro His Gly Gly Asp Glu Val Asp His Ser

195 200 205

Gln Gly Thr Phe Thr Ser Asp Tyr Ser Lys Tyr Leu Asp Ser Arg Arg

210 215 220

Ala Gln Asp Phe Val Gln Trp Leu Met Asn Thr Pro His Gly Gly Asp

225 230 235 240

Glu Val Asp His Ser Gln Gly Thr Phe Thr Ser Asp Tyr Ser Lys Tyr

245 250 255

Leu Asp Ser Arg Arg Ala Gln Asp Phe Val Gln Trp Leu Met Asn Thr

260 265 270

<210> 131

<211> 8

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 包含接头和化学裂解位点的肽

<400> 131

Pro His Gly Gly Asp Glu Val Asp

1 5

<210> 132

<211> 143

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 重组多肽

<400> 132

His Ser Gln Gly Thr Phe Thr Ser Asp Tyr Ser Lys Tyr Leu Asp Ser

1 5 10 15

Arg Arg Ala Gln Asp Phe Val Gln Trp Leu Met Asn Thr Ser Arg His

20 25 30

Trp Gly Asp Glu Val Asp His Ser Gln Gly Thr Phe Thr Ser Asp Tyr

35 40 45

Ser Lys Tyr Leu Asp Ser Arg Arg Ala Gln Asp Phe Val Gln Trp Leu

50 55 60

Met Asn Thr Ser Arg His Trp Gly Asp Glu Val Asp His Ser Gln Gly

65 70 75 80

Thr Phe Thr Ser Asp Tyr Ser Lys Tyr Leu Asp Ser Arg Arg Ala Gln

85 90 95

Asp Phe Val Gln Trp Leu Met Asn Thr Ser Arg His Trp Gly Asp Glu

100 105 110

Val Asp His Ser Gln Gly Thr Phe Thr Ser Asp Tyr Ser Lys Tyr Leu

115 120 125

Asp Ser Arg Arg Ala Gln Asp Phe Val Gln Trp Leu Met Asn Thr

130 135 140

<210> 133

<211> 275

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 重组多肽

<400> 133

Met Ile Ala Pro Ile Leu Asp Glu Ile Ala Asp Glu Tyr Gln Gly Lys

1 5 10 15

Leu Thr Val Ala Lys Leu Asn Ile Asp Gln Asn Pro Gly Thr Ala Pro

20 25 30

Lys Tyr Gly Ile Arg Gly Ile Pro Thr Leu Leu Leu Phe Lys Asn Gly

35 40 45

Glu Val Ala Ala Thr Lys Val Gly Ala Leu Ser Lys Gly Gln Leu Lys

50 55 60

Glu Phe Leu Asp Ala Asn Leu Ala Gly Ser Gly Ser Gly His Met His

65 70 75 80

His His His His Ser Ser Gly Leu Val Pro Arg Gly Ser Gly Met Lys

85 90 95

Glu Thr Ala Ala Ala Lys Phe Glu Arg Gln His Met Asp Ser Pro Asp

100 105 110

Leu Gly Thr Asp Asp Asp Asp Lys Ala Met Ala Asp Ile Gly Ser Gly

115 120 125

Asp Glu Val Asp His Ser Gln Gly Thr Phe Thr Ser Asp Tyr Ser Lys

130 135 140

Tyr Leu Asp Ser Arg Arg Ala Gln Asp Phe Val Gln Trp Leu Met Asn

145 150 155 160

Thr Ser Arg His Trp Gly Asp Glu Val Asp His Ser Gln Gly Thr Phe

165 170 175

Thr Ser Asp Tyr Ser Lys Tyr Leu Asp Ser Arg Arg Ala Gln Asp Phe

180 185 190

Val Gln Trp Leu Met Asn Thr Ser Arg His Trp Gly Asp Glu Val Asp

195 200 205

His Ser Gln Gly Thr Phe Thr Ser Asp Tyr Ser Lys Tyr Leu Asp Ser

210 215 220

Arg Arg Ala Gln Asp Phe Val Gln Trp Leu Met Asn Thr Ser Arg His

225 230 235 240

Trp Gly Asp Glu Val Asp His Ser Gln Gly Thr Phe Thr Ser Asp Tyr

245 250 255

Ser Lys Tyr Leu Asp Ser Arg Arg Ala Gln Asp Phe Val Gln Trp Leu

260 265 270

Met Asn Thr

275

<210> 134

<211> 9

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 包含接头和化学裂解位点的肽

<400> 134

Ser Arg His Trp Gly Asp Glu Val Asp

1 5

<210> 135

<211> 146

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 重组多肽

<400> 135

His Ala Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly

1 5 10 15

Gln Ala Ala Lys Glu Glu Phe Ile Ala Trp Leu Val Arg Gly Arg Gly

20 25 30

Arg Arg Gly Ser Lys Arg His Ala Glu Gly Thr Phe Thr Ser Asp Val

35 40 45

Ser Ser Tyr Leu Glu Gly Gln Ala Ala Lys Glu Glu Phe Ile Ala Trp

50 55 60

Leu Val Arg Gly Arg Gly Arg Arg Gly Ser Arg Arg His Ala Glu Gly

65 70 75 80

Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly Gln Ala Ala Lys

85 90 95

Glu Glu Phe Ile Ala Trp Leu Val Arg Gly Arg Gly Arg Arg Gly Ser

100 105 110

Lys Arg His Ala Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu

115 120 125

Glu Gly Gln Ala Ala Lys Glu Glu Phe Ile Ala Trp Leu Val Arg Gly

130 135 140

Arg Gly

145

<210> 136

<211> 276

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 重组多肽

<400> 136

Met Ile Ala Pro Ile Leu Asp Glu Ile Ala Asp Glu Tyr Gln Gly Lys

1 5 10 15

Leu Thr Val Ala Lys Leu Asn Ile Asp Gln Asn Pro Gly Thr Ala Pro

20 25 30

Lys Tyr Gly Ile Arg Gly Ile Pro Thr Leu Leu Leu Phe Lys Asn Gly

35 40 45

Glu Val Ala Ala Thr Lys Val Gly Ala Leu Ser Lys Gly Gln Leu Lys

50 55 60

Glu Phe Leu Asp Ala Asn Leu Ala Gly Ser Gly Ser Gly His Met His

65 70 75 80

His His His His Ser Ser Gly Leu Val Pro Arg Gly Ser Gly Met Lys

85 90 95

Glu Thr Ala Ala Ala Lys Phe Glu Arg Gln His Met Asp Ser Pro Asp

100 105 110

Leu Gly Thr Asp Asp Asp Asp Lys Ala Met Ala Asp Ile Gly Ser Gly

115 120 125

Arg Arg His Ala Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu

130 135 140

Glu Gly Gln Ala Ala Lys Glu Glu Phe Ile Ala Trp Leu Val Arg Gly

145 150 155 160

Arg Gly Arg Arg Gly Ser Lys Arg His Ala Glu Gly Thr Phe Thr Ser

165 170 175

Asp Val Ser Ser Tyr Leu Glu Gly Gln Ala Ala Lys Glu Glu Phe Ile

180 185 190

Ala Trp Leu Val Arg Gly Arg Gly Arg Arg Gly Ser Arg Arg His Ala

195 200 205

Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly Gln Ala

210 215 220

Ala Lys Glu Glu Phe Ile Ala Trp Leu Val Arg Gly Arg Gly Arg Arg

225 230 235 240

Gly Ser Lys Arg His Ala Glu Gly Thr Phe Thr Ser Asp Val Ser Ser

245 250 255

Tyr Leu Glu Gly Gln Ala Ala Lys Glu Glu Phe Ile Ala Trp Leu Val

260 265 270

Arg Gly Arg Gly

275

<210> 137

<211> 6

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 包含接头和蛋白酶识别位点的肽

<400> 137

Arg Arg Gly Ser Lys Arg

1 5

<210> 138

<211> 152

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 重组多肽

<400> 138

His Ala Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly

1 5 10 15

Gln Ala Ala Lys Glu Glu Phe Ile Ala Trp Leu Val Arg Gly Arg Gly

20 25 30

Pro His Gly Gly Asp Glu Val Asp His Ala Glu Gly Thr Phe Thr Ser

35 40 45

Asp Val Ser Ser Tyr Leu Glu Gly Gln Ala Ala Lys Glu Glu Phe Ile

50 55 60

Ala Trp Leu Val Arg Gly Arg Gly Pro His Gly Gly Asp Glu Val Asp

65 70 75 80

His Ala Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly

85 90 95

Gln Ala Ala Lys Glu Glu Phe Ile Ala Trp Leu Val Arg Gly Arg Gly

100 105 110

Pro His Gly Gly Asp Glu Val Asp His Ala Glu Gly Thr Phe Thr Ser

115 120 125

Asp Val Ser Ser Tyr Leu Glu Gly Gln Ala Ala Lys Glu Glu Phe Ile

130 135 140

Ala Trp Leu Val Arg Gly Arg Gly

145 150

<210> 139

<211> 284

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 重组多肽

<400> 139

Met Ile Ala Pro Ile Leu Asp Glu Ile Ala Asp Glu Tyr Gln Gly Lys

1 5 10 15

Leu Thr Val Ala Lys Leu Asn Ile Asp Gln Asn Pro Gly Thr Ala Pro

20 25 30

Lys Tyr Gly Ile Arg Gly Ile Pro Thr Leu Leu Leu Phe Lys Asn Gly

35 40 45

Glu Val Ala Ala Thr Lys Val Gly Ala Leu Ser Lys Gly Gln Leu Lys

50 55 60

Glu Phe Leu Asp Ala Asn Leu Ala Gly Ser Gly Ser Gly His Met His

65 70 75 80

His His His His Ser Ser Gly Leu Val Pro Arg Gly Ser Gly Met Lys

85 90 95

Glu Thr Ala Ala Ala Lys Phe Glu Arg Gln His Met Asp Ser Pro Asp

100 105 110

Leu Gly Thr Asp Asp Asp Asp Lys Ala Met Ala Asp Ile Gly Ser Gly

115 120 125

Asp Glu Val Asp His Ala Glu Gly Thr Phe Thr Ser Asp Val Ser Ser

130 135 140

Tyr Leu Glu Gly Gln Ala Ala Lys Glu Glu Phe Ile Ala Trp Leu Val

145 150 155 160

Arg Gly Arg Gly Pro His Gly Gly Asp Glu Val Asp His Ala Glu Gly

165 170 175

Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly Gln Ala Ala Lys

180 185 190

Glu Glu Phe Ile Ala Trp Leu Val Arg Gly Arg Gly Pro His Gly Gly

195 200 205

Asp Glu Val Asp His Ala Glu Gly Thr Phe Thr Ser Asp Val Ser Ser

210 215 220

Tyr Leu Glu Gly Gln Ala Ala Lys Glu Glu Phe Ile Ala Trp Leu Val

225 230 235 240

Arg Gly Arg Gly Pro His Gly Gly Asp Glu Val Asp His Ala Glu Gly

245 250 255

Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly Gln Ala Ala Lys

260 265 270

Glu Glu Phe Ile Ala Trp Leu Val Arg Gly Arg Gly

275 280

<210> 140

<211> 40

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 中间肽

<400> 140

His Ala Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly

1 5 10 15

Gln Ala Ala Lys Glu Glu Phe Ile Ala Trp Leu Val Arg Gly Arg Gly

20 25 30

Pro His Gly Gly Asp Glu Val Asp

35 40

<210> 141

<211> 129

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 重组多肽

<400> 141

Phe Val Asn Gln His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr

1 5 10 15

Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr Ser Arg

20 25 30

His Trp Gly Asp Glu Val Asp Phe Val Asn Gln His Leu Cys Gly Ser

35 40 45

His Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe Phe

50 55 60

Tyr Thr Pro Lys Thr Ser Arg His Trp Gly Asp Glu Val Asp Gly Ile

65 70 75 80

Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu Glu Asn

85 90 95

Tyr Cys Asn Ser Arg His Trp Gly Asp Glu Val Asp Gly Ile Val Glu

100 105 110

Gln Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu Glu Asn Tyr Cys

115 120 125

Asn

<210> 142

<211> 120

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 重组多肽

<400> 142

Phe Val Asn Gln His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr

1 5 10 15

Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr Arg Arg

20 25 30

Gly Ser Lys Arg Phe Val Asn Gln His Leu Cys Gly Ser His Leu Val

35 40 45

Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro

50 55 60

Lys Thr Arg Arg Gly Ser Arg Arg Gly Ile Val Glu Gln Cys Cys Thr

65 70 75 80

Ser Ile Cys Ser Leu Tyr Gln Leu Glu Asn Tyr Cys Asn Arg Arg Gly

85 90 95

Ser Lys Arg Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu

100 105 110

Tyr Gln Leu Glu Asn Tyr Cys Asn

115 120

<210> 143

<211> 32

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 中间肽

<400> 143

Phe Val Asn Gln His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr

1 5 10 15

Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr Arg Arg

20 25 30

<210> 144

<211> 23

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 中间肽

<400> 144

Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu

1 5 10 15

Glu Asn Tyr Cys Asn Arg Arg

20

<210> 145

<211> 154

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 重组多肽

<400> 145

Gly Asp Glu Val Asp His Ala Glu Gly Thr Phe Thr Ser Asp Val Ser

1 5 10 15

Ser Tyr Leu Glu Gly Gln Ala Ala Lys Glu Glu Phe Ile Ala Trp Leu

20 25 30

Val Arg Gly Arg Gly Pro Gly Gly Asp Glu Val Asp His Ala Glu Gly

35 40 45

Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly Gln Ala Ala Lys

50 55 60

Glu Glu Phe Ile Ala Trp Leu Val Arg Gly Arg Gly Pro Gly Gly Asp

65 70 75 80

Glu Val Asp His Ala Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr

85 90 95

Leu Glu Gly Gln Ala Ala Lys Glu Glu Phe Ile Ala Trp Leu Val Arg

100 105 110

Gly Arg Gly Pro Gly Gly Asp Glu Val Asp His Ala Glu Gly Thr Phe

115 120 125

Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly Gln Ala Ala Lys Glu Glu

130 135 140

Phe Ile Ala Trp Leu Val Arg Gly Arg Gly

145 150

<210> 146

<211> 7

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 包含接头和蛋白酶识别位点的肽

<400> 146

Pro Gly Gly Asp Glu Val Asp

1 5

<210> 147

<211> 39

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 中间肽

<400> 147

His Ala Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly

1 5 10 15

Gln Ala Ala Lys Glu Glu Phe Ile Ala Trp Leu Val Arg Gly Arg Gly

20 25 30

Pro Gly Gly Asp Glu Val Asp

35

<210> 148

<211> 145

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 重组多肽

<400> 148

Arg Arg His Ala Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu

1 5 10 15

Glu Gly Gln Ala Ala Lys Glu Glu Phe Ile Ala Trp Leu Val Arg Gly

20 25 30

Arg Gly Pro Gly Gly Arg Arg His Ala Glu Gly Thr Phe Thr Ser Asp

35 40 45

Val Ser Ser Tyr Leu Glu Gly Gln Ala Ala Lys Glu Glu Phe Ile Ala

50 55 60

Trp Leu Val Arg Gly Arg Gly Pro Gly Gly Lys Arg His Ala Glu Gly

65 70 75 80

Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly Gln Ala Ala Lys

85 90 95

Glu Glu Phe Ile Ala Trp Leu Val Arg Gly Arg Gly Pro Gly Gly Arg

100 105 110

Arg His Ala Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu

115 120 125

Gly Gln Ala Ala Lys Glu Glu Phe Ile Ala Trp Leu Val Arg Gly Arg

130 135 140

Gly

145

<210> 149

<211> 5

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 包含接头和蛋白酶识别位点的肽

<400> 149

Pro Gly Gly Arg Arg

1 5

<210> 150

<211> 5

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 包含接头和蛋白酶识别位点的肽

<400> 150

Pro Gly Gly Lys Arg

1 5

<210> 151

<211> 37

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 中间肽

<400> 151

His Ala Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly

1 5 10 15

Gln Ala Ala Lys Glu Glu Phe Ile Ala Trp Leu Val Arg Gly Arg Gly

20 25 30

Pro Gly Gly Lys Arg

35

<210> 152

<211> 37

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 中间肽

<400> 152

His Ala Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly

1 5 10 15

Gln Ala Ala Lys Glu Glu Phe Ile Ala Trp Leu Val Arg Gly Arg Gly

20 25 30

Pro Gly Gly Arg Arg

35

<210> 153

<211> 157

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 重组多肽

<400> 153

Asp Asp Asp Asp Lys His Ala Glu Gly Thr Phe Thr Ser Asp Val Ser

1 5 10 15

Ser Tyr Leu Glu Gly Gln Ala Ala Lys Glu Glu Phe Ile Ala Trp Leu

20 25 30

Val Arg Gly Arg Gly Pro Gly Gly Asp Asp Asp Asp Lys His Ala Glu

35 40 45

Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly Gln Ala Ala

50 55 60

Lys Glu Glu Phe Ile Ala Trp Leu Val Arg Gly Arg Gly Pro Gly Gly

65 70 75 80

Asp Asp Asp Asp Lys His Ala Glu Gly Thr Phe Thr Ser Asp Val Ser

85 90 95

Ser Tyr Leu Glu Gly Gln Ala Ala Lys Glu Glu Phe Ile Ala Trp Leu

100 105 110

Val Arg Gly Arg Gly Pro Gly Gly Asp Asp Asp Asp Lys His Ala Glu

115 120 125

Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly Gln Ala Ala

130 135 140

Lys Glu Glu Phe Ile Ala Trp Leu Val Arg Gly Arg Gly

145 150 155

<210> 154

<211> 8

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 包含接头和蛋白酶识别位点的肽

<400> 154

Pro Gly Gly Asp Asp Asp Asp Lys

1 5

<210> 155

<211> 40

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 中间肽

<400> 155

His Ala Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly

1 5 10 15

Gln Ala Ala Lys Glu Glu Phe Ile Ala Trp Leu Val Arg Gly Arg Gly

20 25 30

Pro Gly Gly Asp Asp Asp Asp Lys

35 40

<210> 156

<211> 234

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 重组多肽

<400> 156

Met His His His His His His Ala Leu Trp Met Arg Leu Leu Pro Leu

1 5 10 15

Leu Ala Leu Leu Ala Leu Trp Gly Pro Asp Asp Glu Val Asp Phe Val

20 25 30

Asn Gln His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr Leu Val

35 40 45

Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr Arg Arg Glu Ala

50 55 60

Glu Asp Leu Gln Val Gly Gln Val Glu Leu Gly Gly Gly Pro Gly Ala

65 70 75 80

Gly Ser Leu Gln Pro Leu Ala Leu Glu Gly Ser Leu Gln Lys Arg Gly

85 90 95

Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu Glu

100 105 110

Asn Tyr Cys Asn Arg Arg Gly Ala Gly Ala Gly Ala Met Ala Leu Trp

115 120 125

Met Arg Leu Leu Pro Leu Leu Ala Leu Leu Ala Leu Trp Gly Pro Asp

130 135 140

Asp Glu Val Asp Phe Val Asn Gln His Leu Cys Gly Ser His Leu Val

145 150 155 160

Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro

165 170 175

Lys Thr Arg Arg Glu Ala Glu Asp Leu Gln Val Gly Gln Val Glu Leu

180 185 190

Gly Gly Gly Pro Gly Ala Gly Ser Leu Gln Pro Leu Ala Leu Glu Gly

195 200 205

Ser Leu Gln Lys Arg Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys

210 215 220

Ser Leu Tyr Gln Leu Glu Asn Tyr Cys Asn

225 230

<210> 157

<211> 352

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 重组多肽

<400> 157

Met His His His His His His Ala Leu Trp Met Arg Leu Leu Pro Leu

1 5 10 15

Leu Ala Leu Leu Ala Leu Trp Gly Pro Asp Asp Glu Val Asp Phe Val

20 25 30

Asn Gln His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr Leu Val

35 40 45

Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr Arg Arg Glu Ala

50 55 60

Glu Asp Leu Gln Val Gly Gln Val Glu Leu Gly Gly Gly Pro Gly Ala

65 70 75 80

Gly Ser Leu Gln Pro Leu Ala Leu Glu Gly Ser Leu Gln Lys Arg Gly

85 90 95

Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu Glu

100 105 110

Asn Tyr Cys Asn Arg Arg Gly Ala Gly Ala Gly Ala Met Ala Leu Trp

115 120 125

Met Arg Leu Leu Pro Leu Leu Ala Leu Leu Ala Leu Trp Gly Pro Asp

130 135 140

Asp Glu Val Asp Phe Val Asn Gln His Leu Cys Gly Ser His Leu Val

145 150 155 160

Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro

165 170 175

Lys Thr Arg Arg Glu Ala Glu Asp Leu Gln Val Gly Gln Val Glu Leu

180 185 190

Gly Gly Gly Pro Gly Ala Gly Ser Leu Gln Pro Leu Ala Leu Glu Gly

195 200 205

Ser Leu Gln Lys Arg Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys

210 215 220

Ser Leu Tyr Gln Leu Glu Asn Tyr Cys Asn Arg Arg Gly Ala Gly Ala

225 230 235 240

Gly Ala Met Ala Leu Trp Met Arg Leu Leu Pro Leu Leu Ala Leu Leu

245 250 255

Ala Leu Trp Gly Pro Asp Asp Glu Val Asp Phe Val Asn Gln His Leu

260 265 270

Cys Gly Ser His Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg

275 280 285

Gly Phe Phe Tyr Thr Pro Lys Thr Arg Arg Glu Ala Glu Asp Leu Gln

290 295 300

Val Gly Gln Val Glu Leu Gly Gly Gly Pro Gly Ala Gly Ser Leu Gln

305 310 315 320

Pro Leu Ala Leu Glu Gly Ser Leu Gln Lys Arg Gly Ile Val Glu Gln

325 330 335

Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu Glu Asn Tyr Cys Asn

340 345 350

<210> 158

<211> 470

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 重组多肽

<400> 158

Met His His His His His His Ala Leu Trp Met Arg Leu Leu Pro Leu

1 5 10 15

Leu Ala Leu Leu Ala Leu Trp Gly Pro Asp Asp Glu Val Asp Phe Val

20 25 30

Asn Gln His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr Leu Val

35 40 45

Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr Arg Arg Glu Ala

50 55 60

Glu Asp Leu Gln Val Gly Gln Val Glu Leu Gly Gly Gly Pro Gly Ala

65 70 75 80

Gly Ser Leu Gln Pro Leu Ala Leu Glu Gly Ser Leu Gln Lys Arg Gly

85 90 95

Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu Glu

100 105 110

Asn Tyr Cys Asn Arg Arg Gly Ala Gly Ala Gly Ala Met Ala Leu Trp

115 120 125

Met Arg Leu Leu Pro Leu Leu Ala Leu Leu Ala Leu Trp Gly Pro Asp

130 135 140

Asp Glu Val Asp Phe Val Asn Gln His Leu Cys Gly Ser His Leu Val

145 150 155 160

Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro

165 170 175

Lys Thr Arg Arg Glu Ala Glu Asp Leu Gln Val Gly Gln Val Glu Leu

180 185 190

Gly Gly Gly Pro Gly Ala Gly Ser Leu Gln Pro Leu Ala Leu Glu Gly

195 200 205

Ser Leu Gln Lys Arg Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys

210 215 220

Ser Leu Tyr Gln Leu Glu Asn Tyr Cys Asn Arg Arg Gly Ala Gly Ala

225 230 235 240

Gly Ala Met Ala Leu Trp Met Arg Leu Leu Pro Leu Leu Ala Leu Leu

245 250 255

Ala Leu Trp Gly Pro Asp Asp Glu Val Asp Phe Val Asn Gln His Leu

260 265 270

Cys Gly Ser His Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg

275 280 285

Gly Phe Phe Tyr Thr Pro Lys Thr Arg Arg Glu Ala Glu Asp Leu Gln

290 295 300

Val Gly Gln Val Glu Leu Gly Gly Gly Pro Gly Ala Gly Ser Leu Gln

305 310 315 320

Pro Leu Ala Leu Glu Gly Ser Leu Gln Lys Arg Gly Ile Val Glu Gln

325 330 335

Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu Glu Asn Tyr Cys Asn

340 345 350

Arg Arg Gly Ala Gly Ala Gly Ala Met Ala Leu Trp Met Arg Leu Leu

355 360 365

Pro Leu Leu Ala Leu Leu Ala Leu Trp Gly Pro Asp Asp Glu Val Asp

370 375 380

Phe Val Asn Gln His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr

385 390 395 400

Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr Arg Arg

405 410 415

Glu Ala Glu Asp Leu Gln Val Gly Gln Val Glu Leu Gly Gly Gly Pro

420 425 430

Gly Ala Gly Ser Leu Gln Pro Leu Ala Leu Glu Gly Ser Leu Gln Lys

435 440 445

Arg Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln

450 455 460

Leu Glu Asn Tyr Cys Asn

465 470

<210> 159

<211> 824

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 重组多肽

<400> 159

Met His His His His His His Ala Leu Trp Met Arg Leu Leu Pro Leu

1 5 10 15

Leu Ala Leu Leu Ala Leu Trp Gly Pro Asp Asp Glu Val Asp Phe Val

20 25 30

Asn Gln His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr Leu Val

35 40 45

Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr Arg Arg Glu Ala

50 55 60

Glu Asp Leu Gln Val Gly Gln Val Glu Leu Gly Gly Gly Pro Gly Ala

65 70 75 80

Gly Ser Leu Gln Pro Leu Ala Leu Glu Gly Ser Leu Gln Lys Arg Gly

85 90 95

Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu Glu

100 105 110

Asn Tyr Cys Asn Arg Arg Gly Ala Gly Ala Gly Ala Met Ala Leu Trp

115 120 125

Met Arg Leu Leu Pro Leu Leu Ala Leu Leu Ala Leu Trp Gly Pro Asp

130 135 140

Asp Glu Val Asp Phe Val Asn Gln His Leu Cys Gly Ser His Leu Val

145 150 155 160

Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro

165 170 175

Lys Thr Arg Arg Glu Ala Glu Asp Leu Gln Val Gly Gln Val Glu Leu

180 185 190

Gly Gly Gly Pro Gly Ala Gly Ser Leu Gln Pro Leu Ala Leu Glu Gly

195 200 205

Ser Leu Gln Lys Arg Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys

210 215 220

Ser Leu Tyr Gln Leu Glu Asn Tyr Cys Asn Arg Arg Gly Ala Gly Ala

225 230 235 240

Gly Ala Met Ala Leu Trp Met Arg Leu Leu Pro Leu Leu Ala Leu Leu

245 250 255

Ala Leu Trp Gly Pro Asp Asp Glu Val Asp Phe Val Asn Gln His Leu

260 265 270

Cys Gly Ser His Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg

275 280 285

Gly Phe Phe Tyr Thr Pro Lys Thr Arg Arg Glu Ala Glu Asp Leu Gln

290 295 300

Val Gly Gln Val Glu Leu Gly Gly Gly Pro Gly Ala Gly Ser Leu Gln

305 310 315 320

Pro Leu Ala Leu Glu Gly Ser Leu Gln Lys Arg Gly Ile Val Glu Gln

325 330 335

Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu Glu Asn Tyr Cys Asn

340 345 350

Arg Arg Gly Ala Gly Ala Gly Ala Met Ala Leu Trp Met Arg Leu Leu

355 360 365

Pro Leu Leu Ala Leu Leu Ala Leu Trp Gly Pro Asp Asp Glu Val Asp

370 375 380

Phe Val Asn Gln His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr

385 390 395 400

Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr Arg Arg

405 410 415

Glu Ala Glu Asp Leu Gln Val Gly Gln Val Glu Leu Gly Gly Gly Pro

420 425 430

Gly Ala Gly Ser Leu Gln Pro Leu Ala Leu Glu Gly Ser Leu Gln Lys

435 440 445

Arg Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln

450 455 460

Leu Glu Asn Tyr Cys Asn Arg Arg Gly Ala Gly Ala Gly Ala Met Ala

465 470 475 480

Leu Trp Met Arg Leu Leu Pro Leu Leu Ala Leu Leu Ala Leu Trp Gly

485 490 495

Pro Asp Asp Glu Val Asp Phe Val Asn Gln His Leu Cys Gly Ser His

500 505 510

Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr

515 520 525

Thr Pro Lys Thr Arg Arg Glu Ala Glu Asp Leu Gln Val Gly Gln Val

530 535 540

Glu Leu Gly Gly Gly Pro Gly Ala Gly Ser Leu Gln Pro Leu Ala Leu

545 550 555 560

Glu Gly Ser Leu Gln Lys Arg Gly Ile Val Glu Gln Cys Cys Thr Ser

565 570 575

Ile Cys Ser Leu Tyr Gln Leu Glu Asn Tyr Cys Asn Arg Arg Gly Ala

580 585 590

Gly Ala Gly Ala Met Ala Leu Trp Met Arg Leu Leu Pro Leu Leu Ala

595 600 605

Leu Leu Ala Leu Trp Gly Pro Asp Asp Glu Val Asp Phe Val Asn Gln

610 615 620

His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr Leu Val Cys Gly

625 630 635 640

Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr Arg Arg Glu Ala Glu Asp

645 650 655

Leu Gln Val Gly Gln Val Glu Leu Gly Gly Gly Pro Gly Ala Gly Ser

660 665 670

Leu Gln Pro Leu Ala Leu Glu Gly Ser Leu Gln Lys Arg Gly Ile Val

675 680 685

Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu Glu Asn Tyr

690 695 700

Cys Asn Arg Arg Gly Ala Gly Ala Gly Ala Met Ala Leu Trp Met Arg

705 710 715 720

Leu Leu Pro Leu Leu Ala Leu Leu Ala Leu Trp Gly Pro Asp Asp Glu

725 730 735

Val Asp Phe Val Asn Gln His Leu Cys Gly Ser His Leu Val Glu Ala

740 745 750

Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr

755 760 765

Arg Arg Glu Ala Glu Asp Leu Gln Val Gly Gln Val Glu Leu Gly Gly

770 775 780

Gly Pro Gly Ala Gly Ser Leu Gln Pro Leu Ala Leu Glu Gly Ser Leu

785 790 795 800

Gln Lys Arg Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu

805 810 815

Tyr Gln Leu Glu Asn Tyr Cys Asn

820

<210> 160

<211> 62

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 中间肽

<400> 160

Met His His His His His His Ala Leu Trp Met Arg Leu Leu Pro Leu

1 5 10 15

Leu Ala Leu Leu Ala Leu Trp Gly Pro Asp Asp Glu Val Asp Phe Val

20 25 30

Asn Gln His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr Leu Val

35 40 45

Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr Arg Arg

50 55 60

<210> 161

<211> 62

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 中间肽

<400> 161

Gly Ala Gly Ala Gly Ala Met Ala Leu Trp Met Arg Leu Leu Pro Leu

1 5 10 15

Leu Ala Leu Leu Ala Leu Trp Gly Pro Asp Asp Glu Val Asp Phe Val

20 25 30

Asn Gln His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr Leu Val

35 40 45

Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr Arg Arg

50 55 60

<210> 162

<211> 60

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 中间肽

<400> 162

Met His His His His His His Ala Leu Trp Met Arg Leu Leu Pro Leu

1 5 10 15

Leu Ala Leu Leu Ala Leu Trp Gly Pro Asp Asp Glu Val Asp Phe Val

20 25 30

Asn Gln His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr Leu Val

35 40 45

Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr

50 55 60

<210> 163

<211> 60

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 中间肽

<400> 163

Gly Ala Gly Ala Gly Ala Met Ala Leu Trp Met Arg Leu Leu Pro Leu

1 5 10 15

Leu Ala Leu Leu Ala Leu Trp Gly Pro Asp Asp Glu Val Asp Phe Val

20 25 30

Asn Gln His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr Leu Val

35 40 45

Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr

50 55 60

<210> 164

<211> 153

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 重组多肽

<400> 164

Gly Arg Arg His His His His His His Asp Glu Val Asp Phe Val Asn

1 5 10 15

Gln His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr Leu Val Cys

20 25 30

Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr Arg Arg Gly His His

35 40 45

His His His His Asp Glu Val Asp Phe Val Asn Gln His Leu Cys Gly

50 55 60

Ser His Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe

65 70 75 80

Phe Tyr Thr Pro Lys Thr Arg Arg His His His His His His Asp Glu

85 90 95

Val Asp Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu Tyr

100 105 110

Gln Leu Glu Asn Tyr Cys Asn Arg Arg Gly His His His His His His

115 120 125

Asp Glu Val Asp Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser

130 135 140

Leu Tyr Gln Leu Glu Asn Tyr Cys Asn

145 150

<210> 165

<211> 153

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 重组多肽

<400> 165

Gly Arg Arg His His His His His His Asp Glu Val Asp Gly Ile Val

1 5 10 15

Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu Glu Asn Tyr

20 25 30

Cys Asn Arg Arg Gly His His His His His His Asp Glu Val Asp Gly

35 40 45

Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu Glu

50 55 60

Asn Tyr Cys Asn Arg Arg His His His His His His Asp Glu Val Asp

65 70 75 80

Phe Val Asn Gln His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr

85 90 95

Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr Arg Arg

100 105 110

Gly His His His His His His Asp Glu Val Asp Phe Val Asn Gln His

115 120 125

Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu

130 135 140

Arg Gly Phe Phe Tyr Thr Pro Lys Thr

145 150

<210> 166

<211> 43

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 中间肽

<400> 166

Gly His His His His His His Asp Glu Val Asp Phe Val Asn Gln His

1 5 10 15

Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu

20 25 30

Arg Gly Phe Phe Tyr Thr Pro Lys Thr Arg Arg

35 40

<210> 167

<211> 33

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 中间肽

<400> 167

His His His His His His Asp Glu Val Asp Gly Ile Val Glu Gln Cys

1 5 10 15

Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu Glu Asn Tyr Cys Asn Arg

20 25 30

Arg

<210> 168

<211> 34

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 中间肽

<400> 168

Gly His His His His His His Asp Glu Val Asp Gly Ile Val Glu Gln

1 5 10 15

Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu Glu Asn Tyr Cys Asn

20 25 30

Arg Arg

<210> 169

<211> 42

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 中间肽

<400> 169

His His His His His His Asp Glu Val Asp Phe Val Asn Gln His Leu

1 5 10 15

Cys Gly Ser His Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg

20 25 30

Gly Phe Phe Tyr Thr Pro Lys Thr Arg Arg

35 40

<210> 170

<211> 41

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 中间肽

<400> 170

Gly His His His His His His Asp Glu Val Asp Phe Val Asn Gln His

1 5 10 15

Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu

20 25 30

Arg Gly Phe Phe Tyr Thr Pro Lys Thr

35 40

<210> 171

<211> 31

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 中间肽

<400> 171

His His His His His His Asp Glu Val Asp Gly Ile Val Glu Gln Cys

1 5 10 15

Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu Glu Asn Tyr Cys Asn

20 25 30

<210> 172

<211> 32

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 中间肽

<400> 172

Gly His His His His His His Asp Glu Val Asp Gly Ile Val Glu Gln

1 5 10 15

Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu Glu Asn Tyr Cys Asn

20 25 30

<210> 173

<211> 40

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 中间肽

<400> 173

His His His His His His Asp Glu Val Asp Phe Val Asn Gln His Leu

1 5 10 15

Cys Gly Ser His Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg

20 25 30

Gly Phe Phe Tyr Thr Pro Lys Thr

35 40

<210> 174

<211> 6286

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 质粒

<400> 174

tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg 60

cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc 120

ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg 180

gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc 240

acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt 300

ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc 360

ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta 420

acaaaaattt aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt 480

tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta 540

tccgctcatg agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat 600

gagtattcaa catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt 660

ttttgctcac ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg 720

agtgggttac atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga 780

agaacgtttt ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg 840

tattgacgcc gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt 900

tgagtactca ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg 960

cagtgctgcc ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg 1020

aggaccgaag gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga 1080

tcgttgggaa ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc 1140

tgcagcaatg gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc 1200

ccggcaacaa ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc 1260

ggcccttccg gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg 1320

cggtatcatt gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac 1380

gacggggagt caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc 1440

actgattaag cattggtaac tgtcagacca agtttactca tatatacttt agattgattt 1500

aaaacttcat ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac 1560

caaaatccct taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa 1620

aggatcttct tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc 1680

accgctacca gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt 1740

aactggcttc agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg 1800

ccaccacttc aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc 1860

agtggctgct gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt 1920

accggataag gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga 1980

gcgaacgacc tacaccgaac tgagatacct acagcgtgag ctatgagaaa gcgccacgct 2040

tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg 2100

cacgagggag cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca 2160

cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa 2220

cgccagcaac gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt 2280

ctttcctgcg ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga 2340

taccgctcgc cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga 2400

gcgcctgatg cggtattttc tccttacgca tctgtgcggt atttcacacc gcatatatgg 2460

tgcactctca gtacaatctg ctctgatgcc gcatagttaa gccagtatac actccgctat 2520

cgctacgtga ctgggtcatg gctgcgcccc gacacccgcc aacacccgct gacgcgccct 2580

gacgggcttg tctgctcccg gcatccgctt acagacaagc tgtgaccgtc tccgggagct 2640

gcatgtgtca gaggttttca ccgtcatcac cgaaacgcgc gaggcagctg cggtaaagct 2700

catcagcgtg gtcgtgaagc gattcacaga tgtctgcctg ttcatccgcg tccagctcgt 2760

tgagtttctc cagaagcgtt aatgtctggc ttctgataaa gcgggccatg ttaagggcgg 2820

ttttttcctg tttggtcact gatgcctccg tgtaaggggg atttctgttc atgggggtaa 2880

tgataccgat gaaacgagag aggatgctca cgatacgggt tactgatgat gaacatgccc 2940

ggttactgga acgttgtgag ggtaaacaac tggcggtatg gatgcggcgg gaccagagaa 3000

aaatcactca gggtcaatgc cagcgcttcg ttaatacaga tgtaggtgtt ccacagggta 3060

gccagcagca tcctgcgatg cagatccgga acataatggt gcagggcgct gacttccgcg 3120

tttccagact ttacgaaaca cggaaaccga agaccattca tgttgttgct caggtcgcag 3180

acgttttgca gcagcagtcg cttcacgttc gctcgcgtat cggtgattca ttctgctaac 3240

cagtaaggca accccgccag cctagccggg tcctcaacga caggagcacg atcatgcgca 3300

cccgtggggc cgccatgccg gcgataatgg cctgcttctc gccgaaacgt ttggtggcgg 3360

gaccagtgac gaaggcttga gcgagggcgt gcaagattcc gaataccgca agcgacaggc 3420

cgatcatcgt cgcgctccag cgaaagcggt cctcgccgaa aatgacccag agcgctgccg 3480

gcacctgtcc tacgagttgc atgataaaga agacagtcat aagtgcggcg acgatagtca 3540

tgccccgcgc ccaccggaag gagctgactg ggttgaaggc tctcaagggc atcggtcgag 3600

atcccggtgc ctaatgagtg agctaactta cattaattgc gttgcgctca ctgcccgctt 3660

tccagtcggg aaacctgtcg tgccagctgc attaatgaat cggccaacgc gcggggagag 3720

gcggtttgcg tattgggcgc cagggtggtt tttcttttca ccagtgagac gggcaacagc 3780

tgattgccct tcaccgcctg gccctgagag agttgcagca agcggtccac gctggtttgc 3840

cccagcaggc gaaaatcctg tttgatggtg gttaacggcg ggatataaca tgagctgtct 3900

tcggtatcgt cgtatcccac taccgagatg tccgcaccaa cgcgcagccc ggactcggta 3960

atggcgcgca ttgcgcccag cgccatctga tcgttggcaa ccagcatcgc agtgggaacg 4020

atgccctcat tcagcatttg catggtttgt tgaaaaccgg acatggcact ccagtcgcct 4080

tcccgttccg ctatcggctg aatttgattg cgagtgagat atttatgcca gccagccaga 4140

cgcagacgcg ccgagacaga acttaatggg cccgctaaca gcgcgatttg ctggtgaccc 4200

aatgcgacca gatgctccac gcccagtcgc gtaccgtctt catgggagaa aataatactg 4260

ttgatgggtg tctggtcaga gacatcaaga aataacgccg gaacattagt gcaggcagct 4320

tccacagcaa tggcatcctg gtcatccagc ggatagttaa tgatcagccc actgacgcgt 4380

tgcgcgagaa gattgtgcac cgccgcttta caggcttcga cgccgcttcg ttctaccatc 4440

gacaccacca cgctggcacc cagttgatcg gcgcgagatt taatcgccgc gacaatttgc 4500

gacggcgcgt gcagggccag actggaggtg gcaacgccaa tcagcaacga ctgtttgccc 4560

gccagttgtt gtgccacgcg gttgggaatg taattcagct ccgccatcgc cgcttccact 4620

ttttcccgcg ttttcgcaga aacgtggctg gcctggttca ccacgcggga aacggtctga 4680

taagagacac cggcatactc tgcgacatcg tataacgtta ctggtttcac attcaccacc 4740

ctgaattgac tctcttccgg gcgctatcat gccataccgc gaaaggtttt gcgccattcg 4800

atggtgtccg ggatctcgac gctctccctt atgcgactcc tgcattagga agcagcccag 4860

tagtaggttg aggccgttga gcaccgccgc cgcaaggaat ggtgcatgca aggagatggc 4920

gcccaacagt cccccggcca cggggcctgc caccataccc acgccgaaac aagcgctcat 4980

gagcccgaag tggcgagccc gatcttcccc atcggtgatg tcggcgatat aggcgccagc 5040

aaccgcacct gtggcgccgg tgatgccggc cacgatgcgt ccggcgtaga ggatcgagat 5100

cgatctcgat cccgcgaaat taatacgact cactataggg gaattgtgag cggataacaa 5160

ttcccctcta gaaataattt tgtttaactt taagaaggag atatacatat gagcgataaa 5220

attattcacc tgactgacga cagttttgac acggatgtac tcaaagcgga cggggcgatc 5280

ctcgtcgatt tctgggcaga gtggtgcggt ccgtgcaaaa tgatcgcccc gattctggat 5340

gaaatcgctg acgaatatca gggcaaactg accgttgcaa aactgaacat cgatcaaaac 5400

cctggcactg cgccgaaata tggcatccgt ggtatcccga ctctgctgct gttcaaaaac 5460

ggtgaagtgg cggcaaccaa agtgggtgca ctgtctaaag gtcagttgaa agagttcctc 5520

gacgctaacc tggccggttc tggttctggc catatgcacc atcatcatca tcattcttct 5580

ggtctggtgc cacgcggttc tggtatgaaa gaaaccgctg ctgctaaatt cgaacgccag 5640

cacatggaca gcccagatct gggtaccgac gacgacgaca aggccatggc tgatatcgga 5700

tccggtgacg aagtggacca tagccaaggc acctttacca gcgactatag caagtacctg 5760

gatagccgcc gtgcgcaaga ttttgttcaa tggctgatga acacctgcgg tgacgaggtg 5820

gatcacagcc agggcacctt caccagcgac tacagcaagt atttagatag ccgtcgtgct 5880

caggactttg tgcaatggtt aatgaatacc tgcggtgacg aagttgatca cagccaaggc 5940

accttcacca gcgattacag caaatatctg gacagccgtc gtgcgcagga ttttgtgcaa 6000

tggcttatga atacctgcgg cgatgaggtt gaccatagcc agggtacctt taccagcgac 6060

tacagcaaat acctggatag ccgtcgtgcg caagacttcg ttcaatggct gatgaatacc 6120

taactcgagc accaccacca ccaccactga gatccggctg ctaacaaagc ccgaaaggaa 6180

gctgagttgg ctgctgccac cgctgagcaa taactagcat aaccccttgg ggcctctaaa 6240

cgggtcttga ggggtttttt gctgaaagga ggaactatat ccggat 6286

<210> 175

<211> 9

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 蛋白酶识别位点

<220>

<221> VARIANT

<222> (1)..(5)

<223> 氨基酸1-5可以不存在或存在

<220>

<221> VARIANT

<222> (7)..(9)

<223> 氨基酸7-8的任一个或所有可以不存在或存在

<400> 175

Xaa Xaa Xaa Xaa Xaa Pro Xaa Xaa Xaa

1 5

<210> 176

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 蛋白酶识别位点

<220>

<221> VARIANT

<222> (4)..(4)

<223> 氨基酸4可以不存在或存在

<400> 176

Pro Ile Val Xaa

1

<210> 177

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 蛋白酶识别位点

<220>

<221> VARIANT

<222> (4)..(4)

<223> 氨基酸4可以不存在或存在

<400> 177

Leu Gln Ser Xaa

1

<210> 178

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 蛋白酶识别位点

<220>

<221> VARIANT

<222> (4)..(4)

<223> 氨基酸4可以不存在或存在

<400> 178

Pro Gln Ile Xaa

1

<210> 179

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 蛋白酶识别位点

<220>

<221> VARIANT

<222> (4)..(4)

<223> 氨基酸4可以不存在或存在

<400> 179

Pro Ile Ser Xaa

1

<210> 180

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 蛋白酶识别位点

<220>

<221> VARIANT

<222> (4)..(4)

<223> 氨基酸4可以不存在或存在

<400> 180

Pro Val Gln Xaa

1

<210> 181

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 蛋白酶识别位点

<220>

<221> VARIANT

<222> (4)..(4)

<223> 氨基酸4可以不存在或存在

<400> 181

Pro Val Ala Xaa

1

<210> 182

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 蛋白酶识别位点

<220>

<221> VARIANT

<222> (4)..(4)

<223> 氨基酸4可以不存在或存在

<400> 182

Pro Ile Met Xaa

1

<210> 183

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 蛋白酶识别位点

<220>

<221> VARIANT

<222> (4)..(4)

<223> 氨基酸4可以不存在或存在

<400> 183

Pro Ile Gln Xaa

1

<210> 184

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 蛋白酶识别位点

<220>

<221> VARIANT

<222> (4)..(4)

<223> 氨基酸4可以不存在或存在

<400> 184

Pro Val Val Xaa

1

<210> 185

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 蛋白酶识别位点

<220>

<221> VARIANT

<222> (4)..(4)

<223> 氨基酸4可以不存在或存在

<400> 185

Pro Leu Arg Xaa

1

<210> 186

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 蛋白酶识别位点

<220>

<221> VARIANT

<222> (4)..(4)

<223> 氨基酸4可以不存在或存在

<400> 186

Pro Val Thr Xaa

1

<210> 187

<211> 333

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 重组多肽

<400> 187

Met Ser Asp Lys Ile Ile His Leu Thr Asp Asp Ser Phe Asp Thr Asp

1 5 10 15

Val Leu Lys Ala Asp Gly Ala Ile Leu Val Asp Phe Trp Ala Glu Trp

20 25 30

Cys Gly Pro Cys Lys Met Ile Ala Pro Ile Leu Asp Glu Ile Ala Asp

35 40 45

Glu Tyr Gln Gly Lys Leu Thr Val Ala Lys Leu Asn Ile Asp Gln Asn

50 55 60

Pro Gly Thr Ala Pro Lys Tyr Gly Ile Arg Gly Ile Pro Thr Leu Leu

65 70 75 80

Leu Phe Lys Asn Gly Glu Val Ala Ala Thr Lys Val Gly Ala Leu Ser

85 90 95

Lys Gly Gln Leu Lys Glu Phe Leu Asp Ala Asn Leu Ala Gly Ser Gly

100 105 110

Ser Gly His Met His His His His His His Ser Ser Gly Leu Val Pro

115 120 125

Arg Gly Ser Gly Met Lys Glu Thr Ala Ala Ala Lys Phe Glu Arg Gln

130 135 140

His Met Asp Ser Pro Asp Leu Gly Thr Asp Asp Asp Asp Lys Ala Met

145 150 155 160

Ala Asp Ile Gly Gly Ser Asp Glu Val Asp Ser Val Ser Glu Ile Gln

165 170 175

Leu Met His Asn Leu Gly Lys His Leu Asn Ser Met Glu Arg Val Glu

180 185 190

Trp Leu Arg Lys Lys Leu Gln Asp Val His Asn Phe Ser Arg His Trp

195 200 205

Ser Asp Glu Val Asp Ser Val Ser Glu Ile Gln Leu Met His Asn Leu

210 215 220

Gly Lys His Leu Asn Ser Met Glu Arg Val Glu Trp Leu Arg Lys Lys

225 230 235 240

Leu Gln Asp Val His Asn Phe Ser Arg His Trp Ser Asp Glu Val Asp

245 250 255

Ser Val Ser Glu Ile Gln Leu Met His Asn Leu Gly Lys His Leu Asn

260 265 270

Ser Met Glu Arg Val Glu Trp Leu Arg Lys Lys Leu Gln Asp Val His

275 280 285

Asn Phe Ser Arg His Trp Ser Asp Glu Val Asp Ser Val Ser Glu Ile

290 295 300

Gln Leu Met His Asn Leu Gly Lys His Leu Asn Ser Met Glu Arg Val

305 310 315 320

Glu Trp Leu Arg Lys Lys Leu Gln Asp Val His Asn Phe

325 330

<210> 188

<211> 162

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 重组多肽

<400> 188

Ser Asp Glu Val Asp Ser Val Ser Glu Ile Gln Leu Met His Asn Leu

1 5 10 15

Gly Lys His Leu Asn Ser Met Glu Arg Val Glu Trp Leu Arg Lys Lys

20 25 30

Leu Gln Asp Val His Asn Phe Pro Ile Ser Asp Glu Val Asp Ser Val

35 40 45

Ser Glu Ile Gln Leu Met His Asn Leu Gly Lys His Leu Asn Ser Met

50 55 60

Glu Arg Val Glu Trp Leu Arg Lys Lys Leu Gln Asp Val His Asn Phe

65 70 75 80

Pro Ile Ser Asp Glu Val Asp Ser Val Ser Glu Ile Gln Leu Met His

85 90 95

Asn Leu Gly Lys His Leu Asn Ser Met Glu Arg Val Glu Trp Leu Arg

100 105 110

Lys Lys Leu Gln Asp Val His Asn Phe Pro Ile Ser Asp Glu Val Asp

115 120 125

Ser Val Ser Glu Ile Gln Leu Met His Asn Leu Gly Lys His Leu Asn

130 135 140

Ser Met Glu Arg Val Glu Trp Leu Arg Lys Lys Leu Gln Asp Val His

145 150 155 160

Asn Phe

<210> 189

<211> 327

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 重组多肽

<400> 189

Met Ser Asp Lys Ile Ile His Leu Thr Asp Asp Ser Phe Asp Thr Asp

1 5 10 15

Val Leu Lys Ala Asp Gly Ala Ile Leu Val Asp Phe Trp Ala Glu Trp

20 25 30

Cys Gly Pro Cys Lys Met Ile Ala Pro Ile Leu Asp Glu Ile Ala Asp

35 40 45

Glu Tyr Gln Gly Lys Leu Thr Val Ala Lys Leu Asn Ile Asp Gln Asn

50 55 60

Pro Gly Thr Ala Pro Lys Tyr Gly Ile Arg Gly Ile Pro Thr Leu Leu

65 70 75 80

Leu Phe Lys Asn Gly Glu Val Ala Ala Thr Lys Val Gly Ala Leu Ser

85 90 95

Lys Gly Gln Leu Lys Glu Phe Leu Asp Ala Asn Leu Ala Gly Ser Gly

100 105 110

Ser Gly His Met His His His His His His Ser Ser Gly Leu Val Pro

115 120 125

Arg Gly Ser Gly Met Lys Glu Thr Ala Ala Ala Lys Phe Glu Arg Gln

130 135 140

His Met Asp Ser Pro Asp Leu Gly Thr Asp Asp Asp Asp Lys Ala Met

145 150 155 160

Ala Asp Ile Gly Ser Gly Asp Glu Val Asp Ser Val Ser Glu Ile Gln

165 170 175

Leu Met His Asn Leu Gly Lys His Leu Asn Ser Met Glu Arg Val Glu

180 185 190

Trp Leu Arg Lys Lys Leu Gln Asp Val His Asn Phe Pro Ile Ser Asp

195 200 205

Glu Val Asp Ser Val Ser Glu Ile Gln Leu Met His Asn Leu Gly Lys

210 215 220

His Leu Asn Ser Met Glu Arg Val Glu Trp Leu Arg Lys Lys Leu Gln

225 230 235 240

Asp Val His Asn Phe Pro Ile Ser Asp Glu Val Asp Ser Val Ser Glu

245 250 255

Ile Gln Leu Met His Asn Leu Gly Lys His Leu Asn Ser Met Glu Arg

260 265 270

Val Glu Trp Leu Arg Lys Lys Leu Gln Asp Val His Asn Phe Pro Ile

275 280 285

Ser Asp Glu Val Asp Ser Val Ser Glu Ile Gln Leu Met His Asn Leu

290 295 300

Gly Lys His Leu Asn Ser Met Glu Arg Val Glu Trp Leu Arg Lys Lys

305 310 315 320

Leu Gln Asp Val His Asn Phe

325

<210> 190

<211> 41

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 人工序列

<400> 190

Ser Val Ser Glu Ile Gln Leu Met His Asn Leu Gly Lys His Leu Asn

1 5 10 15

Ser Met Glu Arg Val Glu Trp Leu Arg Lys Lys Leu Gln Asp Val His

20 25 30

Asn Phe Pro Ile Ser Asp Glu Val Asp

35 40

<210> 191

<211> 7

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 包含接头和蛋白酶识别位点的肽

<400> 191

Pro Ile Ser Asp Glu Val Asp

1 5

<210> 192

<211> 34

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 中间肽

<400> 192

His Ala Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly

1 5 10 15

Gln Ala Ala Lys Glu Glu Phe Ile Ala Trp Leu Val Arg Gly Arg Gly

20 25 30

Arg Arg

<210> 193

<211> 304

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 硫氧还蛋白标签

<400> 193

Met Ser Asp Lys Ile Ile His Leu Thr Asp Asp Ser Phe Asp Thr Asp

1 5 10 15

Val Leu Lys Ala Asp Gly Ala Ile Leu Val Asp Phe Trp Ala Glu Trp

20 25 30

Cys Gly Pro Cys Lys Met Ile Ala Pro Ile Leu Asp Glu Ile Ala Asp

35 40 45

Glu Tyr Gln Gly Lys Leu Thr Val Ala Lys Leu Asn Ile Asp Gln Asn

50 55 60

Pro Gly Thr Ala Pro Lys Tyr Gly Ile Arg Gly Ile Pro Thr Leu Leu

65 70 75 80

Leu Phe Lys Asn Gly Glu Val Ala Ala Thr Lys Val Gly Ala Leu Ser

85 90 95

Lys Gly Gln Leu Lys Glu Phe Leu Asp Ala Asn Leu Ala Gly Ser Gly

100 105 110

Ser Gly His Met His His His His His His Ser Ser Gly Leu Val Pro

115 120 125

Arg Gly Ser Gly Met Lys Glu Thr Ala Ala Ala Lys Phe Glu Arg Gln

130 135 140

His Met Asp Ser Pro Asp Leu Gly Thr Asp Asp Asp Asp Lys Ala Met

145 150 155 160

Ala Asp Ile Gly Ser Gly Asp Glu Val Asp His Ser Gln Gly Thr Phe

165 170 175

Thr Ser Asp Tyr Ser Lys Tyr Leu Asp Ser Arg Arg Ala Gln Asp Phe

180 185 190

Val Gln Trp Leu Met Asn Thr Cys Gly Asp Glu Val Asp His Ser Gln

195 200 205

Gly Thr Phe Thr Ser Asp Tyr Ser Lys Tyr Leu Asp Ser Arg Arg Ala

210 215 220

Gln Asp Phe Val Gln Trp Leu Met Asn Thr Cys Gly Asp Glu Val Asp

225 230 235 240

His Ser Gln Gly Thr Phe Thr Ser Asp Tyr Ser Lys Tyr Leu Asp Ser

245 250 255

Arg Arg Ala Gln Asp Phe Val Gln Trp Leu Met Asn Thr Cys Gly Asp

260 265 270

Glu Val Asp His Ser Gln Gly Thr Phe Thr Ser Asp Tyr Ser Lys Tyr

275 280 285

Leu Asp Ser Arg Arg Ala Gln Asp Phe Val Gln Trp Leu Met Asn Thr

290 295 300

<210> 194

<211> 310

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 重组多肽

<400> 194

Met Ser Asp Lys Ile Ile His Leu Thr Asp Asp Ser Phe Asp Thr Asp

1 5 10 15

Val Leu Lys Ala Asp Gly Ala Ile Leu Val Asp Phe Trp Ala Glu Trp

20 25 30

Cys Gly Pro Cys Lys Met Ile Ala Pro Ile Leu Asp Glu Ile Ala Asp

35 40 45

Glu Tyr Gln Gly Lys Leu Thr Val Ala Lys Leu Asn Ile Asp Gln Asn

50 55 60

Pro Gly Thr Ala Pro Lys Tyr Gly Ile Arg Gly Ile Pro Thr Leu Leu

65 70 75 80

Leu Phe Lys Asn Gly Glu Val Ala Ala Thr Lys Val Gly Ala Leu Ser

85 90 95

Lys Gly Gln Leu Lys Glu Phe Leu Asp Ala Asn Leu Ala Gly Ser Gly

100 105 110

Ser Gly His Met His His His His His His Ser Ser Gly Leu Val Pro

115 120 125

Arg Gly Ser Gly Met Lys Glu Thr Ala Ala Ala Lys Phe Glu Arg Gln

130 135 140

His Met Asp Ser Pro Asp Leu Gly Thr Asp Asp Asp Asp Lys Ala Met

145 150 155 160

Ala Asp Ile Gly Ser Gly Asp Glu Val Asp His Ser Gln Gly Thr Phe

165 170 175

Thr Ser Asp Tyr Ser Lys Tyr Leu Asp Ser Arg Arg Ala Gln Asp Phe

180 185 190

Val Gln Trp Leu Met Asn Thr Pro His Gly Gly Asp Glu Val Asp His

195 200 205

Ser Gln Gly Thr Phe Thr Ser Asp Tyr Ser Lys Tyr Leu Asp Ser Arg

210 215 220

Arg Ala Gln Asp Phe Val Gln Trp Leu Met Asn Thr Pro His Gly Gly

225 230 235 240

Asp Glu Val Asp His Ser Gln Gly Thr Phe Thr Ser Asp Tyr Ser Lys

245 250 255

Tyr Leu Asp Ser Arg Arg Ala Gln Asp Phe Val Gln Trp Leu Met Asn

260 265 270

Thr Pro His Gly Gly Asp Glu Val Asp His Ser Gln Gly Thr Phe Thr

275 280 285

Ser Asp Tyr Ser Lys Tyr Leu Asp Ser Arg Arg Ala Gln Asp Phe Val

290 295 300

Gln Trp Leu Met Asn Thr

305 310

<210> 195

<211> 313

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 重组多肽

<400> 195

Met Ser Asp Lys Ile Ile His Leu Thr Asp Asp Ser Phe Asp Thr Asp

1 5 10 15

Val Leu Lys Ala Asp Gly Ala Ile Leu Val Asp Phe Trp Ala Glu Trp

20 25 30

Cys Gly Pro Cys Lys Met Ile Ala Pro Ile Leu Asp Glu Ile Ala Asp

35 40 45

Glu Tyr Gln Gly Lys Leu Thr Val Ala Lys Leu Asn Ile Asp Gln Asn

50 55 60

Pro Gly Thr Ala Pro Lys Tyr Gly Ile Arg Gly Ile Pro Thr Leu Leu

65 70 75 80

Leu Phe Lys Asn Gly Glu Val Ala Ala Thr Lys Val Gly Ala Leu Ser

85 90 95

Lys Gly Gln Leu Lys Glu Phe Leu Asp Ala Asn Leu Ala Gly Ser Gly

100 105 110

Ser Gly His Met His His His His His His Ser Ser Gly Leu Val Pro

115 120 125

Arg Gly Ser Gly Met Lys Glu Thr Ala Ala Ala Lys Phe Glu Arg Gln

130 135 140

His Met Asp Ser Pro Asp Leu Gly Thr Asp Asp Asp Asp Lys Ala Met

145 150 155 160

Ala Asp Ile Gly Ser Gly Asp Glu Val Asp His Ser Gln Gly Thr Phe

165 170 175

Thr Ser Asp Tyr Ser Lys Tyr Leu Asp Ser Arg Arg Ala Gln Asp Phe

180 185 190

Val Gln Trp Leu Met Asn Thr Ser Arg His Trp Gly Asp Glu Val Asp

195 200 205

His Ser Gln Gly Thr Phe Thr Ser Asp Tyr Ser Lys Tyr Leu Asp Ser

210 215 220

Arg Arg Ala Gln Asp Phe Val Gln Trp Leu Met Asn Thr Ser Arg His

225 230 235 240

Trp Gly Asp Glu Val Asp His Ser Gln Gly Thr Phe Thr Ser Asp Tyr

245 250 255

Ser Lys Tyr Leu Asp Ser Arg Arg Ala Gln Asp Phe Val Gln Trp Leu

260 265 270

Met Asn Thr Ser Arg His Trp Gly Asp Glu Val Asp His Ser Gln Gly

275 280 285

Thr Phe Thr Ser Asp Tyr Ser Lys Tyr Leu Asp Ser Arg Arg Ala Gln

290 295 300

Asp Phe Val Gln Trp Leu Met Asn Thr

305 310

<210> 196

<211> 314

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 重组多肽

<400> 196

Met Ser Asp Lys Ile Ile His Leu Thr Asp Asp Ser Phe Asp Thr Asp

1 5 10 15

Val Leu Lys Ala Asp Gly Ala Ile Leu Val Asp Phe Trp Ala Glu Trp

20 25 30

Cys Gly Pro Cys Lys Met Ile Ala Pro Ile Leu Asp Glu Ile Ala Asp

35 40 45

Glu Tyr Gln Gly Lys Leu Thr Val Ala Lys Leu Asn Ile Asp Gln Asn

50 55 60

Pro Gly Thr Ala Pro Lys Tyr Gly Ile Arg Gly Ile Pro Thr Leu Leu

65 70 75 80

Leu Phe Lys Asn Gly Glu Val Ala Ala Thr Lys Val Gly Ala Leu Ser

85 90 95

Lys Gly Gln Leu Lys Glu Phe Leu Asp Ala Asn Leu Ala Gly Ser Gly

100 105 110

Ser Gly His Met His His His His His His Ser Ser Gly Leu Val Pro

115 120 125

Arg Gly Ser Gly Met Lys Glu Thr Ala Ala Ala Lys Phe Glu Arg Gln

130 135 140

His Met Asp Ser Pro Asp Leu Gly Thr Asp Asp Asp Asp Lys Ala Met

145 150 155 160

Ala Asp Ile Gly Ser Gly Arg Arg His Ala Glu Gly Thr Phe Thr Ser

165 170 175

Asp Val Ser Ser Tyr Leu Glu Gly Gln Ala Ala Lys Glu Glu Phe Ile

180 185 190

Ala Trp Leu Val Arg Gly Arg Gly Arg Arg Gly Ser Lys Arg His Ala

195 200 205

Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly Gln Ala

210 215 220

Ala Lys Glu Glu Phe Ile Ala Trp Leu Val Arg Gly Arg Gly Arg Arg

225 230 235 240

Gly Ser Arg Arg His Ala Glu Gly Thr Phe Thr Ser Asp Val Ser Ser

245 250 255

Tyr Leu Glu Gly Gln Ala Ala Lys Glu Glu Phe Ile Ala Trp Leu Val

260 265 270

Arg Gly Arg Gly Arg Arg Gly Ser Lys Arg His Ala Glu Gly Thr Phe

275 280 285

Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly Gln Ala Ala Lys Glu Glu

290 295 300

Phe Ile Ala Trp Leu Val Arg Gly Arg Gly

305 310

<210> 197

<211> 322

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 重组多肽

<400> 197

Met Ser Asp Lys Ile Ile His Leu Thr Asp Asp Ser Phe Asp Thr Asp

1 5 10 15

Val Leu Lys Ala Asp Gly Ala Ile Leu Val Asp Phe Trp Ala Glu Trp

20 25 30

Cys Gly Pro Cys Lys Met Ile Ala Pro Ile Leu Asp Glu Ile Ala Asp

35 40 45

Glu Tyr Gln Gly Lys Leu Thr Val Ala Lys Leu Asn Ile Asp Gln Asn

50 55 60

Pro Gly Thr Ala Pro Lys Tyr Gly Ile Arg Gly Ile Pro Thr Leu Leu

65 70 75 80

Leu Phe Lys Asn Gly Glu Val Ala Ala Thr Lys Val Gly Ala Leu Ser

85 90 95

Lys Gly Gln Leu Lys Glu Phe Leu Asp Ala Asn Leu Ala Gly Ser Gly

100 105 110

Ser Gly His Met His His His His His His Ser Ser Gly Leu Val Pro

115 120 125

Arg Gly Ser Gly Met Lys Glu Thr Ala Ala Ala Lys Phe Glu Arg Gln

130 135 140

His Met Asp Ser Pro Asp Leu Gly Thr Asp Asp Asp Asp Lys Ala Met

145 150 155 160

Ala Asp Ile Gly Ser Gly Asp Glu Val Asp His Ala Glu Gly Thr Phe

165 170 175

Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly Gln Ala Ala Lys Glu Glu

180 185 190

Phe Ile Ala Trp Leu Val Arg Gly Arg Gly Pro His Gly Gly Asp Glu

195 200 205

Val Asp His Ala Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu

210 215 220

Glu Gly Gln Ala Ala Lys Glu Glu Phe Ile Ala Trp Leu Val Arg Gly

225 230 235 240

Arg Gly Pro His Gly Gly Asp Glu Val Asp His Ala Glu Gly Thr Phe

245 250 255

Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly Gln Ala Ala Lys Glu Glu

260 265 270

Phe Ile Ala Trp Leu Val Arg Gly Arg Gly Pro His Gly Gly Asp Glu

275 280 285

Val Asp His Ala Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu

290 295 300

Glu Gly Gln Ala Ala Lys Glu Glu Phe Ile Ala Trp Leu Val Arg Gly

305 310 315 320

Arg Gly

<210> 198

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 蛋白酶识别位点

<220>

<221> VARIANT

<222> (1)..(1)

<223> 氨基酸1可以不存在或存在

<220>

<221> VARIANT

<222> (2)..(2)

<223> Xaa是Gly、Ala、Val、Leu、Ile、Phe、Met或Trp.

<220>

<221> VARIANT

<222> (3)..(3)

<223> Xaa是Gly、Ala、Val、Leu、Ile、Phe、Met或Trp.

<220>

<221> VARIANT

<222> (4)..(4)

<223> 氨基酸4可以不存在或存在

<400> 198

Xaa Xaa Xaa Xaa

1

<210> 199

<211> 43

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 重组多肽

<400> 199

Ser Val Ser Glu Ile Gln Leu Met His Asn Leu Gly Lys His Leu Asn

1 5 10 15

Ser Met Glu Arg Val Glu Trp Leu Arg Lys Lys Leu Gln Asp Val His

20 25 30

Asn Phe Ser Arg His Trp Ser Asp Glu Val Asp

35 40

<210> 200

<211> 9

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 重组多肽

<400> 200

Ser Arg His Trp Ser Asp Glu Val Asp

1 5

<210> 201

<211> 9

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 重组多肽

<220>

<221> VARIANT

<222> (1)..(5)

<223> 氨基酸1-5的任一个或所有可以不存在或存在

<220>

<221> VARIANT

<222> (7)..(7)

<223> Xaa是Ile、Gln、Val或Leu

<220>

<221> VARIANT

<222> (8)..(9)

<223> 氨基酸8-9的任一个或所有可以不存在或存在

<400> 201

Xaa Xaa Xaa Xaa Xaa Pro Xaa Xaa Xaa

1 5

<210> 202

<211> 9

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 蛋白酶识别位点

<220>

<221> VARIANT

<222> (1)..(5)

<223> 氨基酸1-5的任一个或所有可以不存在或存在

<220>

<221> VARIANT

<222> (7)..(7)

<223> 氨基酸7可以不存在或存在

<220>

<221> VARIANT

<222> (8)..(8)

<223> Xaa是Val、Ser、Ile、Gln、Ala、Arg或Thr

<220>

<221> VARIANT

<222> (9)..(9)

<223> 氨基酸9可以不存在或存在

<400> 202

Xaa Xaa Xaa Xaa Xaa Pro Xaa Xaa Xaa

1 5

Claims

1.一种重组多肽，包含：

a)多于一个肽单元；

b)每个所述肽单元包含第一蛋白酶识别序列、裂解序列和由靶氨基酸序列组成的产物肽；并且

c)选择所述第一蛋白酶识别序列和所述裂解序列，使得所述第一蛋白酶识别序列和所述裂解序列的裂解都不产生与所述靶氨基酸序列无关的氨基酸残基。

2.根据权利要求1所述的重组多肽，其中所述第一蛋白酶识别序列包括SEQ ID NO:1和SEQ ID NO:30。

3.根据权利要求1所述的重组多肽，其中所述第二裂解序列是包含SEQ ID NO:46-56的化学裂解序列。

4.根据权利要求1所述的重组多肽，其中所述裂解序列是第二蛋白酶识别序列。

5.根据权利要求4所述的重组多肽，其中所述第二蛋白酶识别序列选自由SEQ ID NO:175和SEQ ID NO:200组成的组。

6.根据权利要求1所述的重组多肽，其中接头序列位于所述第一蛋白酶识别序列和所述裂解序列之间。

7.根据权利要求6所述的重组多肽，其中所述接头序列选自由以下组成的组：Gly、Ala、Ser和SEQ ID NO:57-83。

8.根据权利要求1所述的重组多肽，其中所述第二裂解序列位于每个所述肽单元的N-末端，并且所述产物肽位于每个所述肽单元的C-末端。

9.根据权利要求1所述的重组多肽，其中所述多于一个肽单元包含第一肽单元和第二肽单元，并且所述第一肽单元具有至少一个与所述第二肽单元不同的氨基酸。

10.根据权利要求9所述的重组多肽，其中所述第一肽单元具有不同于所述第二肽单元的第二靶氨基酸序列的第一靶氨基酸序列。

11.一种重组多肽，包含：

a)多于一个肽单元；

b)每个所述肽单元包含第一蛋白酶识别序列、裂解序列、接头序列和由靶氨基酸序列组成的产物肽；

c)所述裂解序列是化学裂解序列或第二蛋白酶识别序列；并且

e)所述接头序列位于所述第一蛋白酶识别序列和所述第二裂解序列之间。

12.根据权利要求11所述的重组多肽，其中所述接头序列选自由以下组成的组：Gly、Ala、Ser和SEQ ID NO:57-83。

13.根据权利要求12所述的重组多肽，其中所述接头序列包含小氨基酸，并且其中所述接头序列、所述第一蛋白酶识别序列和所述裂解序列共同具有至少一个带电残基和一个极性残基。

14.根据权利要求11所述的重组多肽，其中所述裂解序列形成所述接头序列的至少一部分。

15.根据权利要求11所述的重组多肽，其中所述第一蛋白酶识别序列是SEQ ID NO:1和SEQ ID NO:30的序列。

16.根据权利要求11所述的重组多肽，其中所述第一蛋白酶识别序列和所述裂解序列的裂解都不产生与所述靶氨基酸序列无关的氨基酸残基。

17.根据权利要求16所述的重组多肽，其中所述化学裂解序列选自由SEQ ID NO:46、SEQ ID NO:49和SEQ ID NO:53组成的组。

18.根据权利要求16所述的重组多肽，其中所述第二蛋白酶识别序列选自由SEQ IDNO:175和SEQ ID NO:200组成的组。

19.一种产生靶肽序列的方法，包括：

a)从编码多于一个肽单元的核酸序列表达重组蛋白，其中每个所述肽单元包含蛋白酶识别序列、裂解序列和所述靶肽序列；

b)分离所述重组蛋白；

c)裂解每个所述肽单元的第一蛋白酶识别序列，其中所述蛋白酶识别序列位于所述靶肽序列的N-末端，并且所述蛋白酶识别序列的裂解导致所述靶肽序列的N-末端不具有无关氨基酸残基；以及

d)裂解所述裂解序列，其中所述裂解序列位于相邻肽单元之间，并且所述第二裂解序列的裂解导致所述靶肽序列的C-末端不具有无关氨基酸残基。

20.根据权利要求19所述的产生靶肽序列的方法，其中所述蛋白酶识别序列为SEQ IDNO:1和SEQ ID NO:30的序列。

21.根据权利要求19所述的产生靶肽序列的方法，其中所述裂解序列是选自由SEQ IDNO:46、SEQ ID NO:49和SEQ ID NO:53组成的组的化学裂解序列。

22.根据权利要求19所述的产生靶肽序列的方法，其中所述裂解序列是选自由SEQ IDNO:175和SEQ ID NO:200组成的组的第二蛋白酶识别序列。

23.根据权利要求19所述的产生靶肽序列的方法，其中接头序列位于所述第一蛋白酶序列和所述裂解序列之间。

24.根据权利要求23所述的产生靶肽序列的方法，其中所述裂解序列形成所述接头序列的至少一部分。

25.根据权利要求23所述的产生靶肽序列的方法，其中所述接头序列选自由以下组成的组：Gly、Ala、Ser和SEQ ID NO:57-83。

26.根据权利要求23所述的产生靶肽序列的方法，其中所述方法不包括变性剂。