CN109790205B

CN109790205B - 酶促肽连接的方法

Info

Publication number: CN109790205B
Application number: CN201780058821.2A
Authority: CN
Inventors: 吴彬; 杨仁良; 黄怡华; 朱利安·莱斯卡; 刘传法; 谈秉军; 基恩·特鲁茨·江·阮; 龙子琦
Original assignee: Nanyang Technological University
Current assignee: Nanyang Technological University
Priority date: 2016-09-23
Filing date: 2017-09-12
Publication date: 2024-01-16
Anticipated expiration: 2037-09-12
Also published as: EP3515931C0; EP3515931B1; US20190218586A1; EP3515931A4; US11795488B2; CN109790205A; US20240263210A1; WO2018056899A1; SG10201913521TA; US20230128192A1; EP3515931A1

Abstract

本发明涉及通过第一肽的C‑末端将其与第二肽的N‑末端连接的方法，其中该反应由具有SEQ ID NO：1氨基酸序列的天冬酰胺/天冬氨酸(Asx)肽连接酶OaAEP1 Cys247Ala催化。进一步包括制备一种或多种目标肽的二聚体、低聚体或多聚体的方法，以及通过一种或多种目标肽修饰或标记靶细胞表面的方法。本发明还包括根据任意所述方法得到的连接肽和/或标记的靶细胞，具有SEQ ID NO：1的氨基酸序列的肽连接酶OaAEP1 Cys247Ala，以及包含所述肽连接酶的试剂盒。

Description

酶促肽连接的方法

相关申请的交叉引用

本申请引用并要求2016年9月23日提交的新加坡专利申请号为10201607951V的优先权权益，其内容以引用的方式并入本文中用于所有目的，包括依据PCT实施细则4.18条中未包含在本文说明书、权利要求或附图且涉及PCT实施细则20.5(a)条的任意要素或部分的并入。

技术领域

本发明主要涉及Asx-特异性肽连接酶，利用所述连接酶酶法连接肽的方法以及由此产生的肽和含肽复合物。

背景技术

与自然界中大量发现的蛋白酶不同，肽连接酶相对罕见。报道的第一个天冬酰胺/天冬氨酸(Asx)肽连接酶是从产大环寡肽的植物蝶豆(Clitoria ternatea)中提纯的蝶豆粘酶1(butelase 1)(Nguyen,G.K.,et al.,Nat Chem Biol,2014.10(9):p.732-8)。与通常用于体外催化转肽反应的细菌转肽酶相比，butelase 1在催化肽和蛋白质连接反应方面表现出极高的效率，在生物技术、蛋白质工程、化学酶合成和蛋白质标记中展开了广泛的应用。最近，一种进化的天冬酰胺内肽酶(AEP)命名为OaAEP1b，与butelase 1相关，也具有连接肽基底物N和C端的能力，其从植物Oldenlandia affinis中分离出来，并在酸性pH激活后用大肠杆菌以活性形式表达。butelase 1和OaAEP1b均在连接位点使用氨基酸Asx，并且具有65％的氨基酸序列一致性。然而，OaAEP1b报道的催化效率明显低于butelase 1(Harris,K.S.,et al.,Nat Commun,2015.6:p.10199)。此外，相关的这种蛋白连接酶家族的结构和催化机制尚不清楚。因此，本领域仍需要新的开发以克服现有技术的缺点，特别是能够有效的肽连接的新方法。

发明内容

通过提供本文所述的方法，本发明满足了本领域的上述需要。

第一方面，本发明涉及一种形成式(I)的肽的方法

P¹-Asx-Xaa¹-Xaa²-P²(I)，

通过连接式(II)的第一肽

P¹-Asx-Xaa³-Leu-COOH/CONH₂(II)

至式(III)的第二肽

H₂N-Xaa¹-Xaa²-P²(III)，

其中，P¹和P²各自独立地为任意修饰或未修饰的肽，并且任选地可以结合以使式(II)和(III)的肽是相同肽的末端；Asx为Asp或Asn；Xaa¹为任意天然存在的氨基酸；Xaa²为除Pro之外的任意天然存在的氨基酸，优选地为Leu或Ile；Xaa³是任意天然存在的氨基酸，优选地选自His、Ala、Ser、Cys、Asn、Gly、Arg、Met、Lys、Gln、Leu和Glu组成的组，

通过酶促裂解所述式(II)的第一肽中“Asx”和“Xaa³”之间的键，并通过所述第一肽的C端将其片段P¹-Asx连接至所述式(III)的第二肽的N端以形成式(I)的连接肽，其中，酶促裂解和连接反应由具有OaAEP1 Cys247Ala(SEQ ID NO：1，下文也称为“Quicklase”)活性的肽连接酶在适于所述裂解和连接反应的条件下催化。

在多种实施方式中，所述第一肽和所述第二肽是相同肽的末端(即P¹和P²结合形成单个肽序列)，以使所述方法环化所述肽。

在多种实施方式中，所述具有OaAEP1 Cys247Ala(SEQ ID NO：1)活性的肽连接酶包含或包括：

(a)SEQ ID NO：1所示的氨基酸序列；

(b)与SEQ ID NO：1所述的氨基酸序列具有至少65％、优选地至少75％、甚至更优选地至少85％、最优选地至少95％的序列一致性，或至少80％、优选地至少90％、更优选地至少95％的序列同源性的氨基酸序列，前提为所述肽连接酶包括对应于SEQ ID NO：1中残基247-264位置的SEQ ID NO：2所示的氨基酸序列；

(c)(a)或(b)的功能片段；或

(d)含有(a)、(b)或(c)作为其必需组分的氨基酸序列，前提为所述肽连接酶不是SEQ ID NO：3所示的氨基酸序列的野生型OaAEP1或SEQ ID NO：4所示的氨基酸序列的蝶豆粘酶1。

(a)SEQ ID NO:1所示的氨基酸序列；

(b)SEQ ID NO:5所示的氨基酸序列；

(c)SEQ ID NO:6所示的氨基酸序列；

(d)SEQ ID NO:7所示的氨基酸序列；

(e)SEQ ID NO:8所示的氨基酸序列；

(f)SEQ ID NO:9所示的氨基酸序列；

(g)SEQ ID NO:10所示的氨基酸序列；或

(h)SEQ ID NO:11所示的氨基酸序列；

在多种实施方式中，所述第一肽和/或所述第二肽还包括标签部分。

在多种实施方式中，所述标签部分为亲和标签、治疗剂、可检测标签或骨架分子。

在多种实施方式中，所述第一肽和/或所述第二肽与固体载体材料连接。

在多种实施方式中，所述第一肽和/或所述第二肽为细胞表面蛋白质，以使所述方法引起所述细胞表面蛋白质的修饰或标记并使细胞表面如此。

第二方面，本发明涉及一种制备一种或多种目标肽的二聚体、低聚体或多聚体的方法，所述方法包括以下步骤：

(a)提供具有C端Asx-Xaa³-Leu-COOH/CONH₂残基的一种或多种目标肽以及具有N端H₂N-Xaa¹-Xaa²残基两个或两个以上拷贝的骨架分子，或者，提供具有N端H₂N-Xaa¹-Xaa²残基的一种或多种目标肽以及具有C端Asx-Xaa³-Leu-COOH/CONH₂残基两个或两个以上拷贝的残基骨架分子，其中，Asx为Asp或Asn；Xaa¹为任意天然存在的氨基酸；Xaa²为除Pro之外的任意天然存在的氨基酸，优选地为Leu或Ile；Xaa³是任意天然存在的氨基酸，优选地选自His、Ala、Ser、Cys、Asn、Gly、Arg、Met、Lys、Gln、Leu和Glu组成的组；

(b)提供具有OaAEP1 Cys247Ala(SEQ ID NO：1)活性的肽连接酶；

(c)制备所述一种或多种目标肽、所述骨架分子和所述具有OaAEP1Cys247Ala(SEQID NO：1)活性的肽连接酶的混合物；

(d)使所述混合物处于所述具有OaAEP1 Cys247Ala(SEQ ID NO：1)活性的肽连接酶能催化所述一种或多种目标肽与所述骨架分子连接的条件中。

第三方面，本发明涉及一种通过一种或多种目标肽修饰或标记靶细胞表面的方法，所述方法包括以下步骤：

(a)提供具有C端Asx-Xaa³-Leu-COOH/CONH₂残基和/或N端H₂N-Xaa¹-Xaa²残基的一种或多种目标肽，其中，Asx为Asp或Asn；Xaa¹为任意天然存在的氨基酸；Xaa²为除Pro之外的任意天然存在的氨基酸，优选地为Leu或Ile；Xaa³是任意天然存在的氨基酸，优选地选自His、Ala、Ser、Cys、Asn、Gly、Arg、Met、Lys、Gln、Leu和Glu组成的组；

(b)提供具有OaAEP1 Cys247Ala(SEQ ID NO：1)活性的肽连接酶；

(c)使靶细胞与所述一种或多种目标肽和所述具有OaAEP1 Cys247Ala(SEQ IDNO：1)活性的肽连接酶接触；

(d)使所述靶细胞处于所述具有OaAEP1 Cys247Ala(SEQ ID NO：1)活性的肽连接酶能催化所述一种或多种目标肽与所述靶细胞的细胞表面蛋白质连接的条件中。

在多种实施方式中，所述方法还包括在步骤(d)之后从所述靶细胞中去除未连接的所述一种或多种目标肽。

在多种实施方式中，所述一种或多种目标肽包括如上所述的标签部分。

在多种实施方式中，所述靶细胞重组表达具有N端H₂N-Xaa¹-Xaa²残基或C端Asx-Xaa³-Leu-COOH/CONH₂残基的表面多肽，以便用所述一种或多种目标肽标记。

在本发明所有上述方面的多种实施方式中，

(a)Asx为Asp或Asn；和/或

(b)Xaa¹为所有天然存在的氨基酸；和/或

(c)Xaa²为Leu或Ile；和/或

(d)Xaa³选自His、Ala、Ser、Cys、Asn、Gly、Arg、Met、Lys、Gln、Leu和Glu组成的组。

在优选实施方式中，满足(a)-(d)特征中两个或两个以上，即(a)和(b)、(a)和(c)，(a)和(d)，(b)和(c)，(b)和(d)，或满足三个或三个以上特征，即(a)、(b)和(c)，(a)、(b)和(d)，(a)、(c)和(d)，(b)、(c)和(d)，或者最优选地满足所有四个特征。

在优选地实施方式中，Asx为Asn，Xaa¹为任意天然存在的氨基酸，Xaa²为Leu，以及Xaa³为His、Ser、Cys、Gly或Ala。

在更优选地实施方式中，Asx为Asn，Xaa¹为Arg或Gly，Xaa²为Leu，Xaa³为His、Ala或Gly。

第四方面，本发明涉及根据本发明中任意方法得到的连接肽和/或标记的靶细胞。

第五方面，本发明涉及具有SEQ ID NO：1氨基酸序列的连接肽酶OaAEP1Cys247Ala和具有上述活性的其他肽连接酶，以及包含任何所述肽连接酶的试剂盒，特别是OaAEP1Cys247Ala(SEQ ID NO:1)。

另一方面，本发明涉及如本文所述的用于连接两个肽的具有OaAEP1Cys247Ala(SEQ ID NO：1)活性的肽连接酶的应用。

应当理解，本文公开的与本发明的一个方面有关的所有实施方式，同样适用于本发明其他所有方面。

附图说明

当非限制性实施例和附图一起考虑时，参考详细的说明书将更好地理解本发明。

图1显示了(a)OaAEP1 Cys247Ala(SEQ ID NO:1)介导的肽连接和(b)其优选实施方式的示意图。

图2显示了OaAEP1的纯化和激活。(a)His-Ub-OaAEP1构建体和所示蛋白质的三个区域的边界，以及推导的活化区段的示意图。合成了6-His标签和泛素标签，随后是OaAEP1(24-474)，并将其插入到pET28b载体中。经过NI-NTA亲和纯化后，大约一半的UB-AEP-FL失去N端融合标签，并以AEP-FL形式(53-474)纯化，最后结晶。该OaAEP1b的酶活性形式，AEP-holo(53-347/351)是酸性诱导AEP-FL自解离失去C端自抑制帽区的产物。(b)色谱纯化和溶解晶体过程中获得的片段的SDS PAGE分析。(c)激活前后OaAEP1的尺寸排阻色谱图，显示有Ub-AEP-FL和AEP-FL异二聚体以及AEP-holo单体。标准蛋白质的洗脱体积用于比较。(d)OaAEP1的pH依赖性激活的SDS PAGE分析。激活进行3小时，激活峰值在pH 3.4到4之间。(e)通过活性重组成熟的OaAEP1酶反式激活/成熟无活性的Cys217Ser活性位点突变体。Cys217Ala活性位点突变体缺乏自激活活性。在pH 3.7下孵化18小时后，添加重量比5％的AEP-FL能够反式切割和激活大部分的AEP-FL Cys217Ala。

图3显示了OaAEP1在其酶原形式下的晶体结构。(a)该OaAEP1结构的整体“正面”视图表示为“动画”(α-螺旋为带状，β-股为箭头)，催化核心区域为绿色，前区为紫色。柔性接头包括的残基325-343(未显示)描绘成虚线，被OaAEP1活性位点捕获的残基344-347描绘成球棍状。(b)和(c)图中的分子表面视图是通过将核心区域与帽区分离并分别以90°角度在相反方向旋转(用箭头表示)获得的。(d)该OaAEP1无活性二聚体通过帽区提供的分子间相互作用稳定。结合在活性位点中的残基344-347描绘为球棍状并标记。与人豆荚蛋白相比，这些接头残基以肽型豆荚蛋白抑制剂相似的方向结合在催化中心。该比较视图中，能够识别出容纳进入的胺的假定通道在核心区域表面。准备进行连接反应的进入的底物的方向由沿着蛋白质表面通道的箭头指示(见文中)。(e)hlegum分子表面在与OaAEP1相同的方向显示，肽Ac-Tyr-Val-Ala-Asp-CMK(球棍状)与活性位点Cys189(来自PDB代码：4AWA)共价结合。在此，进入胺的通道被完全阻断，说明了缺乏有效的连接酶活性。(f)动画突出了与OaAEP1 Cys247Ala底物结合和催化活性相关的两个关键结构特征。P1结合位点负责有效切割，P2结合位点与有效的蛋白质连接有关。

图4显示了OaAEP1的活性位点和活性片段。(a)OaAEP1活性位点的近摄图，其中本文讨论的活性位点显示为球棍状并标记：典型的AEP催化对His175和Cys217以及结合在催化中心的连头残基344-347描绘为球棍状。还显示了由Cys250和Cys264(在蝶豆粘酶1中保守)形成的二硫键，其形成开放的胺进入通道，以及“看门基团”Cys247是连接酶活性的主要决定因素。与S1口袋结合的P1残基Gln347形成的氢键用虚线表示，原子间距离用表示。(b)图显示了一个电子密度图，其中多肽的片段344-347在相位计算中省略并在3σ水平上形成轮廓。(c)在靶向活性片段346-351的定点突变后剩余激活的OaAEP1突变体。接头突变体的酶促反应：Asn346、Gln347、Asp349和Asp351的单点或双点突变体显示了自解离催化的激活中等丧失。三点突变体(Asn346Ala、Asp349Ala和Asp351Ala)以及四点突变体(Asn346、Gln347、Asp349和Asp351)具有更严重的功能表型丧失，表明激活位点可能是该延伸接头的任意残基。(d)显示了接头突变体在6小时后的激活效率的柱状图。Asp349和Asp351可能是更优选的切割位点，Asn346和Gln347也是潜在的切割位点。

图5显示了WT OaEP1b、Cys247Ala和butelase 1的肽环化活性的比较以及看门基团对连接酶活性的影响。(a)用WT OaEP1b、Cys247Ala和butelase 1环化“GLPVSTKPVATRNGL”的动力学参数。(b)图为该反应的质谱分析。(c)看门基团在OaAEP1激活中的作用。(d)在看门基团Cys247位置各种残基的环化效率比较。看门基团残基Cys247控制连接反应动力学。(a)野生型OaAEP1和Cys247Ala突变体测定的动力学，与植物新提取的butelase 1进行比较。Cys247Ala的Kcat/Km比野生型OaAEP1b快160倍。(b)用于确定连接效率的肽的示意图，以及证明野生型OaAEP1和Cys247Ala突变体实现骨架连接的质谱结果。(c)看门基团突变体的自激活。看门基团残基的突变对自激活影响不大。体积大的侧链的突变体难以完全激活。(d)连接催化活性与Cys247突变体侧链的大小呈负相关。

图6显示了Cys247Ala的蛋白连接活性。(a)使用O2-苄基胞嘧啶-Alexa647荧光检测SNAP蛋白，以及用考马斯亮蓝染色检测蛋白质底物和连接产物的SDS PAGE分析。该反应图示为附图。Cys247Ala很好地连接折叠良好的蛋白质。(a)100nM的Cys247Ala，不到4000nM的野生型OaAEP1b，有效地将5μM C端修饰的SNAP标签蛋白与N端修饰的泛素连接。(b)在室温、pH 7.4的PBS缓冲液中30分钟，只要30nM Cys247Ala就能有效催化100μM泛素和50μM生物素标记肽的连接。

图7显示(a)OaAEP1b、Butelase 1和人豆荚蛋白的序列比对。(b)编码OaAEP1结构的确切的氨基酸顺序。残基-85到0是融合标签(青色)，而编码AEP的前23个氨基酸被省略。在我们的晶体结构中观察到活性位点口袋中插入的四个残基着色为橙色，帽区域用紫色显示。

图8显示了2FO-FC电子密度图，突出了模型的良好拟合。(a)帽区中的侧链与密度很好吻合。(b)核心区域中的新型PPP环是AEP连接酶所特有的，与密度非常吻合。

图9显示了看门基团突变体的原始质谱结果。

图10显示了连接反应的潜在副产物。如果没有可用的N端胺，则在Cys247Gly和Cys247Ala突变体中可能发生侧链连接和蛋白质水解。Cys247Gly突变体侧链的较小尺寸允许水分子参与反应并发生蛋白水解。

图11显示了C-或N-末端肽/蛋白质的底物序列特异性的筛选：(a)Asn-Xaa³-Leu-COOH；(b)Asn-Gly-Xaa⁴-COOH；(c)H₂N-Xaa¹-Leu。在室温、中性pH(pH7.4)标准反应缓冲液下100μM底物与50nM Quicklase反应5分钟。自连接(环化)肽的百分比可作为Kcal的定性指标。检测读数中的原始质谱读数也包括在图11(d)中。

图12显示(a)用SEQ ID NO：1(OaAEP1 Cys247Ala)所示氨基酸序列在国家生物技术信息中心(NCBI)数据库中的基本局部比对搜索工具(BLAST)搜索的图形概要以及(b)产生显著比对的序列。

图13显示了具有SEQ ID NO：8所示氨基酸序列的AEP_C13CO4是具有OaAEP1Cys247Ala(SEQ ID NO：1)活性的肽连接酶。

图14显示了(a)基于骨架的一步同源二聚化，(b)基于骨架的两步异二聚化，(c)基于骨架的一步四聚化和(d)模块化超低聚反应的方案。另外显示了(e，f)NGL头对头二聚体，(g)GL接头二聚体和四聚体，(h)NGL多聚体和(i)GL多聚体的制备方案。

图15显示了(a)OaAEP1 Cys247Ala(SEQ ID NO:1)介导的指导细胞修饰过程的示意图。(b)荧光标记的SNAP(New England Biolabs)蛋白与RAW细胞(人巨噬细胞细胞系)和HEK293T(人上皮细胞系)两种不同细胞系的固有细胞表面蛋白结合。将10μM修饰的SNAP蛋白(具有附加的C端NGL残基，泳道1样品)具有或不具有(泳道2和泳道5样品)0.1μMQuicklase的共培养物添加至细胞培养物中，用PBS缓冲液预洗。孵育30分钟到1小时后，用另外的PBS缓冲液(泳道3和泳道6是第一次洗涤的样品)冲洗细胞两次。收获剩余的细胞用SDS上样缓冲液裂解(泳道4和7个样品)。所有样品用SDS-PAGE检测，在凝胶中只有共价荧光标记的SNAP蛋白携带信号，其在(b)中显示为暗带。泳道4和7中的另外的条带表明RAW和HEK283T细胞中大量的固有蛋白质以依赖Quicklase的方式与SNAP蛋白结合。(c)使用荧光显微镜检查表面修饰的RAW细胞，细胞表面上的亮点表明内在细胞膜的表面标记成功。具有与式III密切相关的氨基酸残基序列的某些内在蛋白质由于其优异的酶活性和更宽泛的序列重组能力而被认为是Quicklase。

具体实施方式

以下详细描述通过举例的方式涉及本发明可能实施的具体细节和实施方式。充分详细地描述这些实施方式以使本领域技术人员能够实施本发明。可以使用其他实施方式并且可以在不脱离本发明范围的情况下进行结构和逻辑的变化。多种实施方式不一定是相互排斥的，因为一些实施方式可以与一个或多个其他实施方式组合以形成新的实施方式。除非另有定义，否则本文使用的所有技术和科学术语的含义与本领域普通技术人员通常理解的含义相同。除非上下文另有明确说明，否则单数术语“一”，“一个”和“所述”包括复数指代物。类似地，除非上下文另有明确说明，否则“或”一词也包括“和”。术语“组成”表示“包括”。如有冲突，包括术语解释，以本说明书为准。

肽键的断裂和形成是蛋白质化学中的基本生化反应。与大量可利用的蛋白酶不同，快速作用的连接酶很少见。OaAEP1是从产大环寡肽的植物Oldenlandia affinis分离出的酶，尽管与其他天冬酰胺内肽酶(AEP)具有相似的结构折叠，但显现出微弱的肽环化酶活性。本申请的发明人在此报道了OaAEP1的第一个原子结构，处于其预激活形式，分辨率为该酶的结构和生化分析显示其激活机制和结构特征对其连接活性很重要。重要的是，通过OaAEP1的基于结构的诱变，本发明人获得了一种具有数百倍快的催化动力学的超快突变体，仅用亚微摩尔浓度的酶就可以连接折叠良好的蛋白质底物。相比之下，先前描述的原始野生型OaAEP1酶中的蛋白质-蛋白质连接活性非常弱。因此，本文所述的基于结构的生化基序的鉴定导致了独特且新颖的重组工具(具有SEQ ID NO:1所示的氨基酸序列的OaAEP1Cys247Ala)及其相关结构同源物的表征，现在可用来进行以前极具挑战性的各种蛋白质标记和修饰。例如，可以酶促催化更高效的肽环化和肽/蛋白质。此外，这种新型的重组酶及其结构同源物能够实现新的生化应用，如对固有细胞表面蛋白质的修饰。

本发明的目的是提供一种连接肽技术，利用OaAEP1 Cys247Ala型的ASX特异性蛋白连接酶的优越位点特异性和催化效率。

为此，本发明第一方面提供了形成式(I)的肽的方法

P¹-Asx-Xaa¹-Xaa²-P²(I)，

通过连接式(II)的第一肽

P¹-Asx-Xaa³-Leu-COOH/CONH₂(II)

至式(III)的第二肽

H₂N-Xaa¹-Xaa²-P²(III)，

通过酶促裂解该式(II)的第一肽中“Asx”和“Xaa³”之间的键，并通过该第一肽的C端将其片段P¹-Asx连接至该式(III)的第二肽的N端以形成式(I)的连接肽，其中，酶促裂解和连接反应由具有OaAEP1 Cys247Ala(SEQ ID NO：1)活性的肽连接酶在适于该裂解和连接反应的条件下催化。

在整个申请的上下文中，术语“肽”、“多肽”和“蛋白质”可互换使用，是指通过肽键连接的任意长度的氨基酸聚合物。该聚合物可包含经修饰的氨基酸，其可为直链或支链，并且可被非氨基酸打断。该术语还包括天然或人工修饰的氨基酸聚合物；例如，通过二硫键形成、糖基化、脂质化、乙酰化、磷酸化或任何其他操作，譬如结合到标签部分。然而，在优选的实施方式中，这些术语涉及如下定义的天然存在的氨基酸的聚合物，可以按照上述定义进行选择性修饰，但不包括聚合物主链中的非氨基酸部分。

术语“氨基酸”是指天然和/或非天然或合成氨基酸，包括D和L光学异构体、氨基酸类似物(例如正亮氨酸是亮氨酸的类似物)以及本领域已知的衍生物。本文所用的，术语“天然存在的氨基酸”是指20种天然存在的L-氨基酸，即Gly、Ala、Val、Leu、Ile、Phe、Cys、Met、Pro、Thr、Ser、Glu、Gln、Asp、Asn、His、Lys、Arg、Tyr和Trp。术语“肽键”是指在一个氨基酸的羧基和第二个氨基酸的氨基之间失去水分子而形成的共价酰胺键。式(I)中P¹和Asx之间的“-”以及式(I)中的所有“-”表示肽键。另外，“Leu-COOH/CONH₂”代表亮氨酸或亮氨酰胺，因此，式(II)中“Leu”和“COOH/CONH₂”之间的“-”表示α-碳与亮氨酸/亮氨酰胺的羧基或甲酰胺基团之间的共价键。同样的，式(III)中的“H₂N-Xaa¹”表示氨基酸残基Xaa¹，因此“NH₂”和“Xaa¹”之间的“-”表示α-碳与Xaa¹的氨基之间的共价键。应当理解的，式(II)肽的羧基/甲酰胺基团和式(III)肽的氨基形成末端氨基酸的一部分，而不是另外的官能团。通常，在本文描述的所有式中，肽以N到C端方向显示。

不希望受任何特定理论的束缚，相信如本文所述的具有OaAEP1 Cys247Ala(SEQID NO:1)活性的肽连接酶也可催化任意一种具有“Asx-Xaa³-Leu-COOH/CONH₂”基序末端的物质或对象，与任意一种具有“H₂N-Xaa¹-Xaa²”基序末端的物质或对象之间的连接。有鉴于此，应该注意的是，本文所述的方法也适用于经必要的变通后，其中P¹和P²中的一个或两个是除肽之外的任意物质或对象的实施方式也在本申请的范围内。

在多种实施方式中，

(a)Asx为Asp或Asn；和/或

(b)Xaa¹为所有天然存在的氨基酸；和/或

(c)Xaa²为Leu或Ile；和/或

在更优选地实施方式中，Asx为Asn，Xaa¹为Arg或Gly，Xaa²为Leu，Xaa³为His、Ala或Gly，意思是Asx为Asn，Xaa¹为Arg，Xaa²为Leu，Xaa³为His；Asx为Asn，Xaa¹为Arg，Xaa²为Leu，Xaa³为Ala；Asx为Asn，Xaa¹为Arg，Xaa²为Leu，Xaa³为Gly；Asx为Asn，Xaa¹为Gly，Xaa²为Leu，Xaa³为His；Asx为Asn，Xaa¹为Gly，Xaa²为Leu，Xaa³为Ala；或Asx为Asn，Xaa¹为Gly，Xaa²为Leu，Xaa³为Gly。

应注意，根据图11(b)，式(II)的第一肽的“Leu”残基，即P¹-Asx-Xaa³-Leu-COOH/CONH₂，也可以被另外的天然存在的氨基酸取代，例如Ile、Pro、Phe、Cys、Gln或Lys，前提是这种形式所述的肽适合于本文所述的方法。结合本文描述的任意实施方式的这些实施方式也完全包含在本申请中。

还设想当该第一肽和该第二肽是相同肽的末端时，即通过式(II)和(III)的序列，P¹和P²结合形成终止的肽的核心序列，本发明公开的方法环化所述肽。

本发明中使用的具有OaAEP1 Cys247Ala(SEQ ID NO：1)活性的肽连接酶可以是具有所需活性的任意oaAEP家族酶或其同源酶。肽连接酶具有位点特异性断裂肽键，然后与进入的亲核剂重新形成新键的能力。它是Asx特异性，因为发生连接反应的C端氨基酸，即连接肽的C-末端，可以是Asn或Asp，优选的是Asn。如上所述，在式(II)第一肽的C端识别基序Asx-Xaa³-Leu-COOH/CONH₂，并通过切断排序信号Xaa³-Leu-COOH/CONH₂介导肽连接，并将P¹-Asx与第二肽H₂N-Xaa¹-Xaa²-P²的N端残基连接，形成连接肽P¹-Asx-Xaa¹-Xaa²-P²。

在多种实施方式中，本申请中具有OaAEP1 Cys247Ala(SEQ ID NO：1)活性的肽连接酶包含、由以下组成或基本由以下组成：

(a)SEQ ID NO：1(OaAEP1 Cys247Ala)所示的氨基酸序列；

(b)与SEQ ID NO：1所述的氨基酸序列具有至少65％、优选地至少75％、甚至更优选地至少85％、最优选地至少95％的序列一致性，或至少80％、优选地至少90％、更优选地至少95％的序列同源性的氨基酸序列，前提为该肽连接酶包括对应于SEQ ID NO：1中残基247-264位置的SEQ ID NO：2所示的氨基酸序列，其定义了酶的独特表面结构特征，作为接近N端氨基的结合位点；

(c)(a)或(b)的一个功能片段；或

在多种实施方式中，具有OaAEP1 Cys247Ala(SEQ ID NO：1)活性的肽连接酶包含、由以下组成或基本由以下组成：

(a)SEQ ID NO:1所示的氨基酸序列；

(b)SEQ ID NO:5所示的氨基酸序列；

(c)SEQ ID NO:6所示的氨基酸序列；

(d)SEQ ID NO:7所示的氨基酸序列；

(e)SEQ ID NO:8所示的氨基酸序列；

(f)SEQ ID NO:9所示的氨基酸序列；

(g)SEQ ID NO:10所示的氨基酸序列；或

(h)SEQ ID NO:11所示的氨基酸序列；

在多种实施方式中，该连接肽酶包含或由SEQ ID NO：1(OaAEP1 Cys247Ala)所示的氨基酸序列组成。

核酸或氨基酸序列的识别通常通过序列比较来确定。该序列比较基于在现有技术中建立并常用的BLAST算法(参见例如Altschul et al.(1990)“Basic local alignmentsearch tool”，J.Mol.Biol.215：403-410)，以及Altschul et al.(1997):“Gapped BLASTand PSI-BLAST:a new generation of protein database search programs”；NucleicAcids Res.,25,p.3389-3402)并且原则上分别通过将核酸序列和氨基酸序列中的核苷酸或氨基酸的相似序列相互关联来实现。相关位置的表格关联被称为“对齐”。序列比较(对齐)，特别是多序列比较，通常使用本领域技术人员可获得和已知的计算机程序制备。

这种比较还可以说明被比较的序列之间的相似性。通常表示为百分比同一性，它是根据参考序列及其整个长度计算的。术语“序列同一性”是指在一个比较窗口的序列在核苷酸与核苷酸或氨基酸与氨基酸基础上的相同程度。因此，通过比较比较窗口上的两个最佳比对序列来计算“序列同一性百分比”，确定两个序列中相同的核酸碱基或氨基酸残基出现的位置的数量，得到匹配位置数，将匹配位置的数量除以比较窗口中位置的总数(即窗口大小)，并将结果乘以100得出序列同一性的百分比。在氨基酸序列中，更广泛地解释的术语“同源性”还包括对保守氨基酸替换的考虑，即具有相似化学活性的氨基酸，因为这些通常在蛋白质中具有类似的化学活性。因此，比较序列的相似性也可以表示为“百分比同源性”或“百分比相似性”。同一性和/或同源性的标识可以在整个多肽或基因上，或仅在单个区域出现。各种核酸序列或氨基酸序列的同源和相同区域通过序列匹配来明确。这些区域通常具有相同的功能。它们可能很小，并且仅包含几个核苷酸或氨基酸。这种小区域通常发挥对蛋白质整体活性至关重要的功能。因此，涉及将序列仅匹配至单个和任选的小区域可能很有用。然而，除非另有说明，否则本文中的同一性和同源性标识是指分别表示的核酸序列或氨基酸序列的全长。

虽然认识到如上所述的多种肽连接酶可适用于本发明的实施，但优选使用活性强有效的蛋白连接酶。在多种实施方式中，这意味着它可以以至少50％、优选地至少70％、更优选地至少90％、最优选地至少95％的效率连接给定肽。测定此类效率的方法通过，例如，在中性pH和室温下，所述肽连接酶(50nM)的存在下，在标准反应缓冲液中连接底物(100μM)30分钟，是本领域内众所周知的并且可以由本领域技术人员常规应用。优选地，本发明的肽连接酶具有SEQ ID NO:1的氨基酸序列的酶的蛋白连接酶活性的至少50％、更优选地至少70％、最优选地至少90％。

根据本申请，具有OaAEP1 Cys247Ala(SEQ ID NO：1)活性的肽连接酶可包含氨基酸修改，特别是氨基酸取代、插入或缺失。例如，这种肽连接酶通过靶向遗传修改，即通过突变方法，以及针对特定目的或关于特殊性质(例如，关于它们的催化活性，稳定性等)进行优化。其目的可能是将靶向突变，例如取代、插入或缺失，引入已知分子中以便改变底物特异性和/或提高催化活性。为此，特别是分子表面电荷和/或等电点，以及它们与底物的相互作用可以被改变。另外或替代地，肽连接酶的稳定性可以通过一个或多个相应的突变来增强，从而提高其催化性能。个别突变的有利特性，例如个别替换，可以互相补充。

在多种实施方式中，该肽连接酶的特征在于从如上所述的肽连接酶作为原始分子通过单个或多个保守氨基酸取代获得。术语“保守氨基酸取代”是指一个氨基酸残基与另一个氨基酸残基的替换(取代)，这种替换不会导致替换的氨基酸位置的极性或电荷的变化，例如，非极性氨基酸残基与另一个非极性氨基酸残基的替换。在本发明的上下文中的保守氨基酸取代包括，例如，G＝A＝S，I＝V＝L＝M，D＝E，N＝Q，K＝R，Y＝F和S＝T。

另外或替代地，该肽连接酶的特征在于从本文所述的肽连接酶作为原始分子通过片段化或通过缺失、插入或取代发生突变获得，并且包含一段长度上至少150、160、170、180、190、200、210、220、230、240、250、260、270、280、290或300个连续连接的氨基酸与原始分子匹配的氨基酸序列，前提为该肽连接酶包括对应于SEQ ID NO：1中残基247-264位置的SEQ ID NO：2所示的氨基酸序列。

在多种实施方式中，本发明还涉及本文所述的肽连接酶的功能片段，其中所述功能片段保留酶活性。优选的它们具有原始分子的蛋白质连接酶活性的至少50％，更优选地至少70％，最优选地至少90％，优选地该肽连接酶具有SEQ ID NO：1的氨基酸序列。该功能片段的长度优选地至少有150个氨基酸，更优选地至少180或200，最优选地至少250。

在多种实施方式中，根据本申请进行连接的肽可以修饰，例如，通过共价键或非共价键结合到标签部分。标签部分可以是任意分子，例如但不限于为亲和标签、治疗剂、可检测标签或骨架分子。

在多种实施方式中，该第一肽和/或第二肽可与固体载体材料连接。

本文所用的术语“亲和标签”是指诸如生物素，其可用于将亲和标签所附着的分子与不含亲和标签的其他分子分离。

术语“可检测标签”是指至少一个能够直接或间接产生可检测信号的标签。在非限制性实例中，可检测标签可以是产生可检测信号的酶，例如通过比色法，荧光或发光；发色团，例如荧光、发光或染料复合物，如GFP；电子密度的基团可通过电子显微镜或其电性进行检测，例如导电性、电流分析法、伏安法或阻抗；可检测基团，例如分子足够大以诱导其物理和/或化学特征的可检测修饰(这种检测可通过光学方法进行，如衍射、表面等离子体共振、表面变化或接触角变化，或物理方法，如原子力光谱或隧道效应；或放射性分子，如³²P，³⁵S或¹²⁵I。

本文所用的术语“骨架分子”是指以共价或非共价地连接其它部分的化合物。各种骨架分子如树枝状大分子是本领域熟知的。

本文所用的术语“固体载体材料”是指可将肽固定在其上的固体或半固体(例如水凝胶)材料。非限制性实例包括用于肽合成的固体载体、磁珠、玻璃纤维和树脂。

经标签部分修饰的肽可用合成有机化学领域技术人员已知的标准技术制备，或可参考相关文献推导。

在多种实施方式中，该第一肽/或第二肽是细胞表面蛋白，使得该方法导致细胞表面蛋白的修饰或标记并使细胞表面如此。

第二方面，本发明涉及一种制备一种或多种目标肽的二聚体、低聚体或多聚体的方法，该方法包括以下步骤：

(b)提供上述具有OaAEP1 Cys247Ala(SEQ ID NO：1)活性的肽连接酶；

(c)制备一种或多种目标肽、所述骨架分子和该具有OaAEP1 Cys247Ala(SEQ IDNO：1)活性的肽连接酶的混合物；

(d)使该混合物处于该具有OaAEP1 Cys247Ala(SEQ ID NO：1)活性的肽连接酶催化一种或多种目标肽与所述骨架分子连接的条件中。

在多种实施方式中，

(a)Asx为Asp或Asn；和/或

(b)Xaa¹为所有天然存在的氨基酸；和/或

(c)Xaa²为Leu或Ile；和/或

在更优选地实施方式中，Asx为Asn，Xaa¹为Arg或Gly，Xaa²为Leu，以及Xaa³为His、Ala或Gly。

图14(a)-(d)显示了如何根据一些非限制性实施例制备一种或多种目标肽的异源或同源二聚体、低聚体或多聚体。图14(e)-(i)显示了如何制备用于本发明的载体分子的一些非限制性实例。

第三方面，本发明涉及一种通过一种或多种目标肽修饰或标记靶细胞表面的方法，该方法包括以下步骤：

(b)提供具有OaAEP1 Cys247Ala(SEQ ID NO：1)活性的肽连接酶；

(c)使靶细胞与一种或多种目标肽和该具有OaAEP1 Cys247Ala(SEQ ID NO：1)活性的肽连接酶接触；

(d)使该靶细胞处于该具有OaAEP1 Cys247Ala(SEQ ID NO：1)活性的肽连接酶催化一种或多种目标肽与所述靶细胞的细胞表面蛋白质连接的条件中。

在具体实施方式中，具有SEQ ID NO：3的氨基酸序列的野生型OaAEP1也可用于该方法，其效率可能降低。

在多种实施方式中，

(a)Asx为Asp或Asn；和/或

(b)Xaa¹为所有天然存在的氨基酸；和/或

(c)Xaa²为Leu或Ile；和/或

在多种实施方式中，该方法还包括在步骤(d)之后从靶细胞中去除未连接的一种或多种肽。

一种或多种目标肽可被功能化以结合多种负载(cargo)分子。在多种实施方式中，一种或多种目标肽包括标签部分，如如上所述的亲和标签、治疗剂、可检测标签或骨架分子。一种或多种目标肽还可以与固体载体材料连接。

图15(a)显示了如何根据本发明的一个非限制性实施方式标记靶细胞。

本文所述的方法可适用于在试管内、体外或体内所有类型的细胞。靶细胞可以是任意原核或真核细胞，例如，细菌、酵母、植物或人体细胞；它可以是癌细胞、卵母细胞、胚胎干细胞、造血干细胞或任何其他分化或未分化的细胞，前提为靶细胞表达具有C端Asx-Xaa³-Leu-COOH/CONH₂或N端H₂N-Xaa¹-Xaa²残基的表面多肽，以获得一种或多种目标肽。

在优选地实施方式中，靶细胞表达适于与一种或多种目标肽连接的内源表面蛋白。然而，靶细胞也可以重组表达具有N端H₂N-Xaa¹-Xaa²或C端Asx-Xaa³-Leu-COOH/CONH₂残基的表面多肽，以便被目标肽标记。

本文所用的术语“重组表达”是指通过重组DNA技术表达所述多肽。

在本发明的范围内，一种或多种目标肽可以是内源性或在靶细胞表面重组表达的多肽，在这种情况下，不需要提供额外的所述肽，且本文所述的方法引起靶细胞表面蛋白的异源或同源二聚化、低聚化或多聚化。

因此，我们认为本发明提供了一种多用途和快速作用的技术，通过附着修饰或未修饰的目标肽来修饰或标记细胞表面。与传统的化学标记方法相比，该方法能够特异性和快速结合表面蛋白的N和/或C端。

第五方面，本发明涉及具有SEQ ID NO：1氨基酸序列的连接肽酶OaAEP1Cys247Ala和具有上述活性的其他肽连接酶，以及包含任何该肽连接酶的试剂盒，特别是OaAEP1Cys247Ala(SEQ ID NO:1)。

另一方面，本发明涉及如本文所述的用于连接两个肽的具有OaAEP1Cys247Ala(SEQ ID NO：1)活性的肽连接酶的用途。

通过以下实施例进一步说明本发明。然而，应该理解，本发明不限于示例性实施方式。

实施例

材料与方法

Quicklase的制备

OaAEP1作为泛素融合蛋白在大肠杆菌克隆和表达。具有在大肠杆菌中表达优化的密码子的基因，编码一种由N端6-His标签(SEQ ID NO:13)、76个氨基酸残基的人泛素(SEQID NO:14)以及OaAEP1的24-472位残基(SEQ ID NO:15，无OaAEP1信号肽)组成的蛋白质(SEQ ID NO:12)，通过美国Genescript合成。

该克隆是OaAEP1，有一个氨基酸与OaAEP1b(SEQ ID NO:3)不同(E371V突变)。OaAEP1从mRNA中克隆出来，OaAEP1b从基因组DNA序列中克隆出来。不过，本发明人的野生型结构(OaAEP1，SEQ ID NO:3)表现与之前报道的基本相同(OaAEP1b，具有E371V突变的SEQID NO:3)。

这种复合蛋白结构的氨基酸序列如图S1B所示。该基因插入pET-28b(+)载体的编码区(NcoI-NdeI)并扩增。OaAEP1在大肠杆菌中的重组表达(使用来自美国New EnglandBiolabs的Bl21DE3或T7 Shuffle)按照之前报道的方案进行，使用浓度0.4mM的IPTG，在16℃诱导蛋白表达20小时。然后在4℃下4000g离心15分钟以获得细胞，在含有50mM Tris-HCl、pH 7.4、150mM NaCl、0.05％(v/v)CHAPS、10％(v/v)甘油的溶解缓冲液中重悬。通过使均质化细胞在1500psi通过Emulsiflex-C3(Avestin，美国)高压装置三次进行裂解。使用Ni-NTA柱(Bio-Rad)通过金属亲和进一步纯化含有His-Ub-AEP-FL(SEQ ID NO：12)和Ub-AEP-FL(SEQ ID NO：15)的上清液部分。结合到柱子上的含有His标签的蛋白质在含有50mMTris-HCl、pH 8.0、150mM NaCl、0.05％(v/v)CHAPS、10％甘油的缓冲液中用0到500mM的线性咪唑梯度洗脱。将含有蛋白质的NI-NTA洗脱级分稀释并装入两个串联的5ml HiTrap QSepharose高性能柱(GE Healthcare；每毫升树脂2毫升样品)。用0-30％连续盐梯度的缓冲液B：20mM双三丙烷、2M NaCl、pH 7洗脱结合蛋白。最后，蛋白质通过PBS缓冲液已经预平衡的SEC柱纯化。

为了自激活OaAEP1，将1mM EDTA和0.5mM三(2-羧基乙基)膦盐酸盐加入到未成熟蛋白质中，并用冰醋酸将溶液pH调至4。合并包含蛋白质(通过SDS-PADE分析)的级分并在室温或37℃培养3-16小时。在此pH下蛋白质沉淀以通过离心除去大部分受污染的蛋白质。激活的蛋白通过使用50kDa截止浓缩器(Sartorius)超速离心浓缩并在-80℃储存。

野生型和突变体的泛素(其C末端包括附加的“NGL”序列)和SNAP标签(NewEngland Biolabs)在pET47b载体中克隆并在Bl21(DE3)大肠杆菌细胞中表达。如上所述，使用Ni-NTA通过金属亲和进行纯化。这之后用Prescission蛋白酶(GE healthcare)消化以去除N端6-His标签以及SEC纯化。使用Kapa-Hifi聚合酶(Kapa Biosystems)和两个彼此远离、方向相反的引物进行突变。

使用AEP-C247A-Mut引物：CACCACCGAAAGCAGCTGGGCCTACTATTGC CCGGCGC(SEQ IDNO:16)，通过突变PCR获得Cys247Ala突变体。

肽和肽环化试验

天然的和修饰的氨基酸购于Sigma-Aldrich(美国)。本文使用的所有肽使用固相法和HPLC纯化在内部合成。在包含20mM磷酸盐缓冲液、连接酶(5-700nM)以及肽底物(10-300μM)的50μl反应混合物中进行环化试验。每个反应在37℃进行三次并通过添加5μl 1MHCl溶液猝灭。在Nexera UHPLC系统(Shimadzu)中，使用反相C18分析柱(150×2.1mm，Vydac)在10％-15％乙腈线性梯度下15分钟分离肽。对于动力学分析，野生型OaAEP1(WTOaAEP1)、突变体OaAEP1(mutant OaAEP1)以及butelase 1的浓度分别固定在700nM、50nM和20nM。通过将保留的线性前体或环化的产物的HPLC峰面积转换为浓度来计算环化速度。每个HPLC峰的特征通过MALDI-TOF MS(ABI 4800MALDI TOF/TOF)分析。将该速度输入至GraphPad Prism(GraphPad软件，圣地亚哥)以获得米氏方程曲线和动力学参数(kcat和Km)。在20μl体积的反应混合物中进行各种OaAEP1突变体环化效率的比较并在10分钟或1小时连接反应后通过MALDI-TOF MS分析。

为了快速评价Quicklase的底物特异性，使用100μM肽底物(Xaa¹Xaa²YRRGRLYRRNXaa³Xaa⁴，(SEQ ID NO:17)以及50nM Quicklase在中性pH(pH 7.4)标准反应液中，室温反应5分钟。自连接(环化)肽的百分比作为Kcat的定性指标。在每次筛选中，仅一个残基被修饰；在此次筛选中(图11)，默认的氨基酸在Xaa¹位置是Gly、Xaa²位置是Leu、Xaa³位置是Gly、Xaa⁴位置是Leu。

本文所述的Sequence ID NO和详细氨基酸序列的列表

1、SEQ ID NO:1

通用名称：OaAEP1 Cys247Ala(Quicklase)

来源：Ovaloparmena affinis

序列：

MVRYLAGAVLLLVVLSVAAAVSGARDGDYLHLPSEVSRFFRPQETNDDHGEDSVGTRWAVLIAGSKGYANYRHQAGVCHAYQILKRGGLKDENIVVFMYDDIAYNESNPRPGVIINSPHGSDVYAGVPKDYTGEEVNAKNFLAAILGNKSAITGGSGKVVDSGPNDHIFIYYTDHGAAGVIGMPSKPYLYADELNDALKKKHASGTYKSLVFYLEACESGSMFEGILPEDLNIYALTSTNTTESSWAYYCPAQENPPPPEYNVCLGDLFSVAWLEDSDVQNSWYETLNQQYHHVDKRISHASHATQYGNLKLGEEGLFVYMGSNPANDNYTSLDGNALTPSSIVVNQRDADLLHLWEKFRKAPEGSARKEEAQTQIFKAMSHRVHIDSSIKLIGKLLFGIEKCTEILNAVRPAGQPLVDDWACLRSLVGTFETHCGSLSEYGMRHTRTIANICNAGISEEQMAEAASQACASIP

2、SEQ ID NO:2

通用名称：对应于SEQ ID NO:1的残基247-264位置负责有效的蛋白质连接的关键结构基序

来源：基于本申请结构分析

序列：

(G/A/S/C)²⁴⁷-X-Y-C²⁵⁰-P-X-X-X-X-X-P-P-P-E-Y-X-X-C²⁶⁴

*X表示不破坏剩余的保守氨基酸的结构折叠的任意氨基酸。

**此结构基序中247位的小氨基酸(Gly、Ala、Ser或Cys)允许有效的蛋白质连接。Cys250和Cys264之间的半胱氨酸二硫键稳定此结构基序。

3、SEQ ID NO:3

通用名称：野生型OaAEP1

来源：Ovaloparmena affinis

序列：

MVRYLAGAVLLLVVLSVAAAVSGARDGDYLHLPSEVSRFFRPQETNDDHGEDSVGTRWAVLIAGSKGYANYRHQAGVCHAYQILKRGGLKDENIVVFMYDDIAYNESNPRPGVIINSPHGSDVYAGVPKDYTGEEVNAKNFLAAILGNKSAITGGSGKVVDSGPNDHIFIYYTDHGAAGVIGMPSKPYLYADELNDALKKKHASGTYKSLVFYLEACESGSMFEGILPEDLNIYALTSTNTTESSWCYYCPAQENPPPPEYNVCLGDLFSVAWLEDSDVQNSWYETLNQQYHHVDKRISHASHATQYGNLKLGEEGLFVYMGSNPANDNYTSLDGNALTPSSIVVNQRDADLLHLWEKFRKAPEGSARKEEAQTQIFKAMSHRVHIDSSIKLIGKLLFGIEKCTEILNAVRPAGQPLVDDWACLRSLVGTFETHCGSLSEYGMRHTRTIANICNAGISEEQMAEAASQACASIP

4、SEQ ID NO:4

通用名称：来自蝶豆中的AEP1，butelase 1

来源：蝶豆

序列：

IRDDFLRLPSQASKFFQADDNVEGTRWAVLVAGSKGYVNYRHQADVCHAYQILKKGGLKDENIIVFMYDDIAYNESNPHPGVIINHPYGSDVYKGVPKDYVG EDINPPNFYAVLLANKSALTGTGSGKVLDSGPNDHVFIYYTDHGGAGVLGMPSKPYIAASDLNDVLKKKHASGTYKSIVFYVESCESGSMFDGLLPEDHNIYVMGASDTGESSWVTYCPLQHPSPPPEYDVCVGDLFSVAWLEDCDVHNLQTETFQQQYEVVKNKTIVALIEDGTHVVQYGDVGLSKQTLFVYMGTDPANDNNTFTDKNSLGTPRKAVSQRDADLIHYWEKYRRAPEGSSRKAEAKKQLREVMAHRMHIDNSVKHIGKLLFGIEKGHKMLNNVRPAGLPVVDDWDCFKTLIRTFETHCGSLSEYGMKHMRSFANLCNAGIRKEQMAEASAQACVSIPDNPWSSLHAGFSV

5、SEQ ID NO:5

通用名称：来自咖啡中的非典型的AEP[CDP08231.1]

来源：中粒种咖啡(Coffea canephora)

序列：

MMRYATAALLLLALSIIAVAEARDNFLKLPSEIADFFHPKERSDAGGDSVGTRWAVLIAGSNGYWNYRHQADVCHAYQILKRGGLKDENIVVFMYDDIAYNEENPRPGVIINSPHGADVYQGVPKDYTGDDVNAKNFLAAILGDKTAITGGSGKVVDSGPNDHIFIYYTDHGGPGVLGTPSGPYLYADDLNEVLKKKHASGTYKSLVFYLEACESGSIFEGLLPEDLNIYATTASNAEESSWGTYCPGEYPSPPPEYETCLGDLYSVAWMEDSEIHNLHTETLKQQYHLVKKRTSSSNSAYGSHVMQYGDLKLSLEDLFLYMGTNPANDNYTFVDENSLRPSSKAVNQRDADLLHFWDKFRKAPEGSARKVEAQKQVVEAMSHRMHIDNSVKLIGKLLFGIEKGSEILNSVRPAGHPLADDWDCLKSLVRTFETHCGSLSQYGMKHMRSIANICNAGIKKDQMAEAAAQACVSLPSNSWSSLHRGFSA

6、SEQ ID NO:6

通用名称：非典型酶[XP_017229093.1]

来源：黄胡萝卜(Daucus carota subsp.sativus)

序列：

MVRYLAGAVALLVVVSISAVVESRRDIVGDVLKLPSEVSSFFRPVAEEEDSVGTRWAVLIAGSNGYWNYRHQADICHAYQLLRRGGVKEENIVVFMYDDIAYDEENPRPGVIINSPHGSDVYKGVPKDYTGEDVTVNNVFAAILGDKSATTGGSGKVVDSGPNDHIFIYYSDHGGPGVLGMPTNPYMYAGDLVDVLKKKHASGTYKS MVFYLEACESGSIFEGLLPEGLNIYATTASNAYESSWGTYCPGEYPSPPPEYETCLGDLYSVAWMEDSDIHNLRTETLRQQYQQVKKRTSNDNSGWGSHVMQYGDLKLSTEELFMYMGTNPANDNFTFVDDNSLRLSSSKAVNQRDADLLHFWDKYRKAPEGSDRKIAAQKQFSEAMSHRMHLDNSIQLIGKLLFGIDTASEVLTTVRPSGQPLVDDWLCLKKLVRTFETYCGSLSQYGMKHMRSIANICNAGISEEQMSEASAQACVTFPSNPWSSVNKGFTA

7、SEQ ID NO:7

通用名称：肽酶C13，豆荚蛋白[OMO66906.1]

来源：圆果种黄麻(Corchorus capsularis)

序列：

MTRLVAGVILLLLSVTGIVSAGRDATGDVLRLPSEASRFFRPSDDDEVGTRWAVLIAGSNGYWNYRHQADVCHAYQLLKKGGLKDENIIVFMYDDIAYNYENPRQGIIINSPHGDDVYQGVPKDYTGEEVTVHNFLAAILGNKTAITGGSGKVVDSGPNDHIFIYYTDHGGPGVLGMPTYPYLYADELIDTLKKKHASGTYKSLVFYLEACESGSIFEGLLPEGLNIYATTASNADESSWGTYCPGEYPSPPPEYETCLGDLYSVAWMEDSDLHNLRTETLHQQYELVKRRTLNGNSAYGSHVMQYGDVGLAKEHLFLYLGTNPANDNFTFIDENSLQPPAKAVNQRDADLVHFWDKYRKAPDGSARKVEAQKQVVEAMSHRMHVDNSIQLIGKLLFGIERGADVLKTVRPAGQPLVDDWKCLKSMVRTFETHCGSLAQYGMKHMRSIANICNAGIQTEQIAEASAQACVSIPSGQWSSIQKGFSA

8、SEQ ID NO:8

通用名称：肽酶C13，豆荚蛋白[OMO86616.1]

来源：长蒴黄麻(Corchorus olitorius)

序列：

MTRLVAGVILLLLSVTGIASAGRDATGDVLRLPSEASRFFRPSDDDEVGTRWAVLIAGSNGYWNYRHQADVCHAYQLLKKGGLKDENIIVFMYDDIAFNYENPRQGIIINSPHGDDVYQDVPKDYTGEEVTVHNFLAAILGNKTAIKGGSGKVVDSGPNDHIFIYYTDHGGPGVLGMPTYPYLYADELIDTLKKKHASGTYKSLVFYLEACESGSIFEGLLPEGLNIYATTASNADESSWGTYCPGEYPSPPPEYETCLGDLYS VAWMEDSDLHNLRTETLHQQYELVKRRTLNGNSAYGSHVMQYGDVGLAKEHLFLYLGTNPANDNFTFIDENSLQPPAKAVNQRDADLVHFWDKYRKAPDGSVRKVEAQKQVVEAMSHRMHVDNSIQLIGKLLFGIERGADVLKTVRPAGQPLVDDWKCLKSMVRTFETHCGSLAQYGMKHMRSIANICNAGIQTEQMAEASSQACVSIPSGQWSSIQKGFSA

9、SEQ ID NO:9

通用名称：液泡加工酶[XP_012077326.1]

来源：麻疯树(Jatropha curcas)

序列：

MTRLATGVILLLLALCVVSSAGSRDIVGDVLRLPSEASRFFRPGGAHVAKEDDSTGTRWAILIAGSNGYWNYRHQADVCHAYQLLKKGGLKDENIIVFMYDDIAFNKENPRPGVIINNPYGEDVYKGVPKDYTGEDVNVNNFFAAILGNKTAITGGSGKVVDSGPNDHIFIYYTDHGGPGVLGMPTNPYLYANDLIDVLIKKHASGTYKSLVFYLEACESGSIFEGLLPEGLNIYATTAANAEESSWGTYCPGEYPSPPPEYETCLGDLYSVAWMEDSDVHNLQTETLRQQYQLVKRRTANGNSAYGSHVMQYGDVGLSKDNLFLYMGTNPANENYTFVDENSLRPPSKAVNQRDADLVHFWDKYRKAPDGSTRKIQAQKQFVEAMSHRMHLDHSMKLIGKLLFGIGKGSEVLNAIRPAGQPLVDDWVCLKTLVRTFETHCGSLSQYGMKHMRSLANLCNAGIREDQMAEASAQACVSIPSGPWSSLHKGFSA

10、SEQ ID NO:10

通用名称：非典型酶[AGC94758.1]

来源：平邑甜茶(Malus hupehensis)

序列：

MTRLASAVVLLFLASVLASAAGSRDLIGDVLRLPSEASRFFGRGDDAPDQQDDGTVGTRWAVLIAGSNGYWNYRHQADICHAYQLLKKGGLKDENIVVFMYDDIAYNEENPRQGVIINSPHGSDVYEGVPKDYTGEDVTVNNFFAAILGNKTALTGGSGKVVDSGPNDHIFIYYTDHGGPGILGMPTSPYIYANDLIEVLKKKHAAGTYRSLVFYLEACESGSIFEGLLPEGLNIFATTASNAEESSWGTYCPGEYPSPPPEYDTCLGDLYSVAWMEDSDVHNLRSETLHQQYELVKTRAANDNSGSGSHVMQYG DVGLSKNNLFVYMGTNPANDNYTFLGENSLRPSSKAVNQRDADLLHFWHKYRKAPEGSARKIQAQKDFVEAMSHRMHIDQTMKLIGKLLFGIEKGPQVLNAVRPAGQPLVDDWDCLKTMVRSFETHCGSLSQYGMKHMRSLANICNAGMTQEQMAEASAQACVSAPSGRWSSLHRGFSA

11、SEQ ID NO:11

通用名称：类似液泡加工酶[XP_009361606.1]

来源：Pyrus x bretschneideri

序列：

MTRFAGAVVLLFLASVLASAAGSRDLIGDVLRLPSEASRFFGRGDDAPDQQDDGTVGTRWAVLIAGSNGYWNYRHQADICHAYQLLKKGGLKDENIVVFMYDDIAYNEENPRQGVIINNPQGSDVYEGVPKDYTGEDVTVNNFFAAILGNKTALTGGSGKVVDSGPNDHIFIYYTDHGGPGVLGMPTSPYIYANDLIEVLKKKHAAGTYKSLVFYLEACESGSIFEGLLPEGLNIFATTASNAEESSWGTYCPGEYPSPPPEYETCLGDLYSVAWMEDSDIHNLRSETLHQQYELVKTRTANDNYGFGSHVMQYGDVGLSKNNLFVYMGTNPANDNYTFLGENSLRPSSKAVNQRDADLLHFWHKYRKAPEGSARKVQAQKDFVEAMSHRMHIDQTMKLIGKLLFGIEKGPQVLNAVRPAGQPLVDDWDCLKTMVRSFETHCGSLSQYGMKHMRSLANICNAGMTQEQMAEASAQACVSAPSSRWSSLHRGFSA

12、SEQ ID NO:12

通用名称：野生型OaAEP1(SEQ ID NO:3)重组表达构建

序列：

MGMAHHHHHHMQIFVKTLTGKTITLEVEPSDTIENVKAKIQDKEGIPPDQQRLIFAGKQLEDGRTLSDYNIQKESTLHLVLRLRGGARDGDYLHLPSEVSRFFRPQETNDDHGEDSVGTRWAVLIAGSKGYANYRHQAGVCHAYQILKRGGLKDENIVVFMYDDIAYNESNPRPGVIINSPHGSDVYAGVPKDYTGEEVNAKNFLAAILGNKSAITGGSGKVVDSGPNDHIFIYYTDHGAAGVIGMPSKPYLYADELNDALKKKHASGTYKSLVFYLEACESGSMFEGILPEDLNIYALTSTNTTESSWCYYCPAQENPPPPEYNVCLGDLFSVAWLEDSDVQNSWYETLNQQYHHVDKRISHASHATQYGNLKLGEEGLFVYMGSNPANDNYTSLDGNALTPSSIVVNQRDADLLHLWEK FRKAPEGSARKEEAQTQIFKAMSHRVHIDSSIKLIGKLLFGIEKCTEILNAVRPAGQPLVDDWACLRSLVGTFETHCGSLSEYGMRHTRTIANICNAGISEEQMAEAASQACASIP

13、SEQ ID NO:13

通用名称：6-His标签(重组)

序列：

MGMAHHHHHH

14、SEQ ID NO:14

通用名称：用于协助重组蛋白质表达的泛素标签(重组)

序列：

MQIFVKTLTGKTITLEVEPSDTIENVKAKIQDKEGIPPDQQRLIFAGKQLEDGRTLSDYNIQKESTLHLVLRLRGG

15、SEQ ID NO:15

通用名称：野生型OaAEP1的预激活形式(在本申请中构建结晶，PDB代码：5H0I)

序列：

ARGDYLHLPSEVSRFFRPQETNDDHGEDSVGTRWAVLIAGSKGYANYRHQAGVCHAYQILKRGGLKDENIVVFMYDDIAYNESNPRPGVIINSPHGSDVYAGVPKDYTGEEVNAKNFLAAILGNKSAITGGSGKVVDSGPNDHIFIYYTDHGAAGVIGMPSKPYLYADELNDALKKKHASGTYKSLVFYLEACESGSMFEGILPEDLNIYALTSTNTTESSWCYYCPAQENPPPPEYNVCLGDLFSVAWLEDSDVQNSWYETLNQQYHHVDKRISHASHATQYGNLKLGEEGLFVYMGSNPANDNYTSLDGNALTPSSIVVNQRDADLLHLWEKFRKAPEGSARKEEAQTQIFKAMSHRVHIDSSIKLIGKLLFGIEKCTEILNAVRPAGQPLVDDWACLRSLVGTFETHCGSLSEYGMRHTRTIANICNAGISEEQMAEAASQACASIP

16、SEQ ID NO:16

通用名称：AEP-C247A-Mut，用于突变的引物，将Seq ID NO:3转换为Seq ID NO:1

序列：CACCACCGAAAGCAGCTGGGCCTACTATTGCCCGGCGC

17、SEQ ID NO:17

通用名称：用于表征Quicklase识别序列特异性的肽模板

序列：Xaa¹Xaa²YRRGRLYRRNXaa³Xaa⁴

*在每次筛选中，仅一个残基被修饰；在此次筛选中，默认的氨基酸在Xaa¹位置是Gly、Xaa²位置是Leu、Xaa³位置是Gly、Xaa⁴位置是Leu。

实施例1：Quicklase OaAEP1介导肽连接

AEP型植物肽连接酶有保守蛋白质架构，在人豆荚蛋白(hlegum)肽链内切酶也存在(Ishii,S.,Methods Enzymol,1994.244:p.604-15；Chen,J.M.,et al.,J Biol Chem,1997.272(12):p.8090-8)。植物AEP有一个～20-30氨基酸的N端信号序列，其指导它们至植物液泡室，然后是一个酶核心区域。在该核心区域的C端，一个～130残基“帽(cap)”或原结构域完全覆盖活性位点，使未成熟蛋白保持在不活跃的酶原状态。该核心和原结构域通过一个“接头(linker)”连接，该接头定义为跨越蛋白质残基325-346(图2a)。植物AEP酶活性的激活需要在约为3.7的酸性pH下进行蛋白质水解成熟，此时域通过核心区域自身的解蛋白活性顺式或在环境存在的激活的Asx蛋白酶反式切割原结构域，并从核心区域释放。接头和原结构域内明确的裂解位点导致形成的成熟的活性植物AEP连接酶仍然很难表征。至于butelase 1，Asn383是假定的构成切割cap区的位点(Nguyen,G.K.,et al.,Nat ChemBiol,2014.10(9):p.732-8)，而OaAEP1的一些潜在的切割位点横跨蛋白质区域328-351(图2a和图7)(Harris,K.S.,et al.,Nat Commun,2015.6:p.10199)。植物AEP型连接酶和AEP肽连接酶例如hlegum的氨基酸序列比对显示催化口袋中一些进化保守残基的存在(图7)(Nguyen,G.K.,et al.,Nat Chem Biol,2014.10(9):p.732-8；Harris,K.S.,et al.,NatCommun,2015.6:p.10199；Dall,E.,et al.,Angew Chem Int Ed Engl,2015.54(10):p.2917-21；Dall,E.and H.Brandstetter,Biochimie,2016.122:p.126-50；Saska,I.,etal.,J Biol Chem,2007.282(40):p.29721-8)。因此，什么决定了这些密切相似的酶如何优先作为连接酶或蛋白酶发挥作用仍不清楚。本文报道了一种OaAEP1在其酶原形式的晶体结构，揭示了如何将原结构域N端的Gln347残基的酰胺基容纳至催化口袋中。基于OaAEP1的结构，形成一系列的OaAEP1突变体以更好的理解植物AEP连接酶的激活机理和催化活性。发现346-351部分对突变体OaAEP1b起关键作用，因为这个部分中突变的Asx残基严重破坏AEP连接酶活性。一个调节OaAEP1肽连接活性的效率的主要决定因素是残基247的侧链，其临近催化对Cys217-His175，在此位置上较大的侧链完全消除了连接酶活性，而较小的侧链允许连接反应以更快的速度发生。因此，证明了OaAEP1的单个Cys247Ala突变体具有比野生型OaAEP1酶快～160倍的肽连接酶催化活性，与从植物中提取的butelase 1相当。还显示了仅使用亚微摩尔浓度的重组酶，Cys247Ala就可以有效地催化两种折叠良好的蛋白质(泛素和SNAP标签蛋白)的连接。

更详细地：

如前所述OaAEP1作为泛素融合蛋白在大肠杆菌中克隆和表达(图2)(Harris,K.S.,et al.,Nat Commun,2015.6:p.10199)。利用离子交换和尺寸排阻色谱(SEC)，获得适于酶和结构分析的足量纯蛋白(图2b)。在纯化的中性pH(pH＝7.4)下，OaAEP1主要以异二聚体形式存在，其中两种单体是酶原形式，但仅一个单体另外保留了泛素和N端His标签，而在另外一个单体中的融合部分被切割(图2b和图2c中标记为“His-Ub-AEP-FL”和“AEP-FL”)。这种异二聚体进行环化实验用于结构研究(见下文)。和参考文献一致(Harris,K.S.,etal.,Nat Commun,2015.6:p.10199)，OaAEP1激活的最适pH值在3.4-4.0范围内(图2d)。激活后，根据SEC分析OaAEP1在溶液中转变成单体(图2c中的“AEP-holo”)。为了检测反式激活的蛋白质的能力，催化残基Cys217突变为Ser217。不出所料，Cys217Ser突变体仅表现出背景水平的激活和连接酶活性(图2e)。然而，通过添加仅10％的野生型OaAEP1至不活跃的突变体中就可以以反式方式挽救不活跃的突变体的激活(图2e)。这表明在OaAEP1激活中有相似的反式裂解处理活动，Cys217是顺式和反式激活的活性位点残基。

在第三代同步加速器上获得分辨率为的OaAEP1的晶体衍射(表1和图3)。尽管OaAEP1异二聚体作为原始材料，但晶体结构揭示了一个同源二聚体，其中N端(His)₆标签和泛素融合蛋白以及信号肽序列已从不对称单元中存在的两个单体中释放，这表明在结晶过程中N端蛋白质水解(图3a和d)。通过两个cap区之间的分子内相互作用稳定OaAEP1二聚体。这与SEC分析(图2c)一致，显示含cap区的酶的预激活形式在中性pH下是二聚体，而缺少cap区的激活形式是单体。因此，溶解OaAEP1晶体的SDS PAGE表明了总相对分子质量大约为49.7kDa的酶核心和C端原结构域的存在，支持了结晶酶是一个未成熟形式的假设。OaAEP1核心由6-股β-折叠形成，其周围有6个α-螺旋环绕(Dall,E.,et al.,Angew Chem Int EdEngl,2015.54(10):p.2917-21；Dall,E.and H.Brandstetter,Proc Natl Acad Sci U SA,2013.110(27):p.10940-5；Zhao,L.,et al.,Cell Res,2014.24(3):p.344-58)。在图3a中显示的结构的整体视图揭示了α-螺旋cap区(跨越残基347-474)完全覆盖催化裂口，显示了cap的释放需要获得肽或蛋白质底物。OaAEP1催化位点含有一些在其他AEP中存在的残基，包括Cys217-His175催化对(hlegum中Cys189-His148)和His45-Asp147，其与连接至半胱氨酸蛋白酶抑制剂E(PDB代码：4N6O)的hlegum的His73-Asp174重叠(图4)。在这里发现了hlegum酶原形式(PDB代码：4NOK)和OaAEP1残基在接头区域明显的不同：在prolegumain结构中，接头短且有序，而在OaAEP1结构(图3a)中是长且灵活：在325-343之间的19个残基不存在电子密度，尽管这个部分存在在晶体蛋白中(图2b)。

表1：数据收集和细化统计

*括号中的数字表示最后(最高)分辨率壳层。

^a R_merge＝∑|I_j-<I>|/∑I_j，其中I_j是个体反射强度，<I>是的平均反射强度。

^c R_work＝∑||F_o|-|F_c||/∑|F_c|，其中F_o是观测到的结构因子振幅，F_c是根据模型计算出的结构因子振幅。

^d R_free与R_work相同，但计算时忽略了细化中的5％(3044)随机选择的反射。

虽然接头区域残基325-343因其柔性在电子密度图不可见，但残基Val344-Val345-Asn346-Gln347在cap和核心区域之间的界面被捕获(图3c和4a)。值得注意的是，它们的方向与和hlegum催化位点Cys189(图3e，PDB代码：4AWA)共价连接的Ac-Tyr-Val-Ala-Asp-氯甲基酮肽抑制剂紧密重叠(Dall,E.and H.Brandstetter,Proc Natl Acad Sci U SA,2013.110(27):p.10940-5.)。然而，残基Gln347深入贯穿S1口袋以使它的酰胺基占领Ac-Tyr-Val-Ala-Asp-氯甲基酮肽蛋白酶抑制剂中Asp残基的羧基位置，该抑制剂共价结合hlegum和周围活性位点残基形成一些相互作用(图4a和4b)。因此，本发明的晶体结构能够作为一种描绘预连接构象的有用的模型，其中接头残基344-347模拟与活性位点结合的N端底物受体。

尽管在其他AEP中，在P1位置的Asx是进行处理的最有利的残基，但Gln347的羰基基团位于攻击的Cys217硫中心的距离，表明前蛋白的346-351部分可能含有在成熟中使用的自动切割的位点。由于环化条件与OaAEP1激活兼容，本发明的晶体结构有可能已经捕获了发生在激活途径中的构象状态之一。为了确认Gln347是否属于在自激活中识别和切割部分，进行靶向OaAEP1蛋白质区域346-351的突变实验(图4c)。在OaAEP1自激活中Gln347的作用通过改变该残基为Ala进行特别评估，并检测酶激活是否丧失。发现对突变体酶激活仅一点影响(图4c)。接着靶向紧挨着Gln347的残基Asn346、Asp349和Asp351。尽管两个OaAEP1双点突变体Asn346Ala-Gln347Ala和Asp349Ala-Asp351Ala以及Asn346Ala-Asp349Ala-Asp351Ala三点突变体仍可被激活，但Asn346Ala-Gln347Ala-Asp349Ala-Asp351Ala有显著受损的自激活活性(图4c中泳道“A4”)。重要的是，当野生型酶添加至反应混合物时，不能反式挽救4-Ala突变体的激活。因此，反式激活需要在接头部分中存在四个Asx/Gln残基中至少一个(略微优选Asp349或Asp351)。总之，这些数据表明本发明晶体结构代表在接头区域在催化位点被捕获的一个中间构象状态，模拟了底物结合的预连接复合物。

然后成熟的OaAEP1的肽环化活性通过质谱和肽底物“GLPVSTKPVATRNGL”分析(图5a)。OaAEP1的转换速度(k_cat)是0.052s^-1，和之前报道的值非常一致(Harris,K.S.,et al.,Nat Commun,2015.6:p.10199)。同样的，从植物提取的butelase 1的环化活性通过15个残基肽“GLPVSTKPVATRNHV”测定，导致k_cat比OaAEP1b快约90倍。

然后分析在本发明的结构中捕获的OaAEP1预连接构象，确定一些关键特征以能区分AEP蛋白酶和AEP型连接酶。和之前报道的蛋白水解的AEP抑制剂复合物(PDB代码：4AWA)并行比较，揭示了AEP型连接酶特有的有趣的结构特征。与AEP蛋白酶不同，面对催化Cys217的OaAEP1的表面似乎更广泛地打开。三个半胱氨酸残基(Cys247,Cys250,Cys264)排列在酶表面的浅裂口(图3c和3e)。与含有一些凸起的AEP蛋白酶的表面不同，butelase 1(使用基于OaAEP1b的同源模型)和OaAEP1沿这块有较小的侧链残基。在Cys250和Cys264之间形成的二硫键，在AEP型连接酶butelase 1和OaAEP1b中是保守的。这个共价键有可能稳定局部结构并提供足够的表面，以使N端胺基进入的基团进入。相反地，AEP蛋白酶((PDB：4AWA)相应的表面路径排列有堵塞该通道的如Tyr的大侧链残基(图3e)。因此，假定位于底物通道末端的残基Cys247可能作为最终的亲核试剂过滤器(或“看门基团(gate-keeper)”)发挥作用，允许来自N端胺基的攻击完成连接反应。为了检测在“看门基团”位置处各种侧链对连接反应的影响，进行一系列的点突变，其中Cys247突变为Gly、Ala、Val、Ser、Thr、Met、Leu以及Ile(图5)。相应突变蛋白的活性揭示了侧链的大小对连接活性的确起到关键作用。值得注意的是，与野生型OaAEP1相比，Cys247Ala突变体表现出显著改善的酶学性质(图5d)。这个表现型归因于更合适容纳进入的胺基的较小侧链的存在，而Cys247Gly突变体使局部构象不稳定并对连接酶活性产生负面影响。进一步研究显示如果可用的N端胺基乙酰化，Cys247Gly催化肽水解作为替代反应(图10)。至于Cys247Ala突变体，如果存在不可用N端胺，则更优选侧链连接，Ala较不亲水，不利于水进入催化路径引起中间硫酯键的水解。当N端胺未被保护时，骨架连接比任何替代反应相比更有利。

值得注意的是，Cys247Ala表现出比亲本野生型OaAEP1蛋白质改善的酶学性质：它的k_cat高于野生型OaAEP1b近160倍，使其作为用于多种具有挑战的蛋白质工程和标签应用的引人注目的工具。首先检测Cys247Ala用于连接泛素和肽的能力。“Asn-Gly-Leu”三个残基添加在泛素的C端以使其能被Cys247Ala识别。另一个具有N端残基GlyLeu的肽作为附加组分。在蛋白质：肽摩尔比为1:5时，10分钟内Cys247Ala催化超过90％泛素和肽的连接(图6)。与通过需要进行有效连接的10-30μM转肽酶A相比，30nM Cys247Ala的量足以用于反应。为了进一步证明Cys247Ala的潜力，也检测了两个折叠良好的蛋白之间的连接。在其C末端有相同“Asn-Gly-Leu”修饰的泛素以及N端修饰SNAP(NEB)标签蛋白作为底物。使用5μM的SNAP标签蛋白和8μM的泛素，10nM Cys247Ala能够连接超过60％的单个底物蛋白形成一个连接的单一多肽产物，表明催化蛋白连接是高效且不可逆的(图6)。蛋白质连接在中性pH和室温中数分钟就能进行。值得注意的是，Cys247Ala催化两个折叠蛋白连接的效率与其连接一个蛋白质和一个肽的能力相当，表明其开放的结合位点能够容纳两个大体积的蛋白质底物而不会妨碍连接过程。控制连接实验显示了蛋白质连接活性仅能在Cys247Ala蛋白的存在使观察到，不能在OaAEP1野生型结构体中观察到(图6)。这进一步证明了看门基团残基在调节蛋白质底物通路中发挥重要作用。

转肽酶A和butelase 1均可用于进行肽连接。然而，这两个每都有一些缺点。转肽酶A需要Ca²⁺，速度缓慢并且需要识别更长、更灵活的C端序列(LPXTG)。尽管通过大量的突变研究，鉴定了一些改善其动力学的突变体，但连接两个折叠良好的蛋白质的催化作用仍很低效(Chen,I.,B.M.Dorr,and D.R.Liu,Proc Natl Acad Sci U S A,2011.108(28):p.11399-404)。相反，从植物中提取的butelase 1极其有效并具有较短的识别氨基酸序列(NHV)(Nguyen,G.K.,et al.,Nat Chem Biol,2014.10(9):p.732-8)。然而，由于难以生产活性重组酶，butelase 1重组构建体的优化和工程仍存在挑战。在此，据本发明人所知，报道了OaAEP1的第一个X射线结晶结构，其可作为了解植物AEP连接酶家族的模板以及促进具有替代底物特异性的更快的蛋白质连接酶的设计。我们的结构表明在AEP型连接酶中实现自切割激活的模式，并且还指出了解决AEP型蛋白质之间功能差异的关键残基和结构特征：主要作为蛋白酶的AEP缺乏有助于连接的催化口袋附近的平坦表面，而作为有效连接酶的AEP型蛋白具有能够容纳进入的胺基的宽且开放的表面。这些结构观察致使我们设计了一种具有改善的生化性质的改良的连接酶Cys247Ala，其能够有效连接蛋白质。鉴于其快速连接催化动力学，相信本发明的Cys247Ala重组蛋白质连接酶可以用于进行蛋白质/肽合成和特定蛋白质标记的有吸引力的生物技术应用(Guimaraes,C.P.,et al.,Nat Protoc,2013.8(9):p.1787-99；Swee,L.K.,et al.,Proc Natl Acad Sci U S A,2013.110(4):p.1428-33；Theile,C.S.,et al.,Nat Protoc,2013.8(9):p.1800-7；Witte,M.D.,et al.,Nat Protoc,2013.8(9):p.1808-19；Wagner,K.,et al.,Proc Natl Acad Sci U S A,2014.111(47):p.16820-5；Nguyen,G.K.,et al.,Angew Chem Int Ed Engl,2015.54(52):p.15694-8；Nguyen,G.K.,et al.,J Am Chem Soc,2015.137(49):p.15398-401)。

实施例2：NCBI-BLAST鉴定Quicklase OaAEP1的同系物

SEQ ID NO:1氨基酸序列的Blast搜索通过提交序列至NCBI blast服务中采用标准blast条件进行。选择如图12所示的高命中进行序列分析。发现它们全部含有OaAEP1b的残基247-264的保守结构基序。

实施例3：AEP_C13CO4(SEQ ID NO:8)是一种具有OaAEP1 Cys247Ala(SEQ ID NO:1)活性的肽连接酶

基于序列比对的预测，AEP_C13CO4含有和Quicklase(247-264)相同的保守结构基序。这表明AEP_C13CO4可能是功能性蛋白质连接酶。随后合成AEP_C13CO4的cDNA并以Quicklase相似的方式亚克隆至pet28b中。然后这个新潜在的连接酶以Quicklase相似方式表达、纯化和激活，并表现出蛋白质水解和蛋白质连接活性。尽管AEP_C13CO4的野生型不是一种理想蛋白质连接酶，其具有比Quicklase慢得多的酶催化效率以及明显的蛋白质水解反应副产物(图13)，但这似乎是进一步工程化替代蛋白质连接酶的良好开端。

实施例4：Quicklase OaAEP1催化的肽二聚化、低聚化和多聚化

关于图14中所示的方案，进行了以下实施例：

图14(a)：

基于标准Fmoc固相多肽合成(SPPS)化学，用丁苯酰胺树脂(GL Biochem，中国上海)合成支化二聚体接头(2-mer linker)肽。通过掺入Fmoc-L-Lys(Fmoc)-OH引入分支。除去α-和ε-胺基基团上的Fmoc基团后，根据标准Fmoc-SPPS步骤引入剩余氨基酸(GLGG)。

对于一步同源二聚化反应，50μM的C端NGL标记的目标蛋白(POI-NGL)，在本例中为Ub-AA-NGL，在室温下用0.5μM的AEP催化其与0-200μM范围的不同浓度的二聚体接头反应。1小时后通过SDS-PAGE检测该反应。

图14(b)：

对于两步异源二聚化策略，第一步是酶(0.5μM)催化POIA-NGL(50μM)和过量二聚体接头(200μM)之间的反应，使仅二聚体接头的一个分支被标记。反应后，用3500MW截止浓缩器通过缓冲液交换除去二聚体接头肽来分离POIA-接头。

对于第二步连接步骤，0.5μM的AEP催化POIB-NGL(100，200μM)与POIA-接头(50μM)的反应得到最终异二聚体产物。

图14(c)：

为了形成四聚体接头(4-mer linker)，通过交联C端半胱氨酸残基使二聚体接头二聚化。反应详情参阅图g。

通过AEP催化POI-NGL和该四聚体接头之间的反应实现一步蛋白质四聚体化。以泛素为例，为了优化连接反应，在pH 7.4、室温中0.5μM AEP存在下，20μM的Ub-AA-NGL(POI-NGL)和不同浓度(0-80μM)的四聚体接头连接。1小时后，通过SDS-PAGE分析该反应，表明当使用2.5-5μM的四聚体接头时，产生了最大量的Ub-四聚体(Ub-tetramer)。

图14(d)：

为了实现蛋白质超低聚，首先通过两个步骤合成低聚肽平台：i)直接或通过天然化学连接合成含有多个半胱氨酸残基的肽，其通过7-8个氨基酸的柔性间隔分离；ii)然后通过具有游离N端GL残基的溴乙酰肽将肽中的半胱氨酸残基烷基化之后用于AEP催化的连接。产生低聚体接头后，AEP催化POI-NGL和二聚体接头之间的反应以产生蛋白质超低聚体。

图14(e，f)：

产生用于蛋白质头对头二聚化的二聚体NGL接头(2-mer-NGL linker)的方案：

通过1,3-二氯丙酮或间二甲苯二溴化物(Sigma-aldrich)使单体-NGL肽的N端乙酰化的半胱氨酸S-烷基化，实现二聚体-NGL接头的合成。简单地说，单体-NGL肽溶解在含有20mM Tris HCl、150mM NaCl、5mM TCEP、pH 8.0的终浓度为1mg/mL的缓冲液中。1当量的1,3-二氯丙酮或间二甲苯二溴化物添加至溶液中。在黑暗条件下反应3小时后，通过HPLC用C18反相柱纯化分离得到所需的二聚体-NGL接头。

图14(g)：

产生用于蛋白质尾对尾四聚化的GL-四聚体接头(GL-tetramer linker)的方案：

通过1,3-二氯丙酮或间二甲苯二溴化物使GL-二聚体(GL-dimer)接头肽的C端半胱氨酸S-烷基化，实现GL-四聚体接头的合成。简单地说，GL-二聚体接头溶解在含有20mMTris HCl、150mM NaCl、5mM TCEP、pH 8.0的终浓度为1mg/mL的缓冲液中。1当量的1,3-二氯丙酮或间二甲苯二溴化物添加至溶液中。在黑暗条件下反应3小时后，通过HPLC用C18反相柱纯化分离得到所需的GL-四聚体接头。

图14(h)：

产生用于蛋白质头对头低聚化的NGL-低聚体接头的方案：

含有被7-8个氨基酸的柔性间隔分离的多个半胱氨酸残基的肽，和C端NGL残基之后用于AEP催化的连接的另一个N端溴乙酰肽之间通过S-烷基化反应合成NGL-低聚体接头平台。简单地说，对于烷基化反应，1mg/mL的半胱氨酰肽和1.5mg/mL的溴乙酰肽在含有20mMTris HCl，150mM NaCl，5mM TCEP，pH 8.0的缓冲液中室温避光反应。2小时后，通过HPLC用C18反相柱纯化分离得到所需的NGL-低聚体接头。

图14(i)：

产生用于蛋白质头对头低聚化的GL-低聚体接头的方案：

含有被7-8个氨基酸的柔性间隔分离的多个半胱氨酸残基的肽，和N端GL残基之后用于AEP催化的连接的另一个溴乙酰肽(溴乙酰基于赖氨酸侧链连接)之间通过S-烷基化反应合成GL-低聚体接头平台。简单地说，对于烷基化反应，1mg/mL的半胱氨酰肽和1.5mg/mL的溴乙酰肽在含有20mM Tris HCl，150mM NaCl，5mM TCEP，pH 8.0的缓冲液中室温避光反应。2小时后，通过HPLC用C18反相柱纯化分离得到所需的GL-低聚体接头。

实施例5：Quicklase OaAEP1-催化的细胞表面标记

与图15相关进行了以下实施例：

在标准细胞培养条件下，将0.1-1μM的OaAEP1 Cys247Ala加到细胞培养物中。然后将1-20μM标记的蛋白质标签加入反应并在37℃、标准培养条件下孵育30-45分钟，再洗去过量的酶和标记的标签。获得的三次清洗的细胞部分进行荧光SDS-PAGE分析以确定标记效率。

在成像分析时，使用Nikon Ti显微镜或等同物(Nikon)以及激光源X-Cite 120(Excelitas)或等同物和数码相机C11440(Hamamatsu)或等同物获取图像。观察和拍摄细胞的程序是MetaMorph(Molecular Devices)或等同的。使用Image J或等同的编辑图像。

在此对本发明进行了概括和一般的描述。落入一般披露中的更窄的种类和子类分组的每一个也构成本发明的一部分。这包括本发明的一般描述，用限制性或否定限制性从属中去除任意主题，无论删除的材料是否在本文明确列出。其他实施方式在所附权利要求内。此外，当按照马库什组描述本发明的特征或方面时，本领域技术人员应意识到还按照马库什组成员的任何单独成员或亚组来描述本发明。

本领域技术人员易理解的，本发明非常适合于实现目标并获得所指出的目的和优点，以及其中固有的那些。此外，对于本领域技术人员来说显而易见的，在不脱离本发明的范围和精神的情况下，可以对本文公开的发明进行改变替换和修改。本文所述的组合物、方法、程序、处理、分子和具体化合物目前代表优选实施方式是示例性的，并不旨在限制本发明的范围。本领域的技术人员将想到其中的变化和其他用途，其包含在本发明的精神内并由权利要求书的范围限定。在本说明书中列出或讨论先前公布的文件不应该被认为承认该文件是现有技术的一部分或是公知常识。

本文中说明性地描述的发明可在没有在本文中未具体公开的任何一个或多个元件、一种或多种限制的情况下合适地实践。因此，例如，术语“包括”，“包括”，包含“等”应当被广泛理解而不受限制。因此，词语“包括(comprise)”一词及其变体(如“comprises”或“comprising”)都应被理解为暗示包括所述整数或整数组但并不排除任何其它整数或整数组。此外，本文采用的术语和表达方式是用来描述而非限制的，且这些术语及表达的使用中无意排除所示及描述的特征的任何等同物或其部分，且应当认识到在本发明要求保护的范围内各种改变是可能的。因此，应该理解，尽管已经通过示例性实施方式和可选特征具体公开了本发明，但本领域技术人员可以采用本文公开的发明的修改和变化，应认为这些修改和变化在本发明的范围内。

本文引用的所有文件和专利文献的内容以引用方式整体并入。

序列表

<110> 南洋理工大学

<120> 酶促肽连接的方法

<130> P112356

<150> SG10201607951V

<151> 2016-09-23

<160> 17

<170> PatentIn version 3.5

<210> 1

<211> 474

<212> PRT

<213> Ovaloparmena affinis

<400> 1

Met Val Arg Tyr Leu Ala Gly Ala Val Leu Leu Leu Val Val Leu Ser

1 5 10 15

Val Ala Ala Ala Val Ser Gly Ala Arg Asp Gly Asp Tyr Leu His Leu

20 25 30

Pro Ser Glu Val Ser Arg Phe Phe Arg Pro Gln Glu Thr Asn Asp Asp

35 40 45

His Gly Glu Asp Ser Val Gly Thr Arg Trp Ala Val Leu Ile Ala Gly

50 55 60

Ser Lys Gly Tyr Ala Asn Tyr Arg His Gln Ala Gly Val Cys His Ala

65 70 75 80

Tyr Gln Ile Leu Lys Arg Gly Gly Leu Lys Asp Glu Asn Ile Val Val

85 90 95

Phe Met Tyr Asp Asp Ile Ala Tyr Asn Glu Ser Asn Pro Arg Pro Gly

100 105 110

Val Ile Ile Asn Ser Pro His Gly Ser Asp Val Tyr Ala Gly Val Pro

115 120 125

Lys Asp Tyr Thr Gly Glu Glu Val Asn Ala Lys Asn Phe Leu Ala Ala

130 135 140

Ile Leu Gly Asn Lys Ser Ala Ile Thr Gly Gly Ser Gly Lys Val Val

145 150 155 160

Asp Ser Gly Pro Asn Asp His Ile Phe Ile Tyr Tyr Thr Asp His Gly

165 170 175

Ala Ala Gly Val Ile Gly Met Pro Ser Lys Pro Tyr Leu Tyr Ala Asp

180 185 190

Glu Leu Asn Asp Ala Leu Lys Lys Lys His Ala Ser Gly Thr Tyr Lys

195 200 205

Ser Leu Val Phe Tyr Leu Glu Ala Cys Glu Ser Gly Ser Met Phe Glu

210 215 220

Gly Ile Leu Pro Glu Asp Leu Asn Ile Tyr Ala Leu Thr Ser Thr Asn

225 230 235 240

Thr Thr Glu Ser Ser Trp Ala Tyr Tyr Cys Pro Ala Gln Glu Asn Pro

245 250 255

Pro Pro Pro Glu Tyr Asn Val Cys Leu Gly Asp Leu Phe Ser Val Ala

260 265 270

Trp Leu Glu Asp Ser Asp Val Gln Asn Ser Trp Tyr Glu Thr Leu Asn

275 280 285

Gln Gln Tyr His His Val Asp Lys Arg Ile Ser His Ala Ser His Ala

290 295 300

Thr Gln Tyr Gly Asn Leu Lys Leu Gly Glu Glu Gly Leu Phe Val Tyr

305 310 315 320

Met Gly Ser Asn Pro Ala Asn Asp Asn Tyr Thr Ser Leu Asp Gly Asn

325 330 335

Ala Leu Thr Pro Ser Ser Ile Val Val Asn Gln Arg Asp Ala Asp Leu

340 345 350

Leu His Leu Trp Glu Lys Phe Arg Lys Ala Pro Glu Gly Ser Ala Arg

355 360 365

Lys Glu Glu Ala Gln Thr Gln Ile Phe Lys Ala Met Ser His Arg Val

370 375 380

His Ile Asp Ser Ser Ile Lys Leu Ile Gly Lys Leu Leu Phe Gly Ile

385 390 395 400

Glu Lys Cys Thr Glu Ile Leu Asn Ala Val Arg Pro Ala Gly Gln Pro

405 410 415

Leu Val Asp Asp Trp Ala Cys Leu Arg Ser Leu Val Gly Thr Phe Glu

420 425 430

Thr His Cys Gly Ser Leu Ser Glu Tyr Gly Met Arg His Thr Arg Thr

435 440 445

Ile Ala Asn Ile Cys Asn Ala Gly Ile Ser Glu Glu Gln Met Ala Glu

450 455 460

Ala Ala Ser Gln Ala Cys Ala Ser Ile Pro

465 470

<210> 2

<211> 18

<212> PRT

<213> Ovaloparmena affinis

<220>

<221> MISC_FEATURE

<222> (1)..(1)

<223> Xaa corresponds to position 247 of SEQ ID NO:1 and is Gly, Ala,

Ser, or Cys.

<220>

<221> MISC_FEATURE

<222> (2)..(2)

<223> Xaa is any amino acid, preferably any amino acid that does not

disrupt the structural fold of the remaining conserved amino

acids

<220>

<221> MISC_FEATURE

<222> (6)..(6)

<223> Xaa is any amino acid, preferably any amino acid that does not

disrupt the structural fold of the remaining conserved amino

acids

<220>

<221> MISC_FEATURE

<222> (7)..(7)

<223> Xaa is any amino acid, preferably any amino acid that does not

disrupt the structural fold of the remaining conserved amino

acids

<220>

<221> MISC_FEATURE

<222> (8)..(8)

<223> Xaa is any amino acid, preferably any amino acid that does not

disrupt the structural fold of the remaining conserved amino

acids

<220>

<221> MISC_FEATURE

<222> (9)..(9)

<223> Xaa is any amino acid, preferably any amino acid that does not

disrupt the structural fold of the remaining conserved amino

acids

<220>

<221> MISC_FEATURE

<222> (10)..(10)

<223> Xaa is any amino acid, preferably any amino acid that does not

disrupt the structural fold of the remaining conserved amino

acids

<220>

<221> MISC_FEATURE

<222> (16)..(16)

<223> Xaa is any amino acid, preferably any amino acid that does not

disrupt the structural fold of the remaining conserved amino

acids

<220>

<221> MISC_FEATURE

<222> (17)..(17)

<223> Xaa corresponds to position 263 of SEQ ID NO:1 and is any amino

acid, preferably any amino acid that does not disrupt the

structural fold of the remaining conserved amino acids

<400> 2

Xaa Xaa Tyr Cys Pro Xaa Xaa Xaa Xaa Xaa Pro Pro Pro Glu Tyr Xaa

1 5 10 15

Xaa Cys

<210> 3

<211> 474

<212> PRT

<213> Ovaloparmena affinis

<400> 3

Met Val Arg Tyr Leu Ala Gly Ala Val Leu Leu Leu Val Val Leu Ser

1 5 10 15

Val Ala Ala Ala Val Ser Gly Ala Arg Asp Gly Asp Tyr Leu His Leu

20 25 30

Pro Ser Glu Val Ser Arg Phe Phe Arg Pro Gln Glu Thr Asn Asp Asp

35 40 45

His Gly Glu Asp Ser Val Gly Thr Arg Trp Ala Val Leu Ile Ala Gly

50 55 60

Ser Lys Gly Tyr Ala Asn Tyr Arg His Gln Ala Gly Val Cys His Ala

65 70 75 80

Tyr Gln Ile Leu Lys Arg Gly Gly Leu Lys Asp Glu Asn Ile Val Val

85 90 95

Phe Met Tyr Asp Asp Ile Ala Tyr Asn Glu Ser Asn Pro Arg Pro Gly

100 105 110

Val Ile Ile Asn Ser Pro His Gly Ser Asp Val Tyr Ala Gly Val Pro

115 120 125

Lys Asp Tyr Thr Gly Glu Glu Val Asn Ala Lys Asn Phe Leu Ala Ala

130 135 140

Ile Leu Gly Asn Lys Ser Ala Ile Thr Gly Gly Ser Gly Lys Val Val

145 150 155 160

Asp Ser Gly Pro Asn Asp His Ile Phe Ile Tyr Tyr Thr Asp His Gly

165 170 175

Ala Ala Gly Val Ile Gly Met Pro Ser Lys Pro Tyr Leu Tyr Ala Asp

180 185 190

Glu Leu Asn Asp Ala Leu Lys Lys Lys His Ala Ser Gly Thr Tyr Lys

195 200 205

Ser Leu Val Phe Tyr Leu Glu Ala Cys Glu Ser Gly Ser Met Phe Glu

210 215 220

Gly Ile Leu Pro Glu Asp Leu Asn Ile Tyr Ala Leu Thr Ser Thr Asn

225 230 235 240

Thr Thr Glu Ser Ser Trp Cys Tyr Tyr Cys Pro Ala Gln Glu Asn Pro

245 250 255

Pro Pro Pro Glu Tyr Asn Val Cys Leu Gly Asp Leu Phe Ser Val Ala

260 265 270

Trp Leu Glu Asp Ser Asp Val Gln Asn Ser Trp Tyr Glu Thr Leu Asn

275 280 285

Gln Gln Tyr His His Val Asp Lys Arg Ile Ser His Ala Ser His Ala

290 295 300

Thr Gln Tyr Gly Asn Leu Lys Leu Gly Glu Glu Gly Leu Phe Val Tyr

305 310 315 320

Met Gly Ser Asn Pro Ala Asn Asp Asn Tyr Thr Ser Leu Asp Gly Asn

325 330 335

Ala Leu Thr Pro Ser Ser Ile Val Val Asn Gln Arg Asp Ala Asp Leu

340 345 350

Leu His Leu Trp Glu Lys Phe Arg Lys Ala Pro Glu Gly Ser Ala Arg

355 360 365

Lys Glu Glu Ala Gln Thr Gln Ile Phe Lys Ala Met Ser His Arg Val

370 375 380

His Ile Asp Ser Ser Ile Lys Leu Ile Gly Lys Leu Leu Phe Gly Ile

385 390 395 400

Glu Lys Cys Thr Glu Ile Leu Asn Ala Val Arg Pro Ala Gly Gln Pro

405 410 415

Leu Val Asp Asp Trp Ala Cys Leu Arg Ser Leu Val Gly Thr Phe Glu

420 425 430

Thr His Cys Gly Ser Leu Ser Glu Tyr Gly Met Arg His Thr Arg Thr

435 440 445

Ile Ala Asn Ile Cys Asn Ala Gly Ile Ser Glu Glu Gln Met Ala Glu

450 455 460

Ala Ala Ser Gln Ala Cys Ala Ser Ile Pro

465 470

<210> 4

<211> 462

<212> PRT

<213> Clitoria ternatea

<400> 4

Ile Arg Asp Asp Phe Leu Arg Leu Pro Ser Gln Ala Ser Lys Phe Phe

1 5 10 15

Gln Ala Asp Asp Asn Val Glu Gly Thr Arg Trp Ala Val Leu Val Ala

20 25 30

Gly Ser Lys Gly Tyr Val Asn Tyr Arg His Gln Ala Asp Val Cys His

35 40 45

Ala Tyr Gln Ile Leu Lys Lys Gly Gly Leu Lys Asp Glu Asn Ile Ile

50 55 60

Val Phe Met Tyr Asp Asp Ile Ala Tyr Asn Glu Ser Asn Pro His Pro

65 70 75 80

Gly Val Ile Ile Asn His Pro Tyr Gly Ser Asp Val Tyr Lys Gly Val

85 90 95

Pro Lys Asp Tyr Val Gly Glu Asp Ile Asn Pro Pro Asn Phe Tyr Ala

100 105 110

Val Leu Leu Ala Asn Lys Ser Ala Leu Thr Gly Thr Gly Ser Gly Lys

115 120 125

Val Leu Asp Ser Gly Pro Asn Asp His Val Phe Ile Tyr Tyr Thr Asp

130 135 140

His Gly Gly Ala Gly Val Leu Gly Met Pro Ser Lys Pro Tyr Ile Ala

145 150 155 160

Ala Ser Asp Leu Asn Asp Val Leu Lys Lys Lys His Ala Ser Gly Thr

165 170 175

Tyr Lys Ser Ile Val Phe Tyr Val Glu Ser Cys Glu Ser Gly Ser Met

180 185 190

Phe Asp Gly Leu Leu Pro Glu Asp His Asn Ile Tyr Val Met Gly Ala

195 200 205

Ser Asp Thr Gly Glu Ser Ser Trp Val Thr Tyr Cys Pro Leu Gln His

210 215 220

Pro Ser Pro Pro Pro Glu Tyr Asp Val Cys Val Gly Asp Leu Phe Ser

225 230 235 240

Val Ala Trp Leu Glu Asp Cys Asp Val His Asn Leu Gln Thr Glu Thr

245 250 255

Phe Gln Gln Gln Tyr Glu Val Val Lys Asn Lys Thr Ile Val Ala Leu

260 265 270

Ile Glu Asp Gly Thr His Val Val Gln Tyr Gly Asp Val Gly Leu Ser

275 280 285

Lys Gln Thr Leu Phe Val Tyr Met Gly Thr Asp Pro Ala Asn Asp Asn

290 295 300

Asn Thr Phe Thr Asp Lys Asn Ser Leu Gly Thr Pro Arg Lys Ala Val

305 310 315 320

Ser Gln Arg Asp Ala Asp Leu Ile His Tyr Trp Glu Lys Tyr Arg Arg

325 330 335

Ala Pro Glu Gly Ser Ser Arg Lys Ala Glu Ala Lys Lys Gln Leu Arg

340 345 350

Glu Val Met Ala His Arg Met His Ile Asp Asn Ser Val Lys His Ile

355 360 365

Gly Lys Leu Leu Phe Gly Ile Glu Lys Gly His Lys Met Leu Asn Asn

370 375 380

Val Arg Pro Ala Gly Leu Pro Val Val Asp Asp Trp Asp Cys Phe Lys

385 390 395 400

Thr Leu Ile Arg Thr Phe Glu Thr His Cys Gly Ser Leu Ser Glu Tyr

405 410 415

Gly Met Lys His Met Arg Ser Phe Ala Asn Leu Cys Asn Ala Gly Ile

420 425 430

Arg Lys Glu Gln Met Ala Glu Ala Ser Ala Gln Ala Cys Val Ser Ile

435 440 445

Pro Asp Asn Pro Trp Ser Ser Leu His Ala Gly Phe Ser Val

450 455 460

<210> 5

<211> 488

<212> PRT

<213> Coffea canephora

<400> 5

Met Met Arg Tyr Ala Thr Ala Ala Leu Leu Leu Leu Ala Leu Ser Ile

1 5 10 15

Ile Ala Val Ala Glu Ala Arg Asp Asn Phe Leu Lys Leu Pro Ser Glu

20 25 30

Ile Ala Asp Phe Phe His Pro Lys Glu Arg Ser Asp Ala Gly Gly Asp

35 40 45

Ser Val Gly Thr Arg Trp Ala Val Leu Ile Ala Gly Ser Asn Gly Tyr

50 55 60

Trp Asn Tyr Arg His Gln Ala Asp Val Cys His Ala Tyr Gln Ile Leu

65 70 75 80

Lys Arg Gly Gly Leu Lys Asp Glu Asn Ile Val Val Phe Met Tyr Asp

85 90 95

Asp Ile Ala Tyr Asn Glu Glu Asn Pro Arg Pro Gly Val Ile Ile Asn

100 105 110

Ser Pro His Gly Ala Asp Val Tyr Gln Gly Val Pro Lys Asp Tyr Thr

115 120 125

Gly Asp Asp Val Asn Ala Lys Asn Phe Leu Ala Ala Ile Leu Gly Asp

130 135 140

Lys Thr Ala Ile Thr Gly Gly Ser Gly Lys Val Val Asp Ser Gly Pro

145 150 155 160

Asn Asp His Ile Phe Ile Tyr Tyr Thr Asp His Gly Gly Pro Gly Val

165 170 175

Leu Gly Thr Pro Ser Gly Pro Tyr Leu Tyr Ala Asp Asp Leu Asn Glu

180 185 190

Val Leu Lys Lys Lys His Ala Ser Gly Thr Tyr Lys Ser Leu Val Phe

195 200 205

Tyr Leu Glu Ala Cys Glu Ser Gly Ser Ile Phe Glu Gly Leu Leu Pro

210 215 220

Glu Asp Leu Asn Ile Tyr Ala Thr Thr Ala Ser Asn Ala Glu Glu Ser

225 230 235 240

Ser Trp Gly Thr Tyr Cys Pro Gly Glu Tyr Pro Ser Pro Pro Pro Glu

245 250 255

Tyr Glu Thr Cys Leu Gly Asp Leu Tyr Ser Val Ala Trp Met Glu Asp

260 265 270

Ser Glu Ile His Asn Leu His Thr Glu Thr Leu Lys Gln Gln Tyr His

275 280 285

Leu Val Lys Lys Arg Thr Ser Ser Ser Asn Ser Ala Tyr Gly Ser His

290 295 300

Val Met Gln Tyr Gly Asp Leu Lys Leu Ser Leu Glu Asp Leu Phe Leu

305 310 315 320

Tyr Met Gly Thr Asn Pro Ala Asn Asp Asn Tyr Thr Phe Val Asp Glu

325 330 335

Asn Ser Leu Arg Pro Ser Ser Lys Ala Val Asn Gln Arg Asp Ala Asp

340 345 350

Leu Leu His Phe Trp Asp Lys Phe Arg Lys Ala Pro Glu Gly Ser Ala

355 360 365

Arg Lys Val Glu Ala Gln Lys Gln Val Val Glu Ala Met Ser His Arg

370 375 380

Met His Ile Asp Asn Ser Val Lys Leu Ile Gly Lys Leu Leu Phe Gly

385 390 395 400

Ile Glu Lys Gly Ser Glu Ile Leu Asn Ser Val Arg Pro Ala Gly His

405 410 415

Pro Leu Ala Asp Asp Trp Asp Cys Leu Lys Ser Leu Val Arg Thr Phe

420 425 430

Glu Thr His Cys Gly Ser Leu Ser Gln Tyr Gly Met Lys His Met Arg

435 440 445

Ser Ile Ala Asn Ile Cys Asn Ala Gly Ile Lys Lys Asp Gln Met Ala

450 455 460

Glu Ala Ala Ala Gln Ala Cys Val Ser Leu Pro Ser Asn Ser Trp Ser

465 470 475 480

Ser Leu His Arg Gly Phe Ser Ala

485

<210> 6

<211> 491

<212> PRT

<213> Daucus carota subsp. sativus

<400> 6

Met Val Arg Tyr Leu Ala Gly Ala Val Ala Leu Leu Val Val Val Ser

1 5 10 15

Ile Ser Ala Val Val Glu Ser Arg Arg Asp Ile Val Gly Asp Val Leu

20 25 30

Lys Leu Pro Ser Glu Val Ser Ser Phe Phe Arg Pro Val Ala Glu Glu

35 40 45

Glu Asp Ser Val Gly Thr Arg Trp Ala Val Leu Ile Ala Gly Ser Asn

50 55 60

Gly Tyr Trp Asn Tyr Arg His Gln Ala Asp Ile Cys His Ala Tyr Gln

65 70 75 80

Leu Leu Arg Arg Gly Gly Val Lys Glu Glu Asn Ile Val Val Phe Met

85 90 95

Tyr Asp Asp Ile Ala Tyr Asp Glu Glu Asn Pro Arg Pro Gly Val Ile

100 105 110

Ile Asn Ser Pro His Gly Ser Asp Val Tyr Lys Gly Val Pro Lys Asp

115 120 125

Tyr Thr Gly Glu Asp Val Thr Val Asn Asn Val Phe Ala Ala Ile Leu

130 135 140

Gly Asp Lys Ser Ala Thr Thr Gly Gly Ser Gly Lys Val Val Asp Ser

145 150 155 160

Gly Pro Asn Asp His Ile Phe Ile Tyr Tyr Ser Asp His Gly Gly Pro

165 170 175

Gly Val Leu Gly Met Pro Thr Asn Pro Tyr Met Tyr Ala Gly Asp Leu

180 185 190

Val Asp Val Leu Lys Lys Lys His Ala Ser Gly Thr Tyr Lys Ser Met

195 200 205

Val Phe Tyr Leu Glu Ala Cys Glu Ser Gly Ser Ile Phe Glu Gly Leu

210 215 220

Leu Pro Glu Gly Leu Asn Ile Tyr Ala Thr Thr Ala Ser Asn Ala Tyr

225 230 235 240

Glu Ser Ser Trp Gly Thr Tyr Cys Pro Gly Glu Tyr Pro Ser Pro Pro

245 250 255

Pro Glu Tyr Glu Thr Cys Leu Gly Asp Leu Tyr Ser Val Ala Trp Met

260 265 270

Glu Asp Ser Asp Ile His Asn Leu Arg Thr Glu Thr Leu Arg Gln Gln

275 280 285

Tyr Gln Gln Val Lys Lys Arg Thr Ser Asn Asp Asn Ser Gly Trp Gly

290 295 300

Ser His Val Met Gln Tyr Gly Asp Leu Lys Leu Ser Thr Glu Glu Leu

305 310 315 320

Phe Met Tyr Met Gly Thr Asn Pro Ala Asn Asp Asn Phe Thr Phe Val

325 330 335

Asp Asp Asn Ser Leu Arg Leu Ser Ser Ser Lys Ala Val Asn Gln Arg

340 345 350

Asp Ala Asp Leu Leu His Phe Trp Asp Lys Tyr Arg Lys Ala Pro Glu

355 360 365

Gly Ser Asp Arg Lys Ile Ala Ala Gln Lys Gln Phe Ser Glu Ala Met

370 375 380

Ser His Arg Met His Leu Asp Asn Ser Ile Gln Leu Ile Gly Lys Leu

385 390 395 400

Leu Phe Gly Ile Asp Thr Ala Ser Glu Val Leu Thr Thr Val Arg Pro

405 410 415

Ser Gly Gln Pro Leu Val Asp Asp Trp Leu Cys Leu Lys Lys Leu Val

420 425 430

Arg Thr Phe Glu Thr Tyr Cys Gly Ser Leu Ser Gln Tyr Gly Met Lys

435 440 445

His Met Arg Ser Ile Ala Asn Ile Cys Asn Ala Gly Ile Ser Glu Glu

450 455 460

Gln Met Ser Glu Ala Ser Ala Gln Ala Cys Val Thr Phe Pro Ser Asn

465 470 475 480

Pro Trp Ser Ser Val Asn Lys Gly Phe Thr Ala

485 490

<210> 7

<211> 486

<212> PRT

<213> Corchorus capsularis

<400> 7

Met Thr Arg Leu Val Ala Gly Val Ile Leu Leu Leu Leu Ser Val Thr

1 5 10 15

Gly Ile Val Ser Ala Gly Arg Asp Ala Thr Gly Asp Val Leu Arg Leu

20 25 30

Pro Ser Glu Ala Ser Arg Phe Phe Arg Pro Ser Asp Asp Asp Glu Val

35 40 45

Gly Thr Arg Trp Ala Val Leu Ile Ala Gly Ser Asn Gly Tyr Trp Asn

50 55 60

Tyr Arg His Gln Ala Asp Val Cys His Ala Tyr Gln Leu Leu Lys Lys

65 70 75 80

Gly Gly Leu Lys Asp Glu Asn Ile Ile Val Phe Met Tyr Asp Asp Ile

85 90 95

Ala Tyr Asn Tyr Glu Asn Pro Arg Gln Gly Ile Ile Ile Asn Ser Pro

100 105 110

His Gly Asp Asp Val Tyr Gln Gly Val Pro Lys Asp Tyr Thr Gly Glu

115 120 125

Glu Val Thr Val His Asn Phe Leu Ala Ala Ile Leu Gly Asn Lys Thr

130 135 140

Ala Ile Thr Gly Gly Ser Gly Lys Val Val Asp Ser Gly Pro Asn Asp

145 150 155 160

His Ile Phe Ile Tyr Tyr Thr Asp His Gly Gly Pro Gly Val Leu Gly

165 170 175

Met Pro Thr Tyr Pro Tyr Leu Tyr Ala Asp Glu Leu Ile Asp Thr Leu

180 185 190

Lys Lys Lys His Ala Ser Gly Thr Tyr Lys Ser Leu Val Phe Tyr Leu

195 200 205

Glu Ala Cys Glu Ser Gly Ser Ile Phe Glu Gly Leu Leu Pro Glu Gly

210 215 220

Leu Asn Ile Tyr Ala Thr Thr Ala Ser Asn Ala Asp Glu Ser Ser Trp

225 230 235 240

Gly Thr Tyr Cys Pro Gly Glu Tyr Pro Ser Pro Pro Pro Glu Tyr Glu

245 250 255

Thr Cys Leu Gly Asp Leu Tyr Ser Val Ala Trp Met Glu Asp Ser Asp

260 265 270

Leu His Asn Leu Arg Thr Glu Thr Leu His Gln Gln Tyr Glu Leu Val

275 280 285

Lys Arg Arg Thr Leu Asn Gly Asn Ser Ala Tyr Gly Ser His Val Met

290 295 300

Gln Tyr Gly Asp Val Gly Leu Ala Lys Glu His Leu Phe Leu Tyr Leu

305 310 315 320

Gly Thr Asn Pro Ala Asn Asp Asn Phe Thr Phe Ile Asp Glu Asn Ser

325 330 335

Leu Gln Pro Pro Ala Lys Ala Val Asn Gln Arg Asp Ala Asp Leu Val

340 345 350

His Phe Trp Asp Lys Tyr Arg Lys Ala Pro Asp Gly Ser Ala Arg Lys

355 360 365

Val Glu Ala Gln Lys Gln Val Val Glu Ala Met Ser His Arg Met His

370 375 380

Val Asp Asn Ser Ile Gln Leu Ile Gly Lys Leu Leu Phe Gly Ile Glu

385 390 395 400

Arg Gly Ala Asp Val Leu Lys Thr Val Arg Pro Ala Gly Gln Pro Leu

405 410 415

Val Asp Asp Trp Lys Cys Leu Lys Ser Met Val Arg Thr Phe Glu Thr

420 425 430

His Cys Gly Ser Leu Ala Gln Tyr Gly Met Lys His Met Arg Ser Ile

435 440 445

Ala Asn Ile Cys Asn Ala Gly Ile Gln Thr Glu Gln Ile Ala Glu Ala

450 455 460

Ser Ala Gln Ala Cys Val Ser Ile Pro Ser Gly Gln Trp Ser Ser Ile

465 470 475 480

Gln Lys Gly Phe Ser Ala

485

<210> 8

<211> 486

<212> PRT

<213> Corchorus olitorius

<400> 8

Met Thr Arg Leu Val Ala Gly Val Ile Leu Leu Leu Leu Ser Val Thr

1 5 10 15

Gly Ile Ala Ser Ala Gly Arg Asp Ala Thr Gly Asp Val Leu Arg Leu

20 25 30

Pro Ser Glu Ala Ser Arg Phe Phe Arg Pro Ser Asp Asp Asp Glu Val

35 40 45

Gly Thr Arg Trp Ala Val Leu Ile Ala Gly Ser Asn Gly Tyr Trp Asn

50 55 60

Tyr Arg His Gln Ala Asp Val Cys His Ala Tyr Gln Leu Leu Lys Lys

65 70 75 80

Gly Gly Leu Lys Asp Glu Asn Ile Ile Val Phe Met Tyr Asp Asp Ile

85 90 95

Ala Phe Asn Tyr Glu Asn Pro Arg Gln Gly Ile Ile Ile Asn Ser Pro

100 105 110

His Gly Asp Asp Val Tyr Gln Asp Val Pro Lys Asp Tyr Thr Gly Glu

115 120 125

Glu Val Thr Val His Asn Phe Leu Ala Ala Ile Leu Gly Asn Lys Thr

130 135 140

Ala Ile Lys Gly Gly Ser Gly Lys Val Val Asp Ser Gly Pro Asn Asp

145 150 155 160

His Ile Phe Ile Tyr Tyr Thr Asp His Gly Gly Pro Gly Val Leu Gly

165 170 175

Met Pro Thr Tyr Pro Tyr Leu Tyr Ala Asp Glu Leu Ile Asp Thr Leu

180 185 190

Lys Lys Lys His Ala Ser Gly Thr Tyr Lys Ser Leu Val Phe Tyr Leu

195 200 205

Glu Ala Cys Glu Ser Gly Ser Ile Phe Glu Gly Leu Leu Pro Glu Gly

210 215 220

Leu Asn Ile Tyr Ala Thr Thr Ala Ser Asn Ala Asp Glu Ser Ser Trp

225 230 235 240

Gly Thr Tyr Cys Pro Gly Glu Tyr Pro Ser Pro Pro Pro Glu Tyr Glu

245 250 255

Thr Cys Leu Gly Asp Leu Tyr Ser Val Ala Trp Met Glu Asp Ser Asp

260 265 270

Leu His Asn Leu Arg Thr Glu Thr Leu His Gln Gln Tyr Glu Leu Val

275 280 285

Lys Arg Arg Thr Leu Asn Gly Asn Ser Ala Tyr Gly Ser His Val Met

290 295 300

Gln Tyr Gly Asp Val Gly Leu Ala Lys Glu His Leu Phe Leu Tyr Leu

305 310 315 320

Gly Thr Asn Pro Ala Asn Asp Asn Phe Thr Phe Ile Asp Glu Asn Ser

325 330 335

Leu Gln Pro Pro Ala Lys Ala Val Asn Gln Arg Asp Ala Asp Leu Val

340 345 350

His Phe Trp Asp Lys Tyr Arg Lys Ala Pro Asp Gly Ser Val Arg Lys

355 360 365

Val Glu Ala Gln Lys Gln Val Val Glu Ala Met Ser His Arg Met His

370 375 380

Val Asp Asn Ser Ile Gln Leu Ile Gly Lys Leu Leu Phe Gly Ile Glu

385 390 395 400

Arg Gly Ala Asp Val Leu Lys Thr Val Arg Pro Ala Gly Gln Pro Leu

405 410 415

Val Asp Asp Trp Lys Cys Leu Lys Ser Met Val Arg Thr Phe Glu Thr

420 425 430

His Cys Gly Ser Leu Ala Gln Tyr Gly Met Lys His Met Arg Ser Ile

435 440 445

Ala Asn Ile Cys Asn Ala Gly Ile Gln Thr Glu Gln Met Ala Glu Ala

450 455 460

Ser Ser Gln Ala Cys Val Ser Ile Pro Ser Gly Gln Trp Ser Ser Ile

465 470 475 480

Gln Lys Gly Phe Ser Ala

485

<210> 9

<211> 493

<212> PRT

<213> Jatropha curcas

<400> 9

Met Thr Arg Leu Ala Thr Gly Val Ile Leu Leu Leu Leu Ala Leu Cys

1 5 10 15

Val Val Ser Ser Ala Gly Ser Arg Asp Ile Val Gly Asp Val Leu Arg

20 25 30

Leu Pro Ser Glu Ala Ser Arg Phe Phe Arg Pro Gly Gly Ala His Val

35 40 45

Ala Lys Glu Asp Asp Ser Thr Gly Thr Arg Trp Ala Ile Leu Ile Ala

50 55 60

Gly Ser Asn Gly Tyr Trp Asn Tyr Arg His Gln Ala Asp Val Cys His

65 70 75 80

Ala Tyr Gln Leu Leu Lys Lys Gly Gly Leu Lys Asp Glu Asn Ile Ile

85 90 95

Val Phe Met Tyr Asp Asp Ile Ala Phe Asn Lys Glu Asn Pro Arg Pro

100 105 110

Gly Val Ile Ile Asn Asn Pro Tyr Gly Glu Asp Val Tyr Lys Gly Val

115 120 125

Pro Lys Asp Tyr Thr Gly Glu Asp Val Asn Val Asn Asn Phe Phe Ala

130 135 140

Ala Ile Leu Gly Asn Lys Thr Ala Ile Thr Gly Gly Ser Gly Lys Val

145 150 155 160

Val Asp Ser Gly Pro Asn Asp His Ile Phe Ile Tyr Tyr Thr Asp His

165 170 175

Gly Gly Pro Gly Val Leu Gly Met Pro Thr Asn Pro Tyr Leu Tyr Ala

180 185 190

Asn Asp Leu Ile Asp Val Leu Ile Lys Lys His Ala Ser Gly Thr Tyr

195 200 205

Lys Ser Leu Val Phe Tyr Leu Glu Ala Cys Glu Ser Gly Ser Ile Phe

210 215 220

Glu Gly Leu Leu Pro Glu Gly Leu Asn Ile Tyr Ala Thr Thr Ala Ala

225 230 235 240

Asn Ala Glu Glu Ser Ser Trp Gly Thr Tyr Cys Pro Gly Glu Tyr Pro

245 250 255

Ser Pro Pro Pro Glu Tyr Glu Thr Cys Leu Gly Asp Leu Tyr Ser Val

260 265 270

Ala Trp Met Glu Asp Ser Asp Val His Asn Leu Gln Thr Glu Thr Leu

275 280 285

Arg Gln Gln Tyr Gln Leu Val Lys Arg Arg Thr Ala Asn Gly Asn Ser

290 295 300

Ala Tyr Gly Ser His Val Met Gln Tyr Gly Asp Val Gly Leu Ser Lys

305 310 315 320

Asp Asn Leu Phe Leu Tyr Met Gly Thr Asn Pro Ala Asn Glu Asn Tyr

325 330 335

Thr Phe Val Asp Glu Asn Ser Leu Arg Pro Pro Ser Lys Ala Val Asn

340 345 350

Gln Arg Asp Ala Asp Leu Val His Phe Trp Asp Lys Tyr Arg Lys Ala

355 360 365

Pro Asp Gly Ser Thr Arg Lys Ile Gln Ala Gln Lys Gln Phe Val Glu

370 375 380

Ala Met Ser His Arg Met His Leu Asp His Ser Met Lys Leu Ile Gly

385 390 395 400

Lys Leu Leu Phe Gly Ile Gly Lys Gly Ser Glu Val Leu Asn Ala Ile

405 410 415

Arg Pro Ala Gly Gln Pro Leu Val Asp Asp Trp Val Cys Leu Lys Thr

420 425 430

Leu Val Arg Thr Phe Glu Thr His Cys Gly Ser Leu Ser Gln Tyr Gly

435 440 445

Met Lys His Met Arg Ser Leu Ala Asn Leu Cys Asn Ala Gly Ile Arg

450 455 460

Glu Asp Gln Met Ala Glu Ala Ser Ala Gln Ala Cys Val Ser Ile Pro

465 470 475 480

Ser Gly Pro Trp Ser Ser Leu His Lys Gly Phe Ser Ala

485 490

<210> 10

<211> 494

<212> PRT

<213> Malus hupehensis

<400> 10

Met Thr Arg Leu Ala Ser Ala Val Val Leu Leu Phe Leu Ala Ser Val

1 5 10 15

Leu Ala Ser Ala Ala Gly Ser Arg Asp Leu Ile Gly Asp Val Leu Arg

20 25 30

Leu Pro Ser Glu Ala Ser Arg Phe Phe Gly Arg Gly Asp Asp Ala Pro

35 40 45

Asp Gln Gln Asp Asp Gly Thr Val Gly Thr Arg Trp Ala Val Leu Ile

50 55 60

Ala Gly Ser Asn Gly Tyr Trp Asn Tyr Arg His Gln Ala Asp Ile Cys

65 70 75 80

His Ala Tyr Gln Leu Leu Lys Lys Gly Gly Leu Lys Asp Glu Asn Ile

85 90 95

Val Val Phe Met Tyr Asp Asp Ile Ala Tyr Asn Glu Glu Asn Pro Arg

100 105 110

Gln Gly Val Ile Ile Asn Ser Pro His Gly Ser Asp Val Tyr Glu Gly

115 120 125

Val Pro Lys Asp Tyr Thr Gly Glu Asp Val Thr Val Asn Asn Phe Phe

130 135 140

Ala Ala Ile Leu Gly Asn Lys Thr Ala Leu Thr Gly Gly Ser Gly Lys

145 150 155 160

Val Val Asp Ser Gly Pro Asn Asp His Ile Phe Ile Tyr Tyr Thr Asp

165 170 175

His Gly Gly Pro Gly Ile Leu Gly Met Pro Thr Ser Pro Tyr Ile Tyr

180 185 190

Ala Asn Asp Leu Ile Glu Val Leu Lys Lys Lys His Ala Ala Gly Thr

195 200 205

Tyr Arg Ser Leu Val Phe Tyr Leu Glu Ala Cys Glu Ser Gly Ser Ile

210 215 220

Phe Glu Gly Leu Leu Pro Glu Gly Leu Asn Ile Phe Ala Thr Thr Ala

225 230 235 240

Ser Asn Ala Glu Glu Ser Ser Trp Gly Thr Tyr Cys Pro Gly Glu Tyr

245 250 255

Pro Ser Pro Pro Pro Glu Tyr Asp Thr Cys Leu Gly Asp Leu Tyr Ser

260 265 270

Val Ala Trp Met Glu Asp Ser Asp Val His Asn Leu Arg Ser Glu Thr

275 280 285

Leu His Gln Gln Tyr Glu Leu Val Lys Thr Arg Ala Ala Asn Asp Asn

290 295 300

Ser Gly Ser Gly Ser His Val Met Gln Tyr Gly Asp Val Gly Leu Ser

305 310 315 320

Lys Asn Asn Leu Phe Val Tyr Met Gly Thr Asn Pro Ala Asn Asp Asn

325 330 335

Tyr Thr Phe Leu Gly Glu Asn Ser Leu Arg Pro Ser Ser Lys Ala Val

340 345 350

Asn Gln Arg Asp Ala Asp Leu Leu His Phe Trp His Lys Tyr Arg Lys

355 360 365

Ala Pro Glu Gly Ser Ala Arg Lys Ile Gln Ala Gln Lys Asp Phe Val

370 375 380

Glu Ala Met Ser His Arg Met His Ile Asp Gln Thr Met Lys Leu Ile

385 390 395 400

Gly Lys Leu Leu Phe Gly Ile Glu Lys Gly Pro Gln Val Leu Asn Ala

405 410 415

Val Arg Pro Ala Gly Gln Pro Leu Val Asp Asp Trp Asp Cys Leu Lys

420 425 430

Thr Met Val Arg Ser Phe Glu Thr His Cys Gly Ser Leu Ser Gln Tyr

435 440 445

Gly Met Lys His Met Arg Ser Leu Ala Asn Ile Cys Asn Ala Gly Met

450 455 460

Thr Gln Glu Gln Met Ala Glu Ala Ser Ala Gln Ala Cys Val Ser Ala

465 470 475 480

Pro Ser Gly Arg Trp Ser Ser Leu His Arg Gly Phe Ser Ala

485 490

<210> 11

<211> 494

<212> PRT

<213> Pyrus x bretschneideri

<400> 11

Met Thr Arg Phe Ala Gly Ala Val Val Leu Leu Phe Leu Ala Ser Val

1 5 10 15

Leu Ala Ser Ala Ala Gly Ser Arg Asp Leu Ile Gly Asp Val Leu Arg

20 25 30

Leu Pro Ser Glu Ala Ser Arg Phe Phe Gly Arg Gly Asp Asp Ala Pro

35 40 45

Asp Gln Gln Asp Asp Gly Thr Val Gly Thr Arg Trp Ala Val Leu Ile

50 55 60

Ala Gly Ser Asn Gly Tyr Trp Asn Tyr Arg His Gln Ala Asp Ile Cys

65 70 75 80

His Ala Tyr Gln Leu Leu Lys Lys Gly Gly Leu Lys Asp Glu Asn Ile

85 90 95

Val Val Phe Met Tyr Asp Asp Ile Ala Tyr Asn Glu Glu Asn Pro Arg

100 105 110

Gln Gly Val Ile Ile Asn Asn Pro Gln Gly Ser Asp Val Tyr Glu Gly

115 120 125

Val Pro Lys Asp Tyr Thr Gly Glu Asp Val Thr Val Asn Asn Phe Phe

130 135 140

Ala Ala Ile Leu Gly Asn Lys Thr Ala Leu Thr Gly Gly Ser Gly Lys

145 150 155 160

Val Val Asp Ser Gly Pro Asn Asp His Ile Phe Ile Tyr Tyr Thr Asp

165 170 175

His Gly Gly Pro Gly Val Leu Gly Met Pro Thr Ser Pro Tyr Ile Tyr

180 185 190

Ala Asn Asp Leu Ile Glu Val Leu Lys Lys Lys His Ala Ala Gly Thr

195 200 205

Tyr Lys Ser Leu Val Phe Tyr Leu Glu Ala Cys Glu Ser Gly Ser Ile

210 215 220

Phe Glu Gly Leu Leu Pro Glu Gly Leu Asn Ile Phe Ala Thr Thr Ala

225 230 235 240

Ser Asn Ala Glu Glu Ser Ser Trp Gly Thr Tyr Cys Pro Gly Glu Tyr

245 250 255

Pro Ser Pro Pro Pro Glu Tyr Glu Thr Cys Leu Gly Asp Leu Tyr Ser

260 265 270

Val Ala Trp Met Glu Asp Ser Asp Ile His Asn Leu Arg Ser Glu Thr

275 280 285

Leu His Gln Gln Tyr Glu Leu Val Lys Thr Arg Thr Ala Asn Asp Asn

290 295 300

Tyr Gly Phe Gly Ser His Val Met Gln Tyr Gly Asp Val Gly Leu Ser

305 310 315 320

Lys Asn Asn Leu Phe Val Tyr Met Gly Thr Asn Pro Ala Asn Asp Asn

325 330 335

Tyr Thr Phe Leu Gly Glu Asn Ser Leu Arg Pro Ser Ser Lys Ala Val

340 345 350

Asn Gln Arg Asp Ala Asp Leu Leu His Phe Trp His Lys Tyr Arg Lys

355 360 365

Ala Pro Glu Gly Ser Ala Arg Lys Val Gln Ala Gln Lys Asp Phe Val

370 375 380

Glu Ala Met Ser His Arg Met His Ile Asp Gln Thr Met Lys Leu Ile

385 390 395 400

Gly Lys Leu Leu Phe Gly Ile Glu Lys Gly Pro Gln Val Leu Asn Ala

405 410 415

Val Arg Pro Ala Gly Gln Pro Leu Val Asp Asp Trp Asp Cys Leu Lys

420 425 430

Thr Met Val Arg Ser Phe Glu Thr His Cys Gly Ser Leu Ser Gln Tyr

435 440 445

Gly Met Lys His Met Arg Ser Leu Ala Asn Ile Cys Asn Ala Gly Met

450 455 460

Thr Gln Glu Gln Met Ala Glu Ala Ser Ala Gln Ala Cys Val Ser Ala

465 470 475 480

Pro Ser Ser Arg Trp Ser Ser Leu His Arg Gly Phe Ser Ala

485 490

<210> 12

<211> 537

<212> PRT

<213> artificial sequence

<220>

<223> artificial sequence

<400> 12

Met Gly Met Ala His His His His His His Met Gln Ile Phe Val Lys

1 5 10 15

Thr Leu Thr Gly Lys Thr Ile Thr Leu Glu Val Glu Pro Ser Asp Thr

20 25 30

Ile Glu Asn Val Lys Ala Lys Ile Gln Asp Lys Glu Gly Ile Pro Pro

35 40 45

Asp Gln Gln Arg Leu Ile Phe Ala Gly Lys Gln Leu Glu Asp Gly Arg

50 55 60

Thr Leu Ser Asp Tyr Asn Ile Gln Lys Glu Ser Thr Leu His Leu Val

65 70 75 80

Leu Arg Leu Arg Gly Gly Ala Arg Asp Gly Asp Tyr Leu His Leu Pro

85 90 95

Ser Glu Val Ser Arg Phe Phe Arg Pro Gln Glu Thr Asn Asp Asp His

100 105 110

Gly Glu Asp Ser Val Gly Thr Arg Trp Ala Val Leu Ile Ala Gly Ser

115 120 125

Lys Gly Tyr Ala Asn Tyr Arg His Gln Ala Gly Val Cys His Ala Tyr

130 135 140

Gln Ile Leu Lys Arg Gly Gly Leu Lys Asp Glu Asn Ile Val Val Phe

145 150 155 160

Met Tyr Asp Asp Ile Ala Tyr Asn Glu Ser Asn Pro Arg Pro Gly Val

165 170 175

Ile Ile Asn Ser Pro His Gly Ser Asp Val Tyr Ala Gly Val Pro Lys

180 185 190

Asp Tyr Thr Gly Glu Glu Val Asn Ala Lys Asn Phe Leu Ala Ala Ile

195 200 205

Leu Gly Asn Lys Ser Ala Ile Thr Gly Gly Ser Gly Lys Val Val Asp

210 215 220

Ser Gly Pro Asn Asp His Ile Phe Ile Tyr Tyr Thr Asp His Gly Ala

225 230 235 240

Ala Gly Val Ile Gly Met Pro Ser Lys Pro Tyr Leu Tyr Ala Asp Glu

245 250 255

Leu Asn Asp Ala Leu Lys Lys Lys His Ala Ser Gly Thr Tyr Lys Ser

260 265 270

Leu Val Phe Tyr Leu Glu Ala Cys Glu Ser Gly Ser Met Phe Glu Gly

275 280 285

Ile Leu Pro Glu Asp Leu Asn Ile Tyr Ala Leu Thr Ser Thr Asn Thr

290 295 300

Thr Glu Ser Ser Trp Cys Tyr Tyr Cys Pro Ala Gln Glu Asn Pro Pro

305 310 315 320

Pro Pro Glu Tyr Asn Val Cys Leu Gly Asp Leu Phe Ser Val Ala Trp

325 330 335

Leu Glu Asp Ser Asp Val Gln Asn Ser Trp Tyr Glu Thr Leu Asn Gln

340 345 350

Gln Tyr His His Val Asp Lys Arg Ile Ser His Ala Ser His Ala Thr

355 360 365

Gln Tyr Gly Asn Leu Lys Leu Gly Glu Glu Gly Leu Phe Val Tyr Met

370 375 380

Gly Ser Asn Pro Ala Asn Asp Asn Tyr Thr Ser Leu Asp Gly Asn Ala

385 390 395 400

Leu Thr Pro Ser Ser Ile Val Val Asn Gln Arg Asp Ala Asp Leu Leu

405 410 415

His Leu Trp Glu Lys Phe Arg Lys Ala Pro Glu Gly Ser Ala Arg Lys

420 425 430

Glu Glu Ala Gln Thr Gln Ile Phe Lys Ala Met Ser His Arg Val His

435 440 445

Ile Asp Ser Ser Ile Lys Leu Ile Gly Lys Leu Leu Phe Gly Ile Glu

450 455 460

Lys Cys Thr Glu Ile Leu Asn Ala Val Arg Pro Ala Gly Gln Pro Leu

465 470 475 480

Val Asp Asp Trp Ala Cys Leu Arg Ser Leu Val Gly Thr Phe Glu Thr

485 490 495

His Cys Gly Ser Leu Ser Glu Tyr Gly Met Arg His Thr Arg Thr Ile

500 505 510

Ala Asn Ile Cys Asn Ala Gly Ile Ser Glu Glu Gln Met Ala Glu Ala

515 520 525

Ala Ser Gln Ala Cys Ala Ser Ile Pro

530 535

<210> 13

<211> 10

<212> PRT

<213> artificial sequence

<220>

<223> artificial sequence

<400> 13

Met Gly Met Ala His His His His His His

1 5 10

<210> 14

<211> 76

<212> PRT

<213> artificial sequence

<220>

<223> artificial sequence

<400> 14

Met Gln Ile Phe Val Lys Thr Leu Thr Gly Lys Thr Ile Thr Leu Glu

1 5 10 15

Val Glu Pro Ser Asp Thr Ile Glu Asn Val Lys Ala Lys Ile Gln Asp

20 25 30

Lys Glu Gly Ile Pro Pro Asp Gln Gln Arg Leu Ile Phe Ala Gly Lys

35 40 45

Gln Leu Glu Asp Gly Arg Thr Leu Ser Asp Tyr Asn Ile Gln Lys Glu

50 55 60

Ser Thr Leu His Leu Val Leu Arg Leu Arg Gly Gly

65 70 75

<210> 15

<211> 450

<212> PRT

<213> Ovaloparmena affinis

<400> 15

Ala Arg Gly Asp Tyr Leu His Leu Pro Ser Glu Val Ser Arg Phe Phe

1 5 10 15

Arg Pro Gln Glu Thr Asn Asp Asp His Gly Glu Asp Ser Val Gly Thr

20 25 30

Arg Trp Ala Val Leu Ile Ala Gly Ser Lys Gly Tyr Ala Asn Tyr Arg

35 40 45

His Gln Ala Gly Val Cys His Ala Tyr Gln Ile Leu Lys Arg Gly Gly

50 55 60

Leu Lys Asp Glu Asn Ile Val Val Phe Met Tyr Asp Asp Ile Ala Tyr

65 70 75 80

Asn Glu Ser Asn Pro Arg Pro Gly Val Ile Ile Asn Ser Pro His Gly

85 90 95

Ser Asp Val Tyr Ala Gly Val Pro Lys Asp Tyr Thr Gly Glu Glu Val

100 105 110

Asn Ala Lys Asn Phe Leu Ala Ala Ile Leu Gly Asn Lys Ser Ala Ile

115 120 125

Thr Gly Gly Ser Gly Lys Val Val Asp Ser Gly Pro Asn Asp His Ile

130 135 140

Phe Ile Tyr Tyr Thr Asp His Gly Ala Ala Gly Val Ile Gly Met Pro

145 150 155 160

Ser Lys Pro Tyr Leu Tyr Ala Asp Glu Leu Asn Asp Ala Leu Lys Lys

165 170 175

Lys His Ala Ser Gly Thr Tyr Lys Ser Leu Val Phe Tyr Leu Glu Ala

180 185 190

Cys Glu Ser Gly Ser Met Phe Glu Gly Ile Leu Pro Glu Asp Leu Asn

195 200 205

Ile Tyr Ala Leu Thr Ser Thr Asn Thr Thr Glu Ser Ser Trp Cys Tyr

210 215 220

Tyr Cys Pro Ala Gln Glu Asn Pro Pro Pro Pro Glu Tyr Asn Val Cys

225 230 235 240

Leu Gly Asp Leu Phe Ser Val Ala Trp Leu Glu Asp Ser Asp Val Gln

245 250 255

Asn Ser Trp Tyr Glu Thr Leu Asn Gln Gln Tyr His His Val Asp Lys

260 265 270

Arg Ile Ser His Ala Ser His Ala Thr Gln Tyr Gly Asn Leu Lys Leu

275 280 285

Gly Glu Glu Gly Leu Phe Val Tyr Met Gly Ser Asn Pro Ala Asn Asp

290 295 300

Asn Tyr Thr Ser Leu Asp Gly Asn Ala Leu Thr Pro Ser Ser Ile Val

305 310 315 320

Val Asn Gln Arg Asp Ala Asp Leu Leu His Leu Trp Glu Lys Phe Arg

325 330 335

Lys Ala Pro Glu Gly Ser Ala Arg Lys Glu Glu Ala Gln Thr Gln Ile

340 345 350

Phe Lys Ala Met Ser His Arg Val His Ile Asp Ser Ser Ile Lys Leu

355 360 365

Ile Gly Lys Leu Leu Phe Gly Ile Glu Lys Cys Thr Glu Ile Leu Asn

370 375 380

Ala Val Arg Pro Ala Gly Gln Pro Leu Val Asp Asp Trp Ala Cys Leu

385 390 395 400

Arg Ser Leu Val Gly Thr Phe Glu Thr His Cys Gly Ser Leu Ser Glu

405 410 415

Tyr Gly Met Arg His Thr Arg Thr Ile Ala Asn Ile Cys Asn Ala Gly

420 425 430

Ile Ser Glu Glu Gln Met Ala Glu Ala Ala Ser Gln Ala Cys Ala Ser

435 440 445

Ile Pro

450

<210> 16

<211> 38

<212> DNA

<213> artificial sequence

<220>

<223> primer used for mutagenesis

<400> 16

caccaccgaa agcagctggg cctactattg cccggcgc 38

<210> 17

<211> 14

<212> PRT

<213> artificial sequence

<220>

<223> Peptide template used for characterizing recognition sequence

specificity of Quicklase

<220>

<221> MISC_FEATURE

<222> (1)..(1)

<223> Xaa is any amino acid. In each screen, only one of the residueis

modified. The default amino acid at Xaa1 position is Gly, at Xaa2

position is Leu, and at Xaa3 position is Gly, and at the Xaa4

position is Leu, in this screen.

<220>

<221> MISC_FEATURE

<222> (2)..(2)

<223> Xaa is any amino acid. In each screen, only one of the residueis

modified. The default amino acid at Xaa1 position is Gly, at Xaa2

position is Leu, and at Xaa3 position is Gly, and at the Xaa4

position is Leu, in this screen.

<220>

<221> MISC_FEATURE

<222> (13)..(13)

<223> Xaa is any amino acid. In each screen, only one of the residueis

modified. The default amino acid at Xaa1 position is Gly, at Xaa2

position is Leu, and at Xaa3 position is Gly, and at the Xaa4

position is Leu, in this screen.

<220>

<221> MISC_FEATURE

<222> (14)..(14)

<223> Xaa is any amino acid. In each screen, only one of the residueis

modified. The default amino acid at Xaa1 position is Gly, at Xaa2

position is Leu, and at Xaa3 position is Gly, and at the Xaa4

position is Leu, in this screen.

<400> 17

Xaa Xaa Tyr Arg Arg Gly Arg Leu Tyr Arg Arg Asn Xaa Xaa

1 5 10

Claims

1.形成式（I）的肽的方法：

P¹-Asn-Xaa¹-Leu-P²(I)，

通过连接式（II）的第一肽

P¹-Asn-Xaa³-Xaa⁴-COOH/CONH₂(II)

至式（III）的第二肽

H₂N-Xaa¹-Leu-P²(III)，

其中，P¹和P²各自独立地为任意修饰或未修饰的肽；Xaa¹为任意天然存在的氨基酸；以及（i）Xaa³是任意天然存在的氨基酸，Xaa⁴为Leu；或者（ii）Xaa³为Gly，Xaa⁴为Leu、Ile、Pro或Phe，

通过酶促裂解所述式（II）的第一肽中“Asn”和“Xaa³”之间的键，并通过所述第一肽的C端将其片段P¹-Asn连接至所述式（III）的第二肽的N端以形成式（I）的连接肽，其中，酶促裂解和连接反应由肽连接酶在适于所述裂解和连接反应的条件下催化，所述肽连接酶由以下组成：

（a）SEQ ID NO：1所示的氨基酸序列；或

（b）（a）的一个功能片段，前提为所述功能片段包括对应于SEQ ID NO：1中残基53-347所示的氨基酸序列，所述功能片段具有肽连接酶活性。

2.如权利要求1所述的方法，其中，

（i）Xaa³选自His、Ala、Ser、Cys、Asn、Gly、Arg、Met、Lys、Gln、Leu和Glu组成的组，Xaa⁴为Leu；或者

（ii）Xaa³为Gly，Xaa⁴为Leu、Ile或Pro。

3.如权利要求1所述的方法，其中，

（i）Xaa³为His、Ser、Cys、Gly或Ala，Xaa⁴为Leu；或者

（ii）Xaa³为Gly，Xaa⁴为Leu或Ile。

4.如权利要求1所述的方法，其中，Xaa¹为Arg或Gly，

（i）Xaa³为His、Ala或Gly，Xaa⁴为Leu；或者（ii）Xaa³为Gly，Xaa⁴为Leu。

5.如权利要求1所述的方法，其中，所述第一肽和所述第二肽是相同肽的末端，P¹和P²结合形成单个肽序列，以使所述方法环化所述肽。

6.如权利要求1所述的方法，其中，所述肽连接酶由以下组成：

SEQ ID NO:1所示的氨基酸序列。

7.如权利要求1所述的方法，其中，所述第一肽和/或所述第二肽还包括标签部分。

8.如权利要求7所述的方法，其中，所述标签部分为亲和标签或可检测标签。

9.如权利要求1所述的方法，其中，所述第一肽和/或所述第二肽与固体载体材料连接。

10.如权利要求1所述的方法，其中，所述第一肽和/或所述第二肽为细胞表面蛋白质，以使所述方法引起所述细胞表面蛋白质的修饰或标记。

11.如权利要求1所述的方法，其中所述肽连接酶来源于Oldenlandia affinis。

12.如权利要求1所述的方法，其中所述功能片段由对应于SEQ ID NO：1中残基53-347所示的氨基酸序列组成，所述功能片段具有肽连接酶活性。

13.一种或多种目标肽的多聚体的制备方法，所述方法包括以下步骤：

（a）提供具有C端Asn-Xaa³-Xaa⁴-COOH/CONH₂残基的一种或多种目标肽以及具有N端H₂N-Xaa¹-Leu残基两个或两个以上拷贝的骨架分子，或者，提供具有N端H₂N-Xaa¹-Leu残基的一种或多种目标肽以及具有C端Asn-Xaa³-Xaa⁴-COOH/CONH₂残基两个或两个以上拷贝的骨架分子，其中，Xaa¹为任意天然存在的氨基酸；以及（i）Xaa³是任意天然存在的氨基酸，Xaa⁴为Leu；或者（ii）Xaa³为Gly，Xaa⁴为Leu、Ile、Pro或Phe；

（b）提供肽连接酶；

（c）制备所述一种或多种目标肽、所述骨架分子和所述肽连接酶的混合物；

（d）使所述混合物处于所述肽连接酶能催化所述一种或多种目标肽与所述骨架分子连接的条件中；

其中所述肽连接酶包含或由以下组成：

（i）SEQ ID NO：1所示的氨基酸序列；或

（ii）（i）的一个功能片段，前提为所述功能片段包括对应于SEQ ID NO：1中残基53-347所示的氨基酸序列，所述功能片段具有肽连接酶活性。

14.如权利要求13所述的方法，其中，

（ii）Xaa³为Gly，Xaa⁴选自Leu、Ile和Pro组成的组。

15.如权利要求13所述的方法，其中，

（i）Xaa³为His、Ser、Cys、Gly或Ala，Xaa⁴为Leu；或者

（ii）Xaa³为Gly，Xaa⁴为Leu或Ile。

16.如权利要求13所述的方法，其中，Xaa¹为Arg或Gly，

17.如权利要求13所述的方法，其中，所述肽连接酶由以下组成：

SEQ ID NO:1所示的氨基酸序列。

18.一种通过一种或多种目标肽修饰或标记靶细胞表面的方法，所述方法包括以下步骤：

（a）提供具有C端Asn-Xaa³-Xaa⁴-COOH/CONH₂残基和/或N端H₂N-Xaa¹-Leu残基的一种或多种目标肽，其中，Xaa¹为任意天然存在的氨基酸；以及（i）Xaa³是任意天然存在的氨基酸，Xaa⁴为Leu；或者（ii）Xaa³为Gly，Xaa⁴为Leu、Ile、Pro或Phe；

（b）提供肽连接酶；

（c）使靶细胞与所述一种或多种目标肽和所述肽连接酶接触，其中所述靶细胞包括：

当所述一种或多种目标肽具有N端H₂N-Xaa¹-Leu残基时，所述靶细胞的细胞表面蛋白具有C端Asn-Xaa³-Xaa⁴-COOH/CONH₂残基；和/或

当所述一种或多种目标肽具有C端Asn-Xaa³-Xaa⁴-COOH/CONH₂残基时，所述靶细胞的细胞表面蛋白具有N端H₂N-Xaa¹-Leu残基，

其中，Xaa¹为任意天然存在的氨基酸；以及（i）Xaa³是任意天然存在的氨基酸，Xaa⁴为Leu；或者（ii）Xaa³为Gly，Xaa⁴为Leu、Ile、Pro或Phe；

（d）使所述靶细胞处于所述肽连接酶能催化所述一种或多种目标肽与所述靶细胞的细胞表面蛋白质连接的条件中，

其中所述肽连接酶由以下组成：

（i）SEQ ID NO：1所示的氨基酸序列；或

19.如权利要求18所述的方法，其中，

（i）Xaa³选自His、Ala、Ser、Cys、Asn、Gly、Arg、Met、Lys、Gln、Leu和Glu组成的组，Xaa⁴为Leu或者

（ii）Xaa³为Gly，Xaa⁴为Leu、Ile或Pro。

20.如权利要求18所述的方法，其中，

（i）Xaa³为His、Ser、Cys、Gly或Ala，Xaa⁴为Leu；或者

（ii）Xaa³为Gly，Xaa⁴为Leu或Ile。

21.如权利要求18所述的方法，其中，Xaa¹为Arg或Gly，

22.如权利要求18所述的方法，其中，所述肽连接酶由以下组成：

SEQ ID NO:1所示的氨基酸序列。

23.如权利要求18所述的方法，其中，所述方法还包括在步骤（d）之后从所述靶细胞中去除未连接的所述一种或多种目标肽。

24.如权利要求18所述的方法，其中，所述一种或多种目标肽包括标签部分。

25.如权利要求24所述的方法，其中，所述标签部分为亲和标签或可检测标签。

26.如权利要求18所述的方法，其中，所述一种或多种目标肽与固体载体材料连接。

27.如权利要求18所述的方法，其中，所述靶细胞重组表达具有N端H₂N-Xaa¹-Leu残基或C端Asn-Xaa³-Xaa⁴-COOH/CONH₂残基的所述细胞表面蛋白，以便用所述一种或多种目标肽标记。

28.肽连接酶，由以下组成：

（a）SEQ ID NO：1所示的氨基酸序列；或

29.如权利要求28所述的肽连接酶，其中，所述肽连接酶由以下组成：

SEQ ID NO:1所示的氨基酸序列。

30.用于权利要求1-27任一项所述方法的试剂盒，其中，所述试剂盒包含根据权利要求28或29所述的肽连接酶。

31.根据权利要求28或29所述的肽连接酶在连接第一肽和第二肽中的应用，其中

所述第一肽如式（II）所示，

P¹-Asn-Xaa³-Xaa⁴-COOH/CONH₂(II)

所述第二肽如式（III）所示，

H₂N-Xaa¹-Leu-P²(III)，

其中，P¹和P²各自独立地为任意修饰或未修饰的肽；Xaa¹为任意天然存在的氨基酸；以及（i）Xaa³是任意天然存在的氨基酸，Xaa⁴为Leu；或（ii）Xaa³为Gly，Xaa⁴为Leu、Ile、Pro或Phe。