CN109790205B - 酶促肽连接的方法 - Google Patents

酶促肽连接的方法 Download PDF

Info

Publication number
CN109790205B
CN109790205B CN201780058821.2A CN201780058821A CN109790205B CN 109790205 B CN109790205 B CN 109790205B CN 201780058821 A CN201780058821 A CN 201780058821A CN 109790205 B CN109790205 B CN 109790205B
Authority
CN
China
Prior art keywords
xaa
leu
gly
ala
ser
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201780058821.2A
Other languages
English (en)
Other versions
CN109790205A (zh
Inventor
吴彬
杨仁良
黄怡华
朱利安·莱斯卡
刘传法
谈秉军
基恩·特鲁茨·江·阮
龙子琦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanyang Technological University
Original Assignee
Nanyang Technological University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanyang Technological University filed Critical Nanyang Technological University
Publication of CN109790205A publication Critical patent/CN109790205A/zh
Application granted granted Critical
Publication of CN109790205B publication Critical patent/CN109790205B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/02Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/93Ligases (6)

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Microbiology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biomedical Technology (AREA)
  • Botany (AREA)
  • Biophysics (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本发明涉及通过第一肽的C‑末端将其与第二肽的N‑末端连接的方法,其中该反应由具有SEQ ID NO:1氨基酸序列的天冬酰胺/天冬氨酸(Asx)肽连接酶OaAEP1 Cys247Ala催化。进一步包括制备一种或多种目标肽的二聚体、低聚体或多聚体的方法,以及通过一种或多种目标肽修饰或标记靶细胞表面的方法。本发明还包括根据任意所述方法得到的连接肽和/或标记的靶细胞,具有SEQ ID NO:1的氨基酸序列的肽连接酶OaAEP1 Cys247Ala,以及包含所述肽连接酶的试剂盒。

Description

酶促肽连接的方法
相关申请的交叉引用
本申请引用并要求2016年9月23日提交的新加坡专利申请号为10201607951V的优先权权益,其内容以引用的方式并入本文中用于所有目的,包括依据PCT实施细则4.18条中未包含在本文说明书、权利要求或附图且涉及PCT实施细则20.5(a)条的任意要素或部分的并入。
技术领域
本发明主要涉及Asx-特异性肽连接酶,利用所述连接酶酶法连接肽的方法以及由此产生的肽和含肽复合物。
背景技术
与自然界中大量发现的蛋白酶不同,肽连接酶相对罕见。报道的第一个天冬酰胺/天冬氨酸(Asx)肽连接酶是从产大环寡肽的植物蝶豆(Clitoria ternatea)中提纯的蝶豆粘酶1(butelase 1)(Nguyen,G.K.,et al.,Nat Chem Biol,2014.10(9):p.732-8)。与通常用于体外催化转肽反应的细菌转肽酶相比,butelase 1在催化肽和蛋白质连接反应方面表现出极高的效率,在生物技术、蛋白质工程、化学酶合成和蛋白质标记中展开了广泛的应用。最近,一种进化的天冬酰胺内肽酶(AEP)命名为OaAEP1b,与butelase 1相关,也具有连接肽基底物N和C端的能力,其从植物Oldenlandia affinis中分离出来,并在酸性pH激活后用大肠杆菌以活性形式表达。butelase 1和OaAEP1b均在连接位点使用氨基酸Asx,并且具有65%的氨基酸序列一致性。然而,OaAEP1b报道的催化效率明显低于butelase 1(Harris,K.S.,et al.,Nat Commun,2015.6:p.10199)。此外,相关的这种蛋白连接酶家族的结构和催化机制尚不清楚。因此,本领域仍需要新的开发以克服现有技术的缺点,特别是能够有效的肽连接的新方法。
发明内容
通过提供本文所述的方法,本发明满足了本领域的上述需要。
第一方面,本发明涉及一种形成式(I)的肽的方法
P1-Asx-Xaa1-Xaa2-P2(I),
通过连接式(II)的第一肽
P1-Asx-Xaa3-Leu-COOH/CONH2(II)
至式(III)的第二肽
H2N-Xaa1-Xaa2-P2(III),
其中,P1和P2各自独立地为任意修饰或未修饰的肽,并且任选地可以结合以使式(II)和(III)的肽是相同肽的末端;Asx为Asp或Asn;Xaa1为任意天然存在的氨基酸;Xaa2为除Pro之外的任意天然存在的氨基酸,优选地为Leu或Ile;Xaa3是任意天然存在的氨基酸,优选地选自His、Ala、Ser、Cys、Asn、Gly、Arg、Met、Lys、Gln、Leu和Glu组成的组,
通过酶促裂解所述式(II)的第一肽中“Asx”和“Xaa3”之间的键,并通过所述第一肽的C端将其片段P1-Asx连接至所述式(III)的第二肽的N端以形成式(I)的连接肽,其中,酶促裂解和连接反应由具有OaAEP1 Cys247Ala(SEQ ID NO:1,下文也称为“Quicklase”)活性的肽连接酶在适于所述裂解和连接反应的条件下催化。
在多种实施方式中,所述第一肽和所述第二肽是相同肽的末端(即P1和P2结合形成单个肽序列),以使所述方法环化所述肽。
在多种实施方式中,所述具有OaAEP1 Cys247Ala(SEQ ID NO:1)活性的肽连接酶包含或包括:
(a)SEQ ID NO:1所示的氨基酸序列;
(b)与SEQ ID NO:1所述的氨基酸序列具有至少65%、优选地至少75%、甚至更优选地至少85%、最优选地至少95%的序列一致性,或至少80%、优选地至少90%、更优选地至少95%的序列同源性的氨基酸序列,前提为所述肽连接酶包括对应于SEQ ID NO:1中残基247-264位置的SEQ ID NO:2所示的氨基酸序列;
(c)(a)或(b)的功能片段;或
(d)含有(a)、(b)或(c)作为其必需组分的氨基酸序列,前提为所述肽连接酶不是SEQ ID NO:3所示的氨基酸序列的野生型OaAEP1或SEQ ID NO:4所示的氨基酸序列的蝶豆粘酶1。
在多种实施方式中,所述具有OaAEP1 Cys247Ala(SEQ ID NO:1)活性的肽连接酶包含或包括:
(a)SEQ ID NO:1所示的氨基酸序列;
(b)SEQ ID NO:5所示的氨基酸序列;
(c)SEQ ID NO:6所示的氨基酸序列;
(d)SEQ ID NO:7所示的氨基酸序列;
(e)SEQ ID NO:8所示的氨基酸序列;
(f)SEQ ID NO:9所示的氨基酸序列;
(g)SEQ ID NO:10所示的氨基酸序列;或
(h)SEQ ID NO:11所示的氨基酸序列;
在多种实施方式中,所述第一肽和/或所述第二肽还包括标签部分。
在多种实施方式中,所述标签部分为亲和标签、治疗剂、可检测标签或骨架分子。
在多种实施方式中,所述第一肽和/或所述第二肽与固体载体材料连接。
在多种实施方式中,所述第一肽和/或所述第二肽为细胞表面蛋白质,以使所述方法引起所述细胞表面蛋白质的修饰或标记并使细胞表面如此。
第二方面,本发明涉及一种制备一种或多种目标肽的二聚体、低聚体或多聚体的方法,所述方法包括以下步骤:
(a)提供具有C端Asx-Xaa3-Leu-COOH/CONH2残基的一种或多种目标肽以及具有N端H2N-Xaa1-Xaa2残基两个或两个以上拷贝的骨架分子,或者,提供具有N端H2N-Xaa1-Xaa2残基的一种或多种目标肽以及具有C端Asx-Xaa3-Leu-COOH/CONH2残基两个或两个以上拷贝的残基骨架分子,其中,Asx为Asp或Asn;Xaa1为任意天然存在的氨基酸;Xaa2为除Pro之外的任意天然存在的氨基酸,优选地为Leu或Ile;Xaa3是任意天然存在的氨基酸,优选地选自His、Ala、Ser、Cys、Asn、Gly、Arg、Met、Lys、Gln、Leu和Glu组成的组;
(b)提供具有OaAEP1 Cys247Ala(SEQ ID NO:1)活性的肽连接酶;
(c)制备所述一种或多种目标肽、所述骨架分子和所述具有OaAEP1Cys247Ala(SEQID NO:1)活性的肽连接酶的混合物;
(d)使所述混合物处于所述具有OaAEP1 Cys247Ala(SEQ ID NO:1)活性的肽连接酶能催化所述一种或多种目标肽与所述骨架分子连接的条件中。
第三方面,本发明涉及一种通过一种或多种目标肽修饰或标记靶细胞表面的方法,所述方法包括以下步骤:
(a)提供具有C端Asx-Xaa3-Leu-COOH/CONH2残基和/或N端H2N-Xaa1-Xaa2残基的一种或多种目标肽,其中,Asx为Asp或Asn;Xaa1为任意天然存在的氨基酸;Xaa2为除Pro之外的任意天然存在的氨基酸,优选地为Leu或Ile;Xaa3是任意天然存在的氨基酸,优选地选自His、Ala、Ser、Cys、Asn、Gly、Arg、Met、Lys、Gln、Leu和Glu组成的组;
(b)提供具有OaAEP1 Cys247Ala(SEQ ID NO:1)活性的肽连接酶;
(c)使靶细胞与所述一种或多种目标肽和所述具有OaAEP1 Cys247Ala(SEQ IDNO:1)活性的肽连接酶接触;
(d)使所述靶细胞处于所述具有OaAEP1 Cys247Ala(SEQ ID NO:1)活性的肽连接酶能催化所述一种或多种目标肽与所述靶细胞的细胞表面蛋白质连接的条件中。
在多种实施方式中,所述方法还包括在步骤(d)之后从所述靶细胞中去除未连接的所述一种或多种目标肽。
在多种实施方式中,所述一种或多种目标肽包括如上所述的标签部分。
在多种实施方式中,所述靶细胞重组表达具有N端H2N-Xaa1-Xaa2残基或C端Asx-Xaa3-Leu-COOH/CONH2残基的表面多肽,以便用所述一种或多种目标肽标记。
在本发明所有上述方面的多种实施方式中,
(a)Asx为Asp或Asn;和/或
(b)Xaa1为所有天然存在的氨基酸;和/或
(c)Xaa2为Leu或Ile;和/或
(d)Xaa3选自His、Ala、Ser、Cys、Asn、Gly、Arg、Met、Lys、Gln、Leu和Glu组成的组。
在优选实施方式中,满足(a)-(d)特征中两个或两个以上,即(a)和(b)、(a)和(c),(a)和(d),(b)和(c),(b)和(d),或满足三个或三个以上特征,即(a)、(b)和(c),(a)、(b)和(d),(a)、(c)和(d),(b)、(c)和(d),或者最优选地满足所有四个特征。
在优选地实施方式中,Asx为Asn,Xaa1为任意天然存在的氨基酸,Xaa2为Leu,以及Xaa3为His、Ser、Cys、Gly或Ala。
在更优选地实施方式中,Asx为Asn,Xaa1为Arg或Gly,Xaa2为Leu,Xaa3为His、Ala或Gly。
第四方面,本发明涉及根据本发明中任意方法得到的连接肽和/或标记的靶细胞。
第五方面,本发明涉及具有SEQ ID NO:1氨基酸序列的连接肽酶OaAEP1Cys247Ala和具有上述活性的其他肽连接酶,以及包含任何所述肽连接酶的试剂盒,特别是OaAEP1Cys247Ala(SEQ ID NO:1)。
另一方面,本发明涉及如本文所述的用于连接两个肽的具有OaAEP1Cys247Ala(SEQ ID NO:1)活性的肽连接酶的应用。
应当理解,本文公开的与本发明的一个方面有关的所有实施方式,同样适用于本发明其他所有方面。
附图说明
当非限制性实施例和附图一起考虑时,参考详细的说明书将更好地理解本发明。
图1显示了(a)OaAEP1 Cys247Ala(SEQ ID NO:1)介导的肽连接和(b)其优选实施方式的示意图。
图2显示了OaAEP1的纯化和激活。(a)His-Ub-OaAEP1构建体和所示蛋白质的三个区域的边界,以及推导的活化区段的示意图。合成了6-His标签和泛素标签,随后是OaAEP1(24-474),并将其插入到pET28b载体中。经过NI-NTA亲和纯化后,大约一半的UB-AEP-FL失去N端融合标签,并以AEP-FL形式(53-474)纯化,最后结晶。该OaAEP1b的酶活性形式,AEP-holo(53-347/351)是酸性诱导AEP-FL自解离失去C端自抑制帽区的产物。(b)色谱纯化和溶解晶体过程中获得的片段的SDS PAGE分析。(c)激活前后OaAEP1的尺寸排阻色谱图,显示有Ub-AEP-FL和AEP-FL异二聚体以及AEP-holo单体。标准蛋白质的洗脱体积用于比较。(d)OaAEP1的pH依赖性激活的SDS PAGE分析。激活进行3小时,激活峰值在pH 3.4到4之间。(e)通过活性重组成熟的OaAEP1酶反式激活/成熟无活性的Cys217Ser活性位点突变体。Cys217Ala活性位点突变体缺乏自激活活性。在pH 3.7下孵化18小时后,添加重量比5%的AEP-FL能够反式切割和激活大部分的AEP-FL Cys217Ala。
图3显示了OaAEP1在其酶原形式下的晶体结构。(a)该OaAEP1结构的整体“正面”视图表示为“动画”(α-螺旋为带状,β-股为箭头),催化核心区域为绿色,前区为紫色。柔性接头包括的残基325-343(未显示)描绘成虚线,被OaAEP1活性位点捕获的残基344-347描绘成球棍状。(b)和(c)图中的分子表面视图是通过将核心区域与帽区分离并分别以90°角度在相反方向旋转(用箭头表示)获得的。(d)该OaAEP1无活性二聚体通过帽区提供的分子间相互作用稳定。结合在活性位点中的残基344-347描绘为球棍状并标记。与人豆荚蛋白相比,这些接头残基以肽型豆荚蛋白抑制剂相似的方向结合在催化中心。该比较视图中,能够识别出容纳进入的胺的假定通道在核心区域表面。准备进行连接反应的进入的底物的方向由沿着蛋白质表面通道的箭头指示(见文中)。(e)hlegum分子表面在与OaAEP1相同的方向显示,肽Ac-Tyr-Val-Ala-Asp-CMK(球棍状)与活性位点Cys189(来自PDB代码:4AWA)共价结合。在此,进入胺的通道被完全阻断,说明了缺乏有效的连接酶活性。(f)动画突出了与OaAEP1 Cys247Ala底物结合和催化活性相关的两个关键结构特征。P1结合位点负责有效切割,P2结合位点与有效的蛋白质连接有关。
图4显示了OaAEP1的活性位点和活性片段。(a)OaAEP1活性位点的近摄图,其中本文讨论的活性位点显示为球棍状并标记:典型的AEP催化对His175和Cys217以及结合在催化中心的连头残基344-347描绘为球棍状。还显示了由Cys250和Cys264(在蝶豆粘酶1中保守)形成的二硫键,其形成开放的胺进入通道,以及“看门基团”Cys247是连接酶活性的主要决定因素。与S1口袋结合的P1残基Gln347形成的氢键用虚线表示,原子间距离用表示。(b)图显示了一个电子密度图,其中多肽的片段344-347在相位计算中省略并在3σ水平上形成轮廓。(c)在靶向活性片段346-351的定点突变后剩余激活的OaAEP1突变体。接头突变体的酶促反应:Asn346、Gln347、Asp349和Asp351的单点或双点突变体显示了自解离催化的激活中等丧失。三点突变体(Asn346Ala、Asp349Ala和Asp351Ala)以及四点突变体(Asn346、Gln347、Asp349和Asp351)具有更严重的功能表型丧失,表明激活位点可能是该延伸接头的任意残基。(d)显示了接头突变体在6小时后的激活效率的柱状图。Asp349和Asp351可能是更优选的切割位点,Asn346和Gln347也是潜在的切割位点。
图5显示了WT OaEP1b、Cys247Ala和butelase 1的肽环化活性的比较以及看门基团对连接酶活性的影响。(a)用WT OaEP1b、Cys247Ala和butelase 1环化“GLPVSTKPVATRNGL”的动力学参数。(b)图为该反应的质谱分析。(c)看门基团在OaAEP1激活中的作用。(d)在看门基团Cys247位置各种残基的环化效率比较。看门基团残基Cys247控制连接反应动力学。(a)野生型OaAEP1和Cys247Ala突变体测定的动力学,与植物新提取的butelase 1进行比较。Cys247Ala的Kcat/Km比野生型OaAEP1b快160倍。(b)用于确定连接效率的肽的示意图,以及证明野生型OaAEP1和Cys247Ala突变体实现骨架连接的质谱结果。(c)看门基团突变体的自激活。看门基团残基的突变对自激活影响不大。体积大的侧链的突变体难以完全激活。(d)连接催化活性与Cys247突变体侧链的大小呈负相关。
图6显示了Cys247Ala的蛋白连接活性。(a)使用O2-苄基胞嘧啶-Alexa647荧光检测SNAP蛋白,以及用考马斯亮蓝染色检测蛋白质底物和连接产物的SDS PAGE分析。该反应图示为附图。Cys247Ala很好地连接折叠良好的蛋白质。(a)100nM的Cys247Ala,不到4000nM的野生型OaAEP1b,有效地将5μM C端修饰的SNAP标签蛋白与N端修饰的泛素连接。(b)在室温、pH 7.4的PBS缓冲液中30分钟,只要30nM Cys247Ala就能有效催化100μM泛素和50μM生物素标记肽的连接。
图7显示(a)OaAEP1b、Butelase 1和人豆荚蛋白的序列比对。(b)编码OaAEP1结构的确切的氨基酸顺序。残基-85到0是融合标签(青色),而编码AEP的前23个氨基酸被省略。在我们的晶体结构中观察到活性位点口袋中插入的四个残基着色为橙色,帽区域用紫色显示。
图8显示了2FO-FC电子密度图,突出了模型的良好拟合。(a)帽区中的侧链与密度很好吻合。(b)核心区域中的新型PPP环是AEP连接酶所特有的,与密度非常吻合。
图9显示了看门基团突变体的原始质谱结果。
图10显示了连接反应的潜在副产物。如果没有可用的N端胺,则在Cys247Gly和Cys247Ala突变体中可能发生侧链连接和蛋白质水解。Cys247Gly突变体侧链的较小尺寸允许水分子参与反应并发生蛋白水解。
图11显示了C-或N-末端肽/蛋白质的底物序列特异性的筛选:(a)Asn-Xaa3-Leu-COOH;(b)Asn-Gly-Xaa4-COOH;(c)H2N-Xaa1-Leu。在室温、中性pH(pH7.4)标准反应缓冲液下100μM底物与50nM Quicklase反应5分钟。自连接(环化)肽的百分比可作为Kcal的定性指标。检测读数中的原始质谱读数也包括在图11(d)中。
图12显示(a)用SEQ ID NO:1(OaAEP1 Cys247Ala)所示氨基酸序列在国家生物技术信息中心(NCBI)数据库中的基本局部比对搜索工具(BLAST)搜索的图形概要以及(b)产生显著比对的序列。
图13显示了具有SEQ ID NO:8所示氨基酸序列的AEP_C13CO4是具有OaAEP1Cys247Ala(SEQ ID NO:1)活性的肽连接酶。
图14显示了(a)基于骨架的一步同源二聚化,(b)基于骨架的两步异二聚化,(c)基于骨架的一步四聚化和(d)模块化超低聚反应的方案。另外显示了(e,f)NGL头对头二聚体,(g)GL接头二聚体和四聚体,(h)NGL多聚体和(i)GL多聚体的制备方案。
图15显示了(a)OaAEP1 Cys247Ala(SEQ ID NO:1)介导的指导细胞修饰过程的示意图。(b)荧光标记的SNAP(New England Biolabs)蛋白与RAW细胞(人巨噬细胞细胞系)和HEK293T(人上皮细胞系)两种不同细胞系的固有细胞表面蛋白结合。将10μM修饰的SNAP蛋白(具有附加的C端NGL残基,泳道1样品)具有或不具有(泳道2和泳道5样品)0.1μMQuicklase的共培养物添加至细胞培养物中,用PBS缓冲液预洗。孵育30分钟到1小时后,用另外的PBS缓冲液(泳道3和泳道6是第一次洗涤的样品)冲洗细胞两次。收获剩余的细胞用SDS上样缓冲液裂解(泳道4和7个样品)。所有样品用SDS-PAGE检测,在凝胶中只有共价荧光标记的SNAP蛋白携带信号,其在(b)中显示为暗带。泳道4和7中的另外的条带表明RAW和HEK283T细胞中大量的固有蛋白质以依赖Quicklase的方式与SNAP蛋白结合。(c)使用荧光显微镜检查表面修饰的RAW细胞,细胞表面上的亮点表明内在细胞膜的表面标记成功。具有与式III密切相关的氨基酸残基序列的某些内在蛋白质由于其优异的酶活性和更宽泛的序列重组能力而被认为是Quicklase。
具体实施方式
以下详细描述通过举例的方式涉及本发明可能实施的具体细节和实施方式。充分详细地描述这些实施方式以使本领域技术人员能够实施本发明。可以使用其他实施方式并且可以在不脱离本发明范围的情况下进行结构和逻辑的变化。多种实施方式不一定是相互排斥的,因为一些实施方式可以与一个或多个其他实施方式组合以形成新的实施方式。除非另有定义,否则本文使用的所有技术和科学术语的含义与本领域普通技术人员通常理解的含义相同。除非上下文另有明确说明,否则单数术语“一”,“一个”和“所述”包括复数指代物。类似地,除非上下文另有明确说明,否则“或”一词也包括“和”。术语“组成”表示“包括”。如有冲突,包括术语解释,以本说明书为准。
肽键的断裂和形成是蛋白质化学中的基本生化反应。与大量可利用的蛋白酶不同,快速作用的连接酶很少见。OaAEP1是从产大环寡肽的植物Oldenlandia affinis分离出的酶,尽管与其他天冬酰胺内肽酶(AEP)具有相似的结构折叠,但显现出微弱的肽环化酶活性。本申请的发明人在此报道了OaAEP1的第一个原子结构,处于其预激活形式,分辨率为该酶的结构和生化分析显示其激活机制和结构特征对其连接活性很重要。重要的是,通过OaAEP1的基于结构的诱变,本发明人获得了一种具有数百倍快的催化动力学的超快突变体,仅用亚微摩尔浓度的酶就可以连接折叠良好的蛋白质底物。相比之下,先前描述的原始野生型OaAEP1酶中的蛋白质-蛋白质连接活性非常弱。因此,本文所述的基于结构的生化基序的鉴定导致了独特且新颖的重组工具(具有SEQ ID NO:1所示的氨基酸序列的OaAEP1Cys247Ala)及其相关结构同源物的表征,现在可用来进行以前极具挑战性的各种蛋白质标记和修饰。例如,可以酶促催化更高效的肽环化和肽/蛋白质。此外,这种新型的重组酶及其结构同源物能够实现新的生化应用,如对固有细胞表面蛋白质的修饰。
本发明的目的是提供一种连接肽技术,利用OaAEP1 Cys247Ala型的ASX特异性蛋白连接酶的优越位点特异性和催化效率。
为此,本发明第一方面提供了形成式(I)的肽的方法
P1-Asx-Xaa1-Xaa2-P2(I),
通过连接式(II)的第一肽
P1-Asx-Xaa3-Leu-COOH/CONH2(II)
至式(III)的第二肽
H2N-Xaa1-Xaa2-P2(III),
其中,P1和P2各自独立地为任意修饰或未修饰的肽,并且任选地可以结合以使式(II)和(III)的肽是相同肽的末端;Asx为Asp或Asn;Xaa1为任意天然存在的氨基酸;Xaa2为除Pro之外的任意天然存在的氨基酸,优选地为Leu或Ile;Xaa3是任意天然存在的氨基酸,优选地选自His、Ala、Ser、Cys、Asn、Gly、Arg、Met、Lys、Gln、Leu和Glu组成的组,
通过酶促裂解该式(II)的第一肽中“Asx”和“Xaa3”之间的键,并通过该第一肽的C端将其片段P1-Asx连接至该式(III)的第二肽的N端以形成式(I)的连接肽,其中,酶促裂解和连接反应由具有OaAEP1 Cys247Ala(SEQ ID NO:1)活性的肽连接酶在适于该裂解和连接反应的条件下催化。
在整个申请的上下文中,术语“肽”、“多肽”和“蛋白质”可互换使用,是指通过肽键连接的任意长度的氨基酸聚合物。该聚合物可包含经修饰的氨基酸,其可为直链或支链,并且可被非氨基酸打断。该术语还包括天然或人工修饰的氨基酸聚合物;例如,通过二硫键形成、糖基化、脂质化、乙酰化、磷酸化或任何其他操作,譬如结合到标签部分。然而,在优选的实施方式中,这些术语涉及如下定义的天然存在的氨基酸的聚合物,可以按照上述定义进行选择性修饰,但不包括聚合物主链中的非氨基酸部分。
术语“氨基酸”是指天然和/或非天然或合成氨基酸,包括D和L光学异构体、氨基酸类似物(例如正亮氨酸是亮氨酸的类似物)以及本领域已知的衍生物。本文所用的,术语“天然存在的氨基酸”是指20种天然存在的L-氨基酸,即Gly、Ala、Val、Leu、Ile、Phe、Cys、Met、Pro、Thr、Ser、Glu、Gln、Asp、Asn、His、Lys、Arg、Tyr和Trp。术语“肽键”是指在一个氨基酸的羧基和第二个氨基酸的氨基之间失去水分子而形成的共价酰胺键。式(I)中P1和Asx之间的“-”以及式(I)中的所有“-”表示肽键。另外,“Leu-COOH/CONH2”代表亮氨酸或亮氨酰胺,因此,式(II)中“Leu”和“COOH/CONH2”之间的“-”表示α-碳与亮氨酸/亮氨酰胺的羧基或甲酰胺基团之间的共价键。同样的,式(III)中的“H2N-Xaa1”表示氨基酸残基Xaa1,因此“NH2”和“Xaa1”之间的“-”表示α-碳与Xaa1的氨基之间的共价键。应当理解的,式(II)肽的羧基/甲酰胺基团和式(III)肽的氨基形成末端氨基酸的一部分,而不是另外的官能团。通常,在本文描述的所有式中,肽以N到C端方向显示。
不希望受任何特定理论的束缚,相信如本文所述的具有OaAEP1 Cys247Ala(SEQID NO:1)活性的肽连接酶也可催化任意一种具有“Asx-Xaa3-Leu-COOH/CONH2”基序末端的物质或对象,与任意一种具有“H2N-Xaa1-Xaa2”基序末端的物质或对象之间的连接。有鉴于此,应该注意的是,本文所述的方法也适用于经必要的变通后,其中P1和P2中的一个或两个是除肽之外的任意物质或对象的实施方式也在本申请的范围内。
在多种实施方式中,
(a)Asx为Asp或Asn;和/或
(b)Xaa1为所有天然存在的氨基酸;和/或
(c)Xaa2为Leu或Ile;和/或
(d)Xaa3选自His、Ala、Ser、Cys、Asn、Gly、Arg、Met、Lys、Gln、Leu和Glu组成的组。
在优选实施方式中,满足(a)-(d)特征中两个或两个以上,即(a)和(b)、(a)和(c),(a)和(d),(b)和(c),(b)和(d),或满足三个或三个以上特征,即(a)、(b)和(c),(a)、(b)和(d),(a)、(c)和(d),(b)、(c)和(d),或者最优选地满足所有四个特征。
在优选地实施方式中,Asx为Asn,Xaa1为任意天然存在的氨基酸,Xaa2为Leu,以及Xaa3为His、Ser、Cys、Gly或Ala。
在更优选地实施方式中,Asx为Asn,Xaa1为Arg或Gly,Xaa2为Leu,Xaa3为His、Ala或Gly,意思是Asx为Asn,Xaa1为Arg,Xaa2为Leu,Xaa3为His;Asx为Asn,Xaa1为Arg,Xaa2为Leu,Xaa3为Ala;Asx为Asn,Xaa1为Arg,Xaa2为Leu,Xaa3为Gly;Asx为Asn,Xaa1为Gly,Xaa2为Leu,Xaa3为His;Asx为Asn,Xaa1为Gly,Xaa2为Leu,Xaa3为Ala;或Asx为Asn,Xaa1为Gly,Xaa2为Leu,Xaa3为Gly。
应注意,根据图11(b),式(II)的第一肽的“Leu”残基,即P1-Asx-Xaa3-Leu-COOH/CONH2,也可以被另外的天然存在的氨基酸取代,例如Ile、Pro、Phe、Cys、Gln或Lys,前提是这种形式所述的肽适合于本文所述的方法。结合本文描述的任意实施方式的这些实施方式也完全包含在本申请中。
还设想当该第一肽和该第二肽是相同肽的末端时,即通过式(II)和(III)的序列,P1和P2结合形成终止的肽的核心序列,本发明公开的方法环化所述肽。
本发明中使用的具有OaAEP1 Cys247Ala(SEQ ID NO:1)活性的肽连接酶可以是具有所需活性的任意oaAEP家族酶或其同源酶。肽连接酶具有位点特异性断裂肽键,然后与进入的亲核剂重新形成新键的能力。它是Asx特异性,因为发生连接反应的C端氨基酸,即连接肽的C-末端,可以是Asn或Asp,优选的是Asn。如上所述,在式(II)第一肽的C端识别基序Asx-Xaa3-Leu-COOH/CONH2,并通过切断排序信号Xaa3-Leu-COOH/CONH2介导肽连接,并将P1-Asx与第二肽H2N-Xaa1-Xaa2-P2的N端残基连接,形成连接肽P1-Asx-Xaa1-Xaa2-P2
在多种实施方式中,本申请中具有OaAEP1 Cys247Ala(SEQ ID NO:1)活性的肽连接酶包含、由以下组成或基本由以下组成:
(a)SEQ ID NO:1(OaAEP1 Cys247Ala)所示的氨基酸序列;
(b)与SEQ ID NO:1所述的氨基酸序列具有至少65%、优选地至少75%、甚至更优选地至少85%、最优选地至少95%的序列一致性,或至少80%、优选地至少90%、更优选地至少95%的序列同源性的氨基酸序列,前提为该肽连接酶包括对应于SEQ ID NO:1中残基247-264位置的SEQ ID NO:2所示的氨基酸序列,其定义了酶的独特表面结构特征,作为接近N端氨基的结合位点;
(c)(a)或(b)的一个功能片段;或
(d)含有(a)、(b)或(c)作为其必需组分的氨基酸序列,前提为所述肽连接酶不是SEQ ID NO:3所示的氨基酸序列的野生型OaAEP1或SEQ ID NO:4所示的氨基酸序列的蝶豆粘酶1。
在多种实施方式中,具有OaAEP1 Cys247Ala(SEQ ID NO:1)活性的肽连接酶包含、由以下组成或基本由以下组成:
(a)SEQ ID NO:1所示的氨基酸序列;
(b)SEQ ID NO:5所示的氨基酸序列;
(c)SEQ ID NO:6所示的氨基酸序列;
(d)SEQ ID NO:7所示的氨基酸序列;
(e)SEQ ID NO:8所示的氨基酸序列;
(f)SEQ ID NO:9所示的氨基酸序列;
(g)SEQ ID NO:10所示的氨基酸序列;或
(h)SEQ ID NO:11所示的氨基酸序列;
在多种实施方式中,该连接肽酶包含或由SEQ ID NO:1(OaAEP1 Cys247Ala)所示的氨基酸序列组成。
核酸或氨基酸序列的识别通常通过序列比较来确定。该序列比较基于在现有技术中建立并常用的BLAST算法(参见例如Altschul et al.(1990)“Basic local alignmentsearch tool”,J.Mol.Biol.215:403-410),以及Altschul et al.(1997):“Gapped BLASTand PSI-BLAST:a new generation of protein database search programs”;NucleicAcids Res.,25,p.3389-3402)并且原则上分别通过将核酸序列和氨基酸序列中的核苷酸或氨基酸的相似序列相互关联来实现。相关位置的表格关联被称为“对齐”。序列比较(对齐),特别是多序列比较,通常使用本领域技术人员可获得和已知的计算机程序制备。
这种比较还可以说明被比较的序列之间的相似性。通常表示为百分比同一性,它是根据参考序列及其整个长度计算的。术语“序列同一性”是指在一个比较窗口的序列在核苷酸与核苷酸或氨基酸与氨基酸基础上的相同程度。因此,通过比较比较窗口上的两个最佳比对序列来计算“序列同一性百分比”,确定两个序列中相同的核酸碱基或氨基酸残基出现的位置的数量,得到匹配位置数,将匹配位置的数量除以比较窗口中位置的总数(即窗口大小),并将结果乘以100得出序列同一性的百分比。在氨基酸序列中,更广泛地解释的术语“同源性”还包括对保守氨基酸替换的考虑,即具有相似化学活性的氨基酸,因为这些通常在蛋白质中具有类似的化学活性。因此,比较序列的相似性也可以表示为“百分比同源性”或“百分比相似性”。同一性和/或同源性的标识可以在整个多肽或基因上,或仅在单个区域出现。各种核酸序列或氨基酸序列的同源和相同区域通过序列匹配来明确。这些区域通常具有相同的功能。它们可能很小,并且仅包含几个核苷酸或氨基酸。这种小区域通常发挥对蛋白质整体活性至关重要的功能。因此,涉及将序列仅匹配至单个和任选的小区域可能很有用。然而,除非另有说明,否则本文中的同一性和同源性标识是指分别表示的核酸序列或氨基酸序列的全长。
虽然认识到如上所述的多种肽连接酶可适用于本发明的实施,但优选使用活性强有效的蛋白连接酶。在多种实施方式中,这意味着它可以以至少50%、优选地至少70%、更优选地至少90%、最优选地至少95%的效率连接给定肽。测定此类效率的方法通过,例如,在中性pH和室温下,所述肽连接酶(50nM)的存在下,在标准反应缓冲液中连接底物(100μM)30分钟,是本领域内众所周知的并且可以由本领域技术人员常规应用。优选地,本发明的肽连接酶具有SEQ ID NO:1的氨基酸序列的酶的蛋白连接酶活性的至少50%、更优选地至少70%、最优选地至少90%。
根据本申请,具有OaAEP1 Cys247Ala(SEQ ID NO:1)活性的肽连接酶可包含氨基酸修改,特别是氨基酸取代、插入或缺失。例如,这种肽连接酶通过靶向遗传修改,即通过突变方法,以及针对特定目的或关于特殊性质(例如,关于它们的催化活性,稳定性等)进行优化。其目的可能是将靶向突变,例如取代、插入或缺失,引入已知分子中以便改变底物特异性和/或提高催化活性。为此,特别是分子表面电荷和/或等电点,以及它们与底物的相互作用可以被改变。另外或替代地,肽连接酶的稳定性可以通过一个或多个相应的突变来增强,从而提高其催化性能。个别突变的有利特性,例如个别替换,可以互相补充。
在多种实施方式中,该肽连接酶的特征在于从如上所述的肽连接酶作为原始分子通过单个或多个保守氨基酸取代获得。术语“保守氨基酸取代”是指一个氨基酸残基与另一个氨基酸残基的替换(取代),这种替换不会导致替换的氨基酸位置的极性或电荷的变化,例如,非极性氨基酸残基与另一个非极性氨基酸残基的替换。在本发明的上下文中的保守氨基酸取代包括,例如,G=A=S,I=V=L=M,D=E,N=Q,K=R,Y=F和S=T。
另外或替代地,该肽连接酶的特征在于从本文所述的肽连接酶作为原始分子通过片段化或通过缺失、插入或取代发生突变获得,并且包含一段长度上至少150、160、170、180、190、200、210、220、230、240、250、260、270、280、290或300个连续连接的氨基酸与原始分子匹配的氨基酸序列,前提为该肽连接酶包括对应于SEQ ID NO:1中残基247-264位置的SEQ ID NO:2所示的氨基酸序列。
在多种实施方式中,本发明还涉及本文所述的肽连接酶的功能片段,其中所述功能片段保留酶活性。优选的它们具有原始分子的蛋白质连接酶活性的至少50%,更优选地至少70%,最优选地至少90%,优选地该肽连接酶具有SEQ ID NO:1的氨基酸序列。该功能片段的长度优选地至少有150个氨基酸,更优选地至少180或200,最优选地至少250。
在多种实施方式中,根据本申请进行连接的肽可以修饰,例如,通过共价键或非共价键结合到标签部分。标签部分可以是任意分子,例如但不限于为亲和标签、治疗剂、可检测标签或骨架分子。
在多种实施方式中,该第一肽和/或第二肽可与固体载体材料连接。
本文所用的术语“亲和标签”是指诸如生物素,其可用于将亲和标签所附着的分子与不含亲和标签的其他分子分离。
术语“可检测标签”是指至少一个能够直接或间接产生可检测信号的标签。在非限制性实例中,可检测标签可以是产生可检测信号的酶,例如通过比色法,荧光或发光;发色团,例如荧光、发光或染料复合物,如GFP;电子密度的基团可通过电子显微镜或其电性进行检测,例如导电性、电流分析法、伏安法或阻抗;可检测基团,例如分子足够大以诱导其物理和/或化学特征的可检测修饰(这种检测可通过光学方法进行,如衍射、表面等离子体共振、表面变化或接触角变化,或物理方法,如原子力光谱或隧道效应;或放射性分子,如32P,35S或125I。
本文所用的术语“骨架分子”是指以共价或非共价地连接其它部分的化合物。各种骨架分子如树枝状大分子是本领域熟知的。
本文所用的术语“固体载体材料”是指可将肽固定在其上的固体或半固体(例如水凝胶)材料。非限制性实例包括用于肽合成的固体载体、磁珠、玻璃纤维和树脂。
经标签部分修饰的肽可用合成有机化学领域技术人员已知的标准技术制备,或可参考相关文献推导。
在多种实施方式中,该第一肽/或第二肽是细胞表面蛋白,使得该方法导致细胞表面蛋白的修饰或标记并使细胞表面如此。
第二方面,本发明涉及一种制备一种或多种目标肽的二聚体、低聚体或多聚体的方法,该方法包括以下步骤:
(a)提供具有C端Asx-Xaa3-Leu-COOH/CONH2残基的一种或多种目标肽以及具有N端H2N-Xaa1-Xaa2残基两个或两个以上拷贝的骨架分子,或者,提供具有N端H2N-Xaa1-Xaa2残基的一种或多种目标肽以及具有C端Asx-Xaa3-Leu-COOH/CONH2残基两个或两个以上拷贝的残基骨架分子,其中,Asx为Asp或Asn;Xaa1为任意天然存在的氨基酸;Xaa2为除Pro之外的任意天然存在的氨基酸,优选地为Leu或Ile;Xaa3是任意天然存在的氨基酸,优选地选自His、Ala、Ser、Cys、Asn、Gly、Arg、Met、Lys、Gln、Leu和Glu组成的组;
(b)提供上述具有OaAEP1 Cys247Ala(SEQ ID NO:1)活性的肽连接酶;
(c)制备一种或多种目标肽、所述骨架分子和该具有OaAEP1 Cys247Ala(SEQ IDNO:1)活性的肽连接酶的混合物;
(d)使该混合物处于该具有OaAEP1 Cys247Ala(SEQ ID NO:1)活性的肽连接酶催化一种或多种目标肽与所述骨架分子连接的条件中。
在多种实施方式中,
(a)Asx为Asp或Asn;和/或
(b)Xaa1为所有天然存在的氨基酸;和/或
(c)Xaa2为Leu或Ile;和/或
(d)Xaa3选自His、Ala、Ser、Cys、Asn、Gly、Arg、Met、Lys、Gln、Leu和Glu组成的组。
在优选实施方式中,满足(a)-(d)特征中两个或两个以上,即(a)和(b)、(a)和(c),(a)和(d),(b)和(c),(b)和(d),或满足三个或三个以上特征,即(a)、(b)和(c),(a)、(b)和(d),(a)、(c)和(d),(b)、(c)和(d),或者最优选地满足所有四个特征。
在优选地实施方式中,Asx为Asn,Xaa1为任意天然存在的氨基酸,Xaa2为Leu,以及Xaa3为His、Ser、Cys、Gly或Ala。
在更优选地实施方式中,Asx为Asn,Xaa1为Arg或Gly,Xaa2为Leu,以及Xaa3为His、Ala或Gly。
图14(a)-(d)显示了如何根据一些非限制性实施例制备一种或多种目标肽的异源或同源二聚体、低聚体或多聚体。图14(e)-(i)显示了如何制备用于本发明的载体分子的一些非限制性实例。
第三方面,本发明涉及一种通过一种或多种目标肽修饰或标记靶细胞表面的方法,该方法包括以下步骤:
(a)提供具有C端Asx-Xaa3-Leu-COOH/CONH2残基和/或N端H2N-Xaa1-Xaa2残基的一种或多种目标肽,其中,Asx为Asp或Asn;Xaa1为任意天然存在的氨基酸;Xaa2为除Pro之外的任意天然存在的氨基酸,优选地为Leu或Ile;Xaa3是任意天然存在的氨基酸,优选地选自His、Ala、Ser、Cys、Asn、Gly、Arg、Met、Lys、Gln、Leu和Glu组成的组;
(b)提供具有OaAEP1 Cys247Ala(SEQ ID NO:1)活性的肽连接酶;
(c)使靶细胞与一种或多种目标肽和该具有OaAEP1 Cys247Ala(SEQ ID NO:1)活性的肽连接酶接触;
(d)使该靶细胞处于该具有OaAEP1 Cys247Ala(SEQ ID NO:1)活性的肽连接酶催化一种或多种目标肽与所述靶细胞的细胞表面蛋白质连接的条件中。
在具体实施方式中,具有SEQ ID NO:3的氨基酸序列的野生型OaAEP1也可用于该方法,其效率可能降低。
在多种实施方式中,
(a)Asx为Asp或Asn;和/或
(b)Xaa1为所有天然存在的氨基酸;和/或
(c)Xaa2为Leu或Ile;和/或
(d)Xaa3选自His、Ala、Ser、Cys、Asn、Gly、Arg、Met、Lys、Gln、Leu和Glu组成的组。
在优选实施方式中,满足(a)-(d)特征中两个或两个以上,即(a)和(b)、(a)和(c),(a)和(d),(b)和(c),(b)和(d),或满足三个或三个以上特征,即(a)、(b)和(c),(a)、(b)和(d),(a)、(c)和(d),(b)、(c)和(d),或者最优选地满足所有四个特征。
在优选地实施方式中,Asx为Asn,Xaa1为任意天然存在的氨基酸,Xaa2为Leu,以及Xaa3为His、Ser、Cys、Gly或Ala。
在更优选地实施方式中,Asx为Asn,Xaa1为Arg或Gly,Xaa2为Leu,以及Xaa3为His、Ala或Gly。
在多种实施方式中,该方法还包括在步骤(d)之后从靶细胞中去除未连接的一种或多种肽。
一种或多种目标肽可被功能化以结合多种负载(cargo)分子。在多种实施方式中,一种或多种目标肽包括标签部分,如如上所述的亲和标签、治疗剂、可检测标签或骨架分子。一种或多种目标肽还可以与固体载体材料连接。
图15(a)显示了如何根据本发明的一个非限制性实施方式标记靶细胞。
本文所述的方法可适用于在试管内、体外或体内所有类型的细胞。靶细胞可以是任意原核或真核细胞,例如,细菌、酵母、植物或人体细胞;它可以是癌细胞、卵母细胞、胚胎干细胞、造血干细胞或任何其他分化或未分化的细胞,前提为靶细胞表达具有C端Asx-Xaa3-Leu-COOH/CONH2或N端H2N-Xaa1-Xaa2残基的表面多肽,以获得一种或多种目标肽。
在优选地实施方式中,靶细胞表达适于与一种或多种目标肽连接的内源表面蛋白。然而,靶细胞也可以重组表达具有N端H2N-Xaa1-Xaa2或C端Asx-Xaa3-Leu-COOH/CONH2残基的表面多肽,以便被目标肽标记。
本文所用的术语“重组表达”是指通过重组DNA技术表达所述多肽。
在本发明的范围内,一种或多种目标肽可以是内源性或在靶细胞表面重组表达的多肽,在这种情况下,不需要提供额外的所述肽,且本文所述的方法引起靶细胞表面蛋白的异源或同源二聚化、低聚化或多聚化。
因此,我们认为本发明提供了一种多用途和快速作用的技术,通过附着修饰或未修饰的目标肽来修饰或标记细胞表面。与传统的化学标记方法相比,该方法能够特异性和快速结合表面蛋白的N和/或C端。
第四方面,本发明涉及根据本发明中任意方法得到的连接肽和/或标记的靶细胞。
第五方面,本发明涉及具有SEQ ID NO:1氨基酸序列的连接肽酶OaAEP1Cys247Ala和具有上述活性的其他肽连接酶,以及包含任何该肽连接酶的试剂盒,特别是OaAEP1Cys247Ala(SEQ ID NO:1)。
另一方面,本发明涉及如本文所述的用于连接两个肽的具有OaAEP1Cys247Ala(SEQ ID NO:1)活性的肽连接酶的用途。
通过以下实施例进一步说明本发明。然而,应该理解,本发明不限于示例性实施方式。
实施例
材料与方法
Quicklase的制备
OaAEP1作为泛素融合蛋白在大肠杆菌克隆和表达。具有在大肠杆菌中表达优化的密码子的基因,编码一种由N端6-His标签(SEQ ID NO:13)、76个氨基酸残基的人泛素(SEQID NO:14)以及OaAEP1的24-472位残基(SEQ ID NO:15,无OaAEP1信号肽)组成的蛋白质(SEQ ID NO:12),通过美国Genescript合成。
该克隆是OaAEP1,有一个氨基酸与OaAEP1b(SEQ ID NO:3)不同(E371V突变)。OaAEP1从mRNA中克隆出来,OaAEP1b从基因组DNA序列中克隆出来。不过,本发明人的野生型结构(OaAEP1,SEQ ID NO:3)表现与之前报道的基本相同(OaAEP1b,具有E371V突变的SEQID NO:3)。
这种复合蛋白结构的氨基酸序列如图S1B所示。该基因插入pET-28b(+)载体的编码区(NcoI-NdeI)并扩增。OaAEP1在大肠杆菌中的重组表达(使用来自美国New EnglandBiolabs的Bl21DE3或T7 Shuffle)按照之前报道的方案进行,使用浓度0.4mM的IPTG,在16℃诱导蛋白表达20小时。然后在4℃下4000g离心15分钟以获得细胞,在含有50mM Tris-HCl、pH 7.4、150mM NaCl、0.05%(v/v)CHAPS、10%(v/v)甘油的溶解缓冲液中重悬。通过使均质化细胞在1500psi通过Emulsiflex-C3(Avestin,美国)高压装置三次进行裂解。使用Ni-NTA柱(Bio-Rad)通过金属亲和进一步纯化含有His-Ub-AEP-FL(SEQ ID NO:12)和Ub-AEP-FL(SEQ ID NO:15)的上清液部分。结合到柱子上的含有His标签的蛋白质在含有50mMTris-HCl、pH 8.0、150mM NaCl、0.05%(v/v)CHAPS、10%甘油的缓冲液中用0到500mM的线性咪唑梯度洗脱。将含有蛋白质的NI-NTA洗脱级分稀释并装入两个串联的5ml HiTrap QSepharose高性能柱(GE Healthcare;每毫升树脂2毫升样品)。用0-30%连续盐梯度的缓冲液B:20mM双三丙烷、2M NaCl、pH 7洗脱结合蛋白。最后,蛋白质通过PBS缓冲液已经预平衡的SEC柱纯化。
为了自激活OaAEP1,将1mM EDTA和0.5mM三(2-羧基乙基)膦盐酸盐加入到未成熟蛋白质中,并用冰醋酸将溶液pH调至4。合并包含蛋白质(通过SDS-PADE分析)的级分并在室温或37℃培养3-16小时。在此pH下蛋白质沉淀以通过离心除去大部分受污染的蛋白质。激活的蛋白通过使用50kDa截止浓缩器(Sartorius)超速离心浓缩并在-80℃储存。
野生型和突变体的泛素(其C末端包括附加的“NGL”序列)和SNAP标签(NewEngland Biolabs)在pET47b载体中克隆并在Bl21(DE3)大肠杆菌细胞中表达。如上所述,使用Ni-NTA通过金属亲和进行纯化。这之后用Prescission蛋白酶(GE healthcare)消化以去除N端6-His标签以及SEC纯化。使用Kapa-Hifi聚合酶(Kapa Biosystems)和两个彼此远离、方向相反的引物进行突变。
使用AEP-C247A-Mut引物:CACCACCGAAAGCAGCTGGGCCTACTATTGC CCGGCGC(SEQ IDNO:16),通过突变PCR获得Cys247Ala突变体。
肽和肽环化试验
天然的和修饰的氨基酸购于Sigma-Aldrich(美国)。本文使用的所有肽使用固相法和HPLC纯化在内部合成。在包含20mM磷酸盐缓冲液、连接酶(5-700nM)以及肽底物(10-300μM)的50μl反应混合物中进行环化试验。每个反应在37℃进行三次并通过添加5μl 1MHCl溶液猝灭。在Nexera UHPLC系统(Shimadzu)中,使用反相C18分析柱(150×2.1mm,Vydac)在10%-15%乙腈线性梯度下15分钟分离肽。对于动力学分析,野生型OaAEP1(WTOaAEP1)、突变体OaAEP1(mutant OaAEP1)以及butelase 1的浓度分别固定在700nM、50nM和20nM。通过将保留的线性前体或环化的产物的HPLC峰面积转换为浓度来计算环化速度。每个HPLC峰的特征通过MALDI-TOF MS(ABI 4800MALDI TOF/TOF)分析。将该速度输入至GraphPad Prism(GraphPad软件,圣地亚哥)以获得米氏方程曲线和动力学参数(kcat和Km)。在20μl体积的反应混合物中进行各种OaAEP1突变体环化效率的比较并在10分钟或1小时连接反应后通过MALDI-TOF MS分析。
为了快速评价Quicklase的底物特异性,使用100μM肽底物(Xaa1Xaa2YRRGRLYRRNXaa3Xaa4,(SEQ ID NO:17)以及50nM Quicklase在中性pH(pH 7.4)标准反应液中,室温反应5分钟。自连接(环化)肽的百分比作为Kcat的定性指标。在每次筛选中,仅一个残基被修饰;在此次筛选中(图11),默认的氨基酸在Xaa1位置是Gly、Xaa2位置是Leu、Xaa3位置是Gly、Xaa4位置是Leu。
本文所述的Sequence ID NO和详细氨基酸序列的列表
1、SEQ ID NO:1
通用名称:OaAEP1 Cys247Ala(Quicklase)
来源:Ovaloparmena affinis
序列:
MVRYLAGAVLLLVVLSVAAAVSGARDGDYLHLPSEVSRFFRPQETNDDHGEDSVGTRWAVLIAGSKGYANYRHQAGVCHAYQILKRGGLKDENIVVFMYDDIAYNESNPRPGVIINSPHGSDVYAGVPKDYTGEEVNAKNFLAAILGNKSAITGGSGKVVDSGPNDHIFIYYTDHGAAGVIGMPSKPYLYADELNDALKKKHASGTYKSLVFYLEACESGSMFEGILPEDLNIYALTSTNTTESSWAYYCPAQENPPPPEYNVCLGDLFSVAWLEDSDVQNSWYETLNQQYHHVDKRISHASHATQYGNLKLGEEGLFVYMGSNPANDNYTSLDGNALTPSSIVVNQRDADLLHLWEKFRKAPEGSARKEEAQTQIFKAMSHRVHIDSSIKLIGKLLFGIEKCTEILNAVRPAGQPLVDDWACLRSLVGTFETHCGSLSEYGMRHTRTIANICNAGISEEQMAEAASQACASIP
2、SEQ ID NO:2
通用名称:对应于SEQ ID NO:1的残基247-264位置负责有效的蛋白质连接的关键结构基序
来源:基于本申请结构分析
序列:
(G/A/S/C)247-X-Y-C250-P-X-X-X-X-X-P-P-P-E-Y-X-X-C264
*X表示不破坏剩余的保守氨基酸的结构折叠的任意氨基酸。
**此结构基序中247位的小氨基酸(Gly、Ala、Ser或Cys)允许有效的蛋白质连接。Cys250和Cys264之间的半胱氨酸二硫键稳定此结构基序。
3、SEQ ID NO:3
通用名称:野生型OaAEP1
来源:Ovaloparmena affinis
序列:
MVRYLAGAVLLLVVLSVAAAVSGARDGDYLHLPSEVSRFFRPQETNDDHGEDSVGTRWAVLIAGSKGYANYRHQAGVCHAYQILKRGGLKDENIVVFMYDDIAYNESNPRPGVIINSPHGSDVYAGVPKDYTGEEVNAKNFLAAILGNKSAITGGSGKVVDSGPNDHIFIYYTDHGAAGVIGMPSKPYLYADELNDALKKKHASGTYKSLVFYLEACESGSMFEGILPEDLNIYALTSTNTTESSWCYYCPAQENPPPPEYNVCLGDLFSVAWLEDSDVQNSWYETLNQQYHHVDKRISHASHATQYGNLKLGEEGLFVYMGSNPANDNYTSLDGNALTPSSIVVNQRDADLLHLWEKFRKAPEGSARKEEAQTQIFKAMSHRVHIDSSIKLIGKLLFGIEKCTEILNAVRPAGQPLVDDWACLRSLVGTFETHCGSLSEYGMRHTRTIANICNAGISEEQMAEAASQACASIP
4、SEQ ID NO:4
通用名称:来自蝶豆中的AEP1,butelase 1
来源:蝶豆
序列:
IRDDFLRLPSQASKFFQADDNVEGTRWAVLVAGSKGYVNYRHQADVCHAYQILKKGGLKDENIIVFMYDDIAYNESNPHPGVIINHPYGSDVYKGVPKDYVG EDINPPNFYAVLLANKSALTGTGSGKVLDSGPNDHVFIYYTDHGGAGVLGMPSKPYIAASDLNDVLKKKHASGTYKSIVFYVESCESGSMFDGLLPEDHNIYVMGASDTGESSWVTYCPLQHPSPPPEYDVCVGDLFSVAWLEDCDVHNLQTETFQQQYEVVKNKTIVALIEDGTHVVQYGDVGLSKQTLFVYMGTDPANDNNTFTDKNSLGTPRKAVSQRDADLIHYWEKYRRAPEGSSRKAEAKKQLREVMAHRMHIDNSVKHIGKLLFGIEKGHKMLNNVRPAGLPVVDDWDCFKTLIRTFETHCGSLSEYGMKHMRSFANLCNAGIRKEQMAEASAQACVSIPDNPWSSLHAGFSV
5、SEQ ID NO:5
通用名称:来自咖啡中的非典型的AEP[CDP08231.1]
来源:中粒种咖啡(Coffea canephora)
序列:
MMRYATAALLLLALSIIAVAEARDNFLKLPSEIADFFHPKERSDAGGDSVGTRWAVLIAGSNGYWNYRHQADVCHAYQILKRGGLKDENIVVFMYDDIAYNEENPRPGVIINSPHGADVYQGVPKDYTGDDVNAKNFLAAILGDKTAITGGSGKVVDSGPNDHIFIYYTDHGGPGVLGTPSGPYLYADDLNEVLKKKHASGTYKSLVFYLEACESGSIFEGLLPEDLNIYATTASNAEESSWGTYCPGEYPSPPPEYETCLGDLYSVAWMEDSEIHNLHTETLKQQYHLVKKRTSSSNSAYGSHVMQYGDLKLSLEDLFLYMGTNPANDNYTFVDENSLRPSSKAVNQRDADLLHFWDKFRKAPEGSARKVEAQKQVVEAMSHRMHIDNSVKLIGKLLFGIEKGSEILNSVRPAGHPLADDWDCLKSLVRTFETHCGSLSQYGMKHMRSIANICNAGIKKDQMAEAAAQACVSLPSNSWSSLHRGFSA
6、SEQ ID NO:6
通用名称:非典型酶[XP_017229093.1]
来源:黄胡萝卜(Daucus carota subsp.sativus)
序列:
MVRYLAGAVALLVVVSISAVVESRRDIVGDVLKLPSEVSSFFRPVAEEEDSVGTRWAVLIAGSNGYWNYRHQADICHAYQLLRRGGVKEENIVVFMYDDIAYDEENPRPGVIINSPHGSDVYKGVPKDYTGEDVTVNNVFAAILGDKSATTGGSGKVVDSGPNDHIFIYYSDHGGPGVLGMPTNPYMYAGDLVDVLKKKHASGTYKS MVFYLEACESGSIFEGLLPEGLNIYATTASNAYESSWGTYCPGEYPSPPPEYETCLGDLYSVAWMEDSDIHNLRTETLRQQYQQVKKRTSNDNSGWGSHVMQYGDLKLSTEELFMYMGTNPANDNFTFVDDNSLRLSSSKAVNQRDADLLHFWDKYRKAPEGSDRKIAAQKQFSEAMSHRMHLDNSIQLIGKLLFGIDTASEVLTTVRPSGQPLVDDWLCLKKLVRTFETYCGSLSQYGMKHMRSIANICNAGISEEQMSEASAQACVTFPSNPWSSVNKGFTA
7、SEQ ID NO:7
通用名称:肽酶C13,豆荚蛋白[OMO66906.1]
来源:圆果种黄麻(Corchorus capsularis)
序列:
MTRLVAGVILLLLSVTGIVSAGRDATGDVLRLPSEASRFFRPSDDDEVGTRWAVLIAGSNGYWNYRHQADVCHAYQLLKKGGLKDENIIVFMYDDIAYNYENPRQGIIINSPHGDDVYQGVPKDYTGEEVTVHNFLAAILGNKTAITGGSGKVVDSGPNDHIFIYYTDHGGPGVLGMPTYPYLYADELIDTLKKKHASGTYKSLVFYLEACESGSIFEGLLPEGLNIYATTASNADESSWGTYCPGEYPSPPPEYETCLGDLYSVAWMEDSDLHNLRTETLHQQYELVKRRTLNGNSAYGSHVMQYGDVGLAKEHLFLYLGTNPANDNFTFIDENSLQPPAKAVNQRDADLVHFWDKYRKAPDGSARKVEAQKQVVEAMSHRMHVDNSIQLIGKLLFGIERGADVLKTVRPAGQPLVDDWKCLKSMVRTFETHCGSLAQYGMKHMRSIANICNAGIQTEQIAEASAQACVSIPSGQWSSIQKGFSA
8、SEQ ID NO:8
通用名称:肽酶C13,豆荚蛋白[OMO86616.1]
来源:长蒴黄麻(Corchorus olitorius)
序列:
MTRLVAGVILLLLSVTGIASAGRDATGDVLRLPSEASRFFRPSDDDEVGTRWAVLIAGSNGYWNYRHQADVCHAYQLLKKGGLKDENIIVFMYDDIAFNYENPRQGIIINSPHGDDVYQDVPKDYTGEEVTVHNFLAAILGNKTAIKGGSGKVVDSGPNDHIFIYYTDHGGPGVLGMPTYPYLYADELIDTLKKKHASGTYKSLVFYLEACESGSIFEGLLPEGLNIYATTASNADESSWGTYCPGEYPSPPPEYETCLGDLYS VAWMEDSDLHNLRTETLHQQYELVKRRTLNGNSAYGSHVMQYGDVGLAKEHLFLYLGTNPANDNFTFIDENSLQPPAKAVNQRDADLVHFWDKYRKAPDGSVRKVEAQKQVVEAMSHRMHVDNSIQLIGKLLFGIERGADVLKTVRPAGQPLVDDWKCLKSMVRTFETHCGSLAQYGMKHMRSIANICNAGIQTEQMAEASSQACVSIPSGQWSSIQKGFSA
9、SEQ ID NO:9
通用名称:液泡加工酶[XP_012077326.1]
来源:麻疯树(Jatropha curcas)
序列:
MTRLATGVILLLLALCVVSSAGSRDIVGDVLRLPSEASRFFRPGGAHVAKEDDSTGTRWAILIAGSNGYWNYRHQADVCHAYQLLKKGGLKDENIIVFMYDDIAFNKENPRPGVIINNPYGEDVYKGVPKDYTGEDVNVNNFFAAILGNKTAITGGSGKVVDSGPNDHIFIYYTDHGGPGVLGMPTNPYLYANDLIDVLIKKHASGTYKSLVFYLEACESGSIFEGLLPEGLNIYATTAANAEESSWGTYCPGEYPSPPPEYETCLGDLYSVAWMEDSDVHNLQTETLRQQYQLVKRRTANGNSAYGSHVMQYGDVGLSKDNLFLYMGTNPANENYTFVDENSLRPPSKAVNQRDADLVHFWDKYRKAPDGSTRKIQAQKQFVEAMSHRMHLDHSMKLIGKLLFGIGKGSEVLNAIRPAGQPLVDDWVCLKTLVRTFETHCGSLSQYGMKHMRSLANLCNAGIREDQMAEASAQACVSIPSGPWSSLHKGFSA
10、SEQ ID NO:10
通用名称:非典型酶[AGC94758.1]
来源:平邑甜茶(Malus hupehensis)
序列:
MTRLASAVVLLFLASVLASAAGSRDLIGDVLRLPSEASRFFGRGDDAPDQQDDGTVGTRWAVLIAGSNGYWNYRHQADICHAYQLLKKGGLKDENIVVFMYDDIAYNEENPRQGVIINSPHGSDVYEGVPKDYTGEDVTVNNFFAAILGNKTALTGGSGKVVDSGPNDHIFIYYTDHGGPGILGMPTSPYIYANDLIEVLKKKHAAGTYRSLVFYLEACESGSIFEGLLPEGLNIFATTASNAEESSWGTYCPGEYPSPPPEYDTCLGDLYSVAWMEDSDVHNLRSETLHQQYELVKTRAANDNSGSGSHVMQYG DVGLSKNNLFVYMGTNPANDNYTFLGENSLRPSSKAVNQRDADLLHFWHKYRKAPEGSARKIQAQKDFVEAMSHRMHIDQTMKLIGKLLFGIEKGPQVLNAVRPAGQPLVDDWDCLKTMVRSFETHCGSLSQYGMKHMRSLANICNAGMTQEQMAEASAQACVSAPSGRWSSLHRGFSA
11、SEQ ID NO:11
通用名称:类似液泡加工酶[XP_009361606.1]
来源:Pyrus x bretschneideri
序列:
MTRFAGAVVLLFLASVLASAAGSRDLIGDVLRLPSEASRFFGRGDDAPDQQDDGTVGTRWAVLIAGSNGYWNYRHQADICHAYQLLKKGGLKDENIVVFMYDDIAYNEENPRQGVIINNPQGSDVYEGVPKDYTGEDVTVNNFFAAILGNKTALTGGSGKVVDSGPNDHIFIYYTDHGGPGVLGMPTSPYIYANDLIEVLKKKHAAGTYKSLVFYLEACESGSIFEGLLPEGLNIFATTASNAEESSWGTYCPGEYPSPPPEYETCLGDLYSVAWMEDSDIHNLRSETLHQQYELVKTRTANDNYGFGSHVMQYGDVGLSKNNLFVYMGTNPANDNYTFLGENSLRPSSKAVNQRDADLLHFWHKYRKAPEGSARKVQAQKDFVEAMSHRMHIDQTMKLIGKLLFGIEKGPQVLNAVRPAGQPLVDDWDCLKTMVRSFETHCGSLSQYGMKHMRSLANICNAGMTQEQMAEASAQACVSAPSSRWSSLHRGFSA
12、SEQ ID NO:12
通用名称:野生型OaAEP1(SEQ ID NO:3)重组表达构建
序列:
MGMAHHHHHHMQIFVKTLTGKTITLEVEPSDTIENVKAKIQDKEGIPPDQQRLIFAGKQLEDGRTLSDYNIQKESTLHLVLRLRGGARDGDYLHLPSEVSRFFRPQETNDDHGEDSVGTRWAVLIAGSKGYANYRHQAGVCHAYQILKRGGLKDENIVVFMYDDIAYNESNPRPGVIINSPHGSDVYAGVPKDYTGEEVNAKNFLAAILGNKSAITGGSGKVVDSGPNDHIFIYYTDHGAAGVIGMPSKPYLYADELNDALKKKHASGTYKSLVFYLEACESGSMFEGILPEDLNIYALTSTNTTESSWCYYCPAQENPPPPEYNVCLGDLFSVAWLEDSDVQNSWYETLNQQYHHVDKRISHASHATQYGNLKLGEEGLFVYMGSNPANDNYTSLDGNALTPSSIVVNQRDADLLHLWEK FRKAPEGSARKEEAQTQIFKAMSHRVHIDSSIKLIGKLLFGIEKCTEILNAVRPAGQPLVDDWACLRSLVGTFETHCGSLSEYGMRHTRTIANICNAGISEEQMAEAASQACASIP
13、SEQ ID NO:13
通用名称:6-His标签(重组)
序列:
MGMAHHHHHH
14、SEQ ID NO:14
通用名称:用于协助重组蛋白质表达的泛素标签(重组)
序列:
MQIFVKTLTGKTITLEVEPSDTIENVKAKIQDKEGIPPDQQRLIFAGKQLEDGRTLSDYNIQKESTLHLVLRLRGG
15、SEQ ID NO:15
通用名称:野生型OaAEP1的预激活形式(在本申请中构建结晶,PDB代码:5H0I)
序列:
ARGDYLHLPSEVSRFFRPQETNDDHGEDSVGTRWAVLIAGSKGYANYRHQAGVCHAYQILKRGGLKDENIVVFMYDDIAYNESNPRPGVIINSPHGSDVYAGVPKDYTGEEVNAKNFLAAILGNKSAITGGSGKVVDSGPNDHIFIYYTDHGAAGVIGMPSKPYLYADELNDALKKKHASGTYKSLVFYLEACESGSMFEGILPEDLNIYALTSTNTTESSWCYYCPAQENPPPPEYNVCLGDLFSVAWLEDSDVQNSWYETLNQQYHHVDKRISHASHATQYGNLKLGEEGLFVYMGSNPANDNYTSLDGNALTPSSIVVNQRDADLLHLWEKFRKAPEGSARKEEAQTQIFKAMSHRVHIDSSIKLIGKLLFGIEKCTEILNAVRPAGQPLVDDWACLRSLVGTFETHCGSLSEYGMRHTRTIANICNAGISEEQMAEAASQACASIP
16、SEQ ID NO:16
通用名称:AEP-C247A-Mut,用于突变的引物,将Seq ID NO:3转换为Seq ID NO:1
序列:CACCACCGAAAGCAGCTGGGCCTACTATTGCCCGGCGC
17、SEQ ID NO:17
通用名称:用于表征Quicklase识别序列特异性的肽模板
序列:Xaa1Xaa2YRRGRLYRRNXaa3Xaa4
*在每次筛选中,仅一个残基被修饰;在此次筛选中,默认的氨基酸在Xaa1位置是Gly、Xaa2位置是Leu、Xaa3位置是Gly、Xaa4位置是Leu。
实施例1:Quicklase OaAEP1介导肽连接
AEP型植物肽连接酶有保守蛋白质架构,在人豆荚蛋白(hlegum)肽链内切酶也存在(Ishii,S.,Methods Enzymol,1994.244:p.604-15;Chen,J.M.,et al.,J Biol Chem,1997.272(12):p.8090-8)。植物AEP有一个~20-30氨基酸的N端信号序列,其指导它们至植物液泡室,然后是一个酶核心区域。在该核心区域的C端,一个~130残基“帽(cap)”或原结构域完全覆盖活性位点,使未成熟蛋白保持在不活跃的酶原状态。该核心和原结构域通过一个“接头(linker)”连接,该接头定义为跨越蛋白质残基325-346(图2a)。植物AEP酶活性的激活需要在约为3.7的酸性pH下进行蛋白质水解成熟,此时域通过核心区域自身的解蛋白活性顺式或在环境存在的激活的Asx蛋白酶反式切割原结构域,并从核心区域释放。接头和原结构域内明确的裂解位点导致形成的成熟的活性植物AEP连接酶仍然很难表征。至于butelase 1,Asn383是假定的构成切割cap区的位点(Nguyen,G.K.,et al.,Nat ChemBiol,2014.10(9):p.732-8),而OaAEP1的一些潜在的切割位点横跨蛋白质区域328-351(图2a和图7)(Harris,K.S.,et al.,Nat Commun,2015.6:p.10199)。植物AEP型连接酶和AEP肽连接酶例如hlegum的氨基酸序列比对显示催化口袋中一些进化保守残基的存在(图7)(Nguyen,G.K.,et al.,Nat Chem Biol,2014.10(9):p.732-8;Harris,K.S.,et al.,NatCommun,2015.6:p.10199;Dall,E.,et al.,Angew Chem Int Ed Engl,2015.54(10):p.2917-21;Dall,E.and H.Brandstetter,Biochimie,2016.122:p.126-50;Saska,I.,etal.,J Biol Chem,2007.282(40):p.29721-8)。因此,什么决定了这些密切相似的酶如何优先作为连接酶或蛋白酶发挥作用仍不清楚。本文报道了一种OaAEP1在其酶原形式的晶体结构,揭示了如何将原结构域N端的Gln347残基的酰胺基容纳至催化口袋中。基于OaAEP1的结构,形成一系列的OaAEP1突变体以更好的理解植物AEP连接酶的激活机理和催化活性。发现346-351部分对突变体OaAEP1b起关键作用,因为这个部分中突变的Asx残基严重破坏AEP连接酶活性。一个调节OaAEP1肽连接活性的效率的主要决定因素是残基247的侧链,其临近催化对Cys217-His175,在此位置上较大的侧链完全消除了连接酶活性,而较小的侧链允许连接反应以更快的速度发生。因此,证明了OaAEP1的单个Cys247Ala突变体具有比野生型OaAEP1酶快~160倍的肽连接酶催化活性,与从植物中提取的butelase 1相当。还显示了仅使用亚微摩尔浓度的重组酶,Cys247Ala就可以有效地催化两种折叠良好的蛋白质(泛素和SNAP标签蛋白)的连接。
更详细地:
如前所述OaAEP1作为泛素融合蛋白在大肠杆菌中克隆和表达(图2)(Harris,K.S.,et al.,Nat Commun,2015.6:p.10199)。利用离子交换和尺寸排阻色谱(SEC),获得适于酶和结构分析的足量纯蛋白(图2b)。在纯化的中性pH(pH=7.4)下,OaAEP1主要以异二聚体形式存在,其中两种单体是酶原形式,但仅一个单体另外保留了泛素和N端His标签,而在另外一个单体中的融合部分被切割(图2b和图2c中标记为“His-Ub-AEP-FL”和“AEP-FL”)。这种异二聚体进行环化实验用于结构研究(见下文)。和参考文献一致(Harris,K.S.,etal.,Nat Commun,2015.6:p.10199),OaAEP1激活的最适pH值在3.4-4.0范围内(图2d)。激活后,根据SEC分析OaAEP1在溶液中转变成单体(图2c中的“AEP-holo”)。为了检测反式激活的蛋白质的能力,催化残基Cys217突变为Ser217。不出所料,Cys217Ser突变体仅表现出背景水平的激活和连接酶活性(图2e)。然而,通过添加仅10%的野生型OaAEP1至不活跃的突变体中就可以以反式方式挽救不活跃的突变体的激活(图2e)。这表明在OaAEP1激活中有相似的反式裂解处理活动,Cys217是顺式和反式激活的活性位点残基。
在第三代同步加速器上获得分辨率为的OaAEP1的晶体衍射(表1和图3)。尽管OaAEP1异二聚体作为原始材料,但晶体结构揭示了一个同源二聚体,其中N端(His)6标签和泛素融合蛋白以及信号肽序列已从不对称单元中存在的两个单体中释放,这表明在结晶过程中N端蛋白质水解(图3a和d)。通过两个cap区之间的分子内相互作用稳定OaAEP1二聚体。这与SEC分析(图2c)一致,显示含cap区的酶的预激活形式在中性pH下是二聚体,而缺少cap区的激活形式是单体。因此,溶解OaAEP1晶体的SDS PAGE表明了总相对分子质量大约为49.7kDa的酶核心和C端原结构域的存在,支持了结晶酶是一个未成熟形式的假设。OaAEP1核心由6-股β-折叠形成,其周围有6个α-螺旋环绕(Dall,E.,et al.,Angew Chem Int EdEngl,2015.54(10):p.2917-21;Dall,E.and H.Brandstetter,Proc Natl Acad Sci U SA,2013.110(27):p.10940-5;Zhao,L.,et al.,Cell Res,2014.24(3):p.344-58)。在图3a中显示的结构的整体视图揭示了α-螺旋cap区(跨越残基347-474)完全覆盖催化裂口,显示了cap的释放需要获得肽或蛋白质底物。OaAEP1催化位点含有一些在其他AEP中存在的残基,包括Cys217-His175催化对(hlegum中Cys189-His148)和His45-Asp147,其与连接至半胱氨酸蛋白酶抑制剂E(PDB代码:4N6O)的hlegum的His73-Asp174重叠(图4)。在这里发现了hlegum酶原形式(PDB代码:4NOK)和OaAEP1残基在接头区域明显的不同:在prolegumain结构中,接头短且有序,而在OaAEP1结构(图3a)中是长且灵活:在325-343之间的19个残基不存在电子密度,尽管这个部分存在在晶体蛋白中(图2b)。
表1:数据收集和细化统计
*括号中的数字表示最后(最高)分辨率壳层。
a Rmerge=∑|Ij-<I>|/∑Ij,其中Ij是个体反射强度,<I>是的平均反射强度。
c Rwork=∑||Fo|-|Fc||/∑|Fc|,其中Fo是观测到的结构因子振幅,Fc是根据模型计算出的结构因子振幅。
d Rfree与Rwork相同,但计算时忽略了细化中的5%(3044)随机选择的反射。
虽然接头区域残基325-343因其柔性在电子密度图不可见,但残基Val344-Val345-Asn346-Gln347在cap和核心区域之间的界面被捕获(图3c和4a)。值得注意的是,它们的方向与和hlegum催化位点Cys189(图3e,PDB代码:4AWA)共价连接的Ac-Tyr-Val-Ala-Asp-氯甲基酮肽抑制剂紧密重叠(Dall,E.and H.Brandstetter,Proc Natl Acad Sci U SA,2013.110(27):p.10940-5.)。然而,残基Gln347深入贯穿S1口袋以使它的酰胺基占领Ac-Tyr-Val-Ala-Asp-氯甲基酮肽蛋白酶抑制剂中Asp残基的羧基位置,该抑制剂共价结合hlegum和周围活性位点残基形成一些相互作用(图4a和4b)。因此,本发明的晶体结构能够作为一种描绘预连接构象的有用的模型,其中接头残基344-347模拟与活性位点结合的N端底物受体。
尽管在其他AEP中,在P1位置的Asx是进行处理的最有利的残基,但Gln347的羰基基团位于攻击的Cys217硫中心的距离,表明前蛋白的346-351部分可能含有在成熟中使用的自动切割的位点。由于环化条件与OaAEP1激活兼容,本发明的晶体结构有可能已经捕获了发生在激活途径中的构象状态之一。为了确认Gln347是否属于在自激活中识别和切割部分,进行靶向OaAEP1蛋白质区域346-351的突变实验(图4c)。在OaAEP1自激活中Gln347的作用通过改变该残基为Ala进行特别评估,并检测酶激活是否丧失。发现对突变体酶激活仅一点影响(图4c)。接着靶向紧挨着Gln347的残基Asn346、Asp349和Asp351。尽管两个OaAEP1双点突变体Asn346Ala-Gln347Ala和Asp349Ala-Asp351Ala以及Asn346Ala-Asp349Ala-Asp351Ala三点突变体仍可被激活,但Asn346Ala-Gln347Ala-Asp349Ala-Asp351Ala有显著受损的自激活活性(图4c中泳道“A4”)。重要的是,当野生型酶添加至反应混合物时,不能反式挽救4-Ala突变体的激活。因此,反式激活需要在接头部分中存在四个Asx/Gln残基中至少一个(略微优选Asp349或Asp351)。总之,这些数据表明本发明晶体结构代表在接头区域在催化位点被捕获的一个中间构象状态,模拟了底物结合的预连接复合物。
然后成熟的OaAEP1的肽环化活性通过质谱和肽底物“GLPVSTKPVATRNGL”分析(图5a)。OaAEP1的转换速度(kcat)是0.052s-1,和之前报道的值非常一致(Harris,K.S.,et al.,Nat Commun,2015.6:p.10199)。同样的,从植物提取的butelase 1的环化活性通过15个残基肽“GLPVSTKPVATRNHV”测定,导致kcat比OaAEP1b快约90倍。
然后分析在本发明的结构中捕获的OaAEP1预连接构象,确定一些关键特征以能区分AEP蛋白酶和AEP型连接酶。和之前报道的蛋白水解的AEP抑制剂复合物(PDB代码:4AWA)并行比较,揭示了AEP型连接酶特有的有趣的结构特征。与AEP蛋白酶不同,面对催化Cys217的OaAEP1的表面似乎更广泛地打开。三个半胱氨酸残基(Cys247,Cys250,Cys264)排列在酶表面的浅裂口(图3c和3e)。与含有一些凸起的AEP蛋白酶的表面不同,butelase 1(使用基于OaAEP1b的同源模型)和OaAEP1沿这块有较小的侧链残基。在Cys250和Cys264之间形成的二硫键,在AEP型连接酶butelase 1和OaAEP1b中是保守的。这个共价键有可能稳定局部结构并提供足够的表面,以使N端胺基进入的基团进入。相反地,AEP蛋白酶((PDB:4AWA)相应的表面路径排列有堵塞该通道的如Tyr的大侧链残基(图3e)。因此,假定位于底物通道末端的残基Cys247可能作为最终的亲核试剂过滤器(或“看门基团(gate-keeper)”)发挥作用,允许来自N端胺基的攻击完成连接反应。为了检测在“看门基团”位置处各种侧链对连接反应的影响,进行一系列的点突变,其中Cys247突变为Gly、Ala、Val、Ser、Thr、Met、Leu以及Ile(图5)。相应突变蛋白的活性揭示了侧链的大小对连接活性的确起到关键作用。值得注意的是,与野生型OaAEP1相比,Cys247Ala突变体表现出显著改善的酶学性质(图5d)。这个表现型归因于更合适容纳进入的胺基的较小侧链的存在,而Cys247Gly突变体使局部构象不稳定并对连接酶活性产生负面影响。进一步研究显示如果可用的N端胺基乙酰化,Cys247Gly催化肽水解作为替代反应(图10)。至于Cys247Ala突变体,如果存在不可用N端胺,则更优选侧链连接,Ala较不亲水,不利于水进入催化路径引起中间硫酯键的水解。当N端胺未被保护时,骨架连接比任何替代反应相比更有利。
值得注意的是,Cys247Ala表现出比亲本野生型OaAEP1蛋白质改善的酶学性质:它的kcat高于野生型OaAEP1b近160倍,使其作为用于多种具有挑战的蛋白质工程和标签应用的引人注目的工具。首先检测Cys247Ala用于连接泛素和肽的能力。“Asn-Gly-Leu”三个残基添加在泛素的C端以使其能被Cys247Ala识别。另一个具有N端残基GlyLeu的肽作为附加组分。在蛋白质:肽摩尔比为1:5时,10分钟内Cys247Ala催化超过90%泛素和肽的连接(图6)。与通过需要进行有效连接的10-30μM转肽酶A相比,30nM Cys247Ala的量足以用于反应。为了进一步证明Cys247Ala的潜力,也检测了两个折叠良好的蛋白之间的连接。在其C末端有相同“Asn-Gly-Leu”修饰的泛素以及N端修饰SNAP(NEB)标签蛋白作为底物。使用5μM的SNAP标签蛋白和8μM的泛素,10nM Cys247Ala能够连接超过60%的单个底物蛋白形成一个连接的单一多肽产物,表明催化蛋白连接是高效且不可逆的(图6)。蛋白质连接在中性pH和室温中数分钟就能进行。值得注意的是,Cys247Ala催化两个折叠蛋白连接的效率与其连接一个蛋白质和一个肽的能力相当,表明其开放的结合位点能够容纳两个大体积的蛋白质底物而不会妨碍连接过程。控制连接实验显示了蛋白质连接活性仅能在Cys247Ala蛋白的存在使观察到,不能在OaAEP1野生型结构体中观察到(图6)。这进一步证明了看门基团残基在调节蛋白质底物通路中发挥重要作用。
转肽酶A和butelase 1均可用于进行肽连接。然而,这两个每都有一些缺点。转肽酶A需要Ca2+,速度缓慢并且需要识别更长、更灵活的C端序列(LPXTG)。尽管通过大量的突变研究,鉴定了一些改善其动力学的突变体,但连接两个折叠良好的蛋白质的催化作用仍很低效(Chen,I.,B.M.Dorr,and D.R.Liu,Proc Natl Acad Sci U S A,2011.108(28):p.11399-404)。相反,从植物中提取的butelase 1极其有效并具有较短的识别氨基酸序列(NHV)(Nguyen,G.K.,et al.,Nat Chem Biol,2014.10(9):p.732-8)。然而,由于难以生产活性重组酶,butelase 1重组构建体的优化和工程仍存在挑战。在此,据本发明人所知,报道了OaAEP1的第一个X射线结晶结构,其可作为了解植物AEP连接酶家族的模板以及促进具有替代底物特异性的更快的蛋白质连接酶的设计。我们的结构表明在AEP型连接酶中实现自切割激活的模式,并且还指出了解决AEP型蛋白质之间功能差异的关键残基和结构特征:主要作为蛋白酶的AEP缺乏有助于连接的催化口袋附近的平坦表面,而作为有效连接酶的AEP型蛋白具有能够容纳进入的胺基的宽且开放的表面。这些结构观察致使我们设计了一种具有改善的生化性质的改良的连接酶Cys247Ala,其能够有效连接蛋白质。鉴于其快速连接催化动力学,相信本发明的Cys247Ala重组蛋白质连接酶可以用于进行蛋白质/肽合成和特定蛋白质标记的有吸引力的生物技术应用(Guimaraes,C.P.,et al.,Nat Protoc,2013.8(9):p.1787-99;Swee,L.K.,et al.,Proc Natl Acad Sci U S A,2013.110(4):p.1428-33;Theile,C.S.,et al.,Nat Protoc,2013.8(9):p.1800-7;Witte,M.D.,et al.,Nat Protoc,2013.8(9):p.1808-19;Wagner,K.,et al.,Proc Natl Acad Sci U S A,2014.111(47):p.16820-5;Nguyen,G.K.,et al.,Angew Chem Int Ed Engl,2015.54(52):p.15694-8;Nguyen,G.K.,et al.,J Am Chem Soc,2015.137(49):p.15398-401)。
实施例2:NCBI-BLAST鉴定Quicklase OaAEP1的同系物
SEQ ID NO:1氨基酸序列的Blast搜索通过提交序列至NCBI blast服务中采用标准blast条件进行。选择如图12所示的高命中进行序列分析。发现它们全部含有OaAEP1b的残基247-264的保守结构基序。
实施例3:AEP_C13CO4(SEQ ID NO:8)是一种具有OaAEP1 Cys247Ala(SEQ ID NO:1)活性的肽连接酶
基于序列比对的预测,AEP_C13CO4含有和Quicklase(247-264)相同的保守结构基序。这表明AEP_C13CO4可能是功能性蛋白质连接酶。随后合成AEP_C13CO4的cDNA并以Quicklase相似的方式亚克隆至pet28b中。然后这个新潜在的连接酶以Quicklase相似方式表达、纯化和激活,并表现出蛋白质水解和蛋白质连接活性。尽管AEP_C13CO4的野生型不是一种理想蛋白质连接酶,其具有比Quicklase慢得多的酶催化效率以及明显的蛋白质水解反应副产物(图13),但这似乎是进一步工程化替代蛋白质连接酶的良好开端。
实施例4:Quicklase OaAEP1催化的肽二聚化、低聚化和多聚化
关于图14中所示的方案,进行了以下实施例:
图14(a):
基于标准Fmoc固相多肽合成(SPPS)化学,用丁苯酰胺树脂(GL Biochem,中国上海)合成支化二聚体接头(2-mer linker)肽。通过掺入Fmoc-L-Lys(Fmoc)-OH引入分支。除去α-和ε-胺基基团上的Fmoc基团后,根据标准Fmoc-SPPS步骤引入剩余氨基酸(GLGG)。
对于一步同源二聚化反应,50μM的C端NGL标记的目标蛋白(POI-NGL),在本例中为Ub-AA-NGL,在室温下用0.5μM的AEP催化其与0-200μM范围的不同浓度的二聚体接头反应。1小时后通过SDS-PAGE检测该反应。
图14(b):
对于两步异源二聚化策略,第一步是酶(0.5μM)催化POIA-NGL(50μM)和过量二聚体接头(200μM)之间的反应,使仅二聚体接头的一个分支被标记。反应后,用3500MW截止浓缩器通过缓冲液交换除去二聚体接头肽来分离POIA-接头。
对于第二步连接步骤,0.5μM的AEP催化POIB-NGL(100,200μM)与POIA-接头(50μM)的反应得到最终异二聚体产物。
图14(c):
为了形成四聚体接头(4-mer linker),通过交联C端半胱氨酸残基使二聚体接头二聚化。反应详情参阅图g。
通过AEP催化POI-NGL和该四聚体接头之间的反应实现一步蛋白质四聚体化。以泛素为例,为了优化连接反应,在pH 7.4、室温中0.5μM AEP存在下,20μM的Ub-AA-NGL(POI-NGL)和不同浓度(0-80μM)的四聚体接头连接。1小时后,通过SDS-PAGE分析该反应,表明当使用2.5-5μM的四聚体接头时,产生了最大量的Ub-四聚体(Ub-tetramer)。
图14(d):
为了实现蛋白质超低聚,首先通过两个步骤合成低聚肽平台:i)直接或通过天然化学连接合成含有多个半胱氨酸残基的肽,其通过7-8个氨基酸的柔性间隔分离;ii)然后通过具有游离N端GL残基的溴乙酰肽将肽中的半胱氨酸残基烷基化之后用于AEP催化的连接。产生低聚体接头后,AEP催化POI-NGL和二聚体接头之间的反应以产生蛋白质超低聚体。
图14(e,f):
产生用于蛋白质头对头二聚化的二聚体NGL接头(2-mer-NGL linker)的方案:
通过1,3-二氯丙酮或间二甲苯二溴化物(Sigma-aldrich)使单体-NGL肽的N端乙酰化的半胱氨酸S-烷基化,实现二聚体-NGL接头的合成。简单地说,单体-NGL肽溶解在含有20mM Tris HCl、150mM NaCl、5mM TCEP、pH 8.0的终浓度为1mg/mL的缓冲液中。1当量的1,3-二氯丙酮或间二甲苯二溴化物添加至溶液中。在黑暗条件下反应3小时后,通过HPLC用C18反相柱纯化分离得到所需的二聚体-NGL接头。
图14(g):
产生用于蛋白质尾对尾四聚化的GL-四聚体接头(GL-tetramer linker)的方案:
通过1,3-二氯丙酮或间二甲苯二溴化物使GL-二聚体(GL-dimer)接头肽的C端半胱氨酸S-烷基化,实现GL-四聚体接头的合成。简单地说,GL-二聚体接头溶解在含有20mMTris HCl、150mM NaCl、5mM TCEP、pH 8.0的终浓度为1mg/mL的缓冲液中。1当量的1,3-二氯丙酮或间二甲苯二溴化物添加至溶液中。在黑暗条件下反应3小时后,通过HPLC用C18反相柱纯化分离得到所需的GL-四聚体接头。
图14(h):
产生用于蛋白质头对头低聚化的NGL-低聚体接头的方案:
含有被7-8个氨基酸的柔性间隔分离的多个半胱氨酸残基的肽,和C端NGL残基之后用于AEP催化的连接的另一个N端溴乙酰肽之间通过S-烷基化反应合成NGL-低聚体接头平台。简单地说,对于烷基化反应,1mg/mL的半胱氨酰肽和1.5mg/mL的溴乙酰肽在含有20mMTris HCl,150mM NaCl,5mM TCEP,pH 8.0的缓冲液中室温避光反应。2小时后,通过HPLC用C18反相柱纯化分离得到所需的NGL-低聚体接头。
图14(i):
产生用于蛋白质头对头低聚化的GL-低聚体接头的方案:
含有被7-8个氨基酸的柔性间隔分离的多个半胱氨酸残基的肽,和N端GL残基之后用于AEP催化的连接的另一个溴乙酰肽(溴乙酰基于赖氨酸侧链连接)之间通过S-烷基化反应合成GL-低聚体接头平台。简单地说,对于烷基化反应,1mg/mL的半胱氨酰肽和1.5mg/mL的溴乙酰肽在含有20mM Tris HCl,150mM NaCl,5mM TCEP,pH 8.0的缓冲液中室温避光反应。2小时后,通过HPLC用C18反相柱纯化分离得到所需的GL-低聚体接头。
实施例5:Quicklase OaAEP1-催化的细胞表面标记
与图15相关进行了以下实施例:
在标准细胞培养条件下,将0.1-1μM的OaAEP1 Cys247Ala加到细胞培养物中。然后将1-20μM标记的蛋白质标签加入反应并在37℃、标准培养条件下孵育30-45分钟,再洗去过量的酶和标记的标签。获得的三次清洗的细胞部分进行荧光SDS-PAGE分析以确定标记效率。
在成像分析时,使用Nikon Ti显微镜或等同物(Nikon)以及激光源X-Cite 120(Excelitas)或等同物和数码相机C11440(Hamamatsu)或等同物获取图像。观察和拍摄细胞的程序是MetaMorph(Molecular Devices)或等同的。使用Image J或等同的编辑图像。
在此对本发明进行了概括和一般的描述。落入一般披露中的更窄的种类和子类分组的每一个也构成本发明的一部分。这包括本发明的一般描述,用限制性或否定限制性从属中去除任意主题,无论删除的材料是否在本文明确列出。其他实施方式在所附权利要求内。此外,当按照马库什组描述本发明的特征或方面时,本领域技术人员应意识到还按照马库什组成员的任何单独成员或亚组来描述本发明。
本领域技术人员易理解的,本发明非常适合于实现目标并获得所指出的目的和优点,以及其中固有的那些。此外,对于本领域技术人员来说显而易见的,在不脱离本发明的范围和精神的情况下,可以对本文公开的发明进行改变替换和修改。本文所述的组合物、方法、程序、处理、分子和具体化合物目前代表优选实施方式是示例性的,并不旨在限制本发明的范围。本领域的技术人员将想到其中的变化和其他用途,其包含在本发明的精神内并由权利要求书的范围限定。在本说明书中列出或讨论先前公布的文件不应该被认为承认该文件是现有技术的一部分或是公知常识。
本文中说明性地描述的发明可在没有在本文中未具体公开的任何一个或多个元件、一种或多种限制的情况下合适地实践。因此,例如,术语“包括”,“包括”,包含“等”应当被广泛理解而不受限制。因此,词语“包括(comprise)”一词及其变体(如“comprises”或“comprising”)都应被理解为暗示包括所述整数或整数组但并不排除任何其它整数或整数组。此外,本文采用的术语和表达方式是用来描述而非限制的,且这些术语及表达的使用中无意排除所示及描述的特征的任何等同物或其部分,且应当认识到在本发明要求保护的范围内各种改变是可能的。因此,应该理解,尽管已经通过示例性实施方式和可选特征具体公开了本发明,但本领域技术人员可以采用本文公开的发明的修改和变化,应认为这些修改和变化在本发明的范围内。
本文引用的所有文件和专利文献的内容以引用方式整体并入。
序列表
<110> 南洋理工大学
<120> 酶促肽连接的方法
<130> P112356
<150> SG10201607951V
<151> 2016-09-23
<160> 17
<170> PatentIn version 3.5
<210> 1
<211> 474
<212> PRT
<213> Ovaloparmena affinis
<400> 1
Met Val Arg Tyr Leu Ala Gly Ala Val Leu Leu Leu Val Val Leu Ser
1 5 10 15
Val Ala Ala Ala Val Ser Gly Ala Arg Asp Gly Asp Tyr Leu His Leu
20 25 30
Pro Ser Glu Val Ser Arg Phe Phe Arg Pro Gln Glu Thr Asn Asp Asp
35 40 45
His Gly Glu Asp Ser Val Gly Thr Arg Trp Ala Val Leu Ile Ala Gly
50 55 60
Ser Lys Gly Tyr Ala Asn Tyr Arg His Gln Ala Gly Val Cys His Ala
65 70 75 80
Tyr Gln Ile Leu Lys Arg Gly Gly Leu Lys Asp Glu Asn Ile Val Val
85 90 95
Phe Met Tyr Asp Asp Ile Ala Tyr Asn Glu Ser Asn Pro Arg Pro Gly
100 105 110
Val Ile Ile Asn Ser Pro His Gly Ser Asp Val Tyr Ala Gly Val Pro
115 120 125
Lys Asp Tyr Thr Gly Glu Glu Val Asn Ala Lys Asn Phe Leu Ala Ala
130 135 140
Ile Leu Gly Asn Lys Ser Ala Ile Thr Gly Gly Ser Gly Lys Val Val
145 150 155 160
Asp Ser Gly Pro Asn Asp His Ile Phe Ile Tyr Tyr Thr Asp His Gly
165 170 175
Ala Ala Gly Val Ile Gly Met Pro Ser Lys Pro Tyr Leu Tyr Ala Asp
180 185 190
Glu Leu Asn Asp Ala Leu Lys Lys Lys His Ala Ser Gly Thr Tyr Lys
195 200 205
Ser Leu Val Phe Tyr Leu Glu Ala Cys Glu Ser Gly Ser Met Phe Glu
210 215 220
Gly Ile Leu Pro Glu Asp Leu Asn Ile Tyr Ala Leu Thr Ser Thr Asn
225 230 235 240
Thr Thr Glu Ser Ser Trp Ala Tyr Tyr Cys Pro Ala Gln Glu Asn Pro
245 250 255
Pro Pro Pro Glu Tyr Asn Val Cys Leu Gly Asp Leu Phe Ser Val Ala
260 265 270
Trp Leu Glu Asp Ser Asp Val Gln Asn Ser Trp Tyr Glu Thr Leu Asn
275 280 285
Gln Gln Tyr His His Val Asp Lys Arg Ile Ser His Ala Ser His Ala
290 295 300
Thr Gln Tyr Gly Asn Leu Lys Leu Gly Glu Glu Gly Leu Phe Val Tyr
305 310 315 320
Met Gly Ser Asn Pro Ala Asn Asp Asn Tyr Thr Ser Leu Asp Gly Asn
325 330 335
Ala Leu Thr Pro Ser Ser Ile Val Val Asn Gln Arg Asp Ala Asp Leu
340 345 350
Leu His Leu Trp Glu Lys Phe Arg Lys Ala Pro Glu Gly Ser Ala Arg
355 360 365
Lys Glu Glu Ala Gln Thr Gln Ile Phe Lys Ala Met Ser His Arg Val
370 375 380
His Ile Asp Ser Ser Ile Lys Leu Ile Gly Lys Leu Leu Phe Gly Ile
385 390 395 400
Glu Lys Cys Thr Glu Ile Leu Asn Ala Val Arg Pro Ala Gly Gln Pro
405 410 415
Leu Val Asp Asp Trp Ala Cys Leu Arg Ser Leu Val Gly Thr Phe Glu
420 425 430
Thr His Cys Gly Ser Leu Ser Glu Tyr Gly Met Arg His Thr Arg Thr
435 440 445
Ile Ala Asn Ile Cys Asn Ala Gly Ile Ser Glu Glu Gln Met Ala Glu
450 455 460
Ala Ala Ser Gln Ala Cys Ala Ser Ile Pro
465 470
<210> 2
<211> 18
<212> PRT
<213> Ovaloparmena affinis
<220>
<221> MISC_FEATURE
<222> (1)..(1)
<223> Xaa corresponds to position 247 of SEQ ID NO:1 and is Gly, Ala,
Ser, or Cys.
<220>
<221> MISC_FEATURE
<222> (2)..(2)
<223> Xaa is any amino acid, preferably any amino acid that does not
disrupt the structural fold of the remaining conserved amino
acids
<220>
<221> MISC_FEATURE
<222> (6)..(6)
<223> Xaa is any amino acid, preferably any amino acid that does not
disrupt the structural fold of the remaining conserved amino
acids
<220>
<221> MISC_FEATURE
<222> (7)..(7)
<223> Xaa is any amino acid, preferably any amino acid that does not
disrupt the structural fold of the remaining conserved amino
acids
<220>
<221> MISC_FEATURE
<222> (8)..(8)
<223> Xaa is any amino acid, preferably any amino acid that does not
disrupt the structural fold of the remaining conserved amino
acids
<220>
<221> MISC_FEATURE
<222> (9)..(9)
<223> Xaa is any amino acid, preferably any amino acid that does not
disrupt the structural fold of the remaining conserved amino
acids
<220>
<221> MISC_FEATURE
<222> (10)..(10)
<223> Xaa is any amino acid, preferably any amino acid that does not
disrupt the structural fold of the remaining conserved amino
acids
<220>
<221> MISC_FEATURE
<222> (16)..(16)
<223> Xaa is any amino acid, preferably any amino acid that does not
disrupt the structural fold of the remaining conserved amino
acids
<220>
<221> MISC_FEATURE
<222> (17)..(17)
<223> Xaa corresponds to position 263 of SEQ ID NO:1 and is any amino
acid, preferably any amino acid that does not disrupt the
structural fold of the remaining conserved amino acids
<400> 2
Xaa Xaa Tyr Cys Pro Xaa Xaa Xaa Xaa Xaa Pro Pro Pro Glu Tyr Xaa
1 5 10 15
Xaa Cys
<210> 3
<211> 474
<212> PRT
<213> Ovaloparmena affinis
<400> 3
Met Val Arg Tyr Leu Ala Gly Ala Val Leu Leu Leu Val Val Leu Ser
1 5 10 15
Val Ala Ala Ala Val Ser Gly Ala Arg Asp Gly Asp Tyr Leu His Leu
20 25 30
Pro Ser Glu Val Ser Arg Phe Phe Arg Pro Gln Glu Thr Asn Asp Asp
35 40 45
His Gly Glu Asp Ser Val Gly Thr Arg Trp Ala Val Leu Ile Ala Gly
50 55 60
Ser Lys Gly Tyr Ala Asn Tyr Arg His Gln Ala Gly Val Cys His Ala
65 70 75 80
Tyr Gln Ile Leu Lys Arg Gly Gly Leu Lys Asp Glu Asn Ile Val Val
85 90 95
Phe Met Tyr Asp Asp Ile Ala Tyr Asn Glu Ser Asn Pro Arg Pro Gly
100 105 110
Val Ile Ile Asn Ser Pro His Gly Ser Asp Val Tyr Ala Gly Val Pro
115 120 125
Lys Asp Tyr Thr Gly Glu Glu Val Asn Ala Lys Asn Phe Leu Ala Ala
130 135 140
Ile Leu Gly Asn Lys Ser Ala Ile Thr Gly Gly Ser Gly Lys Val Val
145 150 155 160
Asp Ser Gly Pro Asn Asp His Ile Phe Ile Tyr Tyr Thr Asp His Gly
165 170 175
Ala Ala Gly Val Ile Gly Met Pro Ser Lys Pro Tyr Leu Tyr Ala Asp
180 185 190
Glu Leu Asn Asp Ala Leu Lys Lys Lys His Ala Ser Gly Thr Tyr Lys
195 200 205
Ser Leu Val Phe Tyr Leu Glu Ala Cys Glu Ser Gly Ser Met Phe Glu
210 215 220
Gly Ile Leu Pro Glu Asp Leu Asn Ile Tyr Ala Leu Thr Ser Thr Asn
225 230 235 240
Thr Thr Glu Ser Ser Trp Cys Tyr Tyr Cys Pro Ala Gln Glu Asn Pro
245 250 255
Pro Pro Pro Glu Tyr Asn Val Cys Leu Gly Asp Leu Phe Ser Val Ala
260 265 270
Trp Leu Glu Asp Ser Asp Val Gln Asn Ser Trp Tyr Glu Thr Leu Asn
275 280 285
Gln Gln Tyr His His Val Asp Lys Arg Ile Ser His Ala Ser His Ala
290 295 300
Thr Gln Tyr Gly Asn Leu Lys Leu Gly Glu Glu Gly Leu Phe Val Tyr
305 310 315 320
Met Gly Ser Asn Pro Ala Asn Asp Asn Tyr Thr Ser Leu Asp Gly Asn
325 330 335
Ala Leu Thr Pro Ser Ser Ile Val Val Asn Gln Arg Asp Ala Asp Leu
340 345 350
Leu His Leu Trp Glu Lys Phe Arg Lys Ala Pro Glu Gly Ser Ala Arg
355 360 365
Lys Glu Glu Ala Gln Thr Gln Ile Phe Lys Ala Met Ser His Arg Val
370 375 380
His Ile Asp Ser Ser Ile Lys Leu Ile Gly Lys Leu Leu Phe Gly Ile
385 390 395 400
Glu Lys Cys Thr Glu Ile Leu Asn Ala Val Arg Pro Ala Gly Gln Pro
405 410 415
Leu Val Asp Asp Trp Ala Cys Leu Arg Ser Leu Val Gly Thr Phe Glu
420 425 430
Thr His Cys Gly Ser Leu Ser Glu Tyr Gly Met Arg His Thr Arg Thr
435 440 445
Ile Ala Asn Ile Cys Asn Ala Gly Ile Ser Glu Glu Gln Met Ala Glu
450 455 460
Ala Ala Ser Gln Ala Cys Ala Ser Ile Pro
465 470
<210> 4
<211> 462
<212> PRT
<213> Clitoria ternatea
<400> 4
Ile Arg Asp Asp Phe Leu Arg Leu Pro Ser Gln Ala Ser Lys Phe Phe
1 5 10 15
Gln Ala Asp Asp Asn Val Glu Gly Thr Arg Trp Ala Val Leu Val Ala
20 25 30
Gly Ser Lys Gly Tyr Val Asn Tyr Arg His Gln Ala Asp Val Cys His
35 40 45
Ala Tyr Gln Ile Leu Lys Lys Gly Gly Leu Lys Asp Glu Asn Ile Ile
50 55 60
Val Phe Met Tyr Asp Asp Ile Ala Tyr Asn Glu Ser Asn Pro His Pro
65 70 75 80
Gly Val Ile Ile Asn His Pro Tyr Gly Ser Asp Val Tyr Lys Gly Val
85 90 95
Pro Lys Asp Tyr Val Gly Glu Asp Ile Asn Pro Pro Asn Phe Tyr Ala
100 105 110
Val Leu Leu Ala Asn Lys Ser Ala Leu Thr Gly Thr Gly Ser Gly Lys
115 120 125
Val Leu Asp Ser Gly Pro Asn Asp His Val Phe Ile Tyr Tyr Thr Asp
130 135 140
His Gly Gly Ala Gly Val Leu Gly Met Pro Ser Lys Pro Tyr Ile Ala
145 150 155 160
Ala Ser Asp Leu Asn Asp Val Leu Lys Lys Lys His Ala Ser Gly Thr
165 170 175
Tyr Lys Ser Ile Val Phe Tyr Val Glu Ser Cys Glu Ser Gly Ser Met
180 185 190
Phe Asp Gly Leu Leu Pro Glu Asp His Asn Ile Tyr Val Met Gly Ala
195 200 205
Ser Asp Thr Gly Glu Ser Ser Trp Val Thr Tyr Cys Pro Leu Gln His
210 215 220
Pro Ser Pro Pro Pro Glu Tyr Asp Val Cys Val Gly Asp Leu Phe Ser
225 230 235 240
Val Ala Trp Leu Glu Asp Cys Asp Val His Asn Leu Gln Thr Glu Thr
245 250 255
Phe Gln Gln Gln Tyr Glu Val Val Lys Asn Lys Thr Ile Val Ala Leu
260 265 270
Ile Glu Asp Gly Thr His Val Val Gln Tyr Gly Asp Val Gly Leu Ser
275 280 285
Lys Gln Thr Leu Phe Val Tyr Met Gly Thr Asp Pro Ala Asn Asp Asn
290 295 300
Asn Thr Phe Thr Asp Lys Asn Ser Leu Gly Thr Pro Arg Lys Ala Val
305 310 315 320
Ser Gln Arg Asp Ala Asp Leu Ile His Tyr Trp Glu Lys Tyr Arg Arg
325 330 335
Ala Pro Glu Gly Ser Ser Arg Lys Ala Glu Ala Lys Lys Gln Leu Arg
340 345 350
Glu Val Met Ala His Arg Met His Ile Asp Asn Ser Val Lys His Ile
355 360 365
Gly Lys Leu Leu Phe Gly Ile Glu Lys Gly His Lys Met Leu Asn Asn
370 375 380
Val Arg Pro Ala Gly Leu Pro Val Val Asp Asp Trp Asp Cys Phe Lys
385 390 395 400
Thr Leu Ile Arg Thr Phe Glu Thr His Cys Gly Ser Leu Ser Glu Tyr
405 410 415
Gly Met Lys His Met Arg Ser Phe Ala Asn Leu Cys Asn Ala Gly Ile
420 425 430
Arg Lys Glu Gln Met Ala Glu Ala Ser Ala Gln Ala Cys Val Ser Ile
435 440 445
Pro Asp Asn Pro Trp Ser Ser Leu His Ala Gly Phe Ser Val
450 455 460
<210> 5
<211> 488
<212> PRT
<213> Coffea canephora
<400> 5
Met Met Arg Tyr Ala Thr Ala Ala Leu Leu Leu Leu Ala Leu Ser Ile
1 5 10 15
Ile Ala Val Ala Glu Ala Arg Asp Asn Phe Leu Lys Leu Pro Ser Glu
20 25 30
Ile Ala Asp Phe Phe His Pro Lys Glu Arg Ser Asp Ala Gly Gly Asp
35 40 45
Ser Val Gly Thr Arg Trp Ala Val Leu Ile Ala Gly Ser Asn Gly Tyr
50 55 60
Trp Asn Tyr Arg His Gln Ala Asp Val Cys His Ala Tyr Gln Ile Leu
65 70 75 80
Lys Arg Gly Gly Leu Lys Asp Glu Asn Ile Val Val Phe Met Tyr Asp
85 90 95
Asp Ile Ala Tyr Asn Glu Glu Asn Pro Arg Pro Gly Val Ile Ile Asn
100 105 110
Ser Pro His Gly Ala Asp Val Tyr Gln Gly Val Pro Lys Asp Tyr Thr
115 120 125
Gly Asp Asp Val Asn Ala Lys Asn Phe Leu Ala Ala Ile Leu Gly Asp
130 135 140
Lys Thr Ala Ile Thr Gly Gly Ser Gly Lys Val Val Asp Ser Gly Pro
145 150 155 160
Asn Asp His Ile Phe Ile Tyr Tyr Thr Asp His Gly Gly Pro Gly Val
165 170 175
Leu Gly Thr Pro Ser Gly Pro Tyr Leu Tyr Ala Asp Asp Leu Asn Glu
180 185 190
Val Leu Lys Lys Lys His Ala Ser Gly Thr Tyr Lys Ser Leu Val Phe
195 200 205
Tyr Leu Glu Ala Cys Glu Ser Gly Ser Ile Phe Glu Gly Leu Leu Pro
210 215 220
Glu Asp Leu Asn Ile Tyr Ala Thr Thr Ala Ser Asn Ala Glu Glu Ser
225 230 235 240
Ser Trp Gly Thr Tyr Cys Pro Gly Glu Tyr Pro Ser Pro Pro Pro Glu
245 250 255
Tyr Glu Thr Cys Leu Gly Asp Leu Tyr Ser Val Ala Trp Met Glu Asp
260 265 270
Ser Glu Ile His Asn Leu His Thr Glu Thr Leu Lys Gln Gln Tyr His
275 280 285
Leu Val Lys Lys Arg Thr Ser Ser Ser Asn Ser Ala Tyr Gly Ser His
290 295 300
Val Met Gln Tyr Gly Asp Leu Lys Leu Ser Leu Glu Asp Leu Phe Leu
305 310 315 320
Tyr Met Gly Thr Asn Pro Ala Asn Asp Asn Tyr Thr Phe Val Asp Glu
325 330 335
Asn Ser Leu Arg Pro Ser Ser Lys Ala Val Asn Gln Arg Asp Ala Asp
340 345 350
Leu Leu His Phe Trp Asp Lys Phe Arg Lys Ala Pro Glu Gly Ser Ala
355 360 365
Arg Lys Val Glu Ala Gln Lys Gln Val Val Glu Ala Met Ser His Arg
370 375 380
Met His Ile Asp Asn Ser Val Lys Leu Ile Gly Lys Leu Leu Phe Gly
385 390 395 400
Ile Glu Lys Gly Ser Glu Ile Leu Asn Ser Val Arg Pro Ala Gly His
405 410 415
Pro Leu Ala Asp Asp Trp Asp Cys Leu Lys Ser Leu Val Arg Thr Phe
420 425 430
Glu Thr His Cys Gly Ser Leu Ser Gln Tyr Gly Met Lys His Met Arg
435 440 445
Ser Ile Ala Asn Ile Cys Asn Ala Gly Ile Lys Lys Asp Gln Met Ala
450 455 460
Glu Ala Ala Ala Gln Ala Cys Val Ser Leu Pro Ser Asn Ser Trp Ser
465 470 475 480
Ser Leu His Arg Gly Phe Ser Ala
485
<210> 6
<211> 491
<212> PRT
<213> Daucus carota subsp. sativus
<400> 6
Met Val Arg Tyr Leu Ala Gly Ala Val Ala Leu Leu Val Val Val Ser
1 5 10 15
Ile Ser Ala Val Val Glu Ser Arg Arg Asp Ile Val Gly Asp Val Leu
20 25 30
Lys Leu Pro Ser Glu Val Ser Ser Phe Phe Arg Pro Val Ala Glu Glu
35 40 45
Glu Asp Ser Val Gly Thr Arg Trp Ala Val Leu Ile Ala Gly Ser Asn
50 55 60
Gly Tyr Trp Asn Tyr Arg His Gln Ala Asp Ile Cys His Ala Tyr Gln
65 70 75 80
Leu Leu Arg Arg Gly Gly Val Lys Glu Glu Asn Ile Val Val Phe Met
85 90 95
Tyr Asp Asp Ile Ala Tyr Asp Glu Glu Asn Pro Arg Pro Gly Val Ile
100 105 110
Ile Asn Ser Pro His Gly Ser Asp Val Tyr Lys Gly Val Pro Lys Asp
115 120 125
Tyr Thr Gly Glu Asp Val Thr Val Asn Asn Val Phe Ala Ala Ile Leu
130 135 140
Gly Asp Lys Ser Ala Thr Thr Gly Gly Ser Gly Lys Val Val Asp Ser
145 150 155 160
Gly Pro Asn Asp His Ile Phe Ile Tyr Tyr Ser Asp His Gly Gly Pro
165 170 175
Gly Val Leu Gly Met Pro Thr Asn Pro Tyr Met Tyr Ala Gly Asp Leu
180 185 190
Val Asp Val Leu Lys Lys Lys His Ala Ser Gly Thr Tyr Lys Ser Met
195 200 205
Val Phe Tyr Leu Glu Ala Cys Glu Ser Gly Ser Ile Phe Glu Gly Leu
210 215 220
Leu Pro Glu Gly Leu Asn Ile Tyr Ala Thr Thr Ala Ser Asn Ala Tyr
225 230 235 240
Glu Ser Ser Trp Gly Thr Tyr Cys Pro Gly Glu Tyr Pro Ser Pro Pro
245 250 255
Pro Glu Tyr Glu Thr Cys Leu Gly Asp Leu Tyr Ser Val Ala Trp Met
260 265 270
Glu Asp Ser Asp Ile His Asn Leu Arg Thr Glu Thr Leu Arg Gln Gln
275 280 285
Tyr Gln Gln Val Lys Lys Arg Thr Ser Asn Asp Asn Ser Gly Trp Gly
290 295 300
Ser His Val Met Gln Tyr Gly Asp Leu Lys Leu Ser Thr Glu Glu Leu
305 310 315 320
Phe Met Tyr Met Gly Thr Asn Pro Ala Asn Asp Asn Phe Thr Phe Val
325 330 335
Asp Asp Asn Ser Leu Arg Leu Ser Ser Ser Lys Ala Val Asn Gln Arg
340 345 350
Asp Ala Asp Leu Leu His Phe Trp Asp Lys Tyr Arg Lys Ala Pro Glu
355 360 365
Gly Ser Asp Arg Lys Ile Ala Ala Gln Lys Gln Phe Ser Glu Ala Met
370 375 380
Ser His Arg Met His Leu Asp Asn Ser Ile Gln Leu Ile Gly Lys Leu
385 390 395 400
Leu Phe Gly Ile Asp Thr Ala Ser Glu Val Leu Thr Thr Val Arg Pro
405 410 415
Ser Gly Gln Pro Leu Val Asp Asp Trp Leu Cys Leu Lys Lys Leu Val
420 425 430
Arg Thr Phe Glu Thr Tyr Cys Gly Ser Leu Ser Gln Tyr Gly Met Lys
435 440 445
His Met Arg Ser Ile Ala Asn Ile Cys Asn Ala Gly Ile Ser Glu Glu
450 455 460
Gln Met Ser Glu Ala Ser Ala Gln Ala Cys Val Thr Phe Pro Ser Asn
465 470 475 480
Pro Trp Ser Ser Val Asn Lys Gly Phe Thr Ala
485 490
<210> 7
<211> 486
<212> PRT
<213> Corchorus capsularis
<400> 7
Met Thr Arg Leu Val Ala Gly Val Ile Leu Leu Leu Leu Ser Val Thr
1 5 10 15
Gly Ile Val Ser Ala Gly Arg Asp Ala Thr Gly Asp Val Leu Arg Leu
20 25 30
Pro Ser Glu Ala Ser Arg Phe Phe Arg Pro Ser Asp Asp Asp Glu Val
35 40 45
Gly Thr Arg Trp Ala Val Leu Ile Ala Gly Ser Asn Gly Tyr Trp Asn
50 55 60
Tyr Arg His Gln Ala Asp Val Cys His Ala Tyr Gln Leu Leu Lys Lys
65 70 75 80
Gly Gly Leu Lys Asp Glu Asn Ile Ile Val Phe Met Tyr Asp Asp Ile
85 90 95
Ala Tyr Asn Tyr Glu Asn Pro Arg Gln Gly Ile Ile Ile Asn Ser Pro
100 105 110
His Gly Asp Asp Val Tyr Gln Gly Val Pro Lys Asp Tyr Thr Gly Glu
115 120 125
Glu Val Thr Val His Asn Phe Leu Ala Ala Ile Leu Gly Asn Lys Thr
130 135 140
Ala Ile Thr Gly Gly Ser Gly Lys Val Val Asp Ser Gly Pro Asn Asp
145 150 155 160
His Ile Phe Ile Tyr Tyr Thr Asp His Gly Gly Pro Gly Val Leu Gly
165 170 175
Met Pro Thr Tyr Pro Tyr Leu Tyr Ala Asp Glu Leu Ile Asp Thr Leu
180 185 190
Lys Lys Lys His Ala Ser Gly Thr Tyr Lys Ser Leu Val Phe Tyr Leu
195 200 205
Glu Ala Cys Glu Ser Gly Ser Ile Phe Glu Gly Leu Leu Pro Glu Gly
210 215 220
Leu Asn Ile Tyr Ala Thr Thr Ala Ser Asn Ala Asp Glu Ser Ser Trp
225 230 235 240
Gly Thr Tyr Cys Pro Gly Glu Tyr Pro Ser Pro Pro Pro Glu Tyr Glu
245 250 255
Thr Cys Leu Gly Asp Leu Tyr Ser Val Ala Trp Met Glu Asp Ser Asp
260 265 270
Leu His Asn Leu Arg Thr Glu Thr Leu His Gln Gln Tyr Glu Leu Val
275 280 285
Lys Arg Arg Thr Leu Asn Gly Asn Ser Ala Tyr Gly Ser His Val Met
290 295 300
Gln Tyr Gly Asp Val Gly Leu Ala Lys Glu His Leu Phe Leu Tyr Leu
305 310 315 320
Gly Thr Asn Pro Ala Asn Asp Asn Phe Thr Phe Ile Asp Glu Asn Ser
325 330 335
Leu Gln Pro Pro Ala Lys Ala Val Asn Gln Arg Asp Ala Asp Leu Val
340 345 350
His Phe Trp Asp Lys Tyr Arg Lys Ala Pro Asp Gly Ser Ala Arg Lys
355 360 365
Val Glu Ala Gln Lys Gln Val Val Glu Ala Met Ser His Arg Met His
370 375 380
Val Asp Asn Ser Ile Gln Leu Ile Gly Lys Leu Leu Phe Gly Ile Glu
385 390 395 400
Arg Gly Ala Asp Val Leu Lys Thr Val Arg Pro Ala Gly Gln Pro Leu
405 410 415
Val Asp Asp Trp Lys Cys Leu Lys Ser Met Val Arg Thr Phe Glu Thr
420 425 430
His Cys Gly Ser Leu Ala Gln Tyr Gly Met Lys His Met Arg Ser Ile
435 440 445
Ala Asn Ile Cys Asn Ala Gly Ile Gln Thr Glu Gln Ile Ala Glu Ala
450 455 460
Ser Ala Gln Ala Cys Val Ser Ile Pro Ser Gly Gln Trp Ser Ser Ile
465 470 475 480
Gln Lys Gly Phe Ser Ala
485
<210> 8
<211> 486
<212> PRT
<213> Corchorus olitorius
<400> 8
Met Thr Arg Leu Val Ala Gly Val Ile Leu Leu Leu Leu Ser Val Thr
1 5 10 15
Gly Ile Ala Ser Ala Gly Arg Asp Ala Thr Gly Asp Val Leu Arg Leu
20 25 30
Pro Ser Glu Ala Ser Arg Phe Phe Arg Pro Ser Asp Asp Asp Glu Val
35 40 45
Gly Thr Arg Trp Ala Val Leu Ile Ala Gly Ser Asn Gly Tyr Trp Asn
50 55 60
Tyr Arg His Gln Ala Asp Val Cys His Ala Tyr Gln Leu Leu Lys Lys
65 70 75 80
Gly Gly Leu Lys Asp Glu Asn Ile Ile Val Phe Met Tyr Asp Asp Ile
85 90 95
Ala Phe Asn Tyr Glu Asn Pro Arg Gln Gly Ile Ile Ile Asn Ser Pro
100 105 110
His Gly Asp Asp Val Tyr Gln Asp Val Pro Lys Asp Tyr Thr Gly Glu
115 120 125
Glu Val Thr Val His Asn Phe Leu Ala Ala Ile Leu Gly Asn Lys Thr
130 135 140
Ala Ile Lys Gly Gly Ser Gly Lys Val Val Asp Ser Gly Pro Asn Asp
145 150 155 160
His Ile Phe Ile Tyr Tyr Thr Asp His Gly Gly Pro Gly Val Leu Gly
165 170 175
Met Pro Thr Tyr Pro Tyr Leu Tyr Ala Asp Glu Leu Ile Asp Thr Leu
180 185 190
Lys Lys Lys His Ala Ser Gly Thr Tyr Lys Ser Leu Val Phe Tyr Leu
195 200 205
Glu Ala Cys Glu Ser Gly Ser Ile Phe Glu Gly Leu Leu Pro Glu Gly
210 215 220
Leu Asn Ile Tyr Ala Thr Thr Ala Ser Asn Ala Asp Glu Ser Ser Trp
225 230 235 240
Gly Thr Tyr Cys Pro Gly Glu Tyr Pro Ser Pro Pro Pro Glu Tyr Glu
245 250 255
Thr Cys Leu Gly Asp Leu Tyr Ser Val Ala Trp Met Glu Asp Ser Asp
260 265 270
Leu His Asn Leu Arg Thr Glu Thr Leu His Gln Gln Tyr Glu Leu Val
275 280 285
Lys Arg Arg Thr Leu Asn Gly Asn Ser Ala Tyr Gly Ser His Val Met
290 295 300
Gln Tyr Gly Asp Val Gly Leu Ala Lys Glu His Leu Phe Leu Tyr Leu
305 310 315 320
Gly Thr Asn Pro Ala Asn Asp Asn Phe Thr Phe Ile Asp Glu Asn Ser
325 330 335
Leu Gln Pro Pro Ala Lys Ala Val Asn Gln Arg Asp Ala Asp Leu Val
340 345 350
His Phe Trp Asp Lys Tyr Arg Lys Ala Pro Asp Gly Ser Val Arg Lys
355 360 365
Val Glu Ala Gln Lys Gln Val Val Glu Ala Met Ser His Arg Met His
370 375 380
Val Asp Asn Ser Ile Gln Leu Ile Gly Lys Leu Leu Phe Gly Ile Glu
385 390 395 400
Arg Gly Ala Asp Val Leu Lys Thr Val Arg Pro Ala Gly Gln Pro Leu
405 410 415
Val Asp Asp Trp Lys Cys Leu Lys Ser Met Val Arg Thr Phe Glu Thr
420 425 430
His Cys Gly Ser Leu Ala Gln Tyr Gly Met Lys His Met Arg Ser Ile
435 440 445
Ala Asn Ile Cys Asn Ala Gly Ile Gln Thr Glu Gln Met Ala Glu Ala
450 455 460
Ser Ser Gln Ala Cys Val Ser Ile Pro Ser Gly Gln Trp Ser Ser Ile
465 470 475 480
Gln Lys Gly Phe Ser Ala
485
<210> 9
<211> 493
<212> PRT
<213> Jatropha curcas
<400> 9
Met Thr Arg Leu Ala Thr Gly Val Ile Leu Leu Leu Leu Ala Leu Cys
1 5 10 15
Val Val Ser Ser Ala Gly Ser Arg Asp Ile Val Gly Asp Val Leu Arg
20 25 30
Leu Pro Ser Glu Ala Ser Arg Phe Phe Arg Pro Gly Gly Ala His Val
35 40 45
Ala Lys Glu Asp Asp Ser Thr Gly Thr Arg Trp Ala Ile Leu Ile Ala
50 55 60
Gly Ser Asn Gly Tyr Trp Asn Tyr Arg His Gln Ala Asp Val Cys His
65 70 75 80
Ala Tyr Gln Leu Leu Lys Lys Gly Gly Leu Lys Asp Glu Asn Ile Ile
85 90 95
Val Phe Met Tyr Asp Asp Ile Ala Phe Asn Lys Glu Asn Pro Arg Pro
100 105 110
Gly Val Ile Ile Asn Asn Pro Tyr Gly Glu Asp Val Tyr Lys Gly Val
115 120 125
Pro Lys Asp Tyr Thr Gly Glu Asp Val Asn Val Asn Asn Phe Phe Ala
130 135 140
Ala Ile Leu Gly Asn Lys Thr Ala Ile Thr Gly Gly Ser Gly Lys Val
145 150 155 160
Val Asp Ser Gly Pro Asn Asp His Ile Phe Ile Tyr Tyr Thr Asp His
165 170 175
Gly Gly Pro Gly Val Leu Gly Met Pro Thr Asn Pro Tyr Leu Tyr Ala
180 185 190
Asn Asp Leu Ile Asp Val Leu Ile Lys Lys His Ala Ser Gly Thr Tyr
195 200 205
Lys Ser Leu Val Phe Tyr Leu Glu Ala Cys Glu Ser Gly Ser Ile Phe
210 215 220
Glu Gly Leu Leu Pro Glu Gly Leu Asn Ile Tyr Ala Thr Thr Ala Ala
225 230 235 240
Asn Ala Glu Glu Ser Ser Trp Gly Thr Tyr Cys Pro Gly Glu Tyr Pro
245 250 255
Ser Pro Pro Pro Glu Tyr Glu Thr Cys Leu Gly Asp Leu Tyr Ser Val
260 265 270
Ala Trp Met Glu Asp Ser Asp Val His Asn Leu Gln Thr Glu Thr Leu
275 280 285
Arg Gln Gln Tyr Gln Leu Val Lys Arg Arg Thr Ala Asn Gly Asn Ser
290 295 300
Ala Tyr Gly Ser His Val Met Gln Tyr Gly Asp Val Gly Leu Ser Lys
305 310 315 320
Asp Asn Leu Phe Leu Tyr Met Gly Thr Asn Pro Ala Asn Glu Asn Tyr
325 330 335
Thr Phe Val Asp Glu Asn Ser Leu Arg Pro Pro Ser Lys Ala Val Asn
340 345 350
Gln Arg Asp Ala Asp Leu Val His Phe Trp Asp Lys Tyr Arg Lys Ala
355 360 365
Pro Asp Gly Ser Thr Arg Lys Ile Gln Ala Gln Lys Gln Phe Val Glu
370 375 380
Ala Met Ser His Arg Met His Leu Asp His Ser Met Lys Leu Ile Gly
385 390 395 400
Lys Leu Leu Phe Gly Ile Gly Lys Gly Ser Glu Val Leu Asn Ala Ile
405 410 415
Arg Pro Ala Gly Gln Pro Leu Val Asp Asp Trp Val Cys Leu Lys Thr
420 425 430
Leu Val Arg Thr Phe Glu Thr His Cys Gly Ser Leu Ser Gln Tyr Gly
435 440 445
Met Lys His Met Arg Ser Leu Ala Asn Leu Cys Asn Ala Gly Ile Arg
450 455 460
Glu Asp Gln Met Ala Glu Ala Ser Ala Gln Ala Cys Val Ser Ile Pro
465 470 475 480
Ser Gly Pro Trp Ser Ser Leu His Lys Gly Phe Ser Ala
485 490
<210> 10
<211> 494
<212> PRT
<213> Malus hupehensis
<400> 10
Met Thr Arg Leu Ala Ser Ala Val Val Leu Leu Phe Leu Ala Ser Val
1 5 10 15
Leu Ala Ser Ala Ala Gly Ser Arg Asp Leu Ile Gly Asp Val Leu Arg
20 25 30
Leu Pro Ser Glu Ala Ser Arg Phe Phe Gly Arg Gly Asp Asp Ala Pro
35 40 45
Asp Gln Gln Asp Asp Gly Thr Val Gly Thr Arg Trp Ala Val Leu Ile
50 55 60
Ala Gly Ser Asn Gly Tyr Trp Asn Tyr Arg His Gln Ala Asp Ile Cys
65 70 75 80
His Ala Tyr Gln Leu Leu Lys Lys Gly Gly Leu Lys Asp Glu Asn Ile
85 90 95
Val Val Phe Met Tyr Asp Asp Ile Ala Tyr Asn Glu Glu Asn Pro Arg
100 105 110
Gln Gly Val Ile Ile Asn Ser Pro His Gly Ser Asp Val Tyr Glu Gly
115 120 125
Val Pro Lys Asp Tyr Thr Gly Glu Asp Val Thr Val Asn Asn Phe Phe
130 135 140
Ala Ala Ile Leu Gly Asn Lys Thr Ala Leu Thr Gly Gly Ser Gly Lys
145 150 155 160
Val Val Asp Ser Gly Pro Asn Asp His Ile Phe Ile Tyr Tyr Thr Asp
165 170 175
His Gly Gly Pro Gly Ile Leu Gly Met Pro Thr Ser Pro Tyr Ile Tyr
180 185 190
Ala Asn Asp Leu Ile Glu Val Leu Lys Lys Lys His Ala Ala Gly Thr
195 200 205
Tyr Arg Ser Leu Val Phe Tyr Leu Glu Ala Cys Glu Ser Gly Ser Ile
210 215 220
Phe Glu Gly Leu Leu Pro Glu Gly Leu Asn Ile Phe Ala Thr Thr Ala
225 230 235 240
Ser Asn Ala Glu Glu Ser Ser Trp Gly Thr Tyr Cys Pro Gly Glu Tyr
245 250 255
Pro Ser Pro Pro Pro Glu Tyr Asp Thr Cys Leu Gly Asp Leu Tyr Ser
260 265 270
Val Ala Trp Met Glu Asp Ser Asp Val His Asn Leu Arg Ser Glu Thr
275 280 285
Leu His Gln Gln Tyr Glu Leu Val Lys Thr Arg Ala Ala Asn Asp Asn
290 295 300
Ser Gly Ser Gly Ser His Val Met Gln Tyr Gly Asp Val Gly Leu Ser
305 310 315 320
Lys Asn Asn Leu Phe Val Tyr Met Gly Thr Asn Pro Ala Asn Asp Asn
325 330 335
Tyr Thr Phe Leu Gly Glu Asn Ser Leu Arg Pro Ser Ser Lys Ala Val
340 345 350
Asn Gln Arg Asp Ala Asp Leu Leu His Phe Trp His Lys Tyr Arg Lys
355 360 365
Ala Pro Glu Gly Ser Ala Arg Lys Ile Gln Ala Gln Lys Asp Phe Val
370 375 380
Glu Ala Met Ser His Arg Met His Ile Asp Gln Thr Met Lys Leu Ile
385 390 395 400
Gly Lys Leu Leu Phe Gly Ile Glu Lys Gly Pro Gln Val Leu Asn Ala
405 410 415
Val Arg Pro Ala Gly Gln Pro Leu Val Asp Asp Trp Asp Cys Leu Lys
420 425 430
Thr Met Val Arg Ser Phe Glu Thr His Cys Gly Ser Leu Ser Gln Tyr
435 440 445
Gly Met Lys His Met Arg Ser Leu Ala Asn Ile Cys Asn Ala Gly Met
450 455 460
Thr Gln Glu Gln Met Ala Glu Ala Ser Ala Gln Ala Cys Val Ser Ala
465 470 475 480
Pro Ser Gly Arg Trp Ser Ser Leu His Arg Gly Phe Ser Ala
485 490
<210> 11
<211> 494
<212> PRT
<213> Pyrus x bretschneideri
<400> 11
Met Thr Arg Phe Ala Gly Ala Val Val Leu Leu Phe Leu Ala Ser Val
1 5 10 15
Leu Ala Ser Ala Ala Gly Ser Arg Asp Leu Ile Gly Asp Val Leu Arg
20 25 30
Leu Pro Ser Glu Ala Ser Arg Phe Phe Gly Arg Gly Asp Asp Ala Pro
35 40 45
Asp Gln Gln Asp Asp Gly Thr Val Gly Thr Arg Trp Ala Val Leu Ile
50 55 60
Ala Gly Ser Asn Gly Tyr Trp Asn Tyr Arg His Gln Ala Asp Ile Cys
65 70 75 80
His Ala Tyr Gln Leu Leu Lys Lys Gly Gly Leu Lys Asp Glu Asn Ile
85 90 95
Val Val Phe Met Tyr Asp Asp Ile Ala Tyr Asn Glu Glu Asn Pro Arg
100 105 110
Gln Gly Val Ile Ile Asn Asn Pro Gln Gly Ser Asp Val Tyr Glu Gly
115 120 125
Val Pro Lys Asp Tyr Thr Gly Glu Asp Val Thr Val Asn Asn Phe Phe
130 135 140
Ala Ala Ile Leu Gly Asn Lys Thr Ala Leu Thr Gly Gly Ser Gly Lys
145 150 155 160
Val Val Asp Ser Gly Pro Asn Asp His Ile Phe Ile Tyr Tyr Thr Asp
165 170 175
His Gly Gly Pro Gly Val Leu Gly Met Pro Thr Ser Pro Tyr Ile Tyr
180 185 190
Ala Asn Asp Leu Ile Glu Val Leu Lys Lys Lys His Ala Ala Gly Thr
195 200 205
Tyr Lys Ser Leu Val Phe Tyr Leu Glu Ala Cys Glu Ser Gly Ser Ile
210 215 220
Phe Glu Gly Leu Leu Pro Glu Gly Leu Asn Ile Phe Ala Thr Thr Ala
225 230 235 240
Ser Asn Ala Glu Glu Ser Ser Trp Gly Thr Tyr Cys Pro Gly Glu Tyr
245 250 255
Pro Ser Pro Pro Pro Glu Tyr Glu Thr Cys Leu Gly Asp Leu Tyr Ser
260 265 270
Val Ala Trp Met Glu Asp Ser Asp Ile His Asn Leu Arg Ser Glu Thr
275 280 285
Leu His Gln Gln Tyr Glu Leu Val Lys Thr Arg Thr Ala Asn Asp Asn
290 295 300
Tyr Gly Phe Gly Ser His Val Met Gln Tyr Gly Asp Val Gly Leu Ser
305 310 315 320
Lys Asn Asn Leu Phe Val Tyr Met Gly Thr Asn Pro Ala Asn Asp Asn
325 330 335
Tyr Thr Phe Leu Gly Glu Asn Ser Leu Arg Pro Ser Ser Lys Ala Val
340 345 350
Asn Gln Arg Asp Ala Asp Leu Leu His Phe Trp His Lys Tyr Arg Lys
355 360 365
Ala Pro Glu Gly Ser Ala Arg Lys Val Gln Ala Gln Lys Asp Phe Val
370 375 380
Glu Ala Met Ser His Arg Met His Ile Asp Gln Thr Met Lys Leu Ile
385 390 395 400
Gly Lys Leu Leu Phe Gly Ile Glu Lys Gly Pro Gln Val Leu Asn Ala
405 410 415
Val Arg Pro Ala Gly Gln Pro Leu Val Asp Asp Trp Asp Cys Leu Lys
420 425 430
Thr Met Val Arg Ser Phe Glu Thr His Cys Gly Ser Leu Ser Gln Tyr
435 440 445
Gly Met Lys His Met Arg Ser Leu Ala Asn Ile Cys Asn Ala Gly Met
450 455 460
Thr Gln Glu Gln Met Ala Glu Ala Ser Ala Gln Ala Cys Val Ser Ala
465 470 475 480
Pro Ser Ser Arg Trp Ser Ser Leu His Arg Gly Phe Ser Ala
485 490
<210> 12
<211> 537
<212> PRT
<213> artificial sequence
<220>
<223> artificial sequence
<400> 12
Met Gly Met Ala His His His His His His Met Gln Ile Phe Val Lys
1 5 10 15
Thr Leu Thr Gly Lys Thr Ile Thr Leu Glu Val Glu Pro Ser Asp Thr
20 25 30
Ile Glu Asn Val Lys Ala Lys Ile Gln Asp Lys Glu Gly Ile Pro Pro
35 40 45
Asp Gln Gln Arg Leu Ile Phe Ala Gly Lys Gln Leu Glu Asp Gly Arg
50 55 60
Thr Leu Ser Asp Tyr Asn Ile Gln Lys Glu Ser Thr Leu His Leu Val
65 70 75 80
Leu Arg Leu Arg Gly Gly Ala Arg Asp Gly Asp Tyr Leu His Leu Pro
85 90 95
Ser Glu Val Ser Arg Phe Phe Arg Pro Gln Glu Thr Asn Asp Asp His
100 105 110
Gly Glu Asp Ser Val Gly Thr Arg Trp Ala Val Leu Ile Ala Gly Ser
115 120 125
Lys Gly Tyr Ala Asn Tyr Arg His Gln Ala Gly Val Cys His Ala Tyr
130 135 140
Gln Ile Leu Lys Arg Gly Gly Leu Lys Asp Glu Asn Ile Val Val Phe
145 150 155 160
Met Tyr Asp Asp Ile Ala Tyr Asn Glu Ser Asn Pro Arg Pro Gly Val
165 170 175
Ile Ile Asn Ser Pro His Gly Ser Asp Val Tyr Ala Gly Val Pro Lys
180 185 190
Asp Tyr Thr Gly Glu Glu Val Asn Ala Lys Asn Phe Leu Ala Ala Ile
195 200 205
Leu Gly Asn Lys Ser Ala Ile Thr Gly Gly Ser Gly Lys Val Val Asp
210 215 220
Ser Gly Pro Asn Asp His Ile Phe Ile Tyr Tyr Thr Asp His Gly Ala
225 230 235 240
Ala Gly Val Ile Gly Met Pro Ser Lys Pro Tyr Leu Tyr Ala Asp Glu
245 250 255
Leu Asn Asp Ala Leu Lys Lys Lys His Ala Ser Gly Thr Tyr Lys Ser
260 265 270
Leu Val Phe Tyr Leu Glu Ala Cys Glu Ser Gly Ser Met Phe Glu Gly
275 280 285
Ile Leu Pro Glu Asp Leu Asn Ile Tyr Ala Leu Thr Ser Thr Asn Thr
290 295 300
Thr Glu Ser Ser Trp Cys Tyr Tyr Cys Pro Ala Gln Glu Asn Pro Pro
305 310 315 320
Pro Pro Glu Tyr Asn Val Cys Leu Gly Asp Leu Phe Ser Val Ala Trp
325 330 335
Leu Glu Asp Ser Asp Val Gln Asn Ser Trp Tyr Glu Thr Leu Asn Gln
340 345 350
Gln Tyr His His Val Asp Lys Arg Ile Ser His Ala Ser His Ala Thr
355 360 365
Gln Tyr Gly Asn Leu Lys Leu Gly Glu Glu Gly Leu Phe Val Tyr Met
370 375 380
Gly Ser Asn Pro Ala Asn Asp Asn Tyr Thr Ser Leu Asp Gly Asn Ala
385 390 395 400
Leu Thr Pro Ser Ser Ile Val Val Asn Gln Arg Asp Ala Asp Leu Leu
405 410 415
His Leu Trp Glu Lys Phe Arg Lys Ala Pro Glu Gly Ser Ala Arg Lys
420 425 430
Glu Glu Ala Gln Thr Gln Ile Phe Lys Ala Met Ser His Arg Val His
435 440 445
Ile Asp Ser Ser Ile Lys Leu Ile Gly Lys Leu Leu Phe Gly Ile Glu
450 455 460
Lys Cys Thr Glu Ile Leu Asn Ala Val Arg Pro Ala Gly Gln Pro Leu
465 470 475 480
Val Asp Asp Trp Ala Cys Leu Arg Ser Leu Val Gly Thr Phe Glu Thr
485 490 495
His Cys Gly Ser Leu Ser Glu Tyr Gly Met Arg His Thr Arg Thr Ile
500 505 510
Ala Asn Ile Cys Asn Ala Gly Ile Ser Glu Glu Gln Met Ala Glu Ala
515 520 525
Ala Ser Gln Ala Cys Ala Ser Ile Pro
530 535
<210> 13
<211> 10
<212> PRT
<213> artificial sequence
<220>
<223> artificial sequence
<400> 13
Met Gly Met Ala His His His His His His
1 5 10
<210> 14
<211> 76
<212> PRT
<213> artificial sequence
<220>
<223> artificial sequence
<400> 14
Met Gln Ile Phe Val Lys Thr Leu Thr Gly Lys Thr Ile Thr Leu Glu
1 5 10 15
Val Glu Pro Ser Asp Thr Ile Glu Asn Val Lys Ala Lys Ile Gln Asp
20 25 30
Lys Glu Gly Ile Pro Pro Asp Gln Gln Arg Leu Ile Phe Ala Gly Lys
35 40 45
Gln Leu Glu Asp Gly Arg Thr Leu Ser Asp Tyr Asn Ile Gln Lys Glu
50 55 60
Ser Thr Leu His Leu Val Leu Arg Leu Arg Gly Gly
65 70 75
<210> 15
<211> 450
<212> PRT
<213> Ovaloparmena affinis
<400> 15
Ala Arg Gly Asp Tyr Leu His Leu Pro Ser Glu Val Ser Arg Phe Phe
1 5 10 15
Arg Pro Gln Glu Thr Asn Asp Asp His Gly Glu Asp Ser Val Gly Thr
20 25 30
Arg Trp Ala Val Leu Ile Ala Gly Ser Lys Gly Tyr Ala Asn Tyr Arg
35 40 45
His Gln Ala Gly Val Cys His Ala Tyr Gln Ile Leu Lys Arg Gly Gly
50 55 60
Leu Lys Asp Glu Asn Ile Val Val Phe Met Tyr Asp Asp Ile Ala Tyr
65 70 75 80
Asn Glu Ser Asn Pro Arg Pro Gly Val Ile Ile Asn Ser Pro His Gly
85 90 95
Ser Asp Val Tyr Ala Gly Val Pro Lys Asp Tyr Thr Gly Glu Glu Val
100 105 110
Asn Ala Lys Asn Phe Leu Ala Ala Ile Leu Gly Asn Lys Ser Ala Ile
115 120 125
Thr Gly Gly Ser Gly Lys Val Val Asp Ser Gly Pro Asn Asp His Ile
130 135 140
Phe Ile Tyr Tyr Thr Asp His Gly Ala Ala Gly Val Ile Gly Met Pro
145 150 155 160
Ser Lys Pro Tyr Leu Tyr Ala Asp Glu Leu Asn Asp Ala Leu Lys Lys
165 170 175
Lys His Ala Ser Gly Thr Tyr Lys Ser Leu Val Phe Tyr Leu Glu Ala
180 185 190
Cys Glu Ser Gly Ser Met Phe Glu Gly Ile Leu Pro Glu Asp Leu Asn
195 200 205
Ile Tyr Ala Leu Thr Ser Thr Asn Thr Thr Glu Ser Ser Trp Cys Tyr
210 215 220
Tyr Cys Pro Ala Gln Glu Asn Pro Pro Pro Pro Glu Tyr Asn Val Cys
225 230 235 240
Leu Gly Asp Leu Phe Ser Val Ala Trp Leu Glu Asp Ser Asp Val Gln
245 250 255
Asn Ser Trp Tyr Glu Thr Leu Asn Gln Gln Tyr His His Val Asp Lys
260 265 270
Arg Ile Ser His Ala Ser His Ala Thr Gln Tyr Gly Asn Leu Lys Leu
275 280 285
Gly Glu Glu Gly Leu Phe Val Tyr Met Gly Ser Asn Pro Ala Asn Asp
290 295 300
Asn Tyr Thr Ser Leu Asp Gly Asn Ala Leu Thr Pro Ser Ser Ile Val
305 310 315 320
Val Asn Gln Arg Asp Ala Asp Leu Leu His Leu Trp Glu Lys Phe Arg
325 330 335
Lys Ala Pro Glu Gly Ser Ala Arg Lys Glu Glu Ala Gln Thr Gln Ile
340 345 350
Phe Lys Ala Met Ser His Arg Val His Ile Asp Ser Ser Ile Lys Leu
355 360 365
Ile Gly Lys Leu Leu Phe Gly Ile Glu Lys Cys Thr Glu Ile Leu Asn
370 375 380
Ala Val Arg Pro Ala Gly Gln Pro Leu Val Asp Asp Trp Ala Cys Leu
385 390 395 400
Arg Ser Leu Val Gly Thr Phe Glu Thr His Cys Gly Ser Leu Ser Glu
405 410 415
Tyr Gly Met Arg His Thr Arg Thr Ile Ala Asn Ile Cys Asn Ala Gly
420 425 430
Ile Ser Glu Glu Gln Met Ala Glu Ala Ala Ser Gln Ala Cys Ala Ser
435 440 445
Ile Pro
450
<210> 16
<211> 38
<212> DNA
<213> artificial sequence
<220>
<223> primer used for mutagenesis
<400> 16
caccaccgaa agcagctggg cctactattg cccggcgc 38
<210> 17
<211> 14
<212> PRT
<213> artificial sequence
<220>
<223> Peptide template used for characterizing recognition sequence
specificity of Quicklase
<220>
<221> MISC_FEATURE
<222> (1)..(1)
<223> Xaa is any amino acid. In each screen, only one of the residueis
modified. The default amino acid at Xaa1 position is Gly, at Xaa2
position is Leu, and at Xaa3 position is Gly, and at the Xaa4
position is Leu, in this screen.
<220>
<221> MISC_FEATURE
<222> (2)..(2)
<223> Xaa is any amino acid. In each screen, only one of the residueis
modified. The default amino acid at Xaa1 position is Gly, at Xaa2
position is Leu, and at Xaa3 position is Gly, and at the Xaa4
position is Leu, in this screen.
<220>
<221> MISC_FEATURE
<222> (13)..(13)
<223> Xaa is any amino acid. In each screen, only one of the residueis
modified. The default amino acid at Xaa1 position is Gly, at Xaa2
position is Leu, and at Xaa3 position is Gly, and at the Xaa4
position is Leu, in this screen.
<220>
<221> MISC_FEATURE
<222> (14)..(14)
<223> Xaa is any amino acid. In each screen, only one of the residueis
modified. The default amino acid at Xaa1 position is Gly, at Xaa2
position is Leu, and at Xaa3 position is Gly, and at the Xaa4
position is Leu, in this screen.
<400> 17
Xaa Xaa Tyr Arg Arg Gly Arg Leu Tyr Arg Arg Asn Xaa Xaa
1 5 10

Claims (31)

1.形成式(I)的肽的方法:
P1-Asn-Xaa1-Leu-P2(I),
通过连接式(II)的第一肽
P1-Asn-Xaa3-Xaa4-COOH/CONH2(II)
至式(III)的第二肽
H2N-Xaa1-Leu-P2(III),
其中,P1和P2各自独立地为任意修饰或未修饰的肽;Xaa1为任意天然存在的氨基酸;以及(i)Xaa3是任意天然存在的氨基酸,Xaa4为Leu;或者(ii)Xaa3为Gly,Xaa4为Leu、Ile、Pro或Phe,
通过酶促裂解所述式(II)的第一肽中“Asn”和“Xaa3”之间的键,并通过所述第一肽的C端将其片段P1-Asn连接至所述式(III)的第二肽的N端以形成式(I)的连接肽,其中,酶促裂解和连接反应由肽连接酶在适于所述裂解和连接反应的条件下催化,所述肽连接酶由以下组成:
(a)SEQ ID NO:1所示的氨基酸序列;或
(b)(a)的一个功能片段,前提为所述功能片段包括对应于SEQ ID NO:1中残基53-347所示的氨基酸序列,所述功能片段具有肽连接酶活性。
2.如权利要求1所述的方法,其中,
(i)Xaa3选自His、Ala、Ser、Cys、Asn、Gly、Arg、Met、Lys、Gln、Leu和Glu组成的组,Xaa4为Leu;或者
(ii)Xaa3为Gly,Xaa4为Leu、Ile或Pro。
3.如权利要求1所述的方法,其中,
(i)Xaa3为His、Ser、Cys、Gly或Ala,Xaa4为Leu;或者
(ii)Xaa3为Gly,Xaa4为Leu或Ile。
4.如权利要求1所述的方法,其中,Xaa1为Arg或Gly,
(i)Xaa3为His、Ala或Gly,Xaa4为Leu;或者(ii)Xaa3为Gly,Xaa4为Leu。
5.如权利要求1所述的方法,其中,所述第一肽和所述第二肽是相同肽的末端,P1和P2结合形成单个肽序列,以使所述方法环化所述肽。
6.如权利要求1所述的方法,其中,所述肽连接酶由以下组成:
SEQ ID NO:1所示的氨基酸序列。
7.如权利要求1所述的方法,其中,所述第一肽和/或所述第二肽还包括标签部分。
8.如权利要求7所述的方法,其中,所述标签部分为亲和标签或可检测标签。
9.如权利要求1所述的方法,其中,所述第一肽和/或所述第二肽与固体载体材料连接。
10.如权利要求1所述的方法,其中,所述第一肽和/或所述第二肽为细胞表面蛋白质,以使所述方法引起所述细胞表面蛋白质的修饰或标记。
11.如权利要求1所述的方法,其中所述肽连接酶来源于Oldenlandia affinis
12.如权利要求1所述的方法,其中所述功能片段由对应于SEQ ID NO:1中残基53-347所示的氨基酸序列组成,所述功能片段具有肽连接酶活性。
13.一种或多种目标肽的多聚体的制备方法,所述方法包括以下步骤:
(a)提供具有C端Asn-Xaa3-Xaa4-COOH/CONH2残基的一种或多种目标肽以及具有N端H2N-Xaa1-Leu残基两个或两个以上拷贝的骨架分子,或者,提供具有N端H2N-Xaa1-Leu残基的一种或多种目标肽以及具有C端Asn-Xaa3-Xaa4-COOH/CONH2残基两个或两个以上拷贝的骨架分子,其中,Xaa1为任意天然存在的氨基酸;以及(i)Xaa3是任意天然存在的氨基酸,Xaa4为Leu;或者(ii)Xaa3为Gly,Xaa4为Leu、Ile、Pro或Phe;
(b)提供肽连接酶;
(c)制备所述一种或多种目标肽、所述骨架分子和所述肽连接酶的混合物;
(d)使所述混合物处于所述肽连接酶能催化所述一种或多种目标肽与所述骨架分子连接的条件中;
其中所述肽连接酶包含或由以下组成:
(i)SEQ ID NO:1所示的氨基酸序列;或
(ii)(i)的一个功能片段,前提为所述功能片段包括对应于SEQ ID NO:1中残基53-347所示的氨基酸序列,所述功能片段具有肽连接酶活性。
14.如权利要求13所述的方法,其中,
(i)Xaa3选自His、Ala、Ser、Cys、Asn、Gly、Arg、Met、Lys、Gln、Leu和Glu组成的组,Xaa4为Leu;或者
(ii)Xaa3为Gly,Xaa4选自Leu、Ile和Pro组成的组。
15.如权利要求13所述的方法,其中,
(i)Xaa3为His、Ser、Cys、Gly或Ala,Xaa4为Leu;或者
(ii)Xaa3为Gly,Xaa4为Leu或Ile。
16.如权利要求13所述的方法,其中,Xaa1为Arg或Gly,
(i)Xaa3为His、Ala或Gly,Xaa4为Leu;或者(ii)Xaa3为Gly,Xaa4为Leu。
17.如权利要求13所述的方法,其中,所述肽连接酶由以下组成:
SEQ ID NO:1所示的氨基酸序列。
18.一种通过一种或多种目标肽修饰或标记靶细胞表面的方法,所述方法包括以下步骤:
(a)提供具有C端Asn-Xaa3-Xaa4-COOH/CONH2残基和/或N端H2N-Xaa1-Leu残基的一种或多种目标肽,其中,Xaa1为任意天然存在的氨基酸;以及(i)Xaa3是任意天然存在的氨基酸,Xaa4为Leu;或者(ii)Xaa3为Gly,Xaa4为Leu、Ile、Pro或Phe;
(b)提供肽连接酶;
(c)使靶细胞与所述一种或多种目标肽和所述肽连接酶接触,其中所述靶细胞包括:
当所述一种或多种目标肽具有N端H2N-Xaa1-Leu残基时,所述靶细胞的细胞表面蛋白具有C端Asn-Xaa3-Xaa4-COOH/CONH2残基;和/或
当所述一种或多种目标肽具有C端Asn-Xaa3-Xaa4-COOH/CONH2残基时,所述靶细胞的细胞表面蛋白具有N端H2N-Xaa1-Leu残基,
其中,Xaa1为任意天然存在的氨基酸;以及(i)Xaa3是任意天然存在的氨基酸,Xaa4为Leu;或者(ii)Xaa3为Gly,Xaa4为Leu、Ile、Pro或Phe;
(d)使所述靶细胞处于所述肽连接酶能催化所述一种或多种目标肽与所述靶细胞的细胞表面蛋白质连接的条件中,
其中所述肽连接酶由以下组成:
(i)SEQ ID NO:1所示的氨基酸序列;或
(ii)(i)的一个功能片段,前提为所述功能片段包括对应于SEQ ID NO:1中残基53-347所示的氨基酸序列,所述功能片段具有肽连接酶活性。
19.如权利要求18所述的方法,其中,
(i)Xaa3选自His、Ala、Ser、Cys、Asn、Gly、Arg、Met、Lys、Gln、Leu和Glu组成的组,Xaa4为Leu或者
(ii)Xaa3为Gly,Xaa4为Leu、Ile或Pro。
20.如权利要求18所述的方法,其中,
(i)Xaa3为His、Ser、Cys、Gly或Ala,Xaa4为Leu;或者
(ii)Xaa3为Gly,Xaa4为Leu或Ile。
21.如权利要求18所述的方法,其中,Xaa1为Arg或Gly,
(i)Xaa3为His、Ala或Gly,Xaa4为Leu;或者(ii)Xaa3为Gly,Xaa4为Leu。
22.如权利要求18所述的方法,其中,所述肽连接酶由以下组成:
SEQ ID NO:1所示的氨基酸序列。
23.如权利要求18所述的方法,其中,所述方法还包括在步骤(d)之后从所述靶细胞中去除未连接的所述一种或多种目标肽。
24.如权利要求18所述的方法,其中,所述一种或多种目标肽包括标签部分。
25.如权利要求24所述的方法,其中,所述标签部分为亲和标签或可检测标签。
26.如权利要求18所述的方法,其中,所述一种或多种目标肽与固体载体材料连接。
27.如权利要求18所述的方法,其中,所述靶细胞重组表达具有N端H2N-Xaa1-Leu残基或C端Asn-Xaa3-Xaa4-COOH/CONH2残基的所述细胞表面蛋白,以便用所述一种或多种目标肽标记。
28.肽连接酶,由以下组成:
(a)SEQ ID NO:1所示的氨基酸序列;或
(b)(a)的一个功能片段,前提为所述功能片段包括对应于SEQ ID NO:1中残基53-347所示的氨基酸序列,所述功能片段具有肽连接酶活性。
29.如权利要求28所述的肽连接酶,其中,所述肽连接酶由以下组成:
SEQ ID NO:1所示的氨基酸序列。
30.用于权利要求1-27任一项所述方法的试剂盒,其中,所述试剂盒包含根据权利要求28或29所述的肽连接酶。
31.根据权利要求28或29所述的肽连接酶在连接第一肽和第二肽中的应用,其中
所述第一肽如式(II)所示,
P1-Asn-Xaa3-Xaa4-COOH/CONH2(II)
所述第二肽如式(III)所示,
H2N-Xaa1-Leu-P2(III),
其中,P1和P2各自独立地为任意修饰或未修饰的肽;Xaa1为任意天然存在的氨基酸;以及(i)Xaa3是任意天然存在的氨基酸,Xaa4为Leu;或(ii)Xaa3为Gly,Xaa4为Leu、Ile、Pro或Phe。
CN201780058821.2A 2016-09-23 2017-09-12 酶促肽连接的方法 Active CN109790205B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
SG10201607951V 2016-09-23
SG10201607951V 2016-09-23
PCT/SG2017/050458 WO2018056899A1 (en) 2016-09-23 2017-09-12 Methods for enzymatic peptide ligation

Publications (2)

Publication Number Publication Date
CN109790205A CN109790205A (zh) 2019-05-21
CN109790205B true CN109790205B (zh) 2024-01-16

Family

ID=61689245

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780058821.2A Active CN109790205B (zh) 2016-09-23 2017-09-12 酶促肽连接的方法

Country Status (5)

Country Link
US (3) US11795488B2 (zh)
EP (1) EP3515931B1 (zh)
CN (1) CN109790205B (zh)
SG (1) SG10201913521TA (zh)
WO (1) WO2018056899A1 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111117977B (zh) * 2020-01-06 2021-09-10 广州英赞生物科技有限公司 一种重组多肽连接酶原及其制备、激活方法与应用
CN111951884B (zh) * 2020-07-10 2022-03-22 中南大学 蛋白质小分子结合口袋上关键柔性氨基酸的识别方法
US20240117402A1 (en) * 2021-02-10 2024-04-11 Nanyang Technological University Methods for (poly) peptide tandem ligation and cyclization
WO2023191726A1 (en) * 2022-03-31 2023-10-05 Nanyang Technological University Improving the efficiency of pal-catalyzed protein ligation by a cascade enzymatic scheme

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103044521A (zh) * 2012-12-26 2013-04-17 亚飞(上海)生物医药科技有限公司 天冬氨酸酶靶向激活的阿霉素衍生物、其制备方法和用途
WO2015163818A1 (en) * 2014-04-24 2015-10-29 Nanyang Technological University Asx-specific protein ligase

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6855871B2 (en) * 2000-08-21 2005-02-15 Pioneer Hi-Bred International, Inc. Methods of increasing polypeptide accumulation in plants
US9796764B2 (en) * 2011-03-23 2017-10-24 The University Of Queensland Cyclotide genes in the fabaceae plant family
JP2019500879A (ja) 2015-09-25 2019-01-17 ヘキシマ リミテッド ペプチドの生成
WO2017054044A1 (en) 2015-09-30 2017-04-06 Hexima Limited A method

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103044521A (zh) * 2012-12-26 2013-04-17 亚飞(上海)生物医药科技有限公司 天冬氨酸酶靶向激活的阿霉素衍生物、其制备方法和用途
WO2015163818A1 (en) * 2014-04-24 2015-10-29 Nanyang Technological University Asx-specific protein ligase

Non-Patent Citations (8)

* Cited by examiner, † Cited by third party
Title
An Asparaginyl Endopeptidase Mediates in Vivo Protein Backbone Cyclization;Ivana Saska等;《The Journal of Biological Chemistry》;20071005;第282卷(第40期);摘要,结果,图1-3 *
Butelase 1 is an Asx-specific ligase enabling peptide macrocyclization and synthesis;Giang K T Nguyen等;《Nature Chemical Biology》;20140930;第10卷(第9期);结果,图2-5 *
Circular proteins and mechanisms of cyclization;Brendon F Conlan等;《Biopolymers》;20100526;第94卷(第5期);第573-583页 *
Efficient backbone cyclization of linear peptides by a recombinant asparaginyl endopeptidase;Karen S. Harris等;《nature communications》;20151218(第6期);第1-10页,特别是结果、图3 *
Karen S. Harris等.Efficient backbone cyclization of linear peptides by a recombinant asparaginyl endopeptidase.《nature communications》.2015,(第6期), *
Peptide macrocyclization by a bifunctional endoprotease;Kalia Bernath-Levin等;《Chemistry & Biology》;20150521;第22卷(第5期);第571-582页,特别是"讨论" *
植物半胱氨酸蛋白酶研究进展;闫龙凤等;《草业学报》;20051031;第14卷(第5期);第11-19页 *
生物正交标记反应研究进展;杨麦云等;《化学学报》;20150815;第73卷(第8期);第783-792页 *

Also Published As

Publication number Publication date
EP3515931C0 (en) 2024-05-01
EP3515931B1 (en) 2024-05-01
US20190218586A1 (en) 2019-07-18
EP3515931A4 (en) 2020-04-22
US11795488B2 (en) 2023-10-24
CN109790205A (zh) 2019-05-21
US20240263210A1 (en) 2024-08-08
WO2018056899A1 (en) 2018-03-29
SG10201913521TA (en) 2020-03-30
US20230128192A1 (en) 2023-04-27
EP3515931A1 (en) 2019-07-31

Similar Documents

Publication Publication Date Title
US10527609B2 (en) Peptide tag systems that spontaneously form an irreversible link to protein partners via isopeptide bonds
CN108026148B (zh) 融合蛋白合成的方法和产品
CN109790205B (zh) 酶促肽连接的方法
JP7290305B2 (ja) 例外的なスプライシング活性を有するスプリットインテイン
CA2971402C (en) Microbial transglutaminases, substrates therefor and methods for the use thereof
CN110177811B (zh) 用于蛋白质连接的方法及其用途
WO2015042393A9 (en) Evolved sortases and uses thereof
Steinhagen et al. Large scale modification of biomolecules using immobilized sortase A from Staphylococcus aureus
DK2688905T3 (en) Peptides which are capable of forming a covalent complex and uses thereof
Austin et al. The substrate specificity of Metarhizium anisopliae and Bos taurus carboxypeptidases A: Insights into their use as tools for the removal of affinity tags
WO2000040707A1 (en) Modified forms of hepatitis c virus ns3 protease
WO2014187960A1 (en) Removal of n-terminal extensions from fusion proteins
US20200291444A1 (en) Macrocyclisation Tags
EP3080255A1 (en) Atypical inteins
WO2023048262A1 (ja) 酵素を用いたペプチドライゲーション
Bowersox Isopeptide Ligations Catalyzed by Streptococcus Suis Sortase A
WO2017174760A1 (en) Novel multiply backbone n-methyl transferases and uses thereof
WO2024218401A1 (en) Poly-glutamate specific proteases
US20060009623A1 (en) C-terminal attachment of ligands to proteins for immobilization onto a support
JP2004509973A (ja) ペプチドおよびタンパク質の選択的修飾方法
Zhang et al. A Dual Cleavage System for Protein Purification Based on Small Ubiquitin-Like Modifier and a Split Intein

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information

Inventor after: Wu Bin

Inventor after: Yang Renliang

Inventor after: Huang Yihua

Inventor after: Julian Lesca

Inventor after: Liu Chuanfa

Inventor after: Tan Bingjun

Inventor after: Keane Trutz Jiang Ruan

Inventor after: Long Ziqi

Inventor before: Wu Bin

Inventor before: Yang Renliang

Inventor before: Huang Yihua

Inventor before: Julian Lesca

Inventor before: Liu Chuanfa

Inventor before: Tan Bingjun

Inventor before: Keane Trutz Jiang Ruan

Inventor before: Long Ziqi

CB03 Change of inventor or designer information
GR01 Patent grant
GR01 Patent grant