CN110177811B

CN110177811B - 用于蛋白质连接的方法及其用途

Info

Publication number: CN110177811B
Application number: CN201780083490.8A
Authority: CN
Inventors: C·J·斯夸尔; E·N·贝克; P·G·扬; Y·约萨特马贾
Original assignee: Auckland Uniservices Ltd
Current assignee: Auckland Uniservices Ltd
Priority date: 2016-11-16
Filing date: 2017-11-16
Publication date: 2024-01-09
Anticipated expiration: 2037-11-16
Also published as: WO2018093274A1; US20190352343A1; JP2019535321A; EP3541848A1; JP2023016842A; EP3541848A4; CN110177811A; US11807671B2

Abstract

本发明涉及蛋白质连接技术、纯化肽或重组肽、用于制备具有共价键(包括可逆共价键，如可逆分子间共价键)的肽和蛋白质的方法，及其用途。具体而言，本发明涉及分子间酯键，尤其是存在于重组嵌合肽和蛋白质中的氨基酸侧链的羟基和酰胺基之间的可逆酯键，及这类肽和蛋白质在蛋白质改造中的用途，例如在制备多聚体蛋白质复合物(包括功能化多聚体蛋白质复合物)中的用途。

Description

用于蛋白质连接的方法及其用途

技术领域

本发明涉及蛋白质连接技术、纯化肽或重组肽、用于制备具有共价键(包括可逆共价键，如可逆分子间共价键)的肽的方法，及其用途。具体而言，本发明涉及分子间酯键，尤其是存在于重组嵌合肽和蛋白质中的氨基酸侧链的羟基和酰胺基之间的可逆酯键，及这类肽和蛋白质在蛋白质改造中的用途。

背景技术

蛋白质连接技术是分子生物学领域的重要工具，在许多生命科学学科如检测、纯化和蛋白质改造技术中具有广泛应用。

目前为止，蛋白质连接依赖于较弱和非永久性的非共价相互作用，如离子键、氢键、疏水键和范德华力。最近对革兰氏阳性菌菌毛(pili)中的稳定化分子内共价异肽键的表征揭示了其作为蛋白质连接新工具的潜力。

异肽键是赖氨酸和天冬酰胺或天冬氨酸的氨基酸侧链间形成的酰胺键。异肽键具有许多优势，包括自发形成、在生物条件下不可逆和对大多数蛋白酶具有抗性。但是，异肽系统的不可逆性趋向于限制可用异肽系统产生的蛋白质复合物的复杂性和灵活性。

稳定的共价异肽键可用于产生用于纳米技术的蛋白质结构。高度希望发展使得能够产生复杂蛋白质结构的蛋白质连接技术。

由于目前仅有两种已知的异肽系统可用，存在对新的蛋白质连接技术的持续需要。

本发明的目的是提供包括可逆蛋白质连接技术的蛋白质连接技术及其用途，其克服或至少改善了上文提到的劣势中的一些，或其至少为公众提供有用的选择。

本发明的其他目的可以从以下仅以实例的方式给出的描述变得显而易见。

发明概述

在一方面，本发明涉及包含一个或多个含有免疫球蛋白样结构域的氨基酸序列的重组多肽，其中将Ig样结构域分为截短的蛋白质和含有Ig样结构域最后的β链的肽。

在另一方面，本发明涉及肽标记和结合配偶体对，其中：

a)肽标记包含一个能够涉及含β-clasp的蛋白质中的β-clasp排列内自发形成的酯键的反应性残基，其中肽标记包含该含β-clasp的蛋白质的至少5个，例如8、10、12、14或16个毗连氨基酸，且可选地不包含含β-clasp的蛋白质的整条氨基酸序列；

b)该结合配偶体

i.包含含β-clasp的蛋白质的分开的片段，其中该片段包含该含β-clasp的蛋白质的至少约10个，例如20、30、40、50个毗连氨基酸，或包含与该片段具有至少75％，例如至少80％、至少85％、至少90％或至少95％同一性的序列；和

ii.包含另一能够涉及含β-clasp的蛋白质中自发形成的酯键的反应性残基；和

c)该肽标记和结合配偶体能够通过形成自发形成的酯键相互结合。

在另一方面，本发明涉及肽标记和结合配偶体对，其中：

a)肽标记包含能够形成β-片层的至少约10个，例如至少12个、至少14个、至少16个、至少18个、至少20个、至少22个或至少24个氨基酸，其中氨基酸之一是能够在含β-clasp的蛋白质的β-clasp中自发形成酯键的反应性残基，其中反应性残基选自苏氨酸、丝氨酸、谷氨酰胺和谷氨酸盐(glutamate)/谷氨酸(glutamic acid)，可选地其中肽标记不包含含β-clasp的蛋白质的整条氨基酸序列；

b)该结合配偶体

i.包含含β-clasp的蛋白质的分开的片段，其中该片段包含来自含β-clasp的蛋白质的β-clasp结构域的至少约10个，例如至少约20个、至少约40个、至少约60个、至少约80个、至少约100个或至少约120个毗连氨基酸，或包含与该片段具有至少75％，例如至少80％、至少85％、至少90％或至少95％同一性的序列；和

ii.包含涉及含β-clasp的蛋白质中的自发酯键的反应性残基，其中肽标记中的反应性残基是苏氨酸或丝氨酸时，结合配偶体中的反应性残基是谷氨酰胺或谷氨酸盐/谷氨酸，其中肽标记中的反应性残基是谷氨酰胺或谷氨酸盐/谷氨酸时，结合配偶体中的反应性残基是苏氨酸或丝氨酸；和

c)该肽标记和结合配偶体能够通过自发形成酯键相互结合。

本领域技术人员将理解，适用时，本文所述的任意实施方案涉及本文所述的任意方面。

在多种实施方案中，含β-clasp的蛋白质是含Ig样折叠的蛋白质。

在多种实施方案中，能够涉及含β-clasp的蛋白质中的β-clasp排列内自发形成的酯键的一个或多个反应性残基存在于来自含Ig样折叠的蛋白质的在β-clasp中包含两个β-片层的Ig样折叠中。在一个实例中，各反应性残基存在于来自含Ig样折叠的蛋白质的Ig样折叠中。

在一个实施方案中，在β-clasp排列中包含两个β-片层的Ig样折叠还具有通过酯键连接的第一和最后一条β-链。

在多种实施方案中，酯键是分子间酯键。

在一个实施方案中，在肽标记包含反应性丝氨酸残基时，结合配偶体包含反应性谷氨酰胺或谷氨酸盐/谷氨酸残基，或其中在肽标记包含反应性谷氨酰胺或谷氨酸盐/谷氨酸残基时，结合配偶体包含反应性丝氨酸残基。

在一个实施方案中，两个反应性残基间形成的酯键是可逆水解的。

在一个实施方案中，两个反应性残基间形成的酯键在pH高于7时是可逆水解的。

在某些实例中，两个反应性残基间形成的酯键在pH从约7至约9、或从约7.5至约9、或从约8至约9时是可逆水解的。在一个实例中，酯键在pH为约8时是可逆水解的。

在多种实施方案中，在将肽标记和结合配偶体维持在包含以下一项或多项的条件下时能够形成酯键：

a)pH为约7或以下；

b)存在一种或多种分子群集剂；

c)存在一种或多种二价阳离子；

d)存在甘油；

e)存在兼性离子缓冲分子；

f)存在包含烷基连接的磺酸官能团(包括乙基或丙基连接的磺酸官能团)的缓冲分子；

g)存在包含杂环的缓冲分子；

h)存在包含杂环烷基环的缓冲分子；

i)存在包含饱和杂环烷基环的缓冲分子；

j)存在包含饱和杂六元环的缓冲分子；

k)存在以上e)至j)的每一个中所定义的缓冲分子；

l)以上a)至k)的任意组合。

在一个实施方案中，缓冲分子选自MES、MOPS和HEPES。

在一个实施方案中，该含Ig样折叠的蛋白质是来自产气荚膜梭菌(Clostridiumperfringens)的黏附素蛋白Cpe0147或与之具有至少75％，例如至少80％、至少85％、至少90％或至少95％同一性的能够自发形成一个或多个酯键的蛋白质。

在一个实施方案中，该含Ig样折叠的蛋白质包含一个或多个来自一个或多个来自羞怯动弯杆菌(Mobiluncus mulieris)的黏附素蛋白结构域(如LPXTG基序细胞壁锚定结构域蛋白，蛋白ID EFM47174.1)的Ig样结构域，或与之具有至少80％、至少85％、至少90％或至少95％同一性的能够自发形成一个或多个酯键的蛋白质。

在一个实施方案中，肽标记包含SEQ ID NO.1中所示序列的氨基酸565-587的10个或更多个，例如12个或更多个、14个或更多个、16个或更多个、20个或更多个、22个或更多个毗连氨基酸，或与之具有至少75％，例如至少80％、至少85％、至少90％或至少95％同一性的序列。

在一个实施方案中，结合配偶体包含SEQ ID NO.1中所示序列的氨基酸439-563的10个或更多个，例如20个或更多个、40个或更多个、60个或更多个、80个或更多个、100个或更多个毗连氨基酸，或与之具有至少75％，例如至少80％、至少85％、至少90％或至少95％同一性的序列。

在一个实施方案中，肽标记长度少于50个氨基酸。

在另一方面，本发明涉及包含来自含Ig样折叠结构域的蛋白质的Ig样折叠结构域的至少约10个毗连氨基酸的肽标记，其中该至少约10个毗连氨基酸能够形成β-片层，其中氨基酸之一是能够在含Ig样折叠的蛋白质的Ig样折叠中自发形成分子间酯键的反应性残基，其选自苏氨酸、丝氨酸、谷氨酰胺和谷氨酸盐/谷氨酸，其中肽标记不包含含Ig样折叠的蛋白质的整条氨基酸序列。

在另一方面，本发明涉及包含来自含Ig样折叠结构域的蛋白质的Ig样折叠结构域的至少约10个毗连氨基酸的肽标记，其中该至少约10个毗连氨基酸能够形成β-片层，其中氨基酸之一是能够在含Ig样折叠的蛋白质的Ig样折叠中自发形成分子间酯键的反应性残基，其选自苏氨酸、丝氨酸、谷氨酰胺和谷氨酸盐/谷氨酸，其中肽标记包含异源氨基酸序列。

在一个实施方案中，肽标记包含来自异源蛋白质的至少8个毗连氨基酸。

在一个实施方案中，肽标记包含SEQ ID NO.1中所示序列的氨基酸565-587的10个或更多个毗连氨基酸，或与之具有至少75％同一性的序列。

在另一实施方案中，肽标记包含谷氨酰胺或谷氨酸盐/谷氨酸反应性残基，其中谷氨酰胺或谷氨酸盐/谷氨酸反应性残基存在于氨基酸序列HXDXXDXX[Q/E](SEQ ID NO.30)中。

在另一实施方案中，谷氨酰胺或谷氨酸盐/谷氨酸反应性残基存在于氨基酸序列[H/E]XDXX[D/S]XX[Q/E](SEQ ID NO.55)中。

在另一实施方案中，谷氨酰胺或谷氨酸盐/谷氨酸反应性残基存在于氨基酸序列HXDXX[D/S]XX[Q/E](SEQ ID NO.57)中。

在一个实施方案中，谷氨酰胺或谷氨酸盐/谷氨酸反应性残基存在于氨基酸序列HXDXXSXX[Q/E](SEQ ID NO.57)中。

在另一实施方案中，谷氨酰胺或谷氨酸盐/谷氨酸反应性残基存在于氨基酸序列[H/E]XDXXXXX[Q/E](SEQ ID NO.58)中。

在另一方面，本发明涉及包含含Ig样折叠的蛋白质的片段的结合配偶体，其中该片段包含来自含Ig样折叠的蛋白质的Ig样折叠结构域的至少约10个毗连氨基酸，或包含与该片段具有至少75％同一性的序列，其中该片段包含能够在含Ig样折叠的蛋白质的Ig样折叠中自发形成分子间酯键的反应性残基，该反应性氨基酸残基选自苏氨酸、丝氨酸、谷氨酰胺和谷氨酸盐/谷氨酸。

在一个实施方案中，结合配偶体包含异源氨基酸序列。在一个实施方案中，结合配偶体包含来自异源蛋白质的至少8个毗连氨基酸。

在一个实施方案中，结合配偶体是SEQ ID NO.1的片段。

在另一实施方案中，结合配偶体包含SEQ ID NO.1中所示序列的氨基酸439-563的10个或更多个毗连氨基酸，或除序列SEQ ID NO.1外与之具有至少75％同一性的序列。

在多种实施方案中，肽标记和/或结合配偶体包含SEQ ID NO.1-4或21-30中任一个的氨基酸序列的10个或更多个毗连氨基酸。

在多种实施方案中，肽标记和/或结合配偶体包含SEQ ID NO.1-4或21-30中任一个的氨基酸序列的至少约15个、至少约20个、至少约25个、至少约30个、至少约35个或至少约40个或更多个毗连氨基酸。

在多种实施方案中，肽标记和/或结合配偶体包含SEQ ID NO.31-58中任一个的氨基酸序列的10个或更多个毗连氨基酸。在多种实例中，肽标记和/或结合配偶体包含SEQ IDNO.31-58中任一个的氨基酸序列的10个或更多个毗连氨基酸，且包含表37至41之一中所示的来自存在于该氨基酸序列中的两个或多个结构域的至少一个氨基酸。

在多种实施方案中，肽标记和/或结合配偶体包含SEQ ID NO.31-58中任一个的氨基酸序列的至少约15个、至少约20个、至少约25个、至少约30个、至少约35个或至少约40个或更多个毗连氨基酸。在多种实例中，肽标记和/或结合配偶体包含SEQ ID NO.31-58中任一个的氨基酸序列的至少约15个、至少约20个、至少约25个、至少约30个、至少约35个或至少约40个或更多个毗连氨基酸，且包含表37至41之一中所示的来自存在于该氨基酸序列中的两个或多个结构域的至少一个氨基酸。

在多种实施方案中，肽标记、结合配偶体或肽标记和结合配偶体二者包含两个或多个能够自发形成酯键的反应性残基，其中反应性残基选自苏氨酸、丝氨酸、谷氨酰胺和谷氨酸盐/谷氨酸。

在一方面，本发明涉及肽标记和结合配偶体，其中该肽标记和/或该结合配偶体与核酸分子、蛋白质、肽、小分子有机化合物(包括荧光团)、金属-配体复合物、多糖、纳米颗粒、纳米管、聚合物或其组合缀合。例如，肽标记和/或结合配偶体包含异源氨基酸序列。

在一个实施方案中，本发明涉及包含肽标记和一个或多个异源氨基酸序列的嵌合蛋白质。

在一个实施方案中，本发明涉及嵌合蛋白质，其中肽标记中的反应性残基是丝氨酸。

在一个实施方案中，本发明涉及嵌合蛋白质，其中肽标记中的反应性残基是苏氨酸。

在一个实施方案中，本发明涉及包含结合配偶体和一个或多个异源氨基酸序列的嵌合蛋白质。

在一个实施方案中，本发明涉及嵌合蛋白质，其中结合配偶体中的反应性残基是丝氨酸。

在一个实施方案中，本发明涉及嵌合蛋白质，其中结合配偶体中的反应性残基是苏氨酸。

在一方面，本发明涉及嵌合蛋白质，其包含：

a)两个或多个肽标记；或

b)两个或多个结合配偶体；或

c)至少一个肽标记和至少一个结合配偶体。

在一个实施方案中，该嵌合蛋白质包含一个或多个异源氨基酸序列。

在一个实施方案中，存在于嵌合蛋白质中的肽标记或结合配偶体中的仅一个包含丝氨酸作为反应性残基。

在一个实施方案中，存在于嵌合蛋白质中的肽标记或结合配偶体中的每一个包含丝氨酸作为反应性残基。

在一个实施方案中，存在于嵌合蛋白质中的肽标记或结合配偶体中的仅一个包含苏氨酸作为反应性残基。

在一个实施方案中，存在于嵌合蛋白质中的肽标记或结合配偶体中的每一个包含苏氨酸作为反应性残基。

在一个实施方案中，存在于嵌合蛋白质中的肽标记或结合配偶体中的仅一个包含苏氨酸、谷氨酰胺或谷氨酸盐/谷氨酸作为反应性残基。

在一个实施方案中，存在于嵌合蛋白质中的肽标记或结合配偶体中的每一个包含苏氨酸、谷氨酰胺或谷氨酸盐/谷氨酸作为反应性残基。

在一个实施方案中，该嵌合蛋白质是分支的。

在一个实施方案中，分支蛋白质的每个分支包含至少一个肽标记或结合配偶体。

在另一方面，本发明涉及包含两个或多个嵌合蛋白质的多聚体蛋白复合物。

在一个实施方案中，该嵌合蛋白质中的至少一个包含含有酶、抗原、结构蛋白、抗体、细胞因子或受体的异源氨基酸序列。

在一个实施方案中，该多聚体蛋白复合物包含两个或多个嵌合蛋白质，其中该嵌合蛋白质中的至少一个包含含有酶的异源氨基酸序列，且该嵌合蛋白质中的至少一个包含含有酶的不同的异源氨基酸序列。

在另一方面，本发明涉及包含选自以下的一种或多种成分的多聚体蛋白复合物：本文所述的肽标记，本文所述的结合配偶体，本文所述的嵌合蛋白质，异源氨基酸序列，如包含酶、抗原、结构蛋白、抗体、细胞因子或受体的异源氨基酸序列。

在一个实施方案中，该多聚体蛋白复合物包含选自以下的一种或多种成分：本文所述的主干结构域(trunk domain)，本文所述的分支结构域，本文所述的货物(cargo)，本文所述的货物蛋白质。

在一个实施方案中，该多聚体蛋白复合物包含两个或多个主干结构域。在多种实例中，该多聚体蛋白复合物包含两个或多个能够以预定方式组装和共价连接的主干结构域。

在某些实施方案中，两个或多个主干结构域各包含一个或多个Ig样折叠的至少一部分，由此提供包含Ig样折叠的第一部分的第一主干结构域和包含Ig样折叠的互补部分的第二主干结构域之间的特异性互补，以及两个主干结构域间的特异性结合和酯键的形成。

在某些实施方案中，形成多聚体蛋白复合物的每个主干结构域例如以预定方式与一个或多个其他主干结构域互补和/或特异性结合。在某些实例中，两个主干结构域间的特异性结合由存在于每个主干结构域上的结合结构域之间的互补性提供，例如，一个主干结构域包含例如通常存在于β-clasp排列中的β-片层的第一或最后一条β-链的至少一部分，第二主干结构域包含β-链或β-片层的至少互补部分，由此使β-clasp排列汇集(recapitulate)于第一和第二主干结构域的结合。

在某些实施方案中，主干结构域不结合多聚体蛋白复合物的其他成分，如除与之互补的那些之外的其他主干结构域。例如，多聚体蛋白复合物包含两个或多个主干结构域，其中主干结构域之一包含来自含Ig样结构域的蛋白质的第一Ig样结构域的至少一部分和来自含Ig样结构域的蛋白质的第二Ig样结构域的至少一部分，另一主干结构域包含第一Ig样结构域或第二Ig样结构域的至少一部分，由此互补并使第一或第二Ig样结构域汇集于两个主干结构域间的结合。

在某些实例中，多聚体蛋白包含两个或多个主干结构域，该主干结构域共同包含在该结构域所衍生自的含Ig样结构域的蛋白质的天然序列中彼此毗连的两个或多个Ig样结构域。在某些实例中，两个或多个主干结构域各包含一个Ig样结构域的至少一部分和在含Ig样结构域的蛋白质中与该一个Ig样结构域毗连的Ig样结构域的至少一部分。在一个实例中，该Ig样结构域的部分是通常存在于含Ig样结构域的蛋白质的Ig样结构域中的β-clasp排列中的β-片层的第一或最后一条β-链。

在多种实施方案中，该多聚体蛋白复合物包含一个或多个含有SEQ ID NO.1-4或21-30中任一个的氨基酸序列的10个或更多个毗连氨基酸的蛋白质成分。

在多种实施方案中，该多聚体蛋白复合物包含一个或多个含有SEQ ID NO.1-4或21-30中任一个的氨基酸序列的至少约15个、至少约20个、至少约25个、至少约30个、至少约35个、或至少约40个或更多个毗连氨基酸的蛋白质成分。

在多种实施方案中，该多聚体蛋白复合物包含一个或多个含有SEQ ID NO.31-58中任一个的氨基酸序列的10个或更多个毗连氨基酸的蛋白质成分。在多种实例中，该多聚体蛋白复合物包含一个或多个含有SEQ ID NO.31-58中任一个的氨基酸序列的10个或更多个毗连氨基酸的蛋白质成分，且包含表37至41之一中所示的来自存在于该氨基酸序列中的两个或多个结构域的至少一个氨基酸。

在多种实施方案中，该多聚体蛋白复合物包含一个或多个含有SEQ ID NO.31-58中任一个的氨基酸序列的至少约15个、至少约20个、至少约25个、至少约30个、至少约35个、或至少约40个或更多个毗连氨基酸的蛋白质成分。在多种实例中，该多聚体蛋白复合物包含一个或多个含有SEQ ID NO.31-58中任一个的氨基酸序列的至少约15个、至少约20个、至少约25个、至少约30个、至少约35个、或至少约40个或更多个毗连氨基酸的蛋白质成分，且包含表37至41之一中所示的来自存在于该氨基酸序列中的两个或多个结构域的至少一个氨基酸。

在另一方面，本发明涉及形成共价连接的多聚体蛋白复合物的方法，该方法包括：

a)提供肽标记或嵌合蛋白质，其中嵌合蛋白质包含至少一个肽标记；

b)提供结合配偶体或嵌合蛋白质，其中嵌合蛋白质包含至少一个结合配偶体；

c)使步骤a)的肽标记或嵌合蛋白质和步骤b)的结合配偶体或嵌合蛋白质在适于自发形成分子间酯键的条件下接触；

d)可选地重复步骤a)至c)一次或多次，例如2次或多次、4次或多次、6次或多次；

由此形成共价连接的多聚体蛋白复合物。

在一个实施方案中，形成共价连接的多聚体蛋白复合物的方法包括：

a)提供本文所述肽标记或包含至少一个本文所述肽标记的嵌合蛋白质；

b)提供本文所述结合配偶体或包含至少一个本文所述结合配偶体的嵌合蛋白质；

由此形成共价连接的多聚体蛋白复合物。

在一个实施方案中，在存在于肽标记、结合配偶体或一个或多个嵌合蛋白质中的一个或多个反应性残基是丝氨酸、谷氨酰胺或谷氨酸盐/谷氨酸时，形成共价连接的多聚体蛋白复合物的方法包括在大于7的pH下维持多聚体蛋白复合物。

在一个实施方案中，在存在于肽标记、结合配偶体或一个或多个嵌合蛋白质中的一个或多个反应性残基是丝氨酸、谷氨酰胺或谷氨酸盐/谷氨酸时，形成共价连接的多聚体蛋白复合物的方法可选地包括在大于7的pH下维持多聚体蛋白复合物，或在适于水解丝氨酸残基和谷氨酰胺或谷氨酸盐/谷氨酸残基间形成的共价键的条件下维持多聚体蛋白复合物。

在一个实施方案中，形成共价连接的多聚体蛋白复合物的方法还包括：

e)提供肽标记或嵌合蛋白质，其中嵌合蛋白质包含至少一个肽标记；和/或

f)提供结合配偶体或嵌合蛋白质，其中嵌合蛋白质包含至少一个结合配偶体；

g)使步骤e)的肽标记或嵌合蛋白质和/或步骤f)的肽标记或嵌合蛋白质与多聚体蛋白复合物在适于自发形成分子间酯键的条件下接触；

h)可选地重复步骤e)至g)一次或多次，例如2次或多次、4次或多次、6次或多次；和/或

i)可选地在大于7的pH下维持多聚体蛋白复合物；或

j)h)和i)的任意组合。

在多种实施方案中，适于形成分子间酯键的条件包括以下一项或多项：

a)pH为约7或以下；

b)存在一种或多种分子群集剂；

c)存在一种或多种二价阳离子；

d)存在甘油；

e)存在兼性离子缓冲分子；

g)存在包含杂环的缓冲分子；

h)存在包含杂环烷基环的缓冲分子；

i)存在包含饱和杂环烷基环的缓冲分子；

j)存在包含饱和杂六元环的缓冲分子；

k)存在以上e)至j)的每一个中所定义的缓冲分子；

l)以上a)至k)中任意两项或多项的任意组合。

在一个实施方案中，该缓冲分子选自MES、MOPS和HEPES。

在另一方面，本发明涉及水解共价连接的多聚体蛋白复合物中的一个或多个可逆共价键的方法，该方法包括：

a)提供共价连接的多聚体蛋白复合物，该蛋白复合物包含：

i至少一个本文所述的肽标记或包含至少一个本文所述肽标记的嵌合蛋白质；和

ii至少一个本文所述结合配偶体或包含至少一个本文所述结合配偶体的嵌合蛋白质；

其中存在于肽标记、结合配偶体或一个或多个嵌合蛋白质中的一个或多个反应性残基是丝氨酸、谷氨酰胺或谷氨酸盐/谷氨酸；

b)使蛋白复合物维持在大于约7的pH下足以水解丝氨酸和谷氨酰胺或谷氨酸盐/谷氨酸间的共价键的时段，或使多聚体蛋白复合物维持在适于水解丝氨酸残基和谷氨酰胺或谷氨酸盐/谷氨酸残基间形成的共价键的条件下；

由此水解多聚体蛋白复合物中的一个或多个可逆共价键。

在一个实施方案中，在存在于肽标记、结合配偶体或一个或多个嵌合蛋白质中的一个或多个反应性残基是丝氨酸时，另一反应性残基是谷氨酰胺或谷氨酸盐/谷氨酸。

在多种实施方案中，根据需要，接触或维持持续足以允许酯键形成或水解的时段。

在多种实施方案中，适于水解丝氨酸和谷氨酰胺或谷氨酸盐/谷氨酸间的分子间酯键的条件包括以下一项或多项：

a)pH为约7或以上，例如pH为约8至约9；

b)存在或缺乏一种或多种分子群集剂；

c)存在或缺乏一种或多种二价阳离子；

d)存在或缺乏甘油；

e)存在或缺乏兼性离子缓冲分子；

f)存在或缺乏包含烷基连接的磺酸官能团(包括乙基或丙基连接的磺酸官能团)的缓冲分子；

g)存在或缺乏包含杂环的缓冲分子；

h)存在或缺乏包含杂环烷基环的缓冲分子；

i)存在或缺乏包含饱和杂环烷基环的缓冲分子；

j)存在或缺乏包含饱和杂六元环的缓冲分子；

k)存在或缺乏以上e)至j)的每一个中所定义的缓冲分子；

l)以上a)至k)中任意两项或多项的任意组合。

在一个实施方案中，该缓冲分子选自MES、MOPS和HEPES。

在一个实施方案中，该维持是在从约8至约9的pH下。

在一个实施方案中，该维持是在缺乏一种或多种二价阳离子的情况下。

在一个实施方案中，该维持是在缺乏一种或多种分子群集剂和/或缺乏甘油的情况下。

在多种实施方案中，该接触或维持持续少于约1小时的时段。在某些实施方案中，该接触或维持持续少于约30分钟、或少于约20分钟、少于约10分钟或少于约5分钟的时段。

在其他实施方案中，该接触或维持持续超过1小时、例如超过2、3、4、5或6小时的时段。考虑更长的时段，包括过夜。如本领域技术人员将理解，本文提供的实施例确定，酯键形成和(在反应性残基允许水解时)水解均快速发生，通常希望反应时间更短。在某些实施方案中，例如，在必须使存在于给定反应中所存在的肽标记、结合配偶体、结合对或嵌合蛋白质的群体中的基本上全部或全部反应性残基反应时，接触或维持可以持续几个小时或更多小时的更长时期。

在另一方面，本发明涉及肽标记和结合配偶体对或一个或多个嵌合蛋白质在制备共价连接的多聚体蛋白复合物中的用途。

在一个实施方案中，肽标记和结合配偶体对或一个或多个嵌合蛋白质的用途，其中在该肽标记包含反应性丝氨酸残基时，该结合配偶体包含反应性谷氨酰胺或谷氨酸盐/谷氨酸残基，或在该肽标记包含反应性谷氨酰胺或谷氨酸盐/谷氨酸残基时，该结合配偶体包含反应性丝氨酸残基。

在一个实施方案中，肽标记和结合配偶体对或一个或多个嵌合蛋白质的用途，其中该肽标记长度为5至50个氨基酸。

在另一方面，本发明涉及编码肽标记和结合配偶体对、肽标记、结合配偶体或嵌合蛋白质的核酸分子。

在另一方面，本发明涉及包含编码肽标记和结合配偶体对、肽标记、结合配偶体或嵌合蛋白质的核酸分子的载体。

在另一方面，本发明涉及细胞，其包含编码肽标记和结合配偶体对、肽标记、结合配偶体或嵌合蛋白质的核酸分子，或含有编码肽标记和结合配偶体对、肽标记、结合配偶体或嵌合蛋白质的核酸分子的载体。

在多种实施方案中，本发明涉及上文所述肽标记、结合配偶体、肽标记和结合配偶体对、嵌合蛋白质、或核酸分子、载体或细胞在选自生物催化，生物材料合成，化工生产，过滤、分离或分开一种或多种靶分子(例如从复杂混合物)，生物修复，纳米颗粒合成，检测(sensing)、鉴定和/或定位靶分子，展示包括光活性分子的分子，表面包被，治疗性生物材料，生物支架，组织工程，物理强化，递送一种或多种活性剂的应用中的用途。

在另一方面，本发明涉及肽标记和结合配偶体对，其中：

a)肽标记包含一个能够涉及含β-clasp的蛋白质中的β-clasp内自发形成的酯键的反应性残基，其中肽标记包含谷氨酰胺或谷氨酸盐/谷氨酸反应性残基，其中谷氨酰胺或谷氨酸盐/谷氨酸反应性残基存在于氨基酸序列HXDXXDXX[Q/E]中，且可选地不包含含β-clasp的蛋白质的整条氨基酸序列；

b)该结合配偶体

i.包含含β-clasp的蛋白质的分开的片段，其中该片段包含该含β-clasp的蛋白质的至少约10个、例如20、30、40、50个毗连氨基酸，或包含与该片段具有至少75％、例如至少80％、至少85％、至少90％或至少95％同一性的序列，且

ii.包含另一能够涉及该含β-clasp的蛋白质中自发形成的酯键的反应性残基；且

该肽标记和结合配偶体能够通过形成自发形成的酯键相互结合。

在另一方面，本发明涉及肽标记和结合配偶体对，其中：

c)肽标记包含一个能够涉及含β-clasp的蛋白质中的β-clasp内自发形成的酯键的反应性残基，其中肽标记包含谷氨酰胺或谷氨酸盐/谷氨酸反应性残基，其中谷氨酰胺或谷氨酸盐/谷氨酸反应性残基存在于氨基酸序列[H/E]XDXX[D/S]XX[Q/E](SEQ ID NO.55)中，且可选地不包含含β-clasp的蛋白质的整条氨基酸序列；

d)该结合配偶体

iii.包含含β-clasp的蛋白质的分开的片段，其中该片段包含该含β-clasp的蛋白质的至少约10个，例如20、30、40、50个毗连氨基酸，或包含与该片段具有至少75％、例如至少80％、至少85％、至少90％或至少95％同一性的序列；和

iv.包含另一能够涉及该含β-clasp的蛋白质中自发形成的酯键的反应性残基；和

在一个实施方案中，该谷氨酰胺或谷氨酸盐/谷氨酸反应性残基存在于氨基酸序列HXDXX[D/S]XX[Q/E](SEQ ID NO.56)中。在另一实施方案中，该谷氨酰胺或谷氨酸盐/谷氨酸反应性残基存在于氨基酸序列HXDXXSXX[Q/E](SEQ ID NO.57)中。

在一个实施方案中，该谷氨酰胺或谷氨酸盐/谷氨酸反应性残基存在于氨基酸序列[H/E]XDXXXXX[Q/E](SEQ ID NO.58)中。

在另一方面，本发明涉及包含第一肽结合配偶体和第二肽结合配偶体的肽结合对，其中在接触时该肽结合配偶体能够自发形成分子间酯键，其中：

a)一个结合配偶体包含选自苏氨酸和丝氨酸的反应性残基；和

b)另一结合配偶体包含选自谷氨酰胺和谷氨酸盐/谷氨酸的反应性残基；

在接触时，该第一和第二结合配偶体形成β-clasp，例如Ig样折叠，其包含还含有一个或多个促进自发分子间酯键形成的附属氨基酸残基的丝氨酸蛋白酶活性部位样排列。

在另一方面，本发明涉及第一肽结合配偶体和第二肽结合配偶体，其中在接触时该肽结合配偶体能够自发形成分子间酯键，其中：

在另一方面，本发明涉及肽结合对，其中在接触时该肽结合对形成能够在两个反应性氨基酸残基间自发形成分子间酯键的丝氨酸蛋白酶活性部位样结构，其中一个结合配偶体包含一个选自苏氨酸和丝氨酸的反应性残基，另一结合配偶体包含一个选自谷氨酰胺和谷氨酸盐/谷氨酸的反应性残基，其中存在于活性部位的反应性氨基酸残基在蛋白质数据库(Protein Data Bank)常规正交坐标系(orthogonal coordinate system)中具有以下相对原子位置：

a)Cβ(CB)Thr/Ser:0,0,0；

b)Cδ(CD)Gln/Glu:0.02±0.08,1.91±0.08,-1.61±0.08。

在多种实施方案中，结合配偶体之一或二者都包含一个或多个促进自发分子间酯键形成的氨基酸残基。

在一个实施方案中，一个或多个促进自发分子间酯键形成的氨基酸残基存在于肽结合配偶体内的β-链形成序列中。

在一个实施方案中，一个或多个促进自发分子间酯键形成的氨基酸残基与反应性残基一起存在于β-链形成氨基酸序列中。

在一个实施方案中，含有谷氨酰胺或谷氨酸盐/谷氨酸反应性氨基酸残基的结合配偶体包含促进自发分子间酯键形成的组氨酸氨基酸残基。

在一个实施方案中，含有谷氨酰胺或谷氨酸盐/谷氨酸反应性氨基酸残基的结合配偶体包含促进自发分子间酯键形成的组氨酸氨基酸残基，其中反应性残基和组氨酸都存在于结合配偶体的同一β-链中。

在一个实施方案中，含有谷氨酰胺或谷氨酸盐/谷氨酸反应性氨基酸残基的结合配偶体包含促进自发分子间酯键形成的组氨酸氨基酸残基，其中组氨酸在一级氨基酸序列中处于谷氨酰胺或谷氨酸盐/谷氨酸反应性残基的10个氨基酸之内。

在一个实施方案中，促进自发分子间酯键形成的组氨酸和谷氨酰胺或谷氨酸盐/谷氨酸处于结合配偶体之一的β-链形成氨基酸序列中，且在肽结合配偶体的一级氨基酸序列中在8个氨基酸之内。

在一个实施方案中，存在于包含谷氨酰胺或谷氨酸盐/谷氨酸反应性残基的结合配偶体中的谷氨酰胺或谷氨酸盐/谷氨酸反应性残基存在于氨基酸序列HXDXXDXX[Q/E](SEQ ID NO.30)中。

在一个实施方案中，存在于包含谷氨酰胺或谷氨酸盐/谷氨酸反应性残基的结合配偶体中的谷氨酰胺或谷氨酸盐/谷氨酸反应性残基存在于氨基酸序列[H/E]XDXX[D/S]XX[Q/E](SEQ ID NO.55)中。

在一个实施方案中，存在于包含谷氨酰胺或谷氨酸盐/谷氨酸反应性残基的结合配偶体中的谷氨酰胺或谷氨酸盐/谷氨酸反应性残基存在于氨基酸序列HXDXX[D/S]XX[Q/E](SEQ ID NO.56)中。在另一实施方案中，存在于包含谷氨酰胺或谷氨酸盐/谷氨酸反应性残基的结合配偶体中的谷氨酰胺或谷氨酸盐/谷氨酸反应性残基存在于氨基酸序列HXDXXSXX[Q/E](SEQ ID NO.57)中。在另一实施方案中，存在于包含谷氨酰胺或谷氨酸盐/谷氨酸反应性残基的结合配偶体中的谷氨酰胺或谷氨酸盐/谷氨酸反应性残基存在于氨基酸序列[H/E]XDXXXXX[Q/E](SEQ ID NO.58)中。

在一个实施方案中，含有谷氨酰胺或谷氨酸盐/谷氨酸反应性氨基酸残基的结合配偶体包含促进自发分子间酯键形成的组氨酸氨基酸残基，其中组氨酸在谷氨酰胺或谷氨酸盐/谷氨酸反应性残基的约6、约5.5、约5、约4.5、约4、约3.5、约3、约2.5或约2埃内。

在一个实施方案中，在结合配偶体接触时，促进自发分子间酯键形成的组氨酸的最近的原子在苏氨酸或丝氨酸反应性残基的最近的原子的约5、约4.5、约4、约3.5、约3、约2.5或约2埃内。

在一个实施方案中，促进自发分子间酯键形成的组氨酸残基与苏氨酸或丝氨酸反应性残基存在于同一结合配偶体上。

在一个实施方案中，便于自发形成分子间酯键的氨基酸残基之一是与苏氨酸或丝氨酸反应性残基足够靠近使得能够形成氢键的组氨酸残基。

在一个实施方案中，组氨酸残基和苏氨酸或丝氨酸反应性残基间的最接近点小于约5埃、小于约4埃、小于约3.5埃、小于约3.4埃、小于约3.2埃、或小于约3埃。

在一个实施方案中，便于自发形成分子间酯键的氨基酸残基之一是能够与苏氨酸或丝氨酸反应性残基形成氢键的组氨酸残基。

在一个实施方案中，组氨酸残基和苏氨酸或丝氨酸反应性残基间的距离小于约5埃、小于约4埃、小于约3.5埃、小于约3.2埃、或小于约3埃。

在多种实施方案中，便于自发形成分子间酯键的附属氨基酸残基之一是能够与谷氨酰胺和谷氨酸盐/谷氨酸反应性残基形成氢键的天冬氨酸残基。

在一个实施方案中，天冬氨酸附属残基与谷氨酰胺或谷氨酸盐/谷氨酸反应性残基存在于同一结合配偶体上。

在一个实施方案中，天冬氨酸附属残基与苏氨酸或丝氨酸反应性残基存在于同一结合配偶体上。

在一个实施方案中，谷氨酸盐/谷氨酸或谷氨酰胺残基和天冬氨酸残基便于形成自发形成的分子间酯键。

在一个实施方案中，便于自发形成分子间酯键的谷氨酸盐/谷氨酸或谷氨酰胺残基与天冬氨酸促进残基(facilitating residue)处于同一结合配偶体上。

在一个实施方案中，存在于活性部位的反应性氨基酸残基在蛋白质数据库常规正交坐标系中具有以下相对原子位置：

a)Cβ(CB)Thr/Ser:0,0,0；

b)Cδ(CD)Gln/Glu:0.02±0.08,1.91±0.08,-1.61±0.08。

在一个实施方案中，丝氨酸蛋白酶活性部位样结构还包含一个或多个附属氨基酸，其中存在于活性部位的反应性氨基酸残基在蛋白质数据库常规正交坐标系中具有以下相对原子位置：

a)Cβ(CB)Thr/Ser:0,0,0；

b)Cδ(CD)Gln/Glu:0.02,1.91.-1.61；

其中存在于活性部位的一个或多个附属氨基酸残基在存在时相对于反应性Thr/Ser Cβ位置具有以下Cγ(CG)位置：

c)His:1.35,3.67,3.34；

d)Asp:-3.45,-0.89,-2.19；

其中原子间距离的标准差为：

e)Cβ(CB)Thr至Cδ(CD)Gln为0.08；

f)Cβ(CB)Thr至Cγ(CG)His为0.25；

g)Cβ(CB)Thr至Cγ(CG)Asp为0.04。

在接触时，该第一和第二结合配偶体形成丝氨酸蛋白酶活性部位样结构。

在另一方面，本发明涉及肽结合对或第一肽结合配偶体和第二肽结合配偶体，其中丝氨酸蛋白酶活性部位样结构包含存在于活性部位中的反应性氨基酸残基，其在蛋白质数据库常规正交坐标系中具有以下相对原子位置：

a)Cβ(CB)Thr/Ser:0,0,0；

b)Cδ(CD)Gln/Glu:0.02,1.91.-1.61；

其中丝氨酸蛋白酶活性部位样结构包含存在于活性部位中的附属氨基酸残基，其相对于反应性Thr/Ser Cβ(CB)位置具有以下Cγ(CG)位置：

c)His:1.35,3.67,3.34；

d)Asp:-3.45,-0.89,-2.19；

其中原子间距离的标准差为：

e)Cβ(CB)Thr至Cδ(CD)Gln为0.08；

f)Cβ(CB)Thr至Cγ(CG)His为0.25；

g)Cβ(CB)Thr至Cγ(CG)Asp为0.04。

在一个实施方案中，苏氨酸或丝氨酸反应性氨基酸残基的Cβ(CB)的距离在谷氨酰胺/谷氨酸盐/谷氨酸反应性氨基酸残基的Cδ(CD)的约2.2埃至约3埃之间。

在一个实施方案中，苏氨酸或丝氨酸反应性氨基酸残基的Cβ(CB)的距离在谷氨酰胺/谷氨酸盐/谷氨酸反应性氨基酸残基的Cδ(CD)的2.49埃至2.65埃之间。

在一个实施方案中，苏氨酸或丝氨酸反应性氨基酸残基的Cβ(CB)的距离在促进自发分子间酯键形成的组氨酸氨基酸残基的Cγ(CG)的约4.5埃至约6.0埃之间。

在一个实施方案中，苏氨酸或丝氨酸反应性氨基酸残基的Cβ(CB)的距离在促进自发分子间酯键形成的组氨酸氨基酸残基的Cγ(CG)的4.86埃至5.60埃之间。

在一个实施方案中，苏氨酸或丝氨酸反应性氨基酸残基的Cβ(CB)的距离在促进自发分子间酯键形成的天冬氨酸氨基酸残基的Cγ(CG)的约3.5埃至约4.5埃之间。

在一个实施方案中，苏氨酸或丝氨酸反应性氨基酸残基的Cβ(CB)的距离在促进自发分子间酯键形成的天冬氨酸氨基酸残基的Cγ(CG)的4.07埃至4.18埃之间。

在一个实施方案中，苏氨酸或丝氨酸反应性氨基酸残基的Cβ(CB)至以下的最小距离：

a)至谷氨酰胺/谷氨酸盐/谷氨酸反应性氨基酸残基的Cδ(CD)为约2.2埃；和

b)至促进自发分子间酯键形成的组氨酸氨基酸残基的Cγ(CG)为约4.5埃；和

c)至促进自发分子间酯键形成的天冬氨酸氨基酸残基的Cγ(CG)为约3.5埃；

其中苏氨酸或丝氨酸反应性氨基酸残基的Cβ(CB)至以下的最大距离：

d)至谷氨酰胺/谷氨酸盐/谷氨酸反应性氨基酸残基的Cδ(CD)为约3埃；和

e)至促进自发分子间酯键形成的组氨酸氨基酸残基的Cγ(CG)为约6埃；和

f)至促进自发分子间酯键形成的天冬氨酸氨基酸残基的Cγ(CG)为约4.5埃。

a)至谷氨酰胺/谷氨酸盐/谷氨酸反应性氨基酸残基的Cδ(CD)为2.49埃；和

b)至促进自发分子间酯键形成的组氨酸氨基酸残基的Cγ(CG)为4.86埃；和

c)至促进自发分子间酯键形成的天冬氨酸氨基酸残基的Cγ(CG)为4.07埃；

d)至谷氨酰胺/谷氨酸盐/谷氨酸反应性氨基酸残基的Cδ(CD)为2.65埃；和

e)至促进自发分子间酯键形成的组氨酸氨基酸残基的Cγ(CG)为5.60埃；和

f)至促进自发分子间酯键形成的天冬氨酸氨基酸残基的Cγ(CG)为4.18埃。

在一个实施方案中，该Ig样结构域包含源自革兰氏阳性菌的Ig样结构域。

在多种实施方案中，第一肽结合配偶体、第二肽结合配偶体，或第一和第二肽结合配偶体二者包含来自本文SEQ ID No.1-4和20-30中任一个的至少10个毗连氨基酸。

在多种实施方案中，第一肽结合配偶体、第二肽结合配偶体，或第一和第二肽结合配偶体二者包含来自本文SEQ ID NO.31至58中任一个的至少10个毗连氨基酸。

在一个实施方案中，该Ig样结构域包含梭菌属(Clostridium)蛋白质或蛋白质片段。

在一个实施方案中，该Ig样结构域包含动弯杆菌属(Mobiluncus)蛋白质或蛋白质片段。

在一个实施方案中，该Ig样结构域包含产气荚膜梭菌蛋白质或其片段。

在一个实施方案中，该Ig样结构域包含羞怯动弯杆菌蛋白质或其片段。

在一个实施方案中，该Ig样结构域编码在产气荚膜梭菌基因组的AC1_0147基因内。基因产物的相应氨基酸序列在Uniprot登录号(entry)B1R775中给出。

在一个实施方案中，该Ig样结构域编码在羞怯动弯杆菌基因组的HMPREF0580_0271基因内。基因产物的相应氨基酸序列在Uniprot登录号E0QN07中给出。

在一个实施方案中，该Ig样结构域是Cpe0147的Ig样结构域，其氨基酸序列在本文中作为SEQ ID No.1-4提供。

在一个实施方案中，该Ig样结构域是羞怯动弯杆菌LPXTG基序细胞壁锚定结构域蛋白的Ig样结构域，其氨基酸序列在本文中作为SEQ ID No.21-30提供。

在一个实施方案中，该Ig样结构域是羞怯动弯杆菌LPXTG基序细胞壁锚定结构域蛋白的Ig样结构域，存在于包含来自SEQ ID NO.31至58中任一个的氨基酸序列的10个或更多个毗连氨基酸的氨基酸序列中。

在一个实施方案中，该Ig样结构域包含：

a)与Cpe0147的Ig样结构域的多肽序列(氨基酸439至563)[SEQ ID No.2]具有至少约80％氨基酸序列同一性的截短蛋白质；和/或

b)与Cpe0147的Ig样结构域的多肽序列(氨基酸565至587)[SEQ ID No.3]具有至少约80％氨基酸序列同一性的肽。

在一个实施方案中，该Ig样结构域包含：

a)与羞怯动弯杆菌LPXTG基序细胞壁锚定结构域蛋白的Ig样结构域的氨基酸序列具有至少约80％氨基酸序列同一性的蛋白质；

b)与存在于本文中作为SEQ ID No.21-30提供的氨基酸序列的任一个中的Ig样结构域的氨基酸序列具有至少约80％氨基酸序列同一性的蛋白质；和/或

c)与存在于本文中作为SEQ ID No.31-58提供的氨基酸序列的任一个中的Ig样结构域的氨基酸序列具有至少约80％氨基酸序列同一性的蛋白质。

在一个实施方案中，该Ig样结构域包含：

a)与羞怯动弯杆菌LPXTG基序细胞壁锚定结构域蛋白的Ig样结构域的氨基酸序列具有至少约90％、至少95％、至少98％、或至少99％氨基酸序列同一性的蛋白质；

b)与存在于本文中作为SEQ ID No.21-30提供的氨基酸序列的任一个中的Ig样结构域的氨基酸序列具有至少约90％、至少95％、至少98％、或至少99％氨基酸序列同一性的蛋白质；和/或

c)与存在于本文中作为SEQ ID No.31-58提供的氨基酸序列的任一个中的Ig样结构域的氨基酸序列具有至少约90％、至少95％、至少98％、或至少99％氨基酸序列同一性的蛋白质。

在一个实施方案中，该截短蛋白质进一步在N端包含前面的Ig样结构域的最后一条β-链。

在一个实施方案中，该Ig样结构域进一步在其N端包含来自前面的Ig样结构域的最后一条β-链的至少5个毗连氨基酸。例如，该Ig样结构域进一步在其N端包含来自在该Ig样结构域所衍生自的天然序列中处于它前面的Ig样结构域的最后一条β-链的至少5个毗连氨基酸。

在一个实施方案中，该截短蛋白质进一步在N端包含前面的Ig样结构域的最后一条β-链，其含有全长Cpe0147蛋白的氨基酸416至438(DTKQVVKHEDKNDKAQTLIVEKP[SEQ IDNo.4])。

在一个实施方案中，进一步在N端包含前面的Ig样结构域的最后一条β-链的截短蛋白质自聚合。

在一个实施方案中，该自聚合蛋白质进一步包含共价捕获蛋白质的分支结构域。

在一个实施方案中，该自聚合蛋白质进一步包含共价捕获货物酶的分支结构域。

在一个实施方案中，该货物酶形成酶促途径的部分。

在一个实施方案中，在截短蛋白质和肽之间形成酯键。

在一个实施方案中，在截短蛋白质的第一β-链和含有Cpe0147的Ig样结构域的最后一条β-链的肽之间形成酯键。

在一个实施方案中，该酯键可水解。

在一个实施方案中，该截短蛋白质在450位包含氨基酸取代。

在一个实施方案中，该截短蛋白质在450位包含从苏氨酸至丝氨酸的氨基酸取代。

本发明的其他方面可从以下仅以实例的方式提供的描述和参考附图而变得显而易见。

本文所用的术语“和/或”意指“和”或“或”或二者。

本文在名词后所用的“(s)”意指该名词的复数和/或单数形式。

旨在提及本文公开的数字范围(例如，1至10)还包括对该范围内的所有有理数(例如1、1.1、2、3、3.9、4、5、6、6.5、7、8、9和10)的引用，以及对该范围内的任何有理数范围(例如2至8、1.5至5.5和3.1至4.7)的引用，因此，在此明确公开本文明确公开的所有范围的所有子范围。这些仅是所明确指向的内容的实例，所列出的最低值和最高值之间的数值的所有可能的组合都认为以相似的方式在本申请中明确陈述。

在本说明书中，在提到专利说明书、其他外部文件或其他信息来源时，这通常是为了为讨论本发明的特征提供背景的目的。除非另有明确说明，否则对这些外部文件的引用不应被解释为在任何管辖中承认这类文件或这类信息来源是现有技术或形成本领域的一般常识的部分。

本说明书中所用的术语“包含(comprising)”意指“至少部分包含”。在解释本说明书中包含该术语的声明时，每项声明或权利要求中以该术语作为开始的特征全都需存在，但其他特征也可以存在。相关术语如“包含(comprise)”和“包含(comprised)”以相同的方式解释。

还可以广义地说本发明单独或共同包含本申请的说明书中提到或指出的部分、元件和特征，该部分、元件或特征中任意两或多种的任意组合或所有组合，在本文中提到在本发明所涉及领域具有已知等同物的特定整数时，将这类已知等同物视为在本文中并入，就如同单独给出一样。

附图简述

现将仅以实例的方式并参考附图来描述本发明，其中：

图1显示来自产气荚膜梭菌Cpe0147黏附素的单个结构域的带状图，突出显示Ig样蛋白质结构域的最后一条链(蓝色)和金属结合位点(红球)。连接蛋白质的第一和最后一条链的稳定化分子间酯键以棒形和以特写(嵌入)显示。自发形成的酯键在化学示意图中所示的苏氨酸和谷氨酰胺氨基酸的侧链之间自发形成。

图2显示测定的结果，其显示包含最后一条β-链(残基565-587)的肽和截短的Cpe0147蛋白质之间的分子间酯键形成。图2A显示缓冲液成分对酯键形成的影响。去除甘油和CaCl₂后，几乎观察不到键形成。在钙存在下，～40％的蛋白质转化，而在甘油存在下，转化为约～70％。蛋白质-肽复合物的模式化概念图以连接酯键(粗黑线)显示。图2B显示优化缓冲液条件下的键形成的时程。酯键形成在不到15分钟内近乎完成。

图3显示分裂Cpe0147结构域的蛋白质连接潜能。图3A显示构建体A(MBP–Cpe0147^439-563融合)和构建体B(Cpe0147^565-587–eGFP融合)的连接组装的小角度X射线散射分析(SAXS)产生的从头包封。将组成部分的晶体结构拟合至A-B包封。图3B显示构建体A(麦芽糖结合蛋白-Cpe0147^439-563加合物)和构建体B(Cpe0147^565-587-绿色荧光蛋白加合物)间酯键形成时程的SDS-PAGE分析。时程显示20小时的时段后>90％完成。右侧显示A-B交联组装的模式化概念图。图3C显示归一化至20小时时100％完成的酯键转化图。用GraphPad Prism对酯键转化进行作图，并拟合至指数两相结合模型。图3D显示来自携带麦芽糖结合蛋白作为货物的自聚合Cpe0147构建体(a.a.416-563)的纳米链在大肠杆菌中的体内组装。SDS-PAGE分析显示形成许多种类，最大的质量超过～500kDa。右侧显示自组装纳米链的模式化概念图。

图4显示T450S变体中由pH变化引起的酯键形成和水解。图4A显示低pH条件下及CaCl₂和甘油存在下的酯键形成的反应示意图。随后通过提高pH至8以上并去除CaCl₂和甘油来水解键。所使用的构建体(显示在右侧)是与图3A的构建体相同的MBP/GFP货物组合，但将Cpe0147中的苏氨酸450替换为丝氨酸。图4B显示覆盖20小时时期的酯键形成时程(上)的SDS-PAGE分析。针对水解反应显示相同的时程(下)。图4C显示归一化至100％的酯键形成和水解的图。用GraphPad Prism将指数两相指数模型拟合至酯键形成和水解数据二者。

图5显示Cpe0147和变体的一维1H核磁共振波谱(NMR)分析。甲基区(例如-1ppm处的信号)诊断为蛋白质-肽缀合物的形成。根据蛋白质浓度缩放波谱来辅助显示。图5A显示600μM Cpe^439-587(键形成对照)的波谱。图5B显示400μM对照Cpe^439-563的波谱，图5C显示混合的50μM Cpe^439-563+过量DTKQVVKHEDKNDKAQTLVVEKP[SEQ ID No.3]肽的波谱。使混合物在HEPES和甘油(pH 7.0)中反应一小时，以确保蛋白质-肽缀合物的形成。然后对样品进行缓冲液更换以去除过量肽。图5D显示肽对照150μM DTKQVVKHEDKNDKAQTLVVEKP[SEQ ID No.3]的波谱。

图6显示pH、分子群集剂和Ca²⁺对酯键形成影响的SDS-PAGE分析。将Cpe^439-563与含有蛋白质结构域的最后一条β-链的肽(Cpe^565-587)混合，在一系列(selection)缓冲分子(50mM)、分子群集剂和氯化钙(100μM)中孵育180分钟。SDS-PAGE凝胶泳道如下：(C)不含肽的对照Cpe^439-563；(1)乙酸钠缓冲液pH 5.0中的Cpe^439-563+肽；(2)磷酸钠缓冲液pH 6.0中的Cpe^439-563+肽；(3)MOPS缓冲液pH 7.1中的Cpe^439-563+肽；(4)TRIS.HCl缓冲液pH 8.0中的Cpe^439-563+肽；(5)硼酸盐缓冲液pH 8.8中的Cpe^439-563+肽；(6)甘油(10％v/v)中的Cpe^439-563+肽；(7)蔗糖(200mM)中的Cpe^439-563+肽；(8)PEG1k(10％)中的Cpe^439-563+肽。

图7显示甘油和CaCl₂存在下中性pH下的SDS-PAGE缓冲液筛选。将Cpe^439-563与含有蛋白质结构域的最后一条β-链的肽(Cpe^565-587)混合，在含恒定浓度的20％(v/v)甘油和100μM氯化钙的一系列缓冲分子(50mM)中孵育15分钟。SDS-PAGE凝胶泳道如下：(C)不含肽的对照Cpe^439-563；(1)Bis-Tris丙烷缓冲液pH 6.8中的Cpe^439-563+肽；(2)HEPES缓冲液pH 7.0中的Cpe^439-563+肽；(3)磷酸钠缓冲液pH 6.8中的Cpe^439-563+肽；(4)MOPS缓冲液pH 7.1中的Cpe⁴³⁹ ^-563+肽。

图8显示Cpe0147结构域-2在碱性pH下在尿素中的稳定性的SDS-PAGE分析。在尿素浓度逐渐提高的TRIS.HCl pH 9.0缓冲液中孵育完整结构域Cpe^439-587 24小时。含分子间酯键的野生型Cpe0147结构域比缺乏酯键的相同蛋白质更远地迁移通过SDS-PAGE凝胶。Cpe^439-587构建体甚至在50mM TRIS.Cl pH 9.0、6M尿素中也对水解非常稳定，稍高一点的质量条带的出现证明，仅非常小比例的酯键水解。

图9显示胰蛋白酶消化后Cpe0147-T450S^439-587的质谱分析。质谱显示对应于交联复合物的m/z片段的峰，确认预期的丝氨酸-谷氨酰胺侧链交联的存在。

图10显示Cpe0147-T450S^439-587在pH范围内的稳定性的SDS-PAGE分析。在多种系统中孵育Cpe-T450S^439-587(250μM浓度)20小时来分析pH对酯键稳定性或水解的影响。Ser450和Gln580间的酯键在低于7的pH下稳定，在高于pH 7时水解。SDS-PAGE凝胶泳道如下：(1)MES缓冲液pH 5.5中的Cpe-T450S^439-587；(2)MES缓冲液pH 6.0中的Cpe-T450S^439-587；(3)MES缓冲液pH 6.5中的Cpe-T450S^439-587；(4)HEPES缓冲液pH 7.0中的Cpe-T450S^439-587；(5)HEPES缓冲液pH 7.5中的Cpe-T450S^439-587；(6)TRIS.HCl缓冲液pH 8.0中的Cpe-T450S^439-587；(7)TRIS.HCl缓冲液pH 8.5中的Cpe-T450S^439-587；(8)TRIS.HCl缓冲液pH 9.0中的Cpe-T450S⁴³⁹ ^-587。

图11显示Cpe0147-T450S^439-587的诊断甲基区的1D ¹H NMR终点分析。将各蛋白质样品(250μM浓度)在多种系统中孵育20小时(除非另有说明)来分析pH对酯键稳定性或水解的影响。甲基区的信号(例如-1ppm处的信号)指示蛋白质-肽缀合物的形成。如图注中所示，样品从上至下为：(1)TRIS.HCl缓冲液pH 9.0中的Cpe-T450S^439-587；(2)TRIS.HCl缓冲液pH8.5中的Cpe-T450S^439-587；(3)TRIS.HCl缓冲液pH 8.0中的Cpe-T450S^439-587；(4)HEPES缓冲液pH 7.5中的Cpe-T450S^439-587；(5)HEPES缓冲液pH 7.0中的Cpe-T450S^439-587；(6)MES缓冲液pH6.5中的Cpe-T450S^439-587；(7)MES缓冲液pH 6.0中的Cpe-T450S^439-587；(8)MES缓冲液pH 5.5中的Cpe-T450S^439-587。

图12显示Cpe-T450S 439-587的诊断甲基区的1D ¹H NMR时程分析，显示酯键的形成和T450S变体的蛋白质稳定性。在TRIS.HCl缓冲液pH 9.0中孵育蛋白质Cpe-T450S^439-587(250μM浓度)，在图上注释的不同时间点采集NMR波谱。

图13显示反复Cpe0147-T450S^439-587(Cpe-T450S^439-587)酯键形成和水解循环的SDS-PAGE分析。将单个Cpe-T450S^439-587蛋白质样品在促进酯键形成(50mM MES pH 5.5,0.1mM氯化钙和20％(v/v)甘油)或诱导酯键水解(50mM TRIS.HCl pH 9.0)的缓冲液之间循环。同一蛋白质样品在两种缓冲液间循环三次。由于水解步骤较慢，在每个步骤透析样品24小时，以确保最大反应。SDS-PAGE凝胶泳道如下：(1)TRIS.HCl pH 7.0缓冲系统中的Cpe-T450S⁴³⁹ ^-587，键形成——如通过亲和层析和随后的大小排阻层析步骤从大肠杆菌(E.coli)纯化以分离各个种类；(2)TRIS.HCl pH 7.0缓冲系统中的Cpe-T450S^439-587，通过亲和层析从大肠杆菌纯化的混合群体；(3)MES缓冲系统中的Cpe-T450S^439-587(来自(2))，键再形成-1；(4)TRIS.HCl缓冲系统中的Cpe-T450S^439-587(来自(3))，键再水解-1；(5)MES缓冲系统中的Cpe-T450S^439-587(来自(4))，键再形成-2；(6)TRIS.HCl缓冲系统中的Cpe-T450S^439-587(来自(5))，键再水解-2；(7)MES缓冲系统中的Cpe-T450S^439-587(来自(6))，键再形成-3；(8)TRIS.HCl缓冲系统中的Cpe-T450S^439-587(来自(7))，键再水解-3。

图14显示构建体A(MBP–Cpe0147^439-563融合)和构建体B(Cpe0147^565-587–eGFP融合)的连接组装的小角度X射线散射分析。图14A显示通过小角度X射线散射强度测量的MBP-Cpe-GFP构建体的SEC-SAXS洗脱谱。虚线表示平均以产生散射图(图14B中所示)的散射数据。图14B显示对散射角度作图的SAXS数据(log(I)vs q空心圆，平均和溶剂扣除)。嵌入：显示线性的低角度数据Guinier图(ln(I*C)vs q² 用图14中所示的数据来产生图3A中所示的从头包封。

图15显示蛋白质数据库(PDB ID 4NI6)中公开的Cpe0147蛋白质的第一Ig样结构域的活性部位内的关键反应性和附属残基的相对位置。活性部位包含苏氨酸(或本文所述丝氨酸)和谷氨酰胺或谷氨酸或谷氨酸盐反应性残基及组氨酸和天冬氨酸附属残基。

图16显示包含分子间酯键形成所需的苏氨酸和谷氨酰胺反应性残基连同组氨酸和天冬氨酸附属残基的四个活性部位氨基酸残基的空间排列。标记选定原子名称。此图用Pymol和来自蛋白质数据库文件4MKM的坐标产生。

图17显示包含交联结构域的第一和最后一条β-链的分子间酯键的9个Ig样结构域的结构重叠。图17A是结构域的整体视图，通过黑线连接Cα位置，关键反应性和附属残基显示为白色棒模型。图17B是白色球和棒模型中的苏氨酸和谷氨酰胺反应性残基及组氨酸和天冬氨酸附属残基侧链的特写视图，通过黑线连接主链Cα位置。

图18显示能够形成酯键交联的来自羞怯动弯杆菌的黏附素蛋白质结构域(LPXTG基序细胞壁锚定结构域蛋白，蛋白质ID EFM47174.1)的氨基酸序列。反应性残基和附属残基以黑体表示。

图19显示含有关键反应性残基和附属残基的9种羞怯动弯杆菌黏附素蛋白质结构域的多序列比对。突出显示反应性残基和附属残基。

图20显示多价蛋白质支架的图示，其包含通过自发形成的酯键共价连接的非可逆连接的蛋白质结构域的“主干”，及携带功能结构域作为货物的包含含有肽结合配偶体的非可逆连接或可逆连接的选择性靶向结构域的“分支”。

图21显示示意图，其显示酯键交联的Mol结构域的修饰边界。与天然结构域边界相比，每个改造的Mol结构域错开。改造构建体缺乏其自身的C端β-链，而具有融合至N端的前一个结构域的C端β-链。在混合时，毗连结构域通过链互补结合，并通过自发酯键形成连接在一起，重新形成天然样结构域结构。图21B显示通过小角度X射线散射(SAXS)显示的Mol7-11连接产物。所构建的源自SAXS数据的从头包封描述了最大尺寸为的分子，其与模拟为5蛋白质链的原子水平X射线晶体结构拟合得非常好。

图22显示Mol结构域间酯键形成的SDS-PAGE分析。将Mol8、Mol9、Mol10和Mol11的样品以所有可能的组合混合，并在孵育24小时后通过SDS-PAGE分析。如可见，Mol结构域以特定顺序形成酯键，非毗连结构域间无交叉反应性。

图23显示本文实施例17中所述的来自羞怯动弯杆菌的Mol7a、Mol8、Mol9、Mol10和Mol11蛋白质的改造Ig样结构域的氨基酸序列。在每个序列中，HisTag和rTEV切割结构域以斜体显示，Mol主干结构域以常规字体显示，链互补区具有下划线，反应性残基和附属残基以黑体显示。

图24显示示意图，其显示按实施例18中所述制备的Cpe2-HL-Mol结构域的改造结构域结构。每个构建体包含Mol主干结构域，Cpe2分支结构域通过螺旋接头与N端融合。分支结构域捕获C2pept标记的货物蛋白质，该货物蛋白质通过自发酯键形成与构建体共价连接。

图25显示示意图，其显示实施例18中所述抗原呈递支架树的组装过程：(A)将各分支-主干结构域分别连接至C2pept标记的抗原。(B)将所连接的抗原-分支-主干构建体混合，形成按特定顺序与四种单个T抗原共价连接的树样结构。(C)各组装树包含四种抗原中的每一种的一个拷贝。

图26显示分支-主干构建体和它们各自的C2pept-T抗原间的反应的SDS-PAGE分析。A.T1抗原。B.Cpe2-HL-Mol10(M10)。C.T1+Cpe2-HL-Mol10。D.T3.2抗原。E.Cpe2-HL-Mol9(M9)。F.T3.2+Cpe2-HL-Mol9.G.T13抗原。H.Cpe2-HL-Mol8(M8)。I.T13+Cpe2-HL-Mol8。J.T18.1抗原。K.Cpe2-HL-Mol7(M7)。L.T1+Cpe2-HL-Mol7。

图27显示树组装的SDS-PAGE分析。A.连接在一起形成按>250kDa迁移的产物的树的所有成分。B.IMAC流通。仅T18.1(连接至Cpe2-HL-Mol7)具有完整His标记。所有部分形成的复合物穿过柱子，仅完全形成的树和单体T18.1-Cpe2-HL-Mol7保留在亲和柱上。C.IMAC洗脱。D.IMAC洗脱蛋白质的SEC纯化。第一个峰包含完全形成的T抗原树。E.第二个SEC次峰包含单体T18.1-Cpe2-HL-Mol7。

图28显示本文实施例18中所述改造Cpe2-Mol蛋白质构建体的氨基酸序列。在每个序列中，HisTag和rTEV切割结构域以斜体显示，Cpe2分支结构域具有下划线，螺旋接头结构域以下划线斜体显示，Mol主干结构域以常规字体显示。

图29显示本文实施例18中所述改造C2pept-T抗原蛋白质构建体的氨基酸序列。在每个序列中，HisTag和rTEV切割结构域以斜体显示，C2pept标记和接头结构域具有下划线，T抗原序列以常规字体显示。

图30显示展示eGFP的多聚体蛋白质支架的组装过程。(A)将所有分支-主干分别连接至肽标记的eGFP货物。(B)、(C)将连接的eGFP-分支-主干构建体混合，形成树样结构。

图31显示各分支-主干构建体和它们各自的pept-GFP货物间的连接反应的SDS-PAGE分析。A.分子量梯。B.Corio-HL-Mol7蛋白质。C.Gberg1-HL-Mol8蛋白质。D.Gberg2-HL-Mol9蛋白质。E.Cpe2-HL-Mol10蛋白质。F.C2pept-GFP货物蛋白质。*G.Corio-HL-Mol7+Coriopept-GFP。H.Gberg1-HL-Mol8+Gberg1pept-GFP。I.Gberg2-HL-Mol9+Gberg2pept-GFP。J.Cpe2-HL-Mol10+C2pept-GFP。*为清晰而未显示其他肽-GFP构建体，但看起来与此样品几乎相同。

图32显示eGFP-树组装的SDS-PAGE分析，显示随着加入附加的GFP-分支-HL-主干结构域，连接产物的质量增加。A.分子量梯。B.Mol11蛋白质(M11)。C.GFP-Cpe2-HL-Mol10复合物(M10)。D.Mol11和GFP-Cpe2-HL-Mol10复合物(M11+M10)的连接。E.M11+M10+GFP-Gberg2-Mol9(M9)的连接产生预期的～150kDa产物。F.M11+M10+M9+GFP-Gberg1-HL-Mol8(M8)间的反应产生～250kDa的异源四聚体种类。G.图7C中所示的完整树组装，M11+M10+M9+M8+GFP-Corio-HL-Mol7(M7)。H.分子量梯。

图33显示本文实施例19中所述的改造Cpe样/Mol蛋白质构建体的氨基酸序列。在每个序列中，HisTag和rTEV切割结构域以斜体显示，Cpe样分支结构域具有下划线，螺旋接头结构域以下划线斜体显示，Mol主干结构域以常规字体显示。

图34显示本文实施例19中所述的改造Cpe样/GFP蛋白质构建体的氨基酸序列。在每个序列中，HisTag和rTEV切割结构域以斜体显示，C2pept标记和接头具有下划线，GFP结构域以常规字体显示。

图35是显示本文实施例20中所述的重组T抗原和包含T抗原的多价多聚体蛋白质复合物的免疫原性的ELISA分析结果的图表。

发明详述

本发明提供这样的方法，该方法用于形成氨基酸侧链间自发形成的酯键交联，尤其是不同蛋白质的氨基酸侧链间自发形成的可逆酯键交联，从而使得能够连接两种或多种蛋白质或含有蛋白质的结合配偶体。因此，本发明通过利用酯键的独特特征来解决对蛋白质连接技术尤其是可逆连接的需要。此技术使得能够以精细的控制程度改造复杂蛋白质组装。

在某些方面，本发明涉及包含一个或多个含有免疫球蛋白(Ig)样结构域的氨基酸序列的重组多肽，其中Ig样结构域分裂为截短蛋白质和含有Ig样结构域的最后一条β-链的肽。具体而言，本发明的某些实施方案涉及截短蛋白质、其衍生物或片段和肽、其衍生物或片段之间可逆的自发形成的酯键。

在其他方面，本发明涉及一个或多个含有一个或多个异源氨基酸序列的截短Ig样结构域，其中在使两个或多个这类截短Ig样结构域相互接触时，Ig样结构域进行自聚合。

在某些实施方案中，异源氨基酸序列在本文中称为“货物”，例如“货物蛋白质”或“货物酶”。

本发明进一步涉及含有多个附着的货物蛋白质的截短Ig样结构域，其中截短Ig样结构域可逆自聚合。在某些实施方案中，自聚合的Ig样结构域来自同一含Ig样结构域的蛋白质。在其他实施方案中，来自不同的含Ig样结构域的蛋白质的Ig样结构域自聚合或可逆自聚合。

截短的可逆自聚合的Ig样结构域提供了货物蛋白质的可控组装。例如，一个或多个截短的可逆自聚合的Ig样结构域提供了含有一种或多种货物蛋白质的蛋白质“支架”的可控组装。具体而言，截短的可逆自聚合的Ig样结构域用于多个酶的可控组装。在一些实施方案中，本发明用于模拟天然酶促途径来优化酶产率。

本发明的某些优势包括：

a)肽稳定性提高；

b)高度可控的蛋白质组装过程；

c)肽和蛋白质制造的容易和高效；

d)多聚体蛋白质复合物中非毗连或非互补结合对间最小的交叉反应性；和

e)可逆自催化肽交联。

某些定义

术语“和/或”可以指“和”或“或”。

本说明书中所用的术语“包含”意指“至少部分包含”。在解释本说明书中包含该术语的声明时，每项声明中以该术语作为开始的特征全都需存在，但其他特征也可以存在。相关术语如“含有”和“包括”以相同的方式解释。

本文所使用的“纯化的”不要求绝对纯；相反，它旨在作为相对术语，其中所讨论的物质比它在之前所处的环境中更纯。实际上，该物质通常例如进行了分级分离，以去除多种其他成分，且所得到的物质基本保留其所希望得到的生物活性。术语“基本纯的”指这样的物质，其至少60％游离、优选至少约75％游离、最优选至少约90％游离、至少约95％游离、至少约98％游离或更多游离于它们在制备期间可与之结合的其他成分。

术语“α-氨基酸”或“氨基酸”指包含结合于命名为α-碳的碳的氨基和羧基二者的分子。适宜的氨基酸非限制性地包括天然存在的氨基酸以及通过有机合成或其他代谢途径制备的非天然存在的氨基酸的D和L异构体。除非文中另有明确说明，本文所用的术语氨基酸旨在包括氨基酸类似物。

在某些实施方案中，本文中考虑的蛋白质、多肽或肽仅包含天然氨基酸。术语“天然存在的氨基酸”指常见于自然界中合成的肽中的20种氨基酸中的任一种，以单字母缩写A、R、N、C、D、Q、E、G、H、I、L、K、M、F、P、S、T、W、Y和V为人们所知。在其他实施方案中，本文中考虑的蛋白质、多肽或肽包含一种或多种氨基酸类似物。

术语“氨基酸类似物”或“非天然存在的氨基酸”指结构上类似于氨基酸且可替换氨基酸的分子。氨基酸类似物非限制性地包括这样的化合物，除在氨基和羧基之间包含一个或多个附加的亚甲基(例如α-氨基β-羧酸)，或通过相似反应性的基团取代氨基或羧基(例如用仲胺或叔胺取代伯胺，或用酯取代羧基)外，其在结构上与本文中定义的氨基酸相同。

除非另有说明，本领域技术之内的常规分子生物学、微生物学、细胞生物学、生物化学和免疫学技术可用于实施本文所述的方法。这类技术充分阐述于文献中，如MolecularCloning:ALaboratory Manual,第二版(Sambrook等,1989)；Oligonucleotide Synthesis(M.J.Gait等,1984)；Animal Cell Culture(R.I.Freshney编辑,1987)；Handbook ofExperimental Immunology(D.M.Weir&C.C.Blackwell编辑)；Gene Transfer Vectors forMammalian Cells(J.M.Miller&M.P.Calos编辑,1987)；Current Protocols in MolecularBiology(F.M.Ausubel等编辑,1987)；PCR:The Polymerase Chain Reaction,(Mullis等编辑,1994)；Current Protocols in Immunology(J.E.Coligan等编辑,1991)；TheImmunoassay Handbook(David Wild编辑,Stockton Press NY,1994)；Antibodies:ALaboratory Manual(Harlow等编辑,1987)；及Methods of Immunological Analysis(R.Masseyeff,W.H.Albert和N.A.Staines编辑,Weinheim:VCH Verlags gesellschaftmbH,1993)。

本文所用的术语“肽”等指任何长度的氨基酸残基的任何聚合物。聚合物可以是线性或非线性的(例如分支的)，它可以包含修饰氨基酸或氨基酸类似物。该术语还涵盖天然修饰或通过干预修饰的氨基酸聚合物，例如，通过二硫键形成、糖基化、脂化、乙酰化、磷酸化或任意其他修饰或操作，例如与标记或生物活性成分缀合。

本文中提到指定蛋白质时所用的“片段”通常考虑该指定蛋白质的至少约10个毗连氨基酸。例如，来自含Ig样折叠的蛋白质的Ig样折叠结构域的片段包含来自该Ig样折叠结构域的10个或更多个毗连氨基酸。类似地，本文中作为SEQ ID NO.1至4、21至30或31至58之一提供的氨基酸序列的片段包含来自该指定序列的10个或更多个毗连氨基酸。

本文中所用的术语“截短蛋白质”指源自黏附素蛋白Cpe0147的Ig样结构域的截短(残基439至563)的蛋白质。例如在提到不同的指定蛋白质的截短时，术语“截短蛋白质”的其他用途将从本文中使用该术语的上下文显而易见。

在本文中用于提到含蛋白质的成分如肽标记、结合配偶体、嵌合蛋白质、蛋白质支架或蛋白质复合物时，本文中所用的术语“分支”和/或“分支结构域”考虑提供连接或连接部分或功能来将一个或多个货物或官能团连接至多聚体蛋白复合物的一个或多个其他蛋白质成分的多肽或蛋白质结构域。分支结构域的实例在本文中的例如实施例18和19中提供，并显示在例如图20(作为成分V、W、X、Y和Z)及图24、25和30中。

如本文中所示例，在某些实施方案中，分支或分支结构域将通过本文所述肽标记/肽结合配偶体相互作用和/或自发共价键形成来“捕获”和/或连接至一个或多个其他蛋白质成分、一个或多个货物或官能团，如一个或多个货物蛋白质。

在某些明确考虑的实例中，分支结构域包含：a)一个能够涉及含β-clasp的蛋白质中的β-clasp排列内自发形成的酯键的反应性残基，且包含该含β-clasp的蛋白质的至少5个毗连氨基酸；或b)包含含β-clasp的蛋白质的片段，其中该片段包含该含β-clasp的蛋白质的至少约10个毗连氨基酸，且包含能够涉及含β-clasp的蛋白质中自发形成的酯键的反应性残基。在一个实例中，分支结构域包含本文中示例的Cpe2-C2pept结合对的一部分，其中Cpe2-C2pept结合对的互补部分存在于货物上或包含货物。

本文所用的术语“货物”考虑最终存在于本文所述的蛋白质中或上或以其他方式掺入本文所述的蛋白质的官能团，如本文中所述的嵌合蛋白质或多聚体蛋白复合物。在某些实施方案中，货物附着于或将附着于肽标记或结合配偶体，或包含嵌合蛋白质或截短蛋白质的一部分，该部分转而可以共价结合于一种或多种其他蛋白质成分，形成本文提供的多聚体蛋白复合物。这类货物在本文中也称为价，由此多价蛋白质或蛋白复合物考虑存在多个货物，该多个货物可以相同或可以不同。本领域技术人员将理解，在某些实施方案中，异源氨基酸序列包含货物，因此可提供官能团或部分官能团。

尤其考虑的货物蛋白质是酶，或酶的部分，如酶活性部位或多聚体酶或酶复合物的一个或多个亚基。

在本文中用于提到含蛋白质的成分如肽标记、结合配偶体、嵌合蛋白质、蛋白质支架或蛋白质复合物时，本文所用的术语“主干”和/或“主干结构域”考虑多肽或蛋白质结构域，其提供一个或多个其他主干或主干结构域、一个或多个分支或分支结构域、一个或多个货物或官能团、或本文所述的多聚体蛋白质复合物的一个或多个其他蛋白质成分与之共价连接的支架部分或功能。因此，主干或主干结构域可以认为是其他成分(包括其他主干或主干结构域)与之或围绕其形成的核心的成分。主干结构域的实例在本文中的例如实施例18和19中提供，并显示在例如图20(作为成分1、2、3、4和5)及图24、25和30中。

如本文中所示例，在某些实施方案中，主干或主干结构域将通过本文所述肽标记/肽结合配偶体相互作用和/或自发共价键形成来连接至一个或多个其他蛋白质成分，如一个或多个其他主干或主干结构域、或一个或多个分支或分支结构域。

在某些明确考虑的实例中，主干结构域包含：a)一个能够涉及含β-clasp的蛋白质中的β-clasp排列内自发形成的酯键的反应性残基，且包含该含β-clasp的蛋白质的至少5个毗连氨基酸；或b)包含含β-clasp的蛋白质的片段，其中该片段包含该含β-clasp的蛋白质的至少约10个毗连氨基酸，且包含能够涉及含β-clasp的蛋白质中自发形成的酯键的反应性残基。在一个实例中，主干结构域包含Ig样结构域或其部分，如含β-clasp的蛋白质的Ig样结构域，如缺乏其C端β-链的Ig样结构域或其部分。在另一实例中，主干结构域包含Ig样结构域或其部分，加之来自另一Ig样结构域的β-链，如另一Ig样结构域的最后一条β-链，例如来自含β-clasp的蛋白质的全长β-clasp结构域中的前一个Ig样结构域的最后一条β-链。在一个实例中，主干结构域包含来自Cpe0147蛋白质的Ig样结构域的至少一部分，且可选地具有来自含β-clasp的蛋白质的β-clasp结构域的另一Ig样结构域的附加部分，包括来自Cpe0147的另一Ig样结构域的部分，如全长Cpe0147蛋白质中的前一个Ig样结构域的最后一条β-链。在其他实例中，使用包含一个或多个Ig样结构域的一个或多个部分如实施例6至16中所示例的Mol多肽或实施例17至20中所示例的Mol结构域的可比的主干结构域。

名词后的术语“(s)”考虑单数或复数形式或二者。

本发明包含前述，且还设想下文仅给出其实例而不以任何方式限制其范围的构造。

Cpe0147黏附素

识别黏附基质分子的微生物表面成分(MSCRAMM)是一类细菌表面分子，其非常长、细，在富含蛋白酶的环境中承受大的机械剪切力。MSCRAMM通常是折叠为许多结构域的单多肽。具体而言，本发明利用源自革兰氏阳性菌的MSCRAMM黏附素蛋白。在本发明的示例性实施方案中，使用源自产气荚膜梭菌的黏附素。考虑源自产气荚膜梭菌以外的细菌且按本文所述使用的黏附素或相关蛋白质的其他实例，包括本文在实施例中所示例的蛋白质和细菌物种。

黏附素对介导细菌附着于表面很重要。产气荚膜梭菌黏附素(Cpe0147)的生物信息学分析预测，该结构包含通过含有11个重复结构域并终止于C端细胞壁锚定基序(5’-LPKTG)的锚杆附着于细胞壁的N端黏附素结构域。预测重复结构域各具有所有β-链IgG样折叠(Kwon,H.；Squire,C.J.；Young,P.G.；Baker,E.N.,Autocatalytically generated Thr-Gln ester bond cross-links stabilize the repetitive Ig-domain shaft of abacterial cell surface adhesin.P Natl Acad Sci USA 2014,111(4),1367)。在每个结构域内，第一条β-链上的苏氨酸残基的侧链通过酯键与最后一条β-链上的谷氨酰胺残基的侧链共价连接。

自发酯键形成

不希望受限于任何机制理论，认为酯键交联通过Thr-450对Gln-580(或Glu-580)的亲核攻击、His-572的去质子和Asp-480/Glu-547对的键极化在氨基酸侧链上的羟基和酰胺之间、或羟基和羧酸/羧酸基团之间自发形成。同样不希望受限于任何理论，预期包含能够进行本文所述的这种自发共价键形成的其他Ig样结构域的反应性氨基酸残基的活性部位中存在可比的反应。

本文所用的术语“酯键”指羟基和酰胺之间(消除氨或水分子)、或羟基和羧酸或羧酸基团之间的共价键，其中至少一个不是源自蛋白质主链。酯键可在单个蛋白质内分子内形成或在两个肽/蛋白质或蛋白质/蛋白质分子之间分子间形成。

通常，酯键可存在于例如苏氨酸或丝氨酸残基和谷氨酰胺、谷氨酸盐/谷氨酸、天冬酰胺或天冬氨酸盐/天冬氨酸之间。涉及酯键的对的各残基在本文中称为反应性残基。因此，酯键可在苏氨酸残基和谷氨酰胺残基之间形成。尤其是，之间可存在于苏氨酸的侧链羟基和谷氨酰胺的酰胺基之间。

本文中讨论的术语“肽结合对”指具有一个反应性残基的结合配偶体和具有第二反应性残基的第二结合配偶体。在接触时，来自各结合配偶体的反应性残基形成酯键交联。应理解，在某些实施方案中，包含一个能够与一个结合配偶体形成酯键的反应性残基的多肽如本文中考虑的嵌合多肽将包含一个或多个能够与另一结合配偶体形成酯键的反应性残基，由此具有多个结合配偶体。这类能够结合一个以上结合配偶体的多肽的代表性实例在本文实施例中提供。因此，肽结合对不排除其他结合配偶体与存在于该对中的肽结合，本领域技术人员将理解，其他结合配偶体可以附着形成其他结合对，例如作为多聚体蛋白质复合物的部分。

可以通过例如天冬氨酸/天冬氨酸盐和/或组氨酸氨基酸残基来便于肽结合对的反应性残基间的酯键形成。便于自发酯键形成的各残基在本文中称为附属残基，因为该残基便于反应，但不被反应修饰。因此，天冬氨酸和组氨酸可便于反应性残基对之间的自发酯键形成。

在反应性残基接触时，反应性残基形成含有丝氨酸蛋白酶活性部位样结构的Ig样折叠。包含反应性残基和附属残基的丝氨酸蛋白酶活性部位样结构在本文中称为活性部分(参见图15)。通常，活性部位的反应性残基和附属残基包含例如图16中所示的空间排列。

活性部位可以包含苏氨酸反应性残基，其紧密靠近第二反应性残基例如谷氨酰胺、谷氨酸或谷氨酸盐反应性残基，第一附属残基，例如组氨酸，及第二附属残基，例如天冬氨酸。例如，苏氨酸反应性残基的Cβ原子可以在距反应性谷氨酰胺残基的Cδ2.40、2.45、2.50、2.55、2.60、2.65、2.70、2.75、2.80或2.85埃之内。例如，苏氨酸反应性残基的Cβ原子可以在距组氨酸附属残基的Cγ原子4.50、4.55、4.60、4.65、4.70、4.75、4.80、4.85、4.90、4.95、5.00、5.05、5.15、5.20、5.25、5.30、5.35、5.40、5.45、5.50、5.55、5.60、5.65或5.70埃之内。例如，苏氨酸反应性残基的Cβ原子可以在距天冬氨酸附属残基的Cγ原子4.00、4.05、4.10、4.15或4.20埃之内。

本文所用的术语“自发形成的”指可以在不存在任何其他试剂(例如附加的酶催化剂)和/或无蛋白质或肽的化学修饰的情况下在蛋白质中或肽或蛋白质之间(例如2种肽或肽和蛋白质之间)形成的键，例如酯键或共价键。自发形成的酯键可以在产生蛋白质后或接触后在肽或蛋白质结合配偶体之间几乎立即形成，例如在1、2、3、4、5、10、15、20、25或30分钟内或在1、2、4、8、12、16或20小时内。本发明人已确定Cpe0147的Ig样折叠中的氨基酸取代Thr450>Ser保留氨基酸侧链间自发形成的酯键，但使得酯键形成可逆。还考虑其他使得能够形成可逆酯键的氨基酸取代，如丝氨酸同源物或衍生物，包括非天然存在的衍生物。

本文所用的术语“可逆的”指可水解的酯键，其可以在通过引发因素如pH变化启动时水解。通常，可水解的酯键可以在丝氨酸残基和谷氨酰胺、谷氨酸盐或谷氨酸残基之间形成。尤其是，酯键可以存在于丝氨酸残基的侧链羟基和谷氨酰胺残基的酰胺基之间。

在明确考虑的实施方案中，如Cpe1047的Ig样折叠中的Ser450取代所示例的那些，将其中存在酯键的复合物维持在约7或更高的pH导致含丝氨酸的酯键水解。值得注意的是，其他可存在于复合物中且不可逆(例如不涉及丝氨酸-谷氨酰胺或丝氨酸-谷氨酸盐/谷氨酸酯键)的酯键不水解。本领域技术人员将认可，这种特异性有助于直接构建本文中描述和示例的多聚体蛋白质复合物。

在某些实施方案中，在将其中或其间存在可逆酯键的蛋白质复合物、蛋白质、多肽或肽引入适宜条件后，本文考虑的可逆酯键将几乎立即水解。例如，键在1、2、3、4、5、10、15、20、25或30分钟内或在1、2、4、8、12、16或20小时内水解。如本文提供的实施例中所示例，pH是本文所述丝氨酸-谷氨酰胺或丝氨酸-谷氨酸盐/谷氨酸酯键的可逆性的显著决定因素，其中pH提到至7或以上导致水解。如实施例中所列，其他因素，如缓冲液条件和缓冲剂、二价阳离子的存在或缺乏、和/或分子群集剂如甘油的存在或缺乏，可以影响水解反应的动力学和平衡，使用本文提供的描述，本领域技术人员可以鉴定反应条件，以提供本文所述蛋白质复合物中存在的可逆酯键的所希望得到的和/或最佳的水解。

“保守氨基酸取代”是这样的取代，其中用另一具有化学相似或衍生化侧链的残基替换氨基酸残基。例如本领域已确定具有相似侧链的氨基酸残基家族。这些家族包括例如具有碱性侧链(例如赖氨酸、精氨酸、组氨酸)、酸性侧链(例如天冬氨酸盐/天冬氨酸、谷氨酸盐/谷氨酸)、不带电荷极性侧链(例如甘氨酸、天冬酰胺、谷氨酰胺、丝氨酸、苏氨酸、酪氨酸、半胱胺酸)、非极性侧链(例如丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、甲硫氨酸、色氨酸)、β-分支侧链(例如苏氨酸、缬氨酸、异亮氨酸)和芳香族侧链(例如酪氨酸、苯丙氨酸、色氨酸、组氨酸)的氨基酸。本发明中也考虑氨基酸类似物(例如磷酸化或糖基化氨基酸)，以及用非天然存在的氨基酸(包括但不限于N烷基化氨基酸(例如N-甲基氨基酸)、D-氨基酸、β-氨基酸和γ-氨基酸)取代的肽。

肽基序

除Cpe0147外，本发明人已鉴定出其他包含能够自发形成之间的反应性氨基酸残基和附属氨基酸残基的肽/结构，包括来自羞怯动弯杆菌的多个黏附素蛋白质结构域[SEQID Nos.21-29,31]。鉴定出含有谷氨酰胺反应性残基和组氨酸附属残基的HxDxxDxxQ肽序列基序。HxDxxDxxQ肽序列基序可以例如形成肽结合对的一种肽、本文所述嵌合蛋白质的部分，或本文所述多聚体蛋白质复合物的蛋白质成分的部分。图19中及本文中其他地方显示包含能够自发形成酯键的HxDxxDxxQ肽基序的肽/结构的代表性列表。鉴定出其他共有肽序列基序，即[H/E]xDxx[D/S]xx[Q/E](SEQ ID NO.55)、HxDxx[D/S]xx[Q/E](SEQ ID NO.56)、HXDXXSXX[Q/E](SEQ ID NO.57)和[H/E]XDXXXXX[Q/E],(SEQ ID NO.58)。同样，[H/E]xDxx[D/S]xx[Q/E]肽序列基序、和/或HXDXX[D/S]XX[Q/E]肽序列基序、和/或HXDXXSXX[Q/E](SEQ ID NO.57)肽序列基序、和/或[H/E]XDXXXXX[Q/E],(SEQ ID NO.58)肽序列基序可以例如形成肽结合对的一种肽、本文所述嵌合蛋白质的部分，或本文所述多聚体蛋白质复合物的蛋白质成分的部分。

许多包含上述反应性氨基酸残基和附属氨基酸残基的代表性改造肽结合对在本文实施例中示例，其中一个或多个反应性氨基酸残基和附属氨基酸残基存在于一种肽中(参见例如表42和44中提供的肽序列)，一个或多个其他反应性氨基酸残基和附属氨基酸残基存在于另一种肽中(参见例如表41和43中提供的肽序列)。此外，本文实施例示例了肽结合对，其中一种肽包含一组以上反应性氨基酸残基和附属氨基酸残基，以使得能够连接至多个结合配偶体。例如，例如实施例18和19中提供的某些肽构建体包含一组反应性氨基酸和附属氨基酸，以使得能够连接至互补的“主干”结构域(如图24中显示和表41中提供的氨基酸序列中鉴定的Mol主干结构域)，及另一组反应性氨基酸和附属氨基酸，以使得能够连接至包含货物蛋白质的结合配偶体(如图24中显示和表42中提供的氨基酸序列中鉴定的C2pept-T蛋白质构建体)。

技术应用

应理解，本发明可用于分子生物学、免疫学、合成生物学、纳米技术领域及其他相关领域。例如，本发明可用于目的肽和/或蛋白质的纯化、检测和鉴定，用于增强酶的复原和功效的蛋白质折叠。

本领域技术人员将理解，在某些实施方案中，本发明的多肽适合用于改造模拟成簇多酶复合物的天然效率的自组装酶促复合物。应理解，目前的蛋白质支架限于小的、两种或三种酶的复合物，酶化学计量的控制有限(Lee,H.；DeLoache,W.C.；Dueber,J.E.,Spatial organization of enzymes for metabolic engineering.Metab Eng 2012,14(3)242-251,Horn,A.H.C.；Sticht,H.,Synthetic protein scaffolds based on peptidemotifs and cognate adaptor domains for improving metabolicproductivity.Frontiers in Bioengineering and Biotechnology,2015,3(191),1-7和Chen,R.Chen,Q.；Kim,H.；Siu,K.H.；Sun,Q.；Tsai,S.L.；Chen,W.,Biomolecularscaffolds for enhanced signalling and catalytic efficiency.Curr Opin Biotech2014,28,59-68)。考虑形成酶促途径的部分的无论目前表征过与否的所有酶。

在某些实施方案中，本发明是以特定排列共定位酶促途径的模块构建。通过选择适当的肽标记/结合配偶体对，例如在主干结构域内，可以以定向方式组装多聚体蛋白复合物，使得可以以预定排列放置货物蛋白质或其他官能团。在某些实施方案中，如实施例中尤其是实施例17-19中所示，与现有技术不一样，在实施例17中所利用的主干结构域的情况下，适当选择5种不同的主干结构域使得能够在单个反应中以特定顺序进行至少5个结构域的各构件的复合物组装。

本文所述的构建体和方法使得本领域技术人员能够选择和构建以特定顺序自排列的主干结构域，由此主干结构域包含一个或多个Ig样折叠的至少一部分，使得含有Ig样折叠的第一部分的第一主干结构域和含有Ig样折叠的互补部分的第二主干结构域之间的特异性互补导致两个主干结构域间的特异性结合和两个主干结构域间酯键的形成。如本领域技术人员将理解，尤其是在本文提供的实施例如实施例17-19中所提供的那些的引导下，适当构建一个或多个具有Ig样折叠的一个以上部分的主干结构域使得这类主干结构域能够结合一个以上其他主干结构域，转而使得能够以预定顺序进行主干结构域的定向结合。例如，在某些实施方案中，一个主干结构域包含例如通常存在于β-clasp排列中的β-片层的第一个或最后一条β-链的至少一部分，第二主干结构域包含β-链或β-片层的至少互补部分，由此使β-clasp排列汇集于第一和第二主干结构域的结合。

在某些实施方案中，本文考虑的多聚体蛋白复合物包含货物或官能团与之附着的单个主干或分支结构域。在其他实施方案中，本文考虑的多聚体蛋白复合物包含一个或多个货物或官能团与其中任意一个或多个附着的多个主干和/或分支结构域。因此，在某些实施方案中，本文考虑的多聚体蛋白复合物包含至少2个、至少3个、至少4个、至少5个、或超过5个蛋白质成分，如2、3、4、5或超过5个主干结构域、分支结构域或货物蛋白质。例如，明确考虑本文中示例的包含2、3、4、5或超过5个主干结构域的多聚体蛋白复合物。这类多聚体蛋白复合物(包括本文中示例的那些)包含附加的蛋白质成分，例如2、3、4、5或超过5个分支结构域，和/或2、3、4、5或超过5个货物蛋白质。

如上文所列，应理解，与现有技术不一样，本发明使得能够通常在单个反应中以特定顺序进行至少5个结构域的每个构件的复合物组装。在本发明的某些实施方案中，可以产生五个或更多个模块构件的纳米链。考虑10个或更多个构件的纳米链。还应理解，与现有技术不一样，本发明使得复合物组装能够在单个反应混合物中进行。

在某些实施方案中，本发明用于纯化、检测和鉴定应用，例如用于分离稀有细胞，包括循环肿瘤细胞(CTC)(磁珠-亲合体(affibody)捕获)。现有技术通常受限于捕获表达低水平肿瘤标志的CTC的困难。应理解，本发明使得能够形成的强烈自发形成的共价键提高了诊断方法的灵敏度。

在某些实施方案中，本发明用于例如通过固定在原子力显微镜(AFM)尖端来研究蛋白质的机械/物理特征。应理解，与基于较低特异性的二硫键的现有技术相比较，本发明的结合特异性适合用于研究蛋白质的机械特性。

在某些实施方案中，本发明用于例如通过循环酶来增强酶的复原和稳定性。应理解，在许多重要应用如生物转化、生物燃料产生和分子诊断中，希望得到本发明使得能够达到的酶复原和稳定性的提高。

在某些实施方案中，本发明用于合成疫苗产生，例如用于共价附着抗原至抗体。用于合成疫苗产生的现有技术通常耗时、成本高，且常受限于所表达的分子的大小。本发明使得能够产生可以以较低成本和较短时间高特异性组装的不同蛋白质亚基。

在某些实施方案中，本发明用于治疗性递送外膜囊泡中的酶或蛋白质。应理解，使用现有技术，通常用单个微生物培养物产生重组产物并纯化使用。重组产物在表达该产物的宿主内的累积常导致毒性和产率受限。本发明使得能够在降低细胞毒性的外膜囊泡中产生重组产物，并提高产率。

在某些实施方案中，本发明用于构建催化性生物膜。本发明使得能够改造生物膜来展示功能肽如催化酶。

在某些实施方案中，本发明用于蛋白质表达和溶解度分析。应理解，用于表达和溶解度分析的现有方法通常非常耗时，需要许多纯化步骤。本发明通过将荧光标记附着于目的蛋白质而使得能够快速进行表达和溶解度分析。

在某些实施方案中，本发明用于产生基于蛋白质的水凝胶。应理解，本发明使得能够合成在生理条件下自发形成的蛋白质支架。

在某些实施方案中，本发明用于产生合成纳米纤维。本发明使得能够产生自聚合的蛋白质单体。

阅读本说明书时应理解，可以用肽结合对的多种组合来组装多价蛋白质结构，其中一个结合配偶体包含本文所述自发反应的活性部位的成分，另一个结合配偶体包含自发反应的活性部位的其余成分，足以汇集活性部位，并使得能够进行自发键形成。通过适当选择结合配偶体和活性部位成分，可以达到结合特异性和选择性，以使得能够顺序构建携带多个官能团的蛋白质支架。这种支架的一个代表显示在本文图20中，其中选择性肽结合配偶体汇集活性部位来使不同的功能性货物在一起，将这些官能团共定位在本身通过本文所述的自发酯键形成形成的结构核心处。形成可逆键和不可逆键二者，允许互换不同的官能团，或替换官能团，而并非必然导致结构核心的解构。

携带多个官能团的蛋白质支架，如图20中所示及例如实施例18和19中所示例的蛋白质支架，在本文中也称为多价多聚体蛋白复合物。在某些实施方案中，这类支架携带同一官能团的多个拷贝，因此可以称为同价多聚体蛋白复合物或称为多同价多聚体蛋白复合物。在其他实施方案中，这类支架携带不同官能团的多个拷贝，因此可以称为异价多聚体蛋白复合物或称为多异价多聚体蛋白复合物。

本文明确考虑同价多聚体蛋白复合物，包括多同价多聚体蛋白复合物，及异价多聚体蛋白复合物，包括多异价多聚体蛋白复合物，包括这样一类复合物，该类复合物包含本文中明确描述和/或示例的一种或多种蛋白质成分，包括含有SEQ ID NO.1-4或21-30中任一个的氨基酸序列的10个或更多个毗连氨基酸，和/或含有SEQ ID NO.31-58中任一个的氨基酸序列的10个或更多个毗连氨基酸，如SEQ ID NO.31-58中任一个的氨基酸序列的10个或更多个毗连氨基酸的一种或多种蛋白质成分，且包含本文表37至41之一中所示的来自存在于该氨基酸序列中的两个或多个结构域的至少一个氨基酸。

以下实施例旨在说明而非以任何方式、状况或形式明确地或含蓄地限制本发明。虽然它们是可以使用的那些的典型，但可以备选地使用本领域技术人员已知的其他流程、方法或技术。

实施例

方法

细菌菌株、质粒和寡核苷酸

用大肠杆菌菌株DH5α进行所有DNA操作，用BL21(λDE3)(Stratagene)菌株进行蛋白质表达。培养物于37℃培养在补充了氨苄青霉素(100μg/ml)的2xYT培养基中。表1中列出所使用的寡核苷酸引物。

克隆C2Cpe0147构建体

用引物PYC2NtermFwd[SEQ ID No.5]和PYC2NtermRev[SEQ ID No.6]从之前在Kwon等(2014)中报道的C2构建体PCR扩增编码Cpe0147氨基酸序列439-563(全序列参见Uniprot登录号B1R775)的DNA。用EcoRI和KasI限制性核酸内切酶消化所扩增的PCR片段，克隆入表达载体pMBP-ProExHta(Invitrogen)。通过在pProExHta的His_6-标记和rTEV(重组烟草蚀纹病毒蛋白酶)切割位点之间插入麦芽糖结合蛋白(MBP)基因来产生之前在Ting,Y.T.；Batot,G.；Baker,E.N.；Young,P.G.Acta crystallographica.Section F,Structuralbiology communications 2015,71,61中报道的pMBP-ProExHta。所得到的载体pMBP-Cpe0147^439-563产生N端His_6-标记的MBP融合蛋白，随后是rTEV切割位点和Cpe0147^439-563截短蛋白质结构域。

通过将Cpe0147^439-563亚克隆入之前在Ting等2015中描述的载体pMBP3来产生缺乏可切割的rTEV识别序列的第二构建体。所得到的pMBP3L-Cpe0147^439-563载体产生N端His_6-标记的MBP融合蛋白，随后是-AGA-三残基接头和Cpe0147^439-563截短蛋白质结构域。

通过用引物Fwdcomp1[SEQ ID No.7]和PYC2NtermRev[SEQ ID No.6]从C2构建体PCR扩增Cpe0147氨基酸序列416-563来产生第三自聚合构建体。用EcoRI和KasI限制性核酸内切酶消化所扩增的PCR片段，克隆入表达载体pMBP-ProExHta，以产生构建体pMBP-Cpe0147^416-563Poly。

按以下产生包含用源自Cpe0147的残基565-587的N端肽标记改造的增强型绿色荧光蛋白(eGFP)的构建体。通过应用从100℃至20℃的温度梯度来使编码Cpe0147的残基565-587的定制的互补76bp合成寡核苷酸CtermpeptF2[SEQ ID No.8]和CtermpeptR2[SEQ IDNo.9](Integrated DNATechnologies)退火。退火产物包含与KasI和NcoI限制性核酸内切酶位点互补的单链突出，将其在KasI和NcoI位点之间在eGFP的N端插入构建体SP-GFP中(Ting等,2015)，以产生构建体pC2pept-GFP。此构建体包含N端His_6-标记序列，随后是rTEV切割位点和与eGFP融合的Cpe0147^565-587肽序列。所有构建体均在奥克兰大学生物科学学院DNA测序设备上进行序列验证。

表1：所使用的引物列表

磷酸

Cpe0147的位点定向诱变

通过以pMBP3L-Cpe0147^439-563为模板，用磷酸化引物PYC2T13SFwd[SEQ ID No.10]和PYC2T13SRev[SEQ ID No.11]进行反向PCR位点定向诱变来产生pMBP3L-Cpe0147^439-563的T450S变体。简言之，用高保真DNA聚合酶(iProof,Bio-Rad)PCR扩增pMBP3L-Cpe0147^439-563质粒，以产生在正义引物的5’端含有所希望得到的突变的线性化PCR产物。然后通过DpnI消化来从非甲基化的线性PCR产物去除不含T450S突变的甲基化亲本模板。最后，通过分子间连接再环化PCR产物。将所得到的质粒pMBP3L-Cpe0147-T450S^439-563转化入大肠杆菌DH5α细胞，扩增，提取，并纯化用于序列验证。还改造了完全完整的结构域Cpe0147-T450S^439-587。

蛋白质表达和纯化

将包含重组表达构建体的大肠杆菌BL21(λDE3)细胞在定轨摇床(@180rpm)中于37℃在补充了氨苄青霉素(100μg/ml)的2xYT培养基中培养至光密度为OD₆₀₀＝0.5-0.6。通过加入异丙基β-D-1-硫代半乳吡喃糖苷(IPTG)至终浓度为0.3mM来诱导蛋白质表达，再在18℃孵育培养物16小时。4℃4000g沉淀细胞20分钟，快速冷冻，保存于-20℃。

从冷冻细胞纯化重组蛋白质，将冷冻细胞融化，重悬在加入完整无EDTA蛋白酶抑制剂混合物片(Roche)的裂解缓冲液[50mM HEPES pH 7.0,300mM NaCl,5％(v/v)甘油,10mM咪唑]中，并用细胞破碎器按18,000psi裂解(Constant Systems)。通过离心(4℃，55,000g，30分钟)去除不可溶蛋白质级分，将可溶性重组蛋白质级分上样至5mL ProtinoNiNTA5柱(Macherey-Nagel)，通过固定化金属亲和层析(IMAC)进行纯化。用洗涤缓冲液[50mM HEPES pH 7,300mM NaCl,20mM咪唑]洗涤重组蛋白质，用洗脱缓冲液(含500mM咪唑的洗涤缓冲液)以线性梯度洗脱。

对于具有可去除的His或His/MBP亲和标记的构建体，将来自IMAC的含有重组蛋白质的级分对>100x体积的透析缓冲液[20mM HEPES pH7,100mM NaCl,1mMβ-巯基乙醇]过夜透析，按rTEV与重组蛋白质的摩尔比为1:50用重组TEV蛋白酶同时去除His_6-标记或His-MBP。通过第二轮IMAC去除未消化的蛋白质和rTEV蛋白酶。通过穿过直链淀粉树脂(NEB)对His-MBP标记切除的蛋白质进行附加的纯化，以去除污染的切割MBP蛋白质。浓缩纯化的蛋白质，并在用10mM HEPES pH7和100mM NaCl平衡的Superdex 200 10/300柱(GE Healthcare)上进行大小排阻层析(SEC)。将SEC纯化的蛋白质浓缩至～20mg/ml，在液氮中快速冷却，然后保存于-80℃。

肽合成

使用适当功能化的氨基甲基聚苯乙烯树脂，用Fmoc/tBu固相法在Tribute(Tucson,Az)自动合成仪上按0.1mmol规模制备包含Cpe0147^565-587的合成肽。简言之，用含20％哌啶的DMF(v/v)去除N-Fmoc基团2x 5分钟，用含HATU(0.45mmol)和DIPEA(1mmol)的DMF偶联输入的Fmoc氨基酸(0.5mmol)20分钟。用95％TFA、2.5％TIPS和2.5％水(v/v/v)从树脂释放肽3小时，用醚沉淀，并通过离心回收。用基于其分析特征和通过LC-MS确认的质量的适当梯度通过反相HPLC纯化粗肽。

质谱分析

以正模式使用ESI，使用具有Hewlett Packard Series 1100MSD质谱仪的Agilent1120Compact LC系统，通过LC-MS确认Cpe0147^439-563-Cpe0147^565-587产物的蛋白质质量。按0.3ml/分钟流速用Zorbax SB-300C3(5μm；3.0x 150mm)柱(Agilent)和21分钟内5％至65％B的线性梯度(每分钟～3％B)进行LC-MS。所使用的溶剂系统为A(含0.1％甲酸的H₂O)和B(含0.1％甲酸的乙腈)。在400-2000的m/z范围内获取数据，对m/z值去卷积以产生单同位素质量。所有其他质谱分析实验均由新西兰奥克兰的奥克兰大学质谱分析中心用LC-MS/MS,Q-Star XL四级杆-飞行时间系统进行。

酯键连接反应

最初的Cpe0147^439-563蛋白质纯化在TRIS.HCl pH 8.0缓冲系统中进行。最初的实验探索对pH和包含来自稀释蛋白质的残留TRIS.HCl(～2-5mM)和NaCl(5mM)的缓冲系统的影响。对于随后的实验，用HEPES缓冲系统纯化蛋白质。用10μM的蛋白质浓度进行用于测定酯键形成的反应。将保存于-80℃的浓缩蛋白质融化，在反应缓冲液中稀释～20倍至10μM，同时改变其他成分的浓度。除非另有说明，所有反应均在20℃孵育。对于时程实验，从反应管中的更大体积收集样品，通过加入SDS上样缓冲液并在99℃加热～3分钟来终止。

NMR波谱

用配有BBFO探头的Bruker 500MHz仪器进行NMR实验。使用常规5mm NMR管(Norell)。样品通常包含90％H₂O和10％D₂O。除非另有说明，所有实验均在300K进行。使用标准¹H质子脉冲序列，用2ms Squa100.1000脉冲通过激发雕刻法达到水抑制。对每个样品进行了使用单脉冲章动法(Bruker pulsecal routine)(Wu,P.S.C.；Otting,G.J.Magn.Reson.2005,176,115)的脉冲尖角度校准。

小角度X射线散射

用大小排阻层析(SEC)将用于小角度X射线散射的样品缓冲液更换为10mM HEPESpH 7.0,100mM NaCl。以覆盖(q＝4πsin(θ)/λ)的动量传递范围的1.6m相机长度按波长在澳大利亚同步加速器SAXS/WAXS束线上采集数据。通过SEC-SAXS采集数据，用scatterBrain⁴和PRIMUS⁵处理图像。用ASTAS软件包中的程序进一步分析SAXS数据，包括GASBOR和DAMMIF中产生的从头模拟，用DAMAVER产生的共有模型(Petoukhov,M.V.；Franke,D.；Shkumatov,A.V.；Tria,G.；Kikhney,A.G.；Gajda,M.；Gorba,C.；Mertens,H.D.；Konarev,P.V.；和Svergun,D.I.J Appl Crystallogr.2012,45,342)。

进行连接的MBP-Cpe-GFP组装的小角度X射线散射来测定该结构的低分辨率包封。每2秒通过SEC-SAXS从25μl注射在Superdex S200increase 5/150GL柱(GE HealthcareLife Sciences)上的12mg/ml蛋白质采集数据。用代表SEC洗脱谱的中央峰的图像(图像120-130)进行分析，如散射曲线中所示(图14A)。图14B中显示缓冲液扣除的散射曲线连同Guinier图(嵌入)。表2中显示SAX散射参数和统计。

表2：小角度X射线散射参数和统计

^a束线规格的全部详情可在澳大利亚同步加速器网站获得。

羞怯动弯杆菌黏附素的三结构域构建体的X射线晶体分析

通过从基因组DNA PCR扩增和限制性克隆来达到羞怯动弯杆菌菌株BV 64-5[35240^TM]的三结构域酯键构建体的克隆。用表3中所列的基因特异性引物对从羞怯动弯杆菌基因组DNA(35240^TM)PCR扩增了四个重叠三结构域酯键构建体。简言之，用具有富含GC的缓冲液的高保真DNA聚合酶(iProof,Bio-Rad)从0.5ng基因组DNA PCR扩增3结构域构建体。用KasI和XhoI限制性核酸内切酶消化所扩增的PCR片段，克隆入表达载体pProExHta(Invitrogen)，以产生构建体Mol3-5、Mol5-7、Mol7-9和Mol9-11。对所得到的质粒进行序列验证，并转化入大肠杆菌BL21(DE3)细胞进行蛋白质表达。

将来自IMAC的含有重组蛋白质的级分对>100x体积的透析缓冲液[20mM HEPESpH7,100mM NaCl,1mMβ-巯基乙醇]过夜透析，按rTEV与重组蛋白质的摩尔比为1:50用重组TEV蛋白酶同时去除His_6-标记。通过第二轮IMAC去除未消化的蛋白质和rTEV蛋白酶。浓缩纯化的蛋白质，并在用10mM HEPES pH7和100mM NaCl平衡的Superdex 200 10/300柱(GEHealthcare)上进行大小排阻层析(SEC)。将SEC纯化的蛋白质浓缩至～200-400mg/ml，在Mol5-7的情况下浓缩至750mg/ml，在液氮中快速冷却，然后保存于-80℃。

用基于甲硫氨酸生物合成抑制(Doublie S,Carter C.(1992)Preparation ofSelenomethionyl Protein Crystals.Oxford University Press.New York)的修改的流程产生硒代甲硫氨酸标记的Mol7-9蛋白质。简言之，用M9基本培养基替代2xYT培养基，按上文所述流程培养细胞进行天然蛋白质的表达。一旦OD600达到1.5，即向培养物中加入各100mg/l的赖氨酸、苯丙氨酸和苏氨酸，及各50mg/l的异亮氨酸、亮氨酸和缬氨酸。然后加入丰富的L-硒代甲硫氨酸(60mg/l)，再在37℃培养细胞15分钟，然后用0.1mM IPTG在18℃诱导16小时。

用本地产结晶筛在290K对纯化的重组蛋白质进行坐滴蒸气扩散结晶筛选试验。用与等体积孔溶液混合的1μl蛋白质溶液通过悬滴蒸气扩散型式优化最初的结晶条件。表4和5中列出各构建体的结晶条件、蛋白质浓度和冷冻保护液。

在澳大利亚同步加速器(MX1和MX2)采集X射线衍射数据。用XDS(Kabsch,W.(2010).XDS.Acta Cryst.D66,125-132)和POINTLESS/AIMLESS(Evans,P.R.&Murshudov,G.N.(2013)Acta Cryst.D69,1204-1214)处理和缩放数据。通过SAD定相来解析Smet-Mol7-9的结构。相确定、密度修改和建模使用SHELX-CDE(A short history ofSHELX.Sheldrick,G.M.(2008).Acta Cryst.A64,112-122)。用COOT(Emsley,P.,Lohkamp,B.,Scott,W.G.&Cowtan,K.(2010).Acta Cryst.D66,486-501)完成建模。用REFMAC(Murshudov G.N.,Skubák P.,Lebedev A.A.,Pannu N.S.,Steiner R.A.,Nicholls R.A.,Winn M.D.,Long,F.&Vagin,A.A.(2011).Acta Cryst.D67,355-367)提炼SeMet-Mol7-9结构。用之前解析的各结构的重叠结构域通过分子替换来解析Mol7-9天然结构及Mol9-11、Mol5-7和Mol3-5结构，并用REFMAC提炼。最终验证使用MOLPROBITY(Chen V.B.,ArendallW.B.3^rd,Headd J.J.,Keedy D.A.,Immormino R.M.,Kapral,G.J.,Murray,L.W.,Richardson,J.S.&Richardson,D.C.(2010).Acta Cryst.D66,12-21.)。

表3：用于扩增羞怯动弯杆菌菌株BV 64-5[35240^TM]的引物列表

表4：各构建体的结晶条件和蛋白质浓度

表5：各构建体的冷冻保护液

实施例1

本实施例显示Cpe0147^439-563截短蛋白质结构域和Cpe0147^565-587肽间酯键的自发形成。

方法

将涵盖Cpe0147残基439-587的Ig样结构域分裂为两个部分：包含序列439-563的截短蛋白质和包含该结构域的最后一条β-链残基565-587(DTKQVVKHEDKNDKAQTLVVEKP[SEQID No.3])的肽。截短蛋白质作为麦芽糖结合蛋白(MBP)构建体在大肠杆菌中重组产生，随后去除MBP标记，而互补的C端肽化学合成。

结果

在混合在一起时，N端截短和肽自发形成在SDS-PAGE分析中证明的共价酯键连接(图2A和5)。通过质谱分析确认复合物的质量为17129.2±1.4Da(计算值为17131.6Da)。通过从最初的TRIS.HCl pH 8.0系统改变孵育条件优化了此系统中的酯键形成速率，通过包括分子群集剂、二价阳离子和特定pH缓冲分子达到成键速率的显著提高(图2A)。优化的反应缓冲液包含50mM HEPES pH7.0,10mM NaCl,100μM CaCl₂和20％甘油。使用含10μM蛋白质的此反应缓冲液，且蛋白质:肽比值为1:2，酯键形成反应在少至3分钟内近乎完成(图2B)。在4℃-28℃的温度范围内成键速率相似，允许实验在冰上或在冰箱中孵育。

有趣的是，pH/缓冲液筛选表明，所使用的具体缓冲分子比溶液本身的pH对成键具有更大的影响(图6和7)。最有效的缓冲分子MES、MOPS和HEPES全为兼性离子缓冲分子，且包含含有烷基(乙基或丙基)连接的磺酸官能团的饱和杂六元环。

实施例2

此实施例显示两种蛋白质间的共价交联。

方法

将N端MBP标记的Cpe0147截短蛋白质与用源自Cpe0147黏附素蛋白的残基565-587的N端肽标记改造的增强型绿色荧光蛋白(eGFP)配对。

结果

使Cpe0147^439-563截短蛋白质结构域与融合至eGFP的Cpe0147^565-587肽序列在之前优化的缓冲系统中孵育，产生了质量为84,580Da的二聚、不可逆交联的组装。通过小角度X射线散射(SAXS)显示MBP-Cpe0147-eGFP连接产物。源自SAXS数据的所构建的从头包封(图3A)和颗粒分布函数描述了最大尺寸的分子，其非常符合所连接的组装的单个成分的已知大小。图3B和3C中所示的时程显示酯键形成在～1小时时间点接近50％，在6小时时接近～90％转化。

实施例3

本实施例显示Cpe0147^439-563截短蛋白质结构域的体内自聚合。

方法

将Cpe0147的Ig样结构域改造为自聚合构建体，以形成沿全长展示MBP货物蛋白质的包含中央Cpe0147来源柄的纳米链(图3D，右)。截短的Cpe0147的第二结构域(缺乏其C端β-链)使其N端延伸至包括全长Cpe0147蛋白质中的前一个Ig样结构域的最后一条β-链(残基416-438,DTKQVVKHEDKNDKAQTLIVEKP[SEQ ID No.4])。使His_6-标记的MBP货物蛋白质融合至此N端延伸，表达该蛋白质，并用固定化金属亲和层析数值从粗细菌裂解物分离。

结果

SDS-PAGE分析显示指示聚合的诊断性阶梯模式，含有从～56kDa(单体)至>500kDa分子量的种类的混合物(图3D)。此结果显示在体外发展的酯键技术可转移至体内实验，在细菌内侧形成交联，且对蛋白酶解和水解二者都稳定。

实施例4

本实施例显示可逆酯键。

方法

用Ser-Gln对(T450S变体)替换交联Thr-Gln对。首先通过胰蛋白酶消化和质谱分析确认用Cpe0147的Ig样结构域2的T450S变体在之前优化的缓冲系统下形成Ser-Gln交联(图9)。在此相同的系统中，在应用于发明人的三蛋白MBP货物系统的T450S变体之前，通过SDS-PAGE和¹H-NMR评估了水解反应性并优化(图4)。

结果

在低pH条件下及CaCl₂和甘油存在下，此构建体形成稳定且不水解的酯键(图4A和4B)。但是，提高pH至8和9之间并去除CaCl₂和甘油促进酯键水解，使Glu氨基酸替换野生型Gln(图4A和4B)。

与野生型系统一样，图4C中所示的酯键形成和水解的时程可拟合至两相指数模型；成键为结合模型，水解为衰减模型。与野生型等同物一样，T450S系统中的酯键形成在～1小时时显示>50％转化，表明它们在其连接潜能上几乎等同。水解慢于成键，20小时后剩余～20％完整酯键。

水解后，可以简单地通过转换缓冲液至我们的启动酯键形成的低pH优化条件，来使分开的MBP和eGFP构建体再连接。此处的含义是，可以在活性部位中用Glu替换野生型Gln，且仍形成酯键。有趣的是，可以在同一样品上通过至少三个循环完成键形成和键断裂的过程(图13)。

实施例5

本实施例显示Cpe0147-结构域2的肽序列、活性部位的必须残基的相对原子位置和原子间距离。

方法

Cpe0147-结构域2(残基439-587)的肽序列获自Uniprot(登录号B1R775)。

Cpe0147-结构域2的自发分子间酯键形成所必需的四个残基中每一个的原子的坐标数据获自蛋白质数据库文件4MKM。使用蛋白质数据库(PDB)常规正交坐标系。选择苏氨酸反应性残基的Cβ(CB)原子作为参考坐标(0,0,0)。

通过使用软件程序Pymol内的距离测量工具来获得原子间距离。

Cpe0147-结构域2

表6显示Cpe0147-结构域2的肽序列。必需反应性氨基酸和附属氨基酸以黑体显示。HxDxxDxxQ具有下划线。

表6：Cpe0147-结构域2的肽序列

以下表7中列出苏氨酸、天冬氨酸、组氨酸和谷氨酰胺残基的原子的坐标。

表7：自发分子间酯键形成所必需的残基的相对原子位置

以下表8中列出苏氨酸的Cβ(CB)至谷氨酰胺的Cδ(CD)、组氨酸的Cγ(CG)和天冬氨酸的Cγ(CG)的原子间距离(埃)。

表8：原子间距离

实施例6

本实施例显示T450S-Cpe0147-结构域2的肽序列和活性部位中的必需残基。

方法

pe0147-结构域2(残基439-587)的肽序列获自Uniprot(登录号B1R775)，用丝氨酸残基替换450位的苏氨酸残基。

T450S-Cpe0147-结构域2

表9显示T450S-Cpe0147-结构域2的肽序列。必需反应性氨基酸和附属氨基酸以黑体显示。HxDxxDxxQ肽序列基序具有下划线。

表9：T450S-Cpe0147-结构域2的肽序列

实施例7

本实施例显示Mol3的肽序列和活性部位中的必需残基的相对原子位置和原子间距离。

方法

Mol3的肽序列获自Uniprot(登录号E0QN07)。

Mol3的自发分子间酯键形成所必需的四个残基中每一个的原子的坐标数据获自Mol3-Mol4-Mol5构建体(E0QN07序列5430-5825)的未发表的X射线晶体结构。使用蛋白质数据库(PDB)常规正交坐标系。选择苏氨酸反应性残基的Cβ(CB)原子作为参考坐标(0,0,0)。

Mol3

表10显示Mol3的肽序列。必需反应性氨基酸和附属氨基酸以黑体显示。HxDxxDxxQ肽序列基序具有下划线。

表10：Mol3的肽序列

以下表11中列出苏氨酸、天冬氨酸、组氨酸和谷氨酰胺残基的原子的坐标。

表11：自发分子间酯键形成所必需的残基的相对原子位置

以下表12中列出苏氨酸的Cβ(CB)至谷氨酰胺的Cδ(CD)、组氨酸的Cγ(CG)和天冬氨酸的Cγ(CG)的原子间距离(埃)。

表12：原子间距离

实施例8

本实施例显示Mol4的肽序列和活性部位中的必需残基的相对原子位置和原子间距离。

方法

Mol4的肽序列获自Uniprot(登录号E0QN07)。

Mol4的自发分子间酯键形成所必需的四个残基中每一个的原子的坐标数据获自Mol3-Mol4-Mol5构建体(E0QN07序列5430-5825)的未发表的X射线晶体结构。使用蛋白质数据库(PDB)常规正交坐标系。选择苏氨酸反应性残基的Cβ(CB)原子作为参考坐标(0,0,0)。

Mol4

表13显示Mol4的肽序列。必需反应性氨基酸和附属氨基酸以黑体显示。HxDxxDxxQ肽序列基序具有下划线。

表13：Mol4的肽序列

以下表14中列出苏氨酸、天冬氨酸、组氨酸和谷氨酰胺残基的原子的坐标。

表14：自发分子间酯键形成所必需的残基的相对原子位置

以下表15中列出苏氨酸的Cβ(CB)至谷氨酰胺的Cδ(CD)、组氨酸的Cγ(CG)和天冬氨酸的Cγ(CG)的原子间距离(埃)。

表15：原子间距离

实施例9

本实施例显示Mol5的肽序列和活性部位中的必需残基的相对原子位置和原子间距离。

方法

Mol5的肽序列获自Uniprot(登录号E0QN07)。

Mol5的自发分子间酯键形成所必需的四个残基中每一个的原子的坐标数据获自Mol3-Mol4-Mol5构建体(E0QN07序列5430-5825)的未发表的X射线晶体结构。使用蛋白质数据库(PDB)常规正交坐标系。选择苏氨酸反应性残基的Cβ(CB)原子作为参考坐标(0,0,0)。

Mol5

表16显示Mol5的肽序列。必需反应性氨基酸和附属氨基酸以黑体显示。HxDxxDxxQ肽序列基序具有下划线。

表16：Mol5的肽序列

以下表17中列出苏氨酸、天冬氨酸、组氨酸和谷氨酰胺残基的原子的坐标。

表17：自发分子间酯键形成所必需的残基的相对原子位置

以下表18中列出苏氨酸的Cβ(CB)至谷氨酰胺的Cδ(CD)、组氨酸的Cγ(CG)和天冬氨酸的Cγ(CG)的原子间距离(埃)。

表18：原子间距离

实施例10

本实施例显示Mol6的肽序列和活性部位中的必需残基的相对原子位置和原子间距离。

方法

Mol6的肽序列获自Uniprot(登录号E0QN07)。

Mol6的自发分子间酯键形成所必需的四个残基中每一个的原子的坐标数据获自Mol5-Mol6-Mol7构建体(E0QN07序列5681-6100)的未发表的X射线晶体结构。使用蛋白质数据库(PDB)常规正交坐标系。选择苏氨酸反应性残基的Cβ(CB)原子作为参考坐标(0,0,0)。

Mol6

表19显示Mol6的肽序列。必需反应性氨基酸和附属氨基酸以黑体显示。HxDxxDxxQ肽序列基序具有下划线。

表19：Mol6的肽序列

以下表20中列出苏氨酸、天冬氨酸、组氨酸和谷氨酰胺残基的原子的坐标。

表20：自发分子间酯键形成所必需的残基的相对原子位置

以下表21中列出苏氨酸的Cβ(CB)至谷氨酰胺的Cδ(CD)、组氨酸的Cγ(CG)和天冬氨酸的Cγ(CG)的原子间距离(埃)。

表21：原子间距离

实施例11

本实施例显示Mol7的肽序列和活性部位中的必需残基的相对原子位置和原子间距离。

方法

Mol7的肽序列获自Uniprot(登录号E0QN07)。

Mol7的自发分子间酯键形成所必需的四个残基中每一个的原子的坐标数据获自Mol5-Mol6-Mol7构建体(E0QN07序列5681-6100)的未发表的X射线晶体结构。使用蛋白质数据库(PDB)常规正交坐标系。选择苏氨酸反应性残基的Cβ(CB)原子作为参考坐标(0,0,0)。

Mol7

表22显示Mol7的肽序列。必需反应性氨基酸和附属氨基酸以黑体显示。HxDxxDxxQ肽序列基序具有下划线。

表22：Mol7的肽序列

以下表23中列出苏氨酸、天冬氨酸、组氨酸和谷氨酰胺残基的原子的坐标。

表23：自发分子间酯键形成所必需的残基的相对原子位置

以下表24中列出苏氨酸的Cβ(CB)至谷氨酰胺的Cδ(CD)、组氨酸的Cγ(CG)和天冬氨酸的Cγ(CG)的原子间距离(埃)。

表24：原子间距离

实施例12

本实施例显示Mol8的肽序列和活性部位中的必需残基的相对原子位置和原子间距离。

方法

Mol8的肽序列获自Uniprot(登录号E0QN07)。

Mol8的自发分子间酯键形成所必需的四个残基中每一个的原子的坐标数据获自Mol7-Mol8-Mol9构建体(E0QN07序列5958-6383)的未发表的X射线晶体结构。使用蛋白质数据库(PDB)常规正交坐标系。选择苏氨酸反应性残基的Cβ(CB)原子作为参考坐标(0,0,0)。

Mol8

表25显示Mol8的肽序列。必需反应性氨基酸和附属氨基酸以黑体显示。HxDxxDxxQ肽序列基序具有下划线。

表25：Mol8的肽序列

以下表26中列出苏氨酸、天冬氨酸、组氨酸和谷氨酰胺残基的原子的坐标。

表26：自发分子间酯键形成所必需的残基的相对原子位置

以下表27中列出苏氨酸的Cβ(CB)至谷氨酰胺的Cδ(CD)、组氨酸的Cγ(CG)和天冬氨酸的Cγ(CG)的原子间距离(埃)。

表27：原子间距离

实施例13

本实施例显示T6105S-Mol8的肽序列和活性部位中的必需残基的相对原子位置和原子间距离。

方法

Mol8的肽序列获自Uniprot(登录号E0QN07)，用丝氨酸氨基酸替换氨基酸位置6105的苏氨酸。

T6105S-Mol8的自发分子间酯键形成所必需的四个残基中每一个的原子的坐标数据获自Mol7-T6105S-Mol8-Mol9构建体(E0QN07序列5958-6383)的未发表的X射线晶体结构。对Mol7-Mol8-Mol9的野生型DNA序列(E0QN07序列5958-6383)进行位点定向诱变来产生Mol8的T6105S变体。Mol7和Mol9结构域序列包含野生型序列。使用蛋白质数据库(PDB)常规正交坐标系。选择丝氨酸反应性残基的Cβ(CB)原子作为参考坐标(0,0,0)。

T6105S-Mol8

表28显示T6105S-Mol8的肽序列。必需反应性氨基酸和附属氨基酸以黑体显示。HxDxxDxxQ肽序列基序具有下划线。

表28：T6105S-Mol8的肽序列

以下表29中列出丝氨酸、天冬氨酸、组氨酸和谷氨酰胺残基的原子的坐标。

表29：自发分子间酯键形成所必需的残基的相对原子位置

以下表30中列出丝氨酸的Cβ(CB)至谷氨酰胺的Cδ(CD)、组氨酸的Cγ(CG)和天冬氨酸的Cγ(CG)的原子间距离(埃)。

表30：原子间距离

实施例14

本实施例显示Mol10的肽序列和活性部位中的必需残基的相对原子位置和原子间距离。

方法

Mol10的肽序列获自Uniprot(登录号E0QN07)。

Mol10的自发分子间酯键形成所必需的四个残基中每一个的原子的坐标数据获自Mol9-Mol10-Mol11构建体(E0QN07序列6247-6669)的未发表的X射线晶体结构。使用蛋白质数据库(PDB)常规正交坐标系。选择苏氨酸反应性残基的Cβ(CB)原子作为参考坐标(0,0,0)。

Mol10

表31显示Mol10的肽序列。必需反应性氨基酸和附属氨基酸以黑体显示。HxDxxDxxQ肽序列基序具有下划线。

表31：Mol10的肽序列

以下表32中列出苏氨酸、天冬氨酸、组氨酸和谷氨酰胺残基的原子的坐标。

表32：自发分子间酯键形成所必需的残基的相对原子位置

以下表33中列出苏氨酸的Cβ(CB)至谷氨酰胺的Cδ(CD)、组氨酸的Cγ(CG)和天冬氨酸的Cγ(CG)的原子间距离(埃)。

表33：原子间距离

实施例15

本实施例显示Mol11的肽序列和活性部位中的必需残基的相对原子位置和原子间距离。

方法

Mol11的肽序列获自Uniprot(登录号E0QN07)。

Mol11的自发分子间酯键形成所必需的四个残基中每一个的原子的坐标数据获自Mol9-Mol10-Mol11构建体(E0QN07序列6247-6669)的未发表的X射线晶体结构。使用蛋白质数据库(PDB)常规正交坐标系。选择苏氨酸反应性残基的Cβ(CB)原子作为参考坐标(0,0,0)。

Mol11

表34显示Mol11的肽序列。必需反应性氨基酸和附属氨基酸以黑体显示。HxDxxDxxQ肽序列基序具有下划线。

表34：Mol11的肽序列

以下表35中列出苏氨酸、天冬氨酸、组氨酸和谷氨酰胺残基的原子的坐标。

表35：自发分子间酯键形成所必需的残基的相对原子位置-Mol11

以下表36中列出苏氨酸的Cβ(CB)至谷氨酰胺的Cδ(CD)、组氨酸的Cγ(CG)和天冬氨酸的Cγ(CG)的原子间距离(埃)。

表36：原子间距离

实施例16

本实施例显示Mol9的肽序列和活性部位中的必需残基的相对原子位置和原子间距离。

方法

Mol9的肽序列获自Uniprot(登录号E0QN07)。

Mol9的自发分子间酯键形成所必需的四个残基中每一个的原子的坐标数据获自Mol9-Mol10-Mol11构建体(E0QN07序列6247-6669)的未发表的X射线晶体结构。使用蛋白质数据库(PDB)常规正交坐标系。选择苏氨酸反应性残基的Cβ(CB)原子作为参考坐标(0,0,0)。

Mol9

表37显示Mol9的肽序列。必需反应性氨基酸和附属氨基酸以黑体显示。HxDxxDxxQ肽序列基序具有下划线。

表37：Mol9的肽序列

以下表38中列出丝氨酸、天冬氨酸、组氨酸和谷氨酰胺残基的原子的坐标。

表38：自发分子间酯键形成所必需的残基的相对原子位置-Mol9

以下表39中列出苏氨酸的Cβ(CB)至谷氨酰胺的Cδ(CD)、组氨酸的Cγ(CG)和天冬氨酸的Cγ(CG)的原子间距离(埃)。

表39：原子间距离

实施例17

本实施例显示通过以特定顺序连接在一起形成柄或主干样多聚体结构的改造的羞怯动弯杆菌(Mol)结构域间的自发酯键形成，制备具有“主干”结构的共价连接多聚体蛋白复合物。

方法

修饰Mol7、Mol8、Mol9、Mol10和Mol11的Ig样结构域，由此使各单构建体的结构域边界迁移，使得Mol7至Mol10构建体缺乏它们自身的最后一条β-链，各Mol构建体在N端延伸至包括前一个Mol结构域的最后一条β-链，在本文中也称为链互补序列。将His_6-标记和rTEV切割基序融合至各N端延伸，表达各蛋白质，并用固定化金属亲和层析(IMAC)树脂从粗细菌裂解物分离，然后用rTEV蛋白酶去除His_6-标记。

下文表40中及图23中显示用于本实施例的经修饰的Mol构建体Mol7a-Mol11的氨基酸序列。在各序列中，HisTag和rTEV切割结构域以斜体显示，Mol主干结构域以常规字体显示，链互补区具有下划线，反应性残基和附属残基以黑体显示。Mol7a结构域构建体缺乏N端链互补序列，而Mol11结构域构建体包含具有N端Mol10链互补序列的天然Mol11结构域。

表40：Mol构建体的肽序列

在混合在一起时，各构建体通过链互补和酯键形成以特定顺序与其他构建体连接(参见图21A)，重新形成与天然结构域结构相当的结构，如图21A和图21B中所示。

通过在优化的反应缓冲液(50mM HEPES pH 7.0,10mM NaCl,100μM CaCl₂和20％甘油)中加入等摩尔量的Mol结构域24小时来测试各构建体的特异性。通过SDS-PAGE分析成键。

结果

SDS-PAGE分析显示酯键仅在毗连对间形成(图22)，也就是说，共价结合蛋白质构建体汇集存在于天然蛋白质中的Ig样结构域。非毗连对间不存在酯键形成。在混合全部四个构建体时，形成与四个构建体的总和一致的共价复合物。

讨论

本实施例显示，可以通过选择各个组成构建体间的适当互补性来制备具有所希望得到的确定结构的多聚体蛋白复合物。在此，从Mol Ig样蛋白质的β-clasp结构域选择互补氨基酸序列使得能够定向连接并形成提供主干样支架的多聚体蛋白复合物。此外，甚至在所有各成分都存在于单个反应中时，也可以达到所希望得到的确定结构。

实施例18

本实施例显示功能活性(“价”)置于所希望的相互关系中的具有“树样”结构的多价多聚体蛋白复合物的形成。

在此，将Mol主干结构域改造为携带捕获具有特异性酯键肽标记的货物蛋白质的Cpe0147Ig样结构域2(Cpe2)分支结构域。改造的嵌合Mol-Cpe2(即羞怯动弯杆菌-产气荚膜梭菌Cpe0147Ig样结构域2)构建体和货物蛋白质间自发形成的酯键将各组分以特定顺序连接在一起，形成具有树样结构的多聚体蛋白复合物。

方法

将来自实施例17的Mol7、Mol8、Mol9、Mol10和Mol11的Ig样结构域改造为与之前在实施例1中所述的Cpe2结构域组合。在此，使Cpe2结构域与螺旋接头(HL)融合，使螺旋接头与各结构域的N端链互补肽的N端融合(Cpe2-HL-Mol)。这形成了这样的构建体，其中Mol主干结构域和Cpe2分支结构域由α-螺旋接头分隔开(图24)。

下文表41中及图28中显示本实施例中制备的Cpe2-HL-Mol构建体的氨基酸序列。在各序列中，HisTag和rTEV切割结构域以斜体显示，Cpe2分支结构域具有下划线，螺旋接头结构域以下划线斜体显示，Mol主干结构域以常规字体显示。含有Mol7b的构建体包含本文所述HXDXX[D/S]XX[Q/E](SEQ ID NO.56)共有序列的一个实例，即HXDXXSXX[Q/E](SEQ IDNO.57)肽序列基序。

表41：Cpe2-HL-Mol构建体的肽序列

用N端C2pept标记改造T抗原货物蛋白质(C2pept-T蛋白质)。使用了由酿脓链球菌(S.pyogenes)的不同菌株天然表达的四种不同的T抗原，以产生四种不同的C2pept-T蛋白质构建体。

下文表42中及图29中显示这些C2pept-T构建体的氨基酸序列。在各序列中，HisTag和rTEV切割结构域以斜体显示，C2pept标记和接头具有下划线，螺旋结构域以下划线斜体显示，Mol主干结构域以常规字体显示。

表42：C2pept-T构建体的肽序列

分别表达和纯化蛋白质构建体。各成分以His_6-标记和rTEV切割基序融合至构建体的N端表达(即His6-rTEV-Cpe样-HL-Mol和His6-rTEV-pept-T18.1)。用固定化金属亲和层析从粗细菌裂解物分离重组蛋白质，随后用rTEV蛋白酶从除T18.1外的所有蛋白质构建体去除His_6-标记。

作为大纲，按以下制备多聚体蛋白复合物。首先按图25A)中所示分别将各Cpe2-HL-Mol构建体连接至配对的C2pept-T蛋白质，使得不同的T抗原连接至每个独特的Cpe2-HL-Mol构建体。然后按图25B中所示将这些分开的反应物混合在一起，由此主干结构域通过之前上文实施例16中所述的链互补和自发酯键形成以特定顺序结合和连接在一起。这形成了图25C中所示的通过酯键共价连接并在分支端展示T抗原的具有树样结构的多聚体蛋白复合物。

首先在分开的反应中将等摩尔量的各Cpe2-HL-Mol构建体连接至配对的C2pept-T蛋白质。取出整分试样用于通过SDS-PAGE验证成键。

在下一个步骤中，将所有单个连接的T蛋白质-Cpe2-HL-Mol构建体混合在一起。孵育24小时后，通过IMAC纯化多聚体蛋白复合物来去除任何部分形成的支架和任何单体蛋白质。仅T18.1蛋白质保留His标记，因为其他构建体上的所有His亲和标记都用rTEV蛋白酶去除，因此仅包含T18.1的复合物保留在亲和柱上。

结果

SDS-PAGE分析(图26)显示，在将各C2pept-T蛋白质货物与互补Cpe2-HL-Mol构建体混合时，Cpe2结构域和C2pept-T蛋白质间形成酯键。尤其参见图26的泳道C、F、I和L，其中在图26中标识为“交联T抗原-分支-主干”的位置处可以容易地看到各高MW共价结合Cpe2-HL-Mol-C2pept-T蛋白质。

图27中显示第二连接步骤的代表性结果，其中将四种Cpe2-HL-Mol-C2pept-T蛋白质混合在一起，孵育，然后通过IMAX纯化。

在IMAC之前的孵育样品(图27，泳道A)中、以及流穿和洗脱级分(图27，分别为泳道B和C)中观察到了高分子量种类。来自IMAC纯化的洗脱蛋白质包含图27泳道C中所示的两种主要蛋白质种类。观察到了>250kDa的主要高MW复合物，约70kDA的较小MW复合物。这些分子量分别与290kDa处的多价多聚体蛋白质复合物(即图25C中所示的完全形成的多聚体蛋白复合物)的理论质量和69.1kDa处的单体T18.1-Cpe2-HL-Mol7构建体的理论分子量对应得非常好。

通过大小排阻层析(SEC)分开这两个种类，分别如图27泳道D和E中所示。

讨论

本实施例显示，可以通过单个成分构建体间的适当互补性来制备具有确定的、希望得到的结构且在预定位置携带不同货物蛋白质的多聚体蛋白复合物。在此，从Mol Ig样蛋白质的β-clasp结构域选择互补氨基酸序列使得能够定向连接和形成提供主干样支架的多聚体蛋白复合物，其中每个不同的“主干”成分通过特异性Cpe2-C2pept结合配偶体间的进一步共价连接携带特定的功能性蛋白质货物。

在这种情况下，首先在分开的反应中制备单个单价多聚体蛋白质构建体(“主干-分支-货物”蛋白质构建体)，其中各单价构建体具有单个不同抗原。然后通过在单个第二反应中组合多个单价多聚体蛋白质构建体来形成希望得到的具有确定结构的多价多聚体蛋白复合物。通过适当选择连接配偶体间的互补性和通过适当排序连接反应，可以容易地修改存在于多价多聚体蛋白质中的不同功能活性间的结构关系。

实施例19

本实施例显示具有置于所希望得到的相互关系的功能活性的具有“树样”结构的多聚体蛋白复合物的形成。

在此，将Mol主干结构域改造为携带源自来自产气荚膜梭菌以外的物种的细菌黏附素的多种Cpe样分支结构域，其中各Cpe样分支结构域具有共价连接的肽标记。Cpe样分支结构域和它们的特异性肽标记货物(此处为增强型绿色荧光蛋白eGFP)间自发形成的酯键使得各成分能够以特定顺序连接在一起，形成具有树样结构的多价多聚体蛋白复合物。

方法

Cpe样结构域克隆自以下来源：

Geberg1-Gemella bergeriae ATCC 700627,ACCESSION AWVP01000087

Gberg2-Gemella bergeriae ATCC 700627,ACCESSION ERK56535

Corio-Coriobacteriaceae bacterium 68-1-3,ACCESSION NZ_CP009302

改造Mol7、Mol8、Mol9、Mol10和Mol11的Ig样结构域(上文实施例18中所述)，使Cpe样结构域通过螺旋接头与各结构域的N端链互补肽的N端融合(例如Corio-HL-Mol，图30A)。下文表43中及图33中显示本实施例中制备的Cpe样-HL-Mol构建体的氨基酸序列。在各序列中，HisTag和rTEV切割结构域以斜体显示，Cpe样分支结构域具有下划线，螺旋接头结构域以下划线斜体显示，Mol主干结构域以常规字体显示。

表43：Cpe样-HL-Mol构建体的肽序列

改造GFP货物蛋白质，使其各在其N端具有与上文所列的Cpe样结构域互补的特异性Cpe样pept标记，以产生四种不同Cpe样pept-GFP蛋白质构建体。下文表44中及图34中显示四种不同的Cpe样pept-GFP构建体的氨基酸序列。在各序列中，HisTag和rTEV切割结构域以斜体显示，Cpe样pept标记和接头具有下划线，GFP结构域以常规字体显示。

表44：Cpe样pept-GFP构建体的肽序列

分别纯化构建体，然后混合并组装为具有“树样”结构的多聚体蛋白质支架复合物。各成分以His_6-标记和rTEV切割基序融合至构建体的N端表达(即His6-rTEV-Cpe样-HL-Mol和His6-rTEV-pept-GFP)。用固定化金属亲和层析从粗细菌裂解物分离重组蛋白质，随后用rTEV蛋白酶去除His_6-标记。

作为大纲，按以下制备多聚体蛋白复合物。首先按图30A中所示分别将各Cpe样-HL-Mol构建体连接至配对的Cpe样pept-GFP蛋白质，使得GFP官能团连接至每个独特的Cpe样-HL-Mol构建体(例如Corio-pept-GFP)。然后按图30B中所示将这些分开的反应物混合在一起，由此主干结构域通过链互补和自发酯键形成以特定顺序结合和连接在一起。这形成了图30C中所示的通过酯键共价连接并在分支端展示GFP官能团的具有树样结构的多价多聚体蛋白复合物。

首先在分开的反应中将等摩尔量的各Cpe样-HL-Mol构建体连接至配对的Cpe样pept-GFP蛋白质。孵育24小时后，组合四种单GFP-Cpe样-HL-Mol连接组装连同封闭Mol11结构域。取出整分试样用于通过SDS-PAGE验证成键。

在下一个步骤中，将各个反应物混合在一起来探究连接产物形成。

结果

各个反应的SDS-PAGE分析(图31)显示，在将各Cpe样pept-GFP货物蛋白质与互补Cpe样-HL-Mol构建体混合时，Cpe样结构域和pept-GFP蛋白质间形成酯键。参见图31中标记“交联GFP分支二聚体”的位置处泳道G、H、I和J中的高MW种类。

孵育24小时后，四种单GFP-Cpe样-HL-Mol连接组装连同封闭Mol11结构域组合。Mol主干结构域通过链互补结合形成具有“树样”结构的多价多聚体蛋白复合物，然后其通过酯键形成共价连接，以产生共价连接的多聚体蛋白质。

如在图32中可容易地看到，在混合各个反应物时，随着各连续GFP-Cpe样-HL-Mol复合物的加入，连接产物的质量逐步增加。参见例如图32的泳道D、E、F和G。最终产物是以特定顺序共价连接在一起的9种单蛋白质的复合物-参见标记“完整树”的位置处泳道G中的高MW种类。

讨论

本实施例显示，通过各个成分构建体间的适当互补性，可以制备具有希望得到的确定结构且在预定位置携带多个货物蛋白质的多价多聚体蛋白复合物。在此，从来自不同细菌物种的Ig样结构域的β-clasp结构域选择互补氨基酸序列，使得能够定向连接并形成提供主干样支架的多聚体蛋白复合物，其中每种不同的“主干”成分通过特异性Cpe样-Cpe样pept结合配偶体间的进一步共价连接携带功能性蛋白质货物。

在这种情况下，首先在分开的反应中制备各个单价多聚体蛋白质构建体(“主干-分支-货物”蛋白质构建体)，其中各单价构建体具有蛋白自官能团。然后通过在多个逐步反应中组合多个单价多聚体蛋白质构建体来形成希望得到的具有确定结构的多价多聚体蛋白复合物。通过适当选择连接配偶体间的互补性和通过适当排序连接反应，可以容易地修改存在于多价多聚体蛋白质中的功能活性间的结构关系。

实施例20

本实施例证明多蛋白质货物的功能活性及这些蛋白质官能团通过形成功能活性置于所希望的相互关系中的具有“树样”结构的多价多聚体蛋白复合物的共定位。

方法

通过Western印迹和ELISA分析了按实施例18中所述制备的包含多价T抗原的多聚体蛋白复合物的免疫原性。

通过SDS-PAGE电泳多聚体蛋白复合物的整分试样(如上文实施例18中所述及图27中所示)，并用标准技术转移至膜进行Western印迹分析。用单个重组T抗原蛋白质或完整多价多聚体蛋白复合物(例如图27泳道D中标识为“交联T抗原树”的种类)包被ELISA平板。然后用T抗原的抗血清孵育平板：T1分型血清对T1抗原特异，T6分型血清对T6抗原特异，T18分型血清对T18抗原特异。还使用了T18特异性单克隆FABαE3，其仅与重组T18或T抗原树反应。用重组T6蛋白质作为阴性对照，因为此T抗原是多聚体蛋白质的部分。

结果

Western印迹分析(数据未显示)确定，多价多聚体蛋白复合物显示与T抗血清的免疫原性，确认T抗原与多价多聚体蛋白复合物共定位。

ELISA结果显示在图35中。T1分型血清结合T1重组蛋白质和多价多聚体蛋白质，但不结合T18或T6重组蛋白质。类似地，T18分型血清和T18特异性FABαE3都结合重组T18蛋白质和多价多聚体蛋白质。T6分型血清未显示与多价多聚体蛋白质的反应性，与T6抗原不存在于多价多聚体蛋白质上一致。

讨论

这些结果清楚地显示，在存在于本文所述的多价多聚体蛋白复合物中时，蛋白质货物的功能得以保持。上文报道的Western印迹分析确定蛋白质复合物中存在包含组成T抗原的线性表位。此外，在非变性条件下进行的ELISA确定存在于多价多聚体复合物中的抗原保持其天然构象和免疫原功能性。

本实施例显示，在各T抗原“价”的免疫原性功能的情况下，多蛋白质货物的功能得以维持，并由本文所述多聚体蛋白复合物呈递。因此，提供其中每个不同“主干”成分携带功能性蛋白质货物的主干样支架的多聚体蛋白复合物的定向连接和形成使得能够以确定、有结构的方式呈递和共定位多种功能性。

产业应用

本发明提供允许受控组装和去组装多聚体复合物，尤其是共价连接的多聚体蛋白复合物的肽和蛋白质连接技术。本发明因此在包括生物医学、药物、诊断、工程、农业和园艺领域的范围广泛的产业中具有应用。

在前述描述中提到具有已知等同物的元素或整数时，则包括这类等同物，就如同单独提到它们一样。

虽然以实例的方式并参考具体实施方案描述了本发明，但应理解可以进行修改和/或改善而不背离本发明的范围或精神。

此外，在按照Markush组描述本发明的特征或方面时，本领域技术人员将认识到，由此也按照Markush组的任意单个成员或成员亚组描述了本发明。

出版物

Kwon,H.；Squire,C.J.；Young,P.G.；Baker,E.N.,Autocatalytically generatedThr-Gln ester bond cross-links stabilize the repetitive Ig-domain shaft of abacterial cell surface adhesin.P Natl Acad Sci USA 2014,111(4),1367.

Lee,H.；DeLoache,W.C.；Dueber,J.E.,Spatial organization of enzymes formetabolic engineering.Metab Eng 2012,14(3)242-251

Horn,A.H.C.；Sticht,H.,Synthetic protein scaffolds based on peptidemotifs and cognate adaptor domains for improving metabolicproductivity.Frontiers in Bioengineering and Biotechnology,2015,3(191),1-7

Chen,R.Chen,Q.；Kim,H.；Siu,K.H.；Sun,Q.；Tsai,S.L.；Chen,W.,Biomolecularscaffolds for enhanced signalling and catalytic efficiency.Curr Opin Biotech2014,28,59-68

Ting,Y.T.；Batot,G.；Baker,E.N.；Young,P.G.Actacrystallographica.Section F,Structural biology communications 2015,71,61

Wu,P.S.C.；Otting,G.J.Magn.Reson.2005,176,115

Petoukhov,M.V.；Franke,D.；Shkumatov,A.V.；Tria,G.；Kikhney,A.G.；Gajda,M.；Gorba,C.；Mertens,H.D.；Konarev,P.V.；and Svergun,D.I.J ApplCrystallogr.2012,45,342.

Doublie S,Carter C.(1992)Preparation of Selenomethionyl ProteinCrystals.Oxford University Press.New York.

Kabsch,W.(2010).XDS.Acta Cryst.D66,125-132.

Evans,P.R.&Murshudov,G.N.(2013)Acta Cryst.D69,1204-1214

A short history of SHELX".Sheldrick,G.M.(2008).Acta Cryst.A64,112-122

Emsley,P.,Lohkamp,B.,Scott,W.G.&Cowtan,K.(2010).Acta Cryst.D66,486–501.

Murshudov G.N.,Skubák P.,Lebedev A.A.,Pannu N.S.,Steiner R.A.,Nicholls R.A.,Winn M.D.,Long,F.&Vagin,A.A.(2011).Acta Cryst.D67,355-367.

Chen V.B.,Arendall W.B.3rd,Headd J.J.,Keedy D.A.,Immormino R.M.,Kapral,G.J.,Murray,L.W.,Richardson,J.S.&Richardson,D.C.(2010).Acta Cryst.D66,12–21.

Claims

1.肽标记和结合配偶体对，其中：

a)肽标记由如下所示的氨基酸序列组成：

SEQ ID NO：1、2、4、20-29或31-54中任一项；以及

b)所述结合配偶体由如下所示的氨基酸序列组成：

SEQ ID NO：1、3、4、20-29或31-54中任一项；

并且其中下述之一：

i)(a)中的反应性残基是丝氨酸或苏氨酸，且(b)中的反应性残基是谷氨酰胺或谷氨酸盐/谷氨酸；或

ii)(a)中的反应性残基是谷氨酰胺或谷氨酸盐/谷氨酸，并且(b)中的反应性残基是丝氨酸或苏氨酸；

并且其中所述肽标记和结合配偶体彼此仅通过反应性残基之间的分子间酯键共价连接；

并且其中所述肽标记或结合配偶体或肽标记和结合配偶体二者共价连接至1个或多个异源氨基酸序列。

2.权利要求1的肽标记和结合配偶体对，其中两个反应性残基间形成的酯键是可逆水解的。

3.权利要求1或2的肽标记和结合配偶体对，其中两个反应性残基间形成的酯键在pH高于7时是可逆水解的。

4.权利要求1至3中任一项的肽标记和结合配偶体对，其中所述肽标记由SEQ ID NO：2、4、20-29或31-54中任一项所示的氨基酸序列组成。

5.权利要求1至4中任一项的肽标签和结合配偶体对，其中结合配偶体由SEQ ID NO：3、4、20-29或31-54中任一项所示的氨基酸序列组成。

6.根据权利要求1至5中任一项所述的肽标记和结合配偶体对，其中所述肽标记由SEQID NO：2、4、37-41或46-50中任一项所示的氨基酸序列组成。

7.根据权利要求1至6中任一项所述的肽标记和结合配偶体对，其中所述结合配偶体由SEQ ID NO：3、4、37-41或46-50中任一项所示的氨基酸序列组成。

8.权利要求1至7中任一项的肽标记和结合配偶体对，其中一个或两个肽标记和结合配偶体对包含一个或多个促进自发分子间酯键形成的氨基酸残基。

9.权利要求8的肽标记和结合配偶体对，其中一个或多个促进自发分子间酯键形成的氨基酸残基与反应性残基一起存在于β-链形成氨基酸序列中。

10.权利要求1至9中任一项的肽标记和结合配偶体对，其中谷氨酰胺或谷氨酸盐/谷氨酸反应性残基存在于氨基酸序列HXDXXDXX[Q/E](SEQ ID NO.30)中，或存在于氨基酸序列[H/E]XDXX[D/S]XX[Q/E](SEQ ID NO.55)中，或存在于氨基酸序列HXDXX[D/S]XX[Q/E](SEQID NO.56)中，或存在于氨基酸序列HXDXXSXX[Q/E](SEQ ID NO.57)中，或存在于氨基酸序列[H/E]XDXXXXX[Q/E](SEQ ID NO.58)中，其中X是任何氨基酸。

11.权利要求1至10中任一项的肽标记和结合配偶体对，其中含有谷氨酰胺反应性氨基酸残基或谷氨酸盐/谷氨酸反应性氨基酸残基的结合配偶体包含促进自发分子间酯键形成的组氨酸氨基酸残基，其中组氨酸在谷氨酰胺或谷氨酸盐/谷氨酸反应性残基的约6、约5.5、约5、约4.5、约4、约3.5、约3、约2.5或约2埃内。

12.权利要求11的肽标记和结合配偶体对，其中在结合配偶体接触时，促进自发分子间酯键形成的组氨酸在苏氨酸或丝氨酸反应性残基的约5、约4.5、约4、约3.5、约3、约2.5或约2埃内。

13.权利要求1至12中任一项的肽标记和结合配偶体对，其中在接触时，肽标记和结合配偶体形成丝氨酸蛋白酶活性部位样结构，并且其中丝氨酸蛋白酶活性部位样结构包含存在于活性部位中的反应性氨基酸残基，其在蛋白质数据库常规正交坐标系中具有以下相对原子位置：

a)Cβ(CB)Thr/Ser:0,0,0；

b)Cδ(CD)Gln/Glu:0.02,1.91.-1.61；

并且其中丝氨酸蛋白酶活性部位样结构包含存在于活性部位中的附属氨基酸残基，其相对于反应性Thr/Ser Cβ(CB)位置具有以下Cγ(CG)位置：

c)His:1.35,3.67,3.34；

d)Asp:-3.45,-0.89,-2.19。

14.权利要求1至13中任一项的肽标记和结合配偶体，其中异源氨基酸序列中的至少一个包含酶、抗原、结构蛋白、抗体、细胞因子或受体。

15.权利要求1至14中任一项的肽标记和结合配偶体对，其中异源氨基酸序列中的至少一个包含抗原。

16.权利要求1至15中任一项的肽标记和结合配偶体对，其中异源氨基酸序列中的至少一个包含2个或更多个包含抗原。

17.权利要求1至16中任一项的肽标记和结合配偶体对，其中异源氨基酸序列中的至少一个包含来自异源蛋白质的至少8个连续氨基酸。