ES2880336T3

ES2880336T3 - Métodos y productos para la síntesis de proteínas de fusión

Info

Publication number: ES2880336T3
Application number: ES16728359T
Authority: ES
Inventors: Mark Howarth
Original assignee: Oxford University Innovation Ltd
Current assignee: Oxford University Innovation Ltd
Priority date: 2015-06-05
Filing date: 2016-06-03
Publication date: 2021-11-24
Anticipated expiration: 2036-06-03
Also published as: JP2018521640A; CN108026148A; EP3303374A1; WO2016193746A1; CN116199733A; CN108026148B; AU2016272543A1; CA2987821A1; US20180244730A1; BR112017026042A2; DK3303374T3; AU2016272543B2; KR20180050640A; EP3303374B1; GB201509782D0; JP6883529B2; US10526379B2

Abstract

Método para producir una proteína de fusión, en el que dicho método comprende: a) poner en contacto una Cebadora proteína con una segunda proteína bajo condiciones que permiten la formación de un enlace isopeptídico entre dichas proteínas, en el que dicha Cebadora proteína y dicha segunda proteína comprenden, cada una, un conector peptídico, en el que dichos conectores peptídicos son un par de conectores peptídicos que reaccionan formando un enlace isopeptídico que une dicha Cebadora proteína a dicha segunda proteína para formar una proteína unida, y b) poner en contacto la proteína unida de (a) con una tercera proteína bajo condiciones que permiten la formación de un enlace isopeptídico entre dicha tercera proteína y dicha proteína unida, en el que dicha tercera proteína comprende un conector peptídico que reacciona con un conector peptídico adicional en la proteína unida de (a), y en el que dichos conectores peptídicos son un par de conectores peptídicos que reaccionan formando un enlace isopeptídico que une dicha tercera proteína a dicha proteína unida formando una proteína de fusión, en el que dicho par de conectores peptídicos utilizado en (a) es ortogonal al par de conectores peptídicos utilizado en (b), y en el que los pares ortogonales de conectores peptídicos se seleccionan de cualquiera de entre: (1) un conector peptídico que comprende una secuencia de aminoácidos tal como se indica en la SEC ID nº 1 o una secuencia con una identidad de secuencia de por lo menos 70% respecto a una secuencia de aminoácidos tal como se indica en la SEC ID nº 1, en la que dicha secuencia de aminoácidos comprende un residuo de lisina en la posición 9 y un conector peptídico que comprende una secuencia de aminoácidos tal como se indica en la SEC ID nº 2 o una secuencia con una identidad de secuencia de por lo menos 70% respecto a una secuencia de aminoácidos tal como se indica en la SEC ID nº 2, en la que dicha secuencia de aminoácidos comprende un residuo de glutamato o aspartato en la posición 55, un residuo de treonina en la posición 94, un residuo de glicina en la posición 100 y un residuo de asparagina o aspartato en la posición 106, (2) un conector peptídico que comprende una secuencia de aminoácidos tal como se indica en la SEC ID nº 5 o una secuencia con una identidad de secuencia de por lo menos 70% respecto a una secuencia de aminoácidos tal como se indica en la SEC ID nº 5, en la que dicha secuencia de aminoácidos comprende un residuo de aspartato o asparagina en la posición 8 y un conector peptídico que comprende una secuencia de aminoácidos tal como se indica en la SEC ID nº 6 o una secuencia con una identidad de secuencia de por lo menos 70% respecto a una secuencia de aminoácidos tal como se indica en la SEC ID nº 6, en la que dicha secuencia de aminoácidos comprende un residuo de lisina en la posición 8, (3) un conector peptídico que comprende una secuencia de aminoácidos tal como se indica en la SEC ID nº 9 o una secuencia con una identidad de secuencia de por lo menos 70% respecto a una secuencia de aminoácidos tal como se indica en la SEC ID nº 9, en la que dicha secuencia de aminoácidos comprende un residuo de asparagina o aspartato en la posición 17 y un conector peptídico que comprende una secuencia de aminoácidos tal como se indica en la SEC ID nº 10 o una secuencia con una identidad de secuencia de por lo menos 70% respecto a una secuencia de aminoácidos tal como se indica en la SEC ID nº 10, en la que dicha secuencia de aminoácidos comprende un residuo de lisina en la posición 9 y un residuo de glutamato o aspartato en la posición 70, (4) un conector peptídico que comprende una secuencia de aminoácidos tal como se indica en la SEC ID nº 109 o una secuencia con una identidad de secuencia de por lo menos 70% respecto a una secuencia de aminoácidos tal como se indica en la SEC ID nº 109, en la que dicha secuencia de aminoácidos comprende un residuo de asparagina o aspartato en la posición 17, un residuo de glicina en la posición 11 y opcionalmente un residuo de isoleucina en la posición 20, un residuo de prolina en las posiciones 21 y 22 y un residuo de lisina en la posición 23, y un conector peptídico que comprende una secuencia de aminoácidos tal como se indica en la SEC ID nº 10 o una secuencia con una identidad de secuencia de por lo menos 70% respecto a una secuencia de aminoácidos tal como se indica en la SEC ID nº 10, en la que dicha secuencia de aminoácidos comprende un residuo de lisina en la posición 9 y un residuo de glutamato o aspartato en la posición 70, (5) un conector peptídico que comprende una secuencia de aminoácidos tal como se indica en la SEC ID nº 13 o una secuencia con una identidad de secuencia de por lo menos 70% respecto a una secuencia de aminoácidos tal como 0 se indica en la SEC ID nº 13, en la que dicha secuencia de aminoácidos comprende un residuo de aspartato o asparagina en la posición 7 y un conector peptídico que comprende una secuencia de aminoácidos tal como se indica en la SEC ID nº 14 o una secuencia con una identidad de secuencia de por lo menos 70% respecto a una secuencia de aminoácidos tal como se indica en la SEC ID nº 14, en la que dicha secuencia de aminoácidos comprende un residuo de glutamato o aspartato en la posición 56 , y un residuo de lisina en la posición 10, y 5 (6) un conector peptídico que comprende una secuencia de aminoácidos tal como se indica en la SEC ID nº 13 o una secuencia con una identidad de secuencia de por lo menos 70% respecto a una secuencia de aminoácidos tal como se indica en la SEC ID nº 13, en la que dicha secuencia de aminoácidos comprende un residuo de aspartato o asparagina en la posición 7 y un conector peptídico que comprende una secuencia de aminoácidos tal como se indica en la SEC ID nº 33 o una secuencia con una identidad de secuencia de por lo menos 70% respecto a una secuencia de aminoácidos tal como se indica en la SEC ID nº 33, en la que dicha secuencia de aminoácidos comprende un residuo de lisina en la posición 8, en la que los pares ortogonales de conectores peptídicos comprenden (1) y (4), (1) y (5), (1) y (6), (1) y (3), (1) y (2), (2) y (5), (2) y (6), (3) y (5), (3) y (6), (4) y (5) o (4) y (6).

Description

DESCRIPCIÓN

Métodos y productos para la síntesis de proteínas de fusión

La presente invención se refiere a la síntesis (es decir, la producción, generación o ensamblaje) de una proteína de fusión (es decir, un polímero que comprende dos o más proteínas unidas covalentemente, tal como se define posteriormente) y, en particular, a la síntesis modular (p.ej., escalonada) de una proteína de fusión mediante la utilización de pares ortogonales de conectores peptídicos que reaccionan formando enlaces isopeptídicos. La invención se refiere a la provisión de un nuevo método de síntesis de proteínas de fusión, particularmente a la síntesis en fase sólida. El método puede utilizarse ventajosamente en la producción de una diversidad de productos que comprenden proteínas de fusión, p.ej., matrices de proteínas de fusión. La presente invención se refiere además a conectores peptídicos y a la utilización de pares ortogonales de dichos conectores en la síntesis de proteínas de fusión. Se proporcionan además las proteínas recombinantes que comprenden dichos conectores, moléculas de ácidos nucleicos codificantes de dichas proteínas y conectores, vectores que comprenden dichas moléculas de ácidos nucleicos y células huésped que comprenden dichos vectores y moléculas de ácidos nucleicos. Se proporciona además un kit que comprende dichos polipéptidos recombinantes y/o moléculas/vectores de ácidos nucleicos. Las proteínas de fusión obtenidas mediante el método de la invención y productos, p.ej., matrices y bibliotecas, que comprenden dichas proteínas de fusión también se encuentran contempladas.

Los sucesos biológicos habitualmente dependen de la actividad colaborativa de múltiples proteínas y la disposición precisa de las proteínas en complejos influye y determina su función. De esta manera, la capacidad de disponer proteínas individuales en un complejo de una manera controlada representa una herramienta útil para caracterizar las funciones de las proteínas. Además, la conjugación de múltiples proteínas para formar una denominada "proteína de fusión" puede resultar en moléculas con características útiles. Por ejemplo, la agregación de un único tipo de proteína con frecuencia potencia en gran medida las señales biológicas, p.ej., las estructuras de antígenos repetidas en las vacunas. La agregación de proteínas con diferentes actividades puede resultar además en complejos con actividades mejoradas, p.ej., la canalización de sustratos por enzimas.

Sin embargo, la agregación de diferentes tipos de proteínas en "proteínas de fusión" artificiales precisas se ha enfrentado a numerosos problemas. Por ejemplo, pueden unirse genéticamente proteínas individuales o dominios de proteínas en un marco de lectura abierta largo, aunque los errores en la síntesis de proteínas y el pliegue incorrecto rápidamente se convierten en limitantes. Los métodos alternativos se han centrado en expresar proteínas o dominios de proteínas individualmente, para después unir estos "módulos" o "unidades" entre sí. Por ejemplo, los métodos se han centrado en modificar las proteínas para que contengan parejas de interacción bien caracterizadas, tales como biotina/avidina, permitiendo de esta manera que las proteínas formen complejos mediante interacciones no covalentes. Otros métodos se han basado en grupos reactivos dentro de las proteínas, particularmente residuos de cisteína, para unir proteínas mediante enlaces covalentes, es decir, puentes disulfuro. Sin embargo, incluso los mejores enlaces no covalentes o enlaces covalentes reversibles permiten la reorganización de las proteínas de fusión. De acuerdo con lo anteriormente expuesto, los métodos existentes son limitados, en la medida en que habitualmente resultan en mezclas no definidas de proteínas de fusión que resultan difíciles de separar y/o proteínas de fusión que no son estables en una diversidad de medios, p.ej., bajo condiciones reductoras.

La técnica anterior proporciona, p.ej., un método para el ensamblaje ordenado secuencial de más de dos fracciones mediante enlaces isopeptídicos mediante la eliminación controlada de grupos bloqueantes (Dixon et al., Bioorganic & Medicinal Chemistry 21: 3421-9, 2013). Fairhead et al., J. Am. Chem. Soc. 136(35): 12355-63, 2014 describen la utilización combinada de un par de conectores autoensamblantes que crea un enlace covalente, con una fuerte unión no covalente, para controlar el ensamblaje de más de dos fracciones en un orden dirigido.

Entre las características importantes de un sistema para sintetizar proteínas de fusión se incluyen conexiones definidas molecularmente entre las proteínas individuales (es decir, módulos, dominios o unidades) dentro de dicha proteína de fusión, con independencia de cualquier molde, y la expresión simple de cada proteína (es decir, módulo, dominio o unidad). También resulta altamente deseable presentar un rendimiento prácticamente cuantitativo de cada reacción a fin de minimizar la síntesis involuntaria de productos heterogéneos después de sólo unas cuantas etapas, lo que es una consecuencia común de las cadenas incompletas dentro de la mezcla. También resulta preferente que los módulos individuales se modifiquen con etiquetas peptídicas relativamente pequeñas y no con dominios de fusión de proteínas grandes, para una disrupción mínima de la función de cada módulo dentro de la proteína de fusión. Sin embargo, ningún método de síntesis de proteínas de fusión actual ha podido satisfacer dichos criterios.

De esta manera, existe una necesidad y deseo de un método mejorado de síntesis de proteínas de fusión, y ahora se ha encontrado que pueden utilizarse conectores peptídicos que forman enlaces isopeptídicos para generar enlaces covalentes irreversibles en un método modular (p.ej., en etapas) y de alto rendimiento para sintetizar una proteína de fusión.

Los enlaces isopeptídicos son enlaces amida formados entre grupos carboxilo/carboxamida y amino, en los que por lo menos uno de los grupos carboxilo o amino se encuentra fuera de la cadena principal de la proteína (el esqueleto de la proteína). Dichos enlaces son químicamente irreversibles bajo condiciones biológicas y son resistentes a la mayoría de proteasas. De hechos, los enlaces isopeptídicos entre proteínas se ha demostrado que son la interacción proteica medida más fuerte.

La formación de enlaces isopeptídicos puede estar catalizada enzimáticamente, por ejemplo por enzimas transglutaminasas. Los enlaces isopeptídicos se encuentran comúnmente en medios naturales para mejorar la resistencia y/o la estabilidad de un complejo de proteínas, p.ej., para estabilizar las estructuras de matriz extracelular o reforzar los coágulos sanguíneos.

Los enlaces isopeptídicos también pueden formarse espontáneamente, tal como se ha identificado en la formación de la cápside del bacteriófago HK97 y en los pili de bacterias Gram-positivas. Se ha propuesto que la formación espontánea de enlaces isopeptídicos se produce después del pliegue de las proteínas, mediante ataque nucleofílico del grupo £-amino de una lisina en el grupo Cy de una asparagina o aspartato, fomentado por un glutamato o aspartato próximo.

Las proteínas que son capaces de formación espontánea de enlaces isopeptídicos se han utilizado ventajosamente para desarrollar pares de etiqueta peptídica/pareja de unión que se unen covalentemente entre sí y que, por lo tanto, proporcionan interacciones irreversibles (ver, p.ej., el documento n° WO2011/098772). A este respecto, las proteínas que son capaces de formación espontánea de enlaces isopeptídicos pueden expresarse en forma de fragmentos separados, proporcionando una etiqueta peptídica y una pareja de unión para la etiqueta peptídica, en donde los dos fragmentos son capaces de reconstituirse covalentemente mediante formación de enlace isopeptídico. El enlace isopeptídico formado por los pares de etiqueta peptídica y pareja de unión es estable bajo condiciones en las que las interacciones no covalentes se disociarían rápidamente, p.ej., durante periodos prolongados de tiempo (p.ej., semanas), a temperatura elevada (hasta por lo menos 95°C), bajo fuerza elevada o con un tratamiento químico riguroso (p.ej., pH 2 a 11, solventes orgánicos, detergentes o desnaturalizantes).

Brevemente, puede derivarse un par de etiqueta peptídica/pareja de unión a partir de cualquier proteína capaz de formar espontáneamente un enlace isopeptídico (una proteína isopeptídica), en la que los dominios de la proteína se expresan por separado para producir una etiqueta peptídica que comprende uno de los residuos que participa en el enlace isopeptídico (p.ej., una lisina) y una pareja de unión peptídica que comprende el otro residuo que participa en el enlace isopeptídico (p.ej., una asparagina o un aspartato). En algunos casos, uno de entre la etiqueta peptídica o la pareja de unión comprende otro u otros residuos requeridos para formar el enlace isopeptídico (p.ej., un glutamato). Sin embargo, se ha encontrado que resulta posible expresar los dominios que comprenden los residuos implicados en la formación de enlaces isopeptídicos por separado, es decir, en forma de tres péptidos separados (dominios, módulos o unidades). A este respecto, la etiqueta peptídica comprende uno de los residuos implicados en el enlace isopeptídico (p.ej., una lisina), la pareja de unión peptídica que comprende el otro residuo que participa en el enlace isopeptídico (p.ej., una asparagina o aspartato) y un tercer péptido que comprende otro u otros residuos que participan en la formación del enlace isopeptídico (p.ej., un glutamato). La mezcla de la totalidad de los tres péptidos resulta en la formación de un enlace isopeptídico entre los dos péptidos que comprenden los residuos que reaccionan para formar el enlace isopeptídico, es decir, la etiqueta peptídica y la pareja de unión. De esta manera, el tercer péptido media en la conjugación de la etiqueta peptídica y la pareja de unión, pero no forma parte de la estructura resultante, es decir, el tercer péptido no está unido covalentemente a la etiqueta peptídica o a la pareja de unión. De esta manera, el tercer péptido puede verse como una proteína ligasa o una péptido ligasa. Lo anterior resulta particularmente útil ya que minimiza el tamaño de la etiqueta peptídica y la pareja de unión que necesitan fusionarse con la proteína de interés, reduciendo de esta manera la posibilidad de interacciones no deseadas causadas por la adición de la etiqueta peptídica o la pareja de unión, p.ej., el pliegue incorrecto.

Tal como se comenta en mayor detalle posteriormente, se han identificado diversas proteínas que son capaces de formar espontáneamente uno o más enlaces isopeptídicos (una denominada "proteína isopeptídica") y pueden modificarse para producir un par de etiqueta peptídica/pareja de unión y opcionalmente una péptido ligasa, tal como se ha comentado anteriormente. Pueden identificarse proteínas adicionales que son capaces de formar espontáneamente uno o más enlaces isopeptídicos, mediante la comparación de sus estructuras con las de proteínas que es conocido que forman espontáneamente uno o más enlaces isopeptídicos. Particularmente, pueden identificarse otras proteínas que pueden formar espontáneamente un enlace isopeptídico, mediante la comparación de sus estructuras cristalinas con las de proteínas isopeptídicas conocidas, p.ej., la proteína pilina mayor Spy0128, y en particular mediante la comparación de los residuos Lys-Asn/Asp-Gly/Asp que con frecuencia participan en la formación de una proteína isopeptídica. Adicionalmente, pueden identificarse otras proteínas isopeptídicas mediante cribado para homólogos estructurales de proteínas isopeptídicas conocidas mediante la utilización del Protein Data Bank utilizando herramientas estándares de búsqueda en bases de datos. El servidor SPASM (http://eds.bmc.uu.se/eds/spana.php7spasm) puede utilizarse para reconocer el molde estructural 3D de Lys-Asn/Asp-Gly/Asp del enlace isopeptídico o también pueden identificarse proteínas isopeptídicas por homología de secuencias únicamente.

En particular, pueden diseñarse de novo proteínas que forman enlaces isopeptídicos, tal como se indica en el documento n° WO2011/098772. Puede utilizarse Rosetta para diseñar proteínas isopeptídicas de novo, y este software puede encontrarse en http://depts.washington.edu/ventures/UW Technology/Express Licenses/rosetta.php. (ver también Macromolecular modeling with rosetta, Das.R, Baker.D, Annu. Rev. Biochem., 77, 363-82, 2008).

Adicionalmente, puede utilizarse el servidor RASMOT-3D PRO para buscar en bases de datos de proteínas para la orientación apropiada de los residuos, en http://biodev.extra.cea.fr/rasmot3d/.

Los presentes inventores han determinado ventajosamente que dichos pares de etiqueta peptídica/pareja de unión pueden utilizarse como conectores peptídicos para unir covalentemente múltiples proteínas, es decir, para producir una proteína de fusión. En particular, los inventores han demostrado que los pares ortogonales (es decir, mutuamente no reactivos o no afines) de etiqueta peptídica/pareja de unión encuentran utilidad en la fusión (p.ej., conjugación o enlace) de dos o más proteínas, es decir, la producción (síntesis, construcción y ensamblaje) de proteínas de fusión. Tal como se muestra en detalle en los Ejemplos, posteriormente, los métodos y usos de la presente invención proporcionan un enfoque modular (p.ej., escalonado) y de alto rendimiento para unir proteínas en cadenas basándose en la formación secuencial de enlaces isopeptídicos. En particular, los métodos y usos indicados en la presente memoria permiten la extensión controlada (es decir, específica y dirigida) de cadenas de proteína sin la generación de mezclas estadísticas. Resulta particularmente ventajoso respecto a métodos anteriores debido a que resulta en una proteína de fusión en la que cada unidad proteica (módulo o dominio) se une mediante un enlace irreversible, es decir, un enlace isopeptídico. De esta manera, debido a que el enlace no se basa en la reacción de los residuos de cisteína, es aplicable a proteínas que contienen residuos de cisteína libres y/o enlaces disulfuro. Además, cada unidad proteína que debe añadirse a la cadena necesita modificarse únicamente con dos pequeñas etiquetas peptídicas, que pueden incorporarse en diversas posiciones dentro de la proteína, es decir, en el extremo N-terminal, extremo C-terminal o en un sitio interno en la proteína. De esta manera, cada unidad proteica de la proteína de fusión puede estar completamente codificada genéticamente, es decir, el método no se basa en la utilización de aminoácidos no naturales (es decir, no estándares) o en la modificación post-traduccional de residuos aminoácidos. De esta manera, la presente invención proporciona un método simple y escalable para la síntesis de proteínas de fusión que es altamente específico y no requiere la purificación de intermediarios.

Se proporciona un ejemplo representativo del método de la invención en la figura 1, que muestra una realización de fase sólida de la invención. Sin embargo, lo anterior en modo alguno pretende ser limitativo del alcance de la invención y resultarán evidentes para el experto en la materia diversas otras permutaciones a partir de la descripción, posteriormente, y se pretende que se encuentren comprendidas en la presente invención tal como se define en las reivindicaciones adjuntas.

La figura 1 muestra dos pares de conectores peptídicos, denominados SpyTag/SpyCatcher y SnoopTag/Snoop Catcher, en los que cada par, es decir, cada "Tag" y cada "Catcher", reaccionan específica y espontáneamente para formar un enlace isopeptídico, uniendo de esta manera el péptido "Tag" con el péptido "Catcher". A este respecto, los pares son ortogonales, es decir son mutuamente no reactivos, es decir, SpyTag y SpyCatcher no pueden reaccionar con SnoopCatcher o SnoopTag para formar un enlace isopeptídico. Tal como se comenta posteriormente en mayor detalle, en algunas realizaciones, los "Tags" pueden considerarse etiquetas peptídicas y los péptidos "Catcher" pueden considerarse proteínas de pareja de unión.

De esta manera, en la etapa 1, se proporciona una primera proteína, MBPx (una versión modificada de la proteína de unión a maltosa, comentada posteriormente), en la que la proteína ha sido modificada para incorporar un conector peptídico, SpyCatcher (es decir, la primera parte de un primer par de conectores peptídicos), p.ej., mediante expresión recombinante de una molécula de ácidos nucleicos codificante del polipéptido MBPx y el conector peptídico SpyCatcher en un único marco de lectura abierta. En dicho ejemplo representativo, la proteína MBPx se utiliza como una etiqueta de purificación o inmovilización que permite que la proteína de fusión en extensión se inmovilice sobre una fase sólida (una resina de amilosa). Sin embargo, resultará evidente a partir del comentario, posteriormente, que ésta no es una característica esencial de la invención. Por ejemplo, el método puede ser heterogéneo (es decir, en fase sólida) u homogéneo (es decir, en solución) y, en caso de ser heterogéneo, puede utilizarse cualquier etiqueta adecuada de purificación/inmovilización, es decir, no resulta esencial que la proteína sea una etiqueta proteica o peptídica.

En la etapa 2, la primera proteína (MBPx-SpyCatcher) se pone en contacto con una segunda proteína (A) que ha sido modificada para incorporar dos conectores peptídicos. Un conector peptídico es la segunda parte del primer par de conectores (SpyTag), en el que la primera parte forma un dominio de la primera proteína (SpyCatcher). El otro conector peptídico es la primera parte de un segundo par de conectores peptídicos (SnoopTag); tal como se ha comentado anteriormente, el segundo par de conectores no reacciona con el primer par de conectores. De esta manera, al entrar en contacto la primera y la segunda proteína, el primer par de conectores reacciona (p.ej., espontáneamente), formando un enlace isopeptídico específico entre los conectores peptídicos SpyCatcher y SpyTag, uniendo de esta manera la primera proteína (MBPx-SpyCatcher) y la segunda proteína (SpyTag-A-SnoopTag) entre sí para formar una proteína de fusión.

En la etapa 3, la proteína de fusión (MBPx-SpyCatcher-SpyTag-A-SnoopTag) se pone en contacto con una proteína adicional que comprende dos conectores peptídicos: SnoopCatcher y SpyCatcher. De esta manera, un conector peptídico (SnoopCatcher) es la segunda parte del segundo par de conectores peptídicos y el otro conector peptídico (SpyCatcher) es del primer par de conectores peptídicos. Dichos conectores peptídicos pueden conectarse mediante un espaciador, p.ej., un espaciador peptídico, o una proteína que debe incorporarse en la proteína de fusión final. Al poner en contacto la proteína de fusión (MBPx-SpyCatcher-SpyTag-A-SnoopTag) con la proteína adicional (SnoopCatcher-SpyCatcher), el segundo par de conectores reacciona (p.ej., espontáneamente) para formar un enlace isopeptídico, extendiendo de esta manera la proteína de fusión. Visto alternativamente, la adición de la proteína SnoopCathcer-SpyCatcher puede considerarse funcionalizar o activar la proteína de fusión para la extensión adicional, es decir, mediante la adición de un grupo reactivo (un conector peptídico reactivo) a la proteína de fusión.

En la etapa 4, la proteína de fusión extendida de la etapa 3 (MBPx-SpyCatcher-SpyTag-A-SnoopTag-SnoopCatcher-SpyCathcer) se pone en contacto con una proteína adicional (B), que incorpora dos conectores peptídicos similares a la proteína A (SpyTag-B-SnoopTag). Nuevamente, se forma un enlace isopeptídico entre los conectores peptídicos que son capaces de reaccionar entre sí, es decir, el primer par, SpyCatcher y SpyTag, para extender adicionalmente la proteína de fusión.

Resultará evidente que dicho procedimiento puede repetirse hasta que las unidades proteicas de la proteína de fusión deseada han sido unidas entre sí. La proteína de fusión puede simplemente eluírse respecto de la fase sólida, p.ej. con maltosa, y utilizarse sin purificación adicional. Debe señalarse que la proteína terminal de la proteína de fusión necesita modificarse para incorporarse únicamente un solo conector peptídico, que puede reaccionar con un conector peptídico libre en una proteína, p.ej., la penúltima unidad proteica, de la proteína de fusión. Tal como se comenta en los Ejemplos, el inventor ha demostrado la síntesis de una proteína de fusión que contiene 10 unidades proteicas, que ha sido validada mediante electroforesis en gel y espectrometría de masas.

Sin respaldo teórico, se cree que la orientación precisa de los residuos aminoácidos en los pares de conectores peptídicos, p.ej., SnoopTag/SnoopCatcher, SpyTag/SpyCatcher etc., fomenta el ataque nucleofílico y la formación de un enlace isopeptídico irreversible entre los conectores peptídicos. Tal como se ha indicado anteriormente, la lisina reacciona con aspartato o asparagina en cada uno de dichos pares. El péptido SpyTag presenta un aspartato reactivo y por lo tanto no puede reaccionar con la asparagina reactiva de SnoopCatcher. El péptido SnoopTag presenta una lisina reactiva y por lo tanto no puede reaccionar con la lisina reactiva de SpyCatcher. Por lo tanto, dichos dos pares de conectores peptídicos son ortogonales y resultará evidente que podrían utilizarse cualesquiera pares ortogonales de conectores peptídicos en el método indicado en la presente memoria para generar proteínas de fusión. A este respecto, son las propiedades ortogonales, mutuamente no reactivas, de los pares de conectores peptídicos las que permiten la generación de proteínas de fusión robustas y programables. En particular, en el caso de que la proteína de fusión en crecimiento se una a una fase sólida, el módulo en reacción (es decir, la siguiente proteína que debe unirse a la proteína de fusión) puede añadirse en un amplio exceso, impulsando de esta manera la reacción hasta que se complete. Lo anterior implica que los bloques constructivos no reaccionados simplemente pueden eliminarse por lavado, por lo que la separación (es decir, la separación de la proteína de fusión en crecimiento respecto de los componentes no reaccionados) no resulta necesaria en cada etapa. De esta manera, el alargamiento etapa a etapa permite el crecimiento de la cadena mediante la utilización de un número pequeño de conexiones ortogonales. Por lo tanto, el método desarrollado por el presente inventor es superior a los métodos de acoplamiento de proteínas anteriormente descritos, particularmente en términos de la estabilidad del producto proteína de fusión y la simplicidad de las etapas de reacción individuales.

De esta manera, la invención puede considerarse la utilización de por lo menos dos pares ortogonales de conectores peptídicos para la producción de una proteína de fusión, en la que cada par de conectores peptídicos reacciona formando un enlace isopeptídico, en el que los pares ortogonales de conectores peptídicos se seleccionan de cualquiera de entre:

(1) un conector peptídico que comprende una secuencia de aminoácidos tal como se indica en la SEC ID n° 1 o una secuencia con una identidad de secuencia de por lo menos 70% respecto a una secuencia de aminoácidos tal como se indica en la SEC ID n° 1, en la que dicha secuencia de aminoácidos comprende un residuo de lisina en la posición 9 y un conector peptídico que comprende una secuencia de aminoácidos tal como se indica en la SEC ID n° 2 o una secuencia con una identidad de secuencia de por lo menos 70% respecto a una secuencia de aminoácidos tal como se indica en la SEC ID n° 2, en la que dicha secuencia de aminoácidos comprende un residuo de glutamato o aspartato en la posición 55, un residuo de treonina en la posición 94, un residuo de glicina en la posición 100 y un residuo de asparagina o aspartato en la posición 106,

(2) un conector peptídico que comprende una secuencia de aminoácidos tal como se indica en la SEC ID n° 5 o una secuencia con una identidad de secuencia de por lo menos 70% respecto a una secuencia de aminoácidos tal como se indica en la SEC ID n° 5, en la que dicha secuencia de aminoácidos comprende un residuo de aspartato o asparagina en la posición 8 y un conector peptídico que comprende una secuencia de aminoácidos tal como se indica en la SEC ID n° 6 o una secuencia con una identidad de secuencia de por lo menos 70% respecto a una secuencia de aminoácidos tal como se indica en la SEC ID n° 6, en la que dicha secuencia de aminoácidos comprende un residuo de lisina en la posición 8,

(3) un conector peptídico que comprende una secuencia de aminoácidos tal como se indica en la SEC ID n° 9 o una secuencia con una identidad de secuencia de por lo menos 70% respecto a una secuencia de aminoácidos tal como se indica en la SEC ID n° 9, en la que dicha secuencia de aminoácidos comprende un residuo de asparagina o aspartato en la posición 17 y un conector peptídico que comprende una secuencia de aminoácidos tal como se indica en la SEC ID n° 10 o una secuencia con una identidad de secuencia de por lo menos 70% respecto a una secuencia de aminoácidos tal como se indica en la SEC ID n° 10, en la que dicha secuencia de aminoácidos comprende un residuo de lisina en la posición 9 y un residuo de glutamato o aspartato en la posición 70,

(4) un conector peptídico que comprende una secuencia de aminoácidos tal como se indica en la SEC ID n° 109 o una secuencia con una identidad de secuencia de por lo menos 70% respecto a una secuencia de aminoácidos tal como se indica en la SEC ID n° 109, en la que dicha secuencia de aminoácidos comprende un residuo de asparagina o aspartato en la posición 17, un residuo de glicina en la posición 11 y opcionalmente un residuo de isoleucina en la posición 20, un residuo de prolina en las posiciones 21 y 22 y un residuo de lisina en la posición 23, y un conector peptídico que comprende una secuencia de aminoácidos tal como se indica en la SEC ID n° 10 o una secuencia con una identidad de secuencia de por lo menos 70% respecto a una secuencia de aminoácidos tal como se indica en la SEC ID n° 10, en la que dicha secuencia de aminoácidos comprende un residuo de lisina en la posición 9 y un residuo de glutamato o aspartato en la posición 70,

(5) un conector peptídico que comprende una secuencia de aminoácidos tal como se indica en la SEC ID n° 13 o una secuencia con una identidad de secuencia de por lo menos 70% respecto a una secuencia de aminoácidos tal como se indica en la SEC ID n° 13, en la que dicha secuencia de aminoácidos comprende un residuo de aspartato o asparagina en la posición 7 y un conector peptídico que comprende una secuencia de aminoácidos tal como se indica en la SEC ID n° 14 o una secuencia con una identidad de secuencia de por lo menos 70% respecto a una secuencia de aminoácidos tal como se indica en la SEC ID n° 14, en la que dicha secuencia de aminoácidos comprende un residuo de glutamato o aspartato en la posición 56 , y un residuo de lisina en la posición 10, y

(6) un conector peptídico que comprende una secuencia de aminoácidos tal como se indica en la SEC ID n° 13 o una secuencia con una identidad de secuencia de por lo menos 70% respecto a una secuencia de aminoácidos tal como se indica en la SEC ID n° 13, en la que dicha secuencia de aminoácidos comprende un residuo de aspartato o asparagina en la posición 7 y un conector peptídico que comprende una secuencia de aminoácidos tal como se indica en la SEC ID n° 33 o una secuencia con una identidad de secuencia de por lo menos 70% respecto a una secuencia de aminoácidos tal como se indica en la SEC ID n° 33, en la que dicha secuencia de aminoácidos comprende un residuo de lisina en la posición 8,

en la que los pares ortogonales de conectores peptídicos comprenden (1) y (4), (1) y (5), (1) y (6), (1) y (3), (1) y (2), (2) y (5), (2) y (6), (3) y (5), (3) y (6), (4) y (5) o (4) y (6).

Los conectores peptídicos de cada par de conectores peptídicos reaccionan entre sí, formando un enlace isopeptídico. Tal como se ha indicado anteriormente, cada conector peptídico forma una parte (p.ej., un dominio) de una proteína que formará una unidad (p.ej., un dominio o módulo) de la proteína de fusión. En otras palabras, las proteínas que deben unirse entre sí pueden modificarse para incorporar por lo menos un conector peptídico (p.ej., dos, tres o cuatro conectores peptídicos, etc.), en el que cada par de conectores peptídicos utilizado en la producción de una proteína de fusión es ortogonal respecto a por lo menos otro par de conectores peptídicos utilizado en la producción de dicha proteína de fusión.

De esta manera, en algunas realizaciones, los pares ortogonales de conectores peptídicos se utilizan en la producción de una proteína de fusión que contiene por lo menos dos unidades proteicas (p.ej., dominio o módulos). Por ejemplo, en la realización representativa mostrada en la figura 1, la proteína utilizada para conjugar la proteína A con la proteína B puede considerarse una unidad conectora, es decir, la unidad conectora (proteína conectora) funciona únicamente conjugando la proteína A con la proteína B. De esta manera, la proteína de fusión puede considerarse que contiene o que comprende por lo menos dos proteínas funcionales, es decir, proteínas con funciones diferentes de las de un conector. En otras realizaciones, la proteína de fusión puede considerarse que contiene o que comprende por lo menos tres proteínas (es decir, con independencia de su función).

En realizaciones adicionales, la proteína de fusión puede considerarse que contiene o que comprende por lo menos tres proteínas funcionales. Por ejemplo, en referencia a la realización representativa mostrada en la figura 1, en el caso de que la proteína conectora utilizada para conjugar la proteína A con la proteína B contenga una proteína (p.ej., una proteína funcional) además de los conectores peptídicos, puede considerarse que es una unidad proteica (dominio o módulo) de la proteína de fusión. De esta manera, la proteína de fusión puede considerarse que contiene o que comprende por lo menos tres proteínas funcionales, es decir, proteínas con funciones alternativas o adicionales a las de un conector.

Considerada alternativamente, la invención proporciona un método para producir (p.ej., generar, sintetizar, ensamblar, etc.) una proteína de fusión, en la que dicho método comprende:

a) poner en contacto una primera proteína con una segunda proteína bajo condiciones que permiten la formación de un enlace isopeptídico entre dichas proteínas, en el que dicha primera proteína y dicha segunda proteína comprenden, cada una, un conector peptídico, en el que dichos conectores peptídicos son un par de conectores peptídicos que reaccionan (entre sí) formando un enlace isopeptídico que une dicha primera proteína a dicha segunda proteína para formar una proteína unida, y

b) poner en contacto la proteína unida de (a) con una tercera proteína bajo condiciones que permiten la formación de un enlace isopeptídico entre dicha tercera proteína y dicha proteína unida, en el que dicha tercera proteína comprende un conector peptídico que reacciona con un conector peptídico adicional en la proteína unida de (a), y en el que dichos conectores peptídicos son un par de conectores peptídicos que reaccionan (entre sí) formando un enlace isopeptídico que une dicha tercera proteína con dicha proteína unida formando una proteína de fusión,

en el que dicho par de conectores peptídicos utilizado en (a) es ortogonal al par de conectores peptídicos utilizado en (b), y en el que los pares ortogonales de conectores peptídicos se seleccionan de cualquiera de entre:

Considerado desde todavía otro aspecto, el método para producir (p.ej., generar, sintetizar, ensamblar, etc.) una proteína de fusión, descrito anteriormente comprende:

a) proporcionar una primera proteína que comprende un primer conector peptídico,

b) poner en contacto dicha primera proteína con una segunda proteína, en el que dicha segunda proteína comprende un segundo conector peptídico y un tercer conector peptídico, bajo condiciones que permiten que dicho primer conector peptídico y dicho segundo conector peptídico formen un enlace isopeptídico, uniendo de esta manera dicha primera y segunda proteína, y

c) poner en contacto dicha primera y segunda proteína unidas con una tercera proteína, en la que dicha tercera proteína comprende un cuarto conector peptídico, bajo condiciones que permiten que dicho tercer conector peptídico y dicho cuarto conector peptídico formen un enlace isopeptídico, uniendo de esta manera dicha segunda y tercera proteína para producir una proteína de fusión,

en el que dicho primer y segundo conector peptídico son un par de conectores peptídicos que son ortogonales al par de conectores peptídicos que consisten dicho tercer y cuarto conector peptídico.

Tal como se ha señalado anteriormente, en algunas realizaciones, la segunda proteína puede funcionarse como un conector entre la primera y tercera proteína. De acuerdo con lo anteriormente expuesto, la proteína de fusión puede considerarse que comprende dos proteínas "funcionales", es decir, proteínas que presentan funciones diferentes de unir dos unidades proteínas (módulos, dominios, etc.) entre sí. De esta manera, en algunas realizaciones, la segunda proteína puede considerarse una proteína conectora, es decir, una proteína que contiene por lo menos dos conectores peptídicos, cada uno de diferentes pares ortogonales de conectores peptídicos y opcionalmente un dominio espaciador, p.ej., un espaciador peptídico.

De esta manera, en algunas realizaciones, la segunda proteína puede considerarse una proteína conectora que funcionaliza o activa la primera proteína, permitiendo que dicha primera proteína se una (se conjugue) con dicha tercera proteína. De manera similar, en donde se añaden proteínas adicionales a la proteína de fusión (es decir, en donde se extiende la proteína de fusión), puede utilizarse una proteína conectora para funcionalizar o activar una o más proteínas en la proteína de fusión para permitir la unión de dicha proteína o proteínas a dichas proteínas adicionales.

Tal como se ha comentado anteriormente, la utilización de pares ortogonales de conectores peptídicos facilita la producción de proteínas de fusión que contienen un gran número de unidades proteicas. De acuerdo con lo anterior, pueden añadirse proteínas adicionales a la proteína de fusión (es decir, la proteína de fusión puede extenderse (p.ej., elongarse o alargarse)) mediante la puesta en contacto de la proteína de fusión con una proteína adicional que comprende por lo menos un conector peptídico que es capaz de formar un enlace isopeptídico con un conector peptídico en una proteína de la proteína de fusión. A este respecto, el conector peptídico en la nueva proteína forma parte de un par de conectores peptídicos que es ortogonal al par de conectores peptídicos utilizado para formar el enlace isopeptídico anterior en la proteína de fusión.

De esta manera, en algunas realizaciones, el método comprende además una etapa de extensión de la proteína de fusión, en la que la nueva proteína (es decir, una proteína adicional) que debe unirse a la proteína de fusión comprende un conector peptídico que forma parte de un par de conectores peptídicos que es ortogonal respecto al par de conectores peptídicos utilizado para formar el enlace isopeptídico anterior en la proteína de fusión, en el que el conector peptídico en la nueva proteína es capaz de formar un enlace isopeptídico con un conector peptídico en una proteína de la proteína de fusión, en el que dicho método comprende poner en contacto dicha nueva proteína con dicha proteína de fusión bajo condiciones que permiten que dicha nueva proteína (particularmente el conector peptídico en dicha nueva proteína) forme un enlace isopeptídico con un conector peptídico en la proteína de fusión. De esta manera, en algunas realizaciones, la tercera proteína puede considerarse una proteína "adicional", p.ej., una proteína nueva o adicional, para la adición a la proteína de fusión. Por lo tanto, la extensión de la proteína de fusión puede considerarse la etapa repetitiva (c) en el método anterior, en el que los conectores peptídicos en la proteína adicional son un par de conectores peptídicos que es ortogonal respecto al par de conectores peptídicos utilizado para unir la proteína anterior añadida a la proteína de fusión.

En algunas realizaciones, la nueva proteína (es decir, la proteína adicional) que debe añadirse a la proteína de fusión comprende por lo menos un segundo conector peptídico (p.ej., para permitir una extensión adicional de la cadena de la proteína de fusión). De acuerdo con lo anterior, el segundo conector peptídico (y cualesquiera conectores peptídicos adicionales en la nueva proteína) es ortogonal respecto al par de conectores peptídicos utilizado para unir (conjugar) la proteína de fusión y la nueva proteína.

De esta manera, en realizaciones todavía adicionales, el método para producir dicha proteína de fusión puede comprender una etapa de extensión de dicha proteína de fusión, en la que dicha tercera proteína comprende un quinto conector peptídico y dicho método comprende una etapa de puesta en contacto de dicha proteína de fusión con una cuarta proteína, en la que dicha cuarta proteína comprende un sexto conector peptídico, bajo condiciones que permiten que dicho quinto conector peptídico y dicho sexto conector peptídico formen un enlace isopeptídico, uniendo de esta manera dicha tercera y cuarta proteína para extender dicha proteína de fusión, en la que dicho quinto y sexto conectores peptídicos forman un par de conectores peptídicos que es ortogonal respecto al par de conectores peptídicos que consiste en dicho tercer y cuarto conector peptídico.

Tal como se muestra en la figura 1, resulta posible generar una proteína de fusión que comprende múltiples unidades proteicas (p.ej., más de 3 unidades proteínas, p.ej., 4, 5, 6, 7, 8, 9, 10 o más unidades proteicas, tal como 12, 15, 20 o más unidades proteicas) utilizando dos pares ortogonales de conectores peptídicos. De esta manera, en algunas realizaciones, el par de conectores peptídicos que consiste en el quinto y sexto conector peptídico es idéntico al par de conectores peptídicos que consiste en el primer y segundo conector peptídico.

De esta manera, en una realización todavía adicional, la proteína de fusión puede extenderse adicionalmente, en la que dicha cuarta proteína comprende un séptimo conector peptídico y dicho método comprende una etapa de poner en contacto dicha proteína de fusión con una quinta proteína, en la que dicha quinta proteína comprende un octavo conector peptídico, bajo condiciones que permiten que dicho séptimo conector peptídico y dicho octavo conector peptídico formen un enlace isopeptídico, uniendo de esta manera dicha cuarta y quinta proteína para extender dicha proteína de fusión, en la que dicho séptimo y octavo conector peptídico forman un par de conectores peptídicos que es ortogonal respecto al par de conectores peptídicos que consiste en dicho quinto y sexto conector peptídico.

En algunas realizaciones, el par de conectores peptídicos que consiste en el séptimo y octavo conector peptídico es idéntico al par de conectores peptídicos que consiste en el tercer y cuarto conector peptídico.

Resultará evidente que la cadena de la proteína de fusión puede extenderse mediante repetición de las etapas indicadas anteriormente, p.ej., en el que la quinta proteína comprende un noveno conector peptídico y una sexta proteína que comprende un décimo conector peptídico y en el que dicho nonveno y décimo conector peptídico forma un par de conectores peptídicos que es ortogonal respecto al par de conectores peptídicos que consiste en dicho séptimo y octavo conectores peptídicos. En algunas realizaciones, el par de conectores peptídicos que consiste en el noveno y décimo conector peptídico es idéntico al par de conectores peptídicos que consiste en el primer y tercer conector peptídico y/o dicho quinto y sexto conector peptídico.

De esta manera, en algunas realizaciones, los dos o más pares ortogonales de conectores peptídicos pueden utilizarse alternativamente para unir (conjugar) proteínas para formar una proteína de fusión. Considerado alternativamente, la proteína nueva o adicional que debe añadirse a la proteína de fusión comprende por lo menos un conector peptídico que forma parte de un par de conectores peptídicos que es ortogonal respecto al par de conectores peptídicos utilizado para unir la proteína anteriormente añadida a la proteína de fusión.

Aunque la invención puede trabajarse con éxito mediante la utilización de dos pares ortogonales de conectores peptídicos, resultará evidente que pueden utilizarse más de dos pares ortogonales de conectores peptídicos en los métodos y usos de la invención. De esta manera, en el contexto de los ejemplos representativos proporcionados anteriormente, el par de conectores peptídicos que consiste en el quinto y sexto conector peptídico es diferente, preferentemente ortogonal, respecto al par de conectores peptídicos que consiste en el primer y segundo conector peptídico. Tal como se comenta posteriormente, la utilización de más de dos pares de conectores peptídicos ortogonales permitiría la producción de estructuras completas de proteína de fusión, p.ej., estructuras ramificadas. De acuerdo con lo anterior, tal como se comenta en detalle posteriormente, el inventor ha desarrollado varios pares ortogonales de conectores peptídicos, que forman una realización adicional de la invención.

Por ejemplo, una proteína de fusión que comprende tres proteínas, puede producirse 1, 2 y 3 según el método indicado anteriormente, en el que la proteína 1 comprende el conector peptídico A, la proteína 2 comprende los conectores peptídicos A' y B y la proteína 3 comprende el conector peptídico B'. A este respecto, los conectores peptídicos A y A' (un par de conectores peptídicos) reaccionan formando un enlace isopeptídico y los conectores peptídicos B y B' (un par de conectores peptídicos) reaccionan formando un enlace isopeptídico, en el que los pares de conectores peptídicos A/A' y B/B' son ortogonales (es decir, no reaccionan con el otro par para formar un enlace isopeptídico). La utilización de un tercer par ortogonal de conectores peptídicos permitiría la producción de una estructura ramificada. Por ejemplo, la proteína 2 puede comprender un tercer conector peptídico C y una cuarta proteína, 4, puede comprender un conector peptídico C', en el que C y C' (un par de conectores peptídicos) reaccionan formando un enlace isopeptídico y en el que los conectores peptídicos A/A', B/B' y C/C' son ortogonales. Al poner en contacto la proteína de fusión 1-2-3 con la proteína 4 bajo condiciones que permiten que C y C' formen un enlace isopeptídico, la proteína de fusión resultante será ramificada, es decir, 1-2(-4)-3 (ver la figura 13A). Alternativamente, la proteína de fusión 1-2-4 puede ponerse en contacto con la proteína 3 bajo condiciones que permiten que B y B' formen un enlace isopeptídico para producir la proteína de fusión ramificada, 1-2(-4)-3. El experto en la materia entenderá que pueden generarse estructuras ramificadas complejas mediante la utilización de tres pares de conectores peptídicos ortogonales y que la complejidad de las estructuras ramificadas puede incrementarse adicionalmente mediante la utilización de pares ortogonales adicionales de conectores peptídicos. En particular, la utilización de más de dos pares ortogonales de conectores peptídicos puede utilizarse ventajosamente para generar estructuras ramificadas asimétricas.

De esta manera, en algunas realizaciones, el método y usos de la invención utilizan más de dos pares ortogonales de conectores peptídicos, p.ej. 3, 4, 5, 6, 7, 8, 9 o 10 o más pares ortogonales de conectores peptídicos.

La ramificación también puede conseguirse utilizando dos pares ortogonales de conectores peptídicos. Por ejemplo, una proteína de fusión ramificada que comprende cinco proteínas, 1 a 5, puede producirse mediante inclusión de conectores peptídicos adicionales en una de las proteínas, p.ej., la proteína 2 puede comprender 4 conectores peptídicos de dos pares ortogonales de conectores peptídicos. En dicha realización representativa, la proteína 1 comprende el conector peptídico A, la proteína 2 comprende el conector peptídico A' y tres conectores peptídicos B. Las proteínas 3, 4 y 5 comprenden, cada una, el conector peptídico B', en el que los conectores peptídicos A y A' (un par de conectores peptídicos) reaccionan formando un enlace isopeptídico y los conectores peptídicos B y B' (un par de conectores peptídicos) reaccionan formando un enlace isopeptídico, en el que los pares de conectores peptídicos A/A' y B/B' son ortogonales. De esta manera, el contacto de las proteínas de fusión 1 a 2 con las proteínas 3 a 5 resultaría en una proteína de fusión ramificada en la que las proteínas 3 a 5 se unen todas a la proteína 2 independientemente unas de otras (ver la figura 13B). Resultará evidente que las proteínas 3 a 5 pueden ser proteínas iguales o diferentes. Además, una o más de las proteínas 3 a 5 puede comprender conectores peptídicos adicionales de pares ortogonales de conectores peptídicos para facilitar la extensión (p.ej., la extensión independiente separada) de cada rama de la proteína de fusión.

De esta manera, en algunas realizaciones, la proteína de fusión puede ser ramificada. En otras realizaciones, la proteína de fusión puede ser lineal. En algunas realizaciones, p.ej. en las que se utilizan más de dos pares ortogonales de conectores peptídicos, la proteína de fusión puede comprender ramas asimétricas, es decir, la proteína de fusión puede presentar una estructura asimétrica. De esta manera, en algunas realizaciones, la invención proporciona un método para producir una proteína de fusión ramificada. En algunas realizaciones, la invención proporciona un método para producir una proteína de fusión lineal.

El término "ramificada" se refiere a proteínas de fusión en las que están unidas dos o más unidades proteicas (unidos, conjugados) a la misma unidad proteica interna (una unidad proteica no terminal) de una proteína de fusión, independientemente unas de otras, es decir, mediante enlaces isopeptídicos formados independientemente (separadamente). Una unidad proteica interna o una unidad proteica no terminal puede definirse como una proteína que se une (enlaza, conjuga) mediante un enlace isopeptídico a por lo menos dos o tres unidades proteicas en la proteína de fusión. Una unidad proteica terminal puede definirse como una proteína que está unida (enlazada, conjugada) mediante un enlace isopeptídico únicamente a otra unidad proteica en la proteína de fusión. De esta manera, en los ejemplos representativos comentados anteriormente y mostrados en la figura 13, la proteína 2 es una unidad proteica interna o unidad proteica no terminal debido a que está unida mediante enlaces isopeptídicos a las proteínas 1 y 3, en donde las proteínas 4 y 5 pueden considerarse "ramas" de la proteína de fusión. Las proteínas 1, 3, 4 y 5 pueden considerarse unidades proteicas terminales. De esta manera, una proteína de fusión ramificada comprende más de dos unidades proteicas terminales.

El término "lineal" se refiere a proteínas de fusión en las que la totalidad de las unidades proteicas internas están unidas únicamente a dos otras unidades proteicas en la proteína de fusión, generando de esta manera una cadena lineal de unidades proteicas. De esta manera, una proteína de fusión lineal comprende únicamente dos unidades proteicas terminales.

En todavía otras realizaciones, la proteína de fusión puede ser circular. Por ejemplo, considerando la proteína de fusión, anteriormente, 1-2-3, en el caso de que la proteína 1 contenga además un conector peptídico C y la proteína 3 contenga además un conector peptídico C', las proteínas 1 y 3 pueden unirse mediante un enlace isopeptídico, formando de esta manera una proteína circular. De esta manera, en algunas realizaciones, una proteína lineal puede considerarse como circularizable, es decir, capaz de formar una proteína de fusión circular. A este respecto, tal como se ha comenta posteriormente, uno o más conectores peptídicos pueden bloquearse o protegerse para evitar o retrasar su reacción. De esta manera, utilizando el ejemplo, anteriormente, en el caso de que el conector peptídico C y/o C' se encuentre bloqueado, la proteína de fusión será una proteína de fusión lineal que es circularizable y puede circularizarse mediante el desbloqueo de C y/o C', para permitir que los conectores peptídicos reaccionen para formar un enlace isopeptídico.

De esta manera, en algunas realizaciones, la invención proporciona un método para producir una proteína de fusión circular o circularizable.

De esta manera, el término "circular' se refiere generalmente a proteínas de fusión que no contienen ninguna unidad de proteína terminal. Sin embargo, resultará evidente que resulta posible producir una proteína de fusión "circular ramificada", que comprende una proteína de fusión circular en la que una o más de las unidades proteicas internas está unida mediante un enlace isopeptídico a por lo menos tres otras unidades proteicas en la proteína de fusión.

El término "ortogonal" tal como se utiliza en la presente memoria se refiere a moléculas que son mutuamente no reactivas, p.ej., moléculas que no son capaces de reaccionar entre sí o que reaccionan con eficiencia reducida en comparación con moléculas correspondientes que son capaces de reaccionar entre sí. En el contexto de los conectores peptídicos de la invención, particularmente pares de conectores peptídicos, el término ortogonal se refiere a pares de conectores peptídicos que no son capaces de reaccionar con otros pares de conectores peptídicos para formar un enlace isopeptídico o que reaccionan con una eficiencia reducida en comparación con moléculas correspondientes, p.ej., proteínas endógenas que son capaces de formar espontáneamente enlaces isopeptídicos o pares de conectores peptídicos que son capaces de reaccionar entre sí eficientemente para formar un enlace isopeptídico. La incapacidad de reaccionar puede considerarse que es 5% o menos de los conectores peptídicos en una muestra reaccionan para formar enlaces isopeptídicos, p.ej., 4%, 3%, 2% o 1% o menos. Una eficiencia reducida puede considerarse como menos de 5% de eficiencia, p.ej., menos de 4%, 3%, 2% o 1% de eficiencia, en la reacción de un par de conectores peptídicos ortogonales para formar un enlace isopeptídico en comparación con la capacidad de cada par de conectores peptídicos para formar un enlace isopeptídico. A la inversa, un par de conectores peptídicos que reaccionan eficientemente para formar un enlace isopeptídico puede reaccionar con una eficiencia de por lo menos 95%, p.ej., una eficiencia de por lo menos 96%, 97%, 98%, 99% o 100%, es decir, por lo menos 95% de los conectores peptídicos de un par de conectores peptídicos en una muestra reaccionan para formar un enlace isopeptídico bajo condiciones que permiten la formación de un enlace isopeptídico. Por ejemplo, dos pares de conectores peptídicos, A/A' y B/B', pueden considerarse ortogonales en el caso de que A y A' no puedan reaccionar con B y/o B' para formar un enlace isopeptídico, o en el caso de que A y A' reaccionen con B y/o B' para formar un enlace isopeptídico con una eficiencia inferior a 5% en comparación con la formación de enlaces isopeptídicos entre A y A' y/o B y B'.

Considerado alternativamente, dos conectores peptídicos que reaccionan entre sí eficientemente para formar un enlace isopeptídico bajo condiciones que permiten o facilitan la formación de enlaces isopeptídicos pueden definirse como un par afín de conectores peptídicos, en el que el término "afín" se refiere a componentes que funcionan juntos, es decir, reaccionan entre sí para formar un enlace isopeptídico. De esta manera, dos conectores peptídicos que reaccionan entre sí eficientemente para formar un enlace isopeptídico bajo condiciones que permiten o facilitan la formación de enlaces isopeptídicos también puede hacerse referencia a ellos como par de conectores peptídicos "complementarios". De esta manera, los pares ortogonales de conectores peptídicos pueden considerarse pares no afines o pares no complementarios. Por ejemplo, basándose en los ejemplos representativos indicados anteriormente, el par de conectores peptídicos A/A' puede considerarse como par afín o complementario de conectores peptídicos, mientras que A/A' y B/B' son pares no afines o no complementarios en la medida en que A y A' no pueden reaccionar eficientemente con B y/o B' para formar un enlace isopeptídico bajo condiciones que permiten o facilitan la formación de enlaces isopeptídicos.

Los conectores peptídicos pueden derivarse de una proteína capaz de formar espontáneamente un enlace isopeptídico. En particular, "una proteína capaz de formar espontáneamente un enlace isopeptídico" (también denominado en la presente memoria "una proteína isopeptídica") es una que puede formar un enlace isopeptídico en ausencia de enzimas u otras sustancias y/o sin modificación química, dentro de su cadena proteica, es decir, intramolecularmente. Los dos residuos reactivos para formar el enlace isopeptídico por lo tanto se encuentran comprendidos dentro de una única cadena proteica. De esta manera, las proteínas que sólo forman enlaces isopeptídicos intermolecularmente, es decir, con otras cadenas o unidades peptídicas o proteicas, no se considera que sean proteínas isopeptídicas tal como se utilizan en la presente invención. Particularmente, las subunidades de cápside HK97 que presentan enlaces isopeptídicos intermoleculares están excluidas.

La expresión "enlace isopeptídico" tal como se utiliza en la presente memoria se refiere a un enlace amida entre un grupo carboxilo o carboxamida y un grupo amino por lo menos uno de los cuales no se deriva de una cadena principal de proteína o alternativamente no se considera parte del esqueleto de la proteína. Puede formarse un enlace isopeptídico dentro de una única proteína o puede encontrarse entre dos péptidos o un péptido y una proteína. De esta manera, puede formarse un enlace isopeptídico intramolecularmente dentro de una única proteína o intermolecularmente, es decir, entre dos moléculas de péptido/proteína, p.ej., entre dos conectores peptídicos. Típicamente, puede encontrarse un enlace isopeptídico entre un residuo de lisina y una asparagina, ácido aspártico, glutamina o un residuo de ácido glutámico o el grupo carboxilo terminal de la cadena de proteína o péptido o puede encontrarse entre el extremo alfa-amino terminal de la cadena de proteína o péptido y una asparagina, ácido aspártico, glutamina o ácido glutámico. Cada residuo del par que participa en el enlace isopeptídico se denomina en la presente memoria, residuo reactivo. En realizaciones preferentes de la invención, puede formarse un enlace isopeptídico entre un residuo de lisina y un residuo de asparagina o entre un residuo de lisina y un residuo de ácido aspártico. Particularmente, pueden encontrarse enlaces isopeptídicos entre la amina de cadena lateral de la lisina y el grupo carboxamida de la asparagina o grupo carboxilo de un aspartato.

Las distancias entre los residuos que participan en un enlace isopeptídico se miden desde átomos de C particulares dentro del residuo. De esta manera, en el caso de que una lisina participa en el enlace isopeptídico, la distancia se mide desde el átomo C-epsilón de la lisina; en el caso de que el ácido aspártico participe en el enlace isopeptídico, la distancia se mide desde el átomo C-gamma del ácido aspártico; en el caso de que participe una asparagina en el enlace isopeptídico, la distancia se mide desde el átomo C-gamma de la asparagina y en el caso de que participe ácido glutámico en el enlace isopeptídico, la distancia se mide desde el átomo C-delta del ácido glutámico. Dichos átomos (a partir de los que se calculan las distancias) de los residuos reactivos que participan en el enlace isopeptídico se denominan en la presente memoria, "átomos relevantes".

Típicamente, a fin de que se forme un enlace isopeptídico, los residuos reactivos, p.ej., los residuos reactivos de lisina y asparagina/aspartato (y particularmente, los átomos relevantes de los mismos; para la lisina, el átomo C-epsilón y para la asparagina/aspartato, el átomo C-gamma) deben situarse en estrecha proximidad entre sí en el espacio, p.ej., en la proteína isopeptídica a partir de la que se derivan. De esta manera, particularmente, los residuos reactivos, p.ej., la lisina y la asparagina/aspartato (y particularmente, los átomos relevantes de los mismos) se encuentran a menos de 4 Angstroms unos de otros en la proteína plegada (a partir de la que se derivan) y pueden encontrarse a 3,8, 3,6, 3,4, 3,2, 3,0, 2,8, 2,6, 2,4, 2,2, 2,0, 1,8 o 1,6 Angstroms unos de otros. Particularmente, los residuos reactivos (y más particularmente, sus átomos relevantes) pueden encontrarse a menos de 1,81, 2,63 o 2,60 Angstroms unos de otros en la proteína isopeptídica a partir de la que se derivan.

Generalmente, las proteínas isopeptídicas a partir de la que pueden derivarse los conectores peptídicos pueden comprender un residuo de ácido glutámico o de ácido aspártico en estrecha proximidad a los dos otros residuos de aminoácido reactivos, p.ej., a lisina y asparagina/aspartato, que participan en la formación del enlace isopeptídico. Particularmente, el átomo C-delta del ácido glutámico o el átomo C-gamma del residuo de ácido aspártico pueden encontrarse a menos de 5,5 Angstroms de un residuo reactivo de asparagina/aspartato, p.ej., entre el átomo C-gamma de un residuo reactivo de asparagina/aspartato, implicado en el enlace isopeptídico, en la estructura de la proteína plegada. Por ejemplo, el ácido glutámico (p.ej., el átomo C-delta del mismo) puede encontrarse a menos de 5,4, 5,2, 5,0, 4,8, 4,6, 4,4, 4,2, 4,0, 3,8, 3,6, 3,4, 3,2 o 3,0 Angstroms del residuo reactivo de asparagina/aspartato, p.ej., el átomo C-gamma del mismo en el enlace isopeptídico. Particularmente, el residuo de ácido glutámico, p.ej., el átomo C-delta del mismo, puede encontrarse a 4,99, 3,84 o 3,73 Angstroms del residuo de asparagina/aspartato, p.ej., el átomo C-gamma del mismo.

Además, el residuo de ácido glutámico, p.ej., el átomo C-delta del mismo, puede encontrarse a menos de 6,5 Angstroms de un residuo reactivo de lisina, p.ej., el átomo C-epsilón del mismo, que participa en el enlace isopeptídico, por ejemplo a menos de 6,3, 6,1, 5,9, 5,7, 5,5, 5,3, 5,1, 4,9, 4,7, 4,5, 4,3 o 4,1 Angstroms. Particularmente, el residuo de ácido glutámico, p.ej., el átomo C-delta del mismo, puede encontrarse a 6,07, 4,80 o 4,42 Angstroms de una lisina reactiva, p.ej., el átomo C-epsilón de la misma.

El residuo de ácido glutámico (o el residuo de ácido aspártico) puede ayudar a inducir la formación del enlace isopeptídico tal como se ha comentado anteriormente.

Tal como se ha comentado anteriormente, pueden obtenerse conectores peptídicos mediante la división de los dominios reactivos de una proteína isopeptídica en dos o tres dominios. De esta manera, cada par de conectores peptídicos consiste en un péptido que comprende un residuo de lisina y un péptido que comprende un residuo de aspartato o asparagina, en el que dichos residuos (es decir, lisina y aspartato o lisina y asparagina) participan en la formación de un enlace isopeptídico (es decir, reaccionan formando un enlace isopeptídico), uniendo (conjugando) de esta manera dichos conectores peptídicos.

En algunas realizaciones preferentes, la formación del enlace isopeptídico entre dichos conectores peptídicos es espontánea. De acuerdo con lo anteriormente expuesto, uno de los conectores peptídicos comprende un residuo de ácido glutámico o de ácido aspártico que facilita, p.ej. induce o cataliza, la formación del enlace isopeptídico entre la lisina y los residuos de asparagina o aspartato en los conectores peptídicos. En algunas realizaciones, el residuo de ácido glutámico o de ácido aspártico satisface uno o más de los criterios de proximidad indicados anteriormente.

De esta manera, en realizaciones en las que la formación del enlace isopeptídico entre dichos conectores peptídicos es espontánea, uno de los conectores peptídicos puede considerarse una etiqueta peptídica y el otro conector peptídico (es decir, el conector que comprende el residuo de ácido glutámico o de ácido aspártico que facilita, p.ej., induce o cataliza, la formación del enlace isopeptídico) puede considerarse como una pareja de unión peptídica, es decir, la pareja de unión para la etiqueta peptídica tal como se define adicionalmente después.

El término "espontáneo" tal como se utiliza en la presente memoria se refiere a un enlace, p.ej., un enlace isopeptídico o covalente que puede formarse en una proteína o entre péptidos o proteínas (p.ej., entre 2 péptidos o entre un péptido y una proteína, es decir, los conectores peptídicos de la invención) sin que ningún otro agente (p.ej., un catalizador enzimático) se encuentre presente y/o sin modificación química de la proteína o péptido, p.ej. sin ligación química nativa o acoplamiento químico utilizando 1-etil-3-(3-dimetilaminopropil)carbodiimida (EDC). De esta manera, la ligación química nativa para modificar un péptido o proteína para que presente un tioéster C-terminal no se lleva a cabo.

De esta manera, puede formarse un enlace isopeptídico espontánea en el caso de que se aísle una proteína por sí sola o puede formarse un enlace covalente o isopeptídico entre dos péptidos o entre un péptido y una proteína (es decir, conectores peptídicos de la invención) en caso de encontrarse aislados o sin modificación química. Por lo tanto, puede formarse un enlace isopeptídico o covalente espontánea por sí solo en ausencia de enzimas u otras sustancias exógenas o sin modificación química. Sin embargo, particularmente un enlace isopeptídico o covalente espontáneo puede requerir la presencia de un residuo de ácido glutámico o de ácido aspártico en la proteína o en uno de los péptidos/proteínas (es decir, en uno de los conectores peptídicos) que participan en el enlace para permitir la formación del enlace de una manera inducida por proximidad.

Un enlace isopeptídico o covalente espontáneo puede formarse prácticamente de inmediato después de la producción de una proteína o tras el contacto entre dos o más proteínas que comprenden conectores peptídicos de la invención, p.ej., una etiqueta peptídica y una pareja de unión, p.ej., en 1, 2, 3, 4, 5, 10, 15, 20, 25 o 30 minutos, o en 1, 2, 4, 8, 12, 16, 20 o 24 horas. El enlace puede formarse bajo un abanico de condiciones, tal como en solución salina tamponada con fosfato (PBS, por sus siglas en inglés) o en solución salina tamponada con Tris (TBS) a pH de entre 4,0 y 9,0, p.ej., de 5,0, 5,5, 6,5, 7,0, 7,5, 8,0 o 8,5 y a una temperatura de entre 0°C y 40°C, p.ej., 1, 2, 3, 4, 5, 10, 12, 15, 18, 20, 22 o 25°C. El experto en la materia podría fácilmente determinar otras condiciones adecuadas.

De esta manera, en algunas realizaciones, la puesta en contacto de proteínas que comprenden conectores peptídicos tal como se define en la presente memoria "bajo condiciones que permiten la formación de un enlace isopeptídico" incluye poner en contacto dichas proteínas bajo condiciones tamponadas, p.ej. en una solución tamponada o sobre una fase sólida (p.ej., columna) que ha sido equilibrada con un tampón, tal como PBS o TBS. La etapa de puesta en contacto puede ser a cualquier pH adecuado, tal como un pH de entre 4,0 y 9,0, p.ej., de 4,5 a 8,5, de 5,0 a 8,0 o de 5,5 a 7,5, tal como a un pH de aproximadamente 6,2, 6,4, 6,6, 6,8, 7,0, 7,2, 7,4, 7,6, 7,8 o 8,0. Adicional o alternativamente, la etapa de puesta en contacto puede ser a cualquier temperatura adecuada, tal como de entre aproximadamente 0°C y 40°C, p.ej., de aproximadamente 1°C a 39°C, 2°C a 38°C, 3°C a 37°C, 4°C a 36°C, 5°C a 35°C, 6°C a 34°C, 7°C a 33°C, 8°C a 32°C, 9°C a 31°C o 10°C a 30°C, p.ej., de aproximadamente 10, 12, 15, 18, 20, 22 o 25°C. El experto en la materia entenderá que las condiciones podrían requerir adaptación según las características de los conectores peptídicos utilizados en el método de la invención y podrán fácilmente determinar qué condiciones resultan adecuadas.

En algunas realizaciones, la puesta en contacto de proteínas que comprenden conectores peptídicos tal como se define en la presente memoria "bajo condiciones que permiten la formación de un enlace isopeptídico" incluye poner en contacto dichas proteínas en presencia de un chaperón químico, p.ej., una molécula que potencia o mejora la reactividad de los conectores peptídicos. En algunas realizaciones, el chaperón químico es TMAO (por sus siglas en inglés, N-óxido de trimetilamina). En algunas realizaciones, el chaperón químico, p.ej., TMAO, se encuentra presente en la reacción a una concentración de por lo menos aproximadamente 0,2 M, p.ej., de por lo menos 0,3, 0,4, 0,5, 1,0, 1,5, 2,0 o 2,5 M, p.ej., de aproximadamente 0,2 a 3,0 M, de 0,5 a 2,0 M o de 1,0 a 1,5 M.

En algunas realizaciones, la formación del enlace isopeptídico entre dichos conectores peptídicos no es espontánea, es decir, la formación del enlace isopeptídico resulta inducida o catalizada por un componente que se añade a la reacción. El componente que induce o cataliza la formación del enlace isopeptídico puede ser un péptido. El componente que induce o cataliza la formación del enlace isopeptídico es un péptido derivado de una proteína isopeptídica, es decir, un dominio o fragmento de una proteína isopeptídica que comprende un residuo de ácido glutámico o de ácido aspártico que facilita, p.ej., induce o cataliza, la formación del enlace isopeptídico entre los residuos de lisina y asparagina o aspartato en los conectores peptídicos. Un péptido que facilita, p.ej. induce o cataliza, la formación del enlace isopeptídico entre los residuos de lisina y asparagina o aspartato en los conectores peptídicos puede considerarse una proteína ligasa o péptido ligasa, en la medida en que es capaz de inducir, específicamente, la formación de un enlace isopeptídico entre dos conectores peptídicos.

De esta manera, en realizaciones en que la formación del enlace isopeptídico entre dichos conectores peptídicos no es espontánea, es decir, en los que un componente (p.ej., un péptido, p.ej., una péptido ligasa) que induce la formación de un enlace isopeptídico entre los conectores peptídicos se proporciona por separado, ambos conectores peptídicos pueden considerarse etiquetas peptídicas, tal como se define posteriormente. De acuerdo con lo anteriormente expuesto, el péptido que induce la formación de un enlace isopeptídico entre los conectores peptídicos (etiquetas peptídicas) puede considerarse una péptido ligasa o una pareja de unión de par de conectores peptídicos.

De esta manera, en algunas realizaciones, la invención comprende además una etapa de puesta en contacto de proteínas que deben unirse con un componente (p.ej., un péptido) capaz de inducir la formación de un enlace isopeptídico entre dichos conectores peptídicos bajo condiciones que permiten la formación de un enlace isopeptídico entre dichas proteínas. El componente capaz de inducir la formación de un enlace isopeptídico entre dichos conectores peptídicos es un péptido que comprende un residuo de ácido glutámico o de ácido aspártico que induce la formación del enlace isopeptídico entre los residuos de lisina y asparagina o aspartato en los conectores peptídicos en dichas proteínas.

El componente (p.ej., el péptido) capaz de inducir la formación de un enlace isopeptídico entre dichos conectores peptídicos puede añadirse a la reacción antes, después o simultáneamente en el caso de que las proteínas que deben unirse se pongan en contacto entre sí. En algunas realizaciones, el componente (p.ej., el péptido) capaz de inducir la formación de un enlace isopeptídico entre dichos conectores peptídicos puede añadirse a la reacción después de que las proteínas que deben unirse se pongan en contacto mutuo.

La utilización de un componente (p.ej., un péptido) capaz de inducir la formación de un enlace isopeptídico entre dichos conectores peptídicos resulta particularmente ventajosa debido a que permite que las unidades proteicas de la proteína de fusión que deben unirse (conjugarse) sin la presencia de dominios peptídicos intermedios grandes. Considerado alternativamente, la utilización de un componente (p.ej., un péptido) capaz de inducir la formación de un enlace isopeptídico entre dichos conectores peptídicos facilita la utilización de pequeños conectores peptídicos (p.ej., etiquetas peptídicas), es decir, la secuencia peptídica mínima de cada conector peptídico en un par afín de conectores peptídicos capaces de formar un enlace isopeptídico entre dichos conectores peptídicos.

En algunas realizaciones, el par de conectores peptídicos afines y el péptido capaz de inducir la formación de un enlace isopeptídico entre dichos conectores peptídicos se derivan de la misma proteína isopeptídica.

Las proteínas capaces de formar espontáneamente un enlace isopeptídico pueden ser capaces de formar por lo menos uno de dichos enlaces y pueden comprender más de un enlace isopeptídico, por ejemplo, 2, 3, 4, 5, 6, 7, 8, 9, 10 o más. Puede resultar posible desarrollar varios pares diferentes de conectores peptídicos a partir de una proteína isopeptídica, particularmente en el caso de que se encuentre presente más de un enlace isopeptídico formado espontáneamente dentro de la proteína. Diferentes pares de conectores peptídicos derivados de la misma proteína isopeptídica pueden ser ortogonales.

Entre los ejemplos de proteínas conocidas capaces de formar espontáneamente uno o más enlaces isopeptídicos se incluyen Spy0128 (Kang et al., Science, 318(5856), 1625-8, 2007), Spy0125 (Pointon et al., J. Biol., Chem., 285(44), 33858-66, 2010) y FbaB (Oke et al., J. Struct Funct Genomics, 11(2), 167-80, 2010) de Streptococcus pyogenes, Cna of Staphylococcus aureus (Kang et al., Science, 318 (5856), 1625-8, 2007), la proteína ACE19 de Enterococcus faecalis (Kang et al., Science, 318(5856), 1625-8, 2007), la pilina BcpA de Bacillus cereus (Budzik et al., PNAS USA, 106(47), 19992-7, 2007), la pilina Gb S52 menor de Streptococcus agalactiae (Kang et al., Science, 318(5856), 1625 8, 2007), SpaA de Corynebacterium diphtheriae (Kang et al., PNAS USA, 106(40), 16967-71, 2009), SpaP de Streptococcusmutans (Nylander et al., Acta Crystallogr. Sect. F Struct. Biol. Cryst. Commum., 67(Pt1), 23-6, 2011), RrgA (Izore et al., Structure, 18(1), 106-15, 2010), RrgB (El Mortaji et al., J. Biol. Chem., 285(16), 12405-15, 2010) y RrgC (El Mortaji et al., J. Biol. Chem., 285(16), 12405-15, 2010) de Streptococcus pneumoniae, SspB de Streptococcus gordonii(Forsgren et al., J. Mol. Biol., 397(3), 740-51, 2010). Tal como se ha comentado anteriormente, pueden utilizarse cualesquiera de dichas proteínas para generar conectores peptídicos (particularmente pares afines de conectores peptídicos).

La organización u orden de los conectores peptídicos en las proteínas que deben unirse para formar la proteína de fusión no resulta particularmente importante. Por ejemplo, la primera proteína de la proteína de fusión deseada puede comprender una etiqueta peptídica (A) y la segunda proteína puede comprender una pareja de unión peptídica que es afín para la etiqueta peptídica en la primera proteína (A') y una pareja de unión peptídica que es afín para la etiqueta peptídica en la tercera proteína (B'). Alternativamente, la primera proteína de la proteína de fusión deseada puede comprender una pareja de unión peptídica (A') y la segunda proteína puede comprender una etiqueta peptídica que es afín para la pareja de unión peptídica en la primera proteína (A) y una etiqueta peptídica que es afín para la pareja de unión peptídica en la tercera proteína (B). A este respecto, resulta suficiente que el par de conectores peptídicos utilizado para unir dos proteínas (p.ej., una primera proteína y una segunda proteína, una proteína de fusión con una proteína adicional, etc.) sea ortogonal respecto al par de conectores peptídicos utilizado para extender la proteína de fusión. Tal como se comenta posteriormente, los conectores peptídicos ortogonales pueden conseguirse de una diversidad de maneras.

Por ejemplo, el primer par de conectores peptídicos (A/A') comprende un conector peptídico, A (p.ej., una etiqueta peptídica) con un residuo de lisina reactivo y un conector peptídico, A' (p.ej., una pareja de unión peptídica) con un residuo reactivo de aspartato o asparagina y el segundo par de conectores peptídicos (B/B') comprende un conector peptídico, B (p.ej., una etiqueta peptídica) con un residuo reactivo de aspartato o asparagina y un conector peptídico, B' (p.ej., una pareja de unión peptídica) con un residuo reactivo de lisina. Mediante la utilización del ejemplo proporcionado anteriormente, no existe ninguna ruta adecuada para que A reaccione con B' y no existe ninguna ruta adecuada para que B reaccione con A'. De acuerdo con lo anterior, los pares de conectores peptídicos son ortogonales entre sí.

Por ejemplo, el primer par de conectores peptídicos (A/A') puede comprender un conector peptídico, A (p.ej., una etiqueta peptídica) con un residuo de lisina reactivo y un conector peptídico, A' (p.ej., una pareja de unión peptídica) con un residuo reactivo de aspartato o asparagina y el segundo par de conectores peptídicos (B/B') comprende un conector peptídico, B (p.ej., una etiqueta peptídica) con un residuo reactivo de lisina y un conector peptídico, B' (p.ej., una pareja de unión peptídica) con un residuo reactivo de aspartato o asparagina. Alternativamente, el primer par de conectores peptídicos (A/A') comprende un conector peptídico, A (p.ej., una etiqueta peptídica) con un residuo reactivo de aspartato o asparagina y un conector peptídico, A' (p.ej., una pareja de unión peptídica) con un residuo reactivo de lisina y el segundo par de conectores peptídicos (B/B') comprende un conector peptídico, B (p.ej., una etiqueta peptídica) con un residuo reactivo de aspartato o asparagina y un conector peptídico, B' (p.ej., una pareja de unión peptídica) con un residuo reactivo de lisina. En estos ejemplos, los conectores peptídicos (etiquetas peptídicas) A y B pueden seleccionarse de manera que presenten una diferencia sustancial de tamaño en por lo menos un (p.ej., dos o tres) residuos "de anclaje", de manera que el acoplamiento no covalente de A y B' y de B y A' (es decir, la interacción entre A y B' y entre B y A') resulta ineficiente, garantizando de esta manera que la reacción cruzada es mínima.

La expresión "residuos de anclaje" se refiere a residuos aminoácidos en una cadena p de uno de los conectores peptídicos en un par afín de conectores peptídicos (p.ej., una pareja de unión peptídica) que apunta hacia el núcleo hidrofóbico del conector peptídico y que acepta el residuo reactivo del otro conector peptídico del par afín de conectores peptídicos (p.ej., la etiqueta peptídica). Una cadena p alterna entre residuos orientados hacia el solvente y residuos orientados hacia el núcleo proteico hidrofóbico y la orientación del residuo se define a partir de la estructura del dominio que forma un enlace isopeptídico espontáneo en la proteína isopeptídica de la que se deriva el conector peptídico. Lo anterior puede determinarse mediante cualquier método adecuado conocido de la técnica, p.ej., cristalografía de rayos X, resonancia magnética nuclear o microscopía crioelectrónica.

Entre los residuos de anclaje pequeños se incluyen alanina y valina. Entre los residuos de anclaje de tamaño intermedio se incluyen leucina, isoleucina y metionina. Entre los residuos de anclaje grandes se incluyen fenilalanina y triptófano. De esta manera, en algunas realizaciones, por lo menos un residuo de anclaje pequeño puede sustituirse por un residuo de anclaje de tamaño intermedio o grande. En algunas realizaciones, por lo menos un residuo de anclaje de tamaño intermedio puede sustituirse por un residuo de anclaje de tamaño pequeño o grande. En realizaciones todavía adicionales, por lo menos un residuo de anclaje grande puede sustituirse por un residuo de anclaje de tamaño intermedio o pequeño.

Pueden derivarse pares ortogonales de conectores peptídicos a partir de diferentes proteínas isopeptídicas o diferentes dominios de la misma proteína isopeptídica. Alternativamente, pueden producirse de novo pares ortogonales de conectores peptídicos.

Los pares de conectores peptídicos que se producen de novo deben poseer los dos residuos aminoácidos reactivos requeridos para la formación espontánea del enlace isopeptídico, preferentemente junto con un residuo de ácido glutámico o de ácido aspártico. De esta manera, tal como se ha indicado anteriormente, un conector peptídico comprende un residuo reactivo de lisina y el otro conector peptídico comprende un residuo reactivo de asparagina o aspartato. En una realización preferente, uno de los conectores peptídicos comprende además un residuo de ácido glutámico o de ácido aspártico que induce o facilita la formación de un enlace isopeptídico entre dichos conectores peptídicos. Sin embargo, tal como se ha señalado anteriormente, puede proporcionarse por separado un componente (p.ej., un péptido, p.ej., una péptido ligasa) que comprende un residuo de ácido glutámico o de ácido aspártico que induce o facilita la formación de un enlace isopeptídico entre dichos conectores peptídicos.

Resultará evidente que ninguno de los conectores peptídicos en un par afín de conectores peptídicos comprende ambos residuos reactivos participantes en la formación del enlace isopeptídico, es decir, cada conector peptídico en un par afín de conectores peptídicos comprende un residuo reactivo, es decir, un residuo de lisina o un residuo de aspartato/asparagina.

En realizaciones en las que uno de los conectores peptídicos comprende un residuo de ácido glutámico o de ácido aspártico que induce o facilita la formación de un enlace isopeptídico entre dichos conectores peptídicos, típicamente dicho residuo de ácido glutámico o de ácido aspártico se encuentra a 6.5 Angstroms o menos del residuo en el conector que participa en el enlace isopeptídico, p.ej., a 6,0, 5,5, 5,0, 4,5, 4,0, 3,5 o 3,0 Angstroms. Dichas distancias se refieren particularmente a las distancias entre los átomos relevantes dentro de cada residuo, es decir, los átomos que participan en la formación del enlace isopeptídico. En el caso de que dos conectores peptídicos se lleven a encontrarse próximos entre sí, p.ej., en el caso de que la primera y segunda proteína se pongan en contacto entre sí, los dos residuos reactivos (y más particularmente, sus átomos relevantes) que participan en el enlace deben encontrarse a 4 Angstroms o menos uno de otro en el espacio, preferentemente a 3,8, 3,6, 3,4, 3,2, 3,0, 2,8, 2,6, 2,4, 2,2, 2,0, 1,8 o 1,6 Angstroms.

El experto en la materia reconocerá inmediatamente que la pKa de los residuos que participan en la formación del enlace isopeptídico también deberían considerarse durante el diseño de una proteína isopeptídica de novo. Por ejemplo, resulta preferente que el residuo reactivo de lisina sea desprotonado antes de la reacción, que a pH neutro puede requerir que la lisina se entierre en el núcleo hidrofóbico.

Pueden derivarse pares ortogonales de conectores peptídicos a partir de diferentes proteínas isopeptídicas o de diferentes dominios de la misma proteína isopeptídica. Sin embargo, resulta posible producir pares ortogonales de conectores peptídicos a partir de la misma proteína isopeptídica, particularmente de los mismos dominios de una proteína isopeptídica. Por ejemplo, un conector peptídico de un par afín de conectores peptídicos puede modificarse de manera que no reaccione (o no reaccione eficientemente) con el otro conector peptídico en el par. La modificación puede ser reversible, de manera que la reversión o eliminación de la modificación que impide la reacción entre los conectores peptídicos reconstituye la capacidad del par de conectores peptídicos de reaccionar eficientemente para formar un enlace isopeptídico. De esta manera, a título de ejemplo, uno de los conectores peptídicos del par afín de conectores peptídicos A/A' puede modificarse, p.ej., A se modifica mediante la adición de un grupo bloqueante, para producir el conector peptídico B, en el que B no puede reaccionar eficientemente con A' o A para formar un enlace isopeptídico. La eliminación del grupo bloqueante de B resulta en el conector peptídico B', que es capaz de reaccionar con A' para formar un enlace isopeptídico.

La utilización de grupos bloqueantes reversibles o eliminables es bien conocida de la técnica. De esta manera, la adición de un grupo bloqueante a un conector peptídico de un par afín de conectores peptídicos para producir un par ortogonal de conectores peptídicos puede considerarse la adición de un grupo protector al conector peptídico o el enjaulado del conector peptídico. El grupo bloqueante (p.ej., protector, enmascarante o enjaulante) puede eliminarse por cualesquiera medios conocidos de la técnica que reconstituyan la capacidad del conector peptídico de reaccionar eficientemente con el otro conector peptídico del par de conectores peptídicos para formar un enlace isopeptídico. La eliminación del grupo bloqueante (p.ej., desprotector, desenmascarante o desenjaulante) puede llevarse a cabo mediante una reacción química, enzimática o lumínica, según la naturaleza del grupo bloqueante. Entre los ejemplos adecuados grupos bloqueantes se incluyen fracciones voluminosas, tales como proteínas que pueden impedir estéricamente la reacción y pueden eliminarse mediante la utilización de un enzima, tal como la proteasa del virus del grabado del tabaco (según la revisión en Bioorg. Med. Chem. 20(2):571-82, 15 de enero, 2012. doi: 10.1016/j.bmc.2011.07.048. pub. elec., 30 de julio de 2011). Cleavable linkers in chemical biology. Leriche G., Chisholm L., Wagner A. trans-ciclooctén-lisina enjaulada, (N-(((E)-ciclooct-2-en-1-il)-oxi)carbonil-L-lisina, que se desenjaula químicamente mediante la reacción con una tetrazina (Nat. Chem. Biol. 10(12):1003-5, dic., 2014. doi: 10.1038/nchembio.1656. pub. elec., 2 de noviembre de 2014). Diels-Alder reaction-triggered bioorthogonal protein decaging in living cells. Li J., Jia S., Chen PR) o lisina enjaulada con grupos de o-nitrobencilo o coumarina que resultan desenjaulados por luz de la longitud de onda apropiada, tal como es bien conocido de la técnica (ver, p.ej., Chem. Rev. 113(1):119-91, 9 de enero, 2013. doi: 10.1021/cr300177k. (publ. elec., 21 de diciembre, 2012) Photoremovable protecting groups in chemistry and biology: reaction mechanisms and efficacy. Klán , Solomek T., Bochet C.G., Blanc A., Givens R., Rubina M., Popik V., Kostikov A., Wirz J.)

La utilización de grupos bloqueantes no está necesariamente limitada a la producción de pares ortogonales adicionales de conectores peptídicos. Por ejemplo, los grupos bloqueantes pueden resultar particularmente útiles para controlar la extensión de las proteínas de fusión, p.ej., en reacciones multiplex. A título de ejemplo, pueden sintetizarse múltiples proteínas de fusión en un único sustrato de fase sólida, p.ej., para producir una matriz que comprende una diversidad de diferentes proteínas de fusión. La separación física de cada proteína de fusión sobre la fase sólida facilitará el desbloqueo selectivo de los conectores peptídicos sobre el sustrato, p.ej., mediante la utilización de grupos bloqueantes reactivos a la luz de manera similar a la generación de matrices de ácidos nucleicos. El desbloqueo selectivo de conectores peptídicos permitiría la extensión de una única proteína de fusión, o grupos de proteínas de fusión (p.ej., en una localización específica sobre la fase sólida), en una reacción de extensión y la extensión de una proteína de fusión diferente, o un grupo de proteínas de fusión, en reacciones posteriores.

De esta manera, en algunas realizaciones, uno o más de los conectores peptídicos puede comprender un grupo bloqueante, es decir, un grupo bloqueante reversible. En algunas realizaciones, el grupo bloqueante puede eliminarse mediante la puesta en contacto de la proteína de fusión con luz, p.ej., luz UV, un compuesto químico o un enzima que elimine el grupo bloqueante.

De esta manera, en algunas realizaciones, el método de la invención puede comprender una etapa de desbloqueo o eliminación de un grupo bloqueante de un conector peptídico en la proteína de fusión.

En una realización representativa, la invención proporciona un método para producir (p.ej., para generar, sintetizar, ensamblar, etc.) una proteína de fusión, en el que dicho método comprende:

en el que dicho par de conectores peptídicos de (a) es ortogonal al par de conectores peptídicos de (b), y en el que los pares ortogonales de conectores peptídicos se seleccionan de cualquiera de entre:

en el que los pares ortogonales de conectores peptídicos comprenden (1) y (4), (1) y (5), (1) y (6), (1) y (3), (1) y (2), (2) y (5), (2) y (6), (3) y (5), (3) y (6), (4) y (5) o (4) y (6),

y en el que el conector peptídico adicional en la proteína unida comprende un grupo bloqueante y las condiciones que permiten la formación de un enlace isopeptídico entre dicha tercera proteína y dicha proteína unida incluyen el tratamiento de la proteína unida para eliminar el grupo bloqueante.

En algunas realizaciones, el grupo bloqueante puede eliminarse (el conector peptídico puede desbloquearse) antes de la etapa de puesta en contacto de la proteína unida con dicha tercera proteína. En algunas realizaciones, el grupo bloqueante puede eliminarse (el conector peptídico puede desbloquearse) después o simultáneamente a la etapa de puesta en contacto de la proteína unida con dicha tercera proteína.

La expresión "conector peptídico" tal como se utiliza en la presente memoria se refiere generalmente a un péptido, oligopéptido o polipéptido que puede diseñarse o derivarse directamente a partir de una proteína isopeptídica, p.ej., el conector peptídico puede ser un fragmento de una proteína isopeptídica o una modificación de la misma. No existe una definición estándar para los límites de tamaño para péptido, oligopéptido y polipéptido, aunque típicamente se considera que un péptido comprende entre 2 y 20 aminoácidos, un oligopéptido comprende entre 21 y 39 aminoácidos y un polipéptido puede considerarse que comprende por lo menos 40 aminoácidos. De esta manera, un conector peptídico puede definirse en la presente memoria que comprende por lo menos 6 aminoácidos, p.ej., 6 a 300 aminoácidos.

En algunas realizaciones, un conector peptídico puede denominarse etiqueta peptídica y puede presentar entre 6 y 50 aminoácidos de longitud, p.ej., entre 7 y 45, entre 8 y 40, entre 9 y 35, entre 10 y 30 o entre 11 y 25 aminoácidos de longitud, p.ej., puede comprender o consistir en 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 o 20 aminoácidos. El conector o etiqueta peptídico se une específicamente de manera covalente mediante un enlace isopeptídico a un segundo conector peptídico, en el que otro conector peptídico que puede considerarse una etiqueta peptídica o una pareja de unión peptídica, se define posteriormente. Dos conectores peptídicos (p.ej., etiqueta peptídica y etiqueta peptídica, o etiqueta peptídica y pareja de unión peptídica) que reaccionen entre sí (p.ej., específica y eficientemente) formando un enlace isopeptídico pueden definirse como un par de conectores peptídicos, particularmente un par afín de conectores peptídicos.

De esta manera, tal como se ha indicado anteriormente, un conector peptídico debe comprender por lo menos un residuo aminoácido, p.ej., lisina o asparagina/aspartato, que participa en la formación de un enlace isopeptídico. De acuerdo con lo anterior, cada conector peptídico en un par de conectores peptídicos debe comprender un residuo aminoácido reactivo diferente, es decir, complementario, que participa en la formación de un enlace isopeptídico, es decir, un conector peptídico comprende un residuo de lisina y el otro conector peptídico comprende un residuo de asparagina o aspartato.

En algunas realizaciones, un par de conectores peptídicos comprende dos etiquetas peptídicas. Típicamente, dos etiquetas peptídicas no reaccionan espontáneamente para formar un enlace isopeptídico, es decir, requieren la adición de un componente (p.ej., un péptido, p.ej., una péptido ligasa) que induce o cataliza la formación del enlace isopeptídico entre dichas etiquetas/conectores peptídicos, tal como se ha definido anteriormente.

En algunas realizaciones, un conector peptídico (es decir, uno de los conectores peptídicos en un par afín de conectores peptídicos) puede denominarse pareja de unión peptídica, que puede definirse como un péptido (particularmente un oligopéptido o polipéptido) que se deriva o se ha diseñado a partir de una proteína isopeptídica y que puede unirse covalentemente a una etiqueta peptídica mediante un enlace isopeptídico (preferentemente mediante una reacción espontánea). En algunas realizaciones, la pareja de unión peptídica puede diseñarse o derivarse de la misma proteína isopeptídica que la etiqueta peptídica a la que se une covalentemente, es decir, su etiqueta o conector peptídico correspondiente.

Generalmente, una pareja de unión peptídica es mayor que su etiqueta peptídica correspondiente y comprende o consiste en un fragmento o parte de mayor tamaño de la proteína isopeptídica en comparación con la etiqueta peptídica. En particular, además de comprender un residuo que participa en la formación del enlace isopeptídico (es decir, una lisina o asparagina/aspartato), la pareja de unión peptídica comprende un residuo de ácido glutámico o de ácido aspártico que facilita o induce la formación del enlace isopeptídico entre los conectores peptídicos, p.ej., la etiqueta peptídica y la pareja de unión peptídica.

De esta manera, una pareja de unión peptídica puede comprender un fragmento de una proteína isopeptídica que se solapa con un fragmento diseñado para constituir una etiqueta peptídica o puede comprender un fragmento discreto o separado de la proteína isopeptídica en comparación con la de la etiqueta peptídica. De esta manera, la secuencia de la pareja de unión peptídica puede solaparse con la de la etiqueta peptídica diseñada o la etiqueta peptídica y la pareja de unión peptídica pueden comprender o consistir en dos fragmentos discretos de la proteína isopeptídica.

Aunque no existe ningún límite particular del tamaño de una pareja de unión peptídica, en la práctica resulta preferente minimizar el tamaño de los conectores peptídicos para la utilización en los métodos y usos de la invención.

De esta manera, en algunas realizaciones, el conector peptídico (p.ej., la pareja de unión peptídica) puede presentar entre 50 y 300 aminoácidos de longitud, p.ej., entre 60 y 250, entre 70 y 225, o entre 80 y 200 aminoácidos de longitud, p.ej., puede comprender o consistir en 60, 65, 70, 75, 80, 85, 90, 95, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190 o 200 aminoácidos.

De acuerdo con lo anterior, en algunas realizaciones, un par de conectores peptídicos comprende una etiqueta peptídica y una pareja de unión peptídica, en el que dichos conectores peptídicos reaccionan espontáneamente formando un enlace isopeptídico.

En el caso de que la formación de enlace isopeptídico entre los conectores peptídicos no sea espontánea (p.ej., en el caso de que los conectores peptídicos sean ambas etiquetas peptídicas), el péptido que induce o cataliza la formación del enlace isopeptídico entre dichas etiquetas/conectores peptídicos puede considerarse un péptido (p.ej., una péptido ligasa) derivada de una proteína isopeptídica o una pareja de unión peptídica tal como se ha definido anteriormente. En particular, el péptido comprende un residuo de ácido glutámico o de ácido aspártico que facilita o induce la formación del enlace isopeptídico entre los conectores peptídicos, aunque resulta importante que la ligasa no contenga un residuo aminoácido que reaccione formando un enlace isopeptídico con ninguno de los conectores peptídicos en el par de conectores peptídicos. En algunas realizaciones, la péptido ligasa puede presentar entre 50 y 300 aminoácidos de longitud, p.ej., entre 60 y 250, entre 70 y 225, o entre 80 y 200 aminoácidos de longitud, p.ej., puede comprender o consistir en 60, 65, 70, 75, 80, 85, 90, 95, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190 o 200 aminoácidos.

De esta manera, un conector peptídico (p.ej., una etiqueta peptídica y/o una pareja de unión peptídica), por lo tanto, no consiste en la secuencia proteica completa de una proteína isopeptídica y presenta una longitud más corta. Por ejemplo, un conector peptídico puede comprender menos de 5, 10, 20, 30, 40 o 50% del número de residuos aminoácidos presente en la proteína isopeptídica.

Aunque un conector peptídico o par de conectores peptídicos puede estar basado en la secuencia de una proteína isopeptídica (particularmente uno o más fragmentos de la misma), el experto en la materia entenderá fácilmente que la secuencia del conector peptídico puede diferir de la secuencia de la parte de la proteína isopeptídica de la que se deriva. De esta manera, en algunas realizaciones, el conector peptídico o par de conectores peptídicos puede comprender mutaciones o alteraciones en comparación con la secuencia de la proteína isopeptídica de la que se deriva. Tal como se comenta posteriormente, pueden introducirse algunas mutaciones en la secuencia del conector peptídico para mejorar la estabilidad y/o función del conector peptídico, p.ej., para mejorar la velocidad de reacción de la formación espontánea de enlace isopeptídico entre los conectores peptídicos.

De esta manera, en algunas realizaciones, un conector peptídico puede comprender o consistir en un fragmento de una proteína isopeptídica, en la que el fragmento satisface los criterios de tamaño explicados anteriormente y comprende por lo menos 70, 75, 80, 85, 90, 95, 96, 97, 98, 99 o 100% de identidad de secuencia respecto a una región comparable de la proteína isopeptídica de la que se ha derivado.

Además, tal como se ha señalado anteriormente, las proteínas isopeptídicas pueden identificarse mediante la búsqueda de homólogos estructurales de proteínas isopeptídicas conocidas, es decir, proteínas con similitud o identidad de secuencias a proteínas isopeptídicas conocidas. Dichos homólogos pueden considerarse proteínas funcionalmente equivalentes y pueden encontrar utilidad en la producción de los conectores peptídicos de la presente invención.

Puede derivarse un par de conectores peptídicos a partir de cualquier proteína isopeptídica adecuada. Tal como se ha indicado anteriormente, se conocen de la técnica diversas proteínas isopeptídicas. Por ejemplo, pueden derivarse conectores peptídicos a partir de la proteína pilina mayor Spy0128, que presenta la secuencia de aminoácidos indicada en la SEC ID n° 23 y que está codificada por la secuencia de nucleótidos indicada en la SEC ID n° 24. Se forman dos enlaces isopeptídicos en la proteína. Un enlace isopeptídico se forma entre la lisina en la posición 179 en la SEC ID n° 23 y la asparagina en la posición 303 en la SEC ID n° 23 (los residuos reactivos). El residuo de ácido glutámico que induce el enlace isopeptídico espontáneo se encuentra en la posición 258 en la SEC ID n° 23. De esta manera, un par de conectores peptídicos desarrollado a partir de una proteína isopeptídica indicada en la SEC ID n° 23 preferentemente comprenderá un conector peptídico que comprende un fragmento de la proteína que comprende la asparagina reactiva en la posición 303 y un conector peptídico que comprende un fragmento de la proteína que comprende la lisina reactiva en la posición 179. Uno de los conectores peptídicos puede comprender un fragmento que contiene además el residuo de ácido glutámico en la posición 258. Alternativamente, puede proporcionarse por separado un fragmento de la proteína que comprende el residuo de ácido glutámico en la posición 258, es decir, en forma de una péptido ligasa tal como se ha definido anteriormente.

Otro enlace isopeptídico en la proteína pilina mayor Spy0128 se encuentra entre el residuo de lisina en la posición 36 de la SEC ID n° 23 y el residuo de asparagina en la posición 168 de la SEC ID n° 23. El residuo de ácido glutámico que induce la formación de isopéptido se encuentra en la posición 117 en la SEC ID n° 23. De esta manera, un par de conectores peptídicos desarrollado a partir de una proteína isopeptídica indicada en la SEC ID n° 23 preferentemente comprenderá un conector peptídico que comprende un fragmento de la proteína que comprende el residuo reactivo de lisina en la posición 36 y un conector peptídico que comprende un fragmento de la proteína que comprende la asparagina reactiva en la posición 168. Uno de los conectores peptídicos puede comprender un fragmento que contiene además el residuo de ácido glutámico en la posición 117. Alternativamente, puede proporcionarse por separado un fragmento de la proteína que comprende el residuo de ácido glutámico en la posición 117, es decir, en forma de una péptido ligasa tal como se ha definido anteriormente.

ACE19, un dominio de una proteína adhesina de E. faecalis, también forma espontáneamente un enlace isopeptídico. ACE19 presenta una secuencia de aminoácidos tal como se indica en la SEC ID n° 27 y que está codificada por la secuencia de nucleótidos indicada en la SEC ID n° 28.

El enlace isopeptídico se encuentra entre el residuo de lisina en la posición 181 de la SEC ID n° 27 y el residuo de asparagina en la posición 294 de la SEC ID n° 27. El enlace resulta inducido por un residuo de ácido aspártico en la posición 213 de la SEC ID n° 27. De esta manera, un par de conectores peptídicos desarrollado a partir de una proteína isopeptídica indicada en la SEC ID n° 27 preferentemente comprenderá un conector peptídico que comprende un fragmento de la proteína que comprende el residuo reactivo de asparagina en la posición 294 y un conector peptídico que comprende un fragmento de la proteína que comprende el residuo reactivo de lisina en la posición 181. Uno de los conectores peptídicos puede comprender un fragmento que contiene además el residuo de ácido aspártico en la posición 213. Alternativamente, puede proporcionarse por separado un fragmento de la proteína que comprende el residuo de ácido aspártico en la posición 213, es decir, en forma de una péptido ligasa tal como se ha definido anteriormente.

El dominio de unión a colágeno de S. aureus que presenta la secuencia de aminoácidos indicada en la SEC ID n° 29, comprende un enlace isopeptídico formado espontáneamente. El enlace isopeptídico se encuentra entre la lisina en la posición 176 de la SEC ID n° 29 y la asparagina en la posición 308 de la SEC ID n° 29. El residuo de ácido aspártico que induce el enlace isopeptídico se encuentra en la posición 209 de la SEC ID n° 29. De esta manera, un par de conectores peptídicos desarrollado a partir de la proteína isopeptídica indicada en la SEC ID n° 29 preferentemente comprenderá un conector peptídico que comprende un fragmento de la proteína que comprende el residuo reactivo de lisina en la posición 176 y un conector peptídico que comprende un fragmento de la proteína que comprende la asparagina reactiva en la posición 308. Uno de los conectores peptídicos puede comprender un fragmento que contiene además el residuo de ácido aspártico en la posición 209. Alternativamente, puede proporcionarse por separado un fragmento de la proteína que comprende el residuo de ácido aspártico en la posición 209, es decir, en forma de una péptido ligasa tal como se ha definido anteriormente.

FbaB de Streptococcus pyogenes comprende un dominio, CnaB2, que presenta una secuencia de aminoácidos indicada en la SEC ID n° 25, está codificada por la secuencia de nucleótidos indicada en la SEC ID n° 26 y que comprende un enlace isopeptídico formado espontáneamente. El enlace isopeptídico en el dominio CnaB2 se forma entre la lisina en la posición 15 de la SEC ID n° 25 y un residuo de ácido aspártico en la posición 101 de la SEC ID n° 25. El residuo de ácido glutámico que induce el enlace isopeptídico se encuentra en la posición 61 de la SEC ID n° 25. De esta manera, un par de conectores peptídicos desarrollado a partir de la proteína isopeptídica indicada en la SEC ID n° 25 preferentemente comprenderá un conector peptídico que comprende un fragmento de la proteína que comprende la lisina reactiva en la posición 15 y un conector peptídico que comprende un fragmento de la proteína que comprende el ácido aspártico reactivo en la posición 101. Uno de los conectores peptídicos puede comprender un fragmento que contiene además el residuo de ácido glutámico en la posición 61. Alternativamente, puede proporcionarse por separado un fragmento de la proteína que comprende el residuo de ácido glutámico en la posición 61, es decir, en forma de una péptido ligasa tal como se ha definido anteriormente (p.ej., SEC ID n° 34).

La proteína RrgA es una proteína de adhesión de Streptococcus pneumoniae, que presenta la secuencia de aminoácidos indicada en la SEC ID n° 21 y que está codificada por la secuencia de nucleótidos indicada en la SEC ID n° 22. Se forma un enlace isopeptídico entre la lisina en la posición 742 de la SEC ID n° 21 y la asparagina en la posición 854 en la SEC ID n° 21. El enlace resulta inducido por un residuo de ácido glutámico en la posición 803 de la SEC ID n° 21. De esta manera, un par de conectores peptídicos desarrollado a partir de la proteína isopeptídica indicada en la SEC ID n° 21 preferentemente comprenderá un conector peptídico que comprende un fragmento de la proteína que comprende la asparagina reactiva en la posición 854 y un conector peptídico que comprende un fragmento de la proteína que comprende la lisina reactiva en la posición 742. Uno de los conectores peptídicos puede comprender un fragmento que contiene además el residuo de ácido glutámico en la posición 803. Alternativamente, puede proporcionarse por separado un fragmento de la proteína que comprende el residuo de ácido glutámico en la posición 803, es decir, en forma de una péptido ligasa tal como se ha definido anteriormente.

La proteína PsCs es un fragmento de la proteína de clasificación C-terminal del sistema de secreción Por de Streptococcus intermedius, que presenta la secuencia de aminoácidos indicada en la SEC ID n° 31 y que está codificada por la secuencia de nucleótidos indicada en la SEC ID n° 32. Se forma un enlace isopeptídico entre la lisina en la posición 405 de la SEC ID n° 31 y el aspartato en la posición 496 de la SEC ID n° 31. De esta manera, un par de conectores peptídicos desarrollado a partir de la proteína isopeptídica indicada en la SEC ID n° 31 preferentemente comprenderá un conector peptídico que comprende un fragmento de la proteína que comprende el aspartato reactivo en la posición 496 y un conector peptídico que comprende un fragmento de la proteína que comprende la lisina reactiva en la posición 405.

De esta manera, puede derivarse un par de conectores peptídicos a partir de una proteína isopeptídica que comprende la secuencia de aminoácidos indicada en cualquiera de las SEC ID n° 21, 23, 25, 27, 29 o 31 o una proteína con una identidad de secuencia de por lo menos 70% respecto a la secuencia de aminoácidos indicada en cualquiera de las SEC ID n° 21, 23, 25, 27, 29 o 31.

Dicha secuencia de proteína isopeptídica, anteriormente, puede ser por lo menos 75, 80, 85, 90, 95, 96, 97, 98, 99 o 100% idéntica a la secuencia (SEC ID n° 21, 23, 25, 27, 29 o 31) con la que se compara.

Preferentemente, los conectores peptídicos derivados de las proteínas isopeptídicas definidas anteriormente satisfacen los criterios de tamaño e identidad de las secuencias indicados anteriormente.

La identidad de secuencia puede determinarse mediante cualesquiera medios conocidos de la técnica, p.ej., mediante la utilización del banco de datos de secuencias de proteínas SWISS-PROt utilizando FASTA pep-cmp con un pamfactor variable y penalización por creación de hueco fijada en 12,0 y penalización por extensión de hueco fijada en 4,0 y una ventana de 2 aminoácidos. Entre otros programas para determinar la identidad de las secuencias de aminoácidos se incluyen el programa BestFit del paquete de software del Genetics Computer Group (GCG), versión 10, de la University de Wisconsin. El programa utiliza el algoritmo de homologías locales de Smith y Waterman con los valores por defecto. Penalización por creación de hueco - 8; penalización por extensión de hueco = 2, identidad promedio = 2,912; no identidad promedio = -2,003.

Preferentemente, dicha comparación se lleva a cabo a lo largo de la longitud completa de la secuencia, aunque puede realizarse en una ventana de comparación más pequeña, p.ej., de menos de 200, 100 o 50 aminoácidos contiguos. Preferentemente, dichas proteínas relacionadas por la identidad de las secuencias son funcionalmente equivalentes a los polipéptidos que se indican en las SEC ID n° indicadas. Tal como se indica en la presente memoria, "equivalencia funcional" se refiere a homólogos de las proteínas isopeptídicas comentadas anteriormente que pueden mostrar una cierta eficacia reducida en enlaces isopeptídicos de formación espontánea respecto a la molécula parental (es decir, la molécula respecto a la que muestra homología de secuencia), aunque preferentemente son igual de eficientes o son más eficientes.

Los pares ortogonales de conectores peptídicos pueden derivarse de dos o más cualesquiera de las proteínas isopeptídicas definidas anteriormente. Por ejemplo, se deriva un primer par de conectores peptídicos a partir de una proteína isopeptídica que presenta la secuencia de aminoácidos indicada en la SEC ID n° 21 y se deriva un segundo par ortogonal de conectores peptídicos a partir de una proteína isopeptídica que presenta la secuencia de aminoácidos indicada en la SEC ID n° 25. Tal como se comenta posteriormente, pueden derivarse dos pares ortogonales de conectores peptídicos a partir de la misma proteína isopeptídica, p.ej., la SEC ID n° 21. Pueden derivarse otros pares ortogonales de conectores peptídicos a partir de proteínas isopeptídicas que presentan las secuencias de aminoácidos indicadas en las SEC ID n° 21 y 23, 21 y 27, 21 y 29, 21 y 31, 25 y 27, 25 y 29 o 25 y 31. El experto en la materia podrá determinar fácilmente si dos pares cualesquiera de conectores peptídicos son ortogonales basándose en los métodos dados a conocer en la presente memoria, particularmente en los Ejemplos. Por ejemplo, pueden ponerse en contacto diversas combinaciones de conectores peptídicos de diferentes pares de conectores peptídicos, p.ej. en solución, durante un periodo de tiempo adecuado, p.ej., de 1 a 24 horas, bajo condiciones que facilitan la formación de enlaces isopeptídicos, p.ej., en PBS a un pH de entre 4 y 9, p.ej., pH 7, a una temperatura de entre 1°C y 40°C, p.ej., 25°C. La muestra puede analizarse, p.ej., mediante electroforesis en gel (p.ej., SDS-PAGE) para determinar si cualquiera de los conectores peptídicos ha reaccionado, es decir, mediante la búsqueda de péptidos conjugados, ver, p.ej., la figura 7. De esta manera, pueden derivarse pares ortogonales de conectores peptídicos a partir de cualquier combinación adecuada de proteínas isopeptídicas.

El inventor ha desarrollado ventajosamente pares de conectores peptídicos que encuentran particular utilidad en los métodos y usos de la invención. A este respecto, el inventor ha determinado que los pares de conectores peptídicos pueden derivarse de la proteína RrgA tal como se ha definido anteriormente. Sin embargo, tal como se describe en detalle en los Ejemplos, posteriormente, el inventor ha introducido mutaciones en los conectores peptídicos respecto a la secuencia de RrgA nativa a fin de mejorar la reactividad de los conectores peptídicos. Específicamente, se sustituyó un residuo de glicina por un residuo de treonina a fin de estabilizar una cadena p y se sustituyó un residuo de aspartato por un residuo de glicina a fin de estabilizar un giro de horquilla próximo al sitio de reacción.

De esta manera, la presente invención proporciona un conector peptídico que comprende:

(i) una secuencia de aminoácidos tal como se indica en la SEC ID n° 1 o una secuencia con una identidad de secuencia de por lo menos 70% respecto a una secuencia de aminoácidos tal como se indica en la SEC ID n° 1, en la que dicha secuencia de aminoácidos comprende un residuo de lisina en la posición 9, en el que dicho conector peptídico es capaz de formar espontáneamente un enlace isopeptídico con un conector peptídico que comprende una secuencia de aminoácidos tal como se indica en la SEC ID n° 2,

(ii) una secuencia de aminoácidos tal como se indica en la SEC ID n° 2 o una secuencia con una identidad de secuencia de por lo menos 70% respecto a una secuencia de aminoácidos tal como se indica en la SEC ID n° 2, en la que dicha secuencia de aminoácidos comprende un residuo de glutamato o aspartato en la posición 55, un residuo de treonina en la posición 94, un residuo de glicina en la posición 100 y un residuo de asparagina o aspartato en la posición 106, en el que dicho conector peptídico es capaz de formar espontáneamente un enlace isopeptídico con un conector peptídico que comprende una secuencia de aminoácidos tal como se indica en la SEC ID n° 1,

(iii) una secuencia de aminoácidos tal como se indica en la SEC ID n° 5 o una secuencia con una identidad de secuencia de por lo menos 70% respecto a una secuencia de aminoácidos tal como se indica en la SEC ID n° 5, en la que dicha secuencia de aminoácidos comprende un residuo de aspartato o asparagina en la posición 8, en el que dicho conector peptídico es capaz de formar espontáneamente un enlace isopeptídico con un conector peptídico que comprende una secuencia de aminoácidos tal como se indica en la SEC ID n° 6,

(iv) una secuencia de aminoácidos tal como se indica en la SEC ID n° 6 o una secuencia con una identidad de secuencia de por lo menos 70% respecto a una secuencia de aminoácidos tal como se indica en la SEC ID n° 6, en la que dicha secuencia de aminoácidos comprende un residuo de lisina en la posición 8, en el que dicho conector peptídico es capaz de formar espontáneamente un enlace isopeptídico con un conector peptídico que comprende una secuencia de aminoácidos tal como se indica en la SEC ID n° 5,

(v) una secuencia de aminoácidos tal como se indica en la SEC ID n° 9 o una secuencia con una identidad de secuencia de por lo menos 70% respecto a una secuencia de aminoácidos tal como se indica en la SEC ID n° 9, en la que dicha secuencia de aminoácidos comprende un residuo de asparagina o aspartato en la posición 17, en el que dicho conector peptídico es capaz de formar espontáneamente un enlace isopeptídico con un conector peptídico que comprende una secuencia de aminoácidos tal como se indica en la SEC ID n° 10, preferentemente en el que dicho conector comprende una secuencia de aminoácidos tal como se indica en la SEC ID n° 109 o una secuencia con una identidad de secuencia de por lo menos 70% respecto a una secuencia de aminoácidos tal como se indica en la SEC ID n° 109, en el que dicha secuencia de aminoácidos comprende un residuo de asparagina o aspartato en la posición 17, un residuo de glicina en la posición 11 y opcionalmente un residuo de isoleucina en la posición 20, un residuo de prolina en las posiciones 21 y 22 y un residuo de lisina en la posición 23, o

(vi) una secuencia de aminoácidos tal como se indica en la SEC ID n° 10 o una secuencia con una identidad de secuencia de por lo menos 70% respecto a una secuencia de aminoácidos tal como se indica en la SEC ID n° 10, en la que dicha secuencia de aminoácidos comprende un residuo de lisina en la posición 9 y un residuo de glutamato o aspartato en la posición 70, en el que dicho conector peptídico es capaz de formar espontáneamente un enlace isopeptídico con un conector peptídico que comprende una secuencia de aminoácidos tal como se indica en la SEC ID n° 9 o SEC ID n° 109.

En algunas realizaciones, el conector peptídico en (i) comprende una secuencia de aminoácidos tal como se indica en la SEC ID n° 38, y/o el conector peptídico en (ii) comprende una secuencia de aminoácidos tal como se indica en la SEC ID n° 39, y/o el conector peptídico en (iii) comprende una secuencia de aminoácidos tal como se indica en la SEC ID n° 42, y/o el conector peptídico en (iv) comprende una secuencia de aminoácidos tal como se indica en la SEC ID n° 43, y/o el conector peptídico en (v) comprende una secuencia de aminoácidos tal como se indica en la SEC ID n° 46, y/o el conector peptídico en (vi) comprende una secuencia de aminoácidos tal como se indica en la SEC ID n° 47.

En algunas realizaciones, dicha secuencia de conector peptídico, anteriormente es por lo menos 75, 80, 85, 90, 95, 96, 97, 98, 99 o 100% idéntica a la secuencia (SEC ID n° 1, 2, 5, 6, 9, 10 o 109) con la que se compara.

De esta manera, la invención proporciona un par de conectores peptídicos que pueden utilizarse en los métodos y usos de la invención, que comprende:

(1) conectores peptídicos que comprende las SEC ID n° 1 y 2 o variantes de las mismas tal como se han definido anteriormente, p.ej., las SEC ID n° 38 y 39,

(2) conectores peptídicos que comprende las SEC ID n° 5 y 6 o variantes de las mismas tal como se han definido anteriormente, p.ej., las SEC ID n° 42 y 43,

(3) conectores peptídicos que comprende las SEC ID n° 9 y 10 o variantes de las mismas tal como se han definido anteriormente, p.ej., las SEC ID n° 46 y 47, o

(4) conectores peptídicos que comprende las SEC ID n° 109 y 10 o variantes de las mismas tal como se han definido anteriormente.

De esta manera, cada par de conectores peptídicos definido anteriormente puede definirse como un par afín de conectores peptídicos.

Cada par de conectores peptídicos definido anteriormente (es decir, cada par afín de conectores peptídicos) es ortogonal (es decir, no afín) a los demás pares de conectores peptídicos, p.ej., el par (1) es ortogonal al par (2), (3) y/o par (4); el par (2) es ortogonal al par (1), (3) y/o par (4); el par (3) es ortogonal al par (1) y/o par (2), y el par (4) es ortogonal al par (1) y/o (2). Los pares ortogonales preferentes adicionales de conectores peptídicos se definen posteriormente.

Tal como se ha comentado anteriormente, los conectores peptídicos de la invención encuentran particular utilidad en la síntesis de proteínas de fusión, en las que los conectores peptídicos se incorporan en (p.ej., dominios de forma de, o están unidos a) una unidad proteica que debe unirse (conjugarse) a otra unidad proteica para formar una proteína de fusión. De esta manera, en realizaciones adicionales, la invención proporciona un polipéptido recombinante o sintético que comprende un polipéptido y un conector peptídico tal como se ha definido anteriormente.

Resultará evidente que los conectores peptídicos de la invención pueden encontrar utilidad en otros métodos y usos, p.ej., como etiquetas peptídicas tal como se indica en el documento n° WO2011/098772.

Entre otros conectores peptídicos dados a conocer en la presente memoria se incluyen:

(i) una secuencia de aminoácidos tal como se indica en la SEC ID n° 13 o una secuencia con una identidad de secuencia de por lo menos 70% respecto a una secuencia de aminoácidos tal como se indica en la SEC ID n° 13, en la que dicha secuencia de aminoácidos comprende un residuo de aspartato o asparagina en la posición 7, o (ii) una secuencia de aminoácidos tal como se indica en la SEC ID n° 14 o una secuencia con una identidad de secuencia de por lo menos 70% respecto a una secuencia de aminoácidos tal como se indica en la SEC ID n° 14, en la que dicha secuencia de aminoácidos comprende un residuo de glutamato o aspartato en la posición 56, y un residuo de lisina en la posición 10, o

(iii) una secuencia de aminoácidos tal como se indica en la SEC ID n° 33 o una secuencia con una identidad de secuencia de por lo menos 70% respecto a una secuencia de aminoácidos tal como se indica en la SEC ID n° 33, en la que dicha secuencia de aminoácidos comprende un residuo de lisina en la posición 8, o

(iv) una secuencia de aminoácidos tal como se indica en la SEC ID n° 17 o una secuencia con una identidad de secuencia de por lo menos 70% respecto a una secuencia de aminoácidos tal como se indica en la SEC ID n° 17, en la que dicha secuencia de aminoácidos comprende un residuo de aspartato o asparagina en la posición 11, o (v) una secuencia de aminoácidos tal como se indica en la SEC ID n° 18 o una secuencia con una identidad de secuencia de por lo menos 70% respecto a una secuencia de aminoácidos tal como se indica en la SEC ID n° 18, en la que dicha secuencia de aminoácidos comprende un residuo de glutamato o aspartato en la posición 241, y un residuo de lisina en la posición 162,

En algunas realizaciones, dicha secuencia de conector peptídico, anteriormente es por lo menos 75, 80, 85, 90, 95, 96, 97, 98, 99 o 100% idéntica a la secuencia (SEC ID n° 13, 14, 17, 18 o 33) con la que se compara.

Entre otros pares de conectores peptídicos dados a conocer en la presente memoria se incluyen:

(5) conectores peptídicos que comprende las SEC ID n° 13 y 14 o variantes de las mismas tal como se han definido anteriormente,

(6) conectores peptídicos que comprende las SEC ID n° 13 y 33 o variantes de las mismas tal como se han definido anteriormente, o

(7) conectores peptídicos que comprende las SEC ID n° 17 y 18 o variantes de las mismas tal como se han definido anteriormente.

En algunas realizaciones, en el caso de que el par afín de conectores peptídicos comprenda el par definido en (6), anteriormente, la reacción comprende además un componente que induce o cataliza la formación del enlace isopeptídico. Por ejemplo, la reacción comprende una péptido ligasa, preferentemente en la que dicha péptido ligasa comprende una secuencia de aminoácidos tal como se indica en la SEC ID n° 34 o una secuencia con una identidad de secuencia de por lo menos 70% respecto a una secuencia de aminoácidos tal como se indica en la SEC ID n° 34. En algunas realizaciones, dicha secuencia de péptido ligasa, anteriormente, es por lo menos 75, 80, 85, 90, 95, 96, 97, 98, 99 o 100% idéntica a la secuencia (SEC iD n° 34) con la que se compara.

Entre los pares ortogonales de conectores peptídicos que pueden utilizarse en los métodos y usos de la invención se incluyen cualquiera de los pares siguientes, que se han definido anteriormente: (1) y (4), (1) y (5), (1) y (6), (1) y (3), (1) y (2), (2) y (4), (2) y (5), (2) y (6), (3) y (5), (3) y (6), (4) y (5) y (4) y (6).

La posición del conector peptídico dentro de una proteína que debe unirse a otra proteína para formar una proteína de fusión no resulta particularmente importante. De esta manera, en algunas realizaciones, el conector peptídico puede situarse en el extremo N-terminal o C-terminal del polipéptido o proteína recombinante o sintético que debe unirse en la proteína de fusión. En algunas realizaciones, el conector peptídico puede situarse internamente dentro del polipéptido o proteína recombinante o sintético que debe unirse en la proteína de fusión. De esta manera, en algunas realizaciones, el conector peptídico puede considerarse un dominio N-terminal, C-terminal o interno del polipéptido o proteína recombinante o sintético que debe unirse en la proteína de fusión.

En algunas realizaciones, puede resultar útil incluir uno o más espaciadores, p.ej., un espaciador peptídico, entre la proteína que debe unirse y la proteína de fusión y el conector peptídico. De esta manera, la proteína y conector peptídico pueden unirse directamente entre sí o pueden unirse indirectamente mediante una o más secuencias espaciadoras. De esta manera, una secuencia de espaciador puede interespaciar o separar dos o más partes individuales del polipéptido recombinante o sintético o una proteína que debe unirse en la proteína de fusión. En algunas realizaciones, un espaciador puede ser N-terminal o C-terminal respecto al conector peptídico. En algunas realizaciones, los espaciadores pueden encontrarse en ambos lados del conector peptídico.

La naturaleza exacta de la secuencia espaciadora no resulta crucial y puede ser de longitud y/o secuencia variable, por ejemplo puede presentar 1 a 40, más particularmente 2 a 20, 1 a 15, 1 a 12, 1 a 10, 1 a 8 o 1 a 6 residuos, p.ej., 6, 7, 8, 9, 10 o más residuos. A título de ejemplo representativo, la secuencia espaciadora, en caso de estar presente, puede presentar 1 a 15, 1 a 12, 1 a 10, 1 a 8 o 1 a 6 residuos, etc. La naturaleza de los residuos no resulta crítica y pueden ser, por ejemplo, cualquier aminoácido, p.ej., un aminoácido neutro o un aminoácido alifático, o alternativamente pueden ser hidrofóbicos, o polares o con carga, o formadores de estructura, p.ej., prolina. En algunas realizaciones preferentes, el conector es una secuencia rica en serina y/o glicina.

De esta manera, entre las secuencias espaciadoras ejemplares se incluye cualquier residuo aminoácido individual, p.ej., S, G, L, V, P, R, H, M, A o E, o un dipéptido, tripéptido, tetrapéptido, pentapéptido o hexapéptido compuesto de uno o más de dichos residuos. Las secuencias espaciadoras representativas y preferentes comprenden una secuencia de aminoácidos tal como se indica en la SEC ID n° 36 o n° 37.

Los polipéptidos recombinantes o sintéticos de la invención pueden comprender además fracciones o etiquetas de purificación para facilitar su purificación (p.ej., antes de la utilización en los métodos y usos de la invención, y/o durante la extensión de la proteína de fusión tal como se comenta posteriormente). Puede incorporarse cualquier fracción o etiqueta de purificación adecuada en el polipéptido y dichas fracciones son bien conocidas de la técnica. Por ejemplo, en algunas realizaciones, el péptido recombinante o sintético puede comprender una etiqueta o fracción de purificación de péptidos, p.ej., una secuencia de etiqueta de His. Dichas fracciones o etiquetas de purificación pueden incorporarse en cualquier posición dentro del polipéptido. En algunas realizaciones preferentes, la fracción de purificación está situada en o hacia (es decir, a menos de 5, 10, 15 o 20 aminoácidos) el extremo N-terminal o C-terminal del polipéptido.

Entre los polipéptidos recombinantes o sintéticos representativos de la invención se incluyen polipéptidos con una secuencia de aminoácidos tal como se indica en cualquiera de las SEC ID n° 50 a 59, o una secuencia con una identidad de secuencia de por lo menos 70% respecto a la secuencia de aminoácidos indicada en cualquiera de las SEC ID n° 50 a 59, en donde dichos polipéptidos comprenden un conector peptídico tal como se ha definido anteriormente.

Preferentemente, el polipéptido recombinante o sintético satisface los requisitos de identidad de secuencia definidos anteriormente, p.ej., es por lo menos 75, 80, 85, 90, 95, 96, 97, 98, 99 o 100% idéntica respecto a la secuencia con la que se compara.

Tal como se ha señalado anteriormente, una ventaja de la presente invención parte del hecho de que los conectores peptídicos incorporados en las proteínas (p.ej., los polipéptidos recombinantes o sintéticos de la invención) que deben unirse entre sí para formar una proteína de fusión puede encontrarse completamente codificadas genéticamente. De esta manera, en un aspecto adicional, la invención proporciona unas moléculas de ácidos nucleicos codificante de un conector peptídico o polipéptido tal como se ha definido anteriormente.

En algunas realizaciones, la molécula de ácidos nucleicos codificante de un conector peptídico tal como se ha definido anteriormente comprende una secuencia de nucleótidos tal como se indica en cualquiera de las SEC ID n° 3, 4, 7, 8, 11, 12, 40, 41, 44, 45, 48, 49 o 110 o una secuencia de nucleótidos con una identidad de secuencia de por lo menos 70% respecto a la secuencia de aminoácidos indicada en cualquiera de las SEC ID n° 3, 4, 7, 8, 11, 12, 40, 41, 44, 45, 48, 49 o 110.

En algunas realizaciones, la molécula de ácidos nucleicos codificante de un polipéptido recombinante o sintético tal como se ha definido anteriormente comprende una secuencia de nucleótidos tal como se indica en cualquiera de las SEC ID n° 60 a 69, o una secuencia de nucleótidos con una identidad de secuencia de por lo menos 70% respecto a la secuencia de aminoácidos indicada en cualquiera de las SEC ID n° 60 a 69.

Preferentemente, las moléculas de ácidos nucleicos, anteriormente, es por lo menos 75, 80, 85, 90, 95, 96, 97, 98, 99 o 100% idéntica a la secuencia con la que se compara.

La identidad de secuencia de ácidos nucleicos puede determinarse mediante, p.ej., FASTA Search utilizando paquetes de GCG, con valores por defecto y un pamfactor variable, y penalización por creación de hueco fijada en 12,0 y penalización por extensión de hueco fijada en 4,0 con una ventana de 6 nucleótidos. Preferentemente, dicha comparación se lleva a cabo a lo largo de la longitud completa de la secuencia, aunque puede realizarse en una ventana de comparación más pequeña, p.ej., de menos de 600, 500, 400, 300, 200, 100 o 50 aminoácidos contiguos. Las moléculas de ácidos nucleicos de la invención pueden estar constituidas de ribonucleótidos y/o desoxirribonucleótidos, así como de residuos de nucleótidos sintéticos que son capaces de participan en interacciones de pares de bases de tipo Watson-Crick o análogas. Preferentemente, las moléculas de ácidos nucleicos son de ADN o ARN.

Las moléculas de ácidos nucleicos indicadas anteriormente pueden ligarse operativamente a una secuencia de control de la expresión, o a un vehículo o vector de clonación de ADN recombinante que contiene dicha molécula de ADN recombinante. Lo anterior permite la expresión intracelular de las proteínas para la utilización en los métodos y usos de la invención, p.ej., la expresión de los polipéptidos de la invención, como producto génico, la expresión de los cuales está dirigida por el gen o genes introducidos en las células de interés. La expresión génica se dirige a partir de un promotor activo en las células de interés y puede insertarse en cualquier forma de vector de ácido nucleico lineal o circular (p.ej., ADN) para la incorporación en el genoma o para la replicación independiente o la transfección/expresión transitoria. Las técnicas de transformación o transfección adecuadas están bien descritas en la literatura. Alternativamente, la molécula de ácido nucleico desnudo (p.ej., ADN) puede introducirse directamente en la célula para la producción de proteínas y polipéptidos de la invención, y para la utilización en la invención. Alternativamente, el ácido nucleico puede convertirse en ARNm mediante la transcripción in vitro y las proteínas relevantes pueden generarse mediante traducción in vitro.

Entre los vectores de expresión apropiados se incluyen secuencias de control apropiadas, tales como, por ejemplo, elementos de control traduccional (p.ej., codones de inicio y de parada, o sitios de unión ribosómica) y de control transcripcional (p.ej., regiones de promotor-operador y secuencias de parada de terminación) unidas en un marco de lectura correspondiente con las moléculas de ácidos nucleicos de la invención. Entre los vectores apropiados pueden incluirse plásmidos y virus (incluyendo tanto bacteriófagos como virus eucarióticos). Entre los vectores víricos adecuados se incluyen baculovirus y también adenovirus, virus adenoasociados, virus herpes y virus Vaccinia/poxvirus. Se describen en la técnica muchos otros vectores víricos. Entre los vectores preferentes se incluyen los vectores de expresión bacterianos y de mamífero pGEX-KG, pEF-neo y pEF-HA.

Tal como se ha señalado anteriormente, el polipéptido de la invención puede comprender secuencias adicionales (p.ej., etiquetas peptídicas/proteicas para facilitar la purificación del polipéptido) y, de esta manera, las moléculas de ácidos nucleicos pueden convenientemente fusionarse con ADN codificante de un péptido o polipéptido adicional, p.ej., una etiqueta de His o la proteína de unión a maltosa, para producir una proteína de fusión al expresarse.

De esta manera, en la presente memoria se da a conocer un vector, preferentemente un vector de expresión, que comprende unas moléculas de ácidos nucleicos tal como se ha definido anteriormente.

En la presente memoria se dan a conocer además métodos para preparar moléculas de ácidos nucleicos recombinantes según la invención, que comprenden insertar moléculas de ácidos nucleicos de la invención codificantes de los conectores peptídicos y/o polipéptidos de la invención en un vector de ácidos nucleicos.

Las moléculas de ácidos nucleicos de la invención, preferentemente contenidas en un vector, pueden introducirse en una célula por medios apropiados. Las técnicas de transformación o transfección adecuadas están bien descritas en la literatura. Se conoce una diversidad de técnicas y pueden utilizarse para introducir dichos vectores en células procarióticas o eucarióticas para la expresión. Entre las células huésped preferentes para este fin se incluyen las líneas de células de insecto, levaduras, líneas de células de mamífero o E. coli, tal como la cepa BL21/DE3. En la presente memoria se dan a conocer células huésped procarióticas o eucarióticas transformadas o transfectadas que contienen una molécula de ácidos nucleicos, particularmente un vector tal como se ha definido anteriormente.

De esta manera, en la presente memoria se da a conocer además una célula huésped recombinante que contiene una molécula de ácidos nucleicos y/o un vector tal como se ha indicado anteriormente.

El término "recombinante" se refiere a que la molécula de ácidos nucleicos y/o el vector ha sido introducido en la célula huésped. La célula huésped puede contener o no naturalmente una copia endógena de la molécula de ácidos nucleicos, aunque es recombinante en el aspecto de que se ha introducido una copia exógeno o endógeno adicional de la molécula de ácidos nucleicos y/o el vector.

En la presente memoria se da a conocer además un método para preparar un péptido y/o polipéptido de la invención tal como se ha definido anteriormente en la presente memoria, que comprende cultivar una célula huésped que contiene una molécula de ácidos nucleicos tal como se ha definido anteriormente, bajo condiciones en las que se expresa dicha molécula de ácidos nucleicos codificante de dicho conector peptídico y/o polipéptido y la recuperación de dicha molécula (conector peptídico y/o polipéptido) producida de esta manera.

En algunas realizaciones, los conectores peptídicos y/o polipéptidos de la invención, o para la utilización en el método y usos de la invención, pueden generarse sintéticamente, p.ej., mediante ligación de aminoácidos o péptidos generados sintéticamente de menor tamaño, o más convenientemente, mediante expresión recombinante de una molécula de ácidos nucleicos codificante de dicho polipéptido tal como se ha indicado anteriormente en la presente memoria.

Las moléculas de ácidos nucleicos de la invención pueden generarse sintéticamente mediante cualesquiera medios adecuados conocidos de la técnica.

De esta manera, el conector peptídico y/o polipéptido de la invención puede ser un conector peptídico o polipéptido aislado, purificado, recombinante o sintetizado. Tal como se ha señalado anteriormente, el término "polipéptido" se utiliza en la presente memoria intercambiablemente con el término "proteína". Tal como se ha señalado anteriormente, el término polipéptido o proteína típicamente incluye cualquier secuencia de aminoácidos que comprende por lo menos 40 residuos aminoácidos consecutivos, p.ej. por lo menos 50, 60, 70, 80, 90, 100, 150 aminoácidos, tal como 40 a 1000, 50 a 900, 60 a 800, 70 a 700, 80 a 600, 90 a 500 o 100 a 400 aminoácidos.

De manera similar, las moléculas de ácidos nucleicos de la invención pueden ser una molécula de ácidos nucleicos aislada, purificada, recombinante o sintetizada.

De esta manera, considerado alternativamente, los conectores peptídicos, polipéptidos y moléculas de ácidos nucleicos de la invención son no nativas, es decir, moléculas no naturales.

En la presente memoria se utiliza la nomenclatura estándar de los aminoácidos. De esta manera, el nombre completo de un residuo aminoácido puede utilizarse intercambiablemente con abreviaturas de código de una letra o de tres letras. Por ejemplo, la lisina puede sustituirse por K o Lys; la isoleucina puede sustituirse por I o Ile, etc. Además, los términos aspartato y ácido aspártico, y glutamato y ácido glutámico, se utilizan intercambiablemente en la presente memoria y pueden sustituirse por asp o D, o glu o E, respectivamente.

Aunque se contempla que los conectores peptídicos y polipéptidos de la invención, y para la utilización en la invención, puedan producirse recombinantemente y ésta es una realización preferente de la invención, resultará evidente que los conectores peptídicos de la invención pueden conjugarse con proteínas para la unión en una proteína de fusión por otros medios. En otras palabras, el conector peptídico y proteína pueden producirse por separado mediante cualesquiera medios adecuados, p.ej., recombinantemente, y seguidamente conjugarse (unirse) para formar un conjugado de conector peptídico-proteína que pueda utilizarse en los métodos de la invención. Por ejemplo, los conectores peptídicos de la invención pueden producirse sintética o recombinantemente, tal como se ha indicado anteriormente, y conjugarse con una proteína (para la unión en una proteína de fusión según el método de la invención) mediante un conector o espaciador no peptídico, p.ej., un conector o espaciador químico.

De esta manera, en algunas realizaciones, el conector peptídico y proteína que deben incorporarse en una fusión pueden unirse entre sí directamente mediante un enlace o indirectamente mediante un grupo de enlace. En el caso de que se utilicen grupos de enlace, dichos grupos pueden seleccionarse para proporcionar unión covalente del conector peptídico y componente proteína mediante el grupo de enlace. Los grupos de enlace de interés pueden variar ampliamente dependiendo de la naturaleza del componente proteína. El grupo de enlace, en caso de hallarse presente, es en muchas realizaciones biológicamente inerte.

El experto en la materia conoce una diversidad de grupos de enlace y encontrará utilidad en la invención. En realizaciones representativas, el grupo de enlace es generalmente de por lo menos aproximadamente 50 daltons, habitualmente de por lo menos aproximadamente 100 daltons y puede ser de hasta 1000 daltons o mayor, por ejemplo de hasta 1000000 daltons en el caso de que el grupo de enlace contenga un espaciador, aunque generalmente no excederá de aproximadamente 500 daltons y habitualmente no excederá de aproximadamente 300 daltons. Generalmente, dichos conectores comprenderán un grupo espaciador terminado en cualquiera de los extremos con una funcionalidad reactiva capaz de unirse covalentemente al conector peptídico y componente proteína. Entre los grupos espaciadores de interés pueden incluirse cadenas de hidrocarburo alifático e insaturado, espaciadores que contienen heteroátomos, tales como oxígeno (éteres, tales como polietilenglicol) o nitrógeno (poliaminas), péptidos, carbohidratos, sistemas cíclicos o acíclicos que pueden contener posiblemente heteroátomos. Los grupos espaciadores pueden comprender además ligandos que se unen a metales, de manera que la presenta de un ion metálico coordina dos o más ligandos para formar un complejo. Entre los elementos espaciadores específicos se incluyen: 1,4-diaminohexano, xililén-diamina, ácido tereftálico, ácido 3,6-dioxaoctanedioico, ácido etilén-diamín-N,N-diacético, ácido 1,1'-etilén-bis(5-oxo-3-pirrolidín-carboxílico), 4,4'-etilén-dipiperidina. Entre las funcionalidades reactivas potenciales se incluyen grupos funcionales nucleofílicos (aminas, alcoholes, tioles e hidrazidas), grupos funcionales electrofílicos (aldehídos, ésteres, vinilcetonas, epóxidos, isocianatos y maleimidas), grupos funcionales capaces de reacciones de cicloadición, que forman enlaces disulfuro o de unión a metales. Entre los ejemplos específicos se incluyen aminas primarias y secundarias, ácidos hidroxámicos, ésteres de N-hidroxisuccinimidilo, carbonatos de N-hidroxisuccinimidilo, oxicarbonilimidazoles, nitrofenilésteres, ésteres de trifluoroetilo, éteres de glicidilo, vinilsulfonas y maleimidas. Entre los grupos conectores específicos que pueden encontrar utilidad en los conectores peptídicos de la invención se incluyen compuestos heterofuncionales, tales como azidobenzoil hidrazida, N-[4-(p-azidosalicilamino)butil]-3'-[2'-piridilditio]propionamida), suberato de bis-sulfosuccinimidilo, dimetiladipimidato, disuccinimidiltartrato, éster de N-maleimidobutiriloxisuccinimida, N-hidroxi sulfosuccinimidil-4-azidobenzoato, N-succinimidil[4-azidofenil]-1,3'-ditiopropionato, N-succinimidil[4-yodoacetil]aminobenzoato, glutaraldehído y succinimidil-4-[N-maleimidometil]ciclohexano-1-carboxilato, éster de N-hidroxisuccinimida de ácido 3-(2-piridilditio)propiónico (SPDP), éster de N-hidroxisuccinimida de ácido 4-(N-maleimidometil)-ciclohexán-1-carboxílico (SMCC) y similares.

En algunas realizaciones, puede resultar útil modificar uno o más residuos en el conector peptídico y/o proteína para facilitar la conjugación de dichas moléculas y/o para mejorar la estabilidad del conector peptídico y/o proteína. De esta manera, en algunas realizaciones, el conector peptídico, polipéptido o proteína de la invención, o para la utilización en la invención, puede comprender aminoácidos no naturales o no estándares.

En algunas realizaciones, el conector peptídico, polipéptido o proteína de la invención, o para la utilización en la invención, puede comprender uno o más, p.ej., por lo menos 1, 2, 3, 4 o 5 aminoácidos no convencionales, tal como 10, 15 o 20 o más aminoácidos no convencionales, es decir, aminoácidos que poseen una cadena lateral que no está codificada por el código genético estándar, denominados en la presente memoria "aminoácidos no codificados" (ver, p.ej., la Tabla 1). Estos pueden seleccionarse de los aminoácidos que se forman mediante procesos metabólicos, tales como la ornitina o la taurina, y/o aminoácidos modificados artificialmente, tales como 9H-fluorén-9-ilmetoxicarbonilo (Fmoc), (terc)-(B)util(o)xi(c)arbonil (Boc), aminoácidos protegidos con 2,2,5,7,8-pentametilcromán-6-sulfonilo (Pmc), o aminoácidos que presentan el grupo benciloxi-carbonilo (Z).

Son ejemplos de aminoácidos no estándares o análogos estructurales que pueden utilizarse en los conectores peptídicos o polipéptidos de la invención, y para la utilización en la invención, los D-aminoácidos, isoesteres de amida (tales como N-metilamida, amida retroinversa, tioamida, tioéster, fosfonato, cetometileno, hidroximetileno, fluorovinilo, (E)-vinilo, metilenamino, metilentilo o alcano), ácidos L-N-metilamino, ácidos D-a-metilamino y ácidos D-N-metilamino. Se listan en la Tabla 1 ejemplos de aminoácidos no convencionales, es decir, no codificados.

TABLA 1

TABLA 1 (continuación)

(continuación)

En algunas realizaciones, el método de la presente invención puede llevarse a cabo heterogéneamente (tal como se ha indicado anteriormente), utilizando una fase sólida, por ejemplo, en la que la proteína de fusión en crecimiento, preferentemente la primera o segunda proteína en la cadena de la proteína de fusión, puede inmovilizarse sobre una fase sólida, permitiendo la utilización de etapas de lavado. De esta manera, en algunas realizaciones, el método es un método en fase sólida (es decir, un método heterogéneo). Considerado alternativamente, el método se lleva a cabo sobre una fase sólida o sustrato sólido. La utilización de ensayos en fase sólida ofrece ventajas. Por ejemplo, las etapas de lavado pueden ayudar en la eliminación del exceso de proteínas no reaccionadas y/o componentes que podrían interferir con las posteriores rondas de reacción (es decir, la adición de proteínas adicionales a la proteína de fusión), p.ej., péptido ligasas, componentes que participan en el desbloqueo (desenjaulado, desenmascarado o desprotección) de conectores peptídicos, etc.

La inmovilización de la proteína de fusión sobre una fase sólida puede llevarse a cabo de diversas maneras. La proteína de fusión puede inmovilizarse, es decir, unirse al soporte, de cualquier manera, conveniente. En algunas realizaciones, la primera o segunda proteína de la proteína de fusión se inmoviliza sobre un soporte sólido. De esta manera, en algunas realizaciones, el método puede comprender una etapa de inmovilización de la primera proteína sobre un soporte sólido. En algunas realizaciones, el método puede comprender una etapa de inmovilización de la proteína unida, que comprende la primera y segunda proteína, sobre un soporte sólido.

De esta manera, la manera o medios de inmovilización y el soporte sólido pueden seleccionarse, según se seleccione, de entre cualquier número de medios de inmovilización y soportes sólidos ampliamente conocidos de la técnica y descritos en la literatura. De esta manera, la proteína de fusión puede unirse directamente al soporte, por ejemplo mediante un dominio o fracción de por lo menos una proteína en la proteína de fusión (p.ej., entrecruzarse químicamente). En algunas realizaciones, la proteína de fusión puede unirse directamente mediante un grupo conector, o mediante uno o más grupos de unión intermediarios (p.ej., mediante una interacción de biotinaestreptavidina). De esta manera, la proteína de fusión puede unirse covalente o no covalentemente al soporte sólido. El enlace puede ser un enlace reversible (p.ej., escindible) o irreversible. De esta manera, en algunas realizaciones, el enlace puede cortarse enzimáticamente, químicamente o con luz, p.ej., el enlace puede ser un enlace fotosensible.

De esta manera, en algunas realizaciones, puede proporcionarse una proteína para la inclusión en la proteína de fusión con medios de inmovilización (p.ej., una pareja de unión por afinidad, p.ej., biotina o un hapteno, capaz de unión a su pareja de unión, es decir, una pareja de unión afín, p.ej., estreptavidina o un anticuerpo) proporcionado sobre el soporte. En algunas realizaciones, la proteína que debe inmovilizarse sobre el soporte puede ser una proteína de unión, p.ej., proteína de unión a maltosa, un anticuerpo, etc. La interacción entre la proteína de fusión y el soporte sólido debe ser suficientemente robusta para permitir etapas de lavado, es decir, la interacción entre la proteína de fusión y el soporte sólido no resulta perturbada (significativamente perturbada) por las etapas de lavado. Por ejemplo, resulta preferente que en cada etapa de lavado se elimine o eluya menos de 5%, preferentemente menos de 4, 3, 2, 1, 0,5 o 0,1% de la proteína de fusión respecto de la fase sólida. A este respecto, el inventor ha desarrollado una proteína de unión a maltosa modificada que presenta una afinidad de unión mejorada para la maltosa y, por lo tanto, que encuentra particular utilidad en los métodos de la invención.

De esta manera, en la presente memoria se da a conocer una proteína de unión a maltosa que comprende una secuencia de aminoácidos tal como se indica en la SEC ID n° 70 o una secuencia con una identidad de por lo menos 70% respecto a una secuencia de aminoácidos tal como se indica en la SEC ID n° 70.

En algunas realizaciones, la proteína de unión a maltosa anteriormente indicada es por lo menos 75, 80, 85, 90, 95, 96, 97, 98, 99 o 100% idéntica a la secuencia con la que se compara.

Preferentemente, una proteína de unión a maltosa con una identidad de por lo menos 70% respecto a una secuencia de aminoácidos tal como se indica en la SEC ID n° 70 es funcionalmente equivalente a una proteína que consiste en la secuencia de aminoácidos indicada en la SEC ID n° 70, es decir, es capaz de unirse a la maltosa con la misma afinidad, o con mayor afinidad, que una proteína que consiste en la secuencia de aminoácidos indicada en la SEC ID n° 70. Por ejemplo, la proteína de unión a maltosa de la invención presenta una afinidad de unión para la maltosa inferior a 0,2 j M, p.ej., de 0,1, 0,08, 0,05, 0,03 o 0,01 j M o inferior. En realizaciones preferentes, la proteína de unión a maltosa con una identidad de por lo menos 70% respecto a la secuencia de aminoácidos tal como se indica en la SEC ID n° 70 comprende una valina en las posiciones 312 y 317.

En la presente memoria se da a conocer una molécula de ácidos nucleicos codificante de la proteína de unión a maltosa definida anteriormente. En algunas realizaciones, la molécula de ácidos nucleicos comprende la secuencia de nucleótidos indicada en la SEC ID n° 71 o una secuencia con una identidad de secuencia de por lo menos 70% respecto a una secuencia de nucleótidos indicada en la SEC ID n° 71.

La proteína de unión a maltosa puede comprender (p.ej., se conjuga con) un conector peptídico tal como se define en la presente memoria. La proteína de unión a maltosa puede comprender más de una (p.ej., 2 o 3) secuencia de aminoácidos tal como se han definido anteriormente, es decir, comprende una secuencia repetida.

La proteína de fusión, p.ej., la primera proteína que debe incorporarse en la proteína de fusión, puede inmovilizarse antes o después de ponerla en contacto con una proteína adicional (p.ej., una segunda proteína) para la incorporación en la proteína de fusión. Además, dicha proteína de fusión "inmovilizable" puede ponerse en contacto con la proteína adicional junto con el soporte.

El soporte sólido puede ser cualquiera de entre los bien conocidos soportes o matrices que se utilizan o proponen ampliamente en la actualidad para la inmovilización, separación, etc. Estos pueden adoptar la forma de partículas (p.ej., perlas que pueden ser magnéticas, paramagnéticas o no magnéticas), hojas, geles, filtros, membranas, fibras, capilares, portaobjetos, matrices o tiras de microtitulación, tubos, placas o pocillos, etc.

El soporte puede estar realizado en vidrio, sílice, látex o un material polimérico. Resultan adecuados los materiales que presentan una elevada superficie para la unión de la proteína de fusión. Dichos soportes pueden presentar una superficie irregular y pueden ser, por ejemplo, porosos o particulados, p.ej., partículas, fibras, mallas, aglomerados o tamices. Los materiales particulados, p.ej., perlas, resultan útiles debido a su mayor capacidad de unión, particularmente perlas poliméricas.

Convenientemente un soporte sólido particular utilizado según la invención comprenderá perlas esféricas. El tamaño de las perlas no resulta crítico, aunque pueden ser, por ejemplo, del orden de diámetro de por lo menos 1, y preferentemente de por lo menos 2 jm , y presentan un diámetro máximo preferentemente no superior a 10, y, p.ej., no superior a 6 jm .

Las partículas monodispersas, es decir, las que presentan un tamaño sustancialmente uniforme (p.ej., un tamaño con una desviación estándar del diámetro inferior a 5%) presentan la ventaja de que proporcionan una reproducibilidad de reacción muy uniforme. Las partículas de polímero monodispersas representativas pueden producirse mediante la técnica descrita en el documento n° US-A-4336173.

Sin embargo, para ayudar a la manipulación y separación, las perlas magnéticas resultan ventajosas. El término "magnético" tal como se utiliza en la presente memoria se refiere a que el soporte es capaz de presentar un momento magnético proporcionado al mismo al introducirlo en un campo magnético y, de esta manera, es desplazable bajo la acción de ese campo. En otras palabras, un soporte que comprende partículas magnéticas puede eliminarse fácilmente mediante agregación magnética, que proporciona un modo rápido, simple y eficiente de separar las partículas después de las etapas de formación del enlace isopeptídico.

En algunas realizaciones, el soporte sólido es una resina de amilosa.

Tras la formación de un enlace isopeptídico entre la penúltima proteína y las proteínas finales en la proteína de fusión, puede resultar deseable eliminar o eluir la proteína respecto del soporte sólido. De esta manera, en algunas realizaciones, el método comprende una etapa de elución o separación de la proteína de fusión respecto del soporte sólido.

Tal como se ha indicado anteriormente, en determinados protocolos, los métodos de la invención pueden permitir la producción simultánea de dos o más proteínas de fusión sobre el mismo soporte sólido, p.ej., una matriz. De esta manera, en algunas realizaciones, el método de la invención puede considerarse un formato multiplex y/o de alto rendimiento.

En una realización adicional, la invención proporciona una proteína de fusión obtenida u obtenible con el método de la invención. En algunas realizaciones, la proteína de fusión se inmoviliza sobre un soporte sólido. De esta manera, en la presente memoria se da a conocer además un sustrato sólido que comprende por lo menos una proteína de fusión, obtenida u obtenible con el método de la invención. El sustrato sólido puede encontrarse en forma de una matriz (es decir, una matriz de proteínas, particularmente una matriz de proteínas de fusión) que comprende dos o más proteínas de fusión (proteínas de fusión de diferente secuencia) obtenidas u obtenibles con el método de la invención. La matriz puede comprender por lo menos 10, 20, 50, 100, 200, 300, 400, 500, 1000, 1500, 2000, 5000 o 10000 proteínas de fusión, es decir, diferentes proteínas de fusión (con diferentes estructuras o secuencias).

Dos o más proteínas de fusión obtenidas u obtenibles con el método de la invención pueden mezclarse entre sí para formar una biblioteca de proteínas de fusión. De esta manera, en la presente memoria se da a conocer una biblioteca de proteínas de fusión que comprende por lo menos dos proteínas de fusión, obtenidas u obtenibles con el método de la invención. La biblioteca puede comprender por lo menos 10, 20, 50, 100, 200, 300, 400, 500, 1000, 1500, 2000, 5000 o 10000 proteínas de fusión, es decir, diferentes proteínas de fusión (con diferentes estructuras o secuencias). La biblioteca puede comprender proteínas de fusión inmovilizadas sobre un sustrato sólido, p.ej., perla o partícula. Por ejemplo, cada sustrato sólido, p.ej., perla o partícula, puede comprender una proteína de fusión diferente.

Aunque el método de la invención se ha ejemplificado utilizando una realización heterogénea, resultará fácilmente evidente a partir de la exposición en la presente memoria que el método puede utilizarse homogéneamente (es decir, en solución). Sin embargo, con el fin de evitar la producción de mezclas de proteínas de fusión, puede resultar necesario, en algunas realizaciones, separar la proteína de fusión respecto de otros componentes en la reacción después de cada ronda de extensión. La separación o purificación puede llevarse a cabo mediante cualesquiera medios adecuados. Por ejemplo, una de las proteínas en la cadena de la proteína de fusión puede comprender una etiqueta de purificación o puede ser una proteína de unión (p.ej., la proteína de unión a maltosa) que facilite la separación de la proteína de fusión respecto de otros componentes en la reacción, p.ej., la cromatografía de afinidad. Adicional o alternativamente, pueden utilizarse otros métodos de purificación/separación, p.ej., la cromatografía de intercambio iónico, la cromatografía de exclusión por tamaño, la ultracentrifugación, la filtración mediante centrifugación, la diálisis, la diafiltración, etc.

De esta manera, en algunas realizaciones, el método de la invención puede comprender una etapa de separación o purificación de la proteína de fusión después de una etapa de formación de enlace isopeptídico.

En la presente memoria se da a conocer además un kit, particularmente un kit para la utilización en los métodos y usos de la invención, es decir, en la producción o síntesis de una proteína de fusión, en el que dicho kit comprende: (a) un polipéptido recombinante o sintético que comprende un conector peptídico tal como se ha definido anteriormente, y

(b) un polipéptido recombinante o sintético que comprende un conector peptídico tal como se define que es capaz de formar un enlace isopeptídico con el conector peptídico en el polipéptido de (a), y/o

(c) una molécula de ácidos nucleicos, particularmente un vector, codificante de un conector peptídico tal como se ha definido anteriormente, y/o

(d) una molécula de ácidos nucleicos, particularmente un vector, codificante de un conector peptídico que es capaz de formar un enlace isopeptídico con el conector peptídico codificado por la molécula de ácidos nucleicos de (b), opcionalmente en el que el polipéptido recombinante o sintético de (a) y/o (b) comprende un conector peptídico adicional que es parte de un par de conectores peptídicos que son ortogonales a los conectores peptídicos en los polipéptidos de (a) y (b).

Los métodos y usos de la invención pueden definirse como métodos y usos in vitro, es decir, el método in vitro para la síntesis de una proteína de fusión.

Resultará evidente que el método de la invención no se encuentra limitado a la unión de cualesquiera proteínas específicas entre sí para formar una proteína de fusión. De esta manera, el método puede utilizar cualquier proteína o polipéptido tal como se define en la presente memoria, es decir, cualquier proteína o polipéptido deseado. En otras palabras, la invención puede utilizar cualquier proteína o polipéptido que se desee para la inclusión o incorporación en una proteína de fusión. Además, el polipéptido recombinante o sintético de la invención puede comprender cualquier proteína unida a un conector peptídico de la invención. Las proteínas pueden derivarse u obtenerse de cualquier fuente adecuada. Por ejemplo, las proteínas pueden traducirse in vitro o purificarse a partir de muestras biológicas y clínicas, p.ej., cualquier muestra de células o tejidos de un organismo (eucariótico o procariótico) o cualquier líquido corporal o preparación derivada a partir del mismo, así como muestras, tales como cultivos celulares, preparaciones celulares, lisados celulares, etc. Las proteínas pueden derivarse u obtenerse, p.ej., purificarse, a partir de muestras ambientales, p.ej., las muestras de suelo y agua o muestras de alimentos también se encuentran incluidas. Las muestras pueden prepararse inmediatamente o pueden tratarse previamente de cualquier manera conveniente, p.ej., para el almacenamiento.

Tal como se ha señalado anteriormente, en una realización preferente, las proteínas que deben incorporarse en la proteína de fusión pueden producirse recombinantemente y, de esta manera, las moléculas de ácidos nucleicos codificantes de dichas proteínas pueden derivarse u obtenerse de cualquier fuente adecuada, p.ej., cualquier material vírico o celular, incluyendo todas las células procarióticas o eucarióticas, virus, bacteriófagos, micoplasmas, protoplastos y orgánulos. De esta manera, dicho material biológico puede comprender todos los tipos de células animales de mamífero y de no mamífero, células vegetales, algas, incluyendo algas verdiazuladas, hongos, bacterias, protozoos, etc. En algunas realizaciones, las proteínas que deben unirse entre sí en la proteína de fusión pueden ser proteínas sintéticas.

Como ejemplo representativo, las proteínas que deben unirse en una proteína de fusión según la invención pueden ser enzimas, proteínas estructurales, anticuerpos, antígenos, priones, receptores, ligandos, citoquinas, quimoquinas, hormonas, etc., o cualquier combinación de los mismos.

En algunas realizaciones, el polipéptido recombinante o sintético de la invención y para la utilización en los métodos no es una proteína isopeptídica o una proteína isopeptídica diferente a la proteína isopeptídica a partir de la que se deriva el conector peptídico.

En algunas realizaciones, la proteína de fusión comprende una estructura repetida, p.ej., puede unirse a misma proteína. Considerado alternativamente, la proteína de fusión puede contener dos o más unidades proteicas de la misma secuencia. En el caso de que la proteína de fusión contenga dos o más unidades proteicas de la misma secuencia, dichas unidades proteicas pueden ser consecutivas, p.ej., separadas únicamente por los conectores peptídicos que unen las unidades proteicas entre sí, o pueden ser no consecutivos o no secuenciales (p.ej., separadas por una o más proteínas con una secuencia diferente). En algunas realizaciones preferentes, la proteína de fusión comprende por lo menos dos proteínas con diferente secuencia, p.ej., por lo menos 2, 3, 4, 5 o 6 proteínas de diferente secuencia. Las proteínas de diferente secuencia pueden disponerse en cualquier orden adecuado, según el propósito de la proteína de fusión.

En realizaciones todavía adicionales, la proteína puede consistir en dos o más conectores peptídicos tal como se definen en la presente memoria y opcionalmente uno o más espaciadores, p.ej., espaciadores peptídicos, que unen dichos conectores peptídicos. A este respecto, la proteína puede considerarse una proteína no funcional o una proteína/péptido conector, tal como se ha indicado anteriormente. En dichas realizaciones, las otras proteínas en la proteína de fusión son diferentes proteínas o proteínas funcionales, es decir, comprenden secuencias diferentes de los conectores peptídicos y espaciadores. De esta manera, en algunas realizaciones, la proteína de fusión comprende una o más proteínas que comprenden una secuencia de aminoácidos indicada en cualquiera de las SEC ID n° 56 a 59, o con una identidad de secuencia de por lo menos 70% respecto a la secuencia de aminoácidos indicada en cualquiera de las SEC ID n° 56 a 59, en donde dicha proteína comprende por lo menos dos conectores peptídicos tal como se ha definido anteriormente. Por ejemplo, puede utilizarse una proteína no funcional como la segunda proteína en una proteína de fusión, es decir, que une la primera y tercera proteína, o la cuarta proteína en una proteína de fusión, es decir, que une la tercera y quinta proteína, etc. En dicho ejemplo representativo, la segunda y cuarta proteína pueden ser la misma proteína o ser proteínas diferentes. De esta manera, en algunas realizaciones, las unidades proteicas en la proteína de fusión pueden comprender una proteína conectora alternadamente, p.ej., proteína funcional-proteína conectora-proteína funcional, o proteína conectora-proteína funcional-proteína conectora, etc.

En algunas realizaciones, la proteína anteriormente indicada es por lo menos 75, 80, 85, 90, 95, 96, 97, 98, 99 o 100% idéntica a la secuencia con la que se compara.

Una "proteína de fusión" puede definirse como un polímero que comprende por lo menos dos unidades proteicas, p.ej., 2, 3, 4, 5, 6, 7, 8, 9 o 10 o más unidades proteicas, tal como 15, 20, 25 o 50 unidades proteicas, unidas entre sí mediante un enlace covalente, preferentemente un enlace isopeptídico tal como se define en la presente memoria. Una unidad proteica puede definirse como una molécula que comprende por lo menos 40 aminoácidos consecutivos, preferentemente en la que la proteína presenta una función in vivo, p.ej., en la que la proteína es capaz de interactuar específicamente con uno o más componentes biológicos, p.ej., en la que la proteína es activa in vivo. De esta manera, una "proteína de fusión" puede considerarse una megaestructura, macromolécula, megamolécula o poliproteína que comprende por lo menos dos unidades proteicas, p.ej., 2, 3, 4, 5, 6, 7, 8, 9 o 10 o más unidades proteicas, tal como 15, 20, 25 o 50 unidades proteicas, unidas entre sí mediante un enlace covalente, preferentemente un enlace isopeptídico tal como se define en la presente memoria.

Los términos "enlace", "unido" o "unión" en el contexto de la presente invención con respecto a dos o más proteínas en una proteína de fusión se refieren a unir o conjugar dichas proteínas mediante un enlace covalente, particularmente un enlace isopeptídico que se forma entre los conectores peptídicos que se incorporan en dichas proteínas (p.ej., conectores peptídicos que forman dominios de dichas proteínas).

Aunque la invención se ha descrito anteriormente en términos de pares de conectores que reaccionan entre sí formando un enlace isopeptídico, cada par (afín) de conectores alternativamente puede considerarse un único conector peptídico que está formado de dos partes separadas o separables (etiquetas, etiquetas y parejas de unión) que reaccionan formando un enlace isopeptídico (para unir/conjugar dichas proteínas). De esta manera, considerado desde esta perspectiva, la invención puede considerarse que es la utilización de dos conectores peptídicos ortogonales para la producción de una proteína de fusión, en la que cada conector peptídico comprende o consiste en dos partes separables que reaccionan formando un enlace isopeptídico y en el que cada parte del conector se incorpora (forma un dominio con) las proteínas que deben unirse (conjugarse) entre sí.

Resultará evidente que los métodos y usos indicados en la presente memoria y las proteínas de fusión obtenidas u obtenibles con los métodos indicados en la presente memoria presentan un amplio abanico de utilidades. Consideradas alternativamente, las proteínas de fusión producidas mediante los métodos indicados en la presente memoria pueden utilizarse en una diversidad de industrias. Por ejemplo, los métodos de la invención pueden resultar útiles para producir proteínas de fusión para la vacunación. A este respecto, los métodos pueden resultar útiles para unir antígenos proteicos en cadenas, para la inyección directa o utilizarse para decorar partículas de tipo vírico (VLP, por sus siglas en inglés), ya que la multimerización de antígenos proporciona respuestas inmunitarias muy potenciadas.

Los métodos de la invención pueden resultar útiles para producir proteínas de fusión con propiedades enzimáticas potenciadas, p.ej., canalización de sustratos. A este respecto, los enzimas con frecuencia se reúnen funcionando en rutas dentro de las células y tradicionalmente ha resultado difícil conectar múltiples enzimas entre sí fuera de las células (in vitro). De esta manera, el método de la invención podría utilizarse para potenciar la actividad de rutas enzimáticas multietapa, que podría resultar útil en un abanico de conversiones industriales y para el diagnóstico.

Las proteínas de fusión de la invención también pueden presentar propiedades mejoradas con respecto a su estabilidad, es decir, la estabilidad de las unidades proteicas en la proteína de fusión puede potenciarse respecto a su estabilidad como proteínas independientes. En particular, las proteínas de fusión pueden mejorar la termoestabilidad de las unidades proteicas. A este respecto, los enzimas son herramientas valiosas en muchos procedimientos, aunque son inestables y resultan difíciles de recuperar. Los polímeros enzimáticos presentan mayor estabilidad frene a la temperatura, pH y solventes orgánicos y existe un deseo incrementado de utilizar polímeros enzimáticos en procedimientos industriales. Sin embargo, antes de la presente invención, la generación de polímeros enzimáticos utilizaba comúnmente una reacción no específica de glutaraldehído y ello dañaba o desnaturalizaba (es decir, reducía la actividad) de muchos enzimas potencialmente útiles. El enlace específico de sitio de las proteínas en cadenas (polímeros) mediante enlaces isopeptídicos según la presente invención se espera que potencie la resiliencia enzimática, tal como en diagnósticos o en enzimas añadidos a piensos animales. En realizaciones particularmente preferentes, los enzimas pueden estabilizarse mediante circularización, tal como se ha comentado anteriormente.

Los métodos de la invención también encontrarán utilidad en la producción de anticuerpos poliméricos. A este respecto, los anticuerpos son una de las clases más importantes de farmacéuticos y se utilizan con frecuencia unidos a superficies. Sin embargo, la mezcla de antígenos en una muestra, y por lo tanto la captura de dicho antígeno en dicha muestra, resulta insuficiente en proximidad a superficies. Mediante extensión de las cadenas de anticuerpos, se prevé que mejorará la eficiencia de la captura. Lo anterior resultará especialmente valioso en el aislamiento de células tumorales circulantes, que actualmente es una de las maneras más prometedoras para permitir el diagnóstico precoz del cáncer. Además, los anticuerpos de diferentes especificidades pueden combinarse en cualquier orden deseado.

En una realización todavía adicional, los métodos de la invención pueden encontrar utilidad en la producción de fármacos para la activación de la señalización celular. A este respecto, muchas de las maneras más eficaces para activar la función celular son mediante ligandos de proteínas. Sin embargo, en la naturaleza un ligando de proteínas habitualmente no funcionará solo, sino con una combinación específica de otras moléculas de señalización. De esta manera, el método de la invención permite la generación de proteínas de fusión adaptadas (es decir, equipos de proteínas), que podría proporcionar una activación óptima de la señalización celular. Dichas proteínas de fusión (equipos de proteínas) podrían aplicarse en el control de la supervivencia, división o diferenciación celular.

En realizaciones todavía adicionales, los conectores peptídicos de la invención, particularmente pares de conectores de la invención, pueden encontrar utilidad en la generación de hidrogeles para el crecimiento de células madre, la preparación de biomateriales, la funcionalización de anticuerpos con pigmentos o enzimas y la estabilización de enzimas mediante ciclización.

A continuación, se describe la invención en mayor detalle, en el Ejemplo no limitativo siguiente, en referencia a los dibujos a continuación.

La figura 1 muestra un esquema de un ejemplo representativo de síntesis en fase sólida de una proteína de fusión mediante la utilización de dos pares ortogonales de conectores peptídicos: SnoopTag/Snoop Catcher y SpyTag/SpyCatcher.

La figura 2 muestra un esquema de la formación de enlaces isopeptídicos en la proteína RrgA a partir de la que se deriva el par de conectores peptídicos SnoopTag y SnoopCatcher (numeración según la Protein Data Bank, ID 2WW8). La figura 3 muestra una fotografía de un gel de SDS-PAGE con tinción de Coomassie que caracteriza la reacción de SnoopTag-MBP con SnoopCatcher junto a controles con mutación de alaninas de la Lys reactiva de SnoopTag (KA) o la Asn reactiva de SnoopCatcher (NA).

La figura 4 muestra (A) un gráfico que ilustra el curso temporal de la reacción de SnoopTag con una proporción 1:1 o 2:1 de SnoopCatcher a SnoopTag-MBP, (B) una fotografía de un gel de SDS-PAGE con tinción de Coomassie que caracteriza la reacción de SnoopTag-MBP con SnoopCatcher en una proporción 2:1 de SnoopCatcher a SnoopTag-MBP, (C) un gráfico que ilustra el curso temporal de la reacción de SnoopTag con una proporción 1:1, 2:1 o 4:1 de SnoopCatcher a SnoopTag-MBP, y (D) una fotografía de un gel de SDS-PAGE con tinción de Coomassie que caracteriza la reacción de SnoopTag-MBP con SnoopCatcher en una proporción 4:1 de SnoopCatcher a SnoopTag-MBP.

La figura 5 muestra (A) un gráfico de columnas que ilustra la dependencia del pH de la formación de enlace isopeptídico entre SnoopTag-MBP y SnoopCatcher, y (B) un gráfico que ilustra la dependencia de la temperatura de la formación de enlace isopeptídico entre SnoopTag-MBP y SnoopCatcher.

La figura ⁶muestra (A) un gráfico de columnas que ilustra la dependencia de la formación de enlace isopeptídico entre SnoopTag-MBP y SnoopCatcher respecto a sal, agente reductor y detergente, y (B) un gráfico que ilustra la dependencia de TMAO de la formación de enlace isopeptídica entre SnoopTag-MBP y SnoopCatcher.

La figura 7 muestra una fotografía de un gel de SDS-PAGE con tinción de Coomassie que caracteriza la reactividad ortogonal de SnoopTag/SnoopCatcher y SpyTag/SpyCatcher.

La figura ⁸muestra (A) una fotografía de un gel de s DS-PAGE con tinción de Coomassie que caracteriza la reactividad ortogonal de PsCsTag/PsCsCatcher, SnoopTag/SnoopCatcher y SpyTag/SpyCatcher, y (B) una fotografía de un gel de SDS-PAGE con tinción de Coomassie que caracteriza la reactividad ortogonal de RrgATag/RrgACatcher, SnoopTag/SnoopCatcher y SpyTag/SpyCatcher.

La figura 9 muestra (A) una fotografía de un gel de SDS-PAGE con tinción de Coomassie que analiza la síntesis de proteínas de fusión en fase sólida. Los carriles 1 a 3 muestran MBPx-SpyCatcher, SnoopTag-Affi-SpyTag y SpyCatcher-SnoopCatcher aisladamente. MBPx-SpyCatcher se unía a la resina de amilosa y se llevó a cabo la reacción en etapas con SnoopTag-Affibody-SpyTag y SpyCatcher-SnoopCatcher. Después de cada etapa, se eluyó una alícuota de muestra a partir de la resina con maltosa (carriles 4 a 13). Las muestras se analizaron sin ninguna purificación adicional, y (B) una fotografía de un gel de SDS-PAGE con tinción de Coomassie analizando la síntesis de la proteína de fusión en fase sólida. Los carriles 1 a 3 muestran biotina-SpyCatcher, SnoopTag-Affi-SpyTag y SpyCatcher-SnoopCatcher aisladamente. Biotina-SpyCatcher se unía a la estreptavidina-agarosa y se llevó a cabo la reacción en etapas con SnoopTag-Affibody-SpyTag y SpyCatcher-SnoopCatcher. Después de cada etapa, se eluyó una alícuota de muestra a partir de la agarosa con biotina (carriles 4 a 13). Las muestras se analizaron sin ninguna purificación adicional.

La figura 10 muestra (A) un gráfico que ilustra la ionización por electropulverización-espectrometría de masas para someter a ensayo la identidad de la proteína de fusión decamérica, biotina-SpyCatcher:(SnoopTag-Affi-SpyTag:SpyCatcher-SnoopCatcher)⁴:SnoopTag-Affi-SpyTag y (B) un gráfico que ilustra el análisis de cromatografía de exclusión por tamaños de la proteína de fusión decamérica, MBPx-SpyCatcher:(SnoopTag-Affi-SpyTag:SpyCatcher-SnoopCatcher)⁴:SnoopTag-Affi-SpyTag. El gráfico interior muestra los patrones de peso molecular.

La figura 11 muestra (A) una fotografía de un gel de SDS-PAGE con tinción de Coomassie que analiza la termoestabilidad de la proteína de fusión decamérica, MBPx-SpyCatcher:(SnoopTag-Affi-SpyTag:SpyCatcher-SnoopCatcher)⁴:SnoopTag-Affi-SpyTag, y (B) una fotografía de un gel de SDS-PAGE con tinción de Coomassie que analiza la estabilidad dependiente del tiempo de la proteína de fusión decamérica, biotin-SpyCatcher:(SnoopTag-Affi-SpyTag:SpyCatcher-SnoopCatcher)⁴:SnoopTag-Affi-SpyTag.

La figura 12 muestra una fotografía de un gel de SDS-PAGE con tinción de Coomassie que analiza la síntesis de proteínas de fusión en fase sólida. Los carriles 1 a 3 muestran MBPx-SpyCatcher, SnoopTag-mEGFP-SpyTag y SpyCatcher-SnoopCatcher aisladamente. MBPx-SpyCatcher se unía a la resina de amilosa y se llevó a cabo la reacción en etapas con SnoopTag-mEGFP-SpyTag y SpyCatcher-SnoopCatcher. Después de cada etapa, se eluyó una alícuota de muestra a partir de la resina con maltosa (carriles 4 a 9). Las muestras se analizaron sin ninguna purificación adicional, y (B) una fotografía de un gel de SDS-PAGE con tinción de Coomassie analizando la síntesis de la proteína de fusión en fase sólida. Los carriles 1 a 3 muestran MBPx-SpyCatcher, SnoopTag-SpyTag-Affi3 y SpyCatcher-SnoopCatcher aisladamente. La reacción en etapas se llevó a cabo y se analizó tal como en (A).

La figura 13 muestra un diagrama de dos estructuras simples de proteína de fusión ramificada que pueden obtenerse utilizando los métodos de la invención.

La figura 14 muestra una fotografía de un gel de SDS-PAGE con tinción de Coomassie que compara la actividad de un RrgATag mutado (RrgATag2.0, SEC ID n° 111) fusionado con MBP, reaccionado con RrgACatcher con RrgATag no mutado (SEC ID n° 9) fusionado con MBP, reaccionado con RrgACatcher.

La figura 15 muestra una fotografía de un gel de SDS-PAGE con tinción de Coomassie que caracteriza diversos mutantes de conector peptídico RrgATag (fusionado con SUMO), reaccionado con RrgACatcher.

La figura 16 muestra gráficos que ilustran el curso temporal de la reacción de RrgATaq2 con una proporción 1:1, 2:1 o 4:1 de RrgATag2 a RrgACatcher. El gráfico interior muestra la reacción durante los primeros ⁸minutos de la reacción. La figura 17 muestra una fotografía de un gel de SDS-PAGE con tinción de Coomassie que caracteriza la reactividad de RrgACatcher con SnoopTag, SnoopCatcher, SpyTag, SpyCatcher y RrgATaq2.

La figura 18 muestra una fotografía de un gel de SDS-PAGE con tinción de Coomassie que caracteriza la reactividad ortogonal de RrgATag2/RrgACatcher, SnoopTag/SnoopCatcher y SpyTag/SpyCatcher.

Ejemplos

Ejemplo 1. Diseño y síntesis de pares afines de conectores peptídicos que forman enlaces isopeptídicos espontáneos.

RrgA (SEC ID n° 21) es una adhesina de Streptococcus pneumoniae, una bacteria Gram-positiva que puede causar septicemia, neumonía y meningitis en seres humanos. Se forma un enlace isopeptídico espontáneo en el dominio de tipo inmunoglobulina D4 de RrgA, entre los residuos Lys742 y Asn854 (figura 2). El inventor dividió el dominio D4 en un par de conectores peptídicos denominados SnoopTag (residuos 734 a 748, SEC ID n° 1) y una proteína que los presentes inventores denominaron SnoopCatcher (residuos 749 a 860, SEC ID n° 2).

Sin embargo, los inventores encontraron que resultaba necesario introducir dos mutaciones en el conector peptídico SnoopCatcher a fin de formar un par estable de conectores peptídicos para la utilización en la invención. A este respecto, el inventor introdujo la mutación G842T en SnoopCatcher para estabilizar una cadena p y D848G para estabilizar un giro de horquilla próximo al sitio de reacción.

El péptido SnoopTag se expresó en forma de un polipéptido recombinante fusionado con la proteína de unión a maltosa (MBP) y una etiqueta de His (SEC ID n° 50). Se expresó SnoopCatcher en forma de un polipéptido recombinante fusionado con una etiqueta de His (SEC ID n° 39). Se expresaron eficientemente SnoopTag-MBP y SnoopCatcher en forma de proteínas solubles en el citosol de Escherichia coli y se purificaron mediante cromatografía de afinidad de Ni-NTA. SnoopTag-MBP y SnoopCatcher, simplemente con la mezcla, formaron un complejo estable hasta el punto de ebullición en SDS (figura 3). Las mutaciones en la Lys742 reactiva putativa de SnoopTag (SnoopTag KA-MBP) y la Asn854 reactiva putativa de SnoopCatcher (SnoopCatcher NA) anularon la reacción (fig. 3). La ionización por electropulverización-espectrometría de masas apoyaron la pérdida de NH³de la formación de enlace isopeptídico entre SnoopCatcher y el péptido sintético SnoopTag; también se observaron productos secundarios acetilados y gluconilados comunes a la sobreexpresión de E. coli. Con 1:1 de SnoopCatcher a SnoopTag-MBP la reacción se producía con un rendimiento de 80%. Sin embargo, con un exceso de dos veces de SnoopCatcher, SnoopTag-MBP reaccionó cuantitativamente (figuras 4A y B). De manera similar, con un exceso de SnoopTag-MBP, SnoopCatcher fue consumido al 100% (figuras 4C y D).

Los inventores establecieron además que la reacción transcurría eficientemente entre pH ⁶y 9, aunque se enlentecía a pH 5 (figura 5A). La reacción presentaba la velocidad máxima a temperatura ambiente, aunque también se producía a 4°C y a 37°C (figura 5B). La cisteína se encontraba ausente de SnoopTag y SnoopCatcher, por lo que, tal como se esperaba, la reacción no era sensible al ditiotreitol (DTT). No se requería ningún componente tampón específico con la reacción en PBS, así como en presencia de los detergentes Triton X-100 y Tween 20 o alta concentración de sal (NaCl 1 M) (figura ⁶A). El chaperón químico N-óxido de trimetilamina (TMAO) proporcionó una mejora modesta (figura ⁶B).

La hidrólisis espontánea de un enlace amida normalmente requiere años bajo condiciones neutras, aunque los presentes inventores sometieron a ensayo si la hidrólisis resultaba acelerada en este medio particular de proteínas. Los presentes inventores buscaron la escisión de la interacción SnoopTag-MBP/SnoopCatcher, mediante competición con un exceso de una proteína alternativa unida a SnoopTag o con amonio, pero no observaron reversibilidad. Se desarrolló un par adicional de conectores peptídicos a partir de la proteína RrgA mediante la división del dominio de tipo inmunoglobulina D4 en una dirección diferente al par SnoopTag/SnoopCatcher de conectores peptídicos. Dicho par de conectores peptídicos se denominó RrgATag (SEC ID n° 9) y RrgACatcher (SEC ID n° 10). También se desarrolló un par de conectores peptídicos basado en la proteína PsCs (SEC ID n° 31), denominada PsCsTag (SEC ID n° 5) y PsCsCatcher (SEC ID n° ⁶).

Cada par de conectores peptídicos es capaz de formar espontáneamente un enlace isopeptídico bajo una diversidad de condiciones similares a las del par SnoopTag/SnoopCatcher comentado anteriormente.

Ejemplo 2. Investigación de la reactividad cruzada de pares de conectores peptídicos.

Una etiqueta peptídica y una pareja de unión, SpyTag y SpyCatcher (SEC ID n° 13 y 14) que reaccionan espontáneamente para formar un enlace isopeptídico han sido desarrollados anteriormente (documento n° WO2011/098772).

SnoopTag presenta una Lys reactiva, mientras que SpyTag presenta una Asp reactiva, de manera que el inventor planteó la hipótesis de que los pares SnoopTag/SnoopCatcher y SpyTag/SpyCatcher serían totalmente ortogonales, es decir, no mostrarían reactividad cruzada. Tras la mezcla de los conectores peptídicos en diversas combinaciones, se encontró que cada par afín de conectores peptídicos reaccionaba eficientemente, pero no se observaban ni trazas de reacción cruzada entre pares, ni siquiera después de la incubación durante la noche (figura 7). Dicho resultado confirmó que el par SnoopTag/SnoopCatcher es ortogonal a SpyTag/SpyCatcher.

El inventor sometió a ensayo además el par PsCsTag/PsCsCatcher y el par RrgATag/ RrgACatcher para reactividad cruzada con los pares SnoopTag/SnoopCatcher y SpyTag/SpyCatcher. Tal como se muestra en las figuras ⁸A y B, no se observó reactividad cruzada significativa entre el par "PsCs" y el par "Spy" o el par "Snoop". De manera similar, no se encontró reactividad cruzada significativa entre el par "RrgA" y el par "Spy" o el par "Snoop". De esta manera, cada par de conectores peptídicos es ortogonal a los demás pares de conectores peptídicos.

Ejemplo 3. Síntesis de proteínas de fusión mediante la utilización de dos pares ortogonales de conectores peptídicos. Los inventores utilizaron los pares "Spy" y "Snoop" de conectores peptídicos para demostrar que dichos pares ortogonales de conectores peptídicos pueden utilizarse con éxito para sintetizar proteínas de fusión.

La interacción de MBP de E. coli con la resina de amilosa se utiliza ampliamente en la purificación de afinidad: las fusiones de MBP típicamente se pliegan y se expresan bien y muestran una baja unión no específica a la resina. MBP muestra una elución suave selectiva con maltosa, evitando la necesidad de extracción con proteasas. La afinidad de la MBP de tipo salvaje para la maltosa es de 1,2 |jM, que resulta práctica para la purificación de proteínas, aunque insuficiente para múltiples rondas de lavado y extensión de cadena en la síntesis de proteínas de fusión. Por lo tanto, los inventores desarrollaron una MBP mutada para mejorar su estabilidad de unión a la maltosa. En primer lugar, los inventores modificaron la secuencia del polipéptido mediante la introducción de las mutaciones A312V e I317V y la deleción de los residuos 172, 173, 175 y 176. En segundo lugar, la MBP mutante (SEC ID n° 70) se unión en tándem para generar MBPx (His6-MBPmt-conector-MBPmt).

Para la construcción de la cadena inicial, los inventores incorporaron aficuerpos, un andamiaje no de inmunoglobulina que se expresa eficientemente en el citosol de E. coli. El aficuerpo de HER2 se unión en su extremo N-terminal a SnoopTag y a su extremo C-terminal a SpyTag (SnoopTag-Affi-SpyTag, SEC ID n° 72). Las unidades de aficuerpo se puentearon utilizando SpyCatcher conectado mediante un espaciador helicoidal a SnoopCatcher (SpyCatcher-SnoopCatcher (SEC ID n° 56), que también se expresó eficientemente en forma de una proteína soluble en E. coli) (figura 1). Debido a que cada enlace es covalente, la síntesis de la cadena pudo seguirse mediante la adición de maltosa para la elución respecto de la resina, seguido de la ebullición del sobrenadante antes de SDS-PAGE con tinción de Coomassie para seguir la extensión de la proteína de fusión (figura 9A). MBPx-SpyCatcher (unido a la resina de amilosa) reaccionó cuantitativamente con SnoopTag-Affi-SpyTag (figura 9A, carril 5). Dicho constructo a continuación reaccionó cuantitativamente con SpyCatcher-SnoopCatcher (figura 9A, carril ⁶). La adición secuencial de SnoopTag-Affi-SpyTag y SpyCatcher-SnoopCatcher permitió un crecimiento de cadena eficiente, extendiéndose a un producto de 10 unidades de longitud (un decámero, figura 9A, carril 13).

Para demostrar la extensión en fase sólida con un tipo diferente de unión a fase sólida, se generó una proteína SpyCatcher modificada, AviTag-SpyCatcher, para permitir la biotinilación N-terminal específica de sitio. Tras la unión de SpyCatcher biotinilado a perlas recubiertas con estreptavidina, las cadenas de las proteínas de fusión se ensamblaron hasta la longitud de un decámero de la misma manera y se eluyeron con biotina libre (figura 9B).

Con el fin de validar el decámero ensamblado, se llevó a cabo ionización por electropulverización-espectrometría de masas, que mostró una buena correspondencia entre las masas observadas y esperadas (figura 10A). Aunque la espectrometría de masas proporciona una buena indicación de identidad, SDS-PAGE es mucho mejor en la evaluación de la pureza, debido a que los productos secundarios de peso molecular más bajo se ionizan más eficientemente. Los aficuerpos habitualmente son monoméricos, mostrando poca autoasociación; de esta manera, para analizar si el decámero formaba agregados se llevó a cabo una cromatografía de exclusión por tamaños (SEC, por sus siglas en inglés). La SEC proporcionó un pico principal, consistente con la masa monomérica esperada del decámero calibrada con patrones de proteína globular, indicando que se producía una autoasoaciación mínima de los decámeros bajo dichas condiciones (fig. 10B).

Con el fin de evaluar la termoestabilidad, el decámero se calentó brevemente en un intervalo de temperaturas y se mantuvo en gran medida soluble incluso a 70°C (fig. 11A). La integridad de los decámeros en el almacenamiento también se sometió a ensayo y se observó poca degradación y poca pérdida de solubilidad tras 1 o 4 días (fig. 11B).

Con la expansión respecto de la incorporación inicial de AffiHER2 en las cadenas, se mostró que podían incorporarse otras unidades proteicas eficientemente mediante la utilización de la formación de enlace isopeptídico ortogonal (figura 12). A este respecto, se generaron cadenas de proteína de fusión de proteína fluorescente (figura 12A). También se produjeron polímeros de proteína de fusión de escobillón, mediante la unión de un aficuerpo unido en tándem contra HER2 con ambas etiquetas en el extremo N-terminal (SnoopTag-SpyTag-Affi-Affi-Affi) (figura 12B).

En resumen, el inventor ha desarrollado un enfoque modular a la síntesis de proteínas de fusión, mediante la formación espontánea de enlace isopeptídico entre los conectores peptídicos. Las proteínas de fusión generadas según el método de la invención se unen mediante enlaces de amida irreversibles, por lo que son estables durante el tiempo (en caso de que se protejan frente a proteasas) y permiten un análisis fácil mediante SDS-PAGE. Las etapas de inicio, extensión y liberación utilizan condiciones suaves, independientes del estado redox, por lo que deberían resultar aplicables a un amplio abanico de proteínas. Con un único modo para que crezca la cadena, los productos están definidos molecularmente, favoreciendo la reproducibilidad y ajuste preciso de la función. Además, las subunidades no necesitan conectarse en una orientación N-terminal a C-terminal, tal como muestran las arquitecturas poliméricas de escobillón indicadas anteriormente. No se requiere ninguna modificación química del módulo, evitando etapas de bioconjugación, laboriosas y difíciles de controlar, por lo que el método es accesible a cualquier laboratorio capaz de expresar proteínas recombinantes. La formación espontánea de enlace isopeptídico presenta la ventaja de que es una ruta de reacción simple entre dos grupos funcionales que presentan baja reactividad intrínseca: una amina con un ácido carboxílico o una carboxamida, por lo que se producen pocas reacciones secundarias.

Aunque el presente ejemplo demuestra la síntesis de proteínas de fusión mediante la utilización de los pares "Spy" y "Snoop" de conectores peptídicos, resultará evidente que pueden utilizarse cualesquiera pares ortogonales de conectores peptídicos según la invención en los métodos de la invención y, tal como se ha comentado anteriormente, mediante la utilización de más de dos pares ortogonales de conectores peptídicos pueden resultar particularmente ventajosos para la síntesis de proteínas de fusión con estructuras completas, p.ej., estructuras ramificadas o circulares. Ejemplo 4. Diseño y síntesis de pares afines mejorados de conectores peptídicos basados en la proteína RrgA. La RrgATag indicada en el Ejemplo 1 se sometió a una diversidad de modificaciones con el objetivo de producir un par de conectores peptídicos con actividad mejorada respecto al par de conectores peptídicos RrgATag/RrgACatcher. El inventor sintetizó un conector peptídico RrgATag mutante que comprendía una sustitución en la posición 11: ácido aspártico a glicina (D11G), denominado RrgATag2.0 (ver la Tabla 2, posteriormente). RrgATag2.0 (SEC ID n° 111) y RrgATag (SEC ID n° 9) se expresaron en forma de proteínas de fusión unidas a proteína de unión a maltosa (MBP) y se comparó su reactividad con RrgACatcher. Las reacciones se llevaron a cabo durante ⁶horas en solución salina tamponada con fosfato (PBS) a pH 7,4 y a temperatura ambiente. Se utilizaron 10 pM de cada proteína en cada reacción.

La figura 14 muestra que RrgATag2.0 presenta una reactividad muy incrementada con RrgACatcher en comparación con RrgATag.

El inventor sintetizó ocho conectores peptídicos adicionales que comprendían diversas mutaciones respecto a RrgATag (SEC ID n° 9), incluyendo extensiones, truncados, sustituciones y combinaciones de los mismos. La Tabla 2 muestra las secuencias de los conectores peptídicos RrgATag mutantes, en los que las sustituciones y extensiones se han subrayado.

Tabla 2

Los conectores peptídicos RrgATag mutados se expresaron en forma de proteínas de fusión unidas a una proteína SUMO (modificador pequeño de tipo ubiquitina) y las proteínas de fusión se sometieron a ensayo para reactividad con RrgACatcher (SEC ID n° 10). Las reacciones se llevaron a cabo durante 30 minutos en solución salina tamponada con fosfato (PBS) a pH 7,4 y a temperatura ambiente. Se utilizaron 10 pM de cada proteína en cada reacción. La figura 15 muestra que sólo cuatro de los conectores peptídicos RrgATag modificados mostraba reactividad observable con RrgACatcher: RrgATag 2.0, RrgATag2.3, RrgATag2 y RrgATag2.7. Sin embargo, RrgATag2 mostró un incremento significativo de la actividad respecto a RrgATag2.0, que tal como se ha comentado anteriormente, presentaba una actividad incrementada respecto a RrgATAg. De esta manera, RrgATag2 presentaba una reactividad significativamente mejorada con RrgACatcher en comparación con RrgATag.

La velocidad de reacción entre RrgATag2 (en la forma de una proteína de fusión con SUMO) y RrgACatcher se muestra en la figura 16 e indica que un exceso de RrgATag2 incrementa la velocidad de la reacción. Sin embargo, la reacción se acercó a la completitud, es decir, al consumo de 100% de RrgACatcher, a todas las concentraciones de RrgATag2. Aunque sin deseo de restringirse a ninguna teoría, se plantea la hipótesis de que la actividad significativamente mejorada de RrgATag2 es el resultado de la combinación de modificaciones/mutaciones respecto a RrgATAg. A este respecto, la extensión C-terminal, que se basa en la secuencia nativa de RrgA, se cree que forma interacciones favorables con el conector peptídico RrgACatcher. Además, se plantea la hipótesis de que la mutación D a G (es decir, la reducción de tamaño de la cadena lateral) en la parte intermedia del conector peptídico RrgATag2 estabiliza el giro de horquilla en el péptido (tal como se observa en la estructura cristalina presente en el dominio de longitud completa).

Ejemplo 5. Investigación de la reactividad cruzada del conector peptídico RrgATag2 mejorado.

Se sometió a ensayo el par de conectores peptídicos RrgATag2/RrgACatcher para reactividad cruzada con los pares de conectores peptídicos SnoopTag/SnoopCatcher y SpyTag/SpyCatcher, tal como se ha indicado en el Ejemplo 3, anteriormente. El conector peptídico RrgATag2 se expresó en forma de una proteína de fusión unida a SUMO, tal como se indica en el Ejemplo 4.

La figura 17 muestra que no se observó ninguna reactividad cruzada significativa entre el conector peptídico RrgACatcher y los conectores peptídicos SpyTag o SnoopTag. La figura 18 muestra que no se observó reactividad cruzada significativa entre el conector peptídico RrgATag2 y los conectores peptídicos SpyCatcher y SnoopCatcher. De esta manera, cada par de conectores peptídicos es ortogonal a los demás pares de conectores peptídicos.

Materiales y métodos:

Clonación

Se utilizó la ADN polimerasa de inicio en caliente KOD (Roche) para llevar a cabo todas las PCR y mutagénesis dirigidas a sitio. Se utilizó la mezcla maestra Gibson Assembly® (NEB) siguiendo las instrucciones del fabricante. Los constructos se clonaron inicialmente en E. coli DH5a químicamente competentes (Life Technologies).

pET28a SpyTag-MBP (plásmido de Addgene ID 35050), glutatión-S-transferasa-BirA y pDEST14-SpyCatcher (GenBank JQ478411, plásmido de Addgene ID 35044) han sido descritos en B. Zakeri et al., (Proc. Natl. Acad. Sci. USA 109, E690-697, 2012).

Se generó pET28a SnoopCatcher mediante ensamblaje mediado por cebadores de DNAWorks a partir de los residuos 749 a 860 de la adhesina RrgA de Streptococcus pneumoniae (numeración basada en Protein Data Bank ID 2WW8), digerido con HindIII y Ndel y subclonado en pET28a. Para optimizar la reacción con SnoopTag, se realizó la mutación G842T en dicho constructo utilizando QuikChange con 5'-GTGCCGCAGGATATTCCGGCTACATATGAATTTACCAACG (SEC ID n° 73), y la mutación D848G con 5'-GCTACATATGAATTTACCAACGGTAAACATTATATCACCAATGAACC (SEC ID n° 74) y sus complementos inversos. SnoopCatcher presenta 132 residuos de longitud (suponiendo corte por fMet) y presenta un sitio de corte de trombina N-terminal y una etiqueta His⁶. Se produjo pET28a SnoopCatcher NA a partir de pET28a SnoopCatcher con QuikChange de N854 a A utilizando el cebador directo 5'-ACATTATATCACCGCTGAACCGATACCGCCG (SEC ID n° 75) y su complemento inverso.

Se generó pET28a SnoopTag-MBP en dos etapas. En primer lugar, se clonó el péptido reactivo basado en la cadena p N-terminal del dominio D4 de RrgA (residuos 734 a 748) en pET28a-SpyTag-MBP mediante PCR de mutagénesis independiente de la ligasa dirigida a sitio (SLIM, por sus siglas en inglés) (Chiu et al., 2004) utilizando 5'-GGTAGTGGTGAAAGTGGTAAAATCGAAGAAG (SEC ID n° 76), 5'-AAACTGGGCGATATTGAATTTATTAAAGTGAACAAAAACGATAAAGGTAGTGGT GAAAGTGGTAAAATCGAAGAAG (SEC ID n° 77), 5'-TCCCATATGGCTGCCGCGCG (SEC ID n° 78) y 5'-TTTATCGTTTTTGTTCACTTTAATAAATTCAATATCGCCCAGTTTTCCCATATGG CTGCCGCGCG (SEC ID n° 79). Los 3 residuos C-terminales del péptido se eliminaron utilizando QuikChange con 5'-GAATTTATTAAAGTGAACAAAGGTAGTGGTGAAAGTGGTAAAATCG (SEC ID n° 80) y su complemento inverso. Se generó pET28a SnoopTag KA-MBP, una versión no reactiva de SnoopTag, mediante cambio QuikChange de K742 a A en pET28a SnoopTag-MBP utilizando 5'-GGGCGATATTGAATTTATTGCAGTGAACAAAGGTAGTGG (SEC ID n° 81) y su complemento inverso.

Se generó pET28a MBP-SpyCatcher mediante la fusión de SpyCatcher con un espaciador Gly/Ser en el extremo C-terminal de MBP, mediante PCR de extensión por solapamiento. Se amplificó SpyCatcher a partir de pDEST14-SpyCatcher mediante la utilización del cebador directo 5'-GTTCGGGCGGTAGTGGTGCCATGGTTGATACCTTATCAGGTTTATCAAGTGAG CAAG (SEC ID n° 82) y el cebador inverso 5'-TACTAAGCTTCTATTAAATATGAGCGTCACCTTTAGTTGCTTTGCCATTTACAG (SEC ID n° 83). El cebador directo 5'-ATCTCATATGGGCAGCAGCCATCATCATCATCATCAC (SEC ID n° 84) y el cebador inverso 5'-GTATCAACCATGGCACCACTACCGCCCGAACCCGAGCTCGAATTAGTCTGCG (SEC ID n° 85) se utilizaron para amplificar MBP a partir de pET28a SpyTag-MBP. Los dos productos de PCR resultantes se mezclaron y se amplificaron nuevamente mediante la utilización del cebador directo de SpyCatcher y el cebador inverso de MBP, se digirieron con NdeI e HindIII, y se subclonaron en pET21. Con el fin de incrementar la afinidad de MBP-SpyCatcher para la amilosa, en primer lugar, los presentes inventores realizaron las mutaciones A312V y I317V en MBP con QuikChange utilizando el cebador directo 5'-GTCTTACGAGGAAGAGTTGGTGAAAGATCCACGTGTGGCCGCCACTATGGAA AACGC (SEC ID n° ^{8 6}) y su complemento inverso. Los residuos 172, 173, 175 y 176 se delecionaron de MBP utilizando QuikChange con 5'-GGGTTATGCGTTCAAGTATGGCGACATTAAAGACGTGGGCG (SEC ID n° 87) y su complemento inverso. A continuación, los presentes inventores acortaron el extremo N-terminal de SpyCatcher con QuikChange utilizando 5'-CACCATCACCATCACGATTACGATAGTGCTACCCATATTAAATTCTC (SEC ID n° ^{8 8}) y su complemento inverso.

Con el fin de reducir todavía más la disociación respecto de la resina de amilosa, se generaron enlaces en tándem a dicho MBP mutante, proporcionando MBPx-SpyCatcher (etiqueta His⁶N-terminal-MBPmt-espaciador-MBPmtespaciador-SpyCatcher). Se amplificó MBPx y se fusionó con MBPx-SpyCatcher mediante ensamblaje de Gibson utilizando el cebador directo 5-GGCGGATCCGGAGGTGGATCCGGAAAGATAGAGGAGGGTAAACTGGTAATCT GG (SEC ID n° 89), el cebador inverso 5- CCTATAGTGAGTCGTATTAATTTCG (SEC ID n° 90), el cebador directo 5-CGAAATTAAT ACGACT CACT AT AGG (SEC ID n° 91) y el cebador inverso 5-TCCGGATCCACCTCCGGATCCGCCGGAACTAGAATTCGTCTGCGCGTCTTTCA GG (SEC ID n° 92).

Se produjo pET28a SpyCatcher-SnoopCatcher en etapas. Inicialmente, se fusionó SpyCatcher con un espaciador Gly/Ser en el extremo N-terminal de SnoopCatcher; después, el espaciador Gly/Ser se sustituyó por un espaciador ahelicoidal (secuencia PANLKALEAQKQKEQRQAAEELANAKKLKEQLEK, SEC ID n° 93). El cebador directo 5'-CTTTAAGAAGGAGATATACATATGTCGTACTACCATCACCATC (SEC ID n° 94) y el cebador inverso 5'-CCGCTGCTTCCGGATCCAATATGAGCGTCACCTTTAGTTG (SEC ID n° 95) se utilizaron para amplificar la parte SpyCatcher de pDEST14-SpyCatcher. La parte SnoopCatcher se clonó utilizando el cebador directo 5'-CATATTGGATCCGGAAGCAGCGGCCTGGTGCCGCGCGGATCCCATATGAAGC CGCTGC (SEC ID n° 96) y el cebador inverso 5'-GTGGTGGTGGTGGTGCTCGAGTTATTATTTCGGCGGTATCGGTTC (SEC ID n° 97) de pET28a SnoopCatcher. Después de la fusión de SpyCatcher y SnoopCatcher, el espaciador Gly/Ser se sustituyó con un conector a-helicoidal estable mediante la utilización del cebador directo 5'-CT AAAGGT GACGCT CATATTGGATCCCCCGCCAACCT GAAGGCCCTGGAGGC CCAGAAGCAGAAGGAGCAGAGACAGGCCGCCGAGGAGC (SEC ID n° 98) y el cebador inverso 5'-CACGGCACCACGCAGCGGCTTCATATGGGATCCCTTCTCCAGCTGCTCCTTCA GCTTCTTGGCGTTGGCCAGCTCCTCGGCGGCCTGTC (SEC ID n° 99). Se delecionaron 35 residuos del extremo N-terminal de SpyCatcher con QuikChange utilizando el cebador directo 5'-CACCATCACCATCACGATTACGATAGTGCTACCCATATTAAATTCTC (SEC ID n° 100) y su complemento inverso. Se generó pET28a SnoopTag-Affi-SpyTag (etiqueta His⁶N-terminal-SnoopTag-espaciador-aficuerpo contra HER2-espaciador-SpyTag) mediante ensamblaje de Gibson utilizando el cebador directo 5'-GTGAACAAAGGCAGTGGTGAGTCGGGATCCGGAGCTAGCATGACTGGTGG (SEC ID n° 101) y el cebador inverso 5' CATCACGATGTGGGCACCGGAACCTTCCCCGGATCCCTCGAGGCCTTTCGG (SEC ID n° 102) de pET28a-KTag-AffiHer2-SpyTag.

Se generó pET28a SnoopTag-AffiTaq-SpyTag, un aficuerpo contra la ADN polimerasa Taq, mediante PCR inversa a partir de pET28a SnoopTag-AffiHer2-SpyTag utilizando 5'-CT ACCCAACCTAAACGGGGTACAAGTAAAGGCTTT CATAGACT CGCTAAGGGA TGACCCAAGCCAAAGCGC

(SEC ID n° 103) y 5'-GTT GAATATCTCCCAAGTAGCCCACCCTAGCTCCTT GTT GAACTT GTT GTCTAC TTCTTTGTTGAATTTGTTGTCCACGCC (SEC ID n° 104).

Se clonó pET28a SnoopTag-mEGFP-SpyTag mediante la sustitución de mEGFP en los sitios BamHI en pET28a SnoopTag-Affi-SpyTag y mediante PCR para extender el espaciador. Se generó pET28a SnoopTag-SpyTag-Affi3 medainte ensamblaje por PCR de copias en tándem de AffiHER2 unido mediante espaciadores Gly/Ser.

Se clonó AviTag-SpyCatcher, que contiene una etiqueta peptídica para la biotinilación específica de sitio en el extremo N-terminal, mediante PCR SLIM a partir de pDEST14-SpyCatcher utilizando 5'-GATTACGACATCCCAACGACCGAAAACCT G (SEC ID n° 105), 5'-GCCTGAACGATATTTTTGAAGCGCAGAAAATTGAATGGCATGAAGGCGATTAC GACATCCCAACGACCGAAAACCTG (SEC ID n° 106), 5'-GTGATGGTGATGGTGATGGTAGTACGACATATG (SEC ID n° 107) y 5'-TGCCATTCAATTTTCT GCGCTTCAAAAAT AT CGTTCAGGCCGCTGCCGT GAT G GTGATGGTGATGGTAGTACGACATATG (SEC ID n° 108).

Todas las mutaciones y constructos se verificaron mediante secuenciación.

Expresión y purificación de proteínas.

Se expresaron las proteínas en E. coli BL21 DE3 RIPL (Agilent). Se hicieron crecer colonias durante la noche a 37°C en LB que contenía 0,5 mg/ml de canamicina para los vectores pET28a y 0,1 mg/ml de ampicilina para pET21. Los cultivos de durante la noche se diluyeron 1:100 en LB que contenía 0,8% de glucosa con el antibiótico apropiado y se cultivaron a 37°C, a 200 rpm hasta DO600 de 0,5 a 0,6 y se indujeron con IPTG 0,4 mM a 30°C, 200 rpm durante 4 h. Las proteínas se purificaron mediante métodos estándares en Ni-NTA (Qiagen) y se dializaron tres veces con TBS (Tris-HCl 50 mM, pH 8,0 y NaCl 50 mM).

Para la purificación de MBPx-SpyCatcher, tras la elución respecto de Ni-NTA, se intercambió el tampón mediante diálisis en Tris-HCl 20 mM, pH 8,0, a 4°C, cargado en resina de alto rendimiento cuaternaria (Q-HP) (GE Healthcare) y se eluyó con 10 volúmenes de columna (es decir, 10 ml) de gradiente lineal de NaCl 0 a 0,15 M con un caudal de 1 ml/min. Se llevó a cabo una etapa adicional de elución con un gradiente lineal de NaCl 0,15 a 0,35 M a un caudal de 1,5 ml/min y se recogieron fracciones de 0,5 ml. Las fracciones recogidas se dializaron en TBS, se concentraron utilizando un concentrador centrífugo Vivaspin de 5 kDa de corte (GE Healthcare) y se almacenaron a -80°C.

Se dializó SnoopTag-Affi-SpyTag en ácido 2-(N-morfolino)etanosulfónico 20 mM (MES) a pH 5,8 a 4°C y se cargó en resina sulfopropilo de alto rendimiento (SP-HP) (GE Healthcare). Las proteínas se eluyeron mediante la aplicación de un gradiente lineal de NaCl 0,2 a 0,5 M y se recogieron fracciones de 1 ml. Las fracciones eluidas se concentraron a 1 a 2 mg/ml utilizando un concentrador centrífugo Vivaspin de 5 kDa de corte (GE Healtchare), se dializaron en TBS, pH 8,0, y se almacenaron a -80°C.

Para la purificación de SpyCatcher-SnoopCatcher, tras la elución respecto de Ni-NTA, se intercambió el tampón mediante diálisis en Tris-HCl ^{2 0}mM, pH ⁸,⁰, a 4°C, cargado en resina de alto rendimiento cuaternaria (Q-HP) y se eluyó con un gradiente lineal de NaCl 0,2 a 0,5 M. Las fracciones recogidas se dializaron en TBS, se concentraron utilizando un concentrador centrífugo Vivaspin de 5 kDa de corte y se almacenaron a -80°C.

AviTag-SpyCatcher purificado se biotiniló en PBS pH 7,4 que contenía MgCh 5 mM, ATP 1 mM, D-biotina 380 pM y GST-BirA 7 pM durante 1 h a 25°C. Tras 1 h de incubación, se añadió GST-BirA adicional, proporcionando una concentración final de 14 pM y la reacción se incubó durante otra hora a 25°C. Se eliminó GST-BirA mediante incubación de la mezcla de reacción con 50 pl de matriz en suspensión Hi-Cap glutatión (Qiagen) a 25°C, con rotación vertical durante 30 min. La resina se peletizó a 4.000 g durante 1 min. Se recogió el sobrenadante y se dializó durante la noche a 4°C en PBS. Para confirmar la biotinilación completa, se llevó a cabo un ensayo de desplazamiento en gel tal como se ha descrito.

SDS-PAGE

Se llevó a cabo un SDS-PAGE en el gel de poliacrilamida del porcentaje indicado utilizando un recipiente de gel XCell SureLock (Life Technologies) a 200 V. Los geles se tiñeron con tinción de Coomassie azul instantáneo (Triple Red Ltd.) y las bandas se analizaron densitométricamente utilizando un generador de imágenes Gel Doc XR y software Image Lab 3.0 (Bio-Rad). Todos los tampones de migración eran de tris-glicina, excepto en la figura 9A, que era de tris-acetato, para mejorar la resolución de los productos de Mw elevada.

Reconstitución de enlace isopeptídico.

Con el fin de evaluar la formación de un enlace covalente entre SnoopTag y SnoopCatcher, se mezclaron las proteínas, cada una a una concentración final de 10 pM, en TBS, pH 8,0, que contenía N-óxido de trimetilamina (TMAO, Sigma-Aldrich) 1,5 M. El TMAO actúa como un chaperón químico. Las reacciones se detuvieron mediante la adición de ⁶x tampón de carga de SDS (Tris-HCl 0,23 M, pH ⁶,⁸, glicerol al 24% v/v, azul bromofenol 120 pM, SDS 0,23 M). Las muestras posteriormente se calentaron utilizando un ciclador térmico Bio-Rad C1000 a 95°C durante 5 min, antes de SDS-PAGE en geles de poliacrilamida al 16%.

Para someter a ensayo la ortogonalidad, se incubó Snoop-Tag-MBP 10 pM y SnoopCatcher o SpyCatcher 10 pM durante 1 h a 25°C en TBS, pH 8,0, antes del SDS-PAGE. De manera similar, se incubó SpyTag-MBP y SnoopCatcher o SpyCatcher 10 pM tal como anteriormente.

Para los otros pares de conectores peptídicos, se incubó RrgATag-MBP 10 pM o PsCsTag-MBP 10 pM y SnoopCatcher, SpyCatcher, SnoopTag-MBP o SpyTag-MBP 10 pM durante 24 h a 25°C en Pbs, pH 7,4, antes de SDS-PAGE.

Con el fin de evaluar la dependencia del pH, cada proteína se mezcló a una concentración de 10 pM en tampón de succinato-fosfato-glicina (ácido succínico 12,5 mM, NaH²PO⁴43,75 mM y glicina 43,75 mM), seleccionados para permitir un tamponado adecuado en un amplio intervalo de pH, de entre pH 4,0 y pH 9,0, y se incubaron a 25°C durante 15 min.

Con el fin de determinar el efecto de la temperatura, se mezcló SnoopTag-MBP 10 pM y SnoopCathcer 10 pM durante 15 min a las temperaturas indicadas en solución salina tamponada con fosfato (PBS, Na²HPO⁴10 mM, NaCl 137 mM, KCI 27 mM, KH²PO⁴1,8 mM), pH 8,0, que contenía TMAO 1,5 M. Se utilizó p Bs en lugar de TBS debido a que el pH de los tampones de Tris cambia sustancialmente con la temperatura.

Con el fin de investigar la sensibilidad de la composición tamponadora, las proteínas se incubaron a 25°C durante 15 min en Pbs, pH 8,0, TBS, pH 8,0 o TBS, pH 8,0, que contenía Triton X-100 al 1% (p/v), Tween-20 al 1% (v/v), tetraacetato de etilén-diamina (EDTA) 10 mM, MgCh 10 mM, DTT 10 mM o Tris 50 mM, pH 8,0, con NaCl 1 M. Se determinó la velocidad de reacción haciendo reaccionar SnoopTag-MBP y SnoopCatcher a las concentraciones indicadas en TBS, pH 8,0, que contenía TAMO 1,5 M y se incubó a 25°C durante diversos tiempos. Las reacciones se detuvieron en tampón de carga de SDS, tal como se ha indicado anteriormente, antes de SDS-PAGE. Se calculó el % de reconstitución como ^{1 0 0}x la intensidad de banda del aducto covalente, dividido por la suma de intensidades de banda de SnoopTag-MBP, SnoopCatcher y el aducto covalente.

Con el fin de someter a ensayo la reversibilidad con la etiqueta competidora, se incubó SnoopCatcher 10 pM con SnoopTag-MBP 15 pM durante ⁶h y después se añadió SnoopTag-Affi-SpyTag a una concentración final de 130 pM durante 16 h, todos a 25°C. Con el fin de someter a ensayo la reversibilidad con amonio, se incubó SnoopCatcher 10 pM con SnoopTag-MBP 10 pM durante 2 h en TBS, pH 8,0, que contenía TMAO 1,5 M y después se añadió TBS, pH 8,0 o NH⁴Cl, pH 9,0 (hasta una concentración final de 1 M) durante 16 h, todos a 25°C.

Espectrometría de masas

Se incubaron SnoopTag-MBP 20 pM y SnoopCatcher 20 pM a 25°C durante 2 h en PBS, pH 7,4. Se llevó a cabo un análisis de espectrometría de masas utilizando un LCT Micromass-EM por tiempo de vuelo con ionización por electropulverización (Micromass) y el espectro de m/z se convirtió en perfil de masas moleculares utilizando un algoritmo de entropía máxima y el software V4.00.00 (Waters). Se utilizó ExPASy ProtParam para predecir las masas moleculares basándose en la secuencia de aminoácidos de las proteínas, cortando la fMet N-terminal y restando 17,0 Da por la formación de enlaces isopeptídicos. Con frecuencia se observa gluconilación no enzimática a partir de la expresión de proteínas etiquetadas con His en E. coli y añade 178 Da. De manera similar, las proteínas expresadas en E. coli también pueden experimentar cierto grado de acetilación.

El decámero se concentró a 15 pM y se intercambiaron los tampones en acetato amónico 200 mM utilizando un filtro centrífugo Amicon Ultra de 0,5 ml con un valor de corte de 10 kDa (Millipore). Se llevaron a cabo mediciones en un espectrómetro de masas de espectrometría de masas de cuadrupolo-tiempo de vuelo Synapt High Definition de primera generación (Waters) calibrado utilizando yoduro de cesio 10 mg/ml en acetato amónico 250 mM. Se produjeron alícuotas de 2,5 pl de la muestra mediante ionización por electropulverización mediante capilares recubiertos con oro, preparados en el propio laboratorio. Los parámetros instrumentales eran los siguientes: presión origen de 6,0 mbar, voltaje capilar de 1,20 kV, voltaje del cono de 150 V, energía de la trampa: 30 V, energía de transferencia: 10 V, tensión de polarización de 5 V y presión de la trampa de 0,0163 mbar. Se suavizaron los espectros de masas y se calibraron magnéticamente y se asignaron las masas utilizando MassLynx v4.1 (Waters).

Síntesis en fase sólida de proteínas de fusión

Se aplicaron 40 pl de resina de amilosa en suspensión (NEB) a una columna Poly-prep de 1 ml (Bio-Rad), se enjuagó con 1 ml de agua MilliQ y se equilibró con 1 ml de TBS, pH 8,0. Se añadieron 320 pmoles en tándem de MBPx-SpyCatcher en TBS, pH 8,0, en un volumen final de 80 pl a la resina y se incubaron a 25°C durante 1 h con agitación a 700 rpm en un ThermoMixer comfort (Eppendorf). La proteína no reaccionada se eliminó de la columna mediante flujo por gravedad y la resina se lavó con 1 ml de tampón de lavado (Tris-HCl 50 mM, pH 8,0, con NaCl 500 mM). Se añadieron 3 nmoles de SnoopTag-Affi-SpyTag en TBS, pH 8,0, en un volumen final de 80 pl a la resina y se incubaron a 25°C durante 1 h con agitación a 700 rpm. Se eliminó SnoopTag-Affi-SpyTag no reaccionado de la columna mediante flujo por gravedad y la resina se lavó con 1 ml de tampón de lavado. Se añadieron 4 nmoles de SpyCatcher-SnoopCatcher en TBS, pH 8,0 con TMAO 1,5 M a la resina y se incubaron a 25°C durante 2 h con agitación a 700 rpm. SpyCatcher-SnoopCatcher no reaccionado se separó de la columna mediante flujo por gravedad y la resina se lavó con 1 ml de tampón de lavado. Las cadenas se produjeron mediante la adición secuencial de SnoopTag-Affi-SpyTag y SpyCatcher-SnoopCatcher, según las condiciones indicadas anteriormente. Se eluyeron las cadenas, después del lavado de la resina, mediante la adición de 40 pl de TBS, pH 8,0, que contenía D-maltosa 50 mM (Sigma) e incubando a 25°C durante 10 min con agitación a 700 rpm. Se recogieron las cadenas mediante centrifugación de la columna en un tubo de microcentrífuga de 1,5 ml durante 10 s a 17.000 g. Las cadenas que contenían SnoopTagmEGFP-SpyTag y SnoopTag-SpyTag-Affi3 se sintetizaron de exactamente la misma manera.

Para los ensayos de SDS-PAGE después de cada etapa, las muestras se eluyeron tal como se ha indicado anteriormente, se mezclaron con ⁶x tampón de carga de SDS y se calentaron a 95°C durante 5 min antes de SDS-PAGE.

Para el ensamblaje basado en SpyCatcher biotinilado, se aplicaron 40 pl de resina de avidina monomérica en suspensión (Thermo Scientific) a una columna poly-prep de 1 ml, se enjuagaron y se equilibraron tal como se ha indicado anteriormente. Se añadieron 4 pM de SpyCatcher biotinilado en TBS, pH ⁸,⁰, en un volumen final de 80 pl a la resina y se incubaron a 25°C durante ¹h con agitación a 700 rpm. El SpyCatcher biotinilado no reaccionado se separó de la columna mediante flujo por gravedad, se lavó la resina con ¹ml de tampón de lavado y se llevó a cabo la adición secuencial de SnoopTag-Affi-SpyTag y SpyCatcher-SnoopCatcher tal como se ha indicado anteriormente. Tras el lavado de la resina, las cadenas se eluyeron mediante aplicación en la columna de 40 pl de D-biotina 1 mM en TBS, pH 8,0, e incubación a 4 h con agitación a 700 rpm. Las cadenas se recogieron tal como se ha indicado anteriormente y se analizaron mediante SDS-PAGE en geles de tris-glicina al 16% y al ⁸%.

Cromatografía de filtración en gel.

Se analizaron las cadenas de decámero mediante cromatografía de filtración en gel en una columna Superdex 200 GL 10/300 (24 ml de volumen de lecho) (GE Healthcare). La columna se calibró mediante la utilización de patrones de filtración en gel (tiroglobulina, 670 kDa; IgG, 158 kDa; ovoalbúmina, 44 kDa; mioglobina, 17 kDa, y vitamina B12, 1,35 kDa) (Bio-Rad). Las muestras se eluyeron a 0,4 ml/min en Tris-HCl 50 mM, pH 8,0, con NaCl 500 mM, con el perfil de absorbancias medido a 280 nm en un purificador ÁKTA 10 (GE Healthcare).

Claims

REIVINDICACIONES

1. Método para producir una proteína de fusión, en el que dicho método comprende:

a) poner en contacto una Cebadora proteína con una segunda proteína bajo condiciones que permiten la formación de un enlace isopeptídico entre dichas proteínas, en el que dicha Cebadora proteína y dicha segunda proteína comprenden, cada una, un conector peptídico, en el que dichos conectores peptídicos son un par de conectores peptídicos que reaccionan formando un enlace isopeptídico que une dicha Cebadora proteína a dicha segunda proteína para formar una proteína unida, y

b) poner en contacto la proteína unida de (a) con una tercera proteína bajo condiciones que permiten la formación de un enlace isopeptídico entre dicha tercera proteína y dicha proteína unida, en el que dicha tercera proteína comprende un conector peptídico que reacciona con un conector peptídico adicional en la proteína unida de (a), y en el que dichos conectores peptídicos son un par de conectores peptídicos que reaccionan formando un enlace isopeptídico que une dicha tercera proteína a dicha proteína unida formando una proteína de fusión,

2. Método según la reivindicación 1, que es un método para producir una proteína de fusión, en el que dicho método comprende:

a) proporcionar una Cebadora proteína que comprende un Cebador conector peptídico,

b) poner en contacto dicha Cebadora proteína con una segunda proteína, en el que dicha segunda proteína comprende un segundo conector peptídico y un tercer conector peptídico, bajo condiciones que permiten que dicho Cebador conector peptídico y dicho segundo conector peptídico formen un enlace isopeptídico, uniendo de esta manera dicha Cebadora y segunda proteína, y

c) poner en contacto dicha Cebadora y segunda proteína unidas con una tercera proteína, en la que dicha tercera proteína comprende un cuarto conector peptídico, bajo condiciones que permiten que dicho tercer conector peptídico y dicho cuarto conector peptídico formen un enlace isopeptídico, uniendo de esta manera dicha segunda y tercera proteína para producir una proteína de fusión,

en el que dicho Cebador y segundo conector peptídico son un par de conectores peptídicos que son ortogonales al par de conectores peptídicos que consisten dicho tercer y cuarto conector peptídico.

3. Método según la reivindicación 2, que comprende además una etapa de extensión de la proteína de fusión, en la que la nueva proteína que debe unirse a la proteína de fusión comprende un conector peptídico que forma parte de un par de conectores peptídicos que es ortogonal al par de conectores peptídicos utilizado para formar el enlace isopeptídico anterior en la proteína de fusión, en el que el conector peptídico en la nueva proteína es capaz de formar un enlace isopeptídico con un conector peptídico en una proteína de la proteína de fusión, en el que dicho método comprende poner en contacto dicha nueva proteína con dicha proteína de fusión bajo condiciones que permiten que dicha nueva proteína forme un enlace isopeptídico con un conector peptídico en la proteína de fusión.

4. Método según cualquiera de las reivindicaciones 1 a 3, en el que la proteína de fusión presenta una estructura ramificada, lineal o circular, opcionalmente en el que la proteína de fusión es circularizable.

5. Método según cualquiera de las reivindicaciones 1 a 4, en el que dicho método se lleva a cabo sobre una fase sólida.

6. Método según la reivindicación 5, que comprende una etapa de elución de la proteína de fusión respecto de la fase sólida.

7. Conector peptídico que comprende:

8. Conector peptídico según la reivindicación 7, en el que:

(a) el conector peptídico en (i) comprende una secuencia de aminoácidos tal como se indica en la SEC ID n° 38, y/o (b) el conector peptídico en (ii) comprende una secuencia de aminoácidos tal como se indica en la SEC ID n° 39, y/o (c) el conector peptídico en (iii) comprende una secuencia de aminoácidos tal como se indica en la SEC ID n° 42, y/o (d) el conector peptídico en (iv) comprende una secuencia de aminoácidos tal como se indica en la SEC ID n° 43, y/o (e) el conector peptídico en (v) comprende una secuencia de aminoácidos tal como se indica en la SEC ID n° 46, y/o (f) el conector peptídico en (vi) comprende una secuencia de aminoácidos tal como se indica en la SEC ID n° 47.

9. Par de conectores peptídicos para la utilización en el método según cualquiera de las reivindicaciones 1 a 6, que comprende:

(1) un conector peptídico según se define en la reivindicación 7(i) y un conector peptídico según se define en la reivindicación 7(ii),

(2) un conector peptídico según se define en la reivindicación 7(iii) y un conector peptídico según se define en la reivindicación 7(iv), o

(3) un conector peptídico según se define en la reivindicación 7(v) y un conector peptídico según se define en la reivindicación 7(vi).

10. Polipéptido recombinante o sintético que comprende un polipéptido y un conector peptídico según se define en la reivindicación 7 o 8.

11. Polipéptido recombinante o sintético según la reivindicación 10, en el que dicho polipéptido comprende una secuencia de aminoácidos tal como se indica en cualquiera de las SEC ID n° 50 a 59, o una secuencia con una identidad de secuencia de por lo menos 70% respecto a la secuencia de aminoácidos indicada en cualquiera de las SEC ID n° 50 a 59, en el que dichos polipéptidos comprenden un conector peptídico según se define en la reivindicación 7 o 8.

12. Molécula de ácidos nucleicos codificante de un conector peptídico según se define en la reivindicación 7 o 8, o un polipéptido según se define en la reivindicación 10 o 11, opcionalmente en el que la molécula de ácidos nucleicos comprende una secuencia de nucleótidos tal como se indica en la SEC ID n° 3, 4, 7, 8, 11, 12, 40, 41, 44, 45, 48, 49 o 60 a 69 o una secuencia de nucleótidos con una identidad de secuencia de por lo menos 70% respecto a la secuencia indicada en cualquiera de las SEC ID n° 3, 4, 7, 8, 11, 12, 40, 41, 44, 45, 48, 49 o 60 a 69.

13. Proteína de fusión obtenida u obtenible a partir de un método según cualquiera de las reivindicaciones 1 a 6.

14. Utilización de por lo menos dos pares ortogonales de conectores peptídicos para la producción de una proteína de fusión, en la que cada par de conectores peptídicos reacciona formando un enlace isopeptídico, en el que los pares ortogonales de conectores peptídicos se seleccionan de cualquiera de entre:

en la que los pares ortogonales de conectores peptídicos comprenden (1) y (4), (1) y (5), (1) y (6), (1) y (3), (1) y (2), ( 2) y (5), (2) y (6), (3) y (5), (3) y (6), (4) y (5) o (4) y (6).

15. Utilización según la reivindicación 14, en la que la proteína de fusión y conectores peptídicos son tal como se define en cualquiera de las reivindicaciones 4, 7 o 8.