ES2930185T3 - Inteínas divididas, conjugados y usos de las mismas - Google Patents

Inteínas divididas, conjugados y usos de las mismas Download PDF

Info

Publication number
ES2930185T3
ES2930185T3 ES18192415T ES18192415T ES2930185T3 ES 2930185 T3 ES2930185 T3 ES 2930185T3 ES 18192415 T ES18192415 T ES 18192415T ES 18192415 T ES18192415 T ES 18192415T ES 2930185 T3 ES2930185 T3 ES 2930185T3
Authority
ES
Spain
Prior art keywords
intein
fragment
protein
seq
inteins
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES18192415T
Other languages
English (en)
Inventor
Tom W Muir
Miquel Vila-Perello
Zhihua Liu
Neel H Shah
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Princeton University
Original Assignee
Princeton University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Princeton University filed Critical Princeton University
Application granted granted Critical
Publication of ES2930185T3 publication Critical patent/ES2930185T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/18Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/62DNA sequences coding for fusion proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/93Ligases (6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/02Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/06Preparation of peptides or proteins produced by the hydrolysis of a peptide bond, e.g. hydrolysate products
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/50Fusion polypeptide containing protease site
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/90Fusion polypeptide containing a motif for post-translational modification
    • C07K2319/92Fusion polypeptide containing a motif for post-translational modification containing an intein ("protein splicing")domain

Abstract

En el presente documento se describen proteínas divididas, proteínas fusionadas de proteínas divididas y métodos de uso de proteínas divididas para purificar y modificar eficazmente proteínas de interés. (Traducción automática con Google Translate, sin valor legal)

Description

DESCRIPCIÓN
Inteínas divididas, conjugados y usos de las mismas
Antecedentes
El empalme de proteínas es un proceso postraduccional catalizado por una familia de proteínas conocidas como inteínas. (1) Durante este proceso, un dominio de inteína cataliza su propia escisión de una proteína precursora más grande y simultáneamente une las dos secuencias polipeptídicas flanqueantes (exteínas). Mientras que la mayoría de las inteínas catalizan el empalme en cis, existe un pequeño subconjunto de estas proteínas como dominios fragmentados de manera natural que se expresan por separado pero se asocian rápidamente y catalizan el empalme en trans. Dada su capacidad para crear y romper enlaces polipeptídicos (las inteínas se pueden considerar ligasas de proteínas), tanto las inteínas en empalmes en cis como en trans han encontrado un uso generalizado como herramientas biológicas químicas. (2)
A pesar del uso creciente de las inteínas en la biología química, su utilidad práctica se ha visto limitada por dos características comunes de la familia, a saber: (i) cinéticas lentas y (ii) eficacia dependiente del contexto con respecto a las secuencias de exteínas flanqueantes inmediatas. (3,4) Recientemente, se demostró que una inteína dividida de la cianobacteria Nostoc punctiforme (Npu) cataliza el empalme en trans de proteínas en el orden de un minuto, en lugar de horas como la mayoría de las inteínas de empalme en cis o trans. (5) Además, esta inteína fue ligeramente más tolerante de la variación de la secuencia en el resto 2 de C-exteína crítico que otras inteínas (6).
Además de este hallazgo, los siguientes documentos desvelan datos sobre las inteínas y sus usos. Neel H. Shah et al., (Journal of the American Chemical Society, 2012, vol. 134 n.° 28, páginas 11338-11341) desvela un análisis cinético de la familia de inteínas DnaE divididas y demuestra que algunas de estas inteínas pueden catalizar el empalme en trans de la proteína en decenas de segundos. El documento de patente WO 2009/132455 A1 revela métodos para producir proteínas de fusión que comprenden un fragmento N de inteína dividida y un polipéptido. Yang J et al. (PNAS, 2002, vol. 100, n.° 6, páginas 3513-3518) se refiere a proteínas de fusión entre una beta-glucuronidasa y fragmentos N y/o fragmentos C de una inteína DnaE de la cepa PCC6B03 de Synechocystis sp. Neel H. Shah et al. (Angewandte Chemie International Edition, 2011 vol. 50, n.° 29, páginas 6511-6515) desvela el uso de inteínas Nputs y una Npumut para la generación de la proteína de mamífero activa PARP1 de longitud completa a través de una unión de tres piezas en un solo paso y demuestra que las interacciones electrostáticas pueden generar control cinético en un sistema enzimático complejo. Por último, los documentos de patente WO2011057163 y CN101333555 desvelan proteínas de fusión entre un polipéptido y un fragmento N de inteína dividida y métodos para utilizar inteínas divididas en modificaciones de polipéptidos y los documentos de patente WO2013045632A1 y CN101281201A desvelan fragmentos C de inteína y métodos para utilizarlos.
Sin embargo, todavía existe una necesidad de inteínas divididas más robustas y más eficaces para su uso en una variedad de aplicaciones de purificación de proteínas y modificación de proteínas.
Sumario
La invención se refiere a un método que comprende
(a) poner en contacto (1) una proteína de fusión que comprende un polipéptido y un fragmento N de inteína dividida que comprende una secuencia seleccionada del grupo que consiste en la SEQ ID NO: 1-19, o una variante de la misma, en el que la variante comprende una secuencia seleccionada del grupo que consiste en la SEQ ID NO: 21-38 y 761 y (2) un fragmento C de inteína dividida que comprende una secuencia seleccionada del grupo que consiste en la SEQ ID NO: 57-74 y 708 o una variante de la misma, en la que la variante comprende una secuencia seleccionada del grupo que consiste en la SEQ ID NO: 75-128, 707 y 709-711;
en el que el contacto se realiza en condiciones que permiten la unión del fragmento N de la inteína dividida al fragmento C de la inteína dividida para formar un intermedio de inteína; y
(b) poner en contacto el intermedio de inteína con un nucleófilo para formar un conjugado de la proteína y el nucleófilo.
La invención se refiere a un complejo que comprende (i) una proteína de fusión que comprende un fragmento N de inteína dividida y un polipéptido, en el que el fragmento N de inteína dividida comprende una secuencia seleccionada del grupo que consiste en las SEQ ID NO: 6, 1-5, 7-38 y 761, y (ii) un fragmento C de intenína dividida que comprende una secuencia seleccionada del grupo que consiste en las s EQ ID NO: 57-128, 417-704, 707-711 o 745-759.
Breve descripción de los dibujos
La Figura 1 muestra el empalme en trans de las inteínas DnaE divididas. (a) Esquema que representa el empalme en trans de la proteína KanR con una secuencia de C-exteína local variable. (b) Eficacias relativas de empalme en trans in vivo a 30 °C con la secuencia de C-exteína "CFN" endógena y las secuencias "CGN", "CEN" y "CRN" exógenas. Los valores de CI50 (± SE, n = 3-4) se normalizan con respecto a las proteínas KanR intactas con el tripéptido de C-exteína apropiado.
La Figura 2 muestra las semividas in vitro de reacciones de empalme en trans. Los pares de inteínas divididas indicados fusionados con las exteínas modelo Ub o SUMO (Ub-IntN e IntC-SUMO) se mezclaron a 30 °C o 37 °C, y la formación de productos se controló con el tiempo mediante electroforesis en gel. (a) Las semividas se extrajeron de las curvas de progreso de la reacción ajustadas a una ecuación de velocidad de primer orden estándar (± SE, n = 3). Geles representativos de SDS-PAGE teñidos con Coomassie que muestran (b) empalme Ava rápido a 37 °C y (c) empalme Ssp ineficaz a 37 °C.
La Figura 3 muestra las relaciones de secuencia-actividad en las inteínas DnaE divididas. (a) Inteínas en orden de actividad de empalme in vivo con cortes seleccionados de la correspondiente alineación de secuencias múltiples. (b) Representación de la estructura Npu que resalta la proximidad de la posición 120 a los restos catalíticos terminales C1 y N137. (c) Análisis in vivo de la mutación C120G en la inteína Aha (± DE, n = 3). (d) Representación de la estructura Npu que resalta los restos catalíticos clave (barras) y las posiciones no catalíticas importantes (esferas) que modulan la actividad de Ssp. (e) Análisis in vivo de mutaciones puntuales de Ssp a Npu que mejoran la actividad de Ssp (± DE, n = 4). Hay que tener en cuenta que todas las numeraciones de restos corresponden a las posiciones relevantes en Npu según lo definido por la estructura de NMR (PDB: 2KEQ).(21)
La Figura 4 muestra versiones diseñadas de las inteínas DnaE ultrarrápidas que soportan la unión de proteínas expresada de manera eficaz. (a) Esquema que representa la formación del intermedio tioéster lineal y su uso para generar un a-tioéster de proteína para EPL. (b) Gel de SDS-PAGE teñido con Coomassie que muestra la tiólisis MESNa eficaz de la ubiquitina de una inteína AvaDnaE fusionada para producir el tioéster Ub-MES, 4. (c) Geles de SDS-PAGE fluorescentes que muestran la formación del producto ligado con Ub-CGK(Fluoresceína) (6) a partir de reacciones de tiólisis en un solo paso y de unión química nativa utilizando las inteínas indicadas. (d) Cromatografías de HPLC de fase inversa que muestran la dependencia del pH de las poblaciones relativas de precursor de amida (1) y tioéster lineal (2).
La Figura 5 muestra las alineaciones de secuencia de las inteínas DnaE divididas. La numeración sigue a la de Npu asignada para la estructura de NMR (PDB 2KEQ). Los restos catalíticos críticos están marcados con un asterisco.
La Figura 6 muestra los logotipos de secuencia para inteínas de alta y baja actividad. Las inteínas se clasifican según la actividad in vivo con una secuencia de C-exteína "CFN". Las inteínas de alta y baja actividad se distinguen en base a un valor de CI50 de 350 pg/ml de kanamicina, y la inteína Aha se incluye en el conjunto de alta actividad, dado que la mutación C120G restaura considerablemente la actividad alta.
La Figura 7 muestra la purificación de los a-tioésteres C-terminales utilizando inteínas divididas. A) Esquema de la purificación basada en inteína dividida de a-tioésteres de proteína C-terminales. B) Secuencia de NpuC TS y su mutante NpuC-AA que tiene un enlazador para inmovilizarlo sobre un soporte sólido (subrayado). Para los experimentos de tiólisis en solución, el resto de Cys C-terminal fue alquilado previamente con yodoacetamida.
La Figura 8 muestra la purificación de a-tioésteres de proteínas solubles utilizando la columna de afinidad NpuC-AA. A) Esquema de la estrategia de purificación utilizando inteína Npu DnaE dividida. B) Purificación de Ub-tioéster (Ub-COSR) a partir de lisados celulares. C) Purificación de MBP-tioéster (MBP-COSR) a partir de lisados celulares. Ambas purificaciones se monitorizaron mediante análisis SDS PAGE teñido con Coomassie (arriba) o transferencia de Western utilizando un anticuerpo a-His.
La Figura 9 muestra el análisis RP-HPLC y MS de los a-tioésteres Ub y MBP. A) El análisis RP-HPLC (arriba) y MS (abajo) de Ub-COSR se eluyó a partir de la columna NpuC-AA. B) El análisis RP-HPLC (arriba) y MS (abajo) de MBP-COSR se eluyó a partir de la columna NpuC-AA.
La Figura 10 muestra el efecto del resto -1 sobre la eficacia de la tiólisis en resina. Se expresaron 20 proteínas Ub-NpuN diferentes que contenían cada uno de los 20 aminoácidos proteinogénicos en el extremo C de Ub (resto -1) y se purificaron sobre columnas NpuC-AA. Los rendimientos de escisión de la columna NpuC-AA se estimaron mediante electroforesis en gel y las cantidades de tioéster frente a reacciones secundarias (principalmente hidrólisis) se determinaron mediante análisis RP-HPLC y MS.
La Figura 11 muestra la purificación del a-tioéster H2B(1-116) en condiciones de desnaturalización. A) Análisis SDS PAGE de la purificación del a-tioéster H2B(1-116) sobre la columna NpuC-AA en presencia de urea 3 M. El análisis RP-HPLC (B) y MS (C) de E1 a partir del panel A confirmó la presencia del tioéster H2B deseado.
La Figura 12 muestra la purificación de los tioésteres aDEC expresados en células 293T utilizando la columna de inteína dividida. A) Los niveles de expresión de aDEC se fusionaron con diferentes inteínas en las células 293T.
B) Purificación del a-tioéster aDEC a través de la columna de afinidad NpuC-AA. C) Ligadura de proteínas expresadas (EPL, de sus siglas en inglés) de aDEC-tioéster con un Cys N-terminal que contiene péptido fluorescente.
La Figura 13 muestra la EPL directamente utilizando tioésteres eluidos con columna IntC Análisis RP-HPLC (gradiente B al 30-73 %, detección de 214 nm y 440 nm) y MS de las reacciones entre el péptido H-CGK(Fl)-NH2 y los tioésteres MES MBP (A) y PHPT1 (B), purificados de E. coli utilizando la columna IntC
La Figura 14 muestra un experimento de purificación/ligación en un solo paso de ubiquitina al péptido H-CGK(Fluoresceína)-NH2 (CGK(Fl)). Se unió Ub-NpuN a partir de los lisados celulares de E. coli a la columna IntC, y después de la eliminación de contaminantes a través de lavados extensos, la escisión de inteína y la ligadura se activaron mediante la adición de MES 200 mM y péptido CGK(Fl) 1 mM. Análisis de SDS-PAGE teñido con Coomassie y en gel fluorescente de la purificación/ligadura (izquierda). RP-HPLC (detección a 214 y 440 nm) y ESI-TOF MS (derecha) de las fracciones eluidas confirman que la proteína ligada deseada se obtuvo en un paso directamente a partir de los lisados celulares con un rendimiento de ligamiento cercano al 95 % (cuantificado mediante RP-h PlC).
La Figura 15 muestra la semisíntesis de H2B-K120Ac en condiciones de desnaturalización. A) Análisis de SDS-PAGE teñido con Coomassie de la generación de a-tioéster H2B(1-116) en presencia de urea 2 M (sup: sobrenadante de lisado celular, trit: lavado de triton al 1 % de los cuerpos de inclusión, inp: cuerpos de inclusión solubilizados utilizados como entrada para la columna IntC). E1-E6 se agruparon, se concentraron a 150 pM y se ligaron al péptido H-CVTK(Ac)YTSAK-OH a 1 mM durante 3 horas a la temperatura ambiente. B) RP-h PlC (izquierda) de la mezcla de reacción de ligación y MS (derecha) del producto H2B-K120Ac ligado.
La Figura 16 muestra la caracterización de aDEC205 ligado al péptido H-CGK(Fluoresceína)-NH2 (CGK(Fl)). Las fracciones de elución de la columna NpuC que contenían el tioéster aDEC205-MES se concentraron a 20 pM y se ligaron al péptido fluorescente CGK(Fl) a 1 mM durante 48 horas a temperatura ambiente. A) El análisis por MS ESI-TOF de HC desglicosilado y totalmente reducido después de la ligadura, muestra que el 75 % de los HC están marcados. Masa esperada para el producto de ligadura = 50221,2 Da. HC libre = 49575,0 Da. B) Análisis SEC-MALS del anticuerpo ligado que muestra que conserva su estructura tetramérica después de la tiólisis y la ligadura (MW = 151 kDa, MW calc = 148 kDa). C) Unión de aDEC205-CGK(Fl) al receptor d Ec 205. Unión dependiente de la dosis de aDEC205-CGK(Fl) (izquierda) o un anticuerpo control a-DEC205 (derecha) a células CHO que expresan el receptor DEC205 de ratón monitoreado mediante citometría de flujo utilizando una a-IgG de ratón marcada con PE. La unión para controlar las células CHO/NEO, que no expresan el receptor, se muestra en gris.
La Figura 17 muestra la purificación de los tioésteres aDEC expresados en células CHO utilizando la columna de inteína dividida. Arriba) Gel de SDS PAGE teñido con Coomassie de la purificación del tioéster aDEC-MES a partir de células CHO utilizando una columna NpuC. Abajo) Análisis de transferencia Western de la misma purificación.
La Figura 18 muestra la purificación de los tioésteres aDEC utilizando una columna de la inteína divida AvaC y el análisis de transferencia Western de la purificación de los tioésteres aDEC a partir de sobrenadantes de células de mamíferos utilizando una columna AvaC.
La Figura 19 muestra las pruebas de expresión del anticuerpo aDEC205 fusionado con la inteína dividida AvaN a través del extremo C de la cadena ligera del anticuerpo y el análisis de transferencia Western de los sobrenadantes de células CHO que expresan la fusión aDEC205-AvaN en diferentes momentos.
Descripción detallada
De las aproximadamente 600 inteínas actualmente catalogadas, (7) menos del 5 % son inteínas divididas, principalmente de una familia conocida como las inteínas DnaE divididas de cianobacterias (8). Sorprendentemente, solo seis de estas, incluida Npu, se han analizado experimentalmente en alguna medida, (6,9,10) y solo Npu y su ortólogo de baja eficacia y ampliamente estudiado de PCC6803 de Synechocystis species (Ssp) se han caracterizado rigurosamente in vitro. (5,11)
Se realizó un estudio rápido de 18 inteínas DnaE divididas utilizando un método de selección in vivo para comparar con precisión las eficacias de las inteínas divididas (12,13). En este ensayo, los dos fragmentos de una inteína dividida se expresan conjuntamente en E. coli como fusiones a una enzima aminoglucósido fosfotransferasa (KanR) fragmentada. Tras el empalme en trans, la enzima activa se ensambla y las bacterias se vuelven resistentes al antibiótico kanamicina (Figura 1a). Las inteínas más activas confieren mayor resistencia a la kanamicina y, por lo tanto, tienen un mayor valor de CI50 para el crecimiento bacteriano en función de la concentración de kanamicina. Este ensayo se puede llevar a cabo en el fondo de diversas secuencias locales de C-exteína sin perturbar significativamente el intervalo dinámico. Dado que todas las inteínas DnaE empalman las mismas secuencias de exteínas locales en su contexto endógeno, esta prueba se llevó a cabo originalmente en un fondo de C-exteína de tipo silvestre (CFN) dentro de la enzima KanR. Como cabía esperar, las bacterias que expresaban la inteína Npu tenían una CI50 relativa alta, mientras que los clones que expresaban Ssp mostraron una resistencia pobre a la kanamicina. De manera destacable, más de la mitad de las proteínas DnaE mostraron una eficacia de empalme comparable a Npu in vivo a 30 °C (Figura 1b).
Para confirmar que los altos valores de CI50 observados in vivo reflejaron un rápido empalme en trans, se realizaron una serie de estudios cinéticos en condiciones estandarizadas in vitro. Para ello, se hicieron fragmentos de inteína DnaE dividida expresados y purificados individualmente para modelar los dominios de N- y C-exteína, ubiquitina y SUMO. Los restos de exteína local endógenos se conservaron como enlazadores entre los dominios de exteína y los fragmentos de inteína para recapitular un contexto de empalme de tipo salvaje. Los fragmentos de inteína afín se mezclaron a 1 j M, y la formación del producto empalmado Ub-SUMO a 30 °C y 37 °C se controló mediante electroforesis en gel. Estos ensayos validaron que las nuevas inteínas con alta actividad in vivo podrían catalizar el empalme en trans in vitro en decenas de segundos, sustancialmente más rápido que Ssp (Figura 2a). Curiosamente, todas las inteínas analizadas excepto Ssp mostraron tasas de empalme aumentadas a 37 °C. Además, todas las inteínas de empalme rápido mostraron niveles bajos de reacciones secundarias no detectables (Figura 2b), de nuevo en contraste con la Ssp (Figura 2c).
Se investigó la tolerancia de las inteínas divididas a la variación de la secuencia de C-exteína. Previamente, se notaba que la sensibilidad de las inteínas DnaE cambiaba en la posición 2 en la C-exteína. (6,12) Por lo tanto, todas las inteínas DnaE divididas se analizaron en presencia de una glicina 2 (CGN), ácido glutámico (CEN) o arginina (CRN) en el ensayo de selección in vivo (Figura 1b). Al igual que Npu y Ssp, la mayoría de las inteínas mostraron una disminución drástica de la actividad en presencia de las tres mutaciones 2. De los aminoácidos probados, el ácido glutámico fue mejor tolerado por cada inteína, lo que sugiere un mecanismo conservado para acomodar una carga negativa en esta posición. Para evaluar con mayor precisión la magnitud del efecto de las mutaciones de C-exteína en el empalme en trans, las inteínas Npu, Cra(CS505) e Cwa se analizaron in vitro en presencia de una glicina 2. Las tres de estas reacciones se caracterizaron por la rápida acumulación de productos intermedios de tioéster, que se resolvieron lentamente durante decenas de minutos en el producto empalmado y el producto de escisión de N-exteína. De acuerdo con las observaciones informadas anteriormente, estos datos indican que las inteínas DnaE divididas requieren una masa estérica en la posición 2 para una resolución intermedia ramificada y un empalme eficaz. (12) Es importante mencionar que las inteínas Cra(CS505) y Cwa mostraron una mayor promiscuidad de C-exteína in vivo, mientras que Ssp(PCC7002) no toleró ninguna de las mutaciones probadas. Esto demuestra que la variación de la secuencia sutil entre las inteínas divididas puede permitir la promiscuidad diferencial. Por tanto, esta propiedad puede optimizarse aún más a través de la evolución dirigida (12) o el diseño racional.
Estos datos indican que las inteínas DnaE divididas son altamente divergentes en actividad, a pesar de que todas han evolucionado para catalizar el empalme en trans en sustratos virtualmente idénticos. Curiosamente, los restos catalíticos clave involucrados en el empalme se conservan en toda la familia (Figura 5). Por tanto, los restos que afectan la actividad de empalme no son catalíticos y quizás solo se conservan moderadamente. Las mediciones de la actividad relativa pueden facilitar el descubrimiento de características de secuencia específicas que diferencian las inteínas de actividad alta de las ineficaces. De hecho, el análisis de homología de secuencia indica que las inteínas con alta actividad son más homólogas entre sí que las inteínas de baja actividad. Un valor atípico significativo para esta observación es la inteína de Aphanothece halophytica (Aha), que a pesar de tener más del 65 % de identidad de secuencia con las inteínas de alta actividad, estaba inactiva con el motivo de C-exteína "CFN" de tipo silvestre in vivo. Una inspección más cercana de una alineación de secuencia múltiple indicó que esta inteína tiene una cisteína no catalítica (posición 120) en lugar de una glicina que de otra manera sería absolutamente conservada (Figura 3a). Además, esta posición está cerca del sitio activo de inteína, donde un nucleófilo adicional puede facilitar reacciones secundarias indeseables (Figura 3b). De manera gratificante, la mutación de esta cisteína a glicina restableció una alta actividad en la inteína Aha mientras que la mutación inversa destruyó la actividad de empalme de Npu (Figura 3c), validando la capacidad predictiva de estos datos.
Un análisis adicional de la alineación de la secuencia de inteína dividida indicó que varias posiciones tienen una fuerte conservación de aminoácidos entre las inteínas de alta actividad, pero divergen para las inteínas de baja actividad (Figuras 3a, 6). Estos pueden ser sitios donde las inteínas rápidas han retenido interacciones beneficiosas que se han perdido en las lentas. Para analizar esta idea, se eligieron varias posiciones donde esta correlación secuenciaactividad fue evidente y reemplazó el resto en Ssp con el aminoácido correspondiente encontrado en las inteínas rápidas. De acuerdo con esta hipótesis, varias mutaciones puntuales aumentaron la actividad de Ssp in vivo (Figuras 3e). Si bien los roles específicos de estos restos no están explícitamente claros, especialmente dado que se encuentran fuera del sitio activo (Figura 3d), sus ubicaciones en el pliegue interior (14) pueden proporcionar información sobre su función. Por ejemplo, en la posición 56, se prefiere un resto aromático en las inteínas de alta actividad. Esta posición es adyacente al motivo TXXH catalítico conservado (posiciones 69-72), y un resto aromático puede facilitar las interacciones de empaquetamiento para estabilizar esos restos. De manera similar, se prefiere un glutamato en la posición 122, proximal a la histidina catalítica 125. El glutamato en la posición 89 está involucrado en un grupo de iones íntimos que previamente se demostró que es importante para estabilizar el complejo de inteína dividida. (13) Es interesante que, E23 está lejos del sitio catalítico y no tiene un papel estructural evidente. Esta posición es posiblemente importante para la estabilidad o la dinámica del pliegue, como se ha observado anteriormente para activar mutaciones puntuales en otras inteínas. (15,16)
El descubrimiento de nuevas inteínas de empalme en trans rápido tiene amplias implicaciones para la química de proteínas. De hecho, el descubrimiento de Npu alimentó un resurgimiento en la utilización de tecnologías basadas en inteínas divididas. (13,17,18) Si bien ninguna inteína individual puede ser ideal para cada esfuerzo de química proteica, la disponibilidad de varias inteínas divididas de empalme rápido nuevas puede proporcionar opciones para mejorar la eficacia de la mayoría de las aplicaciones de empalme en trans. Por ejemplo, un problema común al trabajar con inteínas divididas es el bajo rendimiento de expresión o la escasa solubilidad de una fusión de fragmentos de inteína con una proteína de interés. De hecho, los esfuerzos de sobreexpresión y purificación aquí muestran que las fusiones Ub-IntN e IntC-SUMO tienen rendimientos de expresión soluble notablemente diferentes, dependiendo de la inteína. Por tanto, una lista corta de inteínas divididas altamente activas con comportamiento variable servirá como punto de partida para la optimización empírica de una aplicación de empalme en trans dada.
Además, los fragmentos de las diferentes inteínas divididas de empalme rápido se pueden mezclar como pares no afines y aún conservan una actividad de empalme altamente eficaz, expandiendo aún más las opciones disponibles para cualquier aplicación de empalme en trans. Por ejemplo, la inteína dividida del fragmento N de Npu o variante del mismo puede unirse al fragmento C de Npu o variante del mismo o cualquiera de los otros fragmentos C de inteína dividida o variantes que se describen a continuación. De manera similar, el fragmento N de Ssp o variante del mismo puede unirse al fragmento C de Ssp o variante del mismo o cualquiera de los otros fragmentos C de inteína dividida o variantes de los mismos que se describen a continuación; el fragmento N de Aha o variante del mismo puede unirse al fragmento C de Aha o variante del mismo o cualquiera de los otros fragmentos C de inteína dividida o variantes de los mismos que se describen a continuación; el fragmento N de Aov o variante del mismo puede unirse al fragmento C de Aov o variante del mismo o cualquiera de los otros fragmentos C de inteína dividida o variantes de los mismos que se describen a continuación; el fragmento N de Asp o variante del mismo puede unirse al fragmento C de Asp o variante del mismo o cualquiera de los otros fragmentos C de inteína dividida o variantes de los mismos que se describen a continuación; el fragmento N de Ava o variante del mismo puede unirse al fragmento C de Ava o variante del mismo o cualquiera de los otros fragmentos C de inteína dividida o variantes de los mismos que se describen a continuación; el fragmento N de Cra(CS5505) o variante del mismo puede unirse al fragmento C de Cra(CS5505) o variante del mismo o cualquiera de los otros fragmentos C de inteína dividida o variantes de los mismos que se describen a continuación; el fragmento N de Csp(CCY0110) o variante del mismo puede unirse al fragmento C de Csp(CCY0110) o variante del mismo o cualquiera de los otros fragmentos C de inteína dividida o variantes de los mismos que se describen a continuación; el fragmento N de Csp(PCC8801) o variante del mismo puede unirse al fragmento C de Csp(PCC8801) o variante del mismo o cualquiera de los otros fragmentos C de inteína dividida o variantes de los mismos que se describen a continuación; el fragmento N de Cwa o variante del mismo puede unirse al fragmento C de Cwa o variante del mismo o cualquiera de los otros fragmentos C de inteína dividida o variantes de los mismos que se describen a continuación; el fragmento N de Maer(NIES843) o variante del mismo puede unirse al fragmento C de Maer(NIES843) o variante del mismo o cualquiera de los otros fragmentos C de inteína dividida o variantes de los mismos que se describen a continuación; el fragmento N de Mcht(PCC7420) o variante del mismo puede unirse al fragmento C de Mcht(PCC7420) o variante del mismo o cualquiera de los otros fragmentos C de inteína dividida o variantes de los mismos que se describen a continuación; el fragmento N de Oli o variante del mismo puede unirse al fragmento C de Oli o variante del mismo o cualquiera de los otros fragmentos C de inteína dividida o variantes de los mismos que se describen a continuación; el fragmento N de Sel(PC7942) o variante del mismo puede unirse al fragmento C de Sel(PC7942) o variante del mismo o cualquiera de los otros fragmentos C de inteína dividida o variantes de los mismos que se describen a continuación; el fragmento N de Ssp(PCC7002) o variante del mismo puede unirse al fragmento C de Ssp(PCC7002) o variante del mismo o cualquiera de los otros fragmentos C de inteína dividida o variantes de los mismos que se describen a continuación; el fragmento N de Tel o variante del mismo puede unirse al fragmento C de Tel o variante del mismo o cualquiera de los otros fragmentos C de inteína dividida o variantes de los mismos que se describen a continuación; el fragmento N de Ter o variante del mismo puede unirse al fragmento C de Ter o variante del mismo o cualquiera de los otros fragmentos C de inteína dividida o variantes de los mismos que se describen a continuación; y el fragmento N de Tvu o variante del mismo puede unirse al fragmento C de Tvu o variante del mismo o cualquiera de los otros fragmentos C de inteína dividida o variantes de los mismos que se describen a continuación.
La tecnología basada en inteínas más ampliamente utilizada, la ligación de proteínas expresadas, explota las inteínas que actúan como c/s para generar derivados a-tioéster de proteínas recombinantes. (2) En principio, cualquier inteína dividida se puede fusionar artificialmente y luego utilizarse como una inteína de empalme en cis en esta aplicación (1 en la Figura 4a). Las inteínas divididas ultrarrápidas son especialmente atractivas en este sentido debido a su velocidad y eficacia. Para analizar esta noción, se generaron variantes fusionadas artificialmente de Npu, Ava y Mcht con un dominio de ubiquitina N-terminal. Para evitar el empalme, se mutaron a Ala una escisión C-terminal prematura o altos niveles no deseados de restos de hidrólisis competitivos Asn137 y Cys+1. Tras la reacción con el tiol 2-mercaptoetanosulfonato de sodio exógeno (MESNa), las inteínas DnaE fusionadas se escindieron rápidamente para generar el a-tioéster de ubiquitina, 4, en unas pocas horas (Figuras 4b). Por el contrario, la tiólisis MESNa de la inteína MxeGyrA utilizada comúnmente no se completó incluso después de un día en condiciones idénticas. Las inteínas DnaE fusionadas fueron lo suficientemente rápidas para permitir una reacción de tiólisis en un solo paso y de ligación química nativa con un péptido fluorescente que contiene cisteína N-terminal, 5, para dar la proteína semisintética 6 (Figura 4c). Además, estas inteínas podrían utilizarse para generar eficazmente los a-tioésteres de otros cuatro dominios de proteínas estructuralmente únicos con diferentes restos de aminoácidos C-terminales. Estos resultados demuestran que las versiones fusionadas de las inteínas DnaE divididas serán de utilidad general para la semisíntesis de proteínas.
La rápida tasa de tiólisis observada para las inteínas DnaE fusionadas tiene implicaciones mecanicistas y prácticas. Sin pretender quedar ligados a teoría alguna, una posible explicación para su reactividad mejorada sobre la inteína MxeGyrA es que estas inteínas impulsan la reacción de cambio de acilo N a S de manera más eficaz, generando una población más grande de las especies reactivas de tioéster lineal 2 (Figura 4a). En general, se piensa que este intermedio tioéster está poblado de manera transitoria en el empalme de proteínas y, por lo que sabemos, nunca se ha observado directamente. (1) Sorprendentemente, al analizar las fusiones de inteína DnaE-ubiquitina mediante HPLC de fase inversa, se observaron, a menudo, dos picos principales y un tercer pico menor, todos con la misma masa. La abundancia relativa de estas especies podría modularse desplegando las proteínas o mediante cambios en el pH, y las dos especies principales se poblaron casi por igual desde pH 4-6 (Figura 4d). Los picos principales corresponden probablemente a la amida precursora, 1, y al tioéster lineal, 2, y al pico menor como el intermedio tetraédrico de oxitiazolidina. De manera importante, solo se observó un pico de HPLC para la fusión ubiquitina-MxeGyrA en condiciones idénticas. Estas observaciones, junto con las tasas de tiólisis mejoradas, apoyan firmemente la idea de que estas inteínas DnaE tienen una unión de empalme N-terminal hiperactivada.
Se han caracterizado las actividades de empalme en una familia entera de inteínas divididas. El empalme en trans de proteínas ultrarrápido puede ser la norma, y no la excepción, en esta familia. Además, las diferentes inteínas divididas tienen diferentes grados de tolerancia para las mutaciones de C-exteína, lo que sugiere que el empalme de proteínas sin rastro se puede lograr mediante el diseño modestamente de cualquier inteína altamente activa. Se puede utilizar una comparación minuciosa de las actividades de una pequeña familia de proteínas homólogas para identificar posiciones no catalíticas importantes que modulan la actividad. Por último, mediante la fusión artificialmente de fragmentos de inteína DnaE dividida, se han proporcionado nuevos constructos para la síntesis eficaz de a-tioésteres de proteína utilizados en la ligadura de proteínas expresadas. Estos resultados guiarán el desarrollo de tecnologías mejoradas de química de proteínas y deberían sentar las bases hacia una comprensión más fundamental de un empalme de proteínas eficaz.
Proteínas de fusión de fragmento N de inteína dividida (no incluido en la invención reivindicada)
En el presente documento se desvelan proteínas de fusión de un polipéptido y un fragmento N de inteína dividida. Como se utiliza en el presente documento, el término "polipéptido" se refiere a cualquier polímero a base de aminoácidos, intercambiable denominado "proteína", y puede incluir glicoproteínas y lipoproteínas. En algunos casos, el polipéptido es un polipéptido excretado de una célula (por ejemplo, una célula de mamífero). En varios casos, el polipéptido es un anticuerpo o un fragmento del mismo. El polipéptido puede ser cualquier polipéptido de interés de origen natural o sintético, incluyendo polipéptidos que tengan uno o más restos de aminoácidos distintos de los 20 aminoácidos de origen natural.
En algunos casos, el polipéptido tiene un peso molecular de 45 kDa o superior, 50 kDa o superior, 60 kDa o superior, 75 kDa o superior, 100 kDa o superior, 120 kDa o superior o 150 kDa o superior. El polipéptido puede ser, por ejemplo, un anticuerpo o un fragmento del mismo. En casos de anticuerpos, el fragmento N de inteína dividida se puede fusionar con una o ambas de las cadenas pesadas, y/o con una o ambas de las cadenas ligeras. En algunos casos, el polipéptido es una proteína secretada de una célula, por ejemplo, una célula de mamífero.
El fragmento N de inteína dividida comprende una secuencia como se muestra en la Figura 5, por ejemplo, Npu (SEQ ID NO: 1), Ssp (SEQ ID NO: 2), Aha (SEQ ID NO: 3), Aov (SEQ ID NO: 4), Asp (SEQ ID NO: 5), Ava (SEQ ID NO: 6), Cra(CS505) (SEQ ID NO: 7), Csp(CCY0110) (SEQ ID NO: 8), Csp(PCC8801) (SEQ ID NO: 9), Cwa (SEQ ID NO: 10), Maer(NIES843) (SEQ ID NO: 11), Mcht(PCC7420) (SEQ ID NO: 12), Oli (SEQ ID NO: 13), Sel(PC7942) (SEQ ID NO: 14), Ssp(PCC7002) (SEQ ID NO: 15), Tel (SEQ ID NO: 16), Ter (SEQ ID NO: 17), Tvu (SEQ ID NO: 18), o una variante del mismo. En algunos casos, la secuencia del fragmento N de inteína dividida comprende una secuencia distinta de Npu (SEQ ID NO: 1) o Ssp (SEQ ID NO: 2), y en otros casos, comprende una secuencia distinta de Npu (SEQ ID NO: 1), Ssp (SEQ ID NO: 2), o Aha (SEQ ID NO: 3). En algunos casos específicos, la secuencia del fragmento N de inteína dividida comprende una secuencia de Ava (SEQ ID NO: 6), Cra (Se Q ID NO: 7), Csp(PCC8801) (SEQ ID NO: 9), Cwa (SEQ ID NO: 10), Mcht(PCC7420) (SEQ ID NO: 12), Oli (SEQ ID NO: 13), Ter (SEQ ID NO: 17) y Tvu (SEQ ID NO: 18). En algunos casos, el fragmento N de inteína dividida tiene una secuencia que comprende una secuencia consenso de SEQ ID NO: 19: (CLSYDTEILTVEYGAVPIGKIVEENIECTVYSVDENGFVYTQPIAQWHDRGEQEVFEYCLEDGSTIRATKDHKFMTED GEMLPIDEIFEQGLDLKQVKGLPD).
Como se utiliza en el presente documento, una variante de un fragmento N de inteína dividida es un fragmento N de inteína dividida mutada como se describe en el presente documento que mantiene la actividad del fragmento N de inteína dividida (por ejemplo, su capacidad para unirse a un fragmento C de inteína dividida y/o catalizar el ataque nucleófilo del polipéptido fusionado a él). Las variantes contempladas de los fragmentos N de inteína dividida desvelados en el presente documento incluyen la mutación de uno o más restos C, excepto para Cys1, a un resto alifático, como A, I, L o F, o a un resto S. Una de dichas variantes contempladas es un Npu mutante con Cys28 y Cys59 mutado a Ser, SEQ ID NO: 20 (CLSYETEILTVEYGLLPIGKIVEKRIESTVYSVDNNGNIYTQPVAQWHDRGEQEVFEYSLEDGSLIRATKDHKFMTVDG QMLPIDEIFERELDLMRVDNLPN).
Fragmentos C de inteínas divididas mutados y unión a un soporte (no incluido en la invención reivindicada)
Los fragmentos C de inteína dividida desvelados en el presente documento se mutan de las secuencias de origen natural para mutar los restos N137 y C+1 en un resto distinto de Asn o Gln para N137 y un resto distinto de Cys para C+1 (s Eq ID NO: 129-146). En algunos casos, las mutaciones en estas dos posiciones son a un resto hidrófobo, por ejemplo, que no contiene un tiol SH (Cys) libre, un ácido carboxílico (Asp, Glu) o una base (Arg, His, Lys) u otro grupo no deseado (por ejemplo, Asn, Gln) en la cadena lateral. En varios casos, los dos restos alifáticos mutados pueden ser iguales o diferentes y pueden ser A, V, I, S, M, H, L, F, Y, G o W o pueden ser un resto de aminoácido alifático no natural (por ejemplo, no codificado por el código genético), como norleucina, ácido 2-aminobutírico, nor-valina, ácido 2-aminopentoico o ácido 2-aminohexaanoico (SEQ ID NO: 219-236). Se contemplan específicamente mutaciones donde ambos restos se seleccionan de A, I, V, L, Y, G y F (SEQ ID NO: 309-326). En varios casos, al menos uno de los dos restos mutados es A.
Por tanto, en el presente documento se proporciona un fragmento C de inteína dividida mutado que comprende una mutación en N137 y Cys+1 de Npu (SEQ ID NO: 129, 147, 165, 183, 201,219, 237, 255, 273, 291, 309, 327, 345, 363, 381 y 399), Ssp (SEQ ID NO: 130, 148, 166, 184, 202, 220, 238, 256, 274, 292, 310, 328, 346, 364, 382 y 400), Aha (SEQ ID NO: 131, 149, 167, 185, 203, 221,239, 257, 275, 293, 311, 329, 347, 365, 383 y 401), Aov (SEQ ID NO: 132, 150, 168, 186, 204, 222, 240, 258, 276, 294, 312, 330, 348, 366, 384 y 402), Asp (SEQ ID NO: 133, 151, 169, 187, 205, 223, 241, 259, 277, 295, 313, 331, 349, 367, 385 y 403), Ava (SEQ ID NO: 134, 152, 170, 188, 206, 224, 242, 260, 278, 296, 314, 332, 350, 368, 386 y 404), Cra(CS505) (SEQ ID NO: 135, 153, 171, 189, 207, 225, 243, 261,279, 297, 315, 333, 351, 369, 387 y 405), Csp (CCY0110) (SEQ ID NO: 136, 154, 172, 190, 208, 226, 244, 262, 280, 298, 316, 334, 352, 370, 388 y 406), Csp(PCC8801) (SEQ ID NO: 137, 155, 173, 191, 209, 227, 245, 263, 281, 299, 317, 335, 353, 371, 389 y 407), Cwa (SEQ ID NO: 138, 156, 174, 192, 210, 228, 246, 264, 282, 300, 318, 336, 354, 372, 390 y 408), Maer(NIES843) (SEQ ID NO: 139, 157, 175, 193, 211,229, 247, 265, 283, 301, 319, 337, 355, 373, 391 y 409), Mcht(PCC7420) (SEQ ID NO: 140, 158, 176, 194, 212, 230, 248, 266, 284, 302, 320, 338, 356, 374, 392 y 410), Oli (SEQ ID NO: 141, 159, 177, 195, 213, 231,249, 267, 285, 303, 321, 339, 357, 375, 393 y 411), Sel(PC7942) (SEQ ID NO: 142, 160, 178, 196, 214, 232, 250, 268, 286, 304, 322, 340, 358, 376, 394 y 412), Ssp(PCC7002) (SEQ ID NO: 143, 161, 179, 197, 215, 233, 251, 269, 287, 305, 323, 341, 359, 377, 395 y 413), Tel (SEQ ID NO: 144, 162, 180, 198, 216, 234, 252, 270, 288, 306, 324, 342, 360, 378, 396 y 414), Ter (SEQ ID NO: 145, 163, 181, 199, 217, 235, 253, 271, 289, 307, 325, 343, 361, 379, 397 and 415), o Tvu (SEQ ID NO: 146, 164, 182, 200, 218, 236, 254, 272, 290, 308, 326, 344, 362, 380, 398 y 416), donde la mutación en N137 y Cys+1 es un resto hidrófobo de origen natural o no natural. En algunos casos específicos, al menos una de las mutaciones es A (SEQ ID NO: 183-200, 255-272, 327-344, y 345-416) y en casos más específicos, ambas mutaciones son A (SEQ ID NO: 399-416).
Se puede utilizar una variedad de soportes. En general, el soporte sólido es un polímero o sustancia que permite el enlace del fragmento C de inteína dividida, opcionalmente a través de un enlazador. El enlazador puede ser restos de aminoácidos adicionales diseñados para el extremo C del fragmento C de inteína dividida o pueden ser otros enlazadores conocidos para la unión de un péptido a un soporte. Un enlazador contemplado es un péptido pequeño -SGGC (SEQ ID NO: 705), donde el tiol de la Cys C-terminal se puede utilizar para unir el fragmento C de inteína dividida al soporte. Por tanto, se contemplan específicamente los fragmentos C de inteína dividida mutados de las secuencias Npu, Ssp, etc. anotadas anteriormente que tienen un enlazador peptídico -SGGC (SEQ ID NO: 705) (por ejemplo, especificando los restos que comienzan en la posición N137: AAFN-SGGC) (SEQ ID NO:706). La longitud de un enlazador peptídico puede modificarse para proporcionar longitudes y flexibilidad variables en cualquier ubicación individual (por ejemplo, más de 2 restos de Gly). También será evidente que el resto del extremo C de un enlazador peptídico se puede modificar para introducir un grupo funcional reactivo apropiado para unir el fragmento C de inteína dividida a una superficie de elección (por ejemplo, Lys para reaccionar a través de una amina, Cys para reaccionar a través de un tiol, o Asp o Glu para reaccionar a través de un ácido carboxílico). También se contemplan otros restos de aminoácidos no naturales para su uso en un enlazador peptídico para proporcionar otras fracciones de grupos funcionales para permitir una química de unión diferente del fragmento C a un soporte de interés (por ejemplo, azida, alquinos, carbonilos, amino-oxi, ciano-benzotiazoles, tetrazoles, alquenos, haluros de alquilo). El enlazador puede ser alternativamente un enlazador polimérico.
Sobre la base de un análisis de las secuencias de los fragmentos C de inteína dividida altamente activos investigados, procede una secuencia consenso para el fragmento C de inteína dividida: SEQ ID NO: 707 (VKIISRQSLGKQNVYDIGVEKDHNFLLANGLIASN), así como una versión mutada en la que el N137 está mutado a otro que no sea Asn o Gln (SEQ ID NO: 708), o más específicamente, N137 se muta a un resto hidrófobo de origen natural o no natural, tal como A, V, I, M, H, L, F, Y, G, S, H o W o pueden ser un resto de aminoácido alifático no natural (por ejemplo, no codificado por el código genético), como norleucina, ácido 2-aminobutírico, nor-valina, ácido 2-aminopentanoico o ácido 2-aminohexanoico (SEQ ID NO: 709). Las mutaciones contempladas específicamente en N137 para las secuencias consenso incluyen A, I, V, L, Y, G, y F (SEQ ID NO: 710). También se contempla cuando N137 se muta a A (SEQ ID NO: 711).
También se contemplan variantes de la secuencia consenso que tiene un resto en la posición 1 que no sea Cys (SEQ ID NO: 712, 716, 720 y 724). Más específicamente, la posición 1 puede ser un resto hidrófobo de origen natural o no natural tal como A, V, I, M, H, L, F, Y, G, S, H o W o pueden ser un resto de aminoácido alifático no natural (por ejemplo, no codificado por el código genético), como norleucina, ácido 2-aminobutírico, nor-valina, ácido 2-aminopentanoico o ácido 2-aminohexanoico (SEQ ID NO: 713, 717, 721 y 725). Se contemplan específicamente la mutación en la posición 1 que se selecciona de A, I, V, L, Y, G y F (SEQ ID NO: 714, 718, 722 y 726). En varios casos, al menos una de los restos mutados de la secuencia consenso es A (SEQ ID NO: 715, 719 y 723). En algunos casos, la secuencia consenso del fragmento C tiene ambas mutaciones como Ala (SEQ ID NO: 727). Además, se contempla una secuencia consenso que comprende FN en las posiciones 2 y 3 (SEQ ID NO: 728-743). También se contempla una secuencia consenso que comprende un enlazador peptídico para unirse a un soporte sólido, y un ejemplo es -SGGC en las posiciones 4-+7 (SEQ ID NO: 744-759).
El fragmento C de inteína dividida o variante del mismo, como se desvela en el presente documento, puede unirse a un soporte sólido a través de un enlazador. En varios casos, el enlazador es un polímero, que incluye, pero no de forma limitativa, a un polímero soluble en agua, un ácido nucleico, un polipéptido, un oligosacárido, un hidrato de carbono, un lípido o combinaciones de los mismos. No es importante cuál es la estructura química del enlazador, ya que sirve principalmente como un enlazador. El enlazador debe elegirse para no interferir con la actividad del fragmento C. El enlazador puede estar formado por aminoácidos unidos entre sí mediante enlaces peptídicos. Por tanto, en algunos aspectos, el enlazador comprende Yn, en el que Y es un aminoácido de origen natural o un esteroisómero del mismo y "n" es uno cualquiera de 1 a 20. El enlazador, por lo tanto, puede estar formado por 1 a 20 aminoácidos unidos por enlaces peptídicos, en el que los aminoácidos se seleccionan entre los 20 aminoácidos de origen natural. En algunos casos, los 1 a 20 aminoácidos se seleccionan de Gly, Ala, Ser, Cys. En algunos casos, el enlazador está formado por una mayoría de aminoácidos que no tienen impedimentos estéricos, como Gly.
También son posibles enlazadores no peptídicos. Por ejemplo, se pueden utilizar enlazadores de alquilo tales como --HN-(CH2)s-CO--, en donde s = 2-20. Estos enlazadores de alquilo pueden estar además sustituidos por cualquier grupo que no sea estéricamente obstaculizado, tal como alquilo inferior (por ejemplo, C-i-Ca), halógeno (por ejemplo, Cl, Br), CN, NH2, fenilo, etc.
Otro tipo de enlazador no peptídico es un grupo de polietilenglicol, tal como: --HN-(CH2)2-(O-CH2-CH2)n-O-CH2-CO, en el que n es tal que el peso molecular total del enlazador varía de aproximadamente 101 a 5000, preferentemente de 101 a 500.
En algunos casos, el enlazador tiene una longitud de aproximadamente 0-14 subunidades (por ejemplo, aminoácidos).
En los casos en que el enlazador es un polinucleótido, la longitud del enlazador en varios aspectos es de al menos aproximadamente 10 nucleótidos, 10-30 nucleótidos, o incluso más de 30 nucleótidos. En diversos aspectos, las bases del enlazador polinucleotídico son todas adeninas, todas tirinas, todas citidinas, todas guaninas, todas uracilos o todas las otras bases modificadas.
En otro aspecto, un enlazador no nucleotídico desvelado comprende un nucleótido básico, poliéter, poliamina, poliamida, péptido, hidrato de carbono, lípido, polihidrocarburo, u otros compuestos poliméricos. Incluyen ejemplos específicos aquellos descritos por Seela y Kaiser, Nucleic Acids Res. 1990, 18:6353 and Nucleic Acids Res. 1987, 15:3113; Cload y Schepartz, J. Am. Chem. Soc. 1991, 113:6324; Richardson y Schepartz, J. Am. Chem. Soc. 1991, 113:5109; Ma et ál., Nucleic Acids Res. 1993, 21:2585 y Biochemistry 1993, 32:1751; Durand et al., Nucleic Acids Res.
1990, 18:6353; McCurdy et al., Nucleosides & Nucleotides 1991, 10:287; Jschke et al., Tetrahedron Lett. 1993, 34:301; Ono et al., Biochemistry 1991, 30:9914; Arnold et al., publicación internacional n.° WO 89/02439; Usman et al., publicación internacional n.° WO 95/06731; Dudycz et al., publicación internacional WO 95/11910 y Ferentz y Verdine, J. Am. Chem. Soc. 1991, 113:4000. Un "no nucleótido" significa además cualquier grupo o compuesto que pueda incorporarse en una cadena de ácido nucleico en lugar de una o más unidades de nucleótidos, incluidas las sustituciones de azúcar y/o fosfato, y permite que las bases restantes muestren su actividad enzimática. El grupo o compuesto puede ser abásico porque no contiene una base de nucleótidos comúnmente reconocida, como adenosina, guanina, citosina, uracilo o timina, por ejemplo, en la posición C1 del azúcar.
En diversos aspectos, los enlazadores contemplados incluyen polímeros lineales (por ejemplo, polietilenglicol, polilisina, dextrano, etc.), polímeros de cadena ramificada (véase, por ejemplo, la Patente de Estados Unidos 4.289.872 para Denkenwalter et al., publicada el martes, 15 de septiembre de 1981; la 5.229.490 para Tam, publicada el martes, 20 de julio de 1993; el documento WO 93/21259 de Frechet et al., publicado el 28 de octubre de 1993); lípidos; grupos de colesterol (como un esteroide); o hidratos de carbono u oligosacáridos. Otros enlazadores incluyen uno o más anexos de polímeros solubles en agua, tales como polioxietilenglicol o polipropilenglicol como se describe en las patentes de Estados Unidos números: 4.640.835, 4.496.689, 4.301.144, 4.670.417, 4.791.192 y 4.179.337. Otros polímeros útiles como enlazadores conocidos en la técnica incluyen monometoxi-polietilenglicol, dextrano, celulosa u otros polímeros basados en carbohidratos, poli-(N-vinilpirrolidona) polietilenglicol, homopolímeros de propilenglicol, un copolímero de óxido de polipropileno/óxido de etileno, polioles polioxietilados (por ejemplo, glicerol) y alcohol polivinílico, así como mezclas de estos polímeros.
En otros aspectos más, se contemplan oligonucleótidos tales como poli-A o polímeros hidrófilos o anfifílicos como enlazadores, que incluyen, por ejemplo, anfífilos (incluyendo oligonucleótidos).
Los soportes sólidos contemplados incluyen resinas, partículas y perlas. Los soportes sólidos más específicos incluyen polímeros polihidroxilados, por ejemplo, a base de polisacáridos, tales como agarosa, dextrano, celulosa, almidón, pullulan o similares, y polímeros sintéticos, tales como amida poliacrílica, amida polimetacrílica, poli(hidroxialquilvinil éteres), poli(hidroxialquilacrilatos) y polimetacrilatos (por ejemplo, poliglicidilmetacrilato), alcoholes polivinílicos y polímeros basados en estirenos y divinilbencenos, y copolímeros en los que se incluyen dos o más de los monómeros correspondientes a los polímeros mencionados anteriormente. Los soportes sólidos específicos contemplados incluyen agarosa, sefarosa, celulosa, poliestireno, polietilenglicol, agarosa derivatizada, acrilamida, sefadex, sefarosa, polietilenglicol (PEG)-acrilamida y soportes a base de poliestireno-PEG. En algunos casos, el soporte sólido puede ser una resina como la resina de p-metilbenzhidrilamina (pMBHA) (Peptides International, Louisville, Ky.), poliestirenos (por ejemplo, resina PAM obtenida de Bachem Inc., Peninsula Laboratories, etc.), que incluye clorometilpoliestireno, hidroximetilpoliestireno y aminometilpoliestireno, poli (dimetilacrilamida) y estireno co-divinil-benceno injertado (por ejemplo, resina POLYHIPE, obtenida de Aminotech, Canadá), resina de poliamida (obtenida de Peninsula Laboratories), resina de poliestireno injertada con polietilenglicol (por ejemplo, TENTAGEL o ARGOGEL, Bayer, Tubingen, Alemania) resina de polidimetilacrilamida (obtenida de Milligen/Biosearch, California) o Sepharose (Pharmacia, Suecia). En diversos aspectos, el soporte sólido puede ser una perla magnética, un portaobjetos de vidrio, una perla de vidrio, o una partícula de metal o inorgánica (por ejemplo, oro, sílice, hierro o mezclas de los mismos).
Métodos de purificación y modificación de polipéptidos
La modificación de proteínas específica del sitio es una herramienta inestimable para estudiar los detalles moleculares de la función de proteínas (19). Por otra parte, su potencial para el descubrimiento y desarrollo de terapias de proteínas también se ha reconocido recientemente (20). Se han desarrollado varios métodos a lo largo de los años para generar proteínas modificadas específicamente para el sitio; uno de los más utilizados es la ligadura de proteínas expresadas (EPL), que se ha aplicado a muchas proteínas diferentes en diversos estudios para abordar cuestiones fundamentales de la función de las proteínas. La EPL se describió por primera vez en 1998 (21), como una expansión a proteínas recombinantes de ligadura química nativa (NCL, de sus siglas en inglés) (19,22), y consiste en la reacción entre un atioéster de proteína recombinante C-terminal con un péptido sintético que contiene una Cys en su extremo N a través de la formación de un nuevo enlace peptídico nativo entre los dos fragmentos. La naturaleza sintética del péptido que contiene Cys permite la incorporación de casi cualquier modificación química en la proteína de interés.
Para aplicar EPL a cualquier proteína dada, la generación de tioésteres C-terminales de proteínas con buenos rendimientos y alta pureza es un requisito absoluto. Se ha utilizado una familia de enzimas de rotación única, llamadas inteínas, desde los albores de la EPL para la generación de tales tioésteres. Las inteínas son capaces de catalizar el empalme de proteínas, una modificación postraduccional que se produce de forma natural mediante la cual se escinden del polipéptido en el que están incrustadas, formando concomitantemente un nuevo enlace peptídico entre sus regiones de proteínas flanqueantes (23). De manera importante, esta reacción se produce a través de varios atioésteres de proteína, que pueden atraparse a través de una reacción de trans-tioesterificación con un tiol exógeno.
Las inteínas, como GyrA o VMA, se han aprovechado con éxito para preparar una amplia variedad de tioésteres de proteínas. Con el fin de aislar los tioésteres de proteína deseados, las inteínas se fusionan generalmente con marcadores de afinidad, como el dominio bidireccional de quitina o el marcador hexa-His. Sin embargo, a pesar del notable éxito de esta estrategia, las condiciones de reacción requeridas para la tiólisis eficaz (agentes reductores, gran concentración de tioles y largos tiempos de incubación) afectan el rendimiento de dichos marcadores y, a menudo, se requieren etapas de purificación adicionales posteriores para obtener el producto puro deseado para la ligadura (24­ 26). Por otra parte, dependiendo de la identidad del resto C-terminal de la proteína de interés, pueden ocurrir niveles significativos de escisión prematura in vivo, reduciendo significativamente el rendimiento del producto final.
Un sistema ideal debería combinar las capacidades de formación de tioéster de las inteínas con una estrategia de purificación por afinidad (totalmente compatible con las condiciones de reacción de la tiólisis) y reducir el riesgo de escisión prematura. Naturalmente, se investigaron las inteínas divididas, que pueden realizar una reacción análoga al empalme de proteínas, pero en la que la propia inteína se divide en dos polipéptidos diferentes. Cada uno de los dos fragmentos de inteína son completamente inactivos por sí mismos, pero tienen una fuerte afinidad entre sí y, al unirse, adoptan su conformación activa competente de empalme y son capaces de llevar a cabo el empalme en trans de la proteína. Recientemente, se ha informado una versión dividida artificialmente de la proteína DnaB para la purificación de proteínas no modificadas (27). Por tanto, se proporciona una estrategia de purificación utilizando inteínas naturalmente divididas en su lugar y para aprovecharlas para la purificación en un solo paso y la generación de atioésteres de proteína recombinantes (Figura 7) directamente de los lisados celulares.
Debido a las cinéticas de reacción extremadamente rápida de las inteínas naturalmente divididas, se introdujeron varias mutaciones para permitir la formación eficaz de tioéster y minimizar las reacciones de escisión in vivo e in vitro no deseadas. De manera específica, tanto los restos catalíticos C-terminal de C-inteínas Asn137 como Cys+1 tuvieron que mutarse a Ala para prevenir la escisión prematura del extremo C y N, respectivamente. También se espera que la mutación a dos restos alifáticos secuenciales, naturales o no naturales, produzca resultados comparables como la mutación AA. En los métodos de purificación y/o modificación descritos se pueden utilizar otros fragmentos C de inteína dividida mutados, como se describió anteriormente, y se contemplan específicamente.
Para desarrollar una estrategia de purificación y formación de tioéster basada en inteínas divididas, se eligió la inteína dividida Npu, que es una de las inteínas divididas DnaE más rápidas conocidas previamente [10]. Inicialmente, la capacidad de la Npu dividida para generar tioésteres de proteínas en solución se probó mezclando la proteína modelo ubiquitina fusionada a NpuN con un NpuC mutante (Asn137 y Cys+1 a Ala) en presencia (y ausencia) del tiol MESNa. El análisis de SDS PAGE, HPLC y MS de las reacciones mostró la formación del a-tioéster C-terminal de ubiquitina deseado en unas pocas horas. Alentado por estos resultados, se diseñó una estrategia de purificación por afinidad basada en la inmovilización covalente del mutante de inteína NpuC en un soporte sólido. La NpuC mutada inmovilizada se podría utilizar luego para purificar proteínas marcadas con NpuN a partir de mezclas complejas y la adición de un tiol exógeno escindiría el a-tioéster de proteína deseado, que se eluiría de la columna en una forma altamente purificada. Otros fragmentos N de inteína dividida, como se describe anteriormente, se pueden utilizar en los métodos desvelados en el presente documento, y se contemplan específicamente.
Se preparó un mutante NpuC (Asn137 y Cys+1 mutado a Ala, NpuC-AA (SEQ ID NO: 777) con un resto Cys en el extremo C de su C-exteína, que se utilizó para inmovilizar el péptido en un resina de yodoacetilo. Con la resina de afinidad NpuC-AA en la mano, se demostró que varios a-tioésteres de proteína C-terminal (Ubiquitina, MBP, PHPT1) podían producirse y purificarse fácilmente a partir de lisados celulares (Figura 8). El análisis de HPLC y MS confirmó la formación de los tioésteres de proteínas deseados con niveles muy bajos de hidrólisis no deseada (Figura 9). Los rendimientos de recuperación variaron entre el 75 y 95 % y la resina NpuC-AA tenía una capacidad de carga constante de 3-6 mg de proteína por ml.
La utilidad de los derivados de a-tioéster de Ub, MBP y PHPT1 obtenidos de la columna se demostró ligando cada uno de ellos a un péptido fluorescente que contenía Cys N-terminal (CGK(Fl)) para obtener los productos semisintéticos correspondientes en excelente rendimiento (Figura 13). De manera importante, se pueden llevar a cabo reacciones de tiólisis/ligamiento en un solo paso, que proporcionan una proteína modificada específicamente para el sitio directamente de los lisados celulares sin aislar el tioéster intermedio (Figura 14).
Una preocupación cuando se trabaja con inteínas divididas (y también inteínas) es el efecto de las secuencias de aminoácidos flanqueantes en la actividad de empalme y/o tiólisis. Aunque la unión N-terminal se considera más tolerante a las desviaciones de los restos de N-exteína nativos, fue importante evaluar el efecto que tendría el aminoácido C-terminal de la proteína de interés (resto -1 de acuerdo con las convenciones de numeración de inteínas) en los rendimientos de la formación de tioésteres. Se construyó una biblioteca completa de proteínas de fusión Ub-X-NpuN donde el resto (X) de Ub C-terminal se varió de su Gly nativo a todos los otros 19 aminoácidos proteinogénicos. Las proteínas se expresaron en E. coliy lisados celulares, se aplicaron a la resina de afinidad NpuC-AA y se purificaron. Los rendimientos de proteína se estimaron a partir del análisis SDS PAGE para cada purificación y los niveles de hidrólisis de análisis MS y RP-HPLC de las fracciones de elución (Figura 10). Los resultados muestran tendencias similares a las conocidas para inteínas no divididas, como GyrA (29), y la mayoría de los aminoácidos muestran altos rendimientos de escisión después de la incubación durante la noche con MESNa, con las excepciones Pro y Glu, para las cuales la recuperación fue del 49 y 50 %, respectivamente. Como cabía esperar, el a-tioéster de Asn no pudo aislarse debido a la reacción bien conocida de su cadena lateral con el a-tioéster adyacente para formar una succinimida.
Esta estrategia de purificación fue muy exitosa para la purificación de varias proteínas solubles en condiciones nativas. Sin embargo, los fragmentos de proteínas requeridos para la EPL a veces sufren de escasa solubilidad y alta toxicidad y tienden a acumularse en los cuerpos de inclusión celulares durante la expresión. Se ha demostrado que la inteína dividida Npu conserva un nivel significativo de actividad en presencia de desnaturalizantes (28), lo que sugiere que esta estrategia sería compatible en tales condiciones. Usando el modelo de fusión de proteínas Ub-NpuN, se confirmó que, tanto la unión a la resina NpuC-AA como la formación de tioéster, funcionaban bien en presencia de urea 2 y 4 M. Se obtuvieron niveles similares de ambos, unión y tiólisis, que en ausencia de desnaturalizante y las mismas condiciones de reacción.
A continuación se probó el sistema para la purificación a partir de cuerpos de inclusión de un fragmento de la histona H2B. La preparación de histonas modificadas específicamente para el sitio utilizando EPL es un tema de gran interés debido a su papel crucial en la comprensión de la regulación epigenética. Sin embargo, los fragmentos de histonas tienen un comportamiento notablemente deficiente y la preparación de sus a-tioésteres C-terminales recombinantes es particularmente difícil. Un fragmento H2B (1-116) fusionado a NpuN se expresó en E. coli y los cuerpos de inclusión se extrajeron con urea 6 M. La fusión H2B-NpuN se diluyó posteriormente en un tampón de urea 3 M y el correspondiente a-tioéster C-terminal generado concomitante con la purificación sobre la resina de afinidad NpuC-AA (Figura 11). Debido a su tendencia a la agregación, las soluciones de proteínas muy diluidas se unieron más eficazmente a la resina, y también se requirieron tiempos de reacción más largos para la generación eficaz del tioéster, obviamente, estos son parámetros que deberían optimizarse en una proteína a base de proteínas. Usando estas condiciones, se obtuvo tioéster C-terminal H2B (1-116) con excelente pureza (> 90 % mediante RP-HPLC) y rendimiento aislado (~ 20 mg por l de cultivo). Esto representa una mejora significativa con respecto a los protocolos anteriores que producen menos proteína (4 mg por l de cultivo) y requieren el uso de múltiples etapas de purificación cromatográfica, incluida la RP-HPLC. De manera importante, el tioéster H2B(1-116)-MES obtenido de la columna IntC se puede utilizar directamente en reacciones de EPL sin purificación adicional. Por consiguiente, la proteína se ligó con éxito a un péptido H2B sintético (117-125) que contenía una Lys acetilada en la posición 120 para producir H2B K120Ac semisintético (Figura 15).
El potencial de esta estrategia de purificación de la formación de tioésteres se demostró mediante la aplicación a la modificación específica del sitio de un anticuerpo monoclonal. Por tanto, se contempla específicamente un método para purificar un anticuerpo mediante la utilización de una proteína de fusión de un anticuerpo y un fragmento N de inteína dividida como se desvela en el presente documento y un fragmento C de inteína dividida mutado como se describe en el presente documento.
La modificación de los anticuerpos es un campo de investigación intensa, especialmente centrado en el desarrollo de conjugados de anticuerpos y fármacos terapéuticos (30). La identidad de la N-inteína podría tener un efecto significativo en los niveles de expresión de su fusión a una proteína de interés dada. El fragmento N de varias de las inteínas DnaE divididas más rápidas reaccionaron de forma cruzada con NpuC, lo que permite utilizar cualquiera de ellas con la misma columna de afinidad basada en NpuC. Por consiguiente, los niveles de expresión de un anticuerpo modelo (aDEC, anticuerpo contra el receptor DEC205) se analizaron y encontraron que los niveles más altos de expresión se obtuvieron cuando aDEC se fusionó con la inteína AvaN (Figura 12A). Las fusiones aDEC-AvaN se transfectaron en células 293T y, después de 4 días de cultivo, los sobrenadantes se recogieron y se purificaron sobre la columna NpuC-AA. La presencia de un tioéster C-terminal en el aDEC purificado se confirmó mediante su reacción con un péptido fluorescente corto con un resto Cys N-terminal (Figura 12b y C). Se utilizó MS del conjugado aDEC-fluoróforo desglicosilado y reducido para confirmar su identidad y SEC-MALS demuestra que el producto fue monodisperso y del tamaño esperado para un anticuerpo IgG.
Las inteínas divididas pueden diseñarse para la preparación de a-tioésteres de proteína y que la fuerte afinidad entre los dos fragmentos de inteína dividida proporciona un mango poderoso para su purificación. La generalidad del enfoque se demuestra al utilizarlo para generar tioésteres altamente puros de proteínas tanto solubles (ubiquitina, MBP, PHPT) e insolubles (fragmento H2B) como de anticuerpos monoclonales (aDEC). Por otra parte, varias N-inteínas se pueden analizar para niveles de expresión óptimos de la proteína de interés y utilizarse con una sola columna NpuC.
Por tanto, las inteínas divididas desveladas en el presente documento se pueden utilizar para purificar y modificar un polipéptido de interés. Se proporciona un polipéptido de interés en una proteína de fusión con un fragmento N de inteína dividida, por ejemplo, a través de métodos de proteína recombinante bien conocidos. La proteína de fusión luego se pone en contacto con un fragmento C de inteína dividida correspondiente en condiciones que permiten la unión del fragmento N y el fragmento C para formar un intermedio de inteína. El fragmento C de inteína dividida se puede unir a un soporte (por ejemplo, un soporte sólido como una resina) o posteriormente (por ejemplo, después de unirse al fragmento N de inteína dividida para formar el intermedio de inteína) puede unirse a un soporte. Esto permite la eliminación mediante el lavado de los componentes que estaban en la mezcla debido a la síntesis de proteínas recombinantes, lo que permite que la proteína de fusión se aísle de los otros componentes. Los lavados pueden incluir detergentes, agentes desnaturalizantes y soluciones salinas (por ejemplo, NaCl).
Después, el intermedio de inteína se puede hacer reaccionar con un nucleófilo para liberar el polipéptido de interés de las inteínas de los fragmentos N y C unidos en donde el extremo C del polipéptido se modifica por la adición del nucleófilo. El nucleófilo puede ser un tiol para obtener el polipéptido como un a-tioéster, que a su vez puede modificarse aún más, por ejemplo, con un nucleófilo diferente (por ejemplo, un fármaco, un polímero, otro polipéptido, un oligonucleótido) o cualquier otra fracción utilizando la bien conocida química del a-tioéster para la modificación de proteínas en el extremo C. Una ventaja de esta química es que solo el extremo C se modifica con un tioéster para una modificación adicional, permitiendo así una modificación selectiva solo en el extremo C y no en ningún otro resto ácido en el polipéptido.
El nucleófilo que se usa en los métodos desvelados en el presente documento con el intermedio de inteína o como un nucleófilo posterior que reacciona con, por ejemplo, un a-tioéster, puede ser cualquier compuesto o material que tenga una fracción nucleófila adecuada. Por ejemplo, para formar un a-tioéster, una fracción tiol se contempla como el nucleófilo. En algunos casos, el tiol es un 1,2-aminotiol o un 1,2-aminoselenol. Un a-selenotioester se puede formar usando un selenotiol (R-SeH). Los nucleófilos alternativos contemplados incluyen aminas (es decir, aminolisis para dar amidas directamente), hidrazinas (para dar hidrazidas), grupos amino-oxi (para dar ácidos hidroxámicos). De manera adicional, el nucleófilo puede ser un grupo funcional dentro de un compuesto de interés para la conjugación con el polipéptido de interés (por ejemplo, un fármaco para formar un conjugado proteína-fármaco) o, como alternativa, podría llevar un grupo funcional adicional para las siguientes reacciones bioortogonales conocidas, tales como una azida o un alquino (para una reacción química de clic entre los dos grupos de funciones para formar un triazol), un tetrazol, un a-cetoácido, un aldehído o cetona, o un cianobenzotiazol.
Los aspectos y detalles adicionales de la invención serán evidentes a partir de los siguientes ejemplos, que pretenden ser ilustrativos en lugar de limitativos.
Ejemplos
Materiales
Todas las sales tamponantes, isopropil-p-D-tiogalactopiranósido (IPTG) y N,N-diisopropiletilamina (DIPEA) se adquirieron de Fisher Scientific (Pittsburgh, PA). Kanamicina sulfato (Kan), p-Mercaptoetanol (BME), DL-ditiotreitol (DTT), 2-mercaptoetanosulfonato de sodio (MESNa), etanoditiol (EDT), Coomassie azul brillante, N,N-dimetilformamida (DMF), Tetrakis(trifenilfosfina)paladio(0) (Pd(PPh3)4), fenilsilano, triisopropilsilano (TIS), dietilditiocarbamato sódico trihidrato y 5(6)-carboxifluoresceína se adquirieron de Sigma-Aldrich (St. Louis, MO). El clorhidrato de tris(2-carboxietil)fosfina (TCEP) se adquirió de Thermo Scientific (Rockford, IL). Fmoc-Gly-OH, Fmoc-Lys(Alloc)-OH y Boc-Cys(Trt)-OH se adquirieron de Novabiochem (Laufelfingen, Suiza). La piperidina se adquirió de Alfa Aesar (Ward Hill, Ma ). El diclorometano (DCM) y la resina de amida de Rink se adquirieron de EMD Chemicals (Billerica, MA). El hidrato de 1-hidroxibenzotriazol (HOBt) se adquirió de AnaSpec (Fremont, Ca). El ácido trifluoroacético (TFA) se adquirió de Halocarbon (North Augusta, SC). Los comprimidos inhibidores de proteasa completos se adquirieron de Roche Diagnostics (Mannheim, Alemania). La resina de ácido níquel-nitrilotriacético (Ni-NTA) fue de Novagen (Gibbstown, NJ). El kit de mutagénesis dirigida al sitio QuikChange XL II fue de Agilent (La Jolla, CA). DpnI y el kit de PCR Phusion de alta fidelidad fueron de New England Biolabs (Ipswich, MA). Los kits de purificación de ADN (QIAprep spin minikit, kit de extracción de gel QIAquick, kit de PCR de purificación QIAquick) fueron de Qiagen (Valencia, CA). Las células competentes DH5^ de eficacia de subclonación y E. coli químicamente competente One Shot BL21(DE3) se adquirieron de Invitrogen (Carlsbad, CA) y se utilizaron para generar líneas celulares de alta competencia "internas". Los oligonucleótidos se adquirieron de Integrated DNA Technologies (Coralville, IA). Los nuevos genes de inteína se generaron sintéticamente y se adquirieron de GENEWIZ (South Plainfield, NJ). Todos los plásmidos utilizados en este estudio fueron secuenciados por GENEWIZ.
Los geles Bis-Tris Criterion XT (12 %), la membrana de PVDF de inmunotransferencia (0,2 pm) y el concentrado de colorante reactivo de Bradford se adquirieron de Bio-Rad (Hercules, CA). Se adquirió tampón MES-SDS 20x de Boston Bioproducts (Ashland, MA). El anticuerpo monoclonal anti-myc de ratón (a-myc) se adquirió de Invitrogen (Carlsbad, CA). El anticuerpo monoclonal de ratón Anti-marcador His, clon HIS.H8 (a-His6) se adquirió de Millipore (Billerica, MA). El anticuerpo monoclonal HA.11 de ratón (a-HA) se adquirió de Covance (Princeton, NJ). El anticuerpo secundario de cabra anti-IgG de ratón IRDye 800CW (Licor mouse 800) y el tampón de bloqueo Licor se adquirieron de LI-COR Biotechnology (Lincoln, NE).
Equipo
La cromatografía de exclusión por tamaño se llevó a cabo en un sistema ÁKTA FPLC de GE Healthcare. Tanto la FPLC preparativa como la analítica se llevaron a cabo en una columna Superdex 7510/300 o S200 10/300. Para todas las ejecuciones, las proteínas se eluyeron en 1,35 volúmenes de columna de tampón (caudal: 0,5 ml/min). La RP-HPLC analítica se realizó en los instrumentos de las series Hewlett-Packard 1100 y 1200 equipados con una columna Vydac C18 (5 pm, 4,6 x 150 mm) a un caudal de 1 ml/min. La RP-HPLC preparativa se realizó en un sistema LC de preparación Waters compuesto por un módulo de gradiente binario Waters 2545 y un detector UV Waters 2489. Las purificaciones se llevaron a cabo en una columna C18 Vydac 218TP1022 (10 pM; 22 x 250 mm). Todas las ejecuciones utilizaron TFA al 0,1 % (ácido trifluoroacético) en agua (disolvente A) y acetonitrilo al 90 % en agua con TFA al 0,1 % (disolvente B). Para todas las ejecuciones, un período isocrático de dos minutos en las condiciones iniciales fue seguido por un gradiente lineal de 30 minutos al aumentar la concentración del tampón B. El análisis espectrométrico de masas por ionización por electropulverización (ESI-MS) se realizó en un espectrómetro de masas Micrukof-Q II de Bruker Daltonics. Los ensayos de actividad de inteínas in vivo se llevaron a cabo en un lector de microplacas sintonizable VersaMax de Molecular Devices. Las células se lisaron utilizando un S-450D Branson Digital Sonifier. Las transferencias de Western y los geles de ensayo de empalme in vitro teñidos con coomassie se obtuvieron en una cámara de imágenes de infrarrojos LI-COR Odyssey. Se tomaron imágenes de geles fluorescentes que contenían fluoresceína utilizando el generador de imágenes GE ImageQuant LAS 4000.
Recopilación de la biblioteca de secuencias DnaE y análisis de secuencias
Las secuencias de proteínas de las inteínas DnaE divididas se obtuvieron de NEB InBase1. Esta lista constaba de 23 entradas a partir de mayo de 2011. De estas entradas, dos se descartaron del estudio ya que no tenían una secuencia de C-inteína: Csp(PCC7822) y Nosp(CCY9414). Dos pares de inteínas tenían secuencias idénticas: Nsp(PCC7120) con Asp (probablemente son el mismo organismo con dos nombres diferentes) y Sel(PCC6301) con Sel(PC7942). Por tanto, Nsp(PCC7120) y Sel(PCC6301) se eliminaron de la biblioteca. Las secuencias de las C-inteínas Mcht(PCC7420) y Oli fueron idénticas, pero ambas inteínas se mantuvieron en la biblioteca ya que sus secuencias de N-inteínas fueron diferentes. En InBase, la inteína Aov tenía una "X" en la posición 87 en lugar de una isoleucina (I) absolutamente conservada, por lo que se utilizó 187 en esta posición. El plásmido para los ensayos de resistencia a kanamicina que contienen la inteína Csp(PCC7424) demostró ser inestable y produjo resultados altamente variables; por lo tanto esta inteína fue excluida de los análisis. La biblioteca final contenía 18 inteínas, Tabla 1.
Tabla 1
Figure imgf000013_0001
Figure imgf000014_0001
Dada la alta homología de las secuencias de inteína DnaE, las inteínas N y C se alinearon manualmente utilizando el software de alineación múltiple Jalview2. Todas las secuencias de N-inteína se "justificaron a la izquierda" para alinear el primer resto de cisteína, y la región variable de la cola de N-inteína no se alineó. Todas las secuencias de C-inteína se "justificaron a la derecha" para alinear la asparagina C-terminal. La numeración de restos utilizada en este estudio se basa en la numeración de la estructura de NMR de una inteína Npu fusionada (código PDB 2KEQ). Por tanto, la región variable de la cola de N-inteína después del resto 102 (el último resto de NpuN) se excluye de la numeración, como lo es la metionina N-terminal de la C-inteína. La numeración de C-inteína comienza en 103, excepto para las inteínas Tel y Tvu, que tienen un hueco en esta posición y comienzan en 104. Para los logotipos de secuencia (Figura 6), las alineaciones de N y C-inteína se separaron en dos alineaciones basadas en actividad alta y baja. Los logotipos de secuencias de alta actividad estaban formados por Cwa, Cra(CS505), Csp(PCC8801), Ava, Npu, Csp(CCY0110), Mcht(PCC7420), Maer(NIES843), Asp, Oli y Aha (que se incluyeron en función de la alta actividad del mutante C120G). Los logotipos de secuencias de baja actividad estaban formados por Aov, Ter, Ssp(PCC7002), Tvu, Tel, Ssp, y Sel(PC7942). Los logotipos de secuencia fueron generados usando WebLogo. (4) Los mapas de calor se generaron utilizando el programa estadístico de estadística y gráficos "R".
Clonación de plásmidos para selección in vivo
Los fragmentos del gen aminoglucósido fosfotransferasa (KanR) y Npu se clonaron en un vector pBluescript KS (+) entre los sitios de restricción KpnI y SacI como se describió anteriormente (36,37). Este constructo contenía la siguiente arquitectura:
[promotor KanR]-[RBS]-[myc-KanRN]-[IntN]-[iRBS]-[IntC]-[CFN-KanRC] donde el promotor KanR es el promotor constitutivo que se encuentra en la mayoría de los plásmidos resistentes a Kanamicina, RBS es un sitio de unión ribosomal de E. coli común, iRBS es un sitio de unión ribosomal intermedio precedido por un enlazador, myc codifica un marcador de epítopo c-myc (EQKLISEEDL) (SEQ ID NO: 760), KanRN y KanRC son fragmentos de la proteína KanR, e IntN y IntC son fragmentos de inteína dividida. También se construyó un plásmido Ssp análogo como se describió anteriormente (36,37). Estos plásmidos se conocen como myc-KanR-NpuDnaE-Split y myc-KanR-SspDnaE-Split. Para generar los vectores de selección para las restantes inteínas divididas, los genes sintéticos se diseñaron y adquirieron de GENEWIZ que contiene la siguiente arquitectura:
[saliente 5']-[IntN]-[iRBS]-[IntC]-[saliente 3'] donde los salientes 5'y 3' fueron las 39 pb exactas encontradas cadena arriba de NpuN y las 25 pb encontradas cadena abajo de NpuC, respectivamente, en el plásmido myc-KanR-NpuDnaE-Split. Para todas las inteínas, las secuencias de genes compradas se optimizaron con codones con la tabla de uso de codones de E. coli predeterminada generada en base a todas las secuencias de codificación de E. coli en GenBank8. Los genes sintéticos fueron recibidos en vectores pUC57.
Para clonar los plásmidos de selección, se amplificó todo el gen sintético con polimerasa Phusion de alta fidelidad utilizando cebadores de recocido a los salientes 5' y 3'. El megacebador resultante se insertó en el plásmido myc-KanR en lugar de Npu mediante PCR de superposición con polimerasa Phusion (39). Esto dio como resultado 18 plásmidos homólogos que contenían esqueletos, promotores y genes KanR idénticos, pero con diferentes genes de inteína optimizados con codones. Los plásmidos se denominan como: myc-KanR-XyzDnaE-Split (donde Xyz indica el nombre de la inteína como se indica en la Tabla 1). Se realizaron mutaciones puntuales específicas a varias inteínas utilizando un kit de mutagénesis dirigida al sitio de QuikChange con el protocolo estándar recomendado.
Selección in vivo de las actividades relativas de inteína
Ensayo en placa de 96 pocillos: Los ensayos de resistencia a kanamicina (KanR) acoplada a actividad de inteína se realizaron en un formato de placa de 96 pocillos como se describió anteriormente (36,37). Normalmente, los plásmidos se transformaron en 15 pl de células DH5a de eficacia de subclonación mediante choque térmico, y las células transformadas se cultivaron durante 18 horas a 37 °C en 3 ml de medio Luria-Bertani (LB) con 100 pg /ml de ampicilina (LB/amp). Los cultivos de una noche se diluyeron 250 veces en soluciones LB/amp que contenían 8 concentraciones diferentes de kanamicina (150 pl por cultivo). Las células se cultivaron a 30 °C en una placa de 96 pocillos, controlando la densidad óptica (DO) a 650 nm cada 5 minutos durante 24 horas mientras se agitaba durante un minuto antes de cada medición. El punto final de esta curva de crecimiento (normalmente en la fase estacionaria) se representó en función de la concentración de kanamicina para visualizar la relación dosis-respuesta y se ajustó a una ecuación de dosis-respuesta de pendiente variable para determinar los valores de CI50.
Figure imgf000015_0001
En cada análisis de regresión, normalmente tres o cuatro curvas independientes de respuesta a la dosis se ajustaron colectivamente a la ecuación anterior utilizando el software GraphPad Prism. En cada ajuste, DOMin se fijó a la absorbancia de fondo a 650 nm, y se permitió que todos los demás parámetros variaran. Las barras de error informadas para los gráficos de barras CI50 (Figura 1b) representan el error estándar en el valor CI50 de mejor ajuste de tres o cuatro curvas de dosis-respuesta de ajuste colectivo.
Análisis de transferencia Western del empalme in vivo: Para los análisis de transferencia Western, las células DH5a se transformaron con los plásmidos del ensayo de forma idéntica a la configuración de la placa de 96 pocillos y se cultivaron durante 18 horas a 37 °C mientras se agitaban. Los cultivos durante la noche se utilizaron para inocular 3 ml de LB/amp fresco a una dilución de 1:300, y las células se incubaron a 30 °C durante 24 horas. Las DO de los cultivos a 30 °C se midieron a 650 nm para evaluar los niveles bacterianos relativos, luego se transfirieron 150 pl de cada cultivo a un tubo Eppendorf y se centrifugaron a 17.000 rcf durante 2 minutos. El sobrenadante se retiró por aspiración, y los sedimentos celulares se resuspendieron/lisaron en ~ 200 pl de colorante de gel de SDS 2x que contenía BME al 4 % (los volúmenes de resuspensión se variaron ligeramente para normalizar las diferencias en DO). Las muestras se hirvieron durante 10 minutos, luego se centrifugaron a 17.000 rcf durante 1 minuto. Cada muestra (5 pl) se cargó en un gel de Bis-Tris al 12 % y se corrió en un tampón de ejecución MES-SDS. Las proteínas se transfirieron a la membrana de PVDF en un tampón de transferencia de Towbin (Tris 25 mM, glicina 192 mM, metanol al 15 %) a 100 V durante 90 minutos. Las membranas se bloquearon con leche al 4 % en TBST, luego el anticuerpo primario (a-myc, 1:5000) y el anticuerpo secundario (Licor mouse 800, 1:15.000) se aplicaron secuencialmente en leche al 4 % en TBST. Se tomaron imágenes de las transferencias con el escáner Licor Odyssey.
Clonación de plásmidos para ensayos de empalme in vitro
Plásmidos Ub-IntN: Los plásmidos de expresión de N-inteína procedían de un plásmido NpuN descrito previamente, pMR-Ub-NpuN(TS) (36,37). Este plásmido codificó para la siguiente secuencia de proteínas:
MHHHHHHGGMQIFVKTLTGKTITLEVESSDTIDNVKSKIQDKEGIPPDQQELIFAGKQ
LE
DGRTLSDYNIQKESTLHLVLRLRGGGGGGKFAEYCLSYETEILTVEYGLLPIGKIVEK
RI
ECTVY SVDNNGNIYTQPVAQWHDRGEQEVFEYCLEDGSLIRATKDHKFMTVDGQMLPI
DE IFERELDLMRVDNLPN (SEQ ID NO: 761)
donde la secuencia NpuN se presenta en negrita, los restos de exteína locales nativos inmediatos están subrayados y estos restos están precedidos por His6-Ub con un enlazador Gly4. Se observó previamente una importante proteólisis in vivo durante la expresión de este constructo, por lo que este plásmido se modificó utilizando QuikChange para eliminar la secuencia Gly4. El plásmido resultante, pMR-Ub-NpuN-AGy se utilizó como plantilla para todos los demás plásmidos Ub-IntN y se codificó para la siguiente secuencia de proteínas:
MHHHHHHGGMQIFVKTLTGKTITLEVESSDTIDNVKSKIQDKEGIPPDQQELIFAGKQ
LE
DGRTLSDYNIQKESTLHLVLRLRGGKFAEYCLSYETEILTVEYGLLPIGKIVEKRIEC
TV
Y SVDNNGNIYTQPVAQWHDRGEQEVFEYCLEDGSLIRATKDHKFMTVDGQMLPIDEIF
ER
ELDLMRVDNLPN (SEQ ID NO: 762)
Todos los demás plásmidos IntN se clonaron utilizando una PCR de superposición para generar los genes de fusión Ub-IntN en plásmidos homólogos de una manera sin rastro (39). De manera específica, los genes de N-inteína se amplificaron mediante polimerasa Phusion a partir de los plásmidos genéticos sintéticos utilizando cebadores con salientes que se aparean a las secuencias de plásmidos que rodean NpuN en pMR-Ub-NpuN-AGly4. El megacebador resultante se utilizó luego para insertar el nuevo gen N-inteína en lugar de NpuN para generar un nuevo plásmido llamado pMR-Ub-IntN que era idéntico al plásmido NpuN, excepto el gen N-inteína.
Plásmidos IntC-SUMO: Todos los plásmidos C-inteína procedían de un plásmido NpuC descrito previamente, pET-NpuC(WT)-SUMO (37). Este plásmido codificó para la siguiente secuencia de proteínas:
MGSSHHHHHHGENLYFQ|GIKIATRKYLGKQNVYDIGVERDHNFALKNGFIASNCFNS
GLV
PRGSASMSDSEVNQEAKPEVKPEVKPETHINLKVSDGSSEIFFKIKKTTPLRRLMEAF
AK RQGKEMDSLRFLYDGIRIQADQTPEDLDMEDNDIIEAHREQIGGYPYDVPDYA
(SEQ ID NO: 763)
donde la secuencia de NpuC se da en negrita, y los restos de exteína locales nativos inmediatos están subrayados, seguidos de una secuencia enlazadora y SUMO-HA. Este constructo está precedido por una secuencia de reconocimiento de la proteasa del marcador His6 y del virus del grabado del tabaco (TEV, de sus siglas en inglés). El sitio de escisión de la proteasa TEV está indicado por "|" y deja un resto de glicina en lugar de una metionina IntC N-terminal.
Todos los demás plásmidos IntC se clonaron utilizando una PCR de superposición para generar los genes de fusión IntC-SUMO en plásmidos homólogos de una manera sin rastro (39). De manera específica, los genes de C-inteína se amplificaron mediante polimerasa Phusion a partir de los plásmidos genéticos sintéticos utilizando cebadores con salientes que se aparean a las secuencias de plásmidos que rodean NpuC en pET-NpuC(TS)-SUMO. El megacebador resultante se utilizó luego para insertar el nuevo gen C-inteína en lugar de NpuC para generar un nuevo plásmido llamado pET-IntC-SUMO que era idéntico al plásmido NpuC, excepto el gen C-inteína.
Purificación de proteínas para ensayos de empalme in vitro
Sobreexpresión y purificación de constructos Ub-IntN (excepto Ub-CwaN): Las células BL21(DE3) de E. coli transformadas con cada plásmido N-inteína se cultivaron en 1 l de LB que contenía 100 pg/ml de ampicilina a 37 °C hasta una DO600 = 0,6. Las células se enfriaron entonces a 18 °C y se indujo la expresión mediante la adición de IPTG 0,5 mM durante 16 horas a 18 °C. Después de recoger las células mediante centrifugación (10.500 rcf, 30 min), los sedimentos celulares se transfirieron a tubos cónicos de 50 ml con 5 ml de tampón de lisis (fosfato 50 mM, NaCl 300 mM, imidazol 5 mM, BME 2 mM, pH 8,0) y almacenado a -80 °C. Los sedimentos celulares se resuspendieron añadiendo 15 ml adicionales de tampón de lisis complementado con un cóctel inhibidor de la proteasa completa. Las células se lisaron mediante sonicación (35 % de amplitud, 8x pulsos de 20 segundos separados por 30 segundos en hielo). La fracción soluble se recuperó mediante centrifugación (35.000 rcf, 30 min). La fracción soluble se mezcló con 2 ml de resina de Ni-NTA y se incubó a 4 °C durante 30 minutos. Después de la incubación, la suspensión se cargó sobre una columna fritada. Después de descartar el flujo, la columna se lavó con 5 volúmenes de columna (CV, de sus siglas en inglés) de tampón de lisis, 5 CV de tampón de lavado 1 (tampón de lisis con imidazol 20 mM) y 3 CV de tampón de lavado 2 (tampón de lisis con imidazol 50 mM). La proteína se eluyó con tampón de elución (tampón de lisis con imidazol 250 mM) en cuatro fracciones de elución de 1,5 CV. Las fracciones de lavado y elución se analizaron por SDS-PAGE.
Después del enriquecimiento sobre la columna de Ni-NTA, las proteínas se purificaron por filtración en gel. Las fracciones de lavado y elución se trataron todas con DTT 50 mM durante 30 minutos en hielo. Para las proteínas que expresan bien, la primera fracción de elución se inyectó directamente en una columna de filtración de gel S75 10/300 (3x inyecciones de 1 ml) y se eluyó sobre 1,35 CV en tampón de empalme desgasificado recién preparado (fosfatos 100 mM, NaCl 150 mM, DTT 1 mM, EDTA 1 mM, pH 7,2). Para las proteínas más diluidas y de bajo rendimiento, normalmente, la fracción de lavado de imidazol 50 mM y las dos primeras fracciones de elución se agruparon y se concentraron cuatro veces en 3 ml. Después, la proteína concentrada se purificó mediante filtración en gel de forma idéntica a los constructos de alto rendimiento. Las fracciones de FPLC se analizaron mediante SDS-PAGE y las fracciones más puras se agruparon y analizaron mediante filtración analítica en gel, RP-HPLC analítica y espectrometría de masas. La concentración de proteínas puras se determinó mediante UV A280nm y mediante el ensayo de Bradford.
Sobreexpresión y purificación de Ub-CwaN: La proteína Ub-CwaN no se expresó bien en la fracción soluble, y toda la proteína enriquecida se agregó, como se observó en el análisis de filtración en gel. Por tanto, después de la expresión, la lisis celular y el fraccionamiento, tal como se han descrito anteriormente, se extrajo la proteína de la fracción insoluble del lisado de la siguiente manera. En primer lugar, el sedimento de lisado se resuspendió en 20 ml de tampón de lavado Triton (tampón de lisis con Triton X-100 al 0,1 %) y se incubó a temperatura ambiente durante 30 minutos. El lavado con Triton se centrifugó a 35.000 rcf durante 30 minutos y se desechó el sobrenadante. A continuación, el sedimento se resuspendió en 20 ml de tampón de lisis que contenía urea 6 M y la mezcla se incubó durante la noche a 4 °C. La mezcla se centrifugó a 35.000 rcf durante 30 minutos, y luego el sobrenadante se mezcló con 2 ml de resina NiNTA. La columna de Ni se ejecutó de manera idéntica a las purificaciones nativas descritas anteriormente, excepto que cada tampón tenía un fondo de urea 6 M. Después del enriquecimiento sobre una columna de Ni-NTA, el lavado de imidazol 50 mM y las dos primeras fracciones de elución se agruparon y se diluyeron a 0,2 mg/ml. La proteína diluida se replegó en tampón de lisis (sin urea) mediante la eliminación por diálisis gradual de la urea a 4 °C. La proteína se concentró cuatro veces a 3 ml y se purificó inmediatamente mediante filtración en gel como se indica para las purificaciones nativas anteriores. La proteína pura se analizó mediante filtración analítica en gel, RP-HPLC analítica y espectrometría de masas. Hay que tener en cuenta que este constructo fue altamente susceptible a la agregación. Cuando se volvió a plegar a 2 mg/ml en lugar de 0,2 mg/ml, menos del 10 % de la proteína obtenida fue monomérica, mientras que el repliegue más diluido produjo aproximadamente el 50 % de proteína monomérica. La proteína obtenida fue 80 % monomérica y la proporción de monómero a agregado no cambió después de 24 horas de almacenamiento a 4 °C. La concentración de proteína pura se determinó mediante el ensayo de Bradford.
Sobreexpresión y purificación de constructos IntC-SUMO: Se cultivaron células BL21(DE3) de E. coli transformadas con cada plásmido de N-inteína en 1 l de medio LB que contenía kanamicina (50 pg/ml) a 37 °C hasta una DO600 = 0,6. Después, se indujo la expresión mediante la adición de IPTG 0,5 mM durante 3 horas a 37 °C. Las células se lisaron y la proteína deseada se enriqueció sobre resina Ni-NTA de manera idéntica a las proteínas Ub-IntN purificadas de forma nativa. Las proteínas AvaC-SUMO y Csp(PCC8801)C-SUMO no se expresaron bien a 37 °C, por lo que las proteínas se volvieron a expresar mediante inducción a 18 °C durante 16 horas. Para cada proteína, el lavado de imidazol 50 mM y las dos primeras fracciones de elución se agruparon y se dializaron en tampón de escisión TEV (fosfato 50 mM, NaCl 300 mM, imidazol 5 mM, EDTA 0,5 mM, DTT 0,5 mM, pH 8,0) y luego se trataron con 40 pg de proteasa TEV marcada con His durante la noche a temperatura ambiente. La escisión se confirmó mediante RP-HPLC/MS, después de lo cual la solución de reacción se incubó con resina de Ni-NTA a temperatura ambiente durante 30 min. Se recogieron y se agruparon el flujo continuo y dos lavados de 1,5 CV con tampón de lavado 1. La proteína se concentró luego a 3-4 ml, se inyectó en la columna de filtración de gel S75 10/300 (3x en inyecciones de 1 ml) y se eluyó sobre 1,35 CV en tampón de empalme desgasificado recién preparado (fosfatos 100 mM, NaCl 150 mM, d Tt 1 mM, EDTA 1 mM, pH 7,2). Las fracciones de FPLC se analizaron mediante SDS-PAGE y las fracciones más puras se agruparon y analizaron mediante filtración analítica en gel, RP-HPLC analítica y espectrometría de masas. La concentración de proteínas puras se determinó mediante UV A280nm y mediante el ensayo de Bradford.
Uso y almacenamiento de los constructos Ub-IntN e IntC-SUMO: Todas las proteínas purificadas se almacenaron a 4 °C y se utilizaron dentro de dos días para empalmar los ensayos con sus IntC-SUMO afines. La proteína restante (2 vol. eq.) se mezcló con un tampón de empalme que contenía glicerol al 60 % (1 vol. eq.) para producir un stock de glicerol al 20 % que se dividió en alícuotas y se congeló rápidamente en N2 líquido. Las alícuotas de proteínas se almacenaron a -80 °C. Las proteínas eran completamente funcionales después de descongelarse en hielo y podían congelarse rápidamente y volver a descongelarse al menos una vez sin una pérdida de función detectable.
Ensayos de empalme in vitro
Procedimiento de ensayo cinético: Para un ensayo típico, se prepararon soluciones madre de proteínas individuales de constructos Ub-IntN e IntC-SUMO en tampón de empalme filtrado (fosfato 100 mM, NaCl 150 mM, DTT 1 mM, EDTA 1 mM, pH 7,2) a 2x la concentración final (por ejemplo, solución madre 2,0 pM para una reacción 1,0 pM). Se añadió TCEP 1 mM (de una solución madre 100 mM con pH neutralizado) a cada solución de proteína, y las proteínas se incubaron a 30 °C o 37 °C durante 5 minutos, dependiendo de la temperatura de reacción. Para iniciar una reacción, la N y C inteína se mezclaron en volúmenes iguales (es decir, proporciones equimolares). Un volumen de reacción normal fue de 300 pl y se llevó a cabo en un tubo Eppendorf en un bloque de calor. Durante la reacción, se eliminaron alícuotas de 20 pl de la solución de reacción en los puntos de tiempo deseados y se inactivaron en 20 pl de colorante de carga de gel de SDS concentrado 2x en hielo para proporcionar una solución final inactivada con Tris 40 mM (~ pH 7,0), glicerol al 10 % (v/v), SDS al 1 % (p/v), azul de bromofenol al 0,02 % (p/v) y BME al 2 % (v/v). Para cada reacción, se tomó un punto de tiempo cero artificial mezclando cantidades equivalentes de materiales de partida directamente en la solución de inactivación. Las muestras se hirvieron durante 10 minutos y luego se centrifugaron a 17.000 rcf durante 1 minuto. Se cargaron partes alícuotas de los materiales de partida y los puntos de tiempo (15 pl) en geles Bis-Tris y se ejecutaron en tampón de ejecución MES-SDS. Los geles se tiñeron con Coomassie y luego se tomaron imágenes con el escáner Licor Odyssey.
Hay que tener en cuenta que para las reacciones con una secuencia de C-exteína CGN, no se utilizó BME en la solución de inactivación. Además, antes de hervir las muestras, cada muestra se trató con 1 pl de HCl 2 N. Después de hervir y enfriar las muestras, se trataron con 1 pl de NaOH 2 N. Este procedimiento evitó la hidrólisis o la tiólisis no deseadas del intermedio ramificado.
Determinación de parámetros cinéticos: Para determinar las velocidades de reacción, cada carril de un gel se analizó utilizando la función de cuantificación Licor Odyssey o ImageJ. Dada la proximidad de las bandas de material de partida, estas bandas se integraron normalmente juntas. Para normalizar el error de carga, la intensidad integrada de cada banda en un carril se expresó como una intensidad de fracción de la intensidad de banda total en ese carril (que se mantuvo relativamente constante entre los carriles). Estas intensidades normalizadas se representaron gráficamente como una función del tiempo, y los datos de tres reacciones independientes se ajustaron colectivamente a las ecuaciones de velocidad de primer orden utilizando el software GraphPad Prism:
Para el agotamiento de reactivos: Y = S (e -kobst) Z
Para la formación de producto: Y = Ymax(1 -e-kobst)
Y es la intensidad fraccional de una especie, t es el tiempo en minutos, S es un factor de escala para el agotamiento del reactivo (se permite que varíe), Z indica la fracción de reactante que queda en el punto final de la reacción (se permite que varíe, Ymax es un factor de escala para la formación del producto, y kobs es la constante de velocidad de primer orden observada para la reacción de empalme (se permite que varíe). Las semividas se calcularon a partir del valor de mejor ajuste para la constante de velocidad de primer orden:
Figure imgf000018_0001
Para las reacciones sin formación de producto secundario detectable, la velocidad de producto (Ub-SUMO) y la formación de IntN fueron consistentes con la velocidad de agotamiento del material de partida.
Análisis de transferencia Western de reacciones: Se realizaron transferencias Western del punto de tiempo cero y el punto final de la reacción para confirmar las identidades de las bandas observadas. Los puntos de tiempo de inactivación de las reacciones descritas anteriormente se cargaron en geles Bis-Tris al 12 % (5 pl por muestra, dos geles idénticos) y se ejecutaron en tampón de ejecución MES-SDS. Las proteínas resueltas se transfirieron del gel a la membrana de PVDF en un tampón de transferencia CAPS (ácido W-ciclohexil-3-aminopropanosulfónico 10 mM, metanol al 10 % (v/v), pH 10,5) a 100 V durante 60 minutos. Las membranas se bloquearon con el tampón de bloqueo de Licor, luego se aplicó el anticuerpo primario (a-His6, 1:3000 o a-HA, 1:25.000) en el tampón de bloqueo de Licor. El anticuerpo secundario (Licor mouse 800, 1:15.000) se aplicó en leche al 4 % en TBST. Se tomaron imágenes de las transferencias con el escáner Licor Odyssey. Las transferencias de las reacciones a 30 °C y 37 °C fueron virtualmente idénticas.
Análisis HPLC/MS de las reacciones Npu-CGN y Cra(CS505)-CGN
Para el análisis HPLC/MS de Npu-CGN y Cra(CS505)-CGN, se prepararon soluciones madre de proteínas individuales de Ub-IntN e IntC-CGN-SUMO en tampón de empalme filtrado (fosfato 100 mM, NaCl 150 mM, DTT 1 mM, EDTA 1 mM, pH 7,2) a 8,0 pM. Se añadió TCEP 1 mM (de una solución madre 100 mM con pH neutralizado) a cada solución de proteína, y las proteínas se incubaron a 30 °C durante 5 minutos. Para iniciar una reacción, la N y C inteína se mezclaron en volúmenes iguales (es decir, proporciones equimolares) y se incubaron a 30 °C. Durante la reacción, se eliminaron alícuotas de 90 pl de la solución de reacción en los puntos de tiempo deseados y se inactivaron en 30 pl de una solución de inactivación rápida (hidrocloruro de guanidina 6 M con ácido trifluoroacético al 4 %). Se inyectaron 100 pl de cada punto de tiempo inactivado en una columna analítica C18 RP-HPLC y se eluyeron en un gradiente de tampón B al 25-73 % en 30 minutos, precedidos por una fase isocrática de dos minutos en tampón B al 25 % (véase la sección Equipo para la columna y especificaciones del tampón de ejecución). En diferentes puntos de tiempo, se recogieron varios picos de HPLC y se confirmaron sus identidades mediante espectrometría de masas. Las especies IntC-(Ub)SUMO se identificaron mediante MS, verificando la formación y el agotamiento de intermedios ramificados.
Modelado cinético
Cuando se compararon las reacciones de Npu, Cra(CS505) y Cwa en presencia de CGN, se obtuvieron mayores cantidades de ubiquitina escindida (es decir, escisión de N-exteína) que el producto de empalme, a pesar del hecho de que la tasa de la primera fue más lenta que la última. Esta observación es inconsistente con la escisión de N-exteína y la formación del producto de empalme que solo ocurre a partir del intermedio ramificado, ya que en este escenario el empalme y la escisión serían reacciones de primer orden que compiten con el mismo reactivo (el intermediario ramificado), lo que lleva a un mayor producto de empalme que de escisión (lo contrario a lo observado). En un intento por conciliar estas observaciones, se llevaron a cabo una serie de simulaciones de modelado cinético. Todo el modelado se llevó a cabo utilizando el applet de modelado cinético de BPReid (40). Los modelos tienen tres suposiciones básicas sobre la ruta de empalme:
1. Las reacciones directas e inversas en el primer equilibrio son rápidas. Además, la posición de este equilibrio se encuentra ligeramente hacia la amida.
2. El segundo equilibrio también es rápido y debería tener Keq cerca de 1, ya que ambos intermedios son tioésteres de cisteinilo.
3. Para inteínas rápidas, la tasa de resolución intermedia ramificada (ks) es del mismo orden de magnitud que las tasas de las dos primeras etapas reversibles, mientras que las tasas de escisión de L (k6) y B (k7) son relativamente lentas. Para inteínas lentas, la resolución intermedia ramificada (ks) también es lenta, en el mismo orden de magnitud que la escisión.
Con estas suposiciones, se diseñaron seis escenarios que evalúan cómo las tasas relativas de escisión y la resolución intermedia ramificada y el equilibrio entre los intermedios lineales y ramificados podrían afectar las tasas y extensiones de formación de la escisión y los productos empalmados. Para inteínas lentas, como las que contienen restos exógenos de C-exteína, la tasa de resolución intermedia ramificada es similar a la tasa de escisión de N-exteína. Bajo estas circunstancias, tres factores son importantes:
1. Las tasas relativas de escisión de L frente a B (k6 frente a k7).
2. Las tasas relativas de resolución intermedia ramificada frente a escisión (ks frente a k6 k7).
3. Lo que es más importante, las tasas de intercambio entre los intermedios lineales y ramificados (k3/k4).
Estos análisis sugieren no solo que la escisión debe llevarse a cabo tanto desde el intermedio lineal como el intermedio ramificado, sino que también puede favorecerse la escisión en el intermedio lineal.
Tiólisis y ligadura de proteínas a partir de inteínas DnaE fusionadas y MxeGyrA
Síntesis en fase sólida y purificación de H-Cys-Gly-Lys (Fluoresceína)-NH? (CGK-Fluoresceína): La síntesis de péptidos en fase sólida (SPPS, de sus siglas en inglés) basada en Fmoc se utilizó para producir un péptido con la secuencia H-Cys-Gly-Lys(Fluoresceína)-NH2. El péptido se sintetizó en resina de amida de Rink a una escala de 0,2 mmol de la siguiente manera: se utilizó piperidina al 20 % en DMF para la desprotección de Fmoc usando un equilibrio de un minuto de la resina seguido de una incubación de 20 minutos. Después de la desprotección de Fmoc, los aminoácidos se acoplaron utilizando DIC/HOBt como agentes activadores. En primer lugar, el aminoácido (1,1 mmol) se disolvió en DCM:DMF 50:50 (2 ml) y se activó con DIC (1,0 mmol) y HOBt (1,2 mmol) a 0 °C durante 15 minutos. La mezcla se añadió a la resina desprotegida en el extremo N y se acopló durante 10 minutos a temperatura ambiente.
Después de acoplar la cisteína, la cadena lateral de lisina se desprotegió mediante tratamiento con Pd(Ph3)4 (0,1 eq.) y fenilsilano (25 eq.) en DCM seco durante 30 minutos. La resina de peptidilo se lavó con DCM (2 x 5 ml) y DMF (2 x 5 ml) seguido de dos lavados con DIPEA al 0,5 % en DMF (v/v) y dos lavados con trihidrato de dietilditiocarbamato de sodio al 0,5 % en DMF (p/v) para eliminar cualquier traza restante del catalizador de Pd. La 5(6)-carboxifluoresceína se acopló luego a la cadena lateral de lisina usando el método de activación DIC/HOBt durante la noche a temperatura ambiente. Por último, el péptido se escindió de la resina utilizando TFA al 94 %, TIS al 1 %, EDT al 2,5 % y H2O al 2,5 % (6,5 ml) durante una hora. Después de la escisión, aproximadamente la mitad del TFA se evaporó bajo una corriente de nitrógeno. El péptido en bruto se precipitó con éter frío y se lavó con éter frío dos veces. Por último, el péptido se purificó mediante RP-HPLC en una columna de preparación C18 sobre un gradiente de tampón B del 15-80 % en 40 minutos. El péptido purificado se analizó mediante RP-HPLC analítica y ESI-MS para confirmar su identidad. Hay que tener en cuenta que no se intentó aislar por separado los conjugados 5-carboxifluoresceína y 6-carboxifluoresceína, por lo que el péptido es una mezcla de estos dos isómeros.
Clonación de fusiones de Ub-Inteína: Todas las fusiones de Ub-Inteína se clonaron en un vector pTXB1 modificado de NEB que contiene ubiquitina en la que se insertaron un marcador His6 y un codón de parada entre la inteína MxeGyrA y el dominio de unión a quitina. Esto dio como resultado un plásmido, pTXB1-Ub-MxeGyrA-ATEA-H6 que codifica la siguiente proteína, llamada Ub-MxeGyrA-ATEA-H6:
MQIFVKTLTGKTITLEVEPSDTIENVKAKIQDKEGIPPDQQRLIFAGKQLEDGRTLSD
YN
IQKESTLHLVLRLRGGCITGDALVALPEGESVRIADIVPGARPNSDNAIDLKVLDRHG
NP
VLADRLFHSGEHPVYTVRTVEGLRVTGTANHPLLCLVDVAGVPTLLWKLIDEIKPGDY
AV
IQRSAFSVDCAGFARGKPEFAPTTYTVGVPGLVRFLEAHHRDPDAQAIADELTDGRFY
YA
KVASVTDAGVQPVYSLRVDTADHAFITNGFVSHATEAHHHHHH (SEQ ID NO: 764)
en la cual la secuencia de inteína para MxeGyrA (N198A) se muestra en negrita, precedida por ubiquitina y seguida por la secuencia local endógena C-exteína (subrayada) y un marcador His6.
Este plásmido se modificó para reemplazar la inteína MxeGyrA con una inteína Npu fusionada. En primer lugar, el plásmido myc-KanR-NpuDnaE-Split se modificó mediante QuikChange para eliminar la secuencia iRBS que separa los genes NpuN y NpuC. El plásmido resultante, myc-KanR-NpuDnaE-Fused, se utilizó luego como plantilla para amplificar megacebadores que llevan la inteína Npu fusionada con salientes homólogos a las secuencias que rodean MxeGyrA en el vector pTXB1 modificado. El gen Npu con la mutación N137A se insertó en lugar de MxeGyrA utilizando una PCR de superposición con la polimerasa Phusion. (39) De manera importante, esta construcción se modificó para incluir los restos de C-exteína nativos de Npu (CFN) en lugar de los de MxeGyrA (TEA). El plásmido resultante, pTXB1-Ub-NpuDnaE-ACFN-H6 codificó para la siguiente proteína:
MQIFVKTLTGKTITLEVEPSDTIENVKAKIQDKEGIPPDQQRLIFAGKQLEDGRTLSD
YN
IQKESTLHLVLRLRGGCLSYETEILTVEYGLLPIGKIVEKRIECTVYSVDNNGNIYTQ
PV
AQWHDRGEQEVFEYCLEDGSLIRATKDHKFMTVDGQMLPIDEIFERELDLMRVDNLPN
IK IATRKYLGKQNVYDIGVERDHNFALKNGFIASACFNHHHHHH (SEQ ID NO:
765)
Esta fusión mostró una importante hidrólisis in vivo de la ubiquitina cuando se expresó en E. coli. Por tanto, se modificó aún más utilizando la mutagénesis QuikChange mediante la mutación de la cisteína 1 en alanina, generando el plásmido pTXB1-Ub-NpuDnaE-AAFN-H6. Este plásmido codificó la siguiente proteína (Ub-NpuDnaE-AAFN-H6) que se utilizó para experimentos de tiólisis in vitro:
MQIFVKTLTGKTITLEVEPSDTIENVKAKIQDKEGIPPDQQRLIFAGKQLEDGRTLSD
YN
IQKESTLHLVLRLRGGCLSYETEILTVEYGLLPIGKIVEKRIECTVYSVDNNGNIYTQ
PV
AQWHDRGEQEVFEYCLEDGSLIRATKDHKFMTVDGQMLPIDEIFERELDLMRVDNLPN
IK
IATRKYLGKQNVYDIGVERDHNFALKNGFIAS AAFNHHHHHH (SEQ ID NO: 766)
Los plásmidos pTXB1-Ub-AvaDnaE-AAFN-H6 y pTXB1-Ub-MchtDnaE-AAFN-H6, que codifican las siguientes secuencias de proteínas (Ub-AvaDnaE-AAFN-H6 y Ub-MchtDnaE-AAFN-H6, respectivamente), fueron clonados análogamente mediante la modificación del plásmido pTXB1-Ub-NpuDnaE-AAFN-H6.
Ub-AvaDnaE-AAFN-H6
MQIFVKTLTGKTITLEVEPSDTIENVKAKIQDKEGIPPDQQRLIFAGKQLEDGRTLSD
YN
IQKESTLHLVLRLRGGCLSYDTEVLTVEYGFVPIGEIVDKGIECSVFSIDSNGIVYTQ
P I
AQWHHRGKQEVFEYCLEDGSIIKATKDHKFMTQDGKMLPIDEIFEQELDLLQVKGLPE
IK
IASRKFLGVENVYDIGVGRDHNFFVKNGLIASAAFNHHHHHH (SEQ ID NO: 767)
Ub-MchtDnaE-AAFN-H6
MQIFVKTLTGKTITLEVEP SDTIENVKAKIQ DKEGIP PDQQRLIFAGKQLEDGRTLSD
YN
IQKESTLHLVLRLRGGCLSYDTQILTVEYGAVAIGEIVEKQIECTVYSVDENGYVYTQ
P I
AQWHNRGEQEVFEYLLEDGATIRATKDHKFMTDEDQMLPIDQIFEQGLELKQVEVLQP
VF
VKIVRRQSLGVQNVYDIGVEKDHNFCLASGEIASAAFNHHHHHH (SEQ ID NO: 768)
Como control para la eliminación del resto Cys 1 en los constructos de inteína DnaE, el resto Thr 1 se mutó a partir del plásmido pTXB1-Ub-MxeGyrA-ATEA-H6 mediante la mutagénesis QuikChange para producir el plásmido pTXB1-Ub-MxeGyrA-AAEA-H6, que codifica la proteína Ub-MxeGyrA-AAEA-H6.
MQIFVKTLTGKTITLEVEPSDTIENVKAKIQDKEGIPPDQQRLIFAGKQLEDGRTLSD
YN
IQKESTLHLVLRLRGGCITGDALVALPEGESVRIADIVPGARPNSDNAIDLKVLDRHG
NP
VLADRLFHSGEHPVYTVRTVEGLRVTGTANHPLLCLVDVAGVPTLLWKLIDEIKPGDY
AV
IQRSAFSVDCAGFARGKPEFAPTTYTVGVPGLVRFLEAHHRDPDAQAIADELTDGRFY
YA
KVASVTDAGVQPVYSLRVDTADHAFITNGFVSHAAEAHHHHHH (SEQ ID NO: 769)
Clonación de fusiones adicionales para inteínas DnaE fusionadas: Varias otras proteínas se fusionaron a AvaDnaE o MchtDnaE para probar la dependencia de secuencia de la tiólisis de estas inteínas. Las proteínas utilizadas fueron el dominio SH3 N-terminal de Grb2 humana (AAs 1-55 /- una Gly C-terminal exógena), el dominio SH2 de la quinasa Abl humana (AAs 122-217), eGFP, y el dominio catalítico de pA r P1 humana (AAs 657-1015). Todos los plásmidos se clonaron utilizando los métodos mencionados anteriormente para producir plásmidos que codifican las siguientes proteínas:
SH3-AvaDnaE-AAFN-H6 MEAIAKYDFKATADDELSFKR.GDILKVLNEECDQNWYKAELNGKDGFIPKNYIEMCLS YD TEVLTVEYGFVPIGEIVDKGIECSVFSIDSNGIVYTQPIAQWHHRGKQEVFEYCLEDG SI IKATKDHKFMTQDGKMLPIDEIFEQELDLLQVKGLPEIKIASRKFLGVENVYDIGVGR DH NFFVKNGLIASAAFNHHHHHH (SEQ ID NO: 770)
SH3-Gly-AvaDnaE-AAFN-H6 MEAIAKYDFKATADDELSFKRGDILKVLNEECDQNWYKAELNGKDGFIPKNYIEMGCL SY DTEVLTVEYGFVPIGEIVDKGIECSVFSIDSNGIVYTQPIAQWHHRGKQEVFEYCLED GS IIKATKDHKFMTQDGKMLPIDEIFEQELDLLQVKGLPEIKIASRKFLGVENVYDIGVG RD HNFFVKNGLIASAAFNHHHHHH (SEQ ID NO: 771)
SH3-MchtDnaE-AAFN-H6 MEAIAKYDFKATADDELSFKRGDILKVLNEECDQNWYKAELNGKDGFIPKNYIEMCLS YD TQILTVEYGAVAIGEIVEKQIECTVYSVDENGYVYTQPIAQWHNRGEQEVFEYLLEDG AT IRATKDHKFMTDEDQMLPIDQIFEQGLELKQVEVLQPVFVKIVRRQSLGVQNVYDIGV EK DHNFCLASGEIASAAFNHHHHHH (SEQ ID NO: 772)
SH2-AvaDnaE-AAFN-H6 MLEKHSWYHGPVSRNAAEYLLSSGINGSFLVRESESSPGQRSISLRYEGRVYHYRINT AS DGKLYVSSESRFNTLAELVHHHSTVADGLITTLHYPACLSYDTEVLTVEYGFVPIGEI VD
KGIECSVFSIDSNGIVYTQPIAQWHHRGKQEVFEYCLEDGSIIKATKDHKFMTQDGKM LP IDEIFEQELDLLQVKGLPEIKIASRKFLGVENVYDIGVGRDHNFFVKNGLIASAAFNH HH
hhh (SEQ ID NO: 773)
eGFP-AvaDnaE-AAFN-H6
MVSKGEELFTGWPILVELDGDVNGHKFSVSGEGEGDATYGKLTLKFICTTGKLPVPW
PT
LVTTLTYGVQCFSRYPDHMKQHDFFKSAMPEGYVQERTIFFKDDGNYKTRAEVKFEGD
TL
VNRIELKGIDFKEDGNILGHKLEYNYNSHNVYIMADKQKNGIKVNFKIRHNIEDGSVQ
LA
DHYQQNTPIGDGPVLLPDNHYLSTQSALSKDPNEKRDHMVLLEFVTAAGITLGMDELY
KC
LSYDTEVLTVEYGFVPIGEIVDKGIECSVFSIDSNGIVYTQPIAQWHHRGKQEVFEYC
LE
DGSIIKATKDHKFMTQDGKMLPIDEIFEQELDLLQVKGLPEIKIASRKFLGVENVYDI
GV GRDHNFFVKNGLIASAAFNHHHHHH (SEQ ID NO: 774)
PARPc-AvaDnaE-AAFN-H6 MVNPGTKSKLPKPVQDLIKMIFDVESMKKAMVEYEIDLQKMPLGKLSKRQIQAAYSIL SE VQQAVSQGSSDSQILDLSNRFYTLIPHDFGMKKPPLLNNADSVQAKAEMLDNLLDIEV AY
SLLRGGSDDSSKDPIDVNYEKLKTDIKVVDRDSEEAEIIRKYVKNTHATTHNAYDLEV
ID
IFKIEREGECQRYKPFKQLHNRRLLWHGSRTTNFAGILSQGLRIAPPEAPVTGYMFGK
GI YFADMVSKSANYCHTSQGDPIGLILLGEVALGNMYELKHASHISKLPKGKHSVKGLGK TT PDPSANISLDGVDVPLGTGISSGVNDTSLLYNEYIVYDIAQVNLKYLLKLKFNFKTSL WC
LSYDTEVLTVEYGFVPIGEIVDKGIECSVFSIDSNGIVYTQPIAQWHHRGKQEVFEYC
LE
DGSIIKATKDHKFMTQDGKMLPIDEIFEQELDLLQVKGLPEIKIASRKFLGVENVYDI
GV GRDHNFFVKNGLI ASAAFNHHHHHH (SEQ ID NO: 775)
Purificación de diversas fusiones de proteína-inteína: Se cultivaron células BL21(DE3) de E. coli transformadas con cada plásmido de fusión de proteína-inteína en 1 l de medio LB que contenía ampicilina (100 |jg/ml) a 37 °C hasta una DO600 = 0,6. Después, se indujo la expresión mediante la adición de IPTG 0,5 mM y la incubación durante 3 horas a 37 °C o la incubación durante 16 horas a 18 °C. Todas las fusiones Ub se expresaron a 37 °C, la fusión eGFP se expresó a 18 °C y las fusiones SH3, SH2 y PARPc se expresaron a ambas temperaturas. Después de recoger las células mediante centrifugación (10.500 rcf, 30 min), los sedimentos celulares se transfirieron a tubos cónicos de 50 ml con 5 ml de tampón de lisis (fosfato 50 mM, NaCl 300 mM, imidazol 5 mM, sin BME, pH 8,0) y se almacenaron a -80 °C. Los sedimentos celulares se resuspendieron añadiendo 15 ml adicionales de tampón de lisis complementado con un cóctel inhibidor de proteínas completo. Las células se lisaron mediante sonicación (35 % de amplitud, 8x pulsos de 20 segundos separados por 30 segundos en hielo). La fracción soluble se recuperó mediante centrifugación (35.000 rcf, 30 min). La fracción soluble se mezcló con 2 ml de resina de Ni-NTA y se incubó a 4 °C durante 30 minutos. Después de la incubación, la suspensión se cargó sobre una columna fritada. Después de descartar el flujo, la columna se lavó con 5 volúmenes de columna (CV, de sus siglas en inglés) de tampón de lisis, 5 CV de tampón de lavado 1 (tampón de lisis con imidazol 20 mM) y 3 CV de tampón de lavado 2 (tampón de lisis con imidazol 50 mM). La proteína se eluyó con tampón de elución (tampón de lisis con imidazol 250 mM) en cuatro fracciones de elución de 1,5 CV. Las fracciones de lavado y elución se analizaron mediante SDS-PAGE con colorante de carga que no contenía tioles. Las fracciones más limpias se agruparon y se trataron con TCEP 10 mM durante 20 minutos en hielo. Después, la solución se inyectó en una columna de filtración de gel S75 o S200 10/300 (2x en inyecciones de 1 ml) y se eluyó sobre 1,35 CV en tampón de tiólisis (fosfatos 100 mM, NaCl 150 mM, EDTA 1 mM, TCEP 1 mM, pH 7,2). Las fracciones de FPLC se analizaron mediante SDS-PAGE con un colorante de carga que no contenía tioles, y las fracciones más puras se agruparon y analizaron mediante RP-HPLC analítica y espectrometría de masas. La concentración de proteínas puras se determinó mediante UV A280nm.
Tiólisis de fusiones de Ub-inteína y ligadura de ubiquitina a un pequeño péptido fluorescente: Para cada proteína de fusión Ub-Inteína, se llevaron a cabo cuatro reacciones en una escala de 100 pl a 30 °C. En la primera reacción para controlar la hidrólisis de fondo, la proteína de fusión (50 pM) se incubó en un tampón de tiólisis (fosfato 100 mM, NaCl 150 mM, EDTA 1 mM, TCEP 1 mM, pH 7,2) complementado con TCEP recién agregado (5 mM adicional). En la segunda y tercera reacción, la proteína se incubó de manera idéntica a la de la primera reacción, excepto que cada reacción tuvo MESNa 100 mM o CGK-Fluoresceína 1 mM. En la cuarta reacción, se añadieron tanto MESNa como el péptido. En diversos puntos temporales, se eliminaron 5 pl de solución de reacción y se inactivaron en 30 pl de colorante de carga SDS 2x que no contenía tioles. A medida que se recogieron los puntos de tiempo, se almacenaron a -20 °C hasta el final de la reacción. Después de la reacción, los 35 pl de los puntos de tiempo de inactivación se descongelaron, se trataron con 1 pl de una solución madre de TCEP 1 M, se hirvieron durante 10 minutos y se centrifugaron a 17.000 rcf durante 1 minuto. Los puntos de tiempo (5 pl) se cargaron en geles Bis-Tris al 12 % y se ejecutaron en tampón de ejecución MES-SDS. Se tomaron imágenes por primera vez de los geles en un generador de imágenes de fluorescencia para visualizar el producto de ligadura Ub-CGK-Fluoresceína. Luego, los geles se tiñeron con Coomassie y se tomaron imágenes con el escáner Licor Odyssey. Además, los puntos finales de la reacción se inactivaron mediante dilución 20 veces en H2O con TFA al 0,1 % y se inyectaron en una columna analítica C18 RP-HPLC. La mezcla se separó en una fase isocrática de 2 minutos en B al 0 %, seguido de un gradiente lineal de B al 0-73 % en 30 minutos. Los principales picos se recogieron y analizaron mediante MS.
Tiólisis de fusiones de SH3-, SH2-, eGFP- y PARPn-Inteína: Se llevaron a cabo reacciones de tiólisis con varias otras proteínas fusionadas a las inteínas fusionadas AvaDnaE y MchtDnaE de manera análoga a las reacciones de ubiquitina descritas anteriormente. En una reacción típica, llevada a cabo en una escala de 300 pl a 30 °C, se trató una proteína de fusión 10 pM con TCEP 5 mM en tampón de tiólisis y luego se incubó en presencia o ausencia de MESNa (ya sea 100 mM o 200 mM) agregado a partir de una solución madre 1 M de pH ajustado. En diversos puntos temporales, se inactivaron partes alícuotas (15 pl) de la solución de reacción en 30 pl de colorante de carga de gel SDS 2x que no contenía tioles y se almacenaron a -20 °C hasta el final de la reacción. Después de la reacción, los 45 pl de los puntos de tiempo de inactivación se descongelaron, se trataron con 1 pl de una solución madre de TCEP 1 M, se hirvieron durante 10 minutos y se centrifugaron a 17.000 rcf durante 1 minuto. Los puntos de tiempo (15 pl) se cargaron en geles Bis-Tris al 12 % y se ejecutaron en tampón de ejecución MES-SDS. Luego, los geles se tiñeron con Coomassie y se tomaron imágenes con el escáner Licor Odyssey. Además, los puntos finales de la reacción se inactivaron mediante dilución 4 veces en H2O con TFA al 0,1 % y se inyectaron en una columna analítica C18 RP-HPLC. La mezcla se separó en una fase isocrática de 2 minutos en B al 0 %, seguido de un gradiente lineal de B al 0­ 73 % en 30 minutos. Los picos de productos se recogieron y analizaron mediante MS.
Observación del intermedio de tioéster lineal en inteínas DnaE fusionadas
Para las fusiones de Npu, Ava y Mcht con la ubiquitina, tres picos fueron visibles para la proteína purificada cuando se inyectaron directamente en una columna C18 de RP-HPLC desde un tampón neutro. Todos estos picos tenían la misma masa de la proteína deseada. Cuando se diluyeron 20 veces en H2O que contenía TFA al 0,1 % (pH 2) y se incubaron durante al menos dos horas a temperatura ambiente, los dos primeros picos se fusionaron en el tercer pico (Figura 4d). La misma observación no se pudo hacer para MxeGyrA en condiciones idénticas. Para confirmar adicionalmente que se estaba produciendo un equilibrio entre la amida precursora y el tioéster lineal, la proteína Ub-NpuDnaE-AAFN-H6 se diluyó 20 veces en tampón de tiólisis que contenía SDS al 1 %. Antes de hervir, los dos picos principales eran visibles. Después de hervir durante 10 minutos, cuando se desplegó la proteína, el primer pico principal convergió parcialmente en el segundo pico principal, lo que sugiere que esta última fue la amida, que debería ser más estable en la proteína desplegada. La evidencia adicional de que los tres picos estaban en equilibrio provino de las titulaciones de pH. La proteína se diluyó 20 veces en tampones de ácido cítrico/fosfato de pH 2 a pH 8, se incubó a temperatura ambiente durante 3-4 horas, luego se analizó mediante HPLC en un gradiente de B al 30-73 % en 30 minutos (Figura 4d). La abundancia relativa de las tres especies se moduló y mostró una dependencia del pH en forma de campana, similar a las actividades de las enzimas que contienen múltiples grupos funcionales ionizables en sus sitios activos.
Además de observar la masa proteica deseada de los tres picos de HPLC observados, se observó la presencia de una especie de -18 Da en los dos primeros picos. Este cambio de masa es característico de una reacción de deshidratación, y tal reacción ha sido informada previamente por Mootz et. al. para una forma mutante de la inteína SspDnaB que no puede catalizar de manera eficaz el cambio de acilo de N a S inicial. (41) De manera específica, el intermedio tetraédrico de las reacciones de acilación directa e inversa puede sufrir deshidratación catalizada por ácido para producir un producto secundario de tiazolina. Para Mootz y colaboradores, esta especie fue un producto secundario irreversible para su inteína mutante en condiciones de reacción normales, y dio lugar a bajos rendimientos. En los sistemas del presente documento, donde las inteínas DnaE pueden reaccionar hasta completarse, esta especie es un artefacto de acidificación durante RP-HPLC o es completamente reversible en condiciones de reacción normales. Es de destacar que la observación de la tiazolina mediante MS valida aún más la presencia de niveles detectables del intermedio tetraédrico en las presentes mezclas de reacción.
Para las fusiones de inteína DnaE con proteínas distintas de la ubiquitina, se observaron perfiles de HPLC similares con múltiples picos a pH neutro, sin embargo, las relaciones de los tres picos variaron según la secuencia. De manera adicional, para secuencias más similares a la N-exteína DnaE "A-E-Y" endógena (como las fusiones SH3 con una secuencia "I-E-M"), se observó una acumulación sustancial de un producto deshidratado (hasta un 50 % mediante HPLC/MS), similar a lo observado por Mootz et. al. para la división de la inteína SspDnaE. (41) Para estos constructos, esta especie parece acumularse durante la expresión de proteínas dando como resultado una mezcla de proteínas de fusión "atrapadas" (deshidratadas) y "libres" (nativas, hidratadas). Tras la adición de MESNa a pH neutro, la proteína "libre" se somete rápidamente a la tiólisis para producir el producto deseado, y la proteína "atrapada" se rehidrata lentamente y también se tioliza para producir el mismo producto deseado. Por tanto, en las curvas de progreso de la reacción, se observó una fase de "descarga" seguida de una fase más lenta. De manera importante, la acumulación de proteína de fusión deshidratada podría reducirse mediante la expresión a temperaturas más bajas (18 °C en lugar de 37 °C), y estas reacciones podrían ser más rápidas y cercanas a la finalización mediante el aumento de la concentración de MESNa de 100 mM a MESNa 200 mM. Además, cabe destacar que para la reacción de la tiólisis SH3, la inteína MchtDnaE fue sustancialmente más eficaz que la inteína AvaDnaE, lo que sugiere que las diferentes inteínas DnaE fusionadas pueden ser preferibles, dependiendo de la proteína de interés.
Referencias
(1) Mills, K. V.; Perler, F. B. Protein Pept. Lett. 2005, 12, 751-5.
(2) Vila-Perelló, M.; Muir, T. W. Cell 2010, 143, 191-200.
(3) Southworth, M.; Amaya, K.; Evans, T.; Xu, M.; Perler, F. Biotechniques 1999, 27, 110-120.
(4) Amitai, G.; Callahan, B. P.; Stanger, M. J.; Belfort, G.; Belfort, M. Proc. Natl. Acad. Sci. USA 2009, 106, 11005­ 10.
(5) Zettler, J.; Schütz, V.; Mootz, H. D. FEBS Lett. 2009, 583, 909-14.
(6) Iwai, H.; Züger, S.; Jin, J.; Tarn, P.-H. FEBS Lett. 2006, 580, 1853-8.
(7) Perler, F. B. Nucleic Acids Res. 2002, 30, 383-4.
(8) Caspi, J.; Amitai, G.; Belenkiy, O.; Pietrokovski, S. Mol. Microbiol. 2003, 50, 1569-77.
(9) Dassa, B.; Amitai, G.; Caspi, J.; Schueler-Furman, O.; Pietrokovski, S. Biochemistry 2007, 46, 322-330.
(10) Chen, L.; Zhang, Y.; Li, G.; Huang, H.; Zhou, N. Anal. Biochem. 2010, 407, 180-7.
(11) Martin, D. D.; Xu, M. Q.; Evans, T. C. Biochemistry 2001, 40, 1393-402.
(12) Lockless, S. W.; Muir, T. W. Proc. Natl. Acad. Sci. USA 2009, 106, 10999-1004.
(13) Shah, N. H.; Vila-Perelló, M.; Muir, T. W. Angew. Chem. Int. Ed. Engl. 2011, 50, 6511-5.
(14) Oeemig, J. S.; Aranko, A. S.; Djupsjobacka, J.; Heinamaki, K.; Iwai, H. FEBS Lett. 2009, 583, 1451-1456. (15) Du, Z.; Liu, Y.; Ban, D.; Lopez, M. M.; Belfort, M.; Wang, C. J. Mol. Biol. 2010, 400, 755-67.
(16) Appleby-Tagoe, J. H.; Thiel, I. V.; Wang, Y.; Wang, Y.; Mootz, H. D.; Liu, X.-Q. J. Biol. Chem. 2011, 286, 34440-7.

Claims (13)

REIVINDICACIONES
1. Un método que comprende
(a) poner en contacto (1) una proteína de fusión que comprende un polipéptido y un fragmento N de inteína dividida que comprende una secuencia seleccionada del grupo que consiste en SEQ ID NO: 1-19, o una variante de la misma, en el que la variante comprende una secuencia seleccionada del grupo que consiste en SEQ ID NO: 21­ 38 y 761 y (2) un fragmento C de inteína dividida que comprende una secuencia seleccionada del grupo que consiste en SEQ ID NO: 57-74 y 708 o una variante de la misma, en la que la variante comprende una secuencia seleccionada del grupo que consiste en la SEQ ID NO: 75-128, 707 y 709-711,
en el que el contacto se realiza en condiciones que permiten la unión del fragmento N de la inteína dividida al fragmento C de la inteína dividida para formar un intermedio de inteína; y
(b) poner en contacto el intermedio de inteína con un nucleófilo para formar un conjugado de la proteína y el nucleófilo.
2. El método de la reivindicación 1, en el que el fragmento C de inteína dividida se une a un soporte.
3. El método de una cualquiera de las reivindicaciones 1 o 2, en el que la proteína de fusión está en un lisado celular completo o es de un sobrenadante celular.
4. El método de la reivindicación 3, que comprende además lavar el intermedio de inteína para separar el intermedio de inteína de los componentes del lisado celular completo o del sobrenadante celular.
5. El método de una cualquiera de las reivindicaciones 1 a 4, en el que el polipéptido tiene un peso molecular de 40 kDa o superior, en el que el polipéptido es un anticuerpo, o fragmento del mismo o en el que el polipéptido se secreta de una célula.
6. El método de una cualquiera de las reivindicaciones 1 a 5, que comprende además aislar el conjugado.
7. El método de una cualquiera de las reivindicaciones 1 a 6, en el que el nucleófilo comprende un segundo polipéptido, un oligonucleótido, una nanopartícula, un fármaco o un polímero.
8. El método de una cualquiera de las reivindicaciones 1 a 7, en el que el nucleófilo comprende un tiol y el conjugado comprende un tioéster, en el que opcionalmente el tiol es 2-mercaptoetansulfonato, un alquiltiol, o un ariltiol.
9. El método de la reivindicación 8, que comprende además hacer reaccionar el tioéster con un segundo nucleófilo para formar un segundo conjugado.
10. El método de la reivindicación 9, en el que el segundo nucleófilo comprende una amina, una hidrazina o una fracción amino-oxi.
11. Un complejo que comprende (i) una proteína de fusión que comprende un fragmento N de inteína dividida y un polipéptido, en el que el fragmento N de inteína dividida comprende una secuencia seleccionada del grupo que consiste en las SEQ ID NO: 6, 1-5, 7-38 y 761, y (ii) un fragmento C de intenína dividida que comprende una secuencia seleccionada del grupo que consiste en las SEq ID NO: 57-128, 417-704, 707-711 o 745-759.
12. El complejo de la reivindicación 11, en el que el polipéptido tiene un peso molecular de 40 kDa o superior, en el que el polipéptido es un anticuerpo o fragmento del mismo o en el que el polipéptido se secreta de una célula.
13. El complejo de una cualquiera de las reivindicaciones 11 o 12, en el que el fragmento C de inteína dividida está unido a un soporte.
ES18192415T 2012-06-27 2013-06-24 Inteínas divididas, conjugados y usos de las mismas Active ES2930185T3 (es)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US201261665215P 2012-06-27 2012-06-27

Publications (1)

Publication Number Publication Date
ES2930185T3 true ES2930185T3 (es) 2022-12-07

Family

ID=49783989

Family Applications (2)

Application Number Title Priority Date Filing Date
ES13809861T Active ES2709333T3 (es) 2012-06-27 2013-06-24 Inteínas divididas, conjugados y usos de las mismas
ES18192415T Active ES2930185T3 (es) 2012-06-27 2013-06-24 Inteínas divididas, conjugados y usos de las mismas

Family Applications Before (1)

Application Number Title Priority Date Filing Date
ES13809861T Active ES2709333T3 (es) 2012-06-27 2013-06-24 Inteínas divididas, conjugados y usos de las mismas

Country Status (10)

Country Link
US (4) US20150344549A1 (es)
EP (3) EP3431497B1 (es)
JP (2) JP2015522020A (es)
AU (1) AU2013280693B2 (es)
CA (1) CA2877882A1 (es)
DK (2) DK2877490T3 (es)
ES (2) ES2709333T3 (es)
PL (1) PL2877490T3 (es)
PT (1) PT2877490T (es)
WO (1) WO2014004336A2 (es)

Families Citing this family (66)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150044192A1 (en) 2013-08-09 2015-02-12 President And Fellows Of Harvard College Methods for identifying a target site of a cas9 nuclease
US9228207B2 (en) 2013-09-06 2016-01-05 President And Fellows Of Harvard College Switchable gRNAs comprising aptamers
EP3177718B1 (en) 2014-07-30 2022-03-16 President and Fellows of Harvard College Cas9 proteins including ligand-dependent inteins
CN104263747B (zh) * 2014-09-22 2017-03-15 程永升 一种长效蛋白质药物表达复性修饰的双标签载体及方法
SI3215614T1 (sl) 2014-11-03 2019-11-29 Merck Patent Gmbh Topni fuzijski proteini inteina in postopki za čiščenje biomolekul
WO2017070632A2 (en) 2015-10-23 2017-04-27 President And Fellows Of Harvard College Nucleobase editors and uses thereof
CA3051195A1 (en) * 2016-01-29 2017-08-03 The Trustees Of Princeton University Split inteins with exceptional splicing activity
US11293021B1 (en) 2016-06-23 2022-04-05 Inscripta, Inc. Automated cell processing methods, modules, instruments, and systems
KR20230095129A (ko) 2016-08-03 2023-06-28 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 아데노신 핵염기 편집제 및 그의 용도
US11661590B2 (en) 2016-08-09 2023-05-30 President And Fellows Of Harvard College Programmable CAS9-recombinase fusion proteins and uses thereof
WO2018039438A1 (en) 2016-08-24 2018-03-01 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
US11306324B2 (en) * 2016-10-14 2022-04-19 President And Fellows Of Harvard College AAV delivery of nucleobase editors
WO2018119359A1 (en) 2016-12-23 2018-06-28 President And Fellows Of Harvard College Editing of ccr5 receptor gene to protect against hiv infection
EP3592853A1 (en) 2017-03-09 2020-01-15 President and Fellows of Harvard College Suppression of pain by gene editing
KR20190127797A (ko) 2017-03-10 2019-11-13 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 시토신에서 구아닌으로의 염기 편집제
US11268082B2 (en) 2017-03-23 2022-03-08 President And Fellows Of Harvard College Nucleobase editors comprising nucleic acid programmable DNA binding proteins
US11560566B2 (en) 2017-05-12 2023-01-24 President And Fellows Of Harvard College Aptazyme-embedded guide RNAs for use with CRISPR-Cas9 in genome editing and transcriptional activation
WO2018213335A1 (en) * 2017-05-16 2018-11-22 Scalmibio, Inc. Activatable antibodies and methods of use thereof
US9982279B1 (en) 2017-06-23 2018-05-29 Inscripta, Inc. Nucleic acid-guided nucleases
US10011849B1 (en) 2017-06-23 2018-07-03 Inscripta, Inc. Nucleic acid-guided nucleases
US20190002874A1 (en) 2017-06-30 2019-01-03 Inscripta, Inc. Cell libraries created using rationally designed nucleic acids
EP3658573A1 (en) 2017-07-28 2020-06-03 President and Fellows of Harvard College Methods and compositions for evolving base editors using phage-assisted continuous evolution (pace)
EP3676376A2 (en) 2017-08-30 2020-07-08 President and Fellows of Harvard College High efficiency base editors comprising gam
US11795443B2 (en) 2017-10-16 2023-10-24 The Broad Institute, Inc. Uses of adenosine base editors
US10858761B2 (en) 2018-04-24 2020-12-08 Inscripta, Inc. Nucleic acid-guided editing of exogenous polynucleotides in heterologous cells
US10557216B2 (en) 2018-04-24 2020-02-11 Inscripta, Inc. Automated instrumentation for production of T-cell receptor peptide libraries
CN114854720A (zh) 2018-06-30 2022-08-05 因思科瑞普特公司 用于改进活细胞中编辑序列的检测的仪器、模块和方法
US11142740B2 (en) 2018-08-14 2021-10-12 Inscripta, Inc. Detection of nuclease edited sequences in automated modules and instruments
US11214781B2 (en) 2018-10-22 2022-01-04 Inscripta, Inc. Engineered enzyme
CN113891937A (zh) 2019-03-19 2022-01-04 布罗德研究所股份有限公司 编辑核苷酸序列的方法和组合物
US10815467B2 (en) 2019-03-25 2020-10-27 Inscripta, Inc. Simultaneous multiplex genome editing in yeast
US11001831B2 (en) 2019-03-25 2021-05-11 Inscripta, Inc. Simultaneous multiplex genome editing in yeast
WO2020210751A1 (en) 2019-04-12 2020-10-15 The Broad Institute, Inc. System for genome editing
CN113939593A (zh) 2019-06-06 2022-01-14 因思科瑞普特公司 用于递归的核酸指导的细胞编辑的处治
EP3999642A1 (en) 2019-07-19 2022-05-25 Flagship Pioneering Innovations VI, LLC Recombinase compositions and methods of use
EP4010474A1 (en) 2019-08-08 2022-06-15 The Broad Institute, Inc. Base editors with diversified targeting scope
AU2019463636A1 (en) * 2019-08-28 2022-03-17 Albert Einstein College Of Medicine Atypical split inteins and uses thereof
CN114450292A (zh) * 2019-09-09 2022-05-06 武汉友芝友生物制药股份有限公司 断裂型内含肽、使用其的重组多肽的制备方法
WO2021072328A1 (en) 2019-10-10 2021-04-15 The Broad Institute, Inc. Methods and compositions for prime editing rna
WO2021102059A1 (en) 2019-11-19 2021-05-27 Inscripta, Inc. Methods for increasing observed editing in bacteria
GB201917046D0 (en) 2019-11-22 2020-01-08 Ge Healthcare Bioprocess R&D Ab Improved protein production
EP4069851A4 (en) 2019-12-18 2023-11-22 Inscripta, Inc. CASCADE/DCAS3 COMPLEMENTATION ASSAYS FOR IN VIVO DETECTION OF NUCLEIC ACID-GUIDED NUCLEASE-MODIFIED CELLS
CA3157061A1 (en) 2020-01-27 2021-08-05 Christian SILTANEN Electroporation modules and instrumentation
US20230108687A1 (en) 2020-02-05 2023-04-06 The Broad Institute, Inc. Gene editing methods for treating spinal muscular atrophy
US20230127008A1 (en) 2020-03-11 2023-04-27 The Broad Institute, Inc. Stat3-targeted base editor therapeutics for the treatment of melanoma and other cancers
US20210332388A1 (en) 2020-04-24 2021-10-28 Inscripta, Inc. Compositions, methods, modules and instruments for automated nucleic acid-guided nuclease editing in mammalian cells
US20230159913A1 (en) 2020-04-28 2023-05-25 The Broad Institute, Inc. Targeted base editing of the ush2a gene
IL297761A (en) 2020-05-08 2022-12-01 Broad Inst Inc Methods and compositions for simultaneously editing two helices of a designated double-helix nucleotide sequence
US11787841B2 (en) 2020-05-19 2023-10-17 Inscripta, Inc. Rationally-designed mutations to the thrA gene for enhanced lysine production in E. coli
WO2022060749A1 (en) 2020-09-15 2022-03-24 Inscripta, Inc. Crispr editing to embed nucleic acid landing pads into genomes of live cells
JP2023543803A (ja) 2020-09-24 2023-10-18 ザ ブロード インスティテュート,インコーポレーテッド プライム編集ガイドrna、その組成物、及びその使用方法
US11512297B2 (en) 2020-11-09 2022-11-29 Inscripta, Inc. Affinity tag for recombination protein recruitment
EP4271802A1 (en) 2021-01-04 2023-11-08 Inscripta, Inc. Mad nucleases
EP4274890A1 (en) 2021-01-07 2023-11-15 Inscripta, Inc. Mad nucleases
CA3203876A1 (en) 2021-01-11 2022-07-14 David R. Liu Prime editor variants, constructs, and methods for enhancing prime editing efficiency and precision
US11884924B2 (en) 2021-02-16 2024-01-30 Inscripta, Inc. Dual strand nucleic acid-guided nickase editing
WO2022187546A1 (en) 2021-03-03 2022-09-09 Shape Therapeutics Inc. Auxotrophic cells for virus production and compositions and methods of making
KR20240007210A (ko) 2021-05-12 2024-01-16 씨티바 바이오프로세스 알&디 에이비 개선된 단백질 정제
AU2022325166A1 (en) 2021-08-06 2024-02-08 President And Fellows Of Harvard College Improved prime editors and methods of use
WO2023027169A1 (ja) * 2021-08-27 2023-03-02 国立大学法人 東京医科歯科大学 生細胞の選別システム
WO2023076898A1 (en) 2021-10-25 2023-05-04 The Broad Institute, Inc. Methods and compositions for editing a genome with prime editing and a recombinase
WO2023102538A1 (en) 2021-12-03 2023-06-08 The Broad Institute, Inc. Self-assembling virus-like particles for delivery of prime editors and methods of making and using same
CN114606252A (zh) * 2022-04-20 2022-06-10 广州市乾相生物科技有限公司 一种基于过滤法的寡肽合成及纯化方法
WO2023205687A1 (en) 2022-04-20 2023-10-26 The Broad Institute, Inc. Improved prime editing methods and compositions
WO2023250174A1 (en) 2022-06-23 2023-12-28 Prime Medicine, Inc. Split prime editors
WO2024077267A1 (en) 2022-10-07 2024-04-11 The Broad Institute, Inc. Prime editing methods and compositions for treating triplet repeat disorders

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4179337A (en) 1973-07-20 1979-12-18 Davis Frank F Non-immunogenic polypeptides
US4289872A (en) 1979-04-06 1981-09-15 Allied Corporation Macromolecular highly branched homogeneous compound based on lysine units
JPS6023084B2 (ja) 1979-07-11 1985-06-05 味の素株式会社 代用血液
US4640835A (en) 1981-10-30 1987-02-03 Nippon Chemiphar Company, Ltd. Plasminogen activator derivatives
US4496689A (en) 1983-12-27 1985-01-29 Miles Laboratories, Inc. Covalently attached complex of alpha-1-proteinase inhibitor with a water soluble polymer
DE3675588D1 (de) 1985-06-19 1990-12-20 Ajinomoto Kk Haemoglobin, das an ein poly(alkenylenoxid) gebunden ist.
US4791192A (en) 1986-06-26 1988-12-13 Takeda Chemical Industries, Ltd. Chemically modified protein with polyethyleneglycol
US5229490A (en) 1987-05-06 1993-07-20 The Rockefeller University Multiple antigen peptide system
KR970005898B1 (ko) 1987-09-21 1997-04-21 젠- 프로우브 인코퍼레이티드 뉴클레오티드 프로브에 대한 비-뉴클레오티드 연결시약
JPH07505915A (ja) 1992-04-14 1995-06-29 コーネル リサーチ ファウンデーション、インコーポレーテッド 樹枝状巨大分子およびその製造法
WO1995006731A2 (en) 1993-09-02 1995-03-09 Ribozyme Pharmaceuticals, Inc. Non-nucleotide containing enzymatic nucleic acid
JPH09504297A (ja) 1993-10-27 1997-04-28 リボザイム・ファーマシューティカルズ・インコーポレーテッド 2′−アミドおよび2′−ペプチド修飾オリゴヌクレオチド
ES2260956T3 (es) * 1998-12-18 2006-11-01 The Penn State Research Foundation Ciclacion de peptidos mediada por inteina.
AU4155602A (en) * 2000-11-01 2002-06-18 Elusys Therapeutics Inc Method of producing biospecific molecules by protein trans-splicing
CN101333555B (zh) * 2007-12-25 2012-03-21 浙江大学 新型的g蛋白偶联受体细胞水平筛选系统构建与应用
WO2009132455A1 (en) * 2008-04-30 2009-11-05 Paul Xiang-Qin Liu Protein splicing using short terminal split inteins
CN101281201A (zh) * 2008-05-07 2008-10-08 南京大学 利用内含肽反式剪接制作蛋白质分子量标准的方法
US8420387B2 (en) * 2009-11-06 2013-04-16 Agrivida, Inc. Intein-modified enzymes, their production and industrial applications
US8986953B2 (en) * 2011-01-20 2015-03-24 University Of Rochester Macrocyclic compounds with a hybrid peptidic/non-peptidic backbone and methods for their preparation
US10100080B2 (en) * 2011-09-28 2018-10-16 Era Biotech, S.A. Split inteins and uses thereof

Also Published As

Publication number Publication date
US20200087388A1 (en) 2020-03-19
AU2013280693B2 (en) 2018-01-04
EP2877490A4 (en) 2016-07-06
WO2014004336A3 (en) 2014-03-27
WO2014004336A2 (en) 2014-01-03
DK3431497T3 (da) 2022-10-10
JP6591511B2 (ja) 2019-10-16
US10526401B2 (en) 2020-01-07
JP2015522020A (ja) 2015-08-03
US11161899B2 (en) 2021-11-02
EP3431497A1 (en) 2019-01-23
US20150344549A1 (en) 2015-12-03
PT2877490T (pt) 2019-02-12
JP2018111685A (ja) 2018-07-19
EP2877490B1 (en) 2018-09-05
AU2013280693A1 (en) 2015-02-12
PL2877490T3 (pl) 2019-03-29
US20180057577A1 (en) 2018-03-01
US20220098293A1 (en) 2022-03-31
EP2877490A2 (en) 2015-06-03
EP4219549A1 (en) 2023-08-02
ES2709333T3 (es) 2019-04-16
EP3431497B1 (en) 2022-07-27
CA2877882A1 (en) 2014-01-03
DK2877490T3 (en) 2018-12-17

Similar Documents

Publication Publication Date Title
ES2930185T3 (es) Inteínas divididas, conjugados y usos de las mismas
ES2880336T3 (es) Métodos y productos para la síntesis de proteínas de fusión
ES2949163T3 (es) Inteínas divididas con actividad de corte y empalme excepcional
Rocco et al. Construction and use of new cloning vectors for the rapid isolation of recombinant proteins from Escherichia coli
ES2383191T3 (es) Métodos y composiciones
ES2321058T3 (es) Purificacion de proteinas recombinantes fusionadas con epitopos multiples.
Wang et al. Engineering protein theranostics using bio-orthogonal asparaginyl peptide ligases
Shen et al. Chemical synthesis of integral membrane proteins: methods and applications
US20170204445A1 (en) In vivo site-specific protein tagging using engineered sortase variants
Bachmann et al. Chemical-tag labeling of proteins using fully recombinant split inteins
Wang et al. PAL-Mediated Ligation for Protein and Cell-Surface Modification
Palei et al. Preparation of Semisynthetic Peptide Macrocycles Using Split Inteins
WO2021100833A1 (ja) N-メチルアミノ酸の取り込みを増強するtRNAのTステムの改変
Mochnáčová et al. Simple and rapid pipeline for the production of cyclic and linear small-sized peptides in E. coli
Diaz et al. Expressed protein ligation: General experimental protocols
KR20230165919A (ko) 루프 또는 말단에서 펩티드 태그와 상호작용하는 폴리펩티드 및 그의 용도
WO2005012902A1 (ja) 有用タンパク質のスクリーニング方法
Haugbro Development of in-situ Protein Engineering Technologies for the Study of Modified Proteins
Díaz Perlas From phage display and venoms to protease-resistant peptides: Design of BBB-shuttles and peptides targeting EGF
Mills Protein splicing in trans by intein segments