ES2324608T3 - Incorporacion especifica de sitio de cetoaminoacidos en proteinas. - Google Patents

Incorporacion especifica de sitio de cetoaminoacidos en proteinas. Download PDF

Info

Publication number
ES2324608T3
ES2324608T3 ES03809019T ES03809019T ES2324608T3 ES 2324608 T3 ES2324608 T3 ES 2324608T3 ES 03809019 T ES03809019 T ES 03809019T ES 03809019 T ES03809019 T ES 03809019T ES 2324608 T3 ES2324608 T3 ES 2324608T3
Authority
ES
Spain
Prior art keywords
trna
cell
protein
phenylalanine
acetyl
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
ES03809019T
Other languages
English (en)
Inventor
Peter G. Schultz
Lei Wang
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Scripps Research Institute
Original Assignee
Scripps Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Scripps Research Institute filed Critical Scripps Research Institute
Application granted granted Critical
Publication of ES2324608T3 publication Critical patent/ES2324608T3/es
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/67General methods for enhancing the expression
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • A61K38/16Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/93Ligases (6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/005Glycopeptides, glycoproteins

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Immunology (AREA)
  • Veterinary Medicine (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Epidemiology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Organic Low-Molecular-Weight Compounds And Preparation Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

Composición que comprende una aminoacil-ARNt sintetasa ortogonal (O-RS), en la que la O-RS aminoacila preferentemente un primer ARNt ortogonal (O-ARNt) con acetil-L-fenilalanina con una eficacia de al menos 50% de la eficacia de un sistema de traducción que comprende p-acetil-L-fenialanina, un O-ARNt de SEQ ID NO.: 21, y un polipéptido sintetasa que comprende una secuencia de aminoácidos seleccionada de la SEQ ID NO.: 18-20.

Description

Incorporación específica de sitio de cetoaminoácidos en proteínas.
Campo de la invención
La invención se sitúa en el campo de la bioquímica de la traducción. La invención se refiere a procedimientos de producción y a composiciones de ARNt ortogonales, aminoacil-ARNt sintetasas ortogonales y a parejas de los mismos, que incorporan cetoaminoácidos en proteínas. La invención también se refiere a procedimientos para producir proteínas en células usando dichas parejas y composiciones relacionadas.
Antecedentes de la invención
Los códigos genéticos de todos los organismos conocidos codifican los mismos 20 aminoácidos comunes como unidades estructurales para la biosíntesis de proteínas. Las cadenas laterales de estos aminoácidos comprenden un número sorprendentemente limitado de grupos funcionales - -bases nitrogenadas, ácidos carboxílicos y amidas, alcoholes y un grupo tiol (y en casos raros, selenocisteína (véase, por ejemplo, Bock, A., y col., (1991) Mol. Microbiol. 5:515-520) o pirrolisina (véase, por ejemplo, Srinivasan, G., y col., (2002) Science 296:1459-1462; Hao, B., y col., (2002) Science 296:1462-1466)), siendo el resto alcanos sencillos o grupos hidrófobos. La capacidad de aumentar los aminoácidos genéticamente codificados con nuevos aminoácidos, por ejemplo, aminoácidos con cadenas laterales quelantes de metales, fluorescentes, activas redox, fotoactivas o con marcador paramagnético, potenciaría significativamente la capacidad de manipular las estructuras y funciones de proteínas y quizás de los propios organismos vivos. Recientemente, se ha descrito que mediante la adición de nuevos componentes a la maquinaria de traducción de Escherichia coli, se podían incorporar de forma específica del sitio con alta fidelidad una serie de aminoácidos no naturales en proteínas, in vivo. Véase, por ejemplo, Wang, L., y col., (2001) Science 292:498-500; Wang, L., y col., (2002) J. Am. Chem. Soc. 124:1836-1837; y, Zhang, Z., y col., (2002) Angew. Chem. Int. Ed. Engl. 41:2840-2842.
Chin y col. (PNAS, 99(17): 11020-11024,2002) se refieren a una pareja de aminoacil-ARNt sintetasa/ARNt ortogonal para incorporar p-benzoil-L-fenilalanina en proteínas en E. coli.
Liu y Schultz (PNAS USA, 96: 4780-4785, 1999) describen un supresor de ARNt derivado de levadura y una glutaminil-ARNt sintetasa de levadura que forman una pareja de ARNt/sintetasa ortogonal en E. coli.
Mendel y col. (Annu. Rev. Biophys. Biomol. Struct., 24: 435-462,1995) describen procedimientos que usan ARNt supresor del codón ámbar químicamente aminoacilado con un aminoácido deseado para la incorporación específico de sitio de un aminoácido en una proteína en respuesta a un codón ámbar.
El grupo ceto es ubicuo en la química orgánica y participa en una serie grande de reacciones desde reacciones de adición y descarboxilación a condensaciones aldólicas. Además, la reactividad única del grupo carbonilo permite que se pueda modificar selectivamente con derivados de hidrazida e hdiroxilamina en presencia de otras cadenas laterales de aminoácidos. Véase, por ejemplo, Cornish, V.W., y col., (1996) J. Am. Chem. Soc. 118:8150-8151; Geoghegan, K.F. y Stroh, J.G. (1992) Bioconjug. Chem. 3:138-146; y, Mahal, L.K., y col., (1997) Science 276:1125-1128. Aunque está presente en cofactores (Véase, por ejemplo, Begley, T.P., y col., (1997) en Top. Curr. Chem., eds. Leeper, F.J. y Vederas, J.C. (Springer-Verlag, New York), Vol. 195, pp. 93-142), metabolitos (Véase, por ejemplo, Diaz, E., y col., (2001) Microbiol. Mol. Biol. Rev. 65:523-569), y como una modificación postraduccional en proteínas (Véase, por ejemplo, Okeley, N.M. y van der Donk, W. yA. (2000) Chem. Biol. 7, R159-R171), este importante grupo funcional está ausente de las cadenas laterales de los aminoácidos comunes. La adición de la cadena lateral de carbonilo a un aminoácido permitiría que proteínas que comprendieran este aminoácido participaran en una serie grande de reacciones, desde reacciones de adición y descarboxilación a condensaciones aldólicas, por ejemplo, para ser modificadas selectivamente con derivados de hidrazida e hidroxilamina.
El grupo ceto proporciona una reactividad química única que no está presente en los 20 aminoácidos comunes debido a su capacidad para participar en reacciones de adición que implican al grupo carbonilo o la posición ácida del C_{\alpha}. Este grupo también proporciona una alternativa al aminoácido natural cisteína para la modificación selectiva de proteínas con una gran variedad de reactivos químicos. El grupo reactivo tiol de la cisteína se ha usado ampliamente para unir diferentes sondas biofísicas a proteínas. Véase, por ejemplo, Creighton, T.E. (1986) Methods Enzymol. 131:83-106; Altenbach, C., y col., (1990) Science 248: 1088-92; Brinkley, M. (1992) Bioconjug. Chem. 3:2-13; Giuliano, K.A., y col., (1995) Annu. Rev. Biophys. Biomol. Struct. 24:405-34; Mannuzzu, L.M., y col., (1996) Science 271:213-6; Griffin, B. y col., (1998) Science 281:269-272; Llopis, J., y col., (2000) Methods Enzymol. 327:546-64; y, Gaietta, G., y col., (2002) Science 296:503-7. Desgraciadamente, el marcaje de restos de cisteína únicos a menudo es complicado por la presencia de más de un resto de cisteína accesible en una proteína, así como por reacciones de intercambio del disulfuro resultante en presencia del tiol libre. Por lo tanto, la capacidad de un aminoácido no proteinogénico con reactividad ortogonal permite la modificación selectiva de la proteína en el caso de que no se pueda marcar selectivamente una sola cisteína, cuando se necesitan dos marcadores diferentes, y cuando un enlace disulfuro puede no ser suficientemente estable. El grupo carbonilo reacciona fácilmente con hidrazidas, hidroxilaminas y semicarbazidas en condiciones suaves en disolución acuosa, y forma enlaces hidrazona, oxima y semicarbazona, respectivamente, que son estables en condiciones fisiológicas. Véase, por ejemplo, Jencks, W.P. (1959) J. Am. Chem. Soc. 81, 475-481; Shao, J. y Tam, J.P. (1995) J. Am. Chem. Soc. 117:3893-3899.
Se han desarrollado varios procedimientos para incorporar selectivamente el grupo carbonilo en péptidos y proteínas. Inicialmente, se introdujo un aldehído en el extremo N de péptidos por oxidación de serina o treonina N-terminales con peryodato, seguido de acoplamiento con biotina e indicadores fluorescentes por un enlace hidrazona. Véase, por ejemplo, Geoghegan, K.F. y Stroh, J.G. (1992) Bioconjug. Chem. 3:138-146. Sin embargo, este procedimiento está restringido a la modificación N-terminal de las proteínas. Más tarde se usó la síntesis de péptidos en fase sólida para preparar segmentos peptídicos que contenían una hidrazida o hidroxilamina, que posteriormente reacciona con una matriz de núcleo de aldehído ramificado para formar dendrímeros peptídicos (véase, por ejemplo, Shao, J. y Tam, J.P. (1995) J. Am. Chem. Soc. 117:3893-3899; Rose, K. (1994) J. Am. Chem. Soc. 116: 30-33), o con un segmento peptídico que contiene ceto para formar proteínas sintéticas (véase, por ejemplo, Canne, L.E., y col., (1995) J. Am. Chem. Soc. 117:2998-3007). Este procedimiento se puede aplicar en general a péptidos o proteínas pequeñas menores de 100 restos, pero está limitado por dificultades asociadas con la síntesis de péptidos y proteínas grandes.
También se ha usado un procedimiento biosintético in vitro para incorporar el grupo ceto en proteínas. Véase, por ejemplo, Cornish, V.W., y col., (1996), véase antes. En este procedimiento, el aminoácido no natural que contiene el grupo ceto se acila químicamente a un ARNt supresor de ámbar. Cuando el ARNt acilado y el gen mutante se combinan en un extracto in vitro capaz de soportar la biosíntesis de proteínas, el aminoácido no natural se incorpora selectivamente en respuesta a un codón UAG. Este procedimiento requiere que el ARNt sea aminoacilado químicamente con el aminoácido no natural in vitro, y el ARNt acilado es consumido como un reactivo estequiométrico durante la traducción y no se puede regenerar, dando como resultado rendimientos bajos de la proteína.
Para expandir más el código genético y aumentar la diversidad de estructuras de aminoácidos no naturales, por ejemplo, un cetoaminoácido, que se pueda incorporar en proteínas en una célula, es necesario desarrollar componentes mejores y/o adicionales de la maquinaria biosintética, por ejemplo, ARNt ortogonales, aminoacil-ARNt sintetasas ortogonales y/o codones únicos que puedan usar un cetoaminoácido y que puedan regenerarse. Esta invención satisface estas y otras necesidades, como será evidente tras la revisión de la siguiente descripción.
Resumen de la invención
La invención proporciona composiciones y procedimientos para producir componentes ortogonales para incorporar p-acetil-L-fenilalanina en una cadena de polipéptido en crecimiento, en respuesta a un codón selector, por ejemplo, codón de parada, un codón sin sentido, un codón de cuatro o más bases, etc., por ejemplo, in vivo. Por ejemplo, la invención proporciona ARNt ortogonales (O-ARNt), aminoacil-ARNt sintetasas ortogonales (O-RS) y parejas de los mismos, que se pueden usar para incorporar cetoaminoácidos en cadenas de polipéptidos en crecimiento, como se expone en las reivindicaciones.
Normalmente, una aminoacil-ARNt sintetasa ortogonal (O-RS) de la invención aminoacila preferentemente un O-ARNt con una eficacia de al menos aproximadamente, por ejemplo, un 50%, un 60%, un 75%, un 80% o un 90% o más de la eficacia de un polipéptido que comprende una secuencia de aminoácidos seleccionada de la SEQ ID NO.: 18 a 20 con p-acetil-L-fenilalanina. En algunas realizaciones, la O-RS comprende una secuencia de aminoácidos que comprende una cualquiera de las SEQ ID NO.: 18-20, o una variación conservativa de los mismos.
Una composición que incluye una O-RS puede incluir además opcionalmente un ARNt ortogonal (O-ARNt), en el que el O-ARNt reconoce un codón selector. En algunas realizaciones, el O-ARNt comprende o es codificado por una secuencia de polinucleótido de SEQ ID NO.: 21. Una composición que incluye una O-RS puede incluir opcionalmente una célula (por ejemplo, una célula no eucariota, tal como una célula de E. coli y similares, o una célula eucariota) y/o un sistema de traducción.
La invención también proporciona una célula (por ejemplo, una célula no eucariota o una célula eucariota) que comprende un sistema de traducción, en el que el sistema de traducción incluye un ARNt ortogonal (O-ARNt); una aminoacil-ARNt sintetasa ortogonal (O-RS); y p-acetil-L-fenilalanina. Normalmente, la O-RS aminoacila preferentemente el O-ARNt con una eficacia de al menos aproximadamente, por ejemplo, un 50%, un 60%, un 75%, un 80% o un 90% o más de eficacia, de la eficacia de un polipéptido que comprende una secuencia de aminoácidos seleccionada de las SEQ ID NO.: 18 a 20 con p-acetil-L-fenilalanina. El O-ARNt reconoce el primer codón selector y la O-RS aminoactila preferentemente el O-ARNt con p-acetil-L-fenilalanina. En algunas realizaciones, el O-ARNt comprende o es codificado por una secuencia de polinucleótido como se muestra en la SEQ ID NO.: 21, o una secuencia de polinucleótido complementaria a la misma. En algunas realizaciones, la O-RS comprende una secuencia de aminoácidos como se muestra en una cualquiera de las SEQ ID NO.: 18-20, o una variación conservativa de los mismos. Opcionalmente, una célula de la invención incluye un ácido nucleico que comprende un polinucleótido que codifica un polipéptido de interés, en el que el polinucleótido comprende un codón selector que es reconocido por el O-ARNt.
Una célula de la invención incluye opcionalmente una célula de E. coli que incluye un ARNt ortogonal (O-ARNt), una aminoacil-ARNt sintetasa ortogonal (O-RS), un cetoaminoácido, y un ácido nucleico que comprende un polinucleótido que codifica un polipéptido de interés, en el que el polinucleótido comprende el codón selector que es reconocido por el O-ARNt. Normalmente, la O-RS aminoacila preferentemente el O-ARNt con una eficacia de al menos aproximadamente, por ejemplo, un 50%, un 60%, un 75%, un 80% o un 90% o más de eficacia, de la eficacia de un polipéptido que comprende una secuencia de aminoácidos de SEQ ID NO.: 18 con p-acetil-L-fenilalanina.
\newpage
En algunas realizaciones de la invención, un O-ARNt de la invención comprende o es codificado por una secuencia de polinucleótido como se muestra en la SEQ ID NO.: 21, o una secuencia de polinucleótido complementaria del mismo. En algunas realizaciones de la invención, una OR-S comprende una secuencia de aminoácidos como se muestra en las SEQ ID NO.: 18-20, o una variación conservativa de los mismos.
El O-ARNt y/o la O-RS de la invención pueden obtenerse de cualquiera de una variedad de organismos (por ejemplo, organismos eucariotas y/o no eucariotas). En algunas realizaciones, la O-RS y el O-ARNt se obtienen de Methonococcus jannaschii.
Los polipéptidos y polinucleótidos también son una característica de la invención. Un polipéptido de la invención incluye un polipéptido artificial (por ejemplo, hecho por el hombre y que no es natural) que comprende una secuncia de aminoácidos como se muestra en las SEQ ID NO.: 18-20, y/o variaciones conservativas. Un polipéptido de la invención incluye un polinucleótido artificial que codifica un polipéptido que comprende un aminoácido como se muestra en las SEQ ID NO.: 18-20.
Los vectores que comprenden un polinucleótido de la invención también son una característica de la invención. Por ejemplo, un vector de la invención puede incluir un plásmido, un cósmido, un fago, un virus, un vector de expresión y/o similares. Una célula que comprende un vector de la invención también es una característica de la invención.
También son una característica de la invención los procedimientos para producir una proteína en una célula (por ejemplo, una célula no eucariota, tal como una célula de E. coli o similar, o una célula eucariota) con p-acetil-L-fenilalanina en una posición específica. Por ejemplo, un procedimiento incluye hacer crecer una célula, en un medio adecuado, en el que la célula comprende un ácido nucleico que comprende al menos un codón selector y codifica una proteína, proporcionar p-acetil-L-fenilalanina e incorporar el cetoaminoácido en la posición específica en la proteína durante la traducción del ácido nucleico con al menos un codón selector, produciendo así la proteína. La célula comprende además: un ARNt ortogonal (O-ARNt) que funciona en la célula y reconoce el codón selector; y una aminoacil-ARNt sintetasa ortogonal (O-RS) que aminoacila preferentemente el O-ARNt con una eficacia de al menos aproximadamente, por ejemplo, un 50%, un 60%, un 75%, un 80% o un 90% o más eficacia, de la eficacia de un polipéptido que comprende una secuencia de aminoácidos de SEQ ID NO.: 18 con p-acetil-L-fenilalanina. En algunas realizaciones, la O-RS comprende una secuencia de aminoácidos que comprende una cualquiera de las SEQ ID NO.: 18-20. En algunas realizaciones, el O-ARNt comprende o es codificado por una secuencia de polinucleótido como se muestra en la SEQ ID NO.: 21, o una secuencia de polinucleótidos complementaria del mismo.
Definiciones
Antes de describir la invención con detalle, hay que entender que esta invención no está limitada a sistemas biológicos particulares que, por supuesto, pueden variar. También hay que entender que la terminología usada en el presente documento tiene solo el propósito de describir realizaciones particulares, y no se pretende que sea limitante. Como se usa en esta memoria descriptiva y las reivindicaciones adjuntas, las formas singulares "un", "una" y "el", "la" incluyen los referentes plurales salvo que el contenido indique claramente otra cosa. Así por ejemplo, la referencia a "una célula" incluye una combinación de dos o más células; la referencia a "bacterias" incluye mezclas de bacterias y similares.
Salvo que se definan en el presente documento y a continuación en el resto de la memoria descriptiva, todos los términos técnicos y científicos usados en el presente documento tienen los mismos significados que entiende habitualmente un experto en la materia a la que pertenece la invención.
Ortogonal: Tal como se usa en el presente documento, el término "ortogonal" se refiere a una molécula (por ejemplo, un ARNt ortogonal (O-ARNt) y/o aminoacil-ARNt sintetasa ortogonal (O-RS)) que funciona con componentes endógenos de una célula con eficacia reducida comparado con una molécula correspondiente que es endógena a la célula u otro sistema de traducción, o que no funciona con componentes endógenos de la célula. En el contexto de los ARNt y aminoacil-ARNt sintetasas, ortogonal se refiere a una incapacidad o eficacia reducida, por ejemplo, menos de 20% de eficacia, menos de 10% de eficacia, menos de 5% de eficacia, o menos de 1% de eficacia, de un ARNt ortogonal para funcionar con una ARNt sintetasa endógena comparado con un ARNt endógeno para funcionar con la ARNt sintetasa endógena, o de una aminoacil-ARNt sintetasa ortogonal para funcionar con un ARNt endógeno comparado con una ARNt sintetasa endógena para funcionar con el ARNt endógeno. La molécula ortogonal carece de una molécula complementaria endógena funcional en la célula. Por ejemplo, un ARNt ortogonal en un sistema de traducción de interés es aminoacilado por cualquier RS endógena de un sistema de traducción de interés con eficacia reducida o incluso cero, cuando se compara con la aminoacilación de un ARNt endógeno por la RS endógena. En otro ejemplo, una RS ortogonal aminoacila cualquier ARNt endógeno en el sistema de traducción de interés con eficacia reducida o incluso cero, comparado con la aminoacilación del ARNt endógeno por una RS
endógena.
Cognado: El término "cognado" se refiere a componentes que funcionan juntos, por ejemplo, un ARNt ortogonal y una aminoacil-ARNt sintetasa ortogonal. Los componentes también se pueden denominar como complementarios.
Aminoacila preferentemente: La expresión "aminoacila preferentemente" se refiere a una eficacia, por ejemplo, 70% de eficacia, 75% de eficacia, 85% de eficacia, 90% de eficacia o 99% o más de eficacia, con la que una O-RS aminoacila un O-RNAt con un cetoaminoácido comparado con la O-RS que aminoacetila un ARNt natural o un material de partida usado para generar el O-ARNt.
Codón selector: La expresión "codón selector" se refiere a codones reconocidos por el O-ARNt en el proceso de traducción y no reconocidos normalmente por un ARNt endógeno. El bucle de anticodón de O-ARNt reconoce el codón selector en el ARNm e incorpora su aminoácido, por ejemplo, un aminoácido no natural, tal como un cetoaminoácido, en este sitio en el polipéptido. Los codones selectores pueden incluir, por ejemplo, codones sin sentido, tales como codones de parada, por ejemplo, los codones ámbar, ocre y ópalo; codones de cuatro o más bases; codones raros; codones derivados de pares de bases naturales o no naturales y/o similares.
ARNt supresor: Un ARNt supresor es un ARNt que altera la lectura de un ARN mensajero (ARNm) en un sistema de traducción dado, por ejemplo, proporcionando un mecanismo para incorporar un aminoácido en una cadena de polipéptido en respuesta a un codón selector. Por ejemplo, un ARNt supresor puede leer, por ejemplo, a lo largo de un codón de parada, un codón de cuatro bases, un codón raro, y/o similares.
Actividad de supresión: La expresión "actividad de supresión" se refiere a la capacidad de un ARNt, por ejemplo, un ARNt supresor de leer a lo largo de un codón selector.
Sistema de traducción: La expresión "sistema de traducción" se refiere a los componentes necesarios para incorporar un aminoácido natural en una cadena de polipéptido en crecimiento (proteína). Los componentes de un sistema de traducción pueden incluir, por ejemplo, ribosomas, ARNt, sintetasas, ARNm y similares. Los componentes de la invención se pueden añadir a un sistema de traducción in vitro o in vivo, por ejemplo, una célula no eucariota, por ejemplo, una bacteria (tal como E. coli), una arquea o una célula eucariótica, por ejemplo, una célula de levadura, una célula de mamífero, una célula vegetal, una célula de alga, una célula de hongo, una célula de insecto y/o similares.
Aminoácido no natural: Tal como se usa en el presente documento, la expresión "aminoácido no natural" se refiere a cualquier aminoácido, aminoácido modificado y/o análogo de aminoácido, tal como un cetoaminoácido, que no es uno de los 20 aminoácidos naturales comunes o selenocisteína o pirrolisina.
Obtenido de: Tal como se usa en el presente documento, la expresión "derivado de" se refiere a un componente que se aísla de o se hace usando información de una molécula u organismo específico.
Marcador de selección o cribado positivo: Tal como se usa en el presente documento, la expresión "marcador de selección o cribado positivo" se refiere a un marcador que cuando está presente, por ejemplo, expresado, activado o similar, da como resultado la identificación de una célula que comprende la característica, por ejemplo, células con el marcador de selección positiva, de aquellas sin la característica.
Marcador de selección o cribado negativo: Tal como se usa en el presente documento, la expresión "marcador de selección o cribado negativo" se refiere a un marcador que cuando está presente, por ejemplo, expresado, activado o similar, permite la identificación de una célula que no comprende la propiedad o característica (por ejemplo, comparado con una célula que no tiene la propiedad o característica).
Indicador: Tal como se usa en el presente documento, el término "indicador" se refiere a un componente que se puede usar para seleccionar componentes objetivo de un sistema de interés. Por ejemplo, un indicador puede incluir una proteína, por ejemplo, una enzima, que confiere resistencia o sensibilidad a antibióticos (por ejemplo, \beta-lactamasa, cloranfenicol acetiltransferasa (CAT) y similares), un marcador de cribado fluorescente (por ejemplo, proteína verde fluorescente (por ejemplo, (GFP), YFP, EGFP, RFP, etc.), un marcador luminiscente (por ejemplo, una proteína luciferasa de luciérnaga), un marcador de cribado basado en afinidad, o genes marcadores seleccionables positivos o negativos tales como lacZ, \beta-gal/lacZ (\beta-galactosidasa), Adh (alcohol deshidrogenasa), his3, ura3, leu2, lys2 o similares.
Eucariota: Tal como se usa en el presente documento, el término "eucariota" se refiere a organismos que pertenecen al dominio filogenético Eucarya tales como animales (por ejemplo, mamíferos, insectos, reptiles, aves, etc.), ciliados, plantas (por ejemplo, monocotiledóneas, dicotiledóneas, algas, etc.), hongos, levaduras, flagelados, microsporidios, protistas, etc.
No eucariota: Tal como se usa en el presente documento, el término "no eucariota" se refiere a organismos no eucariotas. Por ejemplo, un organismo no eucariota puede pertenecer al dominio filogenético de las eubacterias (por ejemplo, Escherichia coli, Thermus thermophilus, Bacillus stearothermophilus, etc.), o al dominio filogenético de las arqueas (por ejemplo, Methanococcus jannaschii (Mj), Methanosarcina mazei (Mm), Methanobacterium thermoautotrophicum (Mt), Methanococcus maripaludis, Methanopyrus kandleri, Halobacterium tales como Haloferax volcanii y especies Halobacterium NRC-1, Archaeoglobus fulgidus (Af), Pyrococcus furiosus (Pf), Pyrococcus horikoshii (Ph), Pyrobaculum aerophilum, Pyrococcus abyssi, Sulfolobus solfataricus (Ss), Sulfolobus tokodaii, Aeuropyrumpernix (Ap), Thermoplasma acidophilum, Thermoplasma volcanium, etc.).
Variante conservativa: La expresión "variante conservativa" se refiere a un componente de traducción, por ejemplo, una variante conservativa de O-ARNt o una variante conservativa de O-RS, que funcionalmente se comporta como el componente en el cual está basada la variante conservativa, por ejemplo, un O-ARNt o O-RS, pero que tienen variaciones en la secuencia. Por ejemplo, una O-RS aminoacilará un O-ARNt complementario o una variante conservativa de O-ARNt con un aminoácido no natural, por ejemplo, un cetoaminoácido, aunque el O-ARNt y la variante conservativa de O-ARNt no tengan la misma secuencia. La variante conservativa puede tener, por ejemplo, una variación, 2 variaciones, 3 variaciones, 4 variaciones o 5 o más variaciones en la secuencia, siempre que la variante conservativa sea complementaria del correspondiente O-ARNt o O-RS.
Agente de cribado o selección: Tal como se usa en el presente documento, la expresión "agente de cribado o selección" se refiere a un agente que, cuando está presente, permite una selección/criado de determinados componentes de una población. Por ejemplo, un agente de selección o cribado incluye, pero no se limita a, por ejemplo, un nutriente, un antibiótico, una longitud de onda de la luz, un anticuerpo, un polinucleótido expresado, o similares. El agente de selección puede variar, por ejemplo, por concentración, intensidad, etc.
En respuesta a: Tal como se usa en el presente documento, en el contexto de la traducción con componentes O-ARNt y O-RS, la expresión "en respuesta a" se refiere a un procedimiento en el que un ARNt de la invención reconoce un codón selector y media la incorporación de un cetoaminoácido, que está unido al ARNt, en una cadena de polipéptido en crecimiento.
Breve descripción de los dibujos
La figura 1 ilustra un análisis de SDS-PAGE del dominio Z acumulado en diferentes condiciones de expresión. La calle de la izquierda es un marcador de peso molecular.
Los paneles (A) y (B) de la figura 2 ilustran (A) el espectro de masas de FT-ICR de alta resolución de la proteína de dominio Z mutante intacta que contiene p-acetil-L-fenilalanina. Se puede observar una serie de picos que corresponden a diferentes estados de carga de la proteína. En cada serie hay 3 picos que corresponden a la proteína sin la primera metionina, su forma acetilada y la proteína intacta como se marca para el estado de carga 8^{+}. El inserto es la expansión del pico molecular de la proteína de dominio Z del grupo isotópico 7^{+}. (B) ilustra el espectro de masas en tándem del péptido NH_{2} terminal MTSVDNY*INK. La secuencia parcial de TSVDNY*IN del péptido que contiene p-acetil-L-fenilalanina (Y*) se puede asignar a partir de las series de iones b e y indicadas.
En la figura 3, los paneles (A), (B) y (C) ilustran el marcaje in vivo del dominio Z mutante que contiene p-acetil-L-fenilalanina con hidrazida de la fluoresceína 1. (A) ilustra la reacción de marcaje de la p-acetil-L-fenilalanina por la hidrazida de la fluoresceína 1. (B) ilustra un análisis SDS-PAGE (parte superior) teñido con plata e imagen de fluorescencia (parte inferior) del dominio Z natural (nat) y mutante con la hidrazida de la fluoresceína 1. (C) ilustra los espectros de fluorescencia para el dominio Z natural y mutante marcado con hidrazida de la fluoresceína 1.
En la figura 4, los paneles (A) y (B) ilustran el marcaje in vivo del dominio Z mutante que contiene p-acetil-L-fenilalanina con hidrazida de la biotina 2. (A) ilustra la estructura del derivado de hidrazida de la biotina usado, la hidrazida del ácido 6-((6-((biotinoil)amino)hexanoil)amino)hexanoico (Molecular Probes, Eugene, OR). (B) ilustra un análisis de transferencia western del dominio Z natural y mutante marcado con hidrazida de la biotina 2.
En la figura 5, los paneles (A) y (B) ilustran un sistema plasmídico de aminoacil-ARNt transferasa para la selección y cribado. (A) ilustra el plásmido pREP/YC-JYCUA. Se usa el indicador de fluorescencia amplificable para el cribado basado en FACS: La ARN polimerasa T7, cuyo gen está bajo el control del promotor ara (P_{BAD}), se produce tras la supresión de los codones de parada ámbar (negro) y conduce la expresión del gen GFPuv. Se usa el indicador de cloranfenicol (Cm^{r}) para la selección positiva, que confiere resistencia bacteriana al cloranfenicol tras la supresión del codón de parada ámbar (negro). El plásmido pREP/YC-JYCUA contiene el gen MjYtRNA_{CUA}, que codifica un ARNt^{Tyr} supresor de ámbar ortogonal obtenido de M. jannaschii, un origen de replicación p15A, y un marcador seleccionable de tetraciclina (Tet^{r}). (B) ilustra un plásmido pBK-JYRS, que contiene el gen constitutivamente expresado de la tirosil-ARNt sintetasa de M. jannaschii (MjYRS), un marcador seleccionable de kanamicina (Kn^{r}), y el origen de replicación ColE1. Los plásmidos de la biblioteca pBK se construyen como se resume en el Ejemplo 4 usando los sitios de restricción mostrados.
La figura 6 ilustra un ejemplo de un procedimiento para la evolución de una aminoacil-ARNt sintetasa usando una selección positiva y un cribado negativo basado en FACS. Las células fluorescentes y no fluorescentes se muestran en círculos con cruces y círculos blancos, respectivamente. "UAA" se refiere al aminoácido no natural.
La figura 7 ilustra un cribado negativo basado en FACS de variantes de MjYRS. Se recogen en un recuadro los sucesos correspondientes a las células que producen poco o no producen GFPuv. Estas células, que se hicieron crecer en ausencia del aminoácido no natural, contienen variantes de MjYRS que no pueden usar como sustratos ninguno de los aminoácidos naturales en E. coli.
La figura 8 ilustra la iluminación ultravioleta de longitud de onda larga de células que contienen una variante de MjYRS que acepta solo un sustrato de aminoácido no natural. Las células se hicieron crecer en presencia (+) o ausencia (-) del aminoácido no natural.
Descripción detallada
Aunque el grupo carbonilo es el más versátil de los grupos funcionales en química orgánica, está ausente en los aminoácidos genéticamente codificados. Para superar esta limitación natural en la biosíntesis de proteínas, es necesaria una pareja de ARNt-sintetasa ortogonal que permita la incorporación in vivo de un cetoaminoácido en proteínas en E. coli con una alta fidelidad de la traducción, en respuesta al codón sin sentido ámbar. Una ventaja de este aminoácido es que una proteína se puede modificar selectivamente in vitro o in vivo, por ejemplo, con una cualquiera de una variedad de moléculas, tales como un fluoróforo molécula pequeña, derivado de biotina, etc. Este nuevo aminoácido genéticamente codificado extiende la capacidad de manipulación de la estructura y función de proteínas tanto in vitro como en células vivas.
Con el fin de añadir aminoácidos sintéticos adicionales, tales como un cetoaminoácido, al código genético, in vivo, son necesarias nuevas parejas ortogonales de aminoacil-ARNt sintetasa y un ARNt que puedan funcionar eficazmente en la maquinaria de la traducción, pero que es "ortogonal" significa que funcione independientemente de las sintetasas y ARNt endógenos de la célula huésped. Las características deseadas de la pareja incluyen un ARNt que descodifique o reconozca sólo un nuevo codón específico, por ejemplo, un codón selector, que no sea descodificado por ningún ARNt endógeno, y una aminoacil-ARNt sintetasa que aminoacile (o cargue) preferentemente su ARNt con sólo un cetoaminoácido específico. El O-ARNt normalmente tampoco es acilado por sintetasas endógenas. Por ejemplo, en E. coli una pareja ortogonal incluirá una aminoacil-ARNt sintetasa que no de reacción cruzada con ninguno de los ARNt endógenos, de los cuales hay por ejemplo 40 en E. coli, y un ARNt ortogonal que no sea aminoacilado por ninguna de las sintetasas endógenas, de las cuales hay, por ejemplo, 21 en E. coli.
Esta invención proporciona composiciones y procedimientos para identificar y producir parejas ortogonales de ARNt-aminoacil-ARNt sintetasa, por ejemplo, o-ARNt/O-RS) que se pueden usar para incorporar el cetoaminoácido p-acetil-L-fenilalanina. Un O-ARNt de la invención puede mediar la incorporación de p-acetil-L-fenilalanina en una proteína que es codificada por un polinucleótido, que comprende un codón selector que es reconocido por el O-ARNt, por ejemplo, in vivo. El bucle anticodón del O-ARNt reconoce el codón selector en un ARNm e incorpora su aminoácido en este sitio en el polipéptido. Una aminoacil-ARNt sintetasa ortogonal de la invención aminoacila (o carga) preferentemente su O-ARNt solo con p-acetil-L-fenilalanina.
ARNt ortogonal/aminoacil-ARNt sintetasas ortogonales y parejas de los mismos
Se describen sistemas de traducción que son adecuados para hacer proteínas que incluyen uno o más aminoácidos no naturales, por ejemplo, cetoaminoácido, en las solicitudes de patente internacional WO 2002/086075, titulada "METHODS AND COMPOSITION FOR THE PRODUCTION OF ORTHOGONAL tRNA-AMINOACYLtRNA SYNTHETASE PAIRS" y WO 2002/085923, titulada "IN VIVO INCORPORATION OF UNNATURAL AMINO ACIDS". Dichos sistemas de traducción en general comprenden células (por ejemplo, células no eucariotas o células eucariotas) que incluyen un ARNt ortogonal (O-ARNt), una aminoacil-ARNt sintetasa ortogonal (O-RS) y p-acetil-L-fenilalanina, en los que la aminoacil-ARNt sintetasa ortogonal (O-RS) aminoacila preferentemente el O-ARNt con una eficacia de al menos aproximadamente, por ejemplo, un 50%, un 60%, un 75%, un 80% o un 90% o más de eficacia, de la eficacia de un polipéptido que comprende una secuencia de aminoácidos seleccionada de las SEQ ID NO.: 18 a 20 con p-acetil-L-fenilalanina. Una pareja ortogonal de la invención incluye un O-ARNt, por ejemplo, un ARNt supresor, un ARNt del marco de lectura, o similares, y una O-RS. En la invención también se proporcionan componentes individuales.
La O-RS aminoacila el O-ARNt con el cetoaminoácido con una eficacia de al menos aproximadamente, por ejemplo, un 50%, un 60%, un 75%, un 80% o un 90% o más de eficacia, de la eficacia de un polipéptido que comprende una secuencia de aminoácidos seleccionada de las SEQ ID NO.: 18 a 20 con p-acetil-L-fenilalanina. La célula usa los componentes para incorporar el cetoaminoácido en una cadena de polipéptido en crecimiento, por ejemplo, por un ácido nucleico que comprende un polinucleótido que codifica un polipéptido de interés, en el que el polinucleótido comprende un codón selector que es reconocido por el O-ARNt. En algunas realizaciones de la invención, una célula incluye una célula de E. coli que incluye un ARNt ortogonal (O-ARNt), una aminoacil-ARNt sintetasa ortogonal (O-RS), p-acetil-L-fenilalanina; y un ácido nucleico que comprende un polinucleótido que codifica un polipéptido de interés, en el que el polipéptido comprende el codón selector que es reconocido por el O-ARNt y en el que la O-RS aminoacila preferentemente el O-ARNt con una eficacia de al menos aproximadamente, por ejemplo, un 50%, un 60%, un 75%, un 80% o un 90% o más de eficacia, de la eficacia de un polipéptido que comprende una secuencia de aminoácidos seleccionada de las SEQ ID NO.: 18 a 20 con p-acetil-L-fenilalanina. El sistema de traducción también puede ser un sistema in vitro.
El O-ARNt y/o la O-RS pueden ser naturales o pueden obtenerse por mutación de un ARNt y/o RS naturales, que genere, por ejemplo, bibliotecas de ARNt y/o bibliotecas de RS, de una variedad de organismos. Por ejemplo, una estrategia de producción de una pareja de ARNt/aminoacil-ARNt sintetasa ortogonal implica importar una pareja de ARNt/sintetasa heteróloga (a la célula huésped), por ejemplo, de una fuente distinta de la célula huésped, o múltiples fuentes, a la célula huésped. Las propiedades del candidato de sintetasa heteróloga incluyen, por ejemplo, que no cargue ningún ARNt de la célula huésped, y las propiedades del ARNt heterólogo candidato incluyen, por ejemplo, que no sea aminoacilado por ninguna sintetasa de la célula huésped. Además, el ARNt heterólogo es ortogonal a todas las sintetasas de la célula huésped, es decir, las sintetasas de la célula huésped no aminoacilan el ARNt heterólogo.
Una segunda estrategia para generar una pareja ortogonal implica generar bibliotecas de mutantes de las cuales cribar y/o seleccionar un O-ARNt o O-RS. Estas estrategias también se pueden combinar.
ARNt ortogonal (O-ARNt)
Un ARNt ortogonal (O-ARNt) de la invención media la incorporación de un cetoaminoácido en una proteína que es codificada por un polinucleótido que comprende un codón selector que es reconocido por la O-ARNt, por ejemplo, in vivo o in vitro.
Un ejemplo de un O-ARNt de la invención es la SEQ ID NO.: 21. Véase la Tabla 2 y el Ejemplo 3 en el presente documento, para las secuencias de ejemplo de las moléculas O-ARNt y O-RS. Véase también la sección titulada "Secuencia del ácido nucleico y polipéptido y variantes" en el presente documento. En la molécula de ARNt, la tiamina (T) se sustituye por uracilo (U). También puede haber modificaciones adicionales de las bases. La invención también incluye variaciones conservativas del O-ARNt. Por ejemplo, las variaciones conservativas del O-ARNt incluyen aquellas moléculas que funcionan como el O-ARNt de la SEQ ID NO.: 21 y mantienen la estructura en forma de L del ARNt, pero no tienen la misma secuencia (y son distintas de las moléculas de ARNt naturales). Véase también la sección titulada "Secuencia del ácido nucleico y polipéptido y variantes" en el presente documento.
Los procedimientos para producir un ARNt ortogonal (O-ARNt) también son una característica de la invención. Un O-ARNt producido por el procedimiento, también es una característica de la invención. En algunas realizaciones de la invención, los O-ARNt se pueden producir generando una biblioteca de mutantes. La biblioteca de ARNt mutantes se puede generar usando diferentes técnicas de mutagénesis conocidas en la técnica. Por ejemplo, los ARNt mutantes se pueden generar por mutaciones específicas de sitio, mutaciones puntuales aleatorias, recombinación homóloga, mezclado de ADN u otros procedimientos de mutagénesis recursivos, construcción quimérica o cualquier combinación de los mismos.
Se pueden introducir mutaciones adicionales en una posición o en posiciones específicas, por ejemplo, en una posición o posiciones no conservativas, o en una posición conservativa, en una posición o posiciones aleatorizadas, o una combinación de ambos en un bucle o región deseado de un ARNt, por ejemplo, un bucle anticodón, el tronco aceptor, brazo D o bucle, bucle variable, brazo o bucle T\psiC, otras regiones de la molécula de ARNt, o una combinación de las mismas. Normalmente, las mutaciones en un ARNt incluyen la mutación del bucle anticodón de cada miembro de la biblioteca de ARNt mutantes, para permitir el reconocimiento de un codón selector. El procedimiento puede incluir además añadir una secuencia adicional (CCA) en el extremo 3' del O-ARNt. Normalmente, un O-ARNt tiene una mejora en la ortogonalidad para un organismo deseado comparado con el material de partida, por ejemplo, la pluralidad de secuencias de ARNt, mientras que se preserva su afinidad frente a una RS deseada.
Normalmente, un O-ARNt se obtiene sometiendo, por ejemplo, a selección negativa una población de células de una primera especie, en la que las células comprenden un miembro de una pluralidad de O-ARNt potenciales. La selección negativa elimina las células que comprenden un miembro de la biblioteca de potenciales O-ARNt que es aminoacilado por una aminoacil-ARNt sintetasa (RS) que es endógena a la célula. Esto proporciona un conjunto de ARNt que son ortogonales a la célula de la primera especie.
En algunas realizaciones, en la selección negativa, se introduce un codón o codones selectores en el polinucleótido que codifica un marcador de selección negativa, por ejemplo, una enzima que confiere resistencia a antibiótico, por ejemplo, la \beta-lactamasa, una enzima que confiere un producto detectable, por ejemplo, la \beta-galactosidasa, cloranfenicol acetiltransferasa (CAT), por ejemplo, un producto tóxico, tal como barnasa, en una posición no esencial (por ejemplo, que todavía produce una barnasa funcional), etc. El cribado/selección se hacen opcionalmente haciendo crecer la población de células en presencia de un agente selectivo (por ejemplo, un antibiótico, tal como ampicilina). En una realización, se varía la concentración del agente de selección.
Por ejemplo, para medir la actividad de los ARNt supresores, se usa un sistema de selección basado en la supresión in vivo del codón selector, por ejemplo, mutaciones sin sentido o del marco de lectura introducidas en un polinucleótido que codifica un marcador de selección negativo, por ejemplo, un gen para la \beta-lactamasa (bla). Por ejemplo, se construyen variantes de polinucleótidos, por ejemplo, variantes de bla, con un codón selector en una posición determinada. Las células, por ejemplo bacterias, se transforman con estos polinucleótidos. En el caso de un ARNt ortogonal, que no puede ser cargado eficazmente por sintetasas de E. coli endógenas, la resistencia a antibióticos, por ejemplo resistencia a la ampicilina, debe ser aproximadamente igual o menor que la de una bacteria transformada sin plásmido. Si el ARNt no es ortogonal, o si una sintetasa heteróloga capaz de cargar el ARNt se coexpresa en el sistema, se observa un nivel mayor de resistencia al antibiótico, por ejemplo, ampicilina. Las células, por ejemplo, bacterias, se eligen de modo que no sean capaces de crecer en placas de agar LB con concentraciones de antibiótico aproximadamente iguales a las de las células transformadas con plásmidos.
En el caso de un producto tóxico (por ejemplo, ribonucleasa barnasa), cuando un miembro de la pluralidad de ARNt potenciales es aminoacilado por sintetasas, por ejemplo, de E. coli, endógenas del huésped (es decir, no son ortogonales al huésped, por ejemplo, sintetasas de E. coli), el codón selector es suprimido y el producto polinucleótido tóxico producido conduce a la muerte celular. Las células que albergan ARNt ortogonales o ARNt no funcionales sobreviven.
En una realización, el conjunto de ARNt que no son ortogonales a un organismo deseado se someten después a una selección positiva en la que un codón selector se pone en un marcador de selección positiva, por ejemplo, codificado por un gen de resistencia a fármaco, tal como un gen de \beta-lactamasa. La selección positiva se lleva a cabo en una célula que comprende un polinucleótido que codifica o comprende un miembro del conjunto de ARNt que son ortogonales a la célula, un polinucleótido que codifica un marcador de selección positiva, y un polinucleótido que codifica RS cognada. En algunas realizaciones, la segunda población de células comprende células que no eran eliminadas por la selección negativa. Los polinucleótidos son expresados en la célula y la célula se hace crecer en presencia de un agente de selección, por ejemplo, ampicilina. Después, los ARNt se seleccionan según su capacidad para ser aminoacilados por la sintetasa cognada coexpresada e insertar un aminoácido en respuesta a este codón selector. Normalmente, estas células muestran una potenciación de la eficacia de la supresión comparado con células que albergan ARNt no funcionales, o ARNt que no pueden ser reconocidos eficazmente por la sintetasa de interés. La célula que alberga los ARNt no funcionales o los que no pueden ser reconocidos eficazmente por la sintetasa de interés son sensibles al antibiótico. Por lo tanto, los ARNt que: (i) no son sustratos para las sintetasas endógenas del huésped, por ejemplo, E. coli; (ii) pueden ser aminoaciladas por la sintetasa de interés; y (iii) son funcionales en la traducción, sobreviven a ambas selecciones.
La restricción de la selección, por ejemplo, la selección positiva, la selección negativa o tanto la selección positiva como la negativa en los procedimientos descritos antes, incluyen opcionalmente variar la restricción de la selección. Por ejemplo, debido a que la barnasa es una proteína extremadamente tóxica, la restricción de la selección negativa se puede controlar introduciendo diferentes números de codones de selección en el gen de barnasa y/o usando un promotor inducible. En otro ejemplo, se varía la concentración de la selección o el agente de cribado (por ejemplo, ampicilina). En un aspecto de la invención, la restricción se varía porque la actividad deseada puede ser baja durante los ciclos primeros. Por lo tanto, se aplican criterios de selección menos restrictivos en los primeros ciclos y se aplican criterios más restrictivos en los últimos ciclos de selección. En determinadas realizaciones, la selección negativa, la selección positiva o tanto la selección negativa como la positiva se puede repetir múltiples veces. Se pueden usar múltiples marcadores de selección negativa diferentes, marcadores de selección positiva o marcadores de selección tanto negativa como positiva. En determinadas realizaciones, los marcadores de selección positivo y negativo pueden ser los mismos.
Se pueden usar otros tipos de selecciones/cribados en la invención para producir componentes de traducción ortogonales, por ejemplo, un O-ARNt, una O-RS, y una pareja O-ARNt/O-RS que utiliza p-acetil-L-fenilalanina. Por ejemplo, el marcador de selección negativa, el marcador de selección positiva o los marcadores tanto de selección positiva como negativa pueden incluir un marcador que fluoresce o cataliza una reacción luminiscente en presencia de un reaccionante adecuado. En otra realización, un producto del marcador se detecta por separación de células activadas por fluorescencia (FACS) o por luminiscencia. Véase, el Ejemplo 4 en el presente documento. Opcionalmente, el marcador incluye un marcador de cribado basado en afinidad. Véase Francisco, J. A., y col., (1993) "Production and fluorescence-activated cell sorting of Escherichia coli expressing a functional antibody fragment on the external surface". Proc. Natl. Acad. Sci. USA. 90:10444-8.
Se pueden encontrar procedimientos adicionales para producir un ARNt ortogonal recombinante, por ejemplo, en la solicitud de patente internacional WO 2002/086075, véase antes. Véase también Forster y col., (2003) "Programming peptidomimetic synthetases by translating generic codes designed de novo PNAS" 100(11):6353-6357; y, Feng y col., (2003), "Expanding tRNA recognition of a tRNA synthetase by a single amino acid change", PNAS 100(10): 5676-5681.
Aminoacil-ARNt sintetasa ortogonal (O-RS)
Una O-RS de la invención aminoacila preferentemente un O-ARNt con un cetoaminoácido in vitro o in vivo. Normalmente, una O-RS de la invención aminoacila preferentemente el O-ARNt con una eficacia de al menos aproximadamente, por ejemplo, un 50%, un 60%, un 75%, un 80% o un 90% o más de eficacia, de la eficacia de un polipéptido que comprende una secuencia de aminoácidos seleccionada de las SEQ ID NO.: 18 a 20, con p-acetil-L-fenilalanina. Una composición que comprende una O-RS puede incluir además un ARNt ortogonal (O-ARNt), en el que el O-ARNt reconoce un codón selector y media la incorporación del cetoaminoácido. En algunas realizaciones, una composición que incluye una O-RS puede incluir además un sistema de traducción (por ejemplo, in vitro o in vivo). Una O-RS de la invención puede proporcionarse al sistema de traducción, por ejemplo, una célula, mediante un polipéptido que incluye una O-RS y/o mediante un polinucleótido que codifica una O-RS o una parte de la misma. Por ejemplo, una O-RS que aminoacila un O-ARNt con p-acetil-L-fenilalanina comprende una secuencia de aminoácidos como se muestra en una cualquiera de las SEQ ID NO.: 18-20, o una variación conservativa de los mismos. En otro ejemplo, una O-RS o una parte de la misma, es codificada por una secuencia de polinucleótido que codifica un aminoácido que comprende una cualquiera de las SEQ ID NO.: 18-20 o una secuencia de polinucleótidos complementaria de la misma. Los componentes adicionales para otros aminoácidos no naturales incluyen, por ejemplo, una O-RS o una parte de la misma, que es codificada por una secuencia de polinucleótido, por ejemplo, de las SEQ ID NO.: 1-17. Véase, por ejemplo, la Tabla 2 y el Ejemplo 3 en el presente documento para las secuencias de moléculas de O-RS de ejemplo. Véase
también la sección titulada "Secuencia del ácido nucleico y polinucleótido y variantes" en el presente documento.
También puede estar presente en la célula un ácido nucleico que comprende un polinucleótido que codifica un polipéptido de interés, en el que el polinucleótido comprende un codón selector que es reconocido por el O-ARNt, o una combinación de uno o más de estos. Véase también la sección en el presente documento titulada "ARNt ortogonal".
Los procedimientos para identificar una aminoacil-ARNt sintetasa ortogonal (O-RS), por ejemplo, una O-RS, para usar con un O-ARNt, también son una característica de la invención. Una O-RS se puede manipular para alterar la especificidad del sustrato de la síntesis, de modo que solo se carga un aminoácido no natural deseado, por ejemplo p-acetil-L-fenilalanina, pero no se carga ninguno de los 20 aminoácidos comunes en el O-ARNt. Los procedimientos para generar una aminoacil-ARNt sintetasa ortogonal con una especificidad de sustrato para un aminoácido no natural incluyen la mutación de la sintetasa, por ejemplo, en el sitio activo en la sintetasa, en el sitio del mecanismo de edición en la sintetasa, en diferentes sitios combinando diferentes dominios de sintetasas, o similares, y la aplicación de un procedimiento de selección. Se usa una estrategia que se basa en la combinación de una selección positiva seguida de una selección negativa. En la selección positiva, la supresión del codón selector introducido en una posición o posiciones no esenciales de un marcador positivo permite que la célula sobreviva con presión de selección positiva. En presencia de aminoácidos tanto naturales como no naturales, los supervivientes codifican sintetasas activas que cargan el ARNt supresor ortogonal con un aminoácido natural o no natural. En la selección negativa, la supresión de un codón selector introducido en una posición o posiciones no esenciales de un marcador negativo elimina las sintetasas con especificidades de aminoácidos naturales. Los supervivientes de la selección negativa y positiva codifican sintetasas que aminoacilan (cargan) el ARNt supresor ortogonal con aminoácidos no naturales solo. Después, estas sintetasas se pueden someter a mutagénesis adicional, por ejemplo, mezclado de ADN u otros procedimientos de mutagénesis recursivos.
Se puede generar una biblioteca de O-RS mutantes usando diferentes técnicas de mutagénesis conocidas en la materia. Por ejemplo, las RS mutantes se pueden generar por mutaciones específicas de sitio, mutaciones puntuales aleatorias, recombinación homóloga, mezclado de ADN u otros procedimientos de mutagénesis recursiva, construcción quimérica o cualquier combinación de los mismos. Por ejemplo, una biblioteca de RS mutantes se puede producir a partir de dos o más "sub-bibliotecas" distintas, por ejemplo más pequeñas, menos diversas. Las bibliotecas quiméricas de RS también están incluidas en la invención. Debe indicarse que las bibliotecas de ARNt sintetasas de diferentes organismos (por ejemplo, microorganismos tales como eubacterias o arqueobacterias) tales como bibliotecas que comprenden diversidad natural (véase, por ejemplo, la patente de EE.UU. nº 6.238.884 de Short y col.; patente de EE.UU. nº 5.756.316 de Schallenberger y col.; patente de EE.UU. nº 5.783.431 de Petersen y col.; patente de EE.UU. nº 5.824.485 de Thompson y col.; patente de EE.UU. nº 5.958.672 de Short y col.), se construyen y criban opcionalmente para parejas ortogonales.
Una vez que las sintetasas son sometidas a la estrategia de selección/cribado positivo y negativo, estas sintetasas se pueden someter entonces a mutagénesis adicional. Por ejemplo, se puede aislar un ácido nucleico que codifica la O-RS; se puede generar un conjunto de polinucleótidos que codifican las O-RS mutadas (por ejemplo, por mutagénesis aleatoria, mutagénesis específica de sitio, recombinación o cualquiera de sus combinaciones) a partir del ácido nucleico; y estas etapas individuales o una combinación de estas etapas se puede repetir hasta que se obtiene una O-RS mutada que aminoacila preferentemente el O-ARNt con el aminoácido no natural, por ejemplo, el cetoaminoácido. En un aspecto de la invención, las etapas se llevan a cabo múltiples veces, por ejemplo, al menos dos veces.
También se pueden usar niveles adicionales de restricción de selección/cribado en los procedimientos de la invención para producir O-ARNt, O-RS o parejas de los mismos. La restricción de la selección o cribado se puede variar en una o en ambas etapas del procedimiento para producir una O-RS. Esto puede incluir, por ejemplo variar la cantidad de agente de selección/cribado que se usa, etc. Se pueden llevar a cabo ciclos de selecciones positivas y/o negativas adicionales. La selección o el cribado también pueden comprender uno o más de un cambio en la permeabilidad del aminoácido, un cambio en la eficacia de la traducción, un cambio en la fidelidad de la traducción, etc. Normalmente, el uno o más cambios se basan en una mutación en uno o más genes en un organismo en el que se usa una pareja de ARNt-ARNt sintetasa ortogonal para producir proteína.
Se pueden encontrar detalles adicionales para producir O-RS, para alterar la especificidad del sustrato de la sintetasa, para otros ejemplos de O-RS en el documento WO 2002/086075, véase antes. Véase también el Ejemplo 4 en el presente documento, para la selección/cribado para la especificidad de sustrato alterada de una O-RS con un sistema basado en FACS.
Fuente y organismos huésped
Los componentes de traducción de la invención se obtienen normalmente de organismos no eucariotas. Por ejemplo, el O-ARNt ortogonal se puede obtener de un organismo no eucariota (o una combinación de organismos), por ejemplo, una arqueobacteria, tal como Methanococcus jannaschii, Methanobacterium thermoautotrophicum, Halobacterium tal como Haloferax volcanii y especies NRC-1 de Halobacterium, Archaeoglobus fulgidus, Pyrococcus furiosus, Pyrococcus horikoshii, Aeuropyrum pernix, Methanococcus maripaludis, Methanopyrus kandleri, Methanosarcina mazei (Mm), Pyrobaculum aerophilum, Pyrococcus abyssi, Sulfolobus solfataricus (Ss), Sulfolobus tokodaii, Thermoplasma acidophilum, Thermoplasma volcanium, o similares, o una eubacteria tal como Escherichia coli, Thermus thermophilus, Bacillus stearothermphilus, o similares, mientras que la O-RS ortogonal se puede obtener de un organismo no eucariota (o una combinación de organismos), por ejemplo, una arqueobacteria, tal como Methanococcus jannaschii, Methanobacterium thermoautotrophicum, Halobacterium tal como Haloferax volcanii y especies NRC-1 de Halobacterium species, Archaeoglobus fulgidus, Pyrococcus furiosus, Pyrococcus horikoshii, Aeuropyrum pernix, Methanococcus maripaludis, Methanopyrus kandleri, Methanosarcina mazei, Pyrobaculum aerophilum, Pyrococcus abyssi, Sulfolobus solfataricus, Sulfolobus tokodaii, Thermoplasma acidophilum, Thermoplasma volcanium, o similares, o una eubacteria tal como Escherichia coli, Thermus thermophilus, Bacillus stearothermphilus, o similares. En una realización, también se pueden usar fuentes eucariotas, por ejemplo, plantas, algas, protistas, hongos, levaduras, animales (por ejemplo, mamíferos, insectos, artrópodos, etc.) o similares como fuentes de O-ARNt y/o O-RS.
Los componentes individuales de una pareja de O-ARNt/O-RS se pueden obtener del mismo organismo o diferentes organismos. En una realización, la pareja de O-ARNt/O-RS es del mismo organismo. Alternativamente, el O-ARNt y la O-RS de la pareja de O-ARNt/O-RS son de diferentes organismos.
El O-ARNt, O-RS o la pareja de O-ARNt/O-RS se pueden seleccionar o cribar in vivo o in vitro y/o se pueden usar en una célula, por ejemplo, una célula no eucariota, o células eucariotas, para producir un polipéptido con un cetoaminoácido. Una célula no eucariota puede ser de una variedad de fuentes, por ejemplo, una eubacteria, tal como Escherichia coli, Thermus thermophilus, Bacillus stearothermphilus, o similares, o una arqueobacteria, tal como Methanococcus jannaschii, Methanobacterium thermoautotrophicum, Halobacterium tal como Haloferax volcanii y especie NRC-1 de Halobacterium, Archaeoglobus fulgidus, Pyrococcus furiosus, Pyrococcus horikoshii, Aeuropyrum pernix, Methanococcus maripaludis, Methanopyrus kandleri, Methanosarcina mazei (Mm), Pyrobaculum aerophilum, Pyrococcus abyss, Sulfolobus solfataricus (Ss), Sulfolobus tokodaii, Thermoplasma acidophilum, Thermoplasma volcanium, o similares. Una célula eucariota puede ser de una variedad de fuentes, por ejemplo, una planta (por ejemplo, planta compleja tal como monocotiledóneas o dicotiledónas), un alga, una protista, un hongo, una levadura (por ejemplo, Saccharomyces cerivisiae), un animal (por ejemplo, un mamífero, un insecto, un artrópodo, etc.) o similares. Las composiciones de las células con componentes de traducción de la invención también son una característica de la invención.
Codones selectores
Los codones selectores de la invención expanden la estructura del codón genético de la maquinaria de biosíntesis de proteínas para incorporar un cetoaminoácido. Por ejemplo, un codón selector incluye, por ejemplo, un codón de tres bases único, un codón sin sentido, tal como un codón de parada, por ejemplo, un codón ámbar (UAG), o un codón ópalo (UGA), un codón no natural, un codón de al menos cuatro bases, un codón raro, o similares. Se puede introducir una serie de codones selectores en un gen deseado, por ejemplo, uno o más, dos o más, más de tres, etc. Usando codones selectores diferentes, se pueden usar múltiples parejas de ARNt/sintetasa ortogonales que permiten la incorporación simultánea de múltiples aminoácidos no naturales, por ejemplo, cetoaminoácidos y otros aminoácidos no naturales, usando estos codones selectores diferentes.
En una realización, los procedimientos implican el uso de un codón selector que es un codón de parada para la incorporación de un cetoaminoácido in vivo en una célula. Por ejemplo, se produce un O-ARNt que reconoce el codón de parada y es aminoacetilado por una O-RS con un cetoaminoácido. Este O-ARNt no es reconocido por las aminoacil-ARNt sintetasas naturales del huésped. Se puede usar la mutagénesis dirigida convencional para introducir el codón de parada en el sitio de interés en un polinucleótido que codifica un polipéptido de interés. Véase, por ejemplo, Sayers, J.R., y col. (1988), "5',3' Exonu-clease in phosphorothioate-based oligonucleotide-directed mutagenesis". Nucleic Acids Res., 791-802. Cuando se combinan la O-RS, el O-ARNt y el ácido nucleico que codifica un polipéptido de interés, por ejemplo, in vivo, el cetoaminoácido se incorpora en respuesta al codón de parada para dar un polipéptido que contiene el cetoaminoácido en una posición especificada. En una realización de la invención, un codón de parada que se usa como un codón selector es un codón ámbar, UAG, y/o un codón ópalo, UGA. En un ejemplo, un código genético en el que se usan tanto UAG como UGA como codones selectores, puede codificar 22 aminoácidos mientras que conserva el codón sin sentido ocre, UAA, que es la señal de terminación natural más abundante, por ejemplo, en E. coli.
La incorporación de cetoaminoácidos in vivo se puede hacer sin una perturbación significativa de la célula huésped. Por ejemplo, en células no eucariotas, tales como Escherichia coli, debido a que la eficacia de supresión para el codón UAG depende de la competición entre el O-ARNt, por ejemplo, el ARNt supresor de ámbar, y el factor de liberación 1 (RF1) (que se une al codón UAG e inicia la liberación del péptido en crecimiento desde el ribosoma), la eficacia de la supresión se puede modular por ejemplo, aumentando el nivel de expresión del O-ARNt, por ejemplo, el ARNt supresor, o usando una cepa deficiente en RF1. En células eucariotas, debido a que la eficacia de la supresión para el codón UAG depende de la competencia entre el O-ARNt, por ejemplo, el ARNt supresor ámbar, y el factor de liberación eucariota (por ejemplo, eRF) (que se une a un codón de parada e inicia la liberación del péptido en crecimiento del ribosoma), la eficacia de la supresión se puede modular, por ejemplo, aumentando el nivel de expresión del O-ARNt, por ejemplo, el ARNt supresor.
Los cetoaminoácidos también pueden ser codificados por codones raros. Por ejemplo, cuando se reduce la concentración de arginina en una reacción de síntesis de proteínas in vitro, se ha demostrado que el codón de arginina raro, AGG, es eficaz para insertar Ala por un ARNt sintético acilado con alanina. Véase, por ejemplo, Ma y col., Biochemistry, 32:7939 (1993). En este caso, el ARNt sintético compite con el ARNt-Arg natural que existe como una especie minoritaria en Escherichia coli. Además, algunos organismos no usan todos los codones tripletes. Se ha usado un codón AGA sin asignar en Micrococcus luteus para insertar aminoácidos en un extracto de transcripción/traducción in vitro. Véase, por ejemplo, Kowal y Oliver, Nucl. Acid. Res., 25:4685 (1997). Se pueden generar componentes de la invención para usar estos codones raros in vivo.
\newpage
Los codones selectores también comprenden codones extendidos, por ejemplo, codones de 4 o más bases, tales como codones de 4, 5, 6 o más bases. Los ejemplos de codones de 4 bases incluyen, por ejemplo, AGGA, CUAG, UAGA, CCCU, y similares. Los ejemplos de codones de 5 bases incluyen, por ejemplo, AGGAC, CCCCU, CCCUC, CUAGA, CUACU, UAGGC y similares. Los procedimientos de la invención incluyen usar codones extendidos basados en la supresión del marco de lectura. Se pueden insertar codones de 4 o más base, por ejemplo, uno o múltiples aminoácidos no naturales tales como un cetoaminoácido, en la misma proteína. En otras realizaciones, los bucles anticodón pueden descodificar, por ejemplo, al menos un codón de 4 bases, al menos un codón de 5 bases o al menos un codón de 6 bases o más. Puesto que hay 256 codones de 4 bases posibles, pueden ser codificados múltiples aminoácidos no naturales en la misma célula usando un codón de 4 o más bases. Véase, Anderson y col., (2002) "Exploring the Limits of Codon and Anticodon Size", Chemistry and Biology, 9:237-244; y, Magliery, (2001) "Expanding the Genetic Code: Selection of Efficient Suppressors of Four-base Codons and Identification of "Shifty" Four-base Codons with a Library Approach in Escherichia coli", J. Mol. Biol. 307: 755-769.
Por ejemplo, se han usado codones de 4 bases para incorporar aminoácidos no naturales en proteínas usando procedimientos biosintéticos in vitro, Véase, por ejemplo, Ma y col., (1993) Biochemistry, 32:7939; y Hohsakay col., (1999) J. Am. Chem. Soc., 121:34. Se usaron CGGG y AGGU para incorporar simultáneamente 2-naftilalanina y un derivado de NBD de la lisina en la estreptavidina in vitro, con 2 ARNt supresores del marco de lectura químicamente acilados. Véase, por ejemplo Hohsaka y col., (1999) J. Am. Chem. Soc., 121:12194. En un estudio in vivo, Moore y col. examinaron la capacidad de los derivados de ARNt^{Leu} con anticodones NCUA para suprimir los codones UAGN (N puede ser U, A, G o C), y encontraron que el cuadruplete UAGA puede ser descodificado por un ARNt^{Leu} con un anticodon UCUA con una eficacia de 13 a 26% con poca descodificación en el marco 0 ó -1. Véase, Moore y col., (2000) J. Mol. Biol., 298:195. En una realización, se pueden usar en la invención codones extendidos basados en codones raros o codones sin sentido, que pueden reducir la lectura sin sentido a través de estos y la supresión del marco de lectura en otros sitios no deseados.
Para un sistema dado, un codón selector también puede incluir uno de los codones naturales de tres bases, en los que el sistema endógeno no usa (o raramente usa) el codón de la base natural. Por ejemplo, esto incluye un sistema que carece de un ARNt que reconoce el codón natural de tres bases y/o un sistema en el que el codón de tres bases es un codón raro.
Los codones selectores incluyen opcionalmente pares de bases no naturales. Estos pares de bases no naturales expanden más el alfabeto genético existente. Un par de bases extra aumenta el número de codones triplete de 64 a 125. Las propiedades de las terceras parejas de bases incluyen el emparejamiento de bases estable y selectivo, incorporación enzimática eficaz en el ADN con alta fidelidad por una polimerasa, y la extensión de cebador continuada eficaz después de la síntesis del par de bases no natural naciente. Las descripciones de pares de bases no naturales que se pueden adaptar para procedimientos y composiciones incluyen, por ejemplo, Hirao, y col., (2002). "An unnatural base pair for incorporating amino acid analogues into protein", Nature Biotechnology, 20:177-182. Véase también Wu, Y., y col., (2002) J. Am. Chem. Soc. 124:14626-14630.
Para el uso in vivo, el nucleósido no natural es permeable a la membrana y es fosforilado para formar el correspondiente trifosfato. Además, la información genética aumentada es estable y no es destruida por enzimas celulares. Los esfuerzos previos de Benner y otros aprovecharon los patrones de enlaces de hidrógeno que son diferentes de los de las parejas canónicas de Watson-Crick, siendo el ejemplo más destacable la pareja iso-C:iso-G. Véase, por ejemplo, Switzer y col., (1989) J. Am. Chem. Soc., 111:8322; y Piccirilli y col., (1990) Nature, 343:33; Kool, (2000) Curr. Opin. Chem. Biol., 4:602. Estas bases en general tienen emparejamientos erróneos en determinado grado con bases naturales y no pueden replicarse enzimáticamente. Kool y colaboradores demostraron que las interacciones de empaquetamiento hidrófobas entre bases pueden sustituir los enlaces de hidrógeno para conducir a la formación de pares de bases. Véase Kool, (2000) Curr. Opin. Chem. Biol., 4:602; y Guckian y Kool, (1998) Angew. Chem. Int. Ed. Engl., 36, 2825. En un esfuerzo para desarrollar un par de bases no natural que sstisfaciera todos los requisitos anteriores, Schultz, Romesberg y colaboradores han sintetizado y estudiado sistemáticamente una serie de bases hidrófobas no naturales. Se encuentra que un par PICS:PICS es más estable que los pares de bases naturales, y se puede incorporar eficazmente en el ADN mediante el fragmento Klenow de la ADN polimerasa I de Escherichia coli (KF). Véase, McMinn y col., (1999) J. Am. Chem. Soc., 121:11586; y Ogawa y col., (2000) J. Am. Chem. Soc., 122:3274. Se puede sintetizar un par 3MN:3MN por KF con eficacia y selectividad suficientes para la función biológica. Véase, por ejemplo, Ogawa y col., (2000) J. Am. Chem. Soc., 122:8803. Sin embargo, ambas bases actúan como un terminador de cadena para la replicación adicional. Recientemente se ha desarrollado una ADN polimerasa mutante que se puede usar para replicar el autopar PICS. Además, se puede replicar un autopar 7AI. Véase, por ejemplo, Tae y col., (2001) J. Am. Chem. Soc., 123:7439. También se ha desarrollado un nuevo par de metalobases, Dipic:Py, que forman un par estable por unión con Cu(II). Véase Meggers y col., (2000) J. Am. Chem. Soc., 122:10714. Debido a que los codones extendidos y los codones no naturales son intrínsecamente ortogonales a los codones naturales, los procedimientos de la invención pueden aprovechar esta propiedad para generar ARNt ortogonales para estos.
También se puede usar un sistema de derivación traduccional para incorporar un cetoaminoácido en un polipéptido deseado. En un sistema de derivación traduccional, se inserta una secuencia larga en un gen pero no es traducida a proteína. La secuencia contiene una estructura que sirve como señal para inducir al ribosoma para saltar la secuencia y reanudar la traducción secuencia abajo de la inserción.
Aminoácidos no naturales
Tal como se usa en el presente documento, un aminoácido no natural se refiere a cualquiera aminoácido, aminoácido modificado o análogo de aminoácido distinto de selenocisteína y/o pirrolisina y los siguientes 20 alfa-aminoácidos genéticamente codificados: alanina, arginina, asparagina, ácido aspártico, cisteína, glutamina, ácido glutámico, glicina, histidina, isoleucina, leucina, lisina, metionina, fenilalanina, prolina, serina, treonina, triptófano, tirosina, valina. La estructura genérica de un alfa-aminoácido se ilustra en la Fórmula I:
\vskip1.000000\baselineskip
1
\vskip1.000000\baselineskip
Un aminoácido no natural normalmente es cualquier estructura que tenga la Fórmula I, en la que el grupo R es cualquier sustituyente distinto de los usados en los 20 aminoácidos naturales. Véase, por ejemplo, Biochemistry de L. Stryer, 3ª ed. 1988, Freeman and Company, New York, para las estructuras de los 20 aminoácidos naturales. Obsérvese que los aminoácidos no naturales de la invención pueden ser compuestos naturales distintos de los 20 alfa-aminoácidos anteriores.
Debido a que los aminoácidos no naturales pueden diferir de los aminoácidos naturales en la cadena lateral, los aminoácidos no naturales normalmente pueden formar enlaces amida con otros aminoácidos, por ejemplo, naturales o no naturales, de la misma forma que se forman en las proteínas naturales. Sin embargo, los aminoácidos no naturales tienen grupos en las cadenas laterales que los distinguen de los aminoácidos naturales.
Tiene un interés particular en la incorporación de aminoácidos no naturales en proteínas, el tener la capacidad de incorporar p-acetil-L-fenilalanina. El grupo ceto de este aminoácido proporciona una reactividad química única que no esta presente en los 20 aminoácidos comunes, debido a su capacidad para participar en reacciones de adición que implican al grupo carbonilo o la posición ácida del C\alpha. El grupo carbonilo reacciona fácilmente, por ejemplo, con hidrazidas, hidroxilaminas, semicarbazidas, etc. en condicioens suaves en disolución acuosa, y forma, por ejemplo, enlaces hidrazona, oxima y semicarbazona, respectivamente, que son estables en condiciones fisiológicas. Véase, por ejemplo, Jencks, W.P. (1959) J. Am. Chem. Soc. 81, 475-481; Shao, J. & Tam, J.P. (1995) J. Am. Chem. Soc. 117:3893-3899. A través del cetoaminoácido, las proteínas se pueden marcar selectivamente con una amplia variedad de otros derivados de hidrazida o hidroxilamina (incluyendo azúcares, marcadores de fluorescencia, derivados de biotina, marcadores paramagnéticos, quelantes de metales, agentes de reticulación, poliéteres, ácidos grasos, toxinas, etc.). Véase, por ejemplo, la adición de derivados de sacárido por un cetoaminoácido.
Para otros aminoácidos no naturales adicionales, por ejemplo, R en la Fórmula I comprende opcionalmente alquilo, arilo, acilo, azido, hidroxilo, hidrazina, ciano, halógeno, hidrazida, alquenilo, alquinilo, éter, tiol, seleno, sulfonilo, borato, boronato, fosfo, fosfono, fosfina, heterociclo, enona, imina, aldehído, éster, tioácido, hidroxilamina, amina y similares, o cualquier combinación de los mismos. Los análogos de glutamina de la invención incluyen, pero no se limitan a derivados \alpha-hidroxi, derivados \gamma-sustituidos, derivados cíclicos y derivados de glutamina sustituidos con amida. Otros aminoácidos no naturales de interés incluyen, pero no se limitan a aminoácidos que comprenden un agente de reticulación fotoactivable, aminoácidos con marcadores paramagnéticos, aminoácidos fluorescentes, aminoácidos que se unen a metales, aminoácidos que contienen metales, aminoácidos radiactivos, aminoácidos con grupos funcionales nuevos, aminoácidos que interaccionan de forma covalente o no covalente con otras moléculas, aminoácidos fotolábiles y/o fotoisomerizables, aminoácidos que contienen biotina o análogo de biotina, aminoácidos glicosilados, polietilenglicol o poliéter que comprenden aminoácidos, aminoácidos sustituidos con átomos pesados, aminoácidos escindibles químicamente o fotoescindibles, aminoácidos con una cadena lateral alargada comparada con los aminoácidos naturales (por ejemplo, poliéteres o hidrocaruros de cadena larga, por ejemplo, mayor de aproximadamente 5, mayor de aproximadamente 10 carbonos, etc.), aminoácidos que contienen azúcares unidos por carbono, aminoácidos que contienen aminotioácido, y aminoácidos que contienen uno o más restos tóxicos. En algunas realizaciones, los aminoácidos no naturales tienen un agente reticulador foroactivable.
\newpage
Además de los aminoácidos no naturales que contienen cadenas laterales nuevas, los aminoácidos no naturales también comprenden opcionalmente estructuras de cadena principal modificadas, por ejemplo, como se ilustra mediante las estructuras de las Fórmulas II y III:
\vskip1.000000\baselineskip
2
\vskip1.000000\baselineskip
en las que Z normalmente comprende OH, NH_{2}, SH, NH-R' o S-R'; X e Y, que pueden ser iguales o diferentes, normalmente comprenden S u O, y R y R', que son opcionalmente iguales o diferentes, se seleccionan normalmente de la misma lista de constituyentes para el grupo R descrito antes para los aminoácidos no naturales que tienen la Fórmula I así como hidrógeno. Por ejemplo, los aminoácidos no naturales de la invención comprenden opcionalmente sustituciones en el grupo amino o carboxilo como se ilustra mediante las Fórmulas II y III. Los aminoácidos no naturales de este tipo incluyen, pero no se limitan a \alpha-hidroxiácidos, \alpha-tioácidos, \alpha-aminotiocarboxilatos, por ejemplo, con cadenas laterales que corresponden a los 20 aminoácidos naturales comunes o cadenas laterales no naturales. Además, las sustituciones en el carbono \alpha incluyen opcionalmente aminoácidos L, D o \alpha,\alpha-disustituidos, tales como D-glutamato, D-alanina, D-metil-O-tirosina, ácido aminobutírico, y similares. Otras alternativas estructurales incluyen aminoácidos cíclicos, tales como análogos de prolina, así como análogos de prolina de anillos de 3, 4, 6, 7, 8 y 9 miembros, \beta y \gamma-aminoácidos tales como \beta-alanina sustituida y ácido \gamma-aminobutírico.
En la presente invención, el cetoaminoácido es el derivado del aminoácido fenilalanina, la p-acetil-L-fenilalanina.
Síntesis química de aminoácidos no naturales
Muchos de los aminoácidos no naturales proporcionados antes están disponibles en el comercio, por ejemplo en Sigma (EE.UU.) o Aldrich (Milwakee, WI, EE.UU.). Los que no están disponibles en el comercio se sintetizan opcionalmente como se proporciona en diferentes publicaciones o usando procedimientos estándar conocidos por los expertos en la materia. Para las técnicas de síntesis orgánica, véase, por ejemplo, "Organic Chemistry" de Fessendon and Fessendon, (1982, 2ª edición, Willard Grant Press, Boston Mass.); Advanced Organic Chemistry de March (3ª edición, 1985, Wiley and Sons, New York); y Advanced Organic Chemistry de Carey y Sundberg (3ª edición, Partes A y B, 1990, Plenum Press, New York). Las publicaciones adicionales que describen la síntesis de aminoácidos no naturales incluyen, por ejemplo, el documento WO 2002/085923, véase antes, Matsoukas y col., (1995) J. Med. Chem., 38, 4660-4669; King, F.E. & Kidd, D.A.A. (1949) "A New Synthesis of Glutamine and of \gamma-Dipeptides of Glutamic Acid from Phthylated Intermediates". J. Chem. Soc., 3315-3319; Friedman, O.M. y Chatterrji, R. (1959) "Synthesis of Derivatives of Glutamine as Model Substrates for Anti-Tumor Agents". J. Am. Chem. Soc. 81, 3750-3752; Craig, J.C. y col. (1988) "Absolute Configuration of the Enantiomers of 7-Chloro-4-[[4-(diethylamino)-1-methylbutyl]amino]-quinoline (Chloroquine)". J. Org. Chem. 53, 1167-1170; Azoulay, M., Vilmont, M. y Frappier, F. (1991) "Glutamine analogues as Potential Antimalarials", Eur. J. Med. Chem. 26, 201-5; Koskinen, A.M.P. y Rapoport, H. (1989) "Synthesis of 4-Substituted Prolines as Conformationally Constrained Amino Acid Analogues". J. Org. Chem. 54, 1859-1866; Christie, B.D. y Rapoport, H. (1985) "Synthesis of Optically Pure Pipecolates from L-Asparagine. Application to the Total Synthesis of (+)-Apovincamine through Amino Acid Decarbonylation and Iminium Ion Cyclization". J. Org. Chem. 1989:1859-1866; Barton y col., (1987) "Synthesis of Novel \alpha-Amino-Acids and Derivatives Using Radical Chemistry: Synthesis of and D-\alpha-Amino-Adipic Acids, L-\alpha-antinopimelic Acid and Appropriate Unsaturated Derivatives". Tetrahedron Lett. 43:4297-4308; y, Subasinghe y col., (1992) "Quisqualic acid analogues: synthesis of beta-heterocyclic 2-aminopropanoic acid derivatives and their activity at a novel quisqualate-sensitized site". J. Med. Chem. 35:4602-7. Véase también el documento WO 2002/085923.
Absorción celular de aminoácidos no naturales
La absorción de aminoácidos no naturales por una célula es un problema que se considera normalmente cuando se diseñan y seleccionan aminoácidos no naturales, por ejemplo, para la incorporación en una proteína. Por ejemplo, la densidad de carga alta de \alpha-aminoácidos sugiere que no es probable que estos compuestos sean permeables a la célula. Los aminoácidos naturales son absorbidos en la célula mediante una colección de sistemas de transporte basados en proteínas que a menudo presentan diferentes grados de especificidad de aminoácidos. Se puede hacer un cribado rápido que evalúe que aminoácidos no naturales, si los hay, son absorbidos por las células. Véase, por ejemplo, los ensayos de toxicidad, por ejemplo, en Liu, D.R. y Schultz, P.G. (1999) "Progress toward the evolution of an organism with an expanded genetic code". PNAS United States 96:4780-4785. Aunque la absorción se analiza fácilmente con diferentes ensayos, una alternativa al diseño de aminoácidos no naturales que se pueden llevar a rutas de absorción celular, es proporcionar rutas biosintéticas para crear aminoácidos in vivo.
Biosíntesis de aminoácidos no naturales
En las células ya existen muchas rutas biosintéticas para producir aminoácidos y otros compuestos. Aunque puede no existir un procedimiento biosintético para un aminoácido no natural particular en la naturaleza, por ejemplo, en una célula, la invención proporciona dichos procedimientos. Por ejemplo, se generan opcionalmente rutas biosintéticas para aminoácidos no naturales en la célula huésped añadiendo enzimas nuevas o modificando rutas celulares del huésped existentes. Las nuevas enzimas adicionales son opcionalmente enzimas naturales o enzimas desarrolladas artificialmente. Por ejemplo, la biosíntesis de la p-aminofenilalanina (como se presenta en un ejemplo en el documento WO 2002/085923, véase antes) se basa en la adición de una combinación de enzimas conocidas de otros organismos. Los genes para estas enzimas se pueden introducir en una célula transformando la célula con un plásmido que comprende los genes. Los genes, cuando se expresan en la célula, proporcionan una ruta enzimática para sintetizar el compuesto deseado. Los ejemplos de estos tipos de enzimas que se añaden opcionalmente, se proporcionan en los siguientes ejemplos. Se encuentran secuencias de enzimas adicionales, por ejemplo, en Genbank. También se añaden opcionalmente en una célula enzimas desarrolladas artificialmente de la misma forma. De esta forma, se manipulan la maquinaria celular y los recursos de una célula para producir aminoácidos no naturales.
Hay disponibles una variedad de procedimientos para producir enzimas nuevas para usar en las rutas biosintéticas o para la evolución de rutas existentes. Por ejemplo, se usa opcionalmente la recombinación recursiva, por ejemplo, como desarrollan Maxygen, Inc. (disponible en internet en www.maxygen.com), para desarrollar enzimas y rutas nuevas. Véase, por ejemplo, Stemmer (1994), "Rapid evolution of a protein in vitro by DNA shuffling", Nature 370(4):389-391; y, Stemmer, (1994), "DNA shuffling by random fragmentation and reassembly: In vitro recombination for molecular evolution", Proc. Natl. Acad. Sci. USA., 91:10747-10751. Igualmente, se usa opcionalmente DesignPath^{TM}, desarrollado por Genencor (disponible en internet en genencor.com) para el diseño de rutas metabólicas, por ejemplo para el diseño de una ruta pare crear un cetoaminoácido en una célula. Esta tecnología reconstruye rutas existentes en organismos huésped usando una combinación de genes nuevos, por ejemplo, identificados mediante genómica funcional, y evolución y diseño moleculares. Diversa Corporation (disponible en internet en diversa.com) también proporciona tecnología para el cribado rápido de genotecas y rutas de genes, por ejemplo, para crear nuevas rutas.
Normalmente, el aminoácido no natural producido por una ruta biosintética diseñada de la invención, se produce en una concentración suficiente para la biosíntesis de proteínas eficaz, por ejemplo, un cantidad celular natural, pero no en un grado tal que afecte a la concentración de los otros aminoácidos o que agote los recursos celulares. Las concentraciones típicas producidas in vivo de esta forma son aproximadamente 10 mM a aproximadamente 0,05 mM. Una vez que la célula se transforma con un plásmido que comprende los genes usados para producir las enzimas deseadas para una ruta específica y se genera un aminoácido no natural in vivo, las selecciones se usan opcionalmente para optimizar más la producción del aminoácido no natural tanto para la síntesis ribosómica de la proteína como para el crecimiento celular.
Secuencia del ácido nucleico y polipéptido y variantes
Como se ha descrito antes y se describe a continuación, la invención proporciona secuencias de ácido nucleico y polinucléotido, por ejemplo, O-ARNt y O-RS y secuencias de aminoácidos de polipéptidos, por ejemplo O-RS, y, por ejemplo, composiciones y procedimientos que comprenden dichas secuencias. Los ejemplos de dichas secuencias, por ejemplo, O-ARNt y O-RS se describen en el presente documento (véase la Tabla 2, por ejemplo SEQ ID NO.: 1-21). Sin embargo, un experto en la materia apreciará que la invención no se limita a las secuencias descritas en el presente documento, por ejemplo, en los Ejemplos. Un experto en la materia apreciará que la invención también proporciona muchas secuencias no relacionadas con las funciones descritas en el presente documento, por ejemplo, que codifican un O-ARNt o una O-RS.
La invención proporciona polipéptidos (O-RS) y polinucleótidos, por ejemplo, O-ARNt, polinucleótidos que codifican O-RS o partes de las mismas, oligonucleótidos usados para aislar clones de aminoacil-ARNt sintetasa, etc. Los polinucleótidos de la invención incluyen los que codifican proteínas o polipéptidos de interés de la invención con uno o más codón selector. Además, los polinucleótidos de la invención incluyen, por ejemplo, un polinucleótido que comprende una secuencia de nucleótidos como se muestra en las SEQ ID NO.: 1-17, 21; un polinucleótido que es complementario de o que codifica una secuencia de polinucleótido del mismo. Un polinucleótido de la invención también incluye un polinucleótido que codifica una secuencia de aminoácidos que comprende las SEQ ID NO.: 18-20. Un polinucleótido de la invención también incluye un polinucleótido que codifica un polipéptido de la invención. Igualmente, un ácido nucleico artificial que hibrida con un polinucleótido indicado antes en condiciones muy restrictivas a lo largo de la longitud sustancialmente entera del ácido nucleico es un polinucleótido de la invención. En una realización, una composición incluye un polipéptido de la invención y un excipiente (por ejemplo, tampón, agua, excipiente farmacéuticamente aceptable, etc.). La invención también proporciona un anticuerpo o antisuero específicamente inmunorreactivo con un polipéptido de la invención. Un polinucleótido artificial es un polinucleótido que está hecho por el hombre y no es natural.
Un polinucleótido de la invención también incluye un polinucleótido artificial, es decir por ejemplo, al menos 75%, al menos 80%, al menos 90%, al menos 95%, al menos 98% o más idéntico al de una secuencia de las SEQ ID NO.: 1-17 y/o 21 (pero es distinto de un polinucleótido natural). Un polinucleótido también incluye un polinucleótido artificial que es, por ejemplo, al menos 75%, al menos 80%, al menos 90%, al menos 95%, al menos 98% o más idéntico al de un ARNt natural.
En algunas realizaciones, un vector (por ejemplo, un plásmido, un cósmido, un fago, un virus, etc.) comprende un polinucleótido de la invención. En una realización, el vector es un vector de expresión. En otra realización, el vector de expresión incluye un promotor operativamente unido a uno o más de los polinucleótidos de la invención. En otra realización, una célula comprende un vector que incluye un polinucleótido de la invención.
Un experto en la materia también apreciará que se incluyen en la invención muchas variantes de las secuencias descritas. Por ejemplo, se incluyen en la invención variantes conservativas de las secuencias descritas que dan una secuencia funcionalmente idéntica. Las variantes de las secuencias de polinucleótido de ácidos nucleicos, en las que las variantes hibridan con al menos una secuencia descrita, se considera que están incluidas en la invención. También están incluidas en la invención las subsecuencias únicas descritas en el presente documento, determinadas, por ejemplo, por técnicas de comparación de secuencias estándar.
Variaciones conservativas
Debido a la degeneración del código genético, las "sustituciones silenciosas" (es decir, sustituciones en una secuencia de ácido nucleico que no dan como resultado una alteración en un polipéptido codificado) son una característica implícita de cada secuencia de ácido nucleico que codifica un aminoácido. Igualmente, las "sustituciones de aminoácidos conservativas", uno o unos cuantos aminoácidos en una secuencia de aminoácidos se sustituyen por aminoácidos diferentes con propiedades muy similares, también se identifican fácilmente como que son muy similares a una construcción descrita. Dichas variaciones conservativas de cada secuencia descrita son una característica de la presente invención.
Las "variaciones conservativas" de una secuencia de ácido nucleico particular se refiere a aquellos ácidos nucleicos que codifican secuencias de aminoácidos idénticas o esencialmente idénticas, o cuando el ácido nucleico no codifica una secuencia de aminoácidos, a secuencias esencialmente idénticas. Un experto en la materia reconocerá que las sustituciones, deleciones o adiciones individuales que alteran, añaden o suprimen un solo aminoácido o un porcentaje pequeño de aminoácidos (normalmente menos de 5%, más normalmente menos de 4%, 2% o 1%) en una secuencia codificada son "variaciones modificadas conservativamente" en las que las alteraciones dan como resultado la deleción de un aminoácido, adición de un aminoácido o sustitución de un aminoácido por un aminoácido químicamente similar. Por lo tanto, las "variaciones conservativas" de una secuencia de polipéptido listada de la presente invención incluye sustituciones de un porcentaje pequeño, normalmente menos de 5%, más normalmente menos de 2% o 1% del aminoácido de la secuencia de polipéptido, por un cetoaminoácido conservativo del mismo grupo de sustitución conservativo. Finalmente, la adición de secuencias que no alteran la actividad codificada de una molécula de ácido nucleico, tal como la adición de una secuencia no funcional, es una variación conservativa del ácido nucleico base.
Las tablas de sustituciones conservativas que proporcionan aminoácidos funcionalmente similares son conocidos en la técnica. A continuación se exponen ejemplos de grupos que contienen aminoácidos naturales que incluyen "sustituciones conservativas" de uno por otro.
Grupos de sustituciones conservativas
3
Hibridación de ácido nucleico
La hibridación comparativa se puede usar para identificar ácidos nucleicos de la invención, tal como las SEQ ID NO.: 1-17, 21, incluyendo variaciones conservativas de los ácidos nucleicos de la invención, y este procedimiento de hibridación comparativa es un procedimiento preferido para distinguir ácidos nucleicos de la invención. Además, los ácidos nucleicos diana que hibridan con un ácido nucleico representado por cualquiera de las SEQ ID NO.: 1-17, 21 en condiciones de restricción altas, ultra-altas y ultra-ultra altas, son una característica de la invención. Los ejemplos de dichos ácidos nucleicos incluyen aquellos con una o unas pocas sustituciones de ácido nucleico silenciosas o conservativas, comparado con una secuencia de ácido nucleico dada.
Se dice que un ácido nucleico de ensayo hibrida específicamente con un ácido nucleico sonda cuando hibrida al menos la ½ tanto con la sonda como con la diana complementaria perfectamente emparejada, es decir, con una relación de señal a ruido al menos un ½ tan alta como la hibridación de la sonda con la diana en condiciones en las que la sonda perfectamente emparejada se une a la diana complementaria perfectamente emparejada con una relación de señal a ruido que es al menos aproximadamente 5x-10x tan alta como la observada para la hibridación con cualquier ácido nucleico diana no emparejado.
Los ácidos nucleicos "hibridan" cuando se asocian, normalmente en disolución. Los ácidos nucleicos hibridan debido a una variedad de fuerzas fisicoquímicas bien caracterizadas, tales como enlaces de hidrógeno, exclusión de disolvente, apilamiento de bases y similares. Se encuentra una guía extensa de la hibridación de ácidos nucleicos en Tijssen (1993) "Laboratory Techniques in Biochemistry and Molecular Biology - -Hybridization with Nucleic Acid Probes" parte I capítulo 2, "Overview of principles of hybridization and the strategy of nucleic acid probe assays," (Elsevier, New York), así como en Ausubel, véase a continuación. Hames y Higgins (1995) Gene Probes 1 IRL Press at Oxford University Press, Oxford, England, (Hames and Higgins 1) y Hames y Higgins (1995) Gene Probes 2 IRL Press at Oxford University Press, Oxford, England (Hames y Higgins 2) proporcionan detalles sobre la síntesis, marcaje, detección y cuantificación de ADN y ARN, incluyendo oligonucleótidos.
Un ejemplo de condiciones de hibridación restrictivas para la hibridación de ácidos nucleicos complementarios que tienen más de 100 restos complementarios en un filtro en una transferencia southern o northern, es formalina al 50% con 1 mg de heparina a 42ºC, llevándose a cabo la hibridación durante una noche. Un ejemplo de condiciones de lavado restrictivas es un lavado con 0,2xSSC a 65ºC durante 15 minutos (véase, Sambrook, véase antes, para una descripción del tampón de SSC). A menudo el lavado de restricción alta va precedido de un lavado de restricción baja para eliminar la señal de fondo de la sonda. Un ejemplo de lavado de restricción baja es 2xSSC a 40ºC durante 15 minutos. En general, una relación de señal a ruido de 5x (o mayor) de la observada para una sonda no relacionada en el ensayo de hibridación particular, indica la detección de una hibridación específica.
Las "condiciones de lavado de hibridación restrictivas" en el contexto de los experimentos de hibridación de ácidos nucleicos, tales como hibridaciones southern o northern, dependen de la secuencia y son diferentes en diferentes parámetros medioambientales. Se encuentra una guía extensa sobre la hibridación de ácidos nucleicos en Tijssen (1993), véase antes, y en Hames y Higgins, 1 y 2, Las condiciones de hibridación y lavado restrictivas se pueden determinar fácilmente de forma empírica mediante cualquier ensayo de ácidos nucleicos. Por ejemplo, en la determinación de las condiciones de hibridación y lavado restrictivas, las condiciones de hibridación y lavado se aumentan gradualmente (por ejemplo, aumentando la temperatura, disminuyendo la concentración de sal, aumentando la concentración de detergente y/o aumentando la concentración de disolventes orgánicos tales como formalina en la hibridación o lavado), hasta que se cumpla un grupo de criterios seleccionado. Por ejemplo, en las condiciones de hibridación y lavado muy restrictivas, las condiciones de hibridación y lavado se aumentan gradualmente hasta que una sonda se une a una diana complementaria perfectamente emparejada con una relación de señal a ruido que es al menos 5x tan alta como la observada para la hibridación de la sonda con una diana no emparejada.
Las condiciones "muy restrictivas" se seleccionan para que sean iguales al punto de fusión térmico (T_{m}) para una sonda particlar. La T_{m} es la temperatura (en una concentración iónica y pH definidos) a la que el 50% de la secuencia de ensayo hibrida con una sonda perfectamente emparejada. Para los propósitos de la presente invención, en general, las condiciones de hibridación y lavado "muy restrictivas" se seleccionan para que sean aproximadamente 5ºC inferiores a la T_{m} para la secuencia específica para una concentración iónica y pH definidos.
Las condiciones de hibridación y lavado de "restricción ultra alta" son aquellas en las que las condiciones de hibridación y lavado se aumentan hasta que la relación de señal a ruido para la unión de la sonda al ácido nucleico diana complementario perfectamente emparejado es al menos 10x tan alta como la observada para la hibridación a cualquiera de los ácidos nucleicos diana no emparejados. Un ácido nucleico diana que hibrida con una sonda en dichas condiciones, con una relación de señal a ruido de al menos un ½ la del ácido nucleico diana complementario perfectamente emparejado, se dice que se une a la sonda en condiciones de restricción ultra-altas.
Igualmente, los niveles de restricción incluso mayores se pueden determinar aumentando gradualmente las condiciones de hibridación y/o lavado del ensayo de hibridación pertinente. Por ejemplo, aquellos en los que la restricción de las condiciones de hibridación y lavado se aumentan hasta que la relación de señal a ruido para la unión de la sonda al ácido nucleico diana complementario perfectamente emparejado es al menos 10x, 20x, 50x, 100x o 500x o más de alto que la observada para la hibridación con cualquiera de los ácidos nucleicos diana no emparejados. Un ácido nucleico diana que hibrida con una sonda en dichas condiciones, con una relación de señal a ruido de al menos ½ la del ácido nucleico diana complementario perfectamente emparejado, se dice que se une a la sonda en condiciones de restricción ultra-ultra altas.
Los ácidos nucleicos que no hibridan entre sí en condiciones de restricción son todavía sustancialmente idénticos si los polipéptidos que codifican son sustancialmente idénticos. Esto ocurre, por ejemplo, cuando se crea una copia del ácido nucleico usando la degeneración de codón máxima permitida por el código genético.
Subsecuencias únicas
En un aspecto, la invención proporciona un ácido nucleico que comprende una subsecuencia única en un ácido nucleico seleccionada de las secuencias de O-ARNt y O-RS descritas en el presente documento. La subsecuencia única es única comparada con un ácido nucleico que corresponde a cualquier secuencia de ácido nucleico de O-ARNt o O-RS conocida. Se puede llevar a cabo el alineamiento usando, por ejemplo, los parámetros por defecto de BLAST. Cualquier subsecuencia única es útil, por ejemplo, como una sonda para identificar los ácidos nucleicos de la invención.
Igualmente, la invención incluye un polipéptido que comprende una subsecuencia única en un polipéptido seleccionado de las secuencias de O-RS descritas en el presente documento. Aquí, la subsecuencia única es única comparado con un polipéptido que corresponde a cualquier secuencia de polipéptido previamente conocida.
La invención también proporciona ácidos nucleicos diana que hibridan en condiciones restrictivas con un oligonucleótido codificante que codifica una subsecuencia única en un polipéptido seleccionado de las secuencias de O-RS en las que la subsecuencia única es única comparada con un polipéptido correspondiente a cualquiera de los polipéptidos de control (por ejemplo, secuencias parentales de las que se obtienen las sintetasas de la invención, por ejemplo, por mutación). Las subsecuencias únicas se determinan como se ha indicado antes.
Comparación, identidad y homología de secuencias
Los términos "idéntico" o porcentaje de "identidad", en el contexto de dos o más secuencias de ácido nucleico o polipéptido se refieren a dos o más secuencias o subsecuencias que son iguales o tienen un porcentaje especificado de restos de aminoácidos o nucleótidos que son los mismos, cuando se comparan y alinean para la correspondencia máxima, medido usando uno de los algoritmos de comparación de secuencias descritos a continuación (u otros algoritmos disponibles para los expertos en la materia) o por inspección visual.
La frase "sustancialmente idéntico" en el contexto de dos ácidos nucleicos o polipéptidos (por ejemplo, ADN que codifica un O-ARNt o O-RS, o la secuencia de aminoácidos de una O-RS) se refiere a dos o más secuencias o subsecuencias que tienen al menos aproximadamente 60%, aproximadamente 80%, aproximadamente 90-95%, aproximadamente 98%, aproximadamente 99% o más de identidad de nucleótidos o restos de aminoácidos, cuando se comparan y alinean para la correspondencia máxima, medido usando un algoritmo de comparación de secuencias o por inspección visual. Dichas secuencias "sustancialmente idénticas" normalmente se considera que son "homólogas" sin referencia al linaje real. Preferiblemente, la "identidad sustancial" existe a lo largo de una región de las secuencias, es decir al menos aproximadamente 50 restos de longitud, más preferiblemente a lo largo de una región de al menos aproximadamente 100 restos, y lo más preferiblemente, las secuencias son sustancialmente idénticas a lo largo de aproximadamente 150 restos, o a lo largo de la longitud entera de las dos secuencias que se comparan.
Las proteínas y/o secuencias de proteínas son "homólogas" cuando se obtienen, de forma natural o artificial, de una proteína o secuencia de proteína ancestral común. Igualmente, los ácidos nucleicos y/o secuencias de ácidos nucleicos son homólogos cuando se obtienen, de forma natural o artificial, de un ácido nucleico o secuencia de ácido nucleico ancestral común. Por ejemplo, cualquier ácido nucleico natural se puede modificar mediante cualquier procedimiento de mutagénesis disponible para incluir uno o más codones selectores. Cuando se expresa, este ácido nucleico mutagenizado codifica un polipéptido que comprende uno o más cetoaminoácidos, por ejemplo aminoácidos no naturales. El procedimiento de mutación puede, por supuesto, alterar adicionalmente uno o más codones estándar, cambiando de esta forma también uno o más aminoácidos estándar en la proteína mutante resultante. La homología en general se infiere de la similitud de secuencia entre dos o más ácidos nucleicos o proteínas (o subsecuencias de los mismos). El porcentaje exacto de similitud entre secuencias que es útil para establecer la homología varía con el ácido nucleico y la proteína en cuestión, pero habitualmente se usa tan poco como 25% de similitud de secuencia para establecer la homología. También se pueden usar niveles mayores de similitud de secuencia, por ejemplo, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, o 99% o más, para establecer la homología. Los procedimientos para determinar los porcentajes de similitud de secuencia (por ejemplo, BLASTP y BLASTN usando los parámetros por defecto) se describen en el presente documento y están disponibles en general.
Para la comparación de secuencias y la determinación de la homología, normalmente una secuencia actúa como secuencia de referencia con la que se compara la secuencia de ensayo. Cuando se usa un algoritmo de comparación de secuencias, se introducen en el ordenador las secuencias de ensayo y de referencia, se especifican las coordenadas de la subsecuencia, si es necesario, y se especifican los parámetros del programa del algoritmo de secuencias. El algoritmo de comparación de secuencias entonces calcula el porcentaje de identidad de secuencias para la(s) secuencia(s) de ensayo con respecto a la secuencia de referencia, basándose en los parámetros del programa especificados.
El alineamiento óptimo de secuencias para la comparación se puede llevar a cabo, por ejemplo, por el algoritmo de homología local de Smith y Waterman, Adv. Appl. Math. 2:482 (1981), por el algoritmo de alineamiento de homología de Needleman y Wunsch, J. Mol. Biol. 48:443 (1970), por el procedimiento de búsqueda de similitud de Pearson y Lipman, Proc. Nat'l. Acad. Sci. USA 85:2444 (1988), por implementaciones computerizadas de estos algoritmos (GAP, BESTFIT, FASTA, y TFASTA en el Wisconsin Genetics Software Package, Genetics Computer Group, 575 Science Dr., Madison, WI), o por inspección visual (véase, en general Ausubel y col., véase a continuación).
Un ejemplo de un algoritmo que es adecuado para determinar el porcentaje de identidad de secuencia y la similitud de secuencia es el algoritmo BLAST, que describen Altschul y col., J. Mol. Biol. 215:403-410 (1990). El software para llevar a cabo los análisis con BALST está públicamente disponible a través del National Centerfor Biotechnology Information (www.ncbi.nlm.nih.gov/). Este algoritmo implica primero identificar pares de secuencias de puntuación alta (HSP) identificando palabras cortas de longitud W en la secuencia que se investiga, que coinciden o satisfacen alguna puntuación T umbral de valor positivo cuando se alinean con una palabra de la misma longitud en una secuencia de la base de datos. T se refiere al umbral de puntuación de palabra vecina (Altschul y col., véase antes). Estos aciertos de palabra vecina inicial, actúan como semillas para iniciar las búsquedas para encontrar HSP más largas que las contienen. Los aciertos de palabras después se extienden en ambas direcciones a lo largo de cada secuencia tan lejos como la puntuación de alineamiento acumulativa se pueda aumentar. Las puntuaciones acumulativas se calculan usando, para las secuencias de nucleótidos, los parámetros M (puntuación de recompensa para una pareja de restos de emparejamiento; siempre > 0) y N (puntuación de penalización para restos mal emparejados; siempre < 0). Para secuencias de aminoácidos, se usa una matriz de puntuación para calcular la puntuación acumulativa. La extensión de los aciertos de palabras en cada dirección se paran cuando: la puntuación de alineamiento acumulativo desciende en una cantidad X desde su valor máximo alcanzado; la puntuación acumulativa va a cero o por debajo, debido a la acumulación de uno o más alineamientos de restos con puntuación negativa; o se alcanza el final de cualquier secuencia. Los parámetros W, T y X del algoritmo de BALST determinan la sensibilidad y velocidad del alineamiento. El programa BLAST (para secuencias de nucleótidos) usa por defecto una longitud de palabra (W) de 11, una expectativa (E) de 10, un punto de corte de 100, M=5, N=-4 y una comparación de ambas cadenas. Para las secuencias de aminoácidos, el programa BLASP usa por defecto una longitud de palabra de 3, una expectativa (E) de 10, y la matriz de puntuación BLOSUM62 (véase Henikoff y Henikoff (1989) Proc. Natl. Acad. Sci. USA 89:10915).
Además de calcular el porcentaje de identidad de secuencia, el algoritmo BLAST también lleva a cabo un análisis estadístico de la similitud entre dos secuencias (véase, por ejemplo, Karlin y Altschul, Proc. Nat'l. Acad. Sci. USA 90:5873-5787 (1993)). Una medida de la similitud proporcionada por el algoritmo de BLAST es la probabilidad de suma menor (P(N)), que proporciona una indicación de la probabilidad de que ocurra por casualidad un emparejamiento entre dos secuencias de nucleótidos o aminoácidos. Por ejemplo, se considera que un ácido nucleico es similar a una secuencia de referencia si la probabilidad de la suma menor en una comparación del ácido nucleico de ensayo con el ácido nucleico de referencia es menor de aproximadamente 0,1, más preferiblemente menor de aproximadamente 0,01, y lo más preferiblemente menor de aproximadamente 0,001.
Mutagénesis y otras técnicas de biología molecular
Los polinucleótidos y polipéptidos de la invención y usados en la invención se pueden manipular usando técnicas de biología molecular. Los textos generales que describen técnicas de biología molecular incluyen Berger y Kimmel, "Guide to Molecular Cloning Techniques, Methods in Enzymology" volume 152 Academic Press, Inc., San Diego, CA (Berger); Sambrook y col., "Molecular Cloning-A Laboratory Manual" (3ª Ed.), Vol. 1-3, Cold Spring Harbor Laboratory, Cold Spring Harbor, New York, 2001 ("Sambrook") y "Current Protocols in Molecular Biology", F.M. Ausubel y col., eds., Current Protocols, a joint venture between Greene Publishing Associates, Inc. and John Wiley & Sons, Inc., (complementado en 2003) ("Ausubel")). Estos textos describen la mutagénesis, el uso de vectores, promotores y muchos otros temas relevantes relacionados, por ejemplo, con la generación de genes que incluyen codones selectores para producir proteínas que incluyen cetoaminoácidos (y opcionalmente, otros aminoácidos no naturales), ARNt ortogonales, sintetasas ortogonales, y las parejas de los mismos.
Se usan varios tipos de mutagénesis en la invención, por ejemplo, para mutar moléculas de ARNt, para producir bibliotecas de ARNt, para producir bibliotecas de sintetasas, para insertar codones selectores que codifican un cetoaminoácido y/u otro aminoácido no natural en una proteína o polipéptido de interés. Se incluyen, pero no se limitan a mutagénesis dirigida, puntual aleatoria, recombinación homóloga, mezclado de ADN u otros procedimientos de mutagénesis recursiva, construcción quimérica, mutagénesis usando moldes que contienen uracilo, mutagénesis dirigida por oligonucleótido, mutagénesis de ADN modificado por fosforotioato, mutagénesis usando ADN dúplex con huecos o similares, o cualquier combinación de los mismos. Los procedimientos adicionales adecuados incluyen reparación puntual de emparejamientos erróneos, mutagénesis usando cepas del huésped deficientes en reparación, restricción-selección y restricción-purificación, mutagénesis por deleción, mutagénesis por síntesis de genes total, reparación de rotura de la doble cadena, y similares. La mutagénesis que implica, por ejemplo, construcciones quiméricas, también está incluida en la invención. En una realización, la mutagénesis puede ser guiada mediante información conocida de la molécula natural o la molécula natural mutada o alterada, por ejemplo, secuencia, comparaciones de secuencias, propiedades físicas, estructura cristalina o similares.
Las células huésped se diseñan genéticamente (por ejemplo, se transforman, transducen o transfectan) con los polinucleótidos de la invención o construcciones que incluyen un polinucleótido de la invención, por ejemplo, un vector de la invención, que puede ser, por ejemplo, un vector de clonación o un vector de expresión. Por ejemplo, las regiones codificantes del ARNt ortogonal, la ARNt sintetasa ortogonal, y la proteína que se va a obtener, están operativamente unidos a elementos de control de la expresión de genes que son funcionales en la célula huésped deseada. Los vectores típicos contienen terminadores de la transcripción y traducción, secuencias de iniciación de la transcripción y la traducción, y promotores útiles para regular la expresión del ácido nucleico diana particular. Los vectores opcionalmente comprenden casetes de expresión genéricos que contienen al menos una secuencia terminadora independiente, secuencias que permiten la replicación del casete en eucariotas o procariotas o ambos (por ejemplo, vectores lanzadera) y marcadores de selección para sistemas tanto procariotas como eucariotas. Los vectores son adecuados para la replicación y/o integración en procariotas, eucariotas o preferiblemente ambas. Véase, Giliman y Smith, Gene 8:81 (1979); Roberts, y col., Nature, 328: 731 (1987); Schneider, B., y col., Protein Expr. Purif. 6435:10 (1995); Ausubel, Sambrook, Berger (véase todos antes). El vector puede ser, por ejemplo, en forma de un plásmido, una bacteria, un virus, un polinucleótido desnudo o un polinucleótido conjugado. Los vectores se introducen en células y/o microorganismos por procedimientos estándar, incluyendo electroporación (From y col., Proc. Natl. Acad. Sci. USA 82, 5824 (1985), infección por vectores víricos, penetración balística a alta velocidad por partículas pequeñas con el ácido nucleico dentro de la matriz de perlas o partículas pequeñas, o sobre la superficie (Klein y col., Nature 327, 70-73 (1987)), y/o similares.
Se proporciona un catálogo de bacterias y bacteriófagos útiles para la clonación, por ejemplo, en ATCC, por ejemplo, "The ATCC Catalogue of Bacteria and Bacteriophage" (1996) Ghema y col. (eds) publicado por el ATCC. También se encuentran procedimientos básicos para la secuenciación, clonación y otros aspectos de biología molecular y consideraciones teóricas básicas en Sambrook (véase antes), Ausubel (véase antes), y en Watson y col. (1992) "Recombinant DNA", 2ª Ed., Scientific American Books, NY. Además, se puede encargar o pedir esenencialmente cualquier ácido nucleico (y prácticamente cualquier ácido nucleico marcado, sea estándar o no) en cualquiera de una variedad de fuentes comerciales, tales como la Midland Certified Reagent Company (Midland, TX mcrc.com), The Great American Gene Company (Ramona, CA disponible en internet en genco.com), ExpressGen Inc. (Chicago, IL disponible en internet en expressgen.com), Operon Technologies Inc. (Alameda, CA) y muchos otros.
Las células huésped diseñadas se pueden cultivar en medios nutrientes convencionales modificados según sea adecuado, para actividades tales como, por ejemplo, etapas de cribado, promotores activantes o transformantes de selección. Estas células se pueden cultivar opcionalmente en organismos transgénicos. Otras referencias útiles, por ejemplo, para el aislamiento y cultivo celulares (por ejemplo, para el aislamiento posterior del ácido nucleico) incluyen Freshney (1994) "Culture of Animal Cells, a Manual of Basic Technique", 3ª edición, Wiley- Liss, New York y las referencias citadas en el mismo; Payne y col. (1992) "Plant Cell and Tissue Culture in Liquid Systems", John Wiley & Sons, Inc. New York, NY; Gamborg and Phillips (eds) (1995) "Plant Cell, Tissue and Organ Culture"; Fundamental Methods Springer Lab Manual, Springer-Verlag (Berlin Heidelberg New York) y Atlas and Parks (eds) "The Handbook of Microbiological Media" (1993) CRC Press, Boca Raton, FL.
Proteínas y polipéptidos de interés
Las proteínas y polipéptidos de interés con al menos un aminoácido p-acetil-L-fenilalanina son una característica de la invención. La invención también incluye polipéptidos o proteínas con al menos un aminoácido p-acetil-L-fenilalanina producidos usando las composiciones y los procedimientos de la invención. Una ventaja de los cetoaminoácidos es que pueden participar en una variedad de reacciones químicas. El grupo carbonilo reacciona fácilmente, por ejemplo con hidrazidas, hidroxilaminas, semicarbazidas y/o similares, en condiciones suaves en disolución acuosa, y forman, por ejemplo, enlaces hidrazona, oxima y semicarbazona, respectivamente, que son estables en condiciones fisiológicas. Véase, por ejemplo, Jencks, W. P. (1959), véase antes; Shao, J. y Tam, J. P. (1995), véase antes. A través del cetoaminoácido, las proteínas se pueden modificar o marcar selectivamente con una amplia variedad de otros derivados de hidrazida o hidroxilamina (incluyendo azúcares, marcadores de fluorescencia, derivados de biotina, marcadores paramagnéticos, quelantes de metales, agentes de reticulación, poliéteres, ácidos grasos, toxinas, etc.), por ejemplo, para producir sondas de estructura y función de proteína, para generar proteínas que potencian las propiedades catalíticas o terapéuticas, o para el desarrollo de bioensayos usando proteínas inmovilizadas o solubles. En algunas realizaciones de la invención, puede estar presente un excipiente (por ejemplo, un excipiente farmacéuticamente aceptable) con la proteína. Opcionalmente, una proteína de la invención incluirá una modificación postraduccional.
Los procedimientos para producir una proteína en una célula con un aminoácido p-acetil-L-fenilalanina en una posición especificada también son una característica de la invención. Por ejemplo, un procedimiento incluye hacer crecer la célula en un medio adecuado, en el que la célula comprende un ácido nucleico que comprende al menos un codón selector y que codifica una proteína, proporcionando el cetoaminoácido e incorporando el cetoaminoácido en la posición especificada en la proteína durante la traducción del ácido nucleico con el al menos un codón selector, produciendo de esta forma la proteína. La célula además comprende: un ARNt ortogonal (O-ARNt) que funciona en la célula y reconoce el codón selector; y una aminoacil-ARNt sintetasa ortogonal (O-RS) que aminoacila preferentemente el O-ARNt con el cetoaminoácido. En algunas realizaciones, la O-RS aminoacila preferentemente el O-ARNt con una eficacia de al menos aproximadamente, por ejemplo, un 50%, un 60%, un 75%, un 80% o un 90% o más eficacia de la eficacia de un polipéptido que comprende una secuencia de aminoácidos seleccionada de las SEQ ID NO.: 18 a 20, con p-acetil-L-fenilalanina. Una proteína producida por este procedimiento también es una característica de la invención.
La invención también proporciona composiciones que incluyen proteínas, en las que las proteínas comprenden un aminoácido p-acetil-L-fenilalanina. En algunas realizaciones, la proteína comprende una secuencia de aminoácidos que es al menos 75% idéntica a la de una proteína terapéutica, una proteína de diagnóstico, una enzima industrial o parte de la misma.
Las composiciones de la invención y las composiciones hechas por los procedimientos de la invención opcionalmente están en una célula. La pareja de O-ARNt/O-RS o los componentes individuales de la invención se pueden usar después en una maquinaria de traducción del sistema del huésped, que de como resultado la incorporación de un cetoaminoácido en la proteína. El documento WO 2002/085923, véase antes, describe este procedimiento. Por ejemplo, cuando se introduce la pareja de O-ARNt/O-RS en un huésped, por ejemplo, Escherichia coli, la pareja conduce a la incorporación in vivo del cetoaminoácido, que se puede añadir de forma exógena al medio de crecimiento, en una proteína en respuesta a un codón selector. Opcionalmente, las composiciones de la presente invención pueden estar en un sistema de traducción in vitro o en un sistema(s) in vivo.
Una célula de la invención proporciona la capacidad de sintetizar proteínas que comprenden aminoácidos no naturales en cantidades grandes útiles. En un aspecto, la composiciones incluye opcionalmente, por ejemplo, al menos 10 microgramos, al menos 50 microgramos, al menos 75 microgramos, al menos 100 microgramos, al menos 200 microgramos, al menos 250 microgramos, al menos 500 microgramos, al menos 1 miligramo, al menos 10 miligramos o más de proteína que comprende un cetoaminoácido, o una cantidad que se pueda lograr con procedimientos de producción de proteínas in vivo (en el presente documento se proporcionan detalles sobre la producción y purificación de proteínas recombinantes). En otro aspecto, la proteína está opcionalmente presente en la composición con una concentración de, por ejemplo, al menos 10 microgramos de proteína por litro, al menos 50 microgramos de proteína por litro, al menos 75 microgramos de proteína por litro, al menos 100 microgramos de proteína por litro, al menos 200 microgramos de proteína por litro, al menos 250 microgramos de proteína por litro, al menos 500 microgramos de proteína por litro, al menos 1 miligramo de proteína por litro, o al menos 10 miligramos de proteína por litro o más, por ejemplo, en un lisato celular, un tampón, un tampón farmacéutico, u otra suspensión líquida (por ejemplo, en un volumen de, por ejemplo, cualquiera de aproximadamente 2 nl a aproximadamente 100 litros). La producción de grandes cantidades (por ejemplo, mayores que las que normalmente son posibles con otros procedimientos, por ejemplo, la traducción in vitro) de una proteína en una célula, que incluye al menos un cetoaminoácido es una característica de la invención.
La incorporación de un cetoaminoácido se puede hacer, por ejemplo, para diseñar cambios en la estructura y/o función de la proteína, por ejemplo, para cambiar el tamaño, acidez, nucleofilia, formación de enlace de hidrógeno, hidrofobicidad, accesibilidad a sitios diana de proteasas, acceso de la diana a un resto de proteína, etc. Las proteínas que incluyen un cetoaminoácido pueden tener propiedades catalíticas o físicas potenciadas o incluso totalmente nuevas. Por ejemplo, las siguientes propiedades se modifican opcionalmente por la inclusión de un cetoaminoácido en una proteína: la toxicidad, biodistribución, propiedades estructurales, propiedades espectroscópicas, propiedades químicas y/o fotoquímicas, capacidad catalítica, semivida (por ejemplo, semivida en el suero), capacidad para reaccionar con otras moléculas, por ejemplo, de forma covalente o no covalente, y similares. Las composiciones que incluyen proteínas que incluyen al menos un cetoaminoácido son útiles, por ejemplo, para nuevos productos terapéuticos, productos de diagnóstico, enzimas catalíticas, enzimas industriales, proteínas de unión (por ejemplo, anticuerpos), y por ejemplo, el estudio de la estructura y función de proteínas. Véase, por ejemplo, Dougherty, (2000) "Unnatural Amino Acids as Probes of Protein Structure and Function", Current Opinion in Chemical Biology, 4:645-652.
En un aspecto de la invención, una composición incluye al menos una proteína con al menos uno, por ejemplo al menos 2, al menos 3, al menos 4, al menos 5, al menos 6, al menos 7, al menos 8, al menos 9 o al menos 10 o más aminoácidos no naturales, por ejemplo, cetoaminoácidos y/u otros aminoácidos no naturales. Los aminoácidos no naturales pueden ser iguales o diferentes, por ejemplo, pueden estar en 1, 2, 3, 4, 5, 6, 7, 8, 9 ó 10 o más sitios diferentes en la proteína que comprende 1, 2, 3, 4, 5, 6, 7, 8, 9 ó 10 o más aminoácidos no naturales diferentes. En otro aspecto, una composición incluye una proteína con al menos uno, pero menos que todos, de un aminoácido particular presente en la proteína, sustituido por el cetoaminoácido. Para una proteína dada con más de un aminoácido no natural, los aminoácidos no naturales pueden ser iguales o diferentes (por ejemplo, la proteína puede incluir dos o más tipos diferentes de aminoácidos no naturales, o puede incluir dos aminoácidos no naturales iguales). Para una proteína dada con más de dos aminoácidos no naturales, los aminoácidos no naturales pueden ser iguales o diferentes, o una combinación de múltiples aminoácidos no naturales del mismo tipo, con al menos un aminoácido no natural diferente.
Se puede producir esencialmente cualquier proteína (o parte de la misma) que incluya un cetoaminoácido (y cualquier ácido nucleico codificante correspondiente, por ejemplo, que incluya uno o más codones selectores) usando las composiciones y los procedimientos del presente documento. No se intentan identificar las cientos de miles de proteínas conocidas, cualquiera de las cuales se puede modificar para que incluya uno o más aminoácidos no naturales, por ejemplo, ajustando cualquier procedimiento de mutación disponible para que incluye uno o más codones selectores adecuados en un sistema de traducción relevante. Los lugares de depósito de secuencias comunes para las proteínas conocidas incluyen GenBank EMBL, DDBJ y NCBI. Se pueden identificar otros lugares de depósito buscando en inernet.
Normalmente, las proteínas son, por ejemplo, al menos 60%, al menos 70%, al menos 75%, al menos 80%, al menos 90%, al menos 95% o al menos 99% o más idénticas a cualquier proteína disponible (por ejemplo, una proteína terapéutica, una proteína de diagnóstico, una enzima industrial, o parte de las mismas, y similares), y puede comprender uno o más cetoaminoácidos. Los ejemplos de productos terapéuticos, de diagnóstico y otras proteínas que se pueden modificar para que comprendan uno o más cetoaminoácidos se pueden encontrar, pero no se limita, en el documento WO 2002/085923, véase antes. Los ejemplos de productos terapéuticos, de diagnóstico y otras proteínas que se pueden modificar para que comprendan uno o más cetoaminoácidos incluyen, pero no se limitan a, por ejemplo, antitripsina alfa-1, angiostatina, factor antihemolítico, anticuerpos (se encuentran detalles adicionales de anticuerpos más adelante), apolipoproteína, apoproteína, factor natriurético atrial, polipéptido natriurético atrial, péptidos atriales, quimioquinas C-X-C (por ejemplo, T39765, NAP-2, ENA-78, Gro-a, Gro-b, Gro-c, IP-10, GCP-2, NAP-4, SDF-1, PF4, MIG), calcitonina, quimioquinas CC (por ejemplo, proteína 1 quimioatractora de monocitos, proteína 2 quimioatractora de monocitos, proteína 3 quimioatractora de monocitos, proteína 1 alfa inflamatoria de monocitos, proteína 1 beta inflamatoria de monocitos, RANTES, I309, R83915, R91733, HCC1, T58847, D31065, T64262), ligando CD40, ligando C-kit, colágeno, factor estimulante de colonia (CSF), factor complemento 5a, inhibidor de complemento, receptor 1 de complemento, citoquinas, (por ejemplo, péptido 78 activante epitelial de neutrófilos, GRO\alpha/MGSA, GRO\beta, GRO\gamma, MIP-1\alpha, MIP-1\delta, MCP-1), factor de crecimiento epidermal (EGF), eritropoyetina ("EPO", que representa una diana preferida para la modificación mediante la incorporación de uno o más aminoácidos no naturales), toxinas exfoliantes A y B, Factor IX, Factor VII, Factor VIII, Factor X, factor de crecimiento de fibroblastos (FGF), Fibrinógeno, Fibronectina, G-CSF, GM-CSF, glucocerebrosidasa, gonadotropina, factores de crecimiento, proteínas Hedgehog (por ejemplo, sónica, India, desierto), hemoglobina, factor de crecimiento de hepatocitos (HGF), hirudina, albúmina de suero humana, insulina, factor de crecimiento de tipo insulina (IGF), interferones (por ejemplo, IFN-\alpha, IFN-\beta, IFN-\gamma), interleuquinas (por ejemplo, IL-1, IL-2, IL-3, IL-4, IL-5, IL-6, IL-7, IL-8, IL-9, IL-10, IL-11, IL-12, etc.), factor de crecimiento de queratinocitos (KGF), lactoferrina, factor inhibidor de leucemia, luciferasa, neurturina, factor inhibidor de neutrófilos (NIF), oncostatina M, proteína osteogénica, hormona paratiroidea, PD-ECSF, PDGF, hormonas peptídicas (por ejemplo, hormona de crecimiento humano), pleiotropina, proteína A, proteína G, exotoxinas pirógenas A, B, y C, relaxina, renina, SCF, receptor de complemento soluble I, Soluble I-CAM 1, receptores de interleuquina solubles (IL-1, 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 14, 15), receptor de TNF soluble, somatomedina, somatostatina, somatotropina, estreptoquinasa, superantígenos, es decir, enterotoxinas estafilococas (SEA, SEB, SEC1, SEC2, SEC3, SED, SEE), superóxido dismutasa (SOD), toxina del síndrome de choque tóxico (TSST-1), timosina alfa 1, activador del plasminógeno tisular, factor de necrosis tumoral beta (TNF beta), receptor del factor de necrosis tumoral (TNFR), factor de necrosis tumoral alfa (TNF alfa), factor de crecimiento endotelial vascular (VEGEF), uroquinasa y muchos otros.
Una clase de proteínas que se pueden hacer usando las composiciones y procedimientos para la incorporación in vivo de cetoaminoácidos descritos en el presente documento, incluyen moduladores de la transcripción o una parte de los mismos. Los ejemplos de moduladores de la transcripción incluyen genes y proteínas moduladoras de la transcripción que modulan el crecimiento, diferenciación, regulación celulares, o similares. Se encuentran moduladores de la transcripción en procariotas, virus y eucariotas, incluyendo hongos, plantas, levaduras, insectos y animales incluyendo mamíferos, que proporcionan una amplia variedad de dianas terapéuticas. Se observará que los activadores de la expresión y transcripción regulan la transcripción por muchos mecanismos, por ejemplo, por unión a receptores, estimulando una cascada de transducción de señales, regulando la expresión de factores de transcripción, por unión a promotores y potenciadores, por unión a proteínas, que se unen a promotores y potenciadores, densenrrollamiento de ADN, corte y empalme de pre-ARNm, poliadenilación de ARN y degradación de ARN.
Una clase de proteínas de la invención (por ejemplo, proteínas con uno o más cetoaminoácidos) incluyen activadores de la expresión tales como citoquinas, moléculas inflamatorias, factores de crecimiento, sus receptores, y productos oncogénicos, por ejemplo, interleuquinas (por ejemplo, IL-1, IL-2, IL-8, etc.), interferones, FGF, IGF-I, IGF-II, FGF, PDGF, TNF, TGF-\alpha, TGF-\beta, EGF, KGF, SCF/c-Kit, CD40L/CD40, VLA-4/VCAM-1, ICAM-1/LFA-1, y hialurina/CD44; moléculas de transducción de señales y productos oncogénicos correspondientes, por ejemplo, Mos, Ras, Raf y Met; y activadores y supresores de la transcripción, por ejemplo, p53, Tat, Fos, Myc, Jun, Myb, Rel y receptores hormonales esteroideos tales como los de estrógeno, progesterona, testosterona, aldosterona, el ligando del receoptor de LDL y corticosterona.
La invención también proporciona enzimas (por ejemplo, enzimas industriales) o partes de las mismas con al menos un cetoaminoácido. Los ejemplos de enzimas incluyen, pero no se limitan a, por ejemplo, amidasas, aminoácido racemasas, acilasas, deshalogenasas, dioxigenasas, diarilpropano peroxidasas, epimerasas, epóxido hidrolasas, esterasas, isomerasas, quinasas, glucosa isomerasas, glicosidasas, glicosiltransferasas, haloperoxidasas, monooxigenasas (por ejemplo, p450s), lipasas, lignina peroxidasas, nitrilo hidratasas, nitrilasas, proteasas, fosfatasas, subtilisinas, transaminasa y nucleasas.
Muchas proteínas que pueden incorporar cetoaminoácidos están disponibles en el comercio (véase, por ejemplo, el catálogo de Sigma Bio-Sciences 2002 y lista de precios) y las correspondientes secuencias de proteínas y genes, y normalmente, muchas variantes de los mismos, son conocidos (véase, por ejemplo, Genbank). Cualquiera de ellas se puede modificar por la inserción de uno o más cetoaminoácidos de acuerdo con la invención, por ejemplo para alterar la proteína con respecto a una o más propiedades terapéuticas, de diagnóstico o enzimáticas, de interés. Los ejemplos de propiedades terapéuticamente relevantes incluyen semivida en el suero, semivida en anaquel, estabilidad, inmunogenicidad, actividad terapéutica, detectabilidad (por ejemplo, por la inclusión de grupos informadores (por ejemplo, marcadores o sitios de unión de marcadores) en los aminoácidos no naturales, por ejemplo, cetoaminoácidos), especificidad, reducción de la DL_{50} u otros efectos secundarios, capacidad para entrar en el cuerpo a través del tracto gástrico (por ejemplo, disponibilidad oral) o similares. Los ejemplos de propiedades de diagnóstico relevantes incluyen semivida en anaquel, estabilidad, actividad diagnóstica, detectabilidad, especificidad o similares. Los ejemplos de propiedades enzimáticas relevantes incluyen semivida en anaquel, estabilidad, actividad enzimática, capacidad de producción, especificidad, o similares.
También se puede modificar una variedad de otras proteínas para incluir uno o más cetoaminoácidos de la invención. Por ejemplo, la invención puede incluir sustituir uno o más aminoácidos naturales en una o más proteínas vacuna por un cetoaminoácido, por ejemplo, en proteínas de hongos infecciosos, por ejemplo, especies de Aspergillus, Candida; bacterias, en particular E. coli, que sirve como modelo para las bacterias patógenas, así como bacterias médicamente importantes tales como estafilococos (por ejemplo, aureus), o estreptococos (por ejemplo, pneumoniae); protozoos tales como esporozoos (por ejemplo, Plasmodia), rizópodos (por ejemplo, Entamoeba) y flagelados (Trypanosoma, Leishmania, Trichomonas, Giardia, etc.); virus tales como virus de ARN (+) (los ejemplos incluyen Poxvirus por ejemplo, vaccinia; Picornavirus, por ejemplo polio; Togavirus, por ejemplo, rubella; Flavivirus, por ejemplo, HCV; y Coronavirus), virus ARN(-) (por ejemplo, Rhabdovirus, por ejemplo, VSV; Paramixovirus, por ejemplo, RSV; Ortomixovirus, por ejemplo, influenza; Buniavirus; y Arenavirus), virus de ADNbc (Reovirus, por ejemplo), virus de ARN a ADN, es decir retrovirus, por ejemplo, VIH y VLTH, y algunos virus de ADN a ARN tales como el de la hepatitis B.
Las proteínas relacionadas con la agricultura tales como proteínas de resistencia a insectos, (p. e., proteínas Cry), enzimas de producción de almidón y lípidos, de plantas y toxinas de insecto, proteínas de resistencia a toxinas, proteínas de detoxificación de micotoxina, enzimas de crecimiento de plantas (por ejemplo, ribulosa 1,5-bisfosfatocarboxilasa/oxigenasa, "RUBISCO"), lipoxigenasa (LOX), y fosfoenolpiruvato (PEP) carboxilasa, también son dianas adecuadas para la modificación con cetoaminoácidos.
En algunas realizaciones, la proteína o polipéptido de interés (o una parte del mismo) en los procedimientos y/o composiciones de la invención, es codificado por un ácido nucleico. Normalmente, el ácido nucleico comprende al menos un codón selector, al menos 2 codones selectores, al menos 3 codones selectores, al menos 4 codones selectores, al menos 5 codones selectores, al menos 6 codones selectores, al menos 7 codones selectores, al menos 8 codones selectores, al menos 9 codones selectores, 10 o más codones selectores.
Los genes que codifican las proteínas o polipéptidos de interés se pueden mutar usando procedimientos conocidos para el experto en la materia y descritos en el presente documento en "Mutagénesis y otras técnicas de biología molecular" para incluir, por ejemplo, uno o más codones selectores para incorporar un cetoaminoácido. Por ejemplo, un ácido nucleico para una proteína de interés se muta para incluir uno o más codones selectores, proporcionando la inserción de uno o más cetoaminoácidos. La invención incluye cualquier variante, por ejemplo, mutante, versiones de cualquier proteína, por ejemplo, que incluye al menos un cetoaminoácido. Igualmente la invención también incluye los correspondientes ácidos nucleicos, es decir, cualquier ácido nucleico con uno o más codones selectores que codifican uno o más cetoaminoácidos.
Para hacer que una proteína incluya un cetoaminoácido, se pueden usar células huésped y organismos que están adaptados para la incorporación in vivo del cetoaminoácido mediante parejas ortogonales de ARNt/RS. Las células huésped se diseñan genéticamente (por ejemplo, se transforman, transducen o transfectan) con uno o más vectores que expresan el ARNt ortogonal, la ARNt sintetasa ortogonal, y un vector que codifica la proteína que se va a obtener. Cada uno de estos componentes puede estar en el mismo vector, o cada uno puede estar en un vector separado, o dos componentes pueden estar en un vector y el tercer componente en un segundo vector. El vector puede estar, por ejemplo, en forma de un plásmido, una bacteria, un virus, un polinucleótido desnudo o un polinucleótido conjugado.
Definición de polipéptidos por inmunorreactividad
Debido a que los polipéptidos de la invención proporcionan una variedad de secuencias de polipéptidos nuevas (por ejemplo, que comprenden cetoaminoácidos en el caso de proteínas sintetizadas en el sistema de traducción de la presente invención, o por ejemplo, en el caso de las sintetasas nuevas, secuencias nuevas de aminoácidos estándar), los polipéptidos también proporcionan nuevas características estructurales, que se pueden reconocer, por ejemplo, en ensayos inmunológicos. La generación de antisueros, que se unen especificamente a los polipéptidos de la invención, así como los polipéptidos que se unen a dichos antisueros, son una característica de la invención. El término "anticuerpo" tal como se usa en el presente documento, incluye, pero no se limita a un polipéptido sustancialmente codificado por un gen de inmunoglobulina o genes de inmunoglobulinas, o fragmentos de los mismos que se unen y reconocen especialmente un analito (antígeno). Los ejemplos incluyen anticuerpos policlonales, monoclonales, quiméricos y de una cadena, y similares. Los fragmentos de inmunoglobulinas, incluyendo fragmentos Fab y fragmentos producidos por una biblioteca de expresión, incluyendo la presentación de fago, también están incluidos en el término "anticuerpo" tal como se usa en el presente documento. Para la estructura de anticuerpos y la terminología véase, por ejemplo, Paul, Fundamental Immunology, 4th Ed., 1999, Raven Press, New York.
Con el fin de producir antisuero para usar en un inmunoensayo, se producen y purifican uno o más polipéptidos inmunógenos, como se describe en el presente documento. Por ejemplo, se puede producir proteína recombinante en una célula recombinante. Una cepa de ratones endogámicos (usada en este ensayo porque los resultados son más reproducibles debido a la identidad genética virtual de los ratones) se inmuniza con la o las proteínas inmunógenas en combinación con un adyuvante estándar, tal como adyuvantes de Freund, y por un protocolo de inmunización de ratón estándar (véase, por ejemplo, Harlow y Lane (1988) "Antibodies. A Laboratory Manual", Cold Spring Harbor Publications, New York, para una descripción estándar de la generación de anticuerpos, formatos y condiciones de inmunoensayo que se pueden usar para determinar la inmunorreactividad específica. Se pueden encontrar detalles adicionales de proteínas, anticuerpos, antisueros, etc. en el documento WO 2002/085923, véase antes.
Ejemplos
Los siguientes ejemplos se ofrecen para ilustrar, pero no limitan la invención. Se entiende que los ejemplos y realizaciones descritos en el presente documento tienen sólo fines ilustrativos y que el experto en la materia sugerirá diferentes modificaciones o cambios a la luz de los mismos.
Ejemplo 1 Incorporación específica de sitio de un cetoaminoácido en proteínas
Aunque el grupo carbonilo es el más versátil de los grupos funcionales en química orgánica, está ausente en los aminoácidos genéticamente codificados. Para superar esta limitación natural en la biosíntesis de proteínas, se desarrolló una pareja de ARNt-sintetasa ortogonal que permite la incorporación in vivo de un cetoaminoácido, la p-acetil-L-fenilalanina, en proteínas en E. coli con una alta fidelidad de la traducción en respuesta al codón sin sentido ámbar. Para demostrar la utilidad de este nuevo aminoácido, se modificó selectivamente una proteína in vitro con una molécula pequeña fluoróforo y derivado de biotina. Este nuevo aminoácido genéticamente codificado debería extender mucho la capacidad de manipular la estructura y función de proteínas tanto in vitro como en células vivas.
Los códigos genéticos de todos los organismos conocidos codifican los mismos 20 aminoácidos comunes como unidades estructurales para la biosíntesis de proteínas. Las cadenas laterales de estos aminoácidos comprenden un número sorporendetemente limitado de grupos funcionales - - bases nitrogenadas, ácidos carboxílicos y amidas, alcoholes y un grupo tiol (en casos raros, selenocisteína (véase, por ejemplo, Bock, A., Forchhammer, K., Heider, J., Leinfelder, W., Sawers, G., Veprek, B. y Zinoni, F. (1991) Mol. Microbiol. 5:515-520) o pirrolisina (véase, por ejemplo, Srinivasan, G., James, C.M. y Krzycki, J.A. (2002) Science 296: 1459-1462; Hao, B., Gong, W., Ferguson, T.K., James, C.M., Krzycki, J.A. y Chan, M.K. (2002) Science 296: 1462-1466)), siendo el resto grupos alcano sencillos o hidrófobos. La capacidad para aumentar los aminoácidos genéticamente codificados con aminoácidos nuevos, por ejemplo, aminoácidos con cadenas laterales quelantes de metales, fluorescentes, redox activas, fotoactivas o con marcador paramagnético, potenciaría significativametne la capacidad para manipular las estructuras y funciones de proteínas y quizás los propios organismos vivos. Recientemente, se ha descrito que mediante la adición de nuevos componentes a la maquinaria de traducción de Escherichia coli, se podría incorporar específicamente en un sitio con alta fidelidad una serie de aminoácidos no naturales en proteínas, in vivo . Véase, por ejemplo, Wang, L., Brock, A., Herberich, B. y Schultz, P. G. (2001) Science 292:498-500; Wang, L., Brock, A. y Schultz, P. G. (2002) J. Am. Chem. Soc. 124:1836-1837; y, Zhang, Z., Wang, L., Brock, A. y Schultz, P. G. (2002) Angew. Chem. Int. Ed. Engl. 41:2840-2842. Este procedimiento se puede generalizar para añadir un aminoácido que contiene grupo ceto en el código genético, por ejemplo, de E. coli, y que la única reactividad del grupo ceto se puede usar para modificar proteínas selectivamente in vitro con una amplia variedad de agentes.
El grupo ceto es ubicuo en química orgánica, y participa en un gran número de reacciones desde reacciones de adición y descarboxilación a condensaciones aldólicas. Además, la reactividad única del grupo carbonilo permite modificarlo selectivamente con derivados de hidrazida e hidroxilamina en presencia de otras cadenas laterales de aminoácidos. Véase, por ejemplo, Cornish, V.W., Hahn, K.M. y Schultz, P.G. (1996) J. Am. Chem. Soc. 118:8150-8151; Geoghegan, K.F. y Stroh, J.G. (1992) Bioconjug. Chem. 3:138-146; y, Mahal, L.K., Yarema, K.J. y Bertozzi, C.R. (1997) Science 276: 1125-1128. Aunque está presente en los cofactores (véase, por ejemplo, Begley, T.P., Kinsland, C., Taylor, S., Tandon, M., Nicewonger, R., Wu, M., Chiu, H., Kelleher, N., Campobasso, N. y Zhang, Y. (1997) en Top. Curr. Chem., eds. Leeper, F. J. y Vederas, J.C. (Springer-Verlag, New York), Vol. 195, pp. 93-142), metabolitos (véase, por ejemplo, Diaz, E., Ferrandez, A., Prieto, M.A. y Garcia, J.L. (2001) Microbiol. Mol. Biol. Rev. 65:523-569) y como modificación postraduccional en proteínas (véase, por ejemplo, Okeley, N.M. y van der Donk, W.A. (2000) Chem. Biol. 7, R159-R171), este importante grupo funcional está ausente en las cadenas laterales de los aminoácidos comunes. Con el fin de codificar genéticamente este grupo funcional en E. coli en forma de p-acetil-L-fenilalanina, se desarrolló una pareja de ARNt-sintetasa que es capaz de insertar este aminoácido específicamente en un sitio en proteínas en E. coli, en respuesta a un codón sin sentido ámbar. Es importante, que esta pareja de ARNt-sintetasa sea ortogonal con sus homólogos para los 20 aminoácidos comunes, es decir, la sintetasa ortogonal aminoacila el ARNt ortogonal solo con el aminoácido no natural, y el ARNt acilado resultante inserta el aminoácido no natural sólo en respuesta al codón ámbar.
Materiales y procedimientos
Preparación de p-acetil-L-fenilalanina: la Fmoc-4-acetil-L-fenilalanina se adquirió en RSP Amino Acid Analogues, Inc. (Worcester, MA). Este compuesto (1,0 g, 2,3 mmol) se agitó con 4 ml de piperidina (al 20% en DMF) durante 2 horas a temperatura ambiente. Se evaporó el disolvente para obtener un polvo blanco. El sólido después se volvió a suspender en 10 ml de agua fría (TFA al 0,1%), y el líquido sobrenadante se recogió por filtración. Se usó HPLC de fase inversa preparativa (Microsorb C18, Rainin Instrument Co., Inc., Woburn, MA) para separar el producto deseado de la mezcla de reacción (CH_{3}CN en H_{2}O con TFA al 0,1%, al 5-30% a lo largo de 30 min). El eluyente (t_{R} = 12 min) se liofilizó para obtener un sólido blanco (0,45 g, 88%). RMN ^{1}H (D_{2}O): \delta 7,85-7,28 (m, 4H), 4,23 (dd, 1H, 5,4 Hz), 3,2 (m, 2H), 2,7 (s, 3H). LRMS, calculado para C_{11}H_{13}NO_{3} (M++1): 208,09. Encontrado (ESI): 208,47.
Síntesis de p-acetil-(\pm)-fenilalanina: Véase, por ejemplo, Cleland, G.H. (1969) J. Org. Chem. 34:744-747. La NBS (N-bromosuccinimida) se recristalizó antes de usarla. Se añadió NBS (18,5 g, 105 mmol) a una disolución agitada de 4-metil-acetofenona (13,4 g, 100 mmol) en 400 ml de tetracloruro de carbono, seguido de la adición de AIBN (2',2'-azobisisobutironitrilo) (0,43 g, 2,5 mmol). Después, la mezcla de reacción se calentó a reflujo durante 4 horas. Después de completarse la reacción (TLC: hexanos:EtOAc 8:1), la disolución se lavó con agua (1 X 100 ml), HCl acuoso 1 M (3 X 100 ml), NaHCO_{3} acuoso al 0,5% (3 X 100 ml) y salmuera (1 X 100 ml). La capa orgánica se recogió y se secó sobre MgSO_{4}, y el disolvente se evaporó para obtener un sólido amarillo que se recristalizó en hexanos para dar la 1-(4-bromoetil-fenil)etanona deseada en forma de sólido (16,8 g, 78%). Se añadió gota a gota etanol seco (50 ml) a trozos de sodio lavados con pentano (2,3 g, 0,1 mol) en atmósfera de argón a lo largo de 15 minutos y la disolución se agitó durante otros 15 minutos. Después, se añadió acetamidomalonato de dietilo sólido (2,7 g, 10 mmol) a lo largo de 30 minutos con agitación, seguido de la adición gota a gota de 1-(4-bromoetil-fenil)etanona (2,1 g, 10 mmol) en etanol seco a lo largo de 90 minutos. Después de calentar a reflujo toda la noche la mezcla y enfriar, se añadieron éter dietílico (150 ml) y agua (100 ml) a la disolución. Se separó la capa orgánica y se lavó sucesivamente con NaHCO_{3} al 0,5% (3 X 100 ml) y salmuera (1 X 100 ml). Después de secar sobre MgSO_{4}, se separó el disolvente a vacío para dar un sólido marrón gomoso. Se añadieron hexanos-diclorometano (4:1) al residuo, y el material insoluble se separó por filtración y se lavó exhaustivamente con diclorometano-benceno 10:1 para dar el éster de dietilo del ácido 2-acetilamino-2-(4-acetil-bencil)malónico en forma de un sólido amarillo (3,3 g, 95% de rendimiento del bruto). Este compuesto se agitó con HCl 4 M en dioxano durante una noche. Después, la mezcla se evaporó a sequedad y se recristalizó en agua para dar la p-acetil-(\pm)-fenilalanina (13,2 g, 64% de rendimiento global) en forma de un sólido blanco. RMN ^{1}H (400 MHz, D_{2}O): \delta 7,85-7,28 (m, 4H), 4,27 (dd, 1H, 5,4 HZ), 3,30 (m, 2H), 2,68 (s, 3H). RMN ^{13}C (400 MHz, D_{2}O): \delta 195,8, 174,3, 145,9, 133,1, 128,9, 127,8, 60,2, 38,3, 26,5. LRMS, calculado para C_{11}H_{13}NO_{3} (M++1): 208,09. Encontrado (ESI): 208,07.
Evolución de la sintetasa mutante: La selección positiva se llevó a cabo en presencia de p-acetil-L-fenilalanina 1 mM como se ha descrito. Véase, por ejemplo, Wang, L., Brock, A., Herberich, B. y Schultz, P.G. (2001) Science 292:498-500. Para la selección negativa, se usó el plásmido pLWJ17B3 para expresar mutRNA^{Tyr}_{CUA} (denominado en el presente documento "mutRNA-Tyr") bajo el control del promotor lpp y el terminador rrnC, y el gen de barnasa con los tres codones ámbar en Gln2, Asp44, y Gly65 bajo el control del promotor de arabinosa. Después de la selección positiva en cloranfenicol, se aislaron los plásmidos pBK que codifican la TyrRS mutante y se transformaron en células competentes DH10B de E. coli que albergaban pLWJ17B3. Las células se hicieron crecer en placas LB (Luria-Bertani) que contenían arabinosa al 0,2%, kanamicina 50 \mug/ml y cloranfenicol 35 \mug/ml. Después de 8 horas, las células se sacaron de la placa, y los plásmidos pBK se purificaron mediante más ciclos de selección. Después de 3 selecciones positivas alternando con 2 selecciones negativas, se identificaron 11 TyrRS mutantes que daban un valor de CI_{50} de cloranfenicol de 9 \mug/ml en ausencia de p-acetil-L-fenilalanina y de cloranfenicol de 120 \mug/ml en presencia de p-acetil-L-fenilalanina. Las secuencias de proteínas de estos TyrRS mutantes convergían en 3 clones independientes LW1, LW5 y LW6, aunque el uso de codón de cada TyrRS mutante difiere.
Expresión y purificación de proteína: Se usó el plásmido pLEIZ para expresar el gen del dominio Z con un codón ámbar en la 7ª posición y un marcador de His6 en el COOH terminal bajo el control de un promotor de bacteriófago T5 y del terminador, y el gen mutTNA^{Tyr}_{CUA} bajo el control del promotor lpp y el terminador rrnC. El gen de la sintetasa mutante aislado del clon LW1 (LW1RS) se codificó en el plásmido pBKLW1RS bajo el control del promotor y terminador constitutivos GlnRS de E. coli. Las células DH10B de E. coli se contransformaron con pLEIZ y las pBK-LW1RS se hicieron crecer en medio mínimo que contenía glicerol al 1% y leucina 0,3 mM (medio GMML) con kanamicina 25 mg/ml, cloranfenicol 34 mg/ml y p-acetil-(\pm)-fenilalanina 1,0 mM. Cuando las células alcanzaron una DO_{600} de 0,5, se añadió isopropil-\beta-D-tiogalactopiranósido (IPTG) (1 mM) para inducir la expresión de proteínas. Después de 5 horas, las células se sedimentaron y la proteína se purificó por cromatografía de afinidad de Ni^{2+} en condiciones desnaturalizantes de acuerdo con el protocolo del fabricante (Qiagen, Valencia, CA). Después, las proteínas de desalaron con una columna PD-10 (Amersham Pharmacia, Piscataway, NJ) y se eluyeron en agua. El rendimiento de la proteína se midió en un ensayo Bradford (kit BCA, Biorad, Hercules, CA). Se usaron partes alícuotas de proteína para el análisis por SDS-PAGE y espectrometría de masas.
Modificación de proteína in vitro con hidrazida de fluoresceína e hidrazida de biotina: Las proteínas de dominio Z natural y mutante purificadas se intercambiaron en tampón 1 x PBS (fosfato potásico 100 mM, pH 6,5, cloruro sódico 0,5 M) por diálisis. Se disolvieron hidrazida de fluoresceína 1 (Molecular Probe, Eugene, OR) o hidrazida de biotina 2 (Molecular Probe, Eugene, OR) en DMF, y se añadieron en 0,5 mg de cada proteína en tubos eppendorf silanizados hasta una concentración final de 1 mM. Se añadió tampón PBS (pH 6,5) para llegar a un volumen final de 0,5 ml. La mezcla de reacción se mantuvo a 25ºC durante 18 horas. Se separó el colorante o biotina sin reaccionar de la proteína usando un columna PD-10 (Amersham Pharmacia, Piscataway, NJ), y las proteínas se eluyeron con 1 x tampón de PBS. Para determinar la eficacia del marcaje, la disolución de reacción de marcaje primero se desaló con una columna PD-10, y la proteína se eluyó en tampón de PBS. Después, la muestra de proteína se analizó por HPLC de fase inversa (Agilent ZORBAX SB-C18, 4,6 mm x 250 mm, caudal 1,0 ml/min, CH_{3}CN en TEAA acuosa 50 mM 10 \rightarrow 40%, pH 7,0 a lo largo de 70 min). El tiempo de retención (t_{R}) para el dominio Z mutante sin marcaje era 39,3 min, el t_{R} para el dominio Z mutante marcado con hidrazida de fluoresceína era 40,7 min; el t_{R} para el dominio Z mutante marcado con hidrazida de biotina era 40,9 min.
Medición del espectro de fluorescencia: Todos los espectros de emisión de fluorescencia se registraron usando un fluorómetro FuoroMax-2 con excitación a 490 nm; paso de banda de excitación y emisión de 4 nm y 4 nm, respectivamente; un voltaje PMT de 950 V; y una velocidad de barrido de 1 nm/s. Se usaron 10 ng de cada proteína marcada. Los espectros registrados representan una media de 3 barridos.
Resultados
Un cetoaminoácido: El grupo cetoproporciona una reactividad química única que no está presente en los veinte aminoácidos comunes, debido a su capacidad para participar en reacciones de adición que implican el grupo carbonilo o la posición ácida del C\alpha. Este grupo también proporciona una alternativa al aminoácido natural cisteína para la modificación selectiva de proteínas con una amplia variedad de reactivos químicos. El grupo tiol reactivo de la cisteína se ha usado ampliamente para unir diferentes sondas biofísicas a proteínas. Véase, por ejemplo, Creighton, T.E. (1986) Methods Enzymol. 131:83-106; Alten-bach, C., Marti, T., Khorana, H.G. y Hubbell, W.L. (1990) Science 248:1088-92; Brinkley, M. (1992) Bioconjug. Chem. 3:2-13; Giuliano, K.A., Post, P.L., Hahn, K.M. y Taylor, D.L. (1995) Annu. Rev. Biophys. Biomol. Struct. 24:405-34; Mannuzzu, L.M., Moronne, M.M. y Isacoff, E.Y. (1996) Science 271:213-6; Griffin, B.A., Adams, S.R. y Tsien, R.Y. (1998) Science 281:269-272; Llopis, J., Adams, S.R., McCaffery, J.M., Teter, K., Kulomaa, M.S., Machen, T.E., Moore, H.P., Tsien, R.Y. y Griffin, B.A. (2000) Methods Enzymol. 327:546-64; y, Gaietta, G., Deerinck, T.J., Adams, S.R., Bouwer, J., Tour, O., Laird, D.W., Sosinsky, G.E., Tsien, R.Y. y Ellisman, M.H. (2002) Science 296:503-7. Desgraciadamente, el marcaje de restos cisteína solos a menudo es complicado por la presencia de más de un resto de cisteína accesible en una proteína, así como por reacciones de intercambio del disulfuro resultante en presencia del tiol libre. Por lo tanto, la capacidad de un aminoácido no proteinogénico con reactividad ortogonal permite la modificación selectiva de proteínas en casos en los que no se puede marcar selectivamente una sola cisteína, cuando son necesarios dos marcadores diferentes y cuando un enlace disulfuro puede no ser suficientemente estable. El grupo carbonilo reacciona fácilmente con hidrazidas, hidroxilaminas y semicarbazidas en condiciones suaves en disolución acuosa, y forma enlaces hidrazona, oxima y semicarbazona, respectivamente, que son estables en condiciones fisiológicas. Véase, por ejemplo, Jencks, W.P. (1959) J. Am. Chem. Soc. 81, 475-481; Shao, J. y Tam, J. P. (1995) J. Am. Chem. Soc. 117:3893-3899.
Se han desarrollado varios procedimientos para incorporar selectivamente el grupo carbonilo en péptidos y proteínas. Inicialmente, se introdujo un aldehído en el extremo N de péptidos por oxidación de serina o treonina N-terminales con peryodato, seguido del acoplamiento con biotina e indicadores fluorescentes por un enlace hidrazona. Véase, por ejemplo, Geoghegan, K.F. y Stroh, J.G. (1992) Bioconjug. Chem. 3:138-146. Sin embargo, este procedimiento está restringido a la modificación N-terminal de proteínas. Más tarde se usó la síntesis de péptidos en fase sólida para preparar segmentos de péptidos que contenían una hidrazida o hidroxilamina, que posteriormente se hacía reaccionar con una matriz de núcleo de aldehído ramificado para formar dendrímeros peptídicos (véase, por ejemplo, Shao, J. y Tam, J. P. (1995) J. Am. Chem. Soc. 117:3893-3S99; Rose, K. (1994) J. Am. Chem. Soc. 116: 30-33), o con un segmento de péptido que contiene ceto para formar proteínas sintéticas (véase, por ejemplo, Canne, L.E., Ferre-D'Amare, A.R., Burley, S.K. y Kent, S.B.H. (1995) J. Am. Chem. Soc. 117:2998-3007). Este procedimiento se puede aplicar en general a péptidos o proteínas pequeñas de menos de 100 restos, pero está limitado por las dificultades asociadas con la síntesis de péptidos o proteínas grandes.
También se ha usado un procedimiento biosintético in vitro para incorporar el grupo ceto en proteínas. Véase, por ejemplo, Cornish, V.W., Hahn, K.M. y Schultz, P.G. (1996) J. Am. Chem. Soc. 118:8150-8151. En este procedimiento un ARNt supresor ámbar se acila químicamente con el aminoácido no natural que contiene el grupo ceto. Cuando el ARNt acilado y el gen mutante se combinan en un extracto in vitro capaz de soportar la biosíntesis de proteínas, el aminoácido no natural se incorpora selectivamente en respuesta a un codón UAG. Este procedimiento requiere que el ARNt supresor sea químicamente aminoacilado con el aminoácido no natural in vitro, y el ARNt acilado es consumido como reactivo estequiométrico durante la traducción y no se puede regenerar, dando como resultado rendimientos bajos de proteína. Mediante el desarrollo de una pareja de ARNt-sintetasa ortogonal con especificidad por la p-acetil-L-fenilalanina, se puede incorporar un cetoaminoácido en proteínas en respuesta al codón UAG directamente en células E. coli vivas. No hay limitación de tamaño en la proteína diana siempre que pueda ser expresada en E. coli, y que puedan expresarse grandes cantidades de proteína mutante. Además, siempre que el reactivo de marcaje sea permeable a la célula y no tóxico, el marcador se puede introducir selectivamente en células enteras.
Evolución de sintetasas mutantes con especificidades por la p-acetil-L-fenilalanina: Se usaron la tirosil-ARNt sintetasa (TyrRS) de Methanococcus jannaschii y un ARNt supresor ámbar de tirosina mutante (mutRNA^{Tyr}_{CUA}) como el punto de partida para la generación de las parejas de ARNt-sintetasa ortogonales. Previamente se mostró que esta pareja era ortogonal en E. coli. Véase, por ejemplo, Wang, L., Magliery, T.J., Liu, D.R. y Schultz, P.G. (2000) J. Am. Chem. Soc. 122:5010-5011; y, Wang, L. y Schultz, P.G. (2001) Chem. Biol. 8:883-890. Para cambiar la especificidad de aminoácido de la TyrRS de modo que cargue p-acetil-L-fenilalanina y no cualquiera de los 20 aminoácidos comunes, se generó una biblioteca de mutantes de TyrRS de M. jannaschii y se cribó. La estructura cristalina de la TyrRS homóloga de Bacillus stearothermophilus TyrRS (véase, por ejemplo, Brick, P., Bhat, T.N. y Blow, D.M. (1989) J. Mol. Biol. 208:83-98) se usó para identificar aquellos restos que están dentro de 6,5 \ring{A} de la posición para del anillo de arilo de la tirosina unida. Los 5 restos correspondientes (Tyr32, Glu107, Asp158, Ile159 y Leu162) en el sitio activo de la TyrRS de M. jannaschii se mutaron aleatoriamente por reacción en cadena de la polimerasa (PCR) para generar una biblioteca de 1,6 x 10^{9} de tamaño. Véase, por ejemplo, Wang, L., Brock, A., Herberich, B. y Schultz, P.G. (2001) Science 292:498-500. Esta biblioteca de TyrRS mutantes primero se pasó por una selección positiva en presencia de p-acetil-L-fenilalanina 1 mM que se basó en la supresión del codón de parada ámbar en el resto sin sentido (Asp112) en el gen de la cloranfenicol acetiltransferasa (CAT) codificado en el plásmido pYC-J17 (véase, por ejemplo, Wang, L., Brock, A., Herberich, B. y Schultz, P.G. (2001) Science 292:498-500) en E. coli. Las células supervivientes en cloranfenicol deben codificar una sintetasa mutante que aminoacile el mutRNA^{Tyr}_{CUA} con un aminoácido(s) común(es) o p-acetil-L-fenilalanina. Después se aisló el ADN que codifica las sintetasas mutantes y se transformó en una cepa de selección negativa que expresa el gen de una proteína tóxica, la barnasa, que contiene 3 codones ámbar en sitios permisivos (codificados en el plásmido pLWJ17B3). Las células que codifican una sintetasa mutante que cargan el mutRNA^{Tyr}_{CUA} con aminoácidos naturales producirán barnasa y morirán. Debido a que no se añadió p-acetil-L-fenilalanina al medio de crecimiento en la selección negativa, los supervivientes deben codificar una sintetasa con especificidad por el aminoácido no natural. Después de 3 ciclos de selección positiva con concentraciones crecientes de cloranfenicol, alternando con 2 ciclos de selección negativa, surgió una serie de clones cuya supervivencia en cloranfenicol dependía de la adición de p-acetil-L-fenilalanina. Estas TyrRS se caracterizaron usando un ensayo in vivo basado en la supresión del codón Asp112ATG en el gen de la CAT. Véase, por ejemplo, Wang, L. y Schultz, P.G. (2001) Chem. Biol. 8:883-890. Se identificaron 11 mutantes de TyrRS. Las células que expresaban la sintetasa seleccionada y el mutRNA^{Tyr}_{CUA} sobrevivieron en ausencia de p-acetil-L-fenilalanina con cloranfenicol 9 \mug/ml en placas de medio mínimo que contenían glicerol al 1% y leucina 0,3 mM (placa GMML); en presencia de este aminoácido no natural, las células sobrevivieron en clorafenicol 120 \mug/ml en placas GMML. Este resultado sugiere que la sintetasa mutante seleccionada tiene una actividad mayor por la p-acetil-L-fenilalanina que por los aminoácidos naturales. La secuenciación del ADN de estos mutantes puso de manifiesto que convergen en 3 mutantes independientes en el nivel de proteína (LW1, LW5 y LW6), aunque tienen uso de codones diferentes para los aminoácidos. Las mutaciones del sitio activo de las sintetasas mutantes se listan en la Tabla 1. Basándose en la estructura cristalina de la TyrRS homóloga de B. stearothermophilus, la cadena lateral conservada de Tyr32 y Asp158 de M. jannaschii forma probablemente enlaces de hidrógeno con el grupo hidroxilo de la tirosina sustrato. En las sintetasas mutantes, la Tyr32 está mutada a Leu o Ala, y la Asp158 está mutada a Gly158. Estas mutaciones pueden desfavorecer la unión de tirosina y al mismo tiempo pueden crear sitio extra para acomodar el grupo metilo de la p-acetil-L-
fenilalanina.
\vskip1.000000\baselineskip
TABLA 1 Restos aminoácidos en la tyrrs de M. jannaschii (mj) natural y las sintetasas mutantes desarrolladas con especificidades por la p-acetil-L-fenilalanina
4
Caracterización de la proteína mutante que contiene p-acetil-L-fenialanina: Para ensayar la capacidad de la sintetasa desarrollada y de mutRNA^{Tyr}_{CUA} para incorporar selectivamente p-acetil-L-fenilalanina en proteínas, se sustituyó un codón de parada ámbar en un sitio permisivo (Lys7) en el gen para el dominio Z de la proteína estafilocócica (véase, por ejemplo, Nilsson, B., Moks, T., Jansson, B., Abrahmsen, L., Elmblad, A., Holmgren, E., Henrichson, C., Jones, T.A. y Uhlen, M. (1987) Protein Eng. 1:107-13) por un marcador His6 COOH-terminal. El dominio Z tiene un peso molecular de aproximadamente 7,9 kD, por lo que su masa se puede medir con una precisión muy alta usando la espectrometría de masas de resonancia de ciclotrón de iones. Las células transformadas con el mutRNA^{Tyr}_{CUA}, LW1RS y gen del dominio Z (Lys7TAG) se hicieron crecer en presencia de p-acetil-(\pm)-fenilalanina 1 mM. La adición del aminoácido no natural no afectaba a la velocidad de crecimiento de las células. La proteína mutante se purificó por cromatografía de afinidad de Ni^{2+} con un rendimiento aislado global de 3,6 mg/l en medio mínimo. Para la comparación, el rendimiento del dominio Z era 9,2 mg/l en medio mínimo cuando la TyrRS mutante se sustituyó por la TyrRS natural (nat). No se obtuvo dominio Z en ausencia de p-acetil-(\pm)-fenilalanina, el mutRNA^{Tyr}_{CUA} o LW1RS (Figura 1), lo que indicaba una fidelidad muy alta en la incorporación del aminoácido no natural en este sitio. La p-acetil-L-fenilalanina también se puede incorporar en otras proteínas, por ejemplo, Cdc42. Véase la
Figura 1.
Tanto la proteína de dominio Z natural expresada por mutRNA^{Tyr}_{CUA}/TyrRS nat como la proteína de dominio Z mutante expresada por mutRNA^{Tyr}_{CUA}/LW1RS se analizaron por espectrometría de masas de resonancia de ciclotrón de iones de transformada de Fourier por ionización por electropulverización (FT-ICR MS). Para la proteína de dominio Z nat, se observaron 3 picos con masas correspondientes a la proteína intacta, la proteína sin la primera metionina y la forma acetilada de la proteína sin la primera metionina (confirmado por análisis de espectrometría de masas en tándem del fragmento peptídico digerido por tripsina, N-terminal). Para la proteína de dominio z mutante (Figura 2A), la masa monoisotópica experimental de la proteína intacta era 7949,893 Da, que está dentro de 2,2 ppm de la masa teórica de 7949,874 Da. Otros 2 picos corresponden a la proteína sin la primera metionina (M_{Experimental} = 7818,838 Da, M_{Teórica} = 7818,833 Da) y su forma acetilada (experimental 7860,843 Da, M_{Teórica} = 7860,844 Da), respectivamente. No se observaron en los espectros picos correspondientes a las proteínas mutantes con ningún otro aminoácido en la posición del codón ámbar. La relación de señal a ruido de más de 1500 veces la observada en el espectro de masas de la proteína intacta se traduce en una fidelidad para la incorporación de la p-acetil-L-fenilalanina mejor que 99,8%. La espectrometría de masas en tándem con cromatografía líquida del digerido con tripsina se llevó a cabo para confirmar la secuencia del péptido NH_{2}-terminal. Se aisló el ion precursor en 606,23 Da, que corresponde al ion molecular doblemente cargado del péptido digerido con tripsina NH_{2}-terminal MTSVDNY*INK y se fragmentó con un espectrómetro de masas de captura de iones (ITMS). Las masas de los iones fragmento se pudieron asignar sin ambigüedad como se muestra en la Figura 2B, confirmando la incorporación específica de sitio de la p-acetil-L-fenilalanina. Estos resultados demuestran claramente que la sintetasa desarrollada junto con el mutRNA^{Tyr}_{CUA} incorpora p-acetil-L-fenilalanina y no cualquier aminoácido natural en la posición codificada por el codón ámbar y no otras posiciones.
Véase la Figura 2.
Modificación de proteína específica de sitio con hidrazida de la fluoresceína: El grupo carbonilo de la p-acetil-L-fenilalanina puede servir como un asa química para la modificación de proteínas específica de sitio in vitro. La proteína de dominio Z con p-acetil-L-fenilalanina mutante (dominio Z mutante) purificada y la proteína de dominio Z natural se trataron con la hidrazida de fluoresceína 1, 1 mM (Figura 3A) a 25ºC durante 18 horas en tampón de PBS. Después de la reacción, las proteínas se separaron del exceso de hidrazida de la fluoresceína por cromatografía de exclusión por tamaños, y se analizaron con electroforesis en gel de poliacrilamida-SDS (SDS-PAGE). Primero se formó la imagen del gel con un sistema de formación de fluoroimágenes, y después se tiñó con plata (Figura 3B). La banda para el dominio Z mutante muestra una señal fluorescente mientras que no se puede detectar fluorescencia de la banda del dominio Z nat. Se usaron partes alícuotas de estas dos proteínas para medir el espectro de fluorescencia con excitación a 490 nm (Figura 3C). Sólo la proteína de dominio Z que contiene p-acetil-L-fenilalanina muestra un espectro de fluorescencia similar al de la fluoresceína. No se detectó señal de fluorescencia para el dominio Z nat, indicando que la reacción de marcaje tuvo lugar sólo entre la hidrazida y la cetona, y no cualquier grupo funcional existente en la proteína natural. El producto marcado se analizó por espectrometría de masas de cuadrupolo en tiempo de vuelo (QTOF MS). Se obtuvo una masa monoisotópica experimental de 8425,160 Da (M_{Teórica} = 8424,958 Da), confirmando que la hidrazida de fluoresceína reaccionaba con la proteína de dominio Z mutante con una relación molar de 1:1. Para determinar la extensión del marcaje, la mezcla de reacción se separó por cromatografía líquida de alto rendimiento (HPLC). La relación del área del pico del dominio Z marcado frente a la del dominio Z no marcado era 90 \pm 5%. Véase la Figura 3.
Modificación de proteína específica de sitio con hidrazida de la biotina: Para demostrar lo general de este procedimiento, el dominio Z se marcó con derivado de hidrazida de la biotina 2 (Figura 4A). El dominio Z mutante y natural purificados se trataron con hidrazida de la biotina 2, 1 mM, en tampón de PBS a 25ºC durante 18 horas. Después de diálisis frente a tampón de PBS para separar el exceso de hidrazida de la biotina, las proteínas se sometieron a SDS-PAG. Las proteínas separadas se transfirieron a membrana de nitrocelulosa y se trataron con sonda con un conjugado de avidina-HRP específico de biotina (Figura 4B). Como se esperaba, solo se detectó el dominio Z mutante que contenía la p-acetil-L-fenilalanina, indicando que se había marcado con hidrazida de la biotina. No se observó señal para el dominio Z natural. La eficacia del marcaje era 80 \pm 10% determinado por análisis de HPLC como se describe en el experimento de marcaje con fluoresceína. Se confirmó por QTOF MS (M_{Experimental} = 8416,236, M_{Teórico} = 8416,146 Da) que la proteína marcada era el producto formado entre una molécula de hidrazida de biotina y una molécula de dominio Z mutante. Estos experimentos demuestran la excelente especificidad del asa cetona para la modificación de proteínas in vitro. Véase la Figura 4.
Se incorporó de forma específica del sitio un nuevo grupo funcional químico, el grupo ceto, en proteínas in vivo. Este grupo funcional se puede marcar de forma selectiva y eficaz con fluoresceína y biotina in vitro por una reacción química ortogonal entre el grupo carbonilo y derivados de hidrazida. Por ejemplo, usando este procedimiento, se pueden marcar proteínas selectivamente con una amplia variedad de otros derivados de hidrazida o hidroxilamina (incluyendo azúcares, marcadores paramagnéticos, quelantes de metales, agentes de reticulación, poliéteres, ácidos grasos y toxinas), sea como sondas de estructura y función de proteínas para generar proteínas con propiedades catalíticas o terapéuticas potenciadas, o para el desarrollo de bioensayos usando proteínas inmovilizadas o solubles. La capacidad para incorporar de forma específica del sitio un asa química ortogonal en proteínas directamente en una célula viva, puede permitir la modificación in vivo de proteínas con moléculas pequeñas fluoróforos para la formación de imágenes in vivo de localización de proteínas, movimiento de proteínas y cambios conformaciones en proteínas con resolución molecular. También se puede hacer el marcaje in vivo de proteínas que contienen p-acetil-L-fenilalanina con fluoróforos en E. coli. Finalmente, se puede determinar por mutagénesis directa o aleatoria si los cetoaminoácidos pueden potenciar la función de la proteína directamente, por ejemplo, formando bases de Schiff intermedias que participen en la catálisis o reticulaciones intra o intermoleculares.
Ejemplo 2 Incorporación in vivo de análogos de meta-tirosina
Se generó una TyrRS ortogonal para la aminoacilación de mutRNA^{Tyr}_{CUA} (descrito en el Ejemplo 1 del documento WO 2002/085923) con análogos de meta-tirosina.
Preparación de biblioteca de plásmidos con TyrRS mutante: se construyó una biblioteca de plásmidos que codificaban TyrRS mutante de M. jannaschii dirigida a derivados de tirosina sustituidos en meta, siguiendo en general los procedimientos descritos en el Ejemplo 1 del documento WO 2002/085923. Brevemente, seis restos (Tyr^{32}, Ala^{67}, His^{70}, Gln^{155}, Asp^{158}, Ala^{167}) en el sitio activo de TyrRS de M. jannaschii que están dentro de los 6,9 \ring{A} de la posición meta del anillo de arilo de la tirosina unida en la estructura cristalina de la TyrRS de Bacillus stearothermophilus, se mutaron en los 20 aminoácidos a nivel del ADN usando un esquema de codón NNK como se ha descrito en el Ejemplo 1 anterior. La biblioteca de plásmidos construida pBK-lib contenía aproximadamente 1x10^{9} clones independientes.
Evolución de las parejas de ARNt-sintetasa ortogonales para la incorporación de m-acetil-fenilalanina: Después de 3 ciclos de selección positiva y 2 ciclos de selección negativa, surgieron 5 clones candidatos (SEQ ID NO.: 17-21 de WO 2002/085923 e SEQ ID NO.: 49-53 de WO 2002/085923) cuya supervivencia en cloranfenicol dependía de la adición del aminoácido no natural. En ausencia de m-acetil-fenilalanina, la CI_{50} de la resistencia al cloranfenicol para las células que albergaban uno de los tres plásmidos mutantes de TyrRS es 20 \mug/ml. en presencia de m-acetil-fenilalanina, la CI_{50} de la resistencia al cloranfenicol para las mismas células es 100 \mug/ml. La gran diferencia entre estos dos números refleja la capacidad de las sintetasas seleccionadas para especificar la incorporación de m-acetil-fenilalanina frente a aminoácidos naturales en la célula. Los datos para la m-metoxi-fenilalanina eran similares; se aislaron 5 clones (SEQ ID NO.: 22-26 de WO 2002/085923 e SEQ ID NO.: 54-58 de WO 2002/085923).
Expresión de proteínas de DHFR con aminoácidos no naturales incorporados: La m-metoxi-fenilalanina y la m-acetil-fenilalanina sinstetasas seleccionadas antes se usaron para incorporar los aminoácidos no naturales relevantes como respuesta a un codón ámbar en DHFR como se ha descrito previamente en el Ejemplo 1 del documento WO 2002/085923. Como control negativo, se hicieron crecer células que contenían tanto la pareja ortogonal de ARNt-sintetasa como el vector mutante-ámbar que codifica DHFR, en ausencia de aminoácidos no naturales. Los resultados de la expresión de proteínas se muestran en la Figura 10 del documento WO 2002/085923. Estos resultados demuestran claramente la especificidad de la pareja ortogonal de ARNt-sintetasa para incorporar m-meotxi-fenilalanina y m-acetil-fenilalanina. Los rendimientos de proteína DHFR expresada eran aproximadamente 0,5 mg/l de cultivo en ambos casos.
En una realización, se pueden usar compuestos (por ejemplo, derivados de hidrazida) para marcar proteínas in vivo con al menos un cetoaminoácido, por ejemplo, análogo de meta-tirosina.
Ejemplo 3 O-RS y O-ARNt de ejemplo para la incorporación de aminoácidos no naturales
Un O-ARNt de ejemplo que media la incorporación de un cetoaminoácido comprende la SEQ ID NO.: 21 (véase la Tabla 2). La O-RS de ejemplo que aminoacila O-ARNt con cetoaminoácidos, incluye las SEQ ID NO.: 18-20 (véase la Tabla 2). Los ejemplos de polinucleótidos incluyen los que codifican la O-RS o partes de la misma, incluyen polinucleótidos, por ejemplo, SEQ ID NO.: 1-17 (para la incorporación de otros aminoácidos no naturales), o que codifican una secuencia de aminoácidos que comprende la SEQ ID NO.: 18-20 (para la incorporación de cetoamino-
ácidos).
Ejemplo 4 Evolución dirigida de las especificidades de sustrato de una aminoacil-ARNt sintetasa usando separación de células activadas por fluorescencia
La separación de células activadas por fluorescencia (FACS) se puede usar para cribar rápidamente bibliotecas grandes de variantes de proteínas producidas en Escherichia coli. Se describen procedimientos que usan FACS, junto con indicadores de fluorescencia genéticos, para dirigir la evolución de las especificidades del sustrato de una tirosil-ARNt sintetasa de Methanococcus jannaschii. El sistema usa una estrategia de doble cribado para identificar variantes enzimáticas que reconocen selectivamente un sustrato nuevo.
Se han desarrollado una variedad de procedimientos de selección y cribado in vivo para la evolución dirigida de la función de proteína. Normalmente, las estrategias de selección in vivo implican la identificación de nuevas funciones de unión o catalíticas basadas en su capacidad para conferir una ventaja de crecimiento selectiva en la célula huésped (normalmente Escherichia coli). Los procedimientos de cribado in vivo difieren de las selecciones en las que el cribado implica la detección de una actividad deseada basándose en su capacidad para producir una señal identificable en un ensayo de actividad.
Para la evolución de la especificidad del sustrato enzimático, los procedimientos de selección y cribado ofrecen ventajas y limitaciones cada uno. La alteración de la especificidad de una enzima para usar selectivamente un sustrato nuevo normalmente requiere una estrategia de "tamizado doble" de modo que la actividad con el nuevo sustrato produzca supervivencia celular, mientras que la actividad con el sustrato antiguo produzca la muerte celular. Puesto que no siempre es fácil conectar una actividad enzimática con la supervivencia o muerte celular, este requisito limita la generalidad de estos procedimientos. En contraste, los procedimientos de cribado solo requieren que una actividad enzimática se pueda conectar a una señal que se pueda ensayar. Los sistemas de cribado se pueden adaptar fácilmente para usar como tamices dobles: los cribados positivos y negativos identifican variantes de enzimas que son activas en presencia y ausencia de un sustrato, respectivamente. Además, la restricción del cribado a menudo se puede variar más fácilmente que la restricción de la selección. Por lo tanto, los procedimientos de cribado in vivo ofrecen la ventaja de la versatilidad para desarrollar la especificidad de sustrato de una enzima.
Por otra parte, los procedimientos de selección ofrecen la ventaja de que el tiempo necesario para llevar a cabo un ciclo de selección normalmente no están a escala con el tamaño de la biblioteca de partida. En contraste, el tiempo necesario para llevar a cabo un ciclo de cribado aumenta el tamaño de la biblioteca que se criba, lo cual puede hacer impracticable el cribado de bibliotecas muy grandes. Se pueden usar procedimientos de alto rendimiento para reducir los requisitos de tiempo para el cribado de bibliotecas grandes. Se puede usar uno de dichos procedimientos, la separación de células activadas por fluorescencia (FACS), para cribar rápidamente las células bacterianas individuales que contienen variantes de proteínas. Véase, por ejemplo, Winson, M.K. y Davey, H.M. (2000). "Flow cytometric analysis of microorganisms". Methods 21:231-240; y, Georgiou, G. (2001). "Analysis of large libraries of protein mutants using flow cytometry". Adv. Protein Chem. 55:213-315. El cribado se puede llevar a cabo a una velocidad de aproximadamente 10^{8} células por hora, que es suficiente para cubrir el tamaño de las bibliotecas de proteínas más grandes que normalmente se pueden construir en E. coli. El requisito principal para usar FACS para desarrollar una actividad enzimática deseada es que se pueda conectar la actividad a la producción de una señal de
fluorescencia.
Aquí, el uso de FACS en la evolución dirigida de la especificidad de sustrato se presenta para MjYRS, la tirosil-ARNt sintetasa de Methanococcus Jannaschii (Santoro, S.W., Wang, L., Herberich, B., King, D.S. y Schultz, P.G. (2002). "An efficient system for the evolution of aminoacyl-tRNA synthetase specificity". Nat. Biotechnol., 20:1044-1048). Para la enzima sintetasa, un cambio en la especificidad de sustrato (en oposición a una ampliación de la especificidad) usa una estrategia de tamizado doble. La presión de selección positiva favorece las variantes enzimáticas que reconocen el nuevo sustrato, por ejemplo, el aminoácido no natural, mientras que la presión negativa favorece las variantes que no pueden reconocer el sustrato original. Para la evolución de la aminoacil-ARNt sintetasa, se presenta un procedimiento que implica selección positiva y negativa.
Materiales y procedimientos
Cepas bacterianas, construcciones genéticas y cebadores oligonucleótidos: Los materiales usados en la evolución de la aminoacil-ARNt sintetasa incluyen los siguientes: cepa de E. coli DH10B (Life Technologies); plásmido pREP/YC-JYCUA (Figura 5A), diseñado y construido como se ha descrito previamente (véase Santoro, S.W., Wang, L., Herberich, B., King, D.S. y Schultz, P.G. (2002). "An efficient system for the evolution of aminoacyl-tRNA synthetase specificity". Nat. Biotechnol., 20:1044-1048) como indicador para la actividad de las variantes de la as aminoacil-ARNt sintetasa ortogonal en E. coli; el plásmido pBK-JYA6 (Figura 5B), diseñado y construido como se ha descrito previamente (véase Wang, L., Brock, A., Herberich, B. y Schultz, P.G. (2001). "Expanding the genetic code of Escherichia coli". Science 292:498-500) como un vector para la expresión de variantes del gen de la aminoacil-ARNt sintetasa; bibliotecas de fragmentos de PCR de variantes del gen de la tirosil-ARNt sintetasa de M. jannaschii (MjYRS) se construyeron como se ha descrito previamente (véase, por ejemplo, Wang, L., Brock, A., Herberich, B. y Schultz, P.G. (2001). "Expanding the genetic code of Escherichia coli". Science 292:498-500) usando una estrategia de mutagénesis dirigida; y cebadores oligonucleótidos de la PCR para la amplificación de bibliotecas de variantes del gen MjYRS (Tabla 3). El plásmido pREP/YC-JYCUA (Figura 5A) tiene el origen de replicación p15A, que permite la replicación simultánea en E. coli con el plásmido pBK-JYRS (y variantes; Figura 5B), que tiene el origen de replicación ColE1. Contiene un indicador de cloranfenicol acetiltransferasa (CAT) que se usa como base para la selección positiva y un sistema indicador de ARN polimerasa T7 (T7 RNAP)/proteína fluorescente verde (GFPuv) que se usa con FACS para cribar frente a variantes de la sintetasa que aceptan aminoácidos naturales. El sistema indicador de fluorescencia también se usa para evaluar de forma visual y fluorométrica la actividad de sintetasa basada en la incorporación de aminoácido.
\vskip1.000000\baselineskip
TABLA 3 Cebadores oligonucleótidos para la amplificación por PCR
5
\vskip1.000000\baselineskip
Otros materiales usados en la evolución dirigida de las especificidades de sustrato de sintetasas incluyen los siguientes: enzimas de restricción, fosfatasa alcalina intestinal de ternero (CIP); componentes de reacción para la PCR (por ejemplo, una ADN polimerasa termoestable, tampón de PCR y trifosfatos de desoxinucleótidos (dNTP) (aunque se usó ADN polimerasa Pfu para los procedimientos descritos aquí, se encontró que el kit Expand de Roche daba rendimientos más altos en la PCR, especialmente para productos de la PCR más largos)); kit de purificación de la PCR; kit de extracción en gel; ADN ligasa T4; electroporador y cubetas de electroporación de 0,2 cm; kit de purificación de plásmidos Maxiprep; equipamiento de electroforesis en agarosa y gel de agarosa; tampón de Tris-acetato EDTA (TAE) (Tris-acetato 40 mM, EDTA 1 mM (pH 8,3)); bromuro de etidio, medio SOC; medio LB; disolución madre de glucosa (al 20% en agua; esterilizada por filtración); IPTG (isopropil-\beta-D-tio-galactopiranósido) (1 mM en agua; debe almacenarse a aproximadamente -20ºC); PBS (disolución salina tamponada en fosfato) (fosfato 10 mM, NaCl 0,14 M, KCl 2,7 mM (pH 7,4 a 25ºC)); kit de purificación de plásmido Miniprep; disolución madre de ampicilina (100 mg/ml en agua; debe almacenarse a aproximadamente -20ºC); disolución madre de kanamicina (35 mg/ml en agua, debe almacenarse a aproximadamente -20ºC); medio mínimo de glicerol con leucina (GMML; contiene glicerol al 1% y leucina 0,3 mM); disolución madre de tetraciclina (25 mg/ml en EtOH al 75%; debe almacenarse a aproximadamente -20ºC); disolución madre de arabinosa (al 20% en agua, esterilizada por filtración); disolución madre de aminoácidos no naturales (normalmente, 0,3 M en HCl o NaOH 0,3 M; debe almacenarse a aproximadamente -20ºC); glicerol (10% en agua desionizada; esterilizado por filtración); y fluorímetro y cubeta de cuarzo.
Evolución dirigida, por ejemplo, de tirosil-ARNt sintetasa: El siguiente procedimiento describe el uso de un sistema de selección/cribado para identificar variantes de tirosil-ARNt sintetasa que cargan de forma eficaz y específica un ARNt ortogonal con un aminoácido no natural. La estrategia usa una selección basada en cloranfenicol para enriquecer variantes positivamente que reconozcan el nuevo aminoácido y cribado basado en FACS negativo para eliminar aquellas variantes que aceptan uno de los aminoácidos naturales (Figura 6).
En principio, la evolución dirigida de una aminoacil-ARNt sintetasa se puede llevar a cabo enteramente por cribado basado en FACS. Para dicha estrategia, la selección positiva basada en cloranfenicol se sustituye por un cribado positivo en el que las células fluorescentes hechas crecer en presencia de un aminoácido no natural se recogen usando FACS.
Las siguientes etapas resumen la producción de células DH10B-DE3 electrocompetentes que albergan el plásmido indicador pREP/YC-JYCUA (Figura 5A). Se transformaron 25 \mul de células DH10B de E. coli electrocompetentes con 10 ng de plásmido pREP/YC-JYCUA. Se pueden usar las condiciones recomendadas por el fabricante del dispositivo de electroporación. Las células deben permanecer en frío todo el tiempo antes de la transformación. Además, las células deben electroporarse tan rápido como sea posible después de descongelarlas sobre hielo, ya que perderán la competencia a lo largo del tiempo. Se añadieron inmediatamente 200 \mul de medio SOC y las células se dejaron recuperar con agitación suave (225 rpm) a 37ºC durante 1 h. Las células recuperadas se pusieron en placa en agar LB que contiene tetraciclina 25 \mug/ml y se incubaron a 37ºC a lo largo de la noche. A partir de una sola colonia se prepararon las células DH10B (pREP/YC-JYCUA) electrocompetentes. La construcción eficaz de plásmido viene de la competencia alta en la transformación de E. coli, en especial cuando se requiere un gran número de transformantes. La electroporación es un procedimiento conveniente para transformar E. coli; la preparación de cepas de E. coli electrocompetentes con eficacias de transformación de 10^{8}-10^{9} ufc/\mug de ADN plasmídico superenrrollado es rutinaria. Hay que tener en cuenta que para ADN plasmídico no superenrrollado y con mella (como se obtiene después de ligamiento), las eficacias pueden ser al menos un orden de magnitud menores. Para hacer bibliotecas, es conveniente usar células DH10B electrocompetentes disponibles en el comercio (Life Technologies) para la transformación inicial, puesto que estas células tienen una eficacia de transformación garantizada de 10^{10} ufc/\mug de ADN plasmídico superenrrollado. El ADN superenrrollado se puede preparar posteriormente e introducir en una cepa no comercial. Por ejemplo, un procedimiento general para preparar E. coli electrocompetente es como sigue: (a) A partir de una sola colonia o disolución madre en glicerol, se inoculan 5 ml de un cultivo iniciador de LB que contiene los antibióticos adecuados (si los hay) y se incuban a 37ºC con agitación a 250 rpm toda la noche; (b) A partir del cultivo iniciador, se inocula un cultivo de 1 litro de 2xYT que contiene los antibióticos adecuados y se hace crecer hasta una densidad óptica (DO) a 600 nm de 0,5: (c) Se transfiere el cultivo a 2 tubos enfriados con hielo de 0,5 litros GS3 y se centrifugan a 1ºC durante 5 min a 10000 g. El líquido sobrenadante se decanta; (d) las células se vuelven a suspender en 1 litro de glicerol al 10% enfriado con hielo y se centrifugan a 1ºC durante 5 min a 7500 g. El líquido sobrenadante se decanta; (e) Se repite la etapa 12d; y (f) Se vuelven a suspender rápidamente las células en el glicerol al 10% residual y se mantienen en hielo. Las células se transforman inmediatamente o se congelan rápidamente en hielo seco antes de separarlas a aproximadamente -80ºC.
Esta sección resume la construcción de una biblioteca de plásmidos de variantes de MjYRS y su introducción en la cepa de indicador de E. coli pREP/YC-JYCUA. Se usaron los cebadores de ADN oligonucleótido pBK-MjYRSN y pBK-MjYRSC (Tabla 3) para amplificar por PCR los fragmentos de la biblioteca de variantes del gen de MjYRS en 4 reacciones de PCR de 100 \mul. Por ejemplo, las condiciones para la PCR estándar para una reacción de 100 \mul son las siguientes: 10 \mul de tampón de PCR 10 min, 10 \mul de dNTP (2 mM cada uno), 4 ml de cada cebador (10 \muM cada uno), \sim10 ng de molde y 1,5 \mul de ADN polimerasa. Normalmente se llevan a cabo 20 ciclos de PCR usando el siguiente ciclo: 95ºC durante 1 min, 50ºC durante 1 min y 72ºC durante 2 min. El ADN se purificó usando un kit de purificación de ADN por PCR. El ADN purificado por PCR se hizo digerir usando enzimas de restricción, Ndel y Pstl. Las condiciones estándar para la digestión con enzimas de restricción y el tratamiento con CIP son como se describen, por ejemplo, en New England Biolabs. Los fragmentos de la PCR digeridos se purificaron por electroforesis en gel de agarosa seguido de extracción en gel.
La electroforesis en gel de agarosa estándar se llevó a cabo usando un gel de agarosa al 1% con tampón de TAE que contenía bromuro de etidio 0,5 \mug/ml. El ADN se visualizó con luz ultravioleta de longitud de onda larga, se escindió usando una cuchilla de afeitar estéril y se separó de la placa de gel por extracción del gel. Véase, por ejemplo, Sambrook, J. y Russell, D.W. (2001). "Molecular cloning: a laboratory manual". 3ª edición. Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.
\newpage
El ADN purificado se cuantificó por electroforesis en gel de agarosa. El vector pBK-JYA6 se hizo digerir usando enzimas de restricción, NdeI y PstI. Opcionalmente, se puede usar un vector original que contiene un "fragmento de relleno" que es suficientemente largo para permitir que los fragmentos de vector de ADN digeridos una y dos veces sean resueltos. Opcionalmente, el vector no se trata con CIP; aunque el tratamiento con CIP aumenta la fracción de clones que contienen inserto, disminuye significativamente la eficacia de la transformación. El vector digerido se purificó por electroforesis en gel de agarosa estándar, seguido de extracción de gel. El ADN purificado se cuantificó por electroforesis en gel de agarosa. El ADN vector e inserto se ligaron en una relación molar de 1 a 1,5, respectivamente, usando al menos 10 \mug de vector en una reacción de 300 \mul durante \sim12 horas a 16ºC. Las condiciones de reacción de ligamiento estándar son como se describen en New England Biolabs. Después del ligamiento, se analizó una pequeña cantidad de reacción por electroforesis en gel de agarosa para verificar que todo el material de partida se había convertido en productos mayores. Los productos de ligamiento se purificaron por extracción 3 veces con 200 \mul de fenol-cloroformo y 2 veces con 200 \mul de cloroformo, seguido de precipitación en etanol. El sedimento de ADN se volvió a disolver en 50 \mul de agua.
Se llevó a cabo una transformación piloto de 25 \mul de E. coli electrocompetente con 1 \mul de producto de ligamiento. Una transformación piloto es útil para comprobar la eficacia de la reacción de ligamiento antes de proceder con una transformación a gran escala. Se pusieron 3 diluciones seriadas de 10 veces de las células transformadas en placas de agar LB que contenían kanamicina 35 \mug/ml y se incubaron a 37ºC toda la noche. Basándose en el número de colonias obtenidas, se calculó el tamaño de la biblioteca esperada. El ADN plasmídico se purificó por Miniprep y correspondía a 10-20 clones individuales. Se hizo el mapa de restricción de los plásmidos y se secuenciaron para verificar que un alto porcentaje de los clones (de forma ideal más de aproximadamente 70%, más de aproximadamente 80%, más de aproximadamente 90%, más de aproximadamente 95% o más) contienen el inserto y que la distribución de las mutaciones dentro de la biblioteca no está excesivamente parcializada.
Si los resultados de la transformación piloto son aceptables, se hace una transformación a gran escala. Por ejemplo, los productos de ligamiento purificados se mezclaron con 500 \mul de células electrocompetentes (sin diluir). Se distribuyeron partes alícuotas de 55 \mul de la mezcla en 10 cubetas frías de 0,2 cm y se electroporaron. Después de cada electroporación, se añadió inmediatamente 1 ml de medio SOC. Las células transformadas se transfirieron a un tubo cónico de 15 ml y se dejaron recuperar con agitación suave (225 rpm) a 37ºC durante 1 h. Las células recuperadas se transfirieron a 2 litros de medio 2xYT que contenía kanamicina 35 \mug/ml en un matraz agitador de
4 litros.
Se sacó inmediatamente una parte alícuota de 100 \mul del cultivo inoculado para usar para el cálculo del número de transformantes independientes que comprende la biblioteca pR-C. Para calcular el número de transformantes independientes, se hicieron 10 diluciones seriadas de la parte alícuota de 100 \mul sacada del cultivo recién inoculado. Se cultivaron 10 \mul de cada dilución (incluyendo la parte alícuota original) en una serie de placas de agar LB que contenían los antibióticos adecuados. Basándose en el número de colonias resultantes, se calculó el número total de transformantes en el cultivo.
Las células transferidas se incubaron a 37ºC durante la noche con agitación (250 rpm). Se usó el maxiprep para el ADN plasmídico de pBK de 500 \mul de cultivo de la biblioteca. El ADN se volvió a disolver en 200 \mul de agua. Se transformaron 200 \mul de células DH10B (pREP/YC-JYCUA) electrocompetentes con 5 \mul del ADN de la biblioteca de plásmidos superenrrollado pBK maxiprep (\sim1-2 \mug) en 4 cubetas de 0,2 cm. Después de cada electroporación, se añadió inmediatamente 1 ml de medio SOC. Las células transformadas se transfirieron a un tubo cónico de 15 ml y se dejaron recuperar con agitación suave (225 rpm) a 37ºC durante 1 h. Las células recuperadas se transformaron en 1 litro de medio 2xYT que contenía tetraciclina 25 \mug/ml y kanamicina 35 \mug/ml en un matraz agitador de 2 litros. Se sacó inmediatamente una parte alícuota de 100 \mul del cultivo inoculado para usar en el cálculo del número de transformantes independientes. Este número es al menos tan grande como el número de transformantes independientes obtenidos después de la construcción de la biblioteca. Las células se incubaron a 37ºC toda la noche con agitación (250 rpm).
Se usa una combinación de selección y cribado para identificar las variantes de MjYRS que han alterado la especificidad con respecto al sustrato aminoácido (Figura 6). Se usa una selección basada en cloranfenicol para enriquecer las variantes que son activas en presencia de un aminoácido no natural. Se usa un cribado basado en FACS negativo para eliminar variantes que son activas en ausencia del aminoácido no natural. A continuación se da un ejemplo de un procedimiento para usar la selección y el cribado basado en FACS para dirigir la evolución de una aminoacil-ARNt sintetasa. Se sedimentaron 2 ml de E. coli (pREP/YC-JYCUA, pBK-lib) por centrifugación a 10000 g durante 1 min. El líquido sobrenadante se descartó y las células se volvieron a suspender en 1 ml de medio GMML. Para empezar el primer ciclo de selección positiva, las células resuspendidas se usaron para inocular 500 ml de GMML que contenía tetraciclina 25 \mug/ml, kanamicina 35 \mug/ml, y aminoácido no natural 1 mM. E. coli hecha crecer en medio GMML con suficiente aireación se saturará con una D.O. (600 nm) de \sim1-2. Las células se incubaron durante 3 h a 37ºC con agitación a 250 rpm. Se añadió cloranfenicol hasta una concentración final de 75 \mug/ml y la incubación se continuó hasta que las células alcanzaron la fase estacionaria (\sim48 h).
La concentración óptima de cloranfenicol depende de la actividad de las sintetasas en la biblioteca inicial. El cloranfenicol es bacteriostático más que bactericida, por lo tanto la eficacia de la selección debería aumentar con el aumento de la concentración de cloranfenicol sin pérdida de diversidad de población. En la práctica, el uso de una concentración arbitrariamente alta de cloranfenicol a menudo produce artefactos en la selección. A la inversa, una concentración de cloranfenicol que sea demasiado baja puede dar como resultado una restricción insuficiente de la selección. Se usa una concentración de cloranfenicol de 75 \mug/ml porque se ha mostrado que es eficaz en los experimentos de enriquecimiento y está en algún punto por debajo de la CI_{50} soportada por la mayoría de las variantes de MjYRS que se han identificado por evolución dirigida, hasta ahora. Véase, Pastrnak, M., Magliery, T.J. y Schultz, P.G. (2000). "A new orthogonal suppressor tRNA/aminoacyl-tRNA synthetase pair for evolving an organism with an expanded genetic code". Helv. Chim. Acta 83:2277-2286; Wang, L., Brock, A., Herberich, B. y Schultz, P.G. (2001). "Expanding the genetic code of Escherichia coli". Science 292:498-500; Wang, L., Brock, A. y Schultz, P.G. (2002). "Adding L-3-(2 naphthyl)alanine to the genetic code of E-coli". J. Am. Chem. Soc. 124:1836-1837; y, Chin, J.W., Santoro, S.W., Martin, A.B., King, D.S., Wang, L. y Schultz, P.G. (2002). "Addition of p-Azido-L-phenylalanine to the genetic code of Escherichia coli". J. Am. Chem. Soc. 124:9026-9027. Aunque es posible que una concentración de cloranfenicol diferente sea óptima para un experimento de evolución dado, aproximadamente 75 \mug/ml es una concentración adecuada para los experimentos iniciales.
Para empezar el segundo ciclo de selección positiva, se usó una parte alícuota de 500 \mul de cultivo saturado a partir de la primera selección para inocular un cultivo de GMML de 100 ml que contiene tetraciclina 25 \mug/ml, kanamicina 35 \mug/ml, cloranfenicol 75 \mug/ml y aminoácido no natural 1 mM. Las células se incubaron a 37ºC con agitación a 250 rpm hasta que las células alcanzaron la fase estacionaria (\sim24-36 h).
Para preparar el cribado negativo basado en FACS, se sedimentó una parte alícuota de 100 \mul de células del segundo ciclo de selección positiva por centrifugación a 10000 g durante 1 min. El líquido sobrenadante se descartó y las células se volvieron a suspender en 100 \mul de medio GMML. Las células resuspendidas se usaron para inocular un cultivo de GMML de 25 ml que contenía tetraciclina 25 \mug/ml, kanamicina 35 \mug/ml, y arabinosa al 0,002%. Se ha optimizado una concentración de arabinosa de 0,002% para permitir la expresión controlada del gen de la ARN polimerasa T7 que contiene el codón de parada ámbar en pREP/YC-JYCUA. Esto dio como resultado una señal de fluorescencia robusta (en presencia de un ARNt supresor cargado de forma adecuada) con efectos mínimos en la velocidad de crecimiento del huésped E. coli. Las células se incubaron a 37ºC con agitación a 250 rpm hasta que las células alcanzaron la fase estacionaria (\sim24-36 h). Se sedimentó una parte alícuota de 1 ml de las células inducidas con arabinosa por centrifugación a 10000 g durante 1 min. Las células se volvieron a suspender en 3 ml de disolución salina tamponada con fosfato (PBS). Usando FACS, las células se separaron, por ejemplo, separación de \sim10^{7}-10^{8} por la carencia de fluorescencia (Figura 7).
Estos experimentos se llevaron a cabo usando un citómetro BDIS FACVantage con una opción TSO. La excitación láser se llevó a cabo usando un ion láser de argón enfriado con agua Coherent Enterprise II 421, que emite 351 y 488 líneas (30 y 250 mW, respectivamente). GFPuv se excita a 351 nm y produce emisiones que se recogen usando un filtro de paso de banda a 519/20 nm. EYFP se excita a 488 nm y produce emisiones que se recogen usando un filtro de paso de banda a 585/45 nm. Sistemas comparables pueden dar resultados similares. El citómetro se configuró especialmente para desencadenar la dispersión de partículas pequeñas. Tanto la dispersión directa (FSC) como la dispersión lateral de ángulo medio (SSC) se tomaron en una escala logarítmica. El sistema de accionó por un umbral de SSC para evitar el bajo nivel de ruido desde FSC con alta sensibilidad. Se usó un inyector de 70 \mum con un sistema de presión de \sim0,21 kg/cm^{2}. Por ejemplo, las células se separan normalmente a una velocidad de \sim10.000/
segundo.
Las células recogidas se diluyeron en 25 ml de medio LB que contiene tetraciclina 25 \mug/ml y kanamicina 35 \mug/ml y se dejaron crecer hasta la saturación a 37ºC con agitación (250 rpm). Se sedimentó una parte alícuota de 100 \mul de las células amplificadas, por centrifugación a 10000 g durante 1 min. Las células se volvieron a suspender en 100 \mul de GMML. Para empezar el tercer ciclo de selección positiva, las células resuspendidas se usaron para inocular 25 ml de GMML que contenía tetraciclina 25 \mug/ml, kanamicina 35 \mug/ml y aminoácido no natural 1 mM. Las células se incubaron durante 3 h a 37ºC con agitación a 250 rpm. Se añadió cloranfenicol hasta una concentración final de 75 \mug/ml (la concentración óptima de cloranfenicol depende de la actividad de la sintetasa en la biblioteca inicial como se ha descrito antes) y la incubación se continuó hasta que las células alcanzaron la fase estacionaria
(\sim48 h).
Las siguientes etapas resumen el procedimiento por el cual se pueden caracterizar por fluorometría la actividad y fluorescencia in vivo de seleccionantes de sintetasa individuales. Las células del tercer ciclo de selección positiva se diluyeron en GMML hasta una densidad de \sim50 células/\mul y se cultivaron partes alícuotas de 10 \mul de la dilución en 8 placas de GMML/agar que contenían tetraciclina 25 mg/ml, kanamicina 35 mg/ml, arabinosa al 0,002%, aminoácido no natural 0 ó 1 mM, y cloranfenicol 0, 35, 75 ó 100 \mug/ml. Las placas se incubaron a 37ºC durante 48 h. Usando un dispositivo manual de luz ultravioleta de longitud de onda larga, se contó el número de colonias fluorescentes y no fluorescentes en cada placa. Si el experimento de evolución tiene éxito, puede haber un número mayor de colonias fluorescentes en las placas que contienen el aminoácido no natural que en las placas que carecen del aminoácido no natural. De la placa que contiene la mayor concentración de cloranfenicol para la que se formó un número significativamente mayor de colonias fluorescentes formadas en presencia frente a la ausencia de aminoácido no natural, se seleccionaron 10-20 colonias fluorescentes. De cada colonia, se inocularon 4 ml de medio GMML que contenía tetraciclina 25 mg/ml, kanamicina 35 mg/ml y arabinosa al 0,002%. Se transfirieron 2 ml de cada muestra inoculada a un tubo separado y el aminoácido no natural se añadió a una concentración final 1 mM. Todos los cultivos se incubaron a 37ºC con agitación (250 rpm) hasta que las células alcanzaron la fase estacionaria (\sim24-36 h). Se sedimentaron 200 \mul de células de cada cultivo por centrifugación a 10000 g durante 1 min. Se decantó el líquido sobrenadante. En este punto, se puede usar un dispositivo manual de luz ultravioleta de longitud de onda larga para observar la fluorescencia visible de cada sedimento de células (Figura 8). Las células que no presentaban una diferencia visible en fluorescencia como resultado del crecimiento en presencia del aminoácido no natural es probable que contengan una variante de MjYRS que acepta un aminoácido natural; no es necesario caracterizar más dichas células. Las células se volvieron a suspender en 1 ml de PBS. Se midió la densidad óptica celular (a 600 nm) de cada mezcla de células resuspendidas. Se transfirieron 200 \mul de cada mezcla de células a una cubeta y se usó un fluorímetro para medir su intensidad de emisión de fluorescencia a 505 nm con excitación a 396 nm. La fluorescencia celular se normalizó dividiendo la intensidad de la fluorescencia de cada mezcla de célula entre su D.O._{600}. La fluorescencia dependiente del aminoácido no natural que corresponde a cada variante de MjYRS se determinó calculando la relación de valores de fluorescencia celular normalizada para células que crecen en presencia frente a la ausencia del aminoácido no natural. Una opción alternativa para el análisis de la actividad y especificidad de la sintetasa es medir la CI_{50} de cloranfenicol para el crecimiento celular en placas de GMML/agar en presencia frente a la ausencia del aminoácido no natural. Véase, por ejemplo, Santoro, S.W., Wang, L., Herberich, B., King, D.S. y Schultz, P.G. (2002). "An efficient system for the evolution of aminoacyl-tRNA synthetase specificity". Nat. Biotechnol., 20:1044-1048.
Se entiende que los ejemplos y realizaciones descritos en el presente documento tienen propósitos sólo ilustrativos y que el experto en la materia sugerirá diferentes modificaciones o cambios a la luz de los mismos.
Aunque la invención anterior se ha descrito con algún detalle para el propósito de claridad y entendimiento, estará claro para un experto en la materia a la vista de esta descripción, que se pueden hacer diferentes cambios en la forma y detalles sin salirse del alcance de la invención. Por ejemplo, todas las técnicas y aparatos descritos antes se pueden usar en diferentes combinaciones.
\vskip1.000000\baselineskip
\vskip1.000000\baselineskip
\vskip1.000000\baselineskip
(Tabla pasa a página siguiente)
6
7
8
9
10
11
12
13
14
Referencias citadas en la descripción
Esta lista de referencias citadas por el solicitante está prevista únicamente para ayudar al lector y no forma parte del documento de patente europea. Aunque se ha puesto el máximo cuidado en su realización, no se pueden excluir errores u omisiones y la OEP declina cualquier responsabilidad en este respecto.
Documentos de patente citados en la descripción
\bullet WO 2002086075 A [0051] [0066] [0073]
\bullet WO 2002085923 A [0051] [0094] [0094] [0096] [0134] [0139] [0150] [0170] [0171] [0172] [0172] [0172] [0173] [0173]
\bullet US 6238884 B, Short [0070]
\bullet US 5756316 A, Schallenberger [0070]
\bullet US 5783431 A, Petersen [0070]
\bullet US 5824485 A, Thompson [0070]
\bullet US 5958672 A, Short [0070].
Documentos que no son patentes citados en la descripción
\bulletBOCK, A. et al. Mol. Microbiol., 1991, vol. 5, 515-520 [0002]
\bulletSRINIVASAN, G. et al. Science, 2002, vol. 296, 1459-1462 [0002]
\bulletHAO, B. et al. Science, 2002, vol. 296, 1462-1466 [0002]
\bulletWANG, L. et al. Science, 2001, vol. 292, 498-500 [0002]
\bulletWANG, L. J. Am. Chem. Soc., 2002, vol. 124, 1836-1837 [0002]
\bulletZHANG, Z. et al. Angew. Chem. Int. Ed. Engl. 2002, vol. 41, 2840-2842 [0002]
\bulletCHIN et al. PNAS, 2002, vol. 99 (17), 11020-11024 [0003]
\bulletLIU; SCHULTZ. PNAS USA, 1999, vol. 96, 4780-4785 [0004]
\bulletMENDEL et al. Annu. Rev. Biophys. Biomol. Struct., 1995, vol. 24, 435-462 [0005]
\bulletCORNISH, V. W. et al. J. Am. Chem. Soc., 1996, vol. 118, 8150-8151 [0006]
\bulletGEOGHEGAN, K. F.; STROH, J. G. Bioconjug. Chem., 1992, vol. 3, 138-146 [0006] [0008] [0154] [0162]
\bulletMAHAL, L. K. et al. Science, 1997, vol. 276, 1125-1128 [0006]
\bulletBEGLEY, T. P. et al. Top. Curr. Chem. Springer-Verlag, 1997, vol. 195, 93-142 [0006]
\bulletDIAZ, E. et al. Microbiol. Mol. Biol. Rev., vol. 65, 523-569 [0006]
\bulletOKELEY, N. M.; VAN DER DONK, W. A. Chem. Biol., 2000, vol. 7, R159-R171 [0006] [0154]
\bulletCREIGHTON, T. E. Methods Enzymol., 1986, vol. 131, 83-106 [0007]
\bulletALTENBACH, C. et al. Science, 1990, vol. 248, 1088-92 [0007]
\bulletBRINKLEY, M. Bioconjug. Chem., 1992, vol. 3, 2-13 [0007] [0161]
\bulletGIULIANO, K.A. et al. Annu. Rev. Biophys. Biomol. Struct., 1995, vol. 24, 405-34 [0007]
\bulletMANNUZZU, L. M. et al. Science, 1996, vol. 271, 213-6 [0007]
\bulletGRIFFIN, B. PNAS, 2002, vol. 99 (17), 11020-11024 [0007]
\bulletScience, 1998, vol. 281, 269-272 [0007]
\bulletLLOPIS, J. et al. Methods Enzymol., 2000, vol. 327, 546-64 [0007]
\bulletGAIETTA, G. et al. Science, 2002, vol. 296, 503-7 [0007]
\bulletJENCKS, W. P. J. Am. Chem. Soc., 1959, vol. 81, 475-481 [0007] [0090]
\bulletSHAO, J.; TAM, J. P. J. Am. Chem. Soc., 1995, vol. 117, 3893-3899 [0007] [0008] [0090] [0161]
\bulletROSE, K. J. Am. Chem. Soc., 1994, vol. 116, 30-33 [0008] [0162]
\bulletCANNE, L. E. et al. J. Am. Chem. Soc., 1995, vol. 117, 2998-3007 [0008]
\bulletFRANCISCO, J. A. et al. Production and fluorescence- activated cell sorting of Escherichia coli expressing a functional antibody fragment on the external surface. Proc Natl Acad Sci U S A., 1993, vol. 90, 10444-8 [0065]
\bulletFORSTER et al. Programming peptidomimetic synthetases by translating generic codes designed de novo. PNAS, 2003, vol. 100 (11), 6353-6357 [0066]
\bulletFENG et al. Expanding tRNA recognition of a tRNA synthetase by a single amino acid change. PNAS, 2003, vol. 100 (10), 5676-5681 [0066]
\bulletSAYERS, J.R. et al. 5',3' Exonuclease in phosphorothioate-based oligonucleotide-directed mutagenesis. Nucleic Acids Res, 1988, 791-802 [0078]
\bulletMA et al. Biochemistry, 1993, vol. 32, 7939 [0080] [0082]
\bulletKOWAL; OLIVER. Nucl. Acid. Res., 1997, vol. 25, 4685 [0080]
\bulletANDERSON et al. Exploring the Limits of Codon and Anticodon Size. Chemistry and Biology, 2002, vol. 9, 237-244 [0081]
\bulletMAGLIERY. Expanding the Genetic Code: Selection of Efficient Suppressors of Four-base Codons and Identification of ''Shifty'' Four-base Codons with a Library Approach in Escherichia coli. J. Mol. Biol., 2001, vol. 307, 755-769 [0081]
\bulletHOHSAKA et al. J. Am. Chem. Soc., 1999, vol. 121, 34 [0082]
\bulletHOHSAKA et al. J. Am. Chem. Soc., 1999, vol. 121, 12194 [0082]
\bulletMOORE et al. J. Mol. Biol., 2000, vol. 298, 195 [0082]
\bulletHIRAO et al. An unnatural base pair for incorporating amino acid analogues into protein. Nature Biotechnology, 2002, vol. 20, 177-182 [0084]
\bulletWU, Y. et al. J. Am. Chem. Soc., 2002, vol. 124, 14626-14630 [0084]
\bulletSWITZER et al. J. Am. Chem. Soc., 1989, vol. 111, 8322 [0085]
\bulletPICCIRILLI et al. Nature, 1990, vol. 343, 33 [0085]
\bulletKOOL. Curr. Opin. Chem. Biol., 2000, vol. 4, 602 [0085] [0085]
\bulletGUCKIAN; KOOL. Angew. Chem. Int. Ed. Engl. 1998, vol. 36, 2825 [0085]
\bulletMCMINN et al. J. Am. Chem. Soc., 1999, vol. 121, 11586 [0085]
\bulletOGAWA et al. J. Am. Chem. Soc., 2000, vol. 122, 3274 [0085]
\bulletOGAWA et al. J. Am. Chem. Soc., 2000, vol. 122, 8803 [0085]
\bulletTAE et al. J. Am. Chem. Soc., 2001, vol. 123, 7439 [0085]
\bulletMEGGERS et al. J. Am. Chem. Soc., 2000, vol. 122, 10714 [0085]
\bullet L. STRYER. Biochemistry. Freeman and Company, 1988 [0088]
\bulletFESSENDON; FESSENDON. Organic Chemistry. Willard Grant Press, 1982 [0094]
\bulletMARCH. Advanced Organic Chemistry. Wiley and Sons, 1985 [0094]
\bulletCAREY; SUNDBERG. Advanced Organic Chemistry. Plenum Press, 1990 [0094]
\bulletMATSOUKAS et al. J. Med. Chem., 1995, vol. 38, 4660-4669 [0094]
\bulletKING, F.E.; KIDD, D.A.A. A New Synthesis of Glutamine and of \gamma-Dipeptides of Glutamic Acid from Phthylated Intermediates. J. Chem. Soc., 1949, 3315-3319 [0094]
\bulletFRIEDMAN, O.M.; CHATTERRJI, R. Synthesis of Derivatives of Glutamine as Model Substrates for Anti-Tumor Agents. J. Am. Chem. Soc., 1959, vol. 81, 3750-3752 [0094]
\bulletCRAIG, J.C. et al. Absolute Configuration of the Enantiomersof7-Chloro-4[[4-(diethylamino)-1-methylbutyl] amino]quinoline (Chloroquine). J. Org. Chem., 1988, vol. 53, 1167-1170 [0094]
\bulletAZOULAY, M.; VILMONT, M.; FRAPPIER, F. Glutamine analogues as Potential Antimalarials. Eur. J. Med. Chem., 1991, vol. 26, 201-5 [0094]
\bulletKOSKINEN, A.M.P.; RAPOPORT, H. Synthesis of 4-Substituted Prolines as Conformationally ConstrainedAminoAcid Analogues. J. Org. Chem., 1989, vol. 54, 1859-1866 [0094]
\bulletCHRISTIE, B.D.; RAPOPORT, H. Synthesis of Optically Pure Pipecolates from L-Asparagine. Application to the Total Synthesis of (+)-Apovincamine through Amino Acid Decarbonylation and Iminium Ion Cyclization. J. Org. Chem, 1985, vol. 1989, 1859-1866 [0094]
\bulletBARTON et al. Synthesis of Novel \alpha-Amino-Acids and Derivatives Using Radical Chemistry: Síntesis of and D-\alpha-Amino-Adipic Acids, L-\alpha-antinopimelic Acid and Appropriate Unsaturated Derivatives. Tetrahedron Lett., 1987, vol. 43, 4297-4308 [0094]
\bulletSUBASINGHE et al. Quisqualic acid analogues: synthesis of beta-heterocyclic 2-aminopropanoic acid derivatives and their activity at a novel quisqualate-sensitized site. J. Med. Chem., 1992, vol. 35, 4602-7
\bulletLIU, D.R.; SCHULTZ, P.G. Progress toward the evolution of an organism with an expanded genetic code. PNAS United States, 1999, vol. 96, 4780-4785 [0095]
\bulletSTEMMER. Rapid evolution of a protein in vitro by DNA shuffling. Nature, 1994, vol. 370 (4), 389-391 [0097]
\bulletSTEMMER. DNA shuffling by random fragmentation and reassembly: In vitro recombination for molecular evolution. Proc. Natl. Acad. Sci. USA., 1994, vol. 91, 10747-10751 [0097]
\bullet Overview of principles of hybridization and the strategy of nucleic acid probe assays. TIJSSEN. Laboratory Techniques in Biochemistry and Molecular Biology - -Hybridization with Nucleic Acid Probes. Elsevier, 1993 [0109]
\bulletHAMES; HIGGINS. Gene Probes 1. IRL Press at Oxford University Press, 1995 [0109]
\bulletHAMES; HIGGINS. Gene Probes 2. IRL Press at Oxford University Press, 1995 [0109]
\bulletSMITH; WATERMAN. Adv. Appl. Math., 1981, vol. 2, 482 [0123]
\bulletNEEDLEMAN; WUNSCH. J. Mol. Biol., 1970, vol. 48, 443 [0123]
\bulletPEARSON; LIPMAN. Proc. Nat'l. Acad. Sci. USA, 1988, vol. 85, 2444 [0123]
\bulletALTSCHUL et al. J. Mol. Biol., 1990, vol. 215, 403-410 [0124]
\bulletHENIKOFF; HENIKOFF. Proc. Natl. Acad. Sci. USA, 1989, vol. 89, 10915 [0124]
\bulletKARLIN; ALTSCHUL. Proc. Nat'l. Acad. Sci. USA, 1993, vol. 90, 5873-5787 [0125]
\bullet Guide to Molecular Cloning Techniques. BERGER; KIMMEL. Methods in Enzymology. Academic Press, Inc, vol. 152 [0126]
\bulletSAMBROOK et al. Molecular Cloning - A Laboratory Manual. Cold Spring Harbor Laboratory, 2001, vol. 1-3 [0126]
\bullet Current Protocols in Molecular Biology. Greene Publishing Associates, Inc. and John Wiley & Sons, Inc, 2003 [0126]
\bulletGILIMAN; SMITH. Gene, 1979, vol. 8, 81 [0128]
\bulletROBERTS et al. Nature, 1987, vol. 328, 731 [0128]
\bulletSCHNEIDER, B. et al. Protein Expr. Purif., 1995, vol. 6435, 10 [0128]
\bulletFROM et al. Proc. Natl. Acad. Sci. USA, 1985, vol. 82, 5824 [0128]
\bulletKLEIN et al. Nature, 1987, vol. 327, 70-73 [0128]
\bulletWATSON et al. Recombinant DNA Second Edition. Scientific American Books, 1992 [0129]
\bulletFRESHNEY. Culture of Animal Cells, a Manual of Basic Technique. Wiley- Liss, 1994 [0130]
\bullet Plant Cell and Tissue Culture in Liquid Systems. John Wiley & Sons, Inc, 1992 [0130]
\bullet Plant Cell, Tissue and Organ Culture; Fundamental Methods Springer Lab Manual. Springer-Verlag, 1995 [0130]
\bullet The Handbook of Microbiological Media. CRC Press, 1993 [0130]
\bulletDOUGHERTY. Unnatural Amino Acids as Probes of Protein Structure and Function. Current Opinion in Chemical Biology, 2000, vol. 4, 645-652 [0136]
\bulletPAUL. Fundamental Immunology. Raven Press, 1999 [0149]
\bulletHARLOW; LANE. Antibodies.ALaboratory Manual. Cold Spring Harbor Publications, 1988 [0150]
\bulletBOCK, A.; FORCHHAMMER, K.; HEIDER, J.; LEINFELDER, W.; SAWERS, G.; VEPREK, B.; ZINONI, F. Mol. Microbiol., 1991, vol. 5, 515-520 [0153]
\bulletSRINIVASAN, G.; JAMES, C. M.; KRZYCKI, J. A. Science, 2002, vol. 296, 1459-1462 [0153]
\bulletHAO, B.; GONG, W.; FERGUSON, T. K.; JAMES, C. M.; KRZYCKI, J. A.; CHAN, M. K. Science, 2002, vol. 296, 1462-1466 [0153]
\bulletWANG, L.; BROCK, A.; HERBERICH, B.; SCHULTZ, P. G. Science, 2001, vol. 292, 498-500 [0153] [0157] [0164]
\bulletWANG, L.; BROCK, A.; SCHULTZ, P. G. J. Am. Chem. Soc., 2002, vol. 124, 1836-1837 [0153]
\bulletZHANG, Z.; WANG, L.; BROCK, A.; SCHULTZ, P. G. Angew. Chem. Int. Ed. Engl., 2002, vol. 41, 2840-2842 [0153]
\bulletCORNISH, V. W.; HAHN, K. M.; SCHULTZ, P. G. J. Am. Chem. Soc., 1996, vol. 118, 8150-8151 [0154] [0163]
\bulletMAHAL, L. K.; YAREMA, K. J.; BERTOZZI, C. R. Science, 1997, vol. 276, 1125-1128 [0154]
\bulletBEGLEY, T. P.; KINSLAND, C.; TAYLOR, S.; TANDON, M.; NICEWONGER, R.; WU, M.; CHIU, H.; KELLEHER, N.; CAMPOBASSO, N.; ZHANG, Y. Top. Curr. Chem. Springer-Verlag, 1997, vol. 195, 93-142 [0154]
\bulletDIAZ, E.; FERRANDEZ, A.; PRIETO, M. A.; GARCIA, J. L. Microbiol. Mol. Biol. Rev., 2001, vol. 65, 523-569 [0154]
\bulletCLELAND, G. H. J. Org. Chem., 1969, vol. 34, 744-747 [0156]
\bulletCREIGHTON, T. E. Methods Enzymol, 1986, vol. 131, 83-106 [0161]
\bulletALTENBACH, C.; MARTI, T.; KHORANA, H. G.; HUBBELL, W. L. Science, 1990, vol. 248, 1088-92 [0161]
\bulletGIULIANO, K. A.; POST, P. L.; HAHN, K. M.; TAYLOR, D. L. Annu. Rev. Biophys. Biomol. Struct., 1995, vol. 24, 405-34 [0161]
\bulletMANNUZZU, L. M.; MORONNE, M. M.; ISACOFF, E. Y. Science, 1996, vol. 271, 213-6 [0161]
\bulletGRIFFIN, B. A.; ADAMS, S. R.; TSIEN, R. Y. Science, 1998, vol. 281, 269-272 [0161]
\bulletLLOPIS, J.; ADAMS, S. R.; MCCAFFERY, J. M.; TETER, K.; KULOMAA, M. S.; MACHEN, T. E.; MOORE, H. P.; TSIEN, R. Y.; GRIFFIN, B. A. Methods Enzymol., 2000, vol. 327, 546-64 [0161]
\bulletGAIETTA, G.; DEERINCK, T. J.; ADAMS, S. R.; BOUWER, J.; TOUR, O.; LAIRD, D. W.; SOSINSKY, G. E.; TSIEN, R. Y.; ELLISMAN, M. H. Science, 2002, vol. 296, 503-7 [0161]
\bulletJENCKS, W. P. J. Am. Chem. Soc., 1995, vol. 81, 475-481 [0161]
\bulletSHAO, J.; TAM, J. P. J. Am. Chem. Soc., 1995, vol. 117, 3893-3S99 [0162]
\bulletCANNE, L. E.; FERRE-D'AMARE, A. R.; BURLEY, S. K.; KENT, S. B. H. J. Am. Chem. Soc., 1995, vol. 117, 2998-3007 [0162]
\bulletWANG, L.; MAGLIERY, T. J.; LIU, D. R.; SCHULTZ, P. G. J. Am. Chem. Soc., 2000, vol. 122, 5010-5011 [0164]
\bulletWANG, L.; SCHULTZ, P. G. Chem. Biol., 2001, vol. 8, 883-890 [0164] [0164]
\bulletBRICK, P.; BHAT, T. N.; BLOW, D. M. J. Mol. Biol., 1989, vol. 208, 83-98 [0164]
\bulletNILSSON, B.; MOKS, T.; JANSSON, B.; ABRAHMSEN, L.; ELMBLAD, A.; HOLMGREN, E.; HENRICHSON, C.; JONES, T. A.; UHLEN, M. Protein Eng., 1987, vol. 1, 107-13 [0165]
\bulletWINSON, M. K.; DAVEY, H. M. Flow cytometric analysis of microorganisms. Methods, 2000, vol. 21, 231-240 [0179]
\bulletGEORGIOU, G. Analysis of large libraries of protein mutants using flow cytometry. Adv Protein Chem, 2001, vol. 55, 213-315 [0179]
\bulletSANTORO, S. W.; WANG, L.; HERBERICH, B.; KING, D. S.; SCHULTZ, P. G. An efficient system for the evolution of aminoacyl-tRNA synthetase specificity. Nat Biotechnol, 2002, vol. 20, 1044-1048 [0180] [0199]
\bulletSANTORO, S. W.; WANG, L., HERBERICH, B.; KING, D. S.; SCHULTZ, P. G. An efficient system for the evolution of aminoacyl-tRNA synthetase specificity. Nat Biotechnol, 2002, vol. 20, 1044-1048 [0181]
\bulletWANG, L.; BROCK, A.; HERBERICH, B.; SCHULTZ, P. G. Expanding the genetic code of Escherichia coli. Science, 2001, vol. 292, 498-500 [0181] [0181]
\bulletSAMBROOK, J.; RUSSELL, D.W. Molecular cloning: a laboratory manual. 3rd edit. Cold Spring Harbor Laboratory Press, 2001 [0187]
\bulletPASTRNAK, M.; MAGLIERY, T. J.; SCHULTZ, P. G. A new orthogonal suppressor tRNA/aminoacyl- tRNA synthetase pair for evolving an organism with an expanded genetic code. Helv Chim Acta, 2000, vol. 83, 2277-2286 [0194]
\bulletWANG, L.; BROCK, A.; HERBERICH, B.; SCHULTZ, P. G. Expanding the genetic code of Escherichia coli. Science, 2001, vol. 292, 498-500 [0194]
\bulletWANG, L.; BROCK, A.; SCHULTZ, P. G. Adding L-3-(2 naphthyl)alanine to the genetic code of E-coli. J Am Chem Soc, 2002, vol. 124, 1836-1837 [0194]
\bulletCHIN, J. W.; SANTORO, S. W.; MARTIN, A. B.; KING, D. S.; WANG, L.; SCHULTZ, P. G. Addition of p-Azido-L-phenylalanine to the genetic code of Escherichia coli. J Am Chem Soc, 2002, vol. 124, 9026-9027 [0194]
\bulletSANTORO et al. Nature Biotechnology, 2002, vol. 20, 1044-1048 [0201] [0201]
\bulletSANTORO et al. Nature Biotechnology, 2002, vol. 20, 1044-1045 [0201].

Claims (28)

1. Composición que comprende una aminoacil-ARNt sintetasa ortogonal (O-RS), en la que la O-RS aminoacila preferentemente un primer ARNt ortogonal (O-ARNt) con acetil-L-fenilalanina con una eficacia de al menos 50% de la eficacia de un sistema de traducción que comprende p-acetil-L-fenialanina, un O-ARNt de SEQ ID NO.: 21, y un polipéptido sintetasa que comprende una secuencia de aminoácidos seleccionada de la SEQ ID NO.: 18-20.
2. Composición de la reivindicación 1, en la que la O-RS comprende una secuencia de aminoácidos que tiene al menos 80% de identidad de secuencia con una secuencia de aminoácidos mostrada en una cualquiera de las SEQ ID NO.: 18-20.
3. Composición de la reivindicación 1, en la que la O-RS comprende una secuencia de aminoácidos que comprende una cualquiera de las SEQ ID NO.: 18-20, o una variación conservativa de los mismos.
4. Composición de una cualquiera de las reivindicaciones 1 a 3, en la que la O-RS se obtiene de Methanococcus jannaschii.
5. Composición de una cualquiera de las reivindicaciones anteriores, que comprende una célula, en la que dicha célula comprende dicha O-RS.
6. Composición de la reivindicación 5, en la que la célula es una célula de E. coli.
7. Composición de una cualquiera de las reivindicaciones anteriores, que comprende un sistema de traducción.
8. Composición de una cualquiera de las reivindicaciones anteriores, que además comprende un O-ARNt.
9. Composición de la reivindicación 8, en la que el O-ARNt comprende o es codificado por una secuencia de polinucleótido de SEQ ID NO.: 21 o una secuencia de polinucleótido complementaria de la misma.
10. Célula que comprende un sistema de traducción, en el que el sistema de traducción comprende:
un primer ARNt ortogonal (O-ARNt);
una aminoacil-ARNt sintetasa ortogonal (O-RS); y,
p-acetil-L-fenialanina;
en el que la O-RS aminoacila preferentemente el O-ARNt con p-acetil-L-fenialanina con una eficacia de al menos 50% de la eficacia de un sistema de traducción que comprende p-acetil-L-fenialanina, un O-ARNt de SEQ ID NO.: 21, y un polipéptido sintetasa que comprende una secuencia de aminoácidos seleccionada de las SEQ ID NO.: 18-20.
11. Célula de la reivindicación 10, en la que el primer O-ARNt comprende o es codificado por una secuencia de polinucleótidos como se muestra en la SEQ ID NO.: 21, o una secuencia de polinucleótidos complementaria de la misma, y en la que la O-RS comprende una secuencia de aminoácidos que comprende una cualquiera de las SEQ ID NO.: 18-20, o una variación conservativa de los mismos.
12. Célula de la reivindicación 10 o la reivindicación 11, en la que la célula es una célula no eucariota.
13. Célula de la reivindicación 12, en la que la célula no eucariota es una célula de E. coli.
14. Célula de una cualquiera de las reivindicaciones 10 a 13, que además comprende un ácido nucleico que comprende un polinucleótido que codifica un polipéptido de interés, en el que el polinucleótido comprende un codón selector que es reconocido por el O-ARNt.
15. Célula de E. coli, que comprende:
un primer ARNt ortogonal (O-ARNt);
una aminoacil-ARNt sintetasa ortogonal (O-RS), en la que la O-RS aminacila preferentemente el O-ARNt con p-acetil-L-fenialanina con una eficacia de al menos 50% de la eficacia de un sistema de traducción que comprende p-acetil-L-fenialanina, un O-ARNt de SEQ ID NO.: 21, y un polipéptido sintetasa que comprende una secuencia de aminoácidos seleccionada de la SEQ ID NO.: 18-20;
p-acetil-L-fenialanina; y
un ácido nucleico que comprende un polinucleótido que codifica un polipéptido de interés, en el que el polinucleótido comprende al menos un codón selector que es reconocido por el primer O-ARNt.
16. Célula de E. coli de la reivindicación 15, en la que el primer O-ARNt comprende o es codificado por una secuencia de polinucleótido como se muestra en la SEQ ID NO.: 21, o una secuencia de polinucleótido complementaria de la misma, y en el que la O-RS comprende una secuencia de aminoácidos que comprende una cualquiera de las SEQ ID NO.: 18-20, o una variación conservativa de la misma.
17. Polipéptido artificial que comprende una cualquiera de las SEQ ID NO.: 18-20.
18. Polinucleótido artificial que codifica un polipéptido de la reivindicación 17.
19. Vector que comprende o codifica un polinucleótido de la reivindicación 17.
20. Vector de la reivindicación 19, en el que el vector comprende un plásmido, un cósmido, un fago o un virus.
21. Vector de la reivindicación 19, en el que el vector es un vector de expresión.
22. Célula que comprende el vector de la reivindicación 19.
23. Procedimiento de producción de una proteína en una célula con p-acetil-L-fenialanina en una posición especificada, comprendiendo el procedimiento:
hacer crecer la célula en un medio adecuado, en el que la célula comprende un ácido nucleico que comprende al menos un codón selector en una posición definida y codifica una proteína de interés; y
proporcionar en un medio adecuado la p-acetil-L-fenialanina;
en el que la célula además comprende:
un primer ARNt ortogonal (O-ARNt) que funciona en la célula y reconoce el codón selector; y
una aminoacil-ARNt sintetasa ortogonal (O-RS) que aminoacila preferentemente el primer O-ARNt con p-acetil-L-fenialanina con una eficacia de al menos 50% de la eficacia de un sistema de traducción que comprende p-acetil-L-fenilalanina, un O-ARNt de SEQ ID NO.: 21, y un polipéptido sintetasa que comprende una secuencia de aminoácidos seleccionada de las SEQ ID NO.: 18-20; e
incorporar la p-acetil-L-fenialanina en la posición especificada en la proteína de interés durante la traducción de la proteína de interés, en el que la posición definida de dicho al menos un codón selector en dicho ácido nucleico corresponde a dicha posición especificada de p-acetil-L-fenialanina en dicha proteína de interés, produciendo así la proteína de interés con p-acetil-L-fenialanina en la posición especificada.
24. Procedimiento de la reivindicación 23, en el que la O-RS comprende una secuencia de aminoácidos que tiene al menos 80% de identidad de secuencia con una secuencia de aminoácidos mostrada en una cualquiera de las SEQ ID NO.: 18-20.
25. Procedimiento de la reivindicación 23, en el que la O-RS comprende una secuencia de aminoácidos que comprende una cualquiera de las SEQ ID NO.: 18-20, o una variación conservativa de los mismos.
26. Procedimiento de una cualquiera de las reivindicaciones 23 a 25, en el que el primer O-ARNt comprende o es codificado por una secuencia de polinucleótido mostrada en la SEQ ID NO.: 21, o una secuencia de polinucleótido complementaria de la misma.
27. Procedimiento de una cualquiera de las reivindicaciones 23 a 26, en el que la célula es una célula no eucariota.
28. Procedimiento de la reivindicación 27, en el que la célula no eucariota es una célula de E. coli.
ES03809019T 2002-10-16 2003-10-15 Incorporacion especifica de sitio de cetoaminoacidos en proteinas. Expired - Lifetime ES2324608T3 (es)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US41926502P 2002-10-16 2002-10-16
US419265P 2002-10-16
US42099002P 2002-10-23 2002-10-23
US420990P 2002-10-23

Publications (1)

Publication Number Publication Date
ES2324608T3 true ES2324608T3 (es) 2009-08-11

Family

ID=32110229

Family Applications (1)

Application Number Title Priority Date Filing Date
ES03809019T Expired - Lifetime ES2324608T3 (es) 2002-10-16 2003-10-15 Incorporacion especifica de sitio de cetoaminoacidos en proteinas.

Country Status (17)

Country Link
US (5) US7432092B2 (es)
EP (2) EP2062976B1 (es)
JP (1) JP4444113B2 (es)
KR (1) KR20050072441A (es)
AT (2) ATE526414T1 (es)
AU (2) AU2003277373B2 (es)
CA (1) CA2502029C (es)
CY (1) CY1110483T1 (es)
DE (1) DE60327369D1 (es)
DK (1) DK1578949T3 (es)
ES (1) ES2324608T3 (es)
HK (1) HK1083351A1 (es)
IL (3) IL167715A (es)
MX (1) MXPA05003983A (es)
PT (1) PT1578949E (es)
SI (1) SI1578949T1 (es)
WO (1) WO2004035743A2 (es)

Families Citing this family (63)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2796546B1 (en) * 2001-04-19 2017-08-09 The Scripps Research Institute Incorporation of unnatural amino acids
WO2004035605A2 (en) 2002-10-16 2004-04-29 The Scripps Research Institute Glycoprotein synthesis
AU2004233083B2 (en) * 2003-04-17 2010-09-16 The Scripps Research Institute Expanding the eukaryotic genetic code
EP2392923B1 (en) * 2003-06-18 2014-05-21 The Scripps Research Institute Method of producing proteins comprising unnatural amino acid
EP1666604B1 (en) 2003-07-07 2008-02-13 The Scripps Research Institute Compositions of orthogonal lysyl-tRNA and aminoacyl-tRNA synthetase pairs and uses thereof
EP1658366A4 (en) 2003-07-07 2006-08-09 Scripps Research Inst COMPOSITIONS OF ORTHOGONAL GLUTAMYL-TRNA AND AMINOACYL-TRNA-SYNTHETASEPAARES AND THEIR USES
CN101532046A (zh) 2003-10-14 2009-09-16 斯克利普斯研究院 将氧化还原活性氨基酸位点特异地掺入蛋白质
AU2005211385B2 (en) 2004-02-02 2008-12-11 Ambrx, Inc. Modified human growth hormone polypeptides and their uses
MXPA06013586A (es) 2004-05-25 2007-11-09 Scripss Res Inst Incorporacion especifica del sitio de aminoacidos no naturales que contienen atomos pesados en proteinas para la determinacion de la estructura cristalina.
WO2006009901A2 (en) 2004-06-18 2006-01-26 Ambrx, Inc. Novel antigen-binding polypeptides and their uses
US7638299B2 (en) * 2004-07-21 2009-12-29 Ambrx, Inc. Biosynthetic polypeptides utilizing non-naturally encoded amino acids
US7824893B2 (en) 2004-09-21 2010-11-02 The Scripps Research Institute In vivo incorporation of alkynyl amino acids into proteins in eubacteria
US20060110784A1 (en) * 2004-09-22 2006-05-25 The Scripps Research Institute Site-specific labeling of proteins for NMR studies
JP2008516637A (ja) 2004-10-20 2008-05-22 ザ スクリップス リサーチ インスティテュート 真正細菌へのn−アセチルガラクトサミンアミノ酸のインビボ部位特異的組込み
CA2583735A1 (en) 2004-10-27 2006-10-19 The Scripps Research Institute Orthogonal translation components for the in vivo incorporation of unnatural amino acids
MX2007007591A (es) 2004-12-22 2007-07-25 Ambrx Inc Metodos para expresion y purificacion de hormona de crecimiento humano recombinante.
EP1836298B1 (en) 2004-12-22 2012-01-18 Ambrx, Inc. COMPOSITIONS OF AMINOACYL-tRNA SYNTHETASE AND USES THEREOF
MX2007007590A (es) 2004-12-22 2007-12-10 Ambrx Inc Composiciones que contienen, metodos que involucran y usos de aminoacidos no naturales y polipeptidos.
US7816320B2 (en) 2004-12-22 2010-10-19 Ambrx, Inc. Formulations of human growth hormone comprising a non-naturally encoded amino acid at position 35
ATE542920T1 (de) 2004-12-22 2012-02-15 Ambrx Inc Modifiziertes menschliches wachstumshormon
CN103030690A (zh) 2005-06-03 2013-04-10 Ambrx公司 经改良人类干扰素分子和其用途
US20090306023A1 (en) * 2005-06-29 2009-12-10 Ramirez Jose E Stable organic peroxide compositions
CN104789536A (zh) * 2005-10-12 2015-07-22 斯克利普斯研究院 噬菌体展示多肽的选择性翻译后修饰
US20090018029A1 (en) 2005-11-16 2009-01-15 Ambrx, Inc. Methods and Compositions Comprising Non-Natural Amino Acids
CN105384807A (zh) 2005-12-14 2016-03-09 Ambrx公司 含有非天然氨基酸和多肽的组合物、涉及非天然氨基酸和多肽的方法以及非天然氨基酸和多肽的用途
US7776535B2 (en) * 2006-02-06 2010-08-17 Franklin And Marshall College Site-specific incorporation of fluorinated amino acids into proteins
PT1991680E (pt) 2006-03-09 2013-10-30 Scripps Research Inst Sistema para a expressão de componentes ortogonais de tradução em células hospedeiras eubacterianas
AU2007227592B2 (en) 2006-03-16 2011-11-24 The Scripps Research Institute Genetically programmed expression of proteins containing the unnatural amino acid phenylselenocysteine
BRPI0711811A2 (pt) * 2006-05-23 2011-12-06 Scripps Research Inst aminoácidos de cumarina fluorescente geneticamente codificados
AU2007292903B2 (en) 2006-09-08 2012-03-29 Ambrx, Inc. Modified human plasma polypeptide or Fc scaffolds and their uses
JP5451390B2 (ja) 2006-09-08 2014-03-26 アンブルックス,インコーポレイテッド 脊椎動物細胞内におけるサプレッサーtrnaの転写
SG174781A1 (en) * 2006-09-08 2011-10-28 Ambrx Inc Hybrid suppressor trna for vertebrate cells
AU2007297610A1 (en) * 2006-09-21 2008-03-27 The Scripps Research Institute Genetically programmed expression of selectively sulfated proteins in Eubacteria
WO2008049034A1 (en) * 2006-10-17 2008-04-24 Zymera, Inc. System for assays of aminotranferase
AU2007333010A1 (en) 2006-10-18 2008-06-19 The Scripps Research Institute Genetic incorporation of unnatural amino acids into proteins in mammalian cells
GB0623974D0 (en) * 2006-11-30 2007-01-10 Medical Res Council Evolved orthogonal ribosomes
KR101476472B1 (ko) 2007-03-30 2015-01-05 암브룩스, 인코포레이티드 변형된 fgf-21 폴리펩티드 및 그 용도
CA2685596A1 (en) 2007-05-02 2008-11-13 Ambrx, Inc. Modified interferon beta polypeptides and their uses
NZ584825A (en) 2007-11-20 2013-03-28 Ambrx Inc Modified insulin polypeptides and their uses
JP5702150B2 (ja) 2008-02-08 2015-04-15 アンブルックス, インコーポレイテッドAmbrx, Inc. 修飾されているレプチンポリペプチドおよびそれらの使用
JP5680534B2 (ja) 2008-07-23 2015-03-04 イーライ リリー アンド カンパニー 修飾されているウシg−csfポリペプチドおよびそれらの使用
AU2009296267B2 (en) 2008-09-26 2013-10-31 Ambrx, Inc. Non-natural amino acid replication-dependent microorganisms and vaccines
PL2342223T3 (pl) 2008-09-26 2017-09-29 Ambrx, Inc. Zmodyfikowane polipeptydy zwierzęcej erytropoetyny i ich zastosowania
WO2011073738A1 (en) 2009-12-14 2011-06-23 Metabolic Explorer Use of inducible promoters in the production of methionine
CN104017063A (zh) 2009-12-21 2014-09-03 Ambrx公司 经过修饰的猪促生长素多肽和其用途
CN107674121A (zh) 2009-12-21 2018-02-09 Ambrx 公司 经过修饰的牛促生长素多肽和其用途
US9567386B2 (en) 2010-08-17 2017-02-14 Ambrx, Inc. Therapeutic uses of modified relaxin polypeptides
MX346786B (es) 2010-08-17 2017-03-31 Ambrx Inc Polipeptidos de relaxina modificados y sus usos.
AR083006A1 (es) 2010-09-23 2013-01-23 Lilly Co Eli Formulaciones para el factor estimulante de colonias de granulocitos (g-csf) bovino y variantes de las mismas
CN102888387B (zh) * 2011-07-21 2015-03-18 中国科学院生物物理研究所 3-氯代酪氨酸翻译系统及其应用
JO3564B1 (ar) 2013-03-08 2020-07-05 Novartis Ag ببتيدات وتركيبات لعلاج ضرر المفاصل
CA2901928C (en) 2013-03-13 2017-10-10 Eli Lilly And Company Modified canine leptin polypeptides
US10005838B2 (en) 2013-07-19 2018-06-26 The Regents Of The University Of California Milk fat globule epidermal growth factor 8 regulates fatty acid uptake
US10011649B2 (en) 2013-08-26 2018-07-03 Arizona Board Of Regents On Behalf Of Arizona State University High affinity synbodies for influenza
EP3164501A4 (en) 2014-07-02 2018-01-17 Sutro Biopharma, Inc. High growth capacity auxotrophic escherichia coli and methods of use
KR102637699B1 (ko) 2014-10-24 2024-02-19 브리스톨-마이어스 스큅 컴퍼니 변형된 fgf-21 폴리펩티드 및 그의 용도
EA039794B1 (ru) 2014-12-04 2022-03-15 Селджин Корпорейшн Конъюгаты биомолекул
US9744624B2 (en) * 2015-06-17 2017-08-29 Kinsus Interconnect Technology Corp. Method for manufacturing circuit board
CN109996809A (zh) 2016-11-14 2019-07-09 诺华股份有限公司 与促融合蛋白minion相关的组合物、方法和治疗用途
EP3538127A1 (en) 2016-11-14 2019-09-18 Novartis AG Methods and compositions for treatment of cartilage damage and arthritis
SG11201907209QA (en) 2017-02-08 2019-09-27 Bristol Myers Squibb Co Modified relaxin polypeptides comprising a pharmacokinetic enhancer and uses thereof
WO2024077277A1 (en) 2022-10-07 2024-04-11 Ambrx, Inc. Drug linkers and antibody conjugates thereof
WO2024091824A1 (en) 2022-10-26 2024-05-02 Ada Forsyth Institute, Inc. Differentiation and reprogramming of chondrocyte

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5824485A (en) 1995-04-24 1998-10-20 Chromaxome Corporation Methods for generating and screening novel metabolic pathways
US5958672A (en) 1995-07-18 1999-09-28 Diversa Corporation Protein activity screening of clones having DNA from uncultivated microorganisms
US5756316A (en) 1995-11-02 1998-05-26 Genencor International, Inc. Molecular cloning by multimerization of plasmids
US6238884B1 (en) 1995-12-07 2001-05-29 Diversa Corporation End selection in directed evolution
US5783431A (en) 1996-04-24 1998-07-21 Chromaxome Corporation Methods for generating and screening novel metabolic pathways
EP2796546B1 (en) * 2001-04-19 2017-08-09 The Scripps Research Institute Incorporation of unnatural amino acids
WO2004035605A2 (en) * 2002-10-16 2004-04-29 The Scripps Research Institute Glycoprotein synthesis

Also Published As

Publication number Publication date
MXPA05003983A (es) 2005-06-22
EP2062976B1 (en) 2011-09-28
IL167715A (en) 2010-11-30
SI1578949T1 (sl) 2009-08-31
US8114629B2 (en) 2012-02-14
AU2003277373B2 (en) 2009-05-07
CA2502029C (en) 2014-06-10
WO2004035743A2 (en) 2004-04-29
EP2062976A3 (en) 2010-04-07
US7432092B2 (en) 2008-10-07
US7524647B2 (en) 2009-04-28
KR20050072441A (ko) 2005-07-11
US7910345B2 (en) 2011-03-22
PT1578949E (pt) 2009-07-14
WO2004035743A3 (en) 2005-11-10
CA2502029A1 (en) 2004-04-29
ATE526414T1 (de) 2011-10-15
EP2062976A2 (en) 2009-05-27
CY1110483T1 (el) 2015-04-29
JP2006507814A (ja) 2006-03-09
EP1578949A2 (en) 2005-09-28
US20110318806A1 (en) 2011-12-29
US20080227153A1 (en) 2008-09-18
JP4444113B2 (ja) 2010-03-31
DK1578949T3 (da) 2009-07-27
WO2004035743A8 (en) 2005-06-09
AU2003277373A1 (en) 2004-05-04
IL210359A0 (en) 2011-03-31
EP1578949B1 (en) 2009-04-22
IL201208A (en) 2011-02-28
US20060068478A1 (en) 2006-03-30
ATE429500T1 (de) 2009-05-15
US20080176284A1 (en) 2008-07-24
EP1578949A4 (en) 2006-12-20
DE60327369D1 (de) 2009-06-04
HK1083351A1 (en) 2006-06-30
US8071344B2 (en) 2011-12-06
AU2009203098A1 (en) 2009-08-20
US20090215117A1 (en) 2009-08-27
AU2009203098B2 (en) 2011-09-08

Similar Documents

Publication Publication Date Title
ES2324608T3 (es) Incorporacion especifica de sitio de cetoaminoacidos en proteinas.
ES2519444T3 (es) Incorporación in vivo de alquinil aminoácidos a proteínas en eubacterias
US8394605B2 (en) Genetically programmed expression of proteins containing the unnatural amino acid phenylselenocysteine
JP5657850B2 (ja) 酸化還元機能性アミノ酸のタンパク質への部位特異的組み入れ
CA2638763A1 (en) System for the expression of orthogonal translation components in eubacterial host cells
JP2009538136A (ja) 遺伝的にコードされた蛍光クマリンアミノ酸
AU2011253900B2 (en) Site specific incorporation of keto amino acids into proteins