MX2007004892A - Componentes de traduccion ortogonales para la incorporacion in vivo de aminoacidos no naturales. - Google Patents

Componentes de traduccion ortogonales para la incorporacion in vivo de aminoacidos no naturales.

Info

Publication number
MX2007004892A
MX2007004892A MX2007004892A MX2007004892A MX2007004892A MX 2007004892 A MX2007004892 A MX 2007004892A MX 2007004892 A MX2007004892 A MX 2007004892A MX 2007004892 A MX2007004892 A MX 2007004892A MX 2007004892 A MX2007004892 A MX 2007004892A
Authority
MX
Mexico
Prior art keywords
trna
amino acid
translation system
host cell
protein
Prior art date
Application number
MX2007004892A
Other languages
English (en)
Inventor
Jianming Xie
Ning Wu
Alexander Deiters
Peter Schultz
Lital Alfonta
Jonathan R Chittuluru
Dan Groff
Daniel Summerer
Meng-Lin Tsao
Jiangyun Wang
Huaqiang Zeng
Original Assignee
Scripps Research Inst
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Scripps Research Inst filed Critical Scripps Research Inst
Publication of MX2007004892A publication Critical patent/MX2007004892A/es

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1058Directional evolution of libraries, e.g. evolution of libraries is achieved by mutagenesis and screening or selection of mixed population of organisms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/93Ligases (6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/02Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Biomedical Technology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Plant Pathology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Medicinal Chemistry (AREA)
  • Ecology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

La presente invencion es concerniente con pares ortogonales de tARN y aminoacil-tARN sintetasas que pueden incorporar aminoacidos no naturales a proteinas producidas en celulas huesped eubacterianas tales como E. Coli o en huesped eucariontico tal como una celula de levadura. La invencion proporciona por ejemplo, pero no esta limitado a, nuevas sintetasas ortogonales, metodos para identificar y fabricar las nuevas sintetasas, metodos para producir proteinas que contienen aminoacidos no naturales y sistemas de traduccion.

Description

COMPONENTES DE TRADUCCIÓN ORTOGONALES PARA LA INCORPORACIÓN IN VIVO DE AMINOÁCIDOS NO NATURALES CAMPO DE LA INVENCIÓN La presente invención es concerniente con el campo de bioquímica de traducción. La invención es concerniente con composiciones y métodos para fabricar y utilizar tARN ortogonales, aminoacil-tARN sintetasas ortogonales y pares de los mismos, que incorporan aminoácidos no naturales a proteínas. La invención también es concerniente con métodos para producir proteínas en células utilizando tales pares y proteínas elaboradas mediante los métodos.
ANTECEDENTES DE LA INVENCIÓN El estudio de la estructura y función de la proteína ha dependido históricamente de las propiedades y químicas d.e reacción que están disponibles usando los grupos reactivos de los aminoácidos que se presentan de manera estable en la naturaleza. Desafortunadamente, cada organismo conocido, desde bacteria a humanos, codifica los mismos veinte aminoácidos comunes (con las raras excepciones de selenocisteína (véase por ejemplo A. Bock et al., (1991), Molecular Microbiology 5:515- 20) y pirrolisina (véase por ejemplo G. Srinivasan, et al., (2002), Science 296:1459-62). Esta selección limitada de grupos R ha restringido el estudio de la estructura y función de proteína, en donde los estudios están confinados por las propiedades químicas de los aminoácidos que se presentan de manera estable en la naturaleza, por ejemplo, los aminoácidos no naturales limitan la capacidad para realizar modificaciones de proteína altamente apuntadas a la exclusión de todos los otros aminoácidos en una proteína. Adicionalmente, los aminoácidos naturales están limitados en sus actividades funcionales, por ejemplo fluorescencia, quelación de metal, potencial redox, fotoenjaula iento, etc. La mayoría de las reacciones de modificación actualmente usadas en el arte para la modificación selectiva de proteínas involucran formación de enlace covalente entre socios de reacción nucleofílicos y electrofílicos que apuntan residuos nucleofílicos que se presentan de manera estable en la naturaleza en las cadenas laterales de aminoácidos de proteína, por ejemplo, la reacción de a-halo cetonas con cadenas laterales de histidina o cisteína. La selectividad en estos casos es determinada por el número y accesibilidad de los residuos de nucleófilo en la proteína. Desafortunadamente, las proteínas que se presentan de manera estable en la naturaleza contienen frecuentemente sitios de reacción colocados deficientemente (por ejemplo inaccesible) o múltiples objetivos de reacción (por ejemplo, residuos de lisina, histidina y cisteína) , dando como resultado selectividad eficiente en las reacciones de modificación, haciendo la modificación de proteína altamente apuntada por reactivos nucleofílicos/electrofílicos difícil. Además, los sitios de modificación están limitados comúnmente a las cadenas laterales de nucleófilo que se presentan de manera estable en la naturaleza de lisina, histidina o cisteína. La modificación en otros sitios es difícil o imposible. Lo que se necesita en el arte son nuevas estrategias para la incorporación de aminoácidos no naturales a proteínas por el propósito de modificar y estudiar la estructura y función de proteína, en donde los aminoácidos no naturales tienen propiedades novedosas, por ejemplo propiedades biológicas, no encontradas en los aminoácidos que se presentan de manera estable en la naturaleza. Hay necesidad considerable en el arte por la creación de nuevas estrategias para reacciones de modificación de proteína que modifiquen proteínas de manera altamente selectiva y además, modifiquen proteínas bajo condiciones fisiológicas. Lo que se necesita en el arte son nuevos métodos para producir modificaciones de proteína, en donde las modificaciones son altamente específicas, por ejemplo modificaciones en donde ninguno de los aminoácidos que es presentan de manera estable en la naturaleza están sujetos a reacciones cruzadas o reacciones laterales. Las nuevas químicas para las estrategias de modificación de proteína altamente específicas pueden encontrar una amplia variedad de aplicaciones en el estudio de la estructura y función de proteína.
Una estrategia para superar estas limitaciones es expandir el código genético y agregar aminoácidos que tienen propiedades físicas, químicas o biológicas distintivas al repertorio biológico. Este procedimiento ha probado ser factible utilizando tARN ortogonales y correspondientes nuevas aminoacil-tARN sintetasas ortogonales para agregar aminoácidos no naturales a proteínas utilizando la maquinaria biosintética de proteína in vivo de una célula huésped, por ejemplo, la eubacteria Escherichia coli (E. coli), levadura o células amíferas. Este procedimiento es descrito en varias fuentes, por ejemplo Wang et al., (2001), Science 292:498-500; Chin et al., (2002) Journal of the American Chemical Society 124:9026-9027; Chin and Schultz, (2002), ChemiBioChem 11:1135-1137; Chin et al., (2002), PNAS United States of America 99:11020-11024; y Wang and Shultz, (2002), Chem. Comm. , 1-10. Véase también publicaciones internacionales WO 2002/080675, intitulada "METHODS AND COMPOSITIONS FOR THE PRODUCTION OF ORTHOGONAL tRNA AMINOACYL-tRNA SYNTHETASE PAIRS;" WO 2002/085923, intitulada "IN VIVO INCORPORATION OF UNNATURAL AMINO ACIDS;" WO 2004/094593, intitulada "EXPANDING THE EUKARYOTIC GENETIC CODE;" WO 2005/019415, presentada el 7 de julio de 2004; WO 2005/007870, presentada el 7 de julio de 2004; y WO 2005/007624, presentada el 7 de julio de 2004. Hay necesidad en el arte para el desarrollo de componentes de traducción ortogonales que incorporen aminoácidos no naturales a proteínas, en donde los aminoácidos no naturales pueden ser incorporados en una posición definida y en donde los aminoácidos no naturales imparten nuevas propiedades biológicas a las proteínas en las cuales son incorporados. También hay necesidad de desarrollar componentes de traducción ortogonales que incorporen aminoácidos no naturales con nuevas propiedades químicas que permiten que el aminoácido sirva como objetivo para modificación específica a la exclusión de reacciones cruzadas o reacciones laterales con otros sitios en las proteínas. También hay necesidad particular por sistemas de expresión de proteínas que tengan la habilidad de producir proteínas que contengan aminoácidos no naturales en cantidades significativas que permiten su uso en aplicaciones terapéuticas e investigación biomédica. La invención descrita en la presente satisface estas y otras necesidades, como será evidente en la revisión de la siguiente revelación.
BREVE DESCRIPCIÓN DE LA INVENCIÓN La invención proporciona composición y métodos para incorporar aminoácidos no naturales a una cadena de polipéptido creciente en respuesta a un codón selector, por ejemplo un codón de retención ámbar, in vivo (por ejemplo, en una célula huésped) . Estas composiciones incluyen pares de t-ARN ortogonales (O-tARN) y aminoacil-tARN sintetasas ortogonales (O-RS) que no interactúan con la maquinaria de traducción de la célula huésped. Es decir, el O-tARN no es cargado (o no es cargado a un nivel significativo) con un aminoácido (natural o no natural) por una aminoacil-tARN sintetasa de célula huésped endógena. Similarmente, las O-RS proporcionadas por la invención no cargan ningún tARN endógeno con un aminoácido (natural o no natural) a un nivel significativo o en algunos casos nivel detectable. Estas nuevas composiciones permiten la producción de grandes cantidades de proteínas que tienen aminoácidos no naturales incorporados traduccionalmente . Dependiendo de las propiedades químicas del aminoácido no natural que es incorporado, estas proteínas encuentran una amplia variedad de usos, en los que se incluyen, por ejemplo, como terapéuticos y en investigación biomédica. En algunos aspectos, la invención proporciona sistemas de traducción. Estos sistemas comprenden una primera aminoacil-tARN sintetasa ortogonal (O-RS), un primer tARN ortogonal (O-tARN) y un aminoácido no natural, en donde la primera O-RS aminoacila preferiblemente el primer O-tARN con el primer aminoácido no natural . El primer aminoácido no natural puede ser seleccionado de p-etiltiocarbonil-L-fenilalanina, p- (3 -oxobutanoil) -L-fenilalanina, 1 , 5-dansil-alanina, 7-amino-coumarin-alanina, 7-hidroxi-coumarin-alanina, o-nitrobencil-serina, O- (2-nitrobencil) -L-tirosina, p-carboximetil-L-fenilalanina, m-ciano-L-fenilalanina, p-ciano-L-fenilalanina, bifenilalanina, 3-amino-L-tirosina, bipiridilalanina, p-(2- amino-1-hidroxietil) -L-fenilalanina y p-isopropiltiocarbonil-L-fenilalanina . Los sistemas de traducción pueden usar componentes derivados de una variedad de fuentes. En una modalidad, la primera O-RS es derivada de una aminoacil-tARN sintetasa de Methanococcus jannaschii , por ejemplo, una tirosil-tARN sintetasa de Methanococcus jannaschii de tipo silvestre. En otras modalidades, la O-RS es derivada de una aminoacil-tARN sintetasa de E. coli, por ejemplo, una leucil-tARN sintetasa de E. coli tipo silvestre. La O-RS usada en el sistema puede comprender una secuencia de aminoácidos seleccionada de SEQ ID NO: 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 50, 52-55, 57, 59-63 y variantes conservadoras de aquellas secuencias. En algunas modalidades, el O-tARN es un t-ARN supresor ámbar. En algunas modalidades, el O-tARN comprende o es codificado por SEQ ID NO: 1 ó 2. En algunos aspectos, el sistema de traducción comprende además un ácido nucleico que codifica una proteína de interés, en donde el ácido nucleico tiene por lo menos un codón selector que es reconocido por el O-tARN. En algunos aspectos, el sistema de traducción incorpora un segundo par ortogonal (eso es, una segunda O-RS y un segundo O-tARN) que utiliza un segundo aminoácido no natural, de tal manera que el sistema es ahora apto de incorporar por lo menos dos aminoácidos no naturales diferentes en diferentes sitios seleccionados en un polipéptido. En este sistema doble, la segunda O-RS aminoacila preferiblemente el segundo O-tARN con un segundo aminoácido no natural que es diferente del primer aminoácido no natural y el segundo O-tARN reconoce un codón selector que es diferente del codón selector reconocido por el primer O-tARN. En algunas modalidades, el sistema de traducción reside en una célula huésped (e incluye la célula huésped) . La célula huésped usada no está particularmente limitada, en cuanto la O-RS y el O-tARN retengan su ortogonalidad en su ambiente de célula huésped. La célula huésped puede ser una célula eubacteriana, tal como célula de E. coli o una célula de levadura, tal como Saccharomyces cerevi siae . La célula huésped puede comprender uno o más polinucleótidos que codifican componentes del sistema de traducción, en los que se incluyen la O-RS o tARN. En algunas modalidades, el polinucleótido que codifica la O-RS comprende una secuencia de nucleótidos de SEQ ID NO: 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 51, 56 ó 58. La invención también proporciona métodos para producir proteínas que tienen uno o más aminoácidos no naturales en posiciones seleccionadas. Estos métodos utilizan los sistemas de traducción descritos anteriormente. En general, estos métodos inician con la etapa de proporcionar un sistema de traducción que comprende: (i) un primer aminoácido no natural seleccionado de p-etiltiocarbonil-L-fenilalanma, p-(3-oxobutanoil) -L-fenilalanina, 1 , 5-dans?l-alanma, 7-ammo-coumarm-alanma, 7-h?drox?-coumarm-alanma, o-nitrobencil-serina, 0- (2-n?trobenc?l) -L-tirosma, p-carboximetil-L-fenilalanma, m-ciano-L-fenilalanina, p-ciano-L-fenilalanina, bifenilalanina, 3 -ammo-L-tirosma, bipiridilalanma, p-(2-ammo-1-h?drox?et?l) -L-fenilalanina y p-isopropiltiocarbonil-L-fenilalanina; (n) una primera ammoacil-tARN smtetasa ortogonal (O-RS); (ni) un primer tARN ortogonal (O-tARN), en donde la O-RS ammoacil preferiblemente el O-tARN con el aminoácido no natural y (ív) un ácido nucleico que codifica la proteína, en donde el ácido nucleico comprende por lo menos un codón selector que es reconocido por el primer O-tARN. El método incorpora luego el aminoácido no natural en la posición seleccionada en la proteína durante la traducción de la proteína en respuesta al codón selector, produciendo mediante esto la proteína que comprende el aminoácido no natural en la posición seleccionada. Estos métodos pueden ser aplicados ampliamente utilizando una variedad de reactivos y etapas. En algunas modalidades, se proporciona un polmucleótido que codifica la O-RS. En algunas modalidades, se proporciona una O-RS derivada de una ammoacil-tARN smtetasa de Methanococcus annaschii , por ejemplo una tirosil-tARN smtetasa Methanococcus jannaschii tipo silvestre. En otras modalidades, se proporciona una O-RS derivada de una ammoacil-tARN smtetasa de E. coli, por ejemplo se proporciona una O-RS derivada de una leucil-tARN sintetasa de E. coll tipo silvestre. En algunas modalidades, la etapa de provisión incluye proporcionar una O-RS que comprende una secuencia de aminoácidos seleccionada de SEQ ID NOs : 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 50, 52-55, 57, 59-63 y variantes conservadoras de las mismas En algunas modalidades de estos métodos, la etapa de proporcionar un sistema de traducción comprende la mutación de una cavidad de enlace de aminoácido de una ammoacil- tARN sintetasa tipo silvestre mediante mutagénesis dirigida al sitio y seleccionar una O-RS que ammoacila preferiblemente el O-tARN con el aminoácido no natural . La etapa de selección puede comprender seleccionar positivamente y seleccionar negativamente la O-RS de un cúmulo de moléculas de ammoacil-tARN smtetasa resultantes enseguida de la mutagénesis dirigida al sitio. En algunas modalidades, la etapa de provisión proporciona un polmucleótido que codifica el O-tARN, por ejemplo, un O-tARN que es un tARN supresor ámbar o un O-tARN que comprende o es codificado por un polinucleótido de SEQ ID NO: 1 ó 2. En estos métodos, la etapa de provisión puede también proporcionar un ácido nucleico que comprende un codón selector ambas que es utilizado por el sistema de traducción. Estos métodos pueden también ser modificados para incorporar más de un aminoácido no natural a una proteína. En estos métodos, un segundo sistema de traducción ortogonal es empleado en conjunción con el primer sistema de traducción, en donde el segundo sistema tiene diferentes especificidades de aminoácido y de codón selector. Por ejemplo, la etapa de provisión puede incluir proporcionar una segunda O-RS y un segundo O-tARN, en donde la segunda O-RS ammoacila preferiblemente el segundo O-tARN con un segundo aminoácido no natural que es diferente del primer aminoácido no natural y en donde el segundo O-tARN reconoce un codón selector en el ácido nucleico que es diferente del codón selector reconocido por el primer O-tARN Los métodos para producir una proteína con un aminoácido no natural pueden también ser llevados a cabo en el contexto de una célula huésped. En estos casos, se proporciona una célula huésped, en donde la célula huésped comprende el aminoácido no natural, la O-RS, el O-tARN y el ácido nucleico y en donde el cultivo de la célula huésped da como resultado la incorporación del aminoácido no natural . En algunas modalidades, la etapa de provisión comprende proporcionar una célula huésped eubacteriana (por ejemplo, E. coli) o una célula huésped de levadura. En algunas modalidades, la etapa de provisión incluye proporcionar una célula huésped que contiene un polmucleótido que codifica la O-RS. Por ejemplo, el polmucleótido que codifica la O-RS puede comprender una secuencia de nucleótidos de SEQ ID NOs : 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 51, 56 ó 58. En algunas modalidades, la etapa de proporcionar un sistema de traducción se lleva a cabo al proporcionar un extracto celular. En algunos aspectos, la invención proporciona sistemas de traducción, en donde los sistemas son para la incorporación de 3-nitro-L-tirosina o p-nitro-L-fenilalanina . Estos sistemas comprenden una primer aminoacil-tARN sintetasa ortogonal (O-RS) , un primer tARN ortogonal (O-tARN) y el aminoácido no natural, en donde la primera O-RS aminoacila preferiblemente el primer O-tARN con el primer aminoácido no natural con una eficiencia que es por lo menos 50% de la eficiencia observada para un sistema de traducción que comprende aquel mismo aminoácido no naturales, el O-tARN y una O-RS que comprende una secuencia de aminoácidos seleccionada de SEQ ID NOs: 7-10. El sistema de traducción puede usar componentes derivados de una variedad de fuentes. En algunas modalidades, la primera O-RS es derivada de una aminoacil-tARN sintetasa de Methanococcus jannaschii , por ejemplo una tirosil-tARN sintetasa de Methanococcus jannaschii tipo silvestre. La O-RS usada en el sistema puede comprende una secuencia de aminoácidos seleccionada de SEQ ID NOs: 7-10 y variantes conservadoras de aquellas secuencias. En algunas modalidades, el O-tARN es un tARN supresor ámbar. En algunas modalidades, el O-tARN comprende o es codificado por SEQ ID NO: 1. En algunos aspectos, el sistema de traducción comprende además un ácido nucleico que codifica una proteína de interés en donde el ácido nucleico tiene por lo menos un codón selector que es reconocido por el t-ARN. En algunos aspectos, el sistema de traducción incorpora un segundo par ortogonal (esto es, una segunda O-RS y un segundo O-tARN) que utiliza un segundo aminoácido no natural, de tal manera que el sistema es ahora apto de incorporar por lo menos dos aminoácidos no naturales diferentes en diferentes sitios seleccionados en un polipéptido. En este sistema doble, la segunda O-RS aminoacila preferiblemente el segundo O-tARN con un segundo aminoácido no natural que es diferente del primer aminoácido no natural y el segundo O-tARN reconoce un codón selector que es diferente del codón selector reconocido por el primer O-tARN. En algunas modalidades, el sistema de traducción reside en una célula huésped (e incluye la célula huésped) . La célula huésped usada no está particularmente limitada, en tanto que la O-RS y O-tARN retengan su ortogonalidad en su ambiente de célula huésped. La célula huésped puede ser una célula eubacteriana, tal como E. coli. La célula huésped puede comprender uno o más polinucleótidos que codifican componentes del sistema de traducción, en los que se incluyen la O-RS o O-tARN. En algunas modalidades, el polinucleótido que codifica la O-RS comprende una secuencia de nucleótidos de SEQ ID NO: 11. La invención proporciona métodos para producir proteínas que tienen uno o más aminoácidos no naturales en posiciones seleccionadas. Estos métodos utilizan los sistemas de traducción descritos anteriormente. En general, estos métodos inicial con la etapa de proporcionar una célula huésped que comprende un sistema de traducción que comprende: (i) un primer aminoácido no natural que es 3 -nitro-L- tirosina o p-nitro-L-fenilalanina; (ii) una primera aminoacil-tARN sintetasa ortogonal (O-RS) ; (iii) un primer tARN ortogonal (O-tARN) , en donde la O-RS a inoacila preferiblemente el O-tARN con el aminoácido no natural con una eficiencia que es por lo menos 50% de la eficiencia observada para la célula huésped que comprende el aminoácido no natural, el O-tARN y una O-RS que comprende una secuencia de aminoácidos seleccionada de SEQ ID NOs: 7-10; y (iv) un ácido nucleico que codifica la proteína, en donde el ácido nucleico comprende por lo menos un codón selector que es reconocido por el O-tARN. Luego la célula huésped es cultivada y el aminoácido no natural es incorporado en la posición seleccionada en la proteína durante la traducción de la proteína en respuesta al codón selector, en donde la posición seleccionada en la proteína corresponde a la posición del codón selector en el ácido nucleico, produciendo mediante esto la proteína que comprende al aminoácido no natural en la posición seleccionada.
Estos métodos pueden ser aplicados ampliamente utilizan una variedad de reactivos y etapas. En algunas modalidades, se proporciona un polinucleótido que codifica la O-RS. En algunas modalidades, se proporciona una O-RS derivada de una aminoacil-tARN sintetasa de Methanococcus jannaschii por ejemplo se puede proporcionar una tirosil-tARN sintetasa de Methanococcus jannaschi i tipo silvestre. En algunas modalidades, la etapa de provisión incluye proporcionar una 0-RS que comprende una secuencia de aminoácidos seleccionada de SEQ ID Nos: 7-10 y variantes conservadoras de las mismas. En algunas modalidades de estos métodos, la etapa de proporcionar un sistema de traducción comprende mutación de una cavidad de enlace de aminoácido de una aminoacil-tARN sintetasa tipo silvestre mediante mutagénesis dirigida al sitio y seleccionar una O-RS resultante que aminoacil preferiblemente el O-tARN con el aminoácido no natural. La etapa de selección puede comprender seleccionar positivamente y seleccionar negativamente para la O-RS de un cúmulo de moléculas de aminoacil-tARN sintetasa resultantes enseguida de la mutagénesis dirigida al sitio. En algunas modalidades, la etapa de provisión proporciona un polinucleótido que codifica el 0-tARN, por ejemplo un O-tARN que es un tARN supresor ámbar o un O-tARN que comprende o es codificado por un polinucleótido de SEQ ID NO: 1. En estos métodos la etapa de provisión puede también proporcionar un ácido nucleico que comprende un codón selector ámbar que es utilizado por el sistema de traducción. Estos métodos pueden también ser modificados para incorporar más de un aminoácido no natural a una proteína. En estos métodos, se emplea un segundo sistema de traducción ortogonal en conjunción con el primer sistema de traducción, en donde el segundo sistema tiene diferentes especificidades de aminoácido y de codón selector. Por ejemplo, la etapa de provisión puede incluir proporcionar una segunda O-RS y un segundo O-tARN, en donde la segunda O-RS aminoacila preferiblemente el segundo O-tARN con un segundo aminoácido no natural que es diferente del primer aminoácido no natural y en donde el segundo O-tARN reconoce un codón selector en el ácido nucleico que es diferente del codón selector reconocido por el primer O-tARN. Los métodos para producir una proteína con un aminoácido no natural se llevan a cabo en el contexto de una célula huésped. En estas modalidades, la célula huésped comprende el aminoácido no naturales, la O-RS, el O-tARN y el ácido nucleico y en donde el cultivo de la célula huésped da como resultado la incorporación del aminoácido no natural. En algunas modalidades, la etapa de provisión comprende proporcionar una célula huésped eubacteriana (por ejemplo E. coli) . En algunas modalidades, la etapa de provisión incluye proporcionar una célula huésped que contiene un polinucleótido que codifica la O-RS. Por ejemplo, el polinucleótido que codifica la O-RS puede comprender una secuencia de nucleótidos de SEQ ID NO: 11. en algunas modalidades, la etapa de proporcionar un sistema de traducción se lleva a cabo al proporcionar un extracto celular. La invención también proporciona una variedad de composiciones, en los que se incluyen ácidos nucleicos y proteínas. La naturaleza de la composición está particularmente limitada, a diferencia de que la composición comprende el ácido nucleico o proteína especificado. Las composiciones de la invención pueden comprender cualquier número de componentes adicionales de cualquier naturaleza. Por ejemplo, la invención proporciona composiciones que comprenden polipéptidos de O-RS, en donde los polipéptidos comprenden SEQ ID NO: 7-10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44 ,46, 50-55, 57, 59-63, o una variante conservadora de las mismas, en donde el polipéptido variante conservador aminoacila un tARN ortogonal (O-tARN) cognato con un aminoácido no natural con una eficiencia que es por lo menos 50% de la eficiencia observada por un sistema de traducción que comprende el O-tARN, el aminoácido no natural y una aminoacil-tARN sintetasa que comprende una secuencia de aminoácidos seleccionada de SEQ ID NOs: 7-10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 50, 52-55, 57 y 59-63. La invención también proporciona polinucleótidos que codifican cualquiera de estos polipéptidos anteriores. En algunas modalidades, estos polinucleótidos pueden comprender SEQ ID NO: 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 51, 56 y 58. En algunas modalidades, los polipéptidos están en una célula. La invención también proporciona composiciones de polinucleótido que comprende una secuencia de nucleótidos de SEQ ID NO: 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 51, 56 ó 58. En algunas modalidades, la invención proporciona vectores que comprenden los polinucleótidos, por ejemplo vectores de expresión. En algunas modalidades, la invención proporciona células que comprenden un vector descrito anteriormente.
DEFINICIONES Antes de describir la invención en detalle, se comprenderá que la presente invención no está limitada a sistemas biológicos particulares, que pueden variar por supuesto. También se comprenderá que la terminología en la presente es por el propósito de describir modalidades particulares solamente y no pretende ser limitante. Como se usa en esta especificación y las reivindicaciones adjuntas, las formas singulares "un" , "una" y "el" incluyen referencias plurales a no ser que el contexto lo determine claramente de otra manera. Así, por ejemplo, la referencia a "una célula" incluye combinaciones de dos o más células; la referencia a "un polinucleótido" incluye, por supuesto, muchas copias de aquel polinucleótido . A no ser que se defina en la presente y a continuación en el resto de la especificación, todos los términos técnicos y científicos usados en la presente tienen el mismo significado como se comprende comúnmente por aquel de habilidad ordinaria en el arte con la cual la invención es concerniente .
Ortogonal: Como se usa en la presente, el término "ortogonal" se refiere a una molécula (por ejemplo, un tARN ortogonal (O-tARN) y/o una aminoacil-tARN sintetasa ortogonal (O-RS) ) que funciona con componentes endógenos de una célula con eficiencia reducida en comparación con una molécula correspondiente que es endógena a la célula o sistema de traducción o que no funciona con componentes endógenos de la célula. En el contexto de tARN y aminoacil-tARN sintetasas, ortogonal se refiere a una inhabilidad o eficiencia reducida, por ejemplo, menos de 20% de eficiencia, menos de 10% de eficiencia, menos de 5% de eficiencia, o menos de 1% de eficiencia, de un tARN ortogonal para funcionar con una tARN sintetasa endógena en comparación con un tARN endógeno para funcionar con la tARN sintetasa endógena o de una aminoacil-tARN sintetasa ortogonal para funcionar con un tARN endógeno en comparación con una tARN sintetasa endógena para funcionar con el tARN endógeno. La molécula ortogonal carece de una molécula complementaria endógena funcionalmente normal en la célula. Por ejemplo, un tARN ortogonal en una célula es aminoacilado por una RS endógena de la célula con eficiencia reducida o aún eficiencia cero, cuando se compara con la aminoacilación de un tARN endógeno por la RS endógena. En otro ejemplo, una RS ortogonal aminoacila cualquier tARN endógeno de una célula de interés con eficiencia reducida o aún eficiencia cero, en comparación con la aminoacilación de tARN endógeno por una RS endógena. Una segunda molécula ortogonal puede ser introducida a la célula que funciona con la primera molécula ortogonal . Por ejemplo, un par de tARN/RS ortogonal incluye componentes complementarios introducidos que funcionan conjuntamente en la célula con una eficiencia (por ejemplo, 45% de eficiencia, 50% de eficiencia, 60% de eficiencia, 70% de eficiencia, 75% de eficiencia, 80% de eficiencia, 90% de eficiencia, 95% de eficiencia, o 99% o más eficiencia) en comparación con aquella de un control, por ejemplo, un par endógeno de tARN/RS correspondiente o un par ortogonal activo (por ejemplo, un par de tirosil tARN/RS ortogonal) .
Tirosil-tARN ortogonal: Como se usa en la presente, un tirosil-tARN ortogonal (tirosil-O-tARN) es un tARN que es ortogonal a un sistema de traducción de interés, en donde el tARN es: (1) idéntico o sustancialmente similar a leucil o tirosil-tARN que se presenta de manera estable en la naturaleza, (2) derivado de un leucil o tirosil-tARN que se presenta de manera estable en la naturaleza mediante mutagénesis natural o artificial, (3) derivado mediante cualquier proceso que toma en cuenta una secuencia de leucil o tirosil-tARN tipo silvestre o mutante de (1) o (2), (4), homólogo a un leucil o tirosil-tARN tipo silvestre o mutante; (5) homólogo a cualquier tARN ejemplar que está diseñado como sustrato para una leucil o tirosil-tARN sintetasa en la tabla 5 o (6) una variante conservadora de cualquier tARN ejemplar que está diseñado como sustrato para una leucil o tirosil-tARN sintetasa en la Tabla 5. El leucil o tirosil-tARN puede existir cargado con un aminoácido o en un estado sin cargar. También se comprenderá que un "tirosil-O-tARN" o "leucil-O-tARN" está opcionalmente cargado (aminoacilado) por una sintetasa cognata con un aminoácido diferente de tirosina o leucina, respectivamente, con un aminoácido no natural. Por supuesto, se apreciará que un leucil o tirosil-O-tARN de la invención es usado ventajosamente para insertar esencialmente cualquier aminoácido, ya sea natural o artificial, a un polipéptido creciente, durante la traducción, en respuesta a un codón selector.
Tirosil aminoácido sintetasa ortogonal: Como se usa en la presente, una tirosil aminoácido sintetasa ortogonal (tirosil -O-RS) es una enzima que aminoacila preferiblemente el tirosil-O-tARN con un aminoácido en un sistema de traducción de interés. El aminoácido que la tirosil-O-RS carga sobre el tirosil-O-tARN puede ser cualquier aminoácido, ya sea natural, no natural o artificial y no está limitado en la presente. La sintetasa es opcionalmente la misma como u homologa con una tirosil aminoácido sintetasa que se presenta de manera estable en la naturaleza o la misma como u homologa con una sintetasa diseñada como O-RS en la Tabla 4. Por ejemplo, la O-RS puede ser una variante conservadora de una tirosil-O-RS de la Tabla 4 y/o puede ser por lo menos 50%, 60%, 70%, 80%, 90%, 95%, 98%, 99% o más idéntica en secuencia a una O-RS de la Tabla 5. Similarmente, una leucil aminoácido sintetasa ortogonal (leucil-O-RS) es una enzima que aminoacila preferiblemente el leucil-O- tARN con un aminoácido en un sistema de traducción de interés. El aminoácido que la leucil-O-RS carga sobre el leucil-O-tARN puede ser cualquier aminoácido, ya sea natural, no natural o artificial y no está limitado en la presente. La sintetasa es opcionalmente la misma como u homologa con una leucil aminoácido sintetasa que se presenta de manera estable en la naturaleza o la misma como u homologa con una sintetasa designada como una O-RS en la Tabla 5. Por ejemplo la O-RS puede ser una variante conservadora de una leucil-O-RS de la Tabla 5 y/o puede ser por lo menos 50%, 60%, 70%, 80%, 90%, 95%, 98%, 99% o más idéntica en secuencia a una O-RS de la Tabla 5.
Cognato : el término "cognato" se refiere a componentes que funcionan conjuntamente, por ejemplo un tARN ortogonal y una aminoacil-tARN sintetasa ortogonal. Los componentes pueden también ser denominados como complementarios .
Aminoacila preferiblemente: Como se usa en la presente en referencia a sistemas de traducción ortogonales, una O-RS "aminoacila preferiblemente" un O-tARN cognato cuando la O-RS carga el O-tARN con un aminoácido más eficientemente que carga cualquier tARN endógeno en un sistema de expresión. Esto es, cuando el O-tARN y cualquier tARN endógeno dado están presentes en un sistema de traducción en proporciones molares aproximadamente iguales, la O-RS cargará el O-tARN más frecuentemente que cargará el tARN endógeno. Preferiblemente, la proporción relativa de O-tARN cargado por la O-RS al tARN endógeno cargado por la O-RS es alta, dando como resultado preferiblemente que la O-RS cargue el O-tARN exclusiva o casi exclusivamente, cuando el O-tARN y tARN endógeno están presentes en concentraciones molares iguales en el sistema de traducción. La proporción relativa entre O-tARN y tARN endógeno que es cargada por la O-RS, cuando el O-tARN y la O-RS están presentes a concentraciones molares iguales, es mayor de 1:1, preferiblemente por lo menos aproximadamente 2:1, más preferiblemente 5:1, todavía más preferiblemente 10:1, aún más preferiblemente 20:1, todavía más preferiblemente 50:1, aún más preferiblemente 75:1, todavía más preferiblemente 95:1, 98:1, 99:1, 100:1, 500:1, 1,000:1, 5,000:1 o mayor. La O-RS "aminoacila preferiblemente un O-tARN con un aminoácido no natural" cuando (a) la O-RS aminoacila preferiblemente el O-tARN en comparación con un tARN endógeno y (b) en donde aquella aminoacilaciones específica para el aminoácido no natural, en comparación con la aminoacilación del O-tARN por la O-RS con cualquier aminoácido natural. Esto es, cuando los aminoácidos no naturales y naturales están presentes en cantidades molares iguales en un sistema de traducción que comprende la O-RS y O-tARN la O-RS cargara el O-tARN con el aminoácido no natural más frecuentemente que con el aminoácido natural. Preferiblemente, la proporción relativa de O-tARN cargado con el aminoácido no natural a O-tARN cargado con el aminoácido natural es alta. Más preferiblemente, O-RS carga el O-tARN exclusiva o casi exclusivamente, con el aminoácido no natural. La proporción relativa entre la carga de O-tARN con el aminoácido no natural y la carga de O- tARN con el aminoácido natural, cuando ambos aminoácido natural y no natural están presentes en el sistema de deducción en concentraciones molares iguales, es mayor de 1:1, preferiblemente por lo menos aproximadamente 2:1, más preferiblemente 5:1, todavía más preferiblemente 10:1, todavía más preferiblemente 20:1, todavía más preferiblemente 50:1, aún más preferiblemente 75:1, todavía más preferiblemente 95:1, 98:1, 99:1, 100:1, 500:1, 1,000:1, 5,000:1 o mayor .
Codón selector: El término "codón selector" se refiere a codones reconocidos por el O-tARN en el proceso de traducción y no reconocidos por un tARN endógeno. El bucle anticodón de O-tARN reconoce el codón selector sobre el mARN e incorpora su aminoácido, por ejemplo un aminoácido no natural, en este sitio en el polipéptido. Codones selectores pueden incluir, por ejemplo codones sin sentido, tal como codones de retención, por ejemplo codones ámbar, ocre y ópalo; codones de cuatro o más bases; codones raros; codones derivados de pares de bases naturales o no naturales y/o los semejantes. tARN supresor: Un tARN supresor es un tARN que altera la lectura de un ARN mensajero (mRNA) en un sistema de traducción dado, por ejemplo, al proporcionar a mecanismo para incorporar un aminoácido a una cadena de polipéptido en respuesta a un codón selector. Por ejemplo, un tARN supresor puede leer a través de, por ejemplo, un codón de retención (por ejemplo, un codón ámbar, ocre o codón ópalo) , un codón de cuatro bases, un codón raro, etc.
Actividad de Supresión: Como se usa en la presente, el término "actividad de supresión" se refiere en general a la habilidad de tARN (por ejemplo, un tARN supresor) para permitir la lectura de traducción de un codón (por ejemplo, un codón selector es un codón ámbar o un codón de 4 o más bases) de otra manera daría como resultado la terminación de traducción o mala traducción (por ejemplo, desplazamiento de cuadro) . La actividad de supresión de tARN supresión puede ser expresada como porcentaje de actividad de lectura de traducción observada en comparación con un segundo tARN supresor o en comparación con un sistema de control, por ejemplo un sistema de control que carece de una O-RS. La presente invención proporciona varios métodos mediante los cuales se puede cuantificar la actividad de supresión. El por ciento de supresión de un O-tARN particular y O-RS contra un codón selector (por ejemplo, un codón ámbar) de interés se refiere al porcentaje de actividad de marcador de prueba expresado dado (por ejemplo, LacZ) , que incluye un codón selector, en un ácido nucleico que codifica el marcador de prueba expresado, en un sistema de traducción de interés, en donde el sistema de traducción de interés incluye una O-RS y un O-tARN, en comparación con un constructo de control positivo, en donde el control positivo carece del O-tARN, la O-RS y el codón selector. Así, por ejemplo, si un constructo de marcador de control positivo activo que carece de un codón selector tiene una actividad observada de X en un sistema de traducción dado, en unidades relevantes al análisis del marcador en cuestión, entonces el por ciento de supresión de un constructo de prueba que comprende el codón selector es el porcentaje de X que el constructo de marcador de prueba muestra bajo esencialmente las mismas condiciones ambientales como bajo las cuales el marcador de control positivo fue expresado, excepto que el constructo de marcador de prueba es expresado en un sistema de traducción que también incluye el O-tARN y la O-RS Comúnmente, el sistema de traducción que expresa el marcador de prueba también incluye un aminoácido que es reconocido por la O-RS y el O-tARN Opcionalmente , la medición del por ciento de supresión puede ser refinada por comparación del marcador de prueba con un constructo de marcador de control de "fondo" o "negativo" , que incluye el mismo codón selector como el marcador de prueba, pero en un sistema que no incluye el 0-tARN, O-RS y/o aminoácido relevante reconocido por el O-tARN y/o la O-RS. Este control negativo es útil para normalizar las mediciones de por ciento de supresión para tomar en cuenta el efecto de señal de fondo del marcador en el sistema de traducción de interés. La eficiencia de supresión puede ser determinada mediante cualquier número de análisis conocidos en el arte. Por ejemplo, un análisis de reportero de ß-galactosidasa puede ser usado, por ejemplo un plásmido lacZ derivado (en donde el constructo tiene un codón selector n en la secuencia de ácido nucleico lacZ) es introducido a células de un organismo apropiado (por ejemplo, un organismo en donde los componentes ortogonales pueden ser usados) junto con el plásmido que comprende un O-tARN de la invención. Una sintetasa cognata puede ser también introducida (ya sea como un polipéptido o un polinucleótido que codifica la sintetasa cognata cuando es expresada) . Las células son cultivadas en medios a una densidad deseada por ejemplo, a una OD60o de aproximadamente 0.5 y se efectúan los análisis de ß-galactosidasa, por ejemplo utilizando el equipo de análisis de ß-galactosidasa BetaFluor™ (Novagen) . El por ciento de supresión puede ser calculado como el porcentaje de actividad para una muestra en relación con un control comparable, por ejemplo el valor observado del constructo lacZ derivado, en donde el constructo tiene un codón de sentido correspondiente en una posición deseada en lugar de un codón selector.
Sistema de traducción: el término "sistema de traducción" se refiere a componentes que incorporan un aminoácido a una cadena de polipéptido creciente (proteínas) . Los componentes de un sistema de traducción pueden incluir, por ejemplo ribosomas, tARN, sintetasas, mARN y los semejantes. El O-tARN y/o las O-RS de la invención puede ser agregados o ser parte de un sistema de traducción in vitro o in vivo, por ejemplo, en una célula no eucapóntica, por ejemplo una bacteria (tal como E. coli) o en una célula eucarióntica, por ejemplo, una célula de levadura, una célula mamífera, una célula de planta, una célula de alga, una célula de hongos, una célula de insecto y/o los semejantes.
Aminoácido no natural- Como se usa en la presente, el término "aminoácido no natural" se refiere a cualquier aminoácido, aminoácido modificado y/o análogo de aminoácido, tal como una alqumil aminoácido, que no es uno de los 20 aminoácidos que se presentan de manera estable en la naturaleza comunes o selenocisteína o pirrolisma. Por ejemplo, la figura 1 proporciona 17 aminoácidos no naturales que encuentran uso con la invención.
Derivado de : Como se usa en la presente, el término "derivado de" se refiere a un componente que es aislado de o fabricado utilizando una molécula u organismo especificado o información de la molécula o organismo especificado. Por ejemplo, un polipéptido que es derivado de un segundo polipéptido comprende una secuencia de aminoácido que es idéntica o sustancialmente similar a la secuencia de aminoácidos del segundo polipéptido. En el caso de polipéptidos, las especies derivadas pueden ser obtenidas por ejemplo mediante mutagénesis que se presenta de manera estable en la naturaleza, mutagénesis dirigida artificialmente o mutagénesis aleatoria artificial. La mutagénesis usada para derivar polipéptidos puede ser dirigida intencionalmente o aleatoria intencionalmente. La mutagénesis de un polipéptido para crear un polipéptido diferente derivado del primero puede ser un evento aleatorio (por ejemplo, provocado por infidelidad de polimerasa) y la identificación del polipéptido derivado puede ser afortunada. La Mutagénesis de un polipéptido abarca comúnmente la manipulación del polinucleótido que codifica el polipéptido.
Marcador de selección o filtración positivo: Como se usa en la presente, el término "marcador de selección o filtración positivo" se refiere a un marcador que, cuando está presente, por ejemplo expresado, activado o los semejantes, da como resultado la identificación de una célula, que comprende el rasgo, por ejemplo células con el marcador de selección positivo, de aquellas sin el rasgo.
Marcador de selección negativo o marcador de selección negativo: Como se ilustra en la presente, el término "marcador de selección negativo o marcador de selección" se refiere a un marcador que, cuando está presente, por ejemplo expresado, activado o los semejantes, permite la identificación de una célula que no comprende una propiedad o rasgo seleccionado (por ejemplo, en comparación con una célula que posee la propiedad o rasgo) .
Reportero : Como se usa en la presente, el término "reportero" se refiere a un componente que puede ser usado para identificar y/o seleccionar componentes objetivo de un sistema de interés. Por ejemplo, un reportero puede incluir una proteína, por ejemplo una enzima, que confiere resistencia o sensibilidad antibiótica (por ejemplo ß-lactamasa, cloranfenicol acetiltransferasa (CAT), y los semejantes), un marcador de selección fluorescente (por ejemplo, proteína fluorescente verde (por ejemplo, (GFP) , YFP, EGFP, RFP, etc.), un marcador luminiscente (por ejemplo, una proteína de luciferasa de luciérnaga) , un marcador de selección a base de afinidad, o genes marcadores seleccionables positivos o negativos tales como lacZ, ß-gal/lacZ (ß-galactosidasa), ADH (alcohol deshidrogenasa), his3, ura3 , leu2 , lys2 , o los semej antes .
Eucarionte : Como se usa en la presente, el término "eucarionte" se refiere a organismos pertenecientes al reino de Eucarya. Los eucariontes son distinguibles en general de los procariontes mediante su organización comúnmente multicelular (pero no exclusivamente multicelular, por ejemplo, levadura) , la presencia de un núcleo enlazado a membrana y otros organelos enlazados a membrana, material genético lineal (esto es, cromosomas lineales), la ausencia de operones, la presencia de intrones, coronación de mensajero y poli -A mARN y otras características bioquímicas, tales como una estructura ribosomal distintiva. Organismos eucapónticos incluyen, por ejemplo, animales (por ejemplo, mamíferos, insectos, reptiles, aves, etc.), ciliados, plantas (por ejemplo, monocotiledóneas , dicotiledóneas, algas, etc ), hongos, levaduras, flagelados, microspopdia, protistas, etc Procarionte • Como se usa en la presente, el término "procarionte" se refiere a organismos pertenecientes al reino de Monera (también denominado Procarya) . Los organismos procarióticos son distinguibles en general de los eucariontes por su organización unicelular, reproducción asexual mediante gemación o fisión, la carencia de un núcleo enlazado a la membrana u otros organelos enlazados a la membrana, un cromosoma circular, la presencia de operones, la ausencia de mtrones, coronación de mensaje y poli-A mARN y otras características biológicas, tales como una estructura ribosomal distintiva. Los procaria incluyen subremos Eubacteria y Archaea (algunas veces denominados "Archaebacteria" ) . Las cianobactepas (las algas verde azul) y micoplasma son algunas veces dados clasificaciones separadas bajo el reino de Monera.
Bacterias : Como se usa en la presente, los términos "bacteria" y "eubacteria" se refieren a organismos procarióticos que son distinguibles de Archaea. Similarmente, Archaea se refiere a procariontes que son distinguibles de eubacteria. Las Eubacterias y Archaea pueden ser distinguidas, mediante una diversidad de criterios morfológicos y bioquímicos. Por ejemplo, las diferencias en secuencias de ARN ribosomal, estructura de polimerasa ARN, la presencia o ausencia de intrones, sensibilidad de antibiótico, la presencia o ausencia de peptidoglicanes de pared celular y otros componentes de pared celular, las estructuras ramificadas contra sin ramificar de los lípidos de membrana y/o la presencia/ausencia de histones y proteínas semejantes a histona son usados para asignar un organismo a un Eubacteria o Archaea. Ejemplos de Eubacteria incluyen Escherichia coli, Thermus thermophilics y Bacillus stearother ophilus . Ejemplos de Archaea incluyen Methanococcus jannaschii (Mj ) , Methanosarcina azei (Mm) , Methanobacteriu thermoautotrophicum (Mt) , Methanococcus maripaludis, Methanopyrus kandleri, Halobacterium tales como Haloferax volcanii y Halobacterium NRC-I , Archaeoglobus fulgidus (Af) , Pyrococcus furiosus (Pf) , Pyrococcus horikoshii (Ph) , Pyrobaculum aerophilum, Pyrococcus abyssi, Sulfolobus solfataricus (Ss) , Sulfolobus tokodaii, Aeuropyrum pernix (Ap) , Ther oplasma acidophilum y Thermoplasma volcanium.
Variante conservadora: Como se usa en la presente, el término "variante conservadora," en el contexto de un componente de traducción, se refiere a un componente de traducción, por ejemplo, un O-tARN variante conservador o una O-RS variante conservadora, que se comporta funcionalmente similar a un componente base que la variante conservadora es similar, por ejemplo un O-tARN o O-RS, que tiene variaciones en la secuencia con un O-tARN o O-RS de referencia. Por ejemplo, una O-RS o una variante conservadora de aquella O-RS aminoacilará un O-tARN cognato con un aminoácido no natural, por ejemplo un aminoácido que comprende una porción de N-acetilgalactosamina . En este ejemplo, la O-RS y la O-RS de variante conservadora no tienen las mismas secuencias de aminoácido. La variante conservadora puede tener por ejemplo, una variación, dos variaciones, tres variaciones, cuatro variaciones o cinco o más variaciones en secuencia, en tanto que la variante conservadora todavía sea complementaria con el correspondiente O-tARN u O-RS. En algunas modalidades, una O-RS de variante conservadora comprende una o más sustituciones de aminoácido conservadoras en comparación con la O-RS de la cual fue derivada. En algunas modalidades, una O-RS de variante conservadora comprende una o más sustituciones de aminoácido conservadoras en comparación con la O-RS de la cual fue derivada, y además, retiene actividad biológica de O-RS; por ejemplo, una O-RS de variante conservadora que retiene por lo menos 10% de la actividad biológica de la molécula de O-RS original de la cual fue derivada, o alternativamente, por lo menos 20%, por lo menos 30% o por lo menos 40%. En algunas modalidades preferidas, la O-RS de variante conservadora retiene por lo menos 50% de la actividad biológica de la molécula de O-RS original de la cual fue derivada. Las sustituciones de aminoácido conservadoras de una O-RS variante conservadora pueden ocurrir en cualquier dominio de la O-RS, en las que se incluyen la cavidad de enlace de aminoácido.
Agente de selección o filtración: Como se usa en la presente, el término "agente de selección o filtración" se refiere a un agente que, cuando está presente, permite la selección/filtración de ciertos componentes de una población. Por ejemplo, un agente de selección o filtración puede ser, pero no está limitado a, por ejemplo un nutriente, un antibiótico, una longitud de onda de luz, un anticuerpo, un polinucleótido expresado o los semejantes. El agente de selección se puede hacer variar, por ejemplo por concentración, intensidad, etc.
En respuesta a: Como se usa en la presente, el término "en respuesta a" se refiere a un proceso en el cual un O-tARN de la invención reconoce un codón selector y modera la incorporación del alquinil aminoácido, que es acoplado al tARN, a la cadena de polipéptido creciente.
Codifica : Como se usa en la presente, el término "codifica" se refiere a cualquier proceso mediante el cual la información en una macromolécula polimérica o cadena de secuencia es usada para dirigir la producción de una segunda molécula o cadena de secuencia que es diferente de la primera molécula o cadena de secuencia. Como se usa en la presente, el término es usado ampliamente y puede tener una variedad de aplicaciones. En un aspecto, el término "codificación" describe el proceso de replicación de ADN semiconservadora, en donde una hebra de una molécula de ADN de doble hebra es usada como plantilla para codificar una hebra hermana complementaria recién sintetizada mediante una ADN polimerasa ADN-dependiente . En otro aspecto, el término "codifica" se refiere a cualquier proceso mediante el cual la información en una molécula es usada para dirigir la producción de una segunda molécula que tiene una natural química diferente de la primera molécula. Por ejemplo, una molécula de ADN puede codificar una molécula de ARN (por ejemplo, mediante el proceso de transcripción que incorpora una enzima de ARN polimerasa ADN-dependiente) . También, una molécula de ARN puede codificar un polipéptido, como en el proceso de traducción. Cuando se usa para describir el proceso de traducción, el término "codificación" también se extiende al codón de triplete que codifica un aminoácido. En algunos aspectos, una molécula de ARN puede codificar una molécula de ADN, por ejemplo mediante el proceso de transcripción inversa que incorpora una ADN polimerasa ARN-dependiente . En otro aspecto, una molécula de ADN puede codificar un polipéptido, en donde se comprende que "codifica" como se usa en aquel caso incorpora tanto los procesos de transcripción como traducción.
BREVE DESCRIPCIÓN DE LAS FIGURAS La figura 1A proporciona las estructuras químicas de varios aminoácidos no naturales . La figura 2 proporciona una fotografía de un análisis de SDS-PAGE teñido de la proteína de dominio Z acumulada en presencia (carril 2) o ausencia (carril 3) de p-nitro-L-fenilalanina . El carril 1 contiene marcadores de masa molecular . La figura 3 proporciona un análisis de MALDI-TOF de proteína de dominio Z incorporada a p-nitro-L-fenilalanina . Masa esperada: 7958, 7826 (exclusión de primera metionina) ; observada: 7958, 7828. La figura 4A proporciona espectros de fluorescencia del mutante 22Trp GCN4pl (líneas continuas) y la mezcla de mutantes de 22Trp y 22p-nitro-L-fenilalanina GCN4pl (líneas discontinuas) . La figura 4B proporciona espectros de fluorescencia del mutante 55Trp GCN4pl (línea continua) y la mezcla de mutantes de 55Trp y GCN4pl 22p-nitro-L-fenilalanina (líneas discontinuas) . La figura 5A proporciona la estructura química de 1 , 5-dansilalanina . La figura 5B proporciona un modelo del sitio activo de leucil -tARN sintetasa (LRS) de Thermus ther ophilus con 1 , 5-dansilalanina-AMP-amida enlazada. Los residuos de sitio activo del clon de LRS mutante B8 que son parte de la región aleatorizada son mostrados como barras. La numeración corresponde a LRS de E. coli. Las figuras 6A y 6B describen la estrategia de rediseño del sitio de edición de leucil-tARN sintetasa B8 mutante. La figura 6A proporciona la estructura cristalina de del sitio de edición de la leucil-tARN sintetasa de Ther us thermophil us en complejo con 2 ' - ( 1-norvalil) -amino-2 ' -desoxiadenosina que imita el término 3' de tARN cargado. T252 y V340 son mostrados como barras. La figura 6B proporciona el análisis de análisis de SDS-PAGE de dansilalanina que lleva Ni-NTA purificado con hSOD en posición 33 utilizando el con de leucil-tARN sintetasa B8 y los dos mutantes V338A y T252A. El gel superior es una fotografía de un teñido de Coomassie. El gel inferior una imagen de fluorescencia con excitación a 302 nm y detección de emisión a 520 nm. L = escalera de peso molecular; UAA = aminoácido no natural. Las figuras 7A y 7B describen la eficiencia de supresión ámbar mejorada del clon de leucil-tARN sintetasa de E. coli G2-6, generada por PCR propensa a error y selección. La figura 7A proporciona la estructura cristalina de la leucil-tARN sintetasa Thermus thermophilus (Cusack et al., EMBO J., 19 (10) : 2351-2361 [2000]). El dominio sintético, dominio de edición, aminoácidos aleatorizados en la sintetasa de E. coli homologa y aminoácidos cambiador por PCR propensa a error en el clon G2-6 son todos indicados. La figura 7B proporciona un análisis de SDS-PAGE de teñido de Coomassie de o-nitrobencilserina que lleva hSOD expresada en posición 33 utilizando el clon de sintetasa mutante de leucil-tARN de E. coli 3H11 designado para incorporación de o-nitrobencilcisteína y el clon de leucil-tARN sintetasa de E. coli mutante G2-6 evolucionado para supresión eficiente con o-nitrobencilserina . L = escalera de peso molecular; UAA = aminoácido no natural (oNBS) . La figura 8 proporciona una representación esquemática del fotodesenj aulado (fotoactivación) de la molécula de tirosina enjaulada O- (2 -nitrobencil) -L-tirosina mediante irradiación a 365 nm, dando como resultado la escisión del enlace de CO bencílico y formación rápida del aminoácido desenj aulado . La figura 9 proporciona análisis de curva de concentración que ilustra el fotodesenj aulado observado experimental (fotoactivación) de la molécula de tirosina enjaulada O- (2-nitrobencil) -L-tirosina . El fotodesenj aulado de O- (2-nitrobencil) -L-tirosina fue ilustrado mediante irradiación de una solución de aminoácido 0.2 mM en agua utilizando una lámpara ultravioleta portátil (365 nm a 10 mm de distancia) . Se formaron alícuotas en puntos en el tiempo específicos y analizadas mediante LC/MS. Las concentraciones de 0- (2-nitrobencil) -L-tirosina (cuadrado) y las especies desenjauladas correspondientes (círculos) son mostradas. La figura 10 proporciona un SDS-PAGE teñido con azul de Gelcode de mioglobina 74TAG expresada en presencia o ausencia de O- (2 -nitrobencil) -L-tirosina utilizando tres sintetasas mutantes diferentes. Las figuras HA y 11B proporcionan un análisis de LC-MS/MS de proteína de mioglogina mutante 74TAG que muestra tirosina en posición 74 (péptido tríptico HGVTVLTALGYILK) . Las figuras 12A y 12B proporcionan un análisis de LC-MS/MS similar a aquel descrito en las figuras HA y 11B, excepto en donde el análisis utiliza una O- (2 -nitrobencil) -L-tirosina deuterada, en donde J denota el aminoácido deuterado (péptido tríptico HGVTVLTALGJILK) . La figura 13 proporciona gráficas de superposición de espectros IR de para-cianofenilalanina tomados en THF y agua. La figura 14A proporciona el espectro sustraído del fondo de para-cianofenilalanina (la sólida) ajustado a una curva Gaussiana (líneas discontinuas) . La figura 14B proporciona el espectro restado del fondo de meta-cianofenilalanina (líneas sólidas) ajustado a dos curvas Gaussianas (discontinua) . La figura 15 proporciona un esquema que describe la síntesis de p-etiltiocarbonil-L-fenilalanina . La figura 16 proporciona un resultado de análisis del espectro de masas de MALDI-TOF de proteínas de dominio Z mutantes que contienen aminoácido no natural en la séptima posición. Todos los datos de masas obtenidos experimentalmente están en excelente acuerdo con aquellas masas calculadas de proteínas intactas que tienen ya sea grupos tioéster o ácido carboxílico . La figura 17 proporciona un esquema de proteína mediante ligación química. Las figuras 18A-18D proporcionan perfiles de elusión de LC/MS (primer pico: 3; segundo pico: 2) verificados a 340 nm. La figura 18A muestra un perfil utilizando una mezcla 1:1 de 3 y 2 en MeOH. La figura 18B muestra un perfil utilizando 3 en PBS (pH = 7.4, tiempo de reacción: 1 semana) . La figura 18C muestra un perfil utilizando 3 en PBS (pH = 3.9, tiempo de reacción: 4 días) . La figura 18D muestra un perfil utilizando 3 en solución de H2S04 diluida (pH = 1.9, tiempo de reacción: 12 horas) . Todas las reacciones se efectuaron a temperatura ambiente con agitación constante. La figura 19 proporciona un esquema que describe la síntesis del aminoácido no natural p- (3-oxobutanoil) -L-fenilalanina que contiene dicetona. La figura 20 proporciona un análisis de SDS-PAGE teñido con azul de Gelcode de proteína de dominio Z expresada en presencia o ausencia de p- (3-oxobutanoil) -L-fenilalanina . El análisis muestra la marcación in vitro de la proteína de dominio Z mutante que contiene p- (3 -oxobutanoil) -L-fenilalanina con fluorescein hidrazida. wt = tipo silvestre. La figura 21 proporciona un esquema que describe la síntesis de varios aductos de la porción que contiene dicetona.
DESCRIPCIÓN DETALLADA DE LA INVENCIÓN La invención proporciona soluciones a las limitaciones inherentes de usar un sistema de traducción confinado por los veinte aminoácidos que se presentan de manera estable en la naturaleza. Las soluciones incluyen la incorporación biosintética específica del sitio programada de aminoácidos no naturales con nuevas propiedades a proteínas utilizando sistemas de traducción ortogonales. Se describen en la presente nuevas composiciones (por ejemplo, nuevas aminoácido-tARN sintetasas) y nuevos métodos para la incorporación genética altamente eficiente y específica de una variedad de aminoácidos no naturales a proteínas en respuesta a un codón selector (por ejemplo, el codón sin sentido ámbar, TAG) .
En algunos casos, las cadenas laterales de aminoácido no natural pueden luego ser modificadas específica y regioselectivamente . Debido a las químicas de reacción únicas de estos sustituyentes de aminoácido no natural, las proteínas a las cuales son incorporados pueden ser modificadas con selectividad extremadamente alta. En algunos casos, el grupo reactivo de aminoácido no natural tiene la ventaja de ser completamente extraño a los sistemas in vivo, mejorando mediante esto la selectividad de reacción. En algunos aspectos, las reacciones de modificación pueden ser llevadas a cabo utilizando condiciones de reacción relativamente moderadas que permiten tanto reacciones de conjugación in vitro como in vivo que involucran proteínas y conservando la actividad biológica de proteína. La naturaleza del material de es conjugado a un aminoácido no natural en una proteína no está particularmente limitada y puede ser cualquier entidad deseada, por ejemplo tintes, fluoróforos, agentes de reticulación, derivados de sacárido, polímeros (por ejemplo derivados de polietilenglicol), agentes de fotoreticulación, compuestos citotóxicos, etiquetas de afinidad, derivados de biotina, resinas, perlas, una segunda proteína o polipéptido (o más), polinucleótido (s) (por ejemplo ADN, ARN, etc.), queladores de metal, co-factores, ácidos grasos, carbohidratos y los semejantes . En otros aspectos, el aminoácido no natural incorporado imparten nuevas propiedades biológicas a la proteína a la cual es incorporado. Por ejemplo, el aminoácido no natural puede ser un aminoácido fluorescente, un aminoácido fotoenj aulado o fotoactivable, un aminoácido que puede participar en un par de FRET como donador o aceptor, un aminoácido redox-activo, un aminoácido quelante de metal, etc. En algunos aspectos, para demostrar (pero no limitar) la presente invención, la revelación en la presente demuestra que la porción de aminoácido no natural puede ser incorporada a una proteína modelo. No se pretende que la incorporación del aminoácido no natural esté limitada a tal proteína modelo. De la presente revelación, será claro que la incorporación de un aminoácido no natural a cualquier proteína dada de interés es ventajosa para una amplia variedad de proteínas para uso en propósitos terapéuticos y de investigación. Se han desarrollado nuevos pares de tARN/aminoacil-tARN sintetasa ortogonales que funcionan en eubacterias y levaduras para incorporar específicamente en el sitio aminoácidos no naturales (por ejemplo, los aminoácidos no naturales provistos en la figura 1) en respuesta a codones selectores. Brevemente, se han identificado nuevos mutantes de la tirosil-tARN sintetasa de Methanococcus jannaschii y la leucil-tARN sintetasa de Escherichia coli que cargan selectivamente un tARN supresor con un aminoácido no natural ya sea en células huésped de E. coli o células huésped de levadura, respectivamente. Estos pares de tARN sintetasa desarrollados pueden ser usados para incorporar específicamente en el sitio el respectivo aminoácido no naturales a una proteína. La incorporación del aminoácido no natural a la proteína puede ser programada para ocurrir en cualquier posición deseada al diseñar el polmucleótido que codifica la proteína de interés para contener un codón selector que señala la incorporación del aminoácido no natural .
TECNOLOGÍA DE tARN/AMINOACIL- tARN SINTETASA ORTOGONAL Un entendimiento de las nuevas composiciones y métodos de la presente invención es facilitado por un entendimiento de las actividades asociadas con pares de tARN ortogonal y ammoacil-tARN smtetasa ortogonal Discusiones de tecnologías de tARN ortogonal y ammoacil-tARN smtetasa se pueden encontrar, por ejemplo, en publicaciones internacionales WO 2002/085923, WO 2002/086075, WO 204/09459, WO 2005/019415, WO 2005/007870 y WO 2005/007624. Véase también, Wang and Schultz "Expandmg the Genetic Code" , Angewandte Chemie Int. Ed. , 44(l):34-66 (2005), el contenido del cual es incorporado en la presente por referencia en su totalidad. Con el fin de agregar aminoácidos no naturales reactivos adicionales al código genético, se necesitan nuevos pares ortogonales que comprenden una aminoacil-tARN sintetasa y un tARN apropiado que puedan funcionar eficientemente en la maquinaria de traducción del huésped, pero que sean "ortogonales" al sistema de traducción en cuestión, lo que significa que funcionen independientemente de las sintetasas y tARN endógenos al sistema de traducción. Las características deseadas del par ortogolo incluyen tARN que descodifique o reconozca solamente un codón específico, por ejemplo un codón selector, que no es descodificado por cualquier tARN endógeno, una ammoacil-tARN smtetasa que ammoacile preferiblemente (o "cargue") su tARN cognato con solamente un aminoácido no natural específico. El O-tARN tampoco es comúnmente ammoacilado por smtetasas endógenas. Por ejemplo, en E. coli, un par ortogonal incluirá una aminoacil- tARN smtetasa que no reacciona de manera cruzada con cualquiera de los tARN endógenos, por ejemplo, que son 40 en E. coll y un tARN ortogonal que no es ammoacilado por cualquiera de las smtetasas endógenas, por ejemplo, de las cuales son 21 en E. coli . La invención descrita en la presente proporciona pares ortogonales para la codificación genética e incorporación de aminoácidos no naturales a proteínas en una eubacteria, por ejemplo una E. coli o en levadura, en donde los componentes ortogonales no reaccionan de manera cruzada con los componentes de E. coli o de levadura endógenos de la maquinaria de traducción de la célula huésped, pero reconocen el aminoácido no natural deseado y lo incorporan a proteínas en respuesta al codón selector (por ejemplo, un codón sin sentido ámbar, TAG) . Los componentes ortogonales provistos por la invención incluyen aminoacil-tARN sintetasas ortogonales derivadas de tirosil tARN sintetasa de Methanococcus jannaschii y el supresor ámbar de tirosil tARNCUA mutante, que funcionan como un par ortogonal en una célula huésped eubacteriana . La invención también proporciona componentes ortogonales derivados de leucil-tARN-sintetasa de E. coli y un supresor ámbar de leucil tARNCUA de E. coli mutante, que funcionan como par ortogonal en una célula huésped de levadura. En estos sistemas, las aminoacil-tARN sintetasas mutantes aminoacilan el tARN supresor con su respectivo aminoácido no natural y no con ninguno de los veinte aminoácidos comunes. La invención proporciona composiciones y métodos para identificar y producir pares de tARN-aminoacil - tARN sintetasa ortogonales adicionales, por ejemplo pares de 0-tARN/O-RS que pueden ser usados para incorporar un aminoácido no natural a una proteína. Un par de O-ARNA/O-RS de la invención es capaz de moderar la incorporación de un aminoácido no natural, por ejemplo, un aminoácido no natural mostrado en la figura 1, a una proteína que es codificada por un polinucleótido, en donde el polinucleótido comprende un codón selector que es reconocido por el O-tARN, por ejemplo, in vivo. El bucle anticodón del O-tARN reconoce el codón selector sobre un mARN e incorpora su aminoácido, por ejemplo un aminoácido no natural mostrado en la figura 1, en este sitio en el polipéptido. En general, una aminoacil-tARN sintetasa ortogonal de la invención aminoacila preferiblemente (o carga) su O-tARN con solamente un aminoácido no natural específico. La habilidad de incorporar un aminoácido no natural (por ejemplo, un aminoácido no natural provisto en la figura 1) específicamente en el sitio a proteínas puede facilitar el estudio de proteínas, también como habilitar el diseño de proteínas con nuevas propiedades. Por ejemplo, la expresión de proteínas que contienen uno o más aminoácidos no naturales puede facilitar el estudio de proteínas mediante marcación específica, alterar la función catalítica de enzimas, mejorar la actividad biológica o reducir la actividad cruzada a un sustrato, reticulación de una proteína con otras proteínas, moléculas pequeñas o biomoléculas, reducir o eliminar la degradación de proteínas, mejorar la vida media de proteínas in vitro (por ejemplo, mediante pegilación u otras modificaciones de sitios reactivos introducidos), etc. tARN ORTOGONAL/AMINOACIL-tARN SINTETASAS ORTOGONALES Y PARES DE LOS MISMOS Los sistemas de traducción que son apropiados para fabricar proteínas que incluyen uno o más aminoácidos no naturales son descritas por ejemplo, en los números de publicación internacional WO 2002/086075, intitulado "METHODS AND COMPOSITION FOR THE PRODUCTION OF ORTHOGONAL tRNA-AMINO ACYL-tRNA SYNTHETASE PAIRS;" WO 2002/085923, intitulado "IN VIVO INCORPORATION OF UNNATURAL AMINO ACIDS;" y WO 2004/094593, intitulado "EXPANDING THE EUKARYOTIC GENETIC CODE ; " WO 2005/019415, presentado el 7 de julio de 2004; WO 2005/007870, presentado el 7 de julio de 2004 y WO 2005/007624, presentado el 7 de julio de 2004. Cada una de estas solicitudes es incorporada en la presente por referencia en su totalidad. Véase también Wang y Schultz "Expanding the Genetic Code" , Angewandte Chemie Int. Ed . , 44(1): 34-66 (2005), el contenido del cual es incorporado por referencia en su totalidad. Tales sistemas de traducción comprenden en general células (que pueden ser células no eucariónticas tales como E. coli o células eucariónticas tales como levadura) que incluyen un tARN ortogonal (O-tARN) , una aminoacil tARN sintetasa ortogonal (0-RS) , y un aminoácido no natural, en donde la O-RS aminoacila el O-tARN con el aminoácido no natural. Un par ortogonal de la invención incluye un O-tARN, por ejemplo, un tARN supresor, un tARN de desplazamiento de cuadro o los semejantes y una O-RS. También se proporcionan componentes individuales en la invención. En general , cuando un par ortogonal reconoce un codón selector y carga un aminoácido en respuesta al codón selector, se dice que el par ortogonal "suprime" el codón selector. Esto es, un codón selector que no es reconocido por la máquina endógena del sistema de traducción (por ejemplo, de la célula) no es traducido ordinariamente, lo que puede dar como resultado bloqueo de producción de un polipéptido que de otra manera sería traducido del ácido nucleico. Un O-tARN de la invención reconoce un codón selector e incluye por lo menos aproximadamente, por ejemplo, una 45%, una 50%, una 60%, una 75%, una 80%, o un 90% o más eficiencia de supresión en presencia de una sintetasa cognata en respuesta a un codón selector en comparación con la eficiencia de supresión de un 0-tARN que comprende o es codificado por una secuencia de polinucleótidos como se resume en el listado de secuencias en la presente. La O-RS aminoacila el O-tARN con un aminoácido no natural de interés. La célula utiliza el par de 0-tARN/O-RS para incorporar el aminoácido no natural a una cadena de polipéptido creciente, por ejemplo vía un ácido nucleico que comprende un polinucleótido que codifica un polipéptido de interés, en donde el polinucleótido comprende un codón selector que es reconocido por el O-tARN. En ciertos aspectos deseables, la célula puede incluir un par de O-tARN/0-RS adicional, en donde el O-tARN adicional es cargado por la O-RS adicional con un aminoácido no natural diferente. Por ejemplo, uno de los 0-tARN puede ser un codón de cuatro bases y el otro puede reconocer un codón de retención. Alternativamente, múltiples codones de retención diferentes o múltiples codones de cuatro bases diferentes pueden reconocer específicamente diferentes codones selectores. En ciertas modalidades de la invención, una célula tal como una célula de E. coli o una célula de levadura que incluye un tARN ortogonal (O-tARN), una aminoacil-tARN sintetasa ortogonal (O-RS) , un aminoácido no natural y un ácido nucleico que comprende un polinucleótido que codifica un polipéptido de interés, en donde el polinucleótido comprende un codón selector que es reconocido por el O-tARN. El sistema de traducción puede también ser un sistema libre de células, por ejemplo, cualquiera de una variedad de sistemas de transcripción/traducción "in vitro" disponibles comercialmente en combinación con un par de O-tARN/O-RS y un aminoácido no natural como se describe en la presente. En una modalidad, la eficiencia de supresión de la 0- RS y el O-tARN conjuntamente es de aproximadamente, por ejemplo, 5 veces, 10 veces, 15 veces, 20 veces, o 25 veces o mayor que la eficiencia de supresión de O-tARN que carece de la O-RS. En un aspecto, la eficiencia de supresión de la O-RS y el O-tARN conjuntamente es de por lo menos aproximadamente, por ejemplo, 35%, 40%, 45%, 50%, 60%, 75%, 80%, o 90% o más de la eficiencia de supresión de un par de sintetasa ortogonal como se resume en los listados de secuencias en la presente. Como se indica, la invención incluye opcionalmente múltiples pares de O-tARN/O-RS en una célula u otro sistema de traducción, que permite la incorporación de más de un aminoácido no natural. Por ejemplo, la célula puede incluir además un par de O-tARN/O-RS diferente adicional y un segundo aminoácido no natural, en donde este O-tARN adicional reconoce un segundo codón selector y esta O-RS adicional aminoacila preferiblemente el O-tARN con el segundo aminoácido no natural. Por ejemplo, una célula que incluye un par de O-tARN/O-RS (en donde el O-tARN reconoce, por ejemplo, un codón selector ámbar), puede comprender además un segundo par ortogonal, en donde el segundo O-tARN reconoce un codón selector diferente, por ejemplo, un codón ópalo, un codón de cuatro bases o los semejantes. Deseablemente, los diferentes pares ortogonales son derivados de diferentes fuentes, lo que puede facilitar el reconocimiento de diferentes codones selectores. El O-tARN y/o la O-RS se pueden presentar de manera estable en la naturaleza, o pueden por ejemplo ser derivados mediante mutación de un tARN y/o RS que se presente de manera estable en la naturaleza, por ejemplo al generar bibliotecas de tARN y/o bibliotecas de RS , a partir de cualquiera de una variedad de organismos y/o al utilizar cualquiera de una variedad de estrategias de mutación disponibles. Por ejemplo, una estrategia para producir un par de tARN/aminoacil-tARN sintetasa ortogonal involucra importar un par de tARN/sintetasa heterólogo (a la célula huésped) de por ejemplo, una fuente diferente a la célula huésped o múltiples fuentes, a la célula huésped. Las propiedades de la sintetasa heteróloga candidata incluye, por ejemplo que no carga cualquier tARN de célula huésped y las propiedades del tARN heterólogo candidato incluyen, por ejemplo, que no es aminoacilado mediante cualquier sintetasa de célula huésped. Además el tARN heterólogo es ortogonal a todas las sintetasas de células huésped . Una segunda estrategia para generar un par ortogonal involucra generar bibliotecas mutantes de la cuales filtrar y/o seleccionar un O-tARN o O-RS. Estas estrategias pueden también ser combinadas . tARN ortogonal (O-tARN) un tARN ortogonal (O-tARN) de la invención modera deseablemente la incorporación de un aminoácido no natural a una proteína que es codificada por un polinucleótido que comprende un codón selector que es reconocido por el O-tARN, por ejemplo in vivo o in vitro. En ciertas modalidades, un O-tARN de la invención incluye por lo menos, por ejemplo, aproximadamente 45%, 45%, 50%, 60%, 75%, 80%, o 90% o más eficiencia de supresión en presencia de una sintetasa cognata en respuesta a un codón selector en comparación con un O-tARN que comprende o es codificado por una secuencia de polinucleótidos como se resume en las secuencias de O-tARN sen el estado de secuencias en la presente.
La eficiencia de supresión puede ser determinada mediante cualquiera de un número de análisis conocidos en el arte. Por ejemplo, se puede usar un análisis de reportero de ß-galactosidasa, por ejemplo un plásmido lacZ derivado (en donde el constructo tiene un codón selector n en la secuencia de ácido nucleico) es introducido a células de un organismo apropiado (por ejemplo, un organismo en donde se pueden usar los componentes ortogonales) junto con un plásmido que comprende un O-tARN de la invención. Una sintetasa cognata puede también ser introducida (ya sea como un polipéptido o un polinucleótido que codifica la sintetasa cognata cuando es expresado) . Las células son cultivadas en medios a una densidad deseada por ejemplo, a una OD60o de aproximadamente 0.5, y se efectúan los análisis de ß-galactosidasa, por ejemplo, utilizando el que de análisis de ß-galactosidasa BetaFluor™ (Novagen) . El por ciento de supresión puede ser calculado como el porcentaje de actividad para una muestra en relación con un control comparable, por ejemplo, el valor observado del constructo de lacZ derivado, en donde el constructo tiene un codón de sentido correspondiente en posición deseada en lugar de un codón selector. Ejemplos de O-tARN de la invención son resumidos en el listado de secuencias de la presente. Véase también, las tablas, ejemplos y figuras en la presente para secuencias de 0-tARN y moléculas de O-RS ejemplares. Véase también, la sección intitulada "Ácido nucleico y secuencia de polipéptido y variantes" en la presente. En una molécula de ARN, tal como una mARN de O-RS, o molécula de O-tARN, timina (T) es reemplazada con uracilo (U) en relación con una secuencia dada (o viceversa para un ADN de codificación) o un complemento de la misma. Modificaciones adicionales a las bases pueden también estar p presentes . La invención también incluye variaciones conservadoras de O-tARN correspondientes a O-tARN particulares en la presente. Por ejemplo, variantes conservadoras de O-tARN incluyen aquellas moléculas que funcional como el O-tARN particular, por ejemplo como en el listado de secciones correspondiente y que mantienen la estructura en forma de L de tARN en virtud de la auto-complementareidad apropiada, pero que no tienen una secuencia idéntica a aquellos, por ejemplo, en el listado de secuencias, figuras o ejemplos en la presente (y deseablemente, son diferentes a las moléculas de tARN de tipo silvestre) . Véase también, la sección en la presente intitulada "Ácidos nucleicos y secuencia de polipéptidos y variantes" . La composición que comprende un O-tARN puede incluir además una aminoacil-tARN sintetasa ortogonal (O-RS) , en donde la O-RS aminoacila preferiblemente el O-tARN con un aminoácido no natural. En ciertas modalidades, una composición que incluye un O-tARN puede incluir además un sistema de traducción (por ejemplo, in vitro o in vivo) . Un ácido nucleico que comprende un polinucleótido que codifica un polipéptido de interés, en donde el polinucleótido comprende un codón selector que es reconocido por el O-tARN o una combinación de uno o más de estos puede también estar presente en la célula. Véase también, la sección en la presente intitulada "aminoacil-tARN sintetasas ortogonales" . Métodos para producir un tARN ortogonal (O-tARN) también un aspecto de la invención. Un O-tARN producido por el método es también un aspecto de la invención. En ciertas modalidades de la invención, los O-tARN pueden ser producidos al generar una biblioteca de mutantes. La biblioteca de tARN mutantes puede ser generada utilizando varias técnicas de mutagénesis conocidas en el arte. Por ejemplo, los tARN mutantes pueden ser generados mediante mutaciones específicas del sitio, mutaciones de punto aleatorio, recombinación homologa, redistribución de ADN u otros métodos de mutagénesis recursivos, construcción quimérica o cualquier combinación de los mismos, por ejemplo, del O-tARN ejemplar de la tabla 5. Mutaciones adicionales pueden ser introducidas en una(s) posición(es) específica (s) , por ejemplo en una(s) posición (es) no conservadora (s) o en una posición conservadora en una(s) posición (es) aleatorizada (s) o una combinación de ambas en un bucle o región deseado de un tARN, por ejemplo, un bucle anticodón, el tallo aceptor, brazo o bucle D, bucle variable, brazo o bucle TPC, otras regiones de la molécula de tARN o una combinación de los mismos. Comúnmente, las mutaciones en un tARN incluyen mutación del bucle anticodón de cada miembro de la biblioteca de los tARN mutante para permitir el reconocimiento de un codón selector. El método puede incluir además agregar secuencias adicionales al O-tARN. Comúnmente, un O-tARN posee una mejora de ortogonalidad por un organismo deseado en comparación con el material de partida, por ejemplo la pluralidad de secuencias de tARN, en tanto que conserva su afinidad hacia una RS deseada. Los métodos incluyen opcionalmente analizar la similaridad (y/u homología inferida) de secuencias de tARN y/o aminoacil-tARN sintetasas para determinar candidatos potenciales para un O-tARN, O-RS y/o pares de los mismos, que parecen ser ortogonales para un organismo específico. Programas de computadora conocidos en el arte y descritos en la presente pueden ser usados para el análisis, por ejemplo BLAST y programas de apilado pueden ser usados. En un ejemplo, para escoger componentes de traducción ortogonales potenciales para uso en E. coli, una sintetasa y/o un tARN es escogido que no muestra similaridad de secuencia estrecha a organismos eubacterianos . Comúnmente, un O-tARN es obtenido al someter por ejemplo a selección negativa, una población de células de una sola especie, en donde las células comprenden un miembro de la pluralidad de O-tARN potenciales. La selección negativa elimina células que comprenden un miembro de la biblioteca de O-tARN potenciales que es aminoacilado por una aminoacil-tARN sintetasa (RS) que es endógena a la célula. Esto proporciona un cúmulo de tARN que son ortogonales a la célula de la primera especie. En ciertas modalidades, en la selección negativa, un(os) codón(es) selector (es) es (son) introducido (s) a un polinucleótido que codifica un marcador de solución negativo, por ejemplo una enzima que confiere resistencia a antibiótico, por ejemplo ß-lactamasa, una enzima que confiere un producto detectable, por ejemplo ß-galactosidasa, cloranfenicol acetiltransferasa (CAT), por ejemplo, un producto tóxico, tal como barnasa, en una posición no esencial (por ejemplo, que todavía produce una barnasa funcional), etc. La filtración/selección se hace opcionalmente al cultivar la población de células en presencia de un agente selectivo (por ejemplo, un antibiótico, tal como ampicilina) . En una modalidad, se hace variar la concentración de la selección. Por ejemplo, para medir la actividad de tARN supresores, se usa un sistema de selección que está basado en la supresión in vivo del codón selector, por ejemplo mutaciones sin sentido (por ejemplo retención) o mutaciones de desplazamiento de cuadro introducidas a un polinucleótido que codifica un marcador de selección negativo, por ejemplo un gen para ß-lactamasa (bla) . Por ejemplo, variantes de polinucleótido, por ejemplo variantes bla, con un codón selector en una cierta posición (por ejemplo A184) son construidas. Células, por ejemplo bacterias, son transformadas con estos polinucleótidos. En el caso de un tARN ortogonal, que no puede ser cargado eficientemente por sintetasas de E. coli endógeno, la resistencia al antibiótico, por ejemplo resistencia a ampicilina, debe ser aproximadamente o menor que aquella para una bacteria transformada sin plásmido. Si el tARN no es ortogonal o si una sintetasa heteróloga capaz de cargar el tARN es co-expresada en el sistema, se observará un nivel más alto de resistencia a antibiótico, por ejemplo ampicilina. Las células, por ejemplo bacterias, son escogidas que no son aptas para crecer sobre cajas de agar de LB con concentraciones de antibiótico y aproximadamente igual a las células transformadas sin plásmido. En el caso de un producto tóxico (por ejemplo, ribonucleasa o barnasa) , cuando un miembro de la pluralidad de tARN potenciales es aminoacilado por el huésped endógeno, por ejemplo sintetasas de Escheri chia coli (esto es, no es ortogonal al huésped, por ejemplo, sintetasas de Escherichia coli ) , el codón selector es suprimido y el producto polinucleótido tóxico producido conduce a muerte de la célula. Las células que albergan tARN ortogonales o tARN no funcionales sobreviven. En una modalidad, el cúmulo de tARN que son ortogonales a un organismo deseado son luego sometidas a una selección positiva en la cual un codón selector es colocado en un marcador de selección positivo, por ejemplo codificado mediante un gen resistente a fármacos, tal como un gen de ß-lactamasa. La selección positiva es efectuada sobre una célula que comprende un polinucleótido que codifica o que comprende un miembro del cúmulo de tARN que son ortogonal a la célula, un polinucleótido que codifica un marcador de selección positivo y un polinucleótido que codifica una RS cognata. En ciertas modalidades, la segunda población de células comprende células que no fueron eliminadas por la selección negativa. Los polinucleótidos son expresados en la célula y la célula es cultivada en presencia de una gente de selección, por ejemplo ampicilina. Luego se seleccionan tARN en cuanto a su habilidad para hacer aminoacilados por la sintetasa cognata coexpresada y para insertar un aminoácido en respuesta a este codón selector. Comúnmente, estas células muestran una mejora en eficiencia en supresión en comparación con células que albergan tARN(s) no funcionales o tARN que no pueden ser reconocidos eficientemente por la sintetasa de interés. La célula que alberga el tARN no funcionales o tARN que no son reconocidos eficientemente por la sintetasa de interés son sensibles al antibiótico. Por consiguiente, tARN que: (i) no son substratos para el huésped endógeno, por ejemplo Escherichia coli , sintetasas; (ii) pueden ser aminoacilados por la sintetasa de interés y (iii) son funcionales en traducción, sobre viven a ambas selecciones. Así, el mismo marcador puede ser ya sea un marcador positivo o un marcador negativo, dependiendo en el contexto en los cuales seleccionado. Esto es, el marcador es un marcador positivo si es seleccionado para, pero un marcador negativo si es seleccionado contra. La severidad de la selección, por ejemplo la selección positiva, la selección negativa o tanto la selección positiva como negativa, en los métodos descritos anteriormente, incluye opcionalmente hacer variar la severidad de selección, por ejemplo, debido que la barnasa es una proteína extremadamente tóxico, la severidad de la selección negativa puede ser controlada al introducir diferentes números de codones selectores en el gen de barnasa y/o al usar un promotor inducible. En otro ejemplo, la concentración de la gente de selección o filtración se hace variar (por ejemplo, concentración de ampicilina) . En un aspecto de la invención, la severidad se hace variar debido a que la actividad deseada puede ser baja durante las rondas prematuras. Así, se aplican criterios de selección menos severos en las rondas prematuras y se aplican criterios más severos en rondas de selección posteriores. En ciertas modalidades, la selección negativa, la selección positiva o tanto la selección negativa como la selección positiva puede ser repetidas múltiples veces. Múltiples marcadores de selección negativos diferentes, marcadores de selección positivos o tanto marcadores de selección negativos como positivos o pueden ser usados. En ciertas modalidades, el marcador de selección positivo y negativo pueden ser los mismos. Otros tipos de selecciones/filtraciones pueden ser usados en la invención para producir componentes de traducción ortogonales, por ejemplo un O-tARN, una O-RS y un par de 0-tARN/0-RS que carga un aminoácido no natural en respuesta a un codón selector Por ejemplo, el marcador de selección negativo, el marcador de selección positivo o ambos marcadores de selección positivos, negativos pueden incluir un marcador que fluoresce o cataliza una reacción luminiscente en presencia de un reactivo apropiado En otra modalidad, un producto del marcador es detectado mediante clasificación de células activada por fluorescencia (FACS) o mediante luminiscencia Opcionalmente , el marcador incluye un marcador de selección a base de afinidad. Véase también Francisco, J A , et al , (1993) Production and fl uorescence -activa ted cell sorting of Eschep chia coll expressmg a functional antibody fragment on the external surface Proc Nati Acad Sci U S A. 90:10444-8 Métodos adicionales para producir un tARN ortogonal recombinante se pueden encontrar, por ejemplo en las publicaciones de solicitud Internacionales WO 2002/086075, intitulada "METHODS AND COMPOSITIONS FOR THE PRODUCTION OF ORTHOGONAL tRNA AMINOACYL-tRNA SYNTHETASE PAIRS;" WO 2004/094593, intitulado "EXPANDING THE EUKARYOTIC GENETIC CODE;" y WO 2005/019415, presentado el 7 de julio del 2004. Véase también Forster et al., (2003) Programming peptidomimetic synthetases by translating genetic codes designed de novo PNAS 100 (11) ¡6353-6357; and, Feng et al . , (2003), Expanding tRNA recogni tion of a tRNA syn the tase by a single amino acid change, PNAS 100(10): 5676-5681.
Aminoacil-tARN sintetasa ortogonal (O-RS) Una O-RS de la presente invención aminoacila preferiblemente un O-tARN con un aminoácido no natural, tanto in vitro como in vivo. Una O-RS de la invención puede ser provista al sistema de traducción, por ejemplo, una célula, mediante un polipéptido que incluye una O-RS y/o mediante un polinucleótido que codifica una O-RS o una porción de la misma. Por ejemplo, una O-RS ejemplar comprende una secuencia de aminoácido como se resume en el listado de secuencias y ejemplos en la presente, o una variación conservadora de las mismas. En otro ejemplo, una O-RS, o una porción de la misma es codificada por un secuencia de polinucleótidos que codifica un aminoácido que comprende la secuencia en el listado de secuencias o ejemplos en la presente o una secuencia de polinucleótidos complementaria de la misma. Véase, por ejemplo, las tablas y ejemplos en la presente para secuencias de moléculas de O-RS ejemplares. Véase también, la sección intitulada "Ácido nucleico y secuencia de polipéptido y variantes" en la presente. Métodos para identificar una aminoacil-tARN sintetasa ortogonal (O-RS) , por ejemplo una O-RS, para uso con un O-tARN, son también son un aspecto de la invención. Por ejemplo, un método que incluye someter a selección, por ejemplo selección positiva, una población de células de una primera especie, en donde las células comprenden individualmente: (1) un miembro de una pluralidad de aminoacil-tARN sintetasas (RS) , (por ejemplo, la pluralidad de RS pueden incluir RS mutantes, RS derivadas de una especie diferente a la primera especie o tanto RS mutantes como RS derivada de una especie diferente a la primera especie) ; (2) el tARN ortogonal (O-tARN) (por ejemplo, de una o más especies) y (3) un polinucleótido que codifica un marcador de selección (por ejemplo, positivo) y que comprende por lo menos un codón selector. Las células son seleccionadas o filtradas para aquellas que muestran una mejora en eficiencia de supresión en comparación con células que carecen o con una cantidad reducida del miembro de la pluralidad de RS . La eficiencia de Supresión puede ser medida mediante técnicas conocidas en el arte y como se describe en la presente. Células que tienen una mejora en eficiencia de supresión comprenden una RS activa que aminoacila el O-tARN. Un nivel de aminoacilación (in vitro o in vivo) mediante la RS activa de un primer conjunto de tARN de la primera especie es comparada con el nivel de aminoacilación (ín vitro o ín vivo) por la RS activa de un segundo conjunto de tARN de la segunda especie. El nivel de ammoacilación puede ser determinado mediante una sustancia detectable (por ejemplo, un aminoácido no natural marcado) . La RS activa que ammoacila más eficientemente el segundo conjunto de tARN en comparación con el primer conjunto de tARN es comúnmente seleccionada, proporcionando mediante esto una ammoacil- tARN sintetasa ortogonal eficiente (optimizada) para uso con el O-tARN. Una O-RS, identificada mediante el método, es también un aspecto de la invención. Cualquiera de una diversidad de análisis pueden ser usados para determinar la ammoacilación Estos análisis pueden ser efectuados m vitro o m vivo. Por ejemplo, análisis de aminoacilación m vitro son descritos en, por ejemplo Hoben and Solí (1985) Methods Enzymol . 113.55-59. la ammoacilación puede también ser determinada al utilizar un reportero junto con componentes de traducción ortogonales y detectar el reportero en un célula que expresa un polinucleótido que comprende por lo menos un codón selector que codifica una proteína. Véase también, WO 2002/085923, intitulado "IN VIVO INCORPORATION OF UNNATURAL AMINO ACID;" y WO 2004/094593, intitulado "EXPANDING THE EUKARYOTIC GENETIC CODE" . La O-RS identificada puede ser manipulada adicionalmente para alterar la especificidad del sustrato por la smtetasa, de tal manera que solo un aminoácido no natural deseado, pero no ninguno de los veinte aminoácidos comunes, son cargados al O-tARN. Métodos para generar una aminoacil-tARN sintetasa ortogonal con una especificidad de sustrato por un aminoácido no natural incluyen mutación de la sintetasa, por ejemplo en el sitio activo en la sintetasa, en el sitio de mecanismo de edición en la sintetasa, en diferentes sitios al combinar diferentes dominios de sintetasas o los semejantes y aplicar un proceso de selección. Se usa una estrategia que está basada en la combinación de una selección positiva seguida por una selección negativa. En la selección positiva, la supresión del codón selector introducido en una(s) posición (es) no esencial de un marcador positivo permite que las células sobrevivan bajo presión de selección positiva. En presencia tanto de aminoácidos naturales como no naturales, los sobrevivientes codifican así sintetasas activas que cargan el tARN supresor ortogonal ya sea con un aminoácido natural o no natural. En la selección negativa, la supresión de un codón selector introducida en una(s) posición (es) no esencial de un marcador nativo remueve sintetasas con especificidades de aminoácido natural . Los sobrevivientes de la selección negativa y positiva codifican sintetasas que aminoacilan (cargan) el tARN supresor ortogonal con aminoácidos no naturales solamente. Luego estas sintetasas pueden ser sometidas adicionalmente a mutagénesis adicionalmente, por ejemplo redistribución de ARN u otros métodos de mutagénesis recursivos.
Una biblioteca de O-RS mutantes puede ser generada utilizando varias técnicas de mutagénesis conocidas en el arte. Por ejemplo, las RS mutantes pueden ser generadas mediante mutaciones específicas del sitio, mutaciones del punto aleatorio, recombinación homologa, redistribución de ADN u otros métodos de mutagénesis recursivos, construcción quimérica o cualquier combinación de los mismos. Por ejemplo, una biblioteca de RS mutantes puede ser producida a partir de dos o más de otras "sub-bibliotecas" más pequeñas, menos diversas. Bibliotecas Quiméricas de RS son también incluidas en la invención. Se debe notar que las bibliotecas de tARN sintetasas de varios organismos (por ejemplo, microorganismos tal como eubacteria o archaebacteria) tales como bibliotecas que comprenden diversidad natural (véase, por ejemplo, Patente estadounidense No. 6,238,884 expedida a Short et al; Patente estadounidense No. 5,756,316 expedida a Schallenberger et al; Patente estadounidense No. 5,783,431 expedida a Petersen et al; Patente estadounidense No. 5,824,485 expedida a Thompson et al; Patente estadounidense No. 5,958,672 expedida a Short et al) son construidas opcionalmente y seleccionadas cuanto a pares ortogonales . Una vez que las sintetasas son sometidas a la estrategia de selección/filtración positiva y negativa, estas sintetasas pueden luego ser sometidas a mutagénesis adicional. por ejemplo, un ácido nucleico que codifica la O-RS puede ser aislado; un conjunto de polinucleótidos que codifican O-RS mutadas (por ejemplo, mediante mutagénesis aleatoria, mutagénesis especificas del sitio, recombinación o cualquier combinación de las mismas) pueden ser generadas a partir del ácido nucleico y estas etapas individuales o una combinación de estas etapas pueden ser repetidas hasta que se obtiene una O-RS mutada que aminoacila preferiblemente el O-tARN con el aminoácido no natural, por ejemplo un alquinil aminoácido. En un aspecto de invención, las etapas son efectuadas múltiples veces, por ejemplo por lo menos dos veces. Niveles adicionales de severidad de selección/filtración pueden también ser usados en los métodos de la invención, para producir O-tARN, O-RS o pares de los mismos. La severidad de selección o filtración se puede hacer variar en una o ambas etapas del método para producir una O-RS. Esto podría incluir, por ejemplo, hacer variar la cantidad de agente de selección/filtración que es usada, etc. También se puede efectuar rondas adicionales de selecciones positivas y/o negativas. La selección o filtración puede también ser uno o más de un cambio en permeabilidad de aminoácido, un cambio en eficiencia de traducción, cambio en fidelidad de traducción, etc. Comúnmente, el uno o más cambios está basado en una mutación en uno o más genes en un organismo en el cual se usa un par de tARN- tARN sintetasa ortogonal para producir proteína. Detalles generales adicionales para producir O-RS y alterar la especificidad del sustrato de la sintetasa se pueden encontrar en la publicación internacional No. WO 2002/086075, intitulada "METHODS AND COMPOSITIONS FOR THE PRODUCTION OF ORTHOGONAL tRNA AMINOACYL-tRNA SYNTHETASE PAIRS" ; y WO 2004/094593, intitulada "EXPANDING THE EUKARYOTIC GENETIC CODE" . Véase también, Wang and Schultz "Expanding the Genetic Code" , Angewandte Chemie Int. Ed . , 44(1): 34-66 (2005), el contenido del cual es incorporado por referencia en su totalidad.
ORGANISMOS FUENTE Y HUÉSPED Los componentes de traducción ortogonales (O-tARN y O-RS) de la invención pueden ser derivados de cualquier organismo (o combinación de organismos) para uso en un sistema de traducción huésped de cualquier otra especie, con la advertencia de que los componentes de O-tARN/O-RS y el sistema huésped funcionen de manera ortogonal . No es un requerimiento que el O-tARN y la O-RS de un par ortogonal sean derivados del mismo organismo. En algunos aspectos, los componentes ortogonales son derivados del género Archaea (esto es, archeabacteria) para uso en un sistema huésped eubacteriano . Por ejemplo, el O-tARN ortogonal puede ser de un organismo Archae, por ejemplo un archaebacteria tal como Methanococcus jannaschii , Methanobacterium thermoautotrophicum, Halobacterium tales como Haloferax volcanii y Halobacterium species NRC-I, Archaeo globus fulgidus, Pyrococcus furiosus, Pyrococcus horikoshii , Aeuropyru pernix, Methanococcus maripaludi s, Methanopyrus kandleri , Methanosarcina mazei (Mm) , Pyrobaculum aerophilum, Pyrococcus abyssi , Sulfolobus solfataricus (Ss) , Sulfolobus tokodaii , Thermoplasma acidophilum, Ther oplastna volcanium, o los semejantes, o un eubacterio, tal como Escherichia coli , Thermus thermophi lus, Baci llus s tearothermphilus o los semejantes, en tanto que la 0-RS ortogonal puede ser derivada de un organismo o combinación de organismos, por ejemplo una archaebacteria, tal como Methanococcus jannaschii , Methanobacterium thermoautotrophi cum, Halobacterium tales como Haloferax volcanii and Halobac terium NRC-I, Archa eoglobus fulgidus , Pyrococcus furiosus , Pyrococcus horikoshi i , Aeuropyrum pernix, Methanococcus maripaludi s , Methanopyrus kandleri , Methanosarcina mazei , Pyrobacul um aerophi l um, Pyrococcus abyssi , Sulfolobus solfa tari cus , Sulfolobus tokodaii , Thermoplasma acidophilum, Thermoplastna vol cani um o los semejantes, o una eubacteria, tal como Escherichia coli , Thermus thermophilus , Bacillus stearothermphilus o los semejantes. En una modalidad, fuentes eucariónticas, por ejemplo, plantas, algas, protistas, hongos, levaduras, animales (por ejemplo, mamíferos, insectos, artrópodos, etc.), o los semejantes puede también ser usados como fuentes de O-tARN y O-RS. Los componentes individuales de un par de O-tARN/O-RS pueden ser derivados del mismo organismo o diferentes organismos. En una modalidad, el par de O-tARN/O-RS es del mismo organismo. Alternativamente, el O-tARN y la O-RS del par O-tARN/O-RS son de diferentes organismos. El O-tARN, O-RS o par de O-tARN/O-RS puede ser seleccionado o filtrado in vivo o in vitro y/o usado en una célula, por ejemplo una célula eubacteriana, para producir un polipéptido con un alquinil aminoácido. La célula eubacteriana usada no está limitada, por ejemplo, Escherichia coli , Thermus thermophilus, Bacillus s tearothermphi lus o los semejantes. Composiciones de célula eubacterianas que comprenden componentes de traducción de la invención son también un aspecto de la invención. Véase también, publicación de solicitud internacional número WO 2004/094593, intitulada "EXPANDING THE EUKARYOTIC GENETIC CODE", presentada el 16 de abril de 2004, para filtrar O-tARN y/o O-RS en una especie para uso en otra especie. En algunos aspectos, el O-tARN, O-RS o par O-tARN/O-RS pueden ser seleccionados o filtrados in vivo o in vitro y/o usados en una célula, por ejemplo una célula eucarióntica para producir un polipéptido con un aminoácido no natural. La célula eucarióntica usada no está limitada por ejemplo cualquier célula de levadura apropiada, tal como Saccharomyces cerevisiae (S. cerevisiae) o los semejantes, pueden ser usados. Composiciones de células eucariónticas que comprenden componentes de traducción de la invención son también un aspecto de la invención. Saccharomyces cerevisiae pueden ser escogidos como una especie de huésped eucarióntico, ya que este organismo proporciona varias ventajas. La especie es unicelular, tiene un tiempo de generación rápido y genéticamente bien caracterizada. Véase, por ejemplo D. Burke , et al., (2000) Methods in Yeast Genetics. Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY. Además, puesto que la maquinaria de traducción de los eucariontes es altamente conservada (véase, por ejemplo, (1996) Translational Control. Cold Spring Harbor Laboratory, Cold Spring Harbor, NY; Y. Kwok, & J.T. Wong, (1980), Evolutionary relationship between Halobacterium cutirubrum and eukaryotes determined by use de aminoacyl - tRNA synthetases as phylogenetic probé s, Canadian Journal de Biochemistry 58:213-218; y (2001) The Ribosome . Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY) , genes de O-RS (por ejemplo, genes de O-RS derivados de secuencias de RS de E. coli tipo silvestre) para la incorporación de aminoácidos no naturales descubiertos en S . cerevi siae pueden ser introducidos a organismos eucariónticos superiores (por ejemplo, en células mamíferas) y usarse, en sociedad con tARN cognatos (véase, por ejemplo, K. Sakamoto, et al., (2002) Si te-specific incorporation of an unnatural amino acid into proteins in mammalian cells , Nucleic Acids Res. 30:4692-4699; y C. Kohrer, et al., (2001), Import of amber and ochre suppresor tRNAs into mammalian cells : a general approach a si te-specific insertion of amino acid analogues into proteins , Proc. Nati. Acad. Sci. U.S. A. 98:14310-14315) para incorporar aminoácidos no naturales. Aunque los sistemas de traducción ortogonales (por ejemplo, que comprenden una O-RS, un O-tARN y un aminoácido no natural) pueden utilizar células huésped cultivadas para producir proteínas que tienen aminoácidos no naturales, no se pretende que un sistema de traducción ortogonal de la invención requiera una célula huésped viable intacta. Por ejemplo, un sistema de traducción ortogonal puede utilizar un sistema libre de células en presencia de un extracto de célula. Por supuesto, el uso de sistemas de transcripción/traducción in vitro libres de células para producción de proteínas es una técnica bien establecida. La aplicación de estos sistemas in vitro para producir proteínas que tienen aminoácidos no naturales utilizando componentes del sistema de traducción ortogonal descritos en la presente es también dentro del alcance de la invención.
CODONES SELECTORES Codones selectores de la invención expanden la estructura de codón genético de la maquinaria biosintética de la proteína. Por ejemplo un codón selector incluye, por ejemplo, un codón de tres bases único, un codón sin sentido, tal como un codón de retención, por ejemplo un codón ámbar (UAG) o un codón ópalo (UGA) , un codón no natural, por lo menos un codón de cuatro bases, un codón raro o los semejantes. Un número de codones selectores pueden ser introducidos a un gen deseado, por ejemplo uno o más, dos o más o más de tres, etc. Al utilizar diferentes codones selectores, se pueden usar múltiples pares de tARN/sintetasa ortogonales que permiten la incorporación específica del sitio simultánea de múltiples aminoácidos no naturales, por ejemplo que incluyen por lo menos un alquinil aminoácido, utilizando estos diferentes codones selectores . En una modalidad, los métodos involucran el uso de un codón selector que es un codón de retención para la incorporación de un aminoácido no natural in vivo en una célula. Por ejemplo, se produce un O-tARN que reconoce el codón de retención y es aminoacilado por una O-RS con un aminoácido no natural. Este O-tARN no es reconocido por las aminoacil-tARN sintetasas del huésped que se presentan de manera estable en la naturaleza. Se puede usar mutagénesis dirigida al sitio convencional para introducir el codón de retención en el sitio de interés en un polinucleótido que codifica un polipéptido de interés. Véase, por ejemplo, Sayers, J.R., et al. (1988), 5 ' , 3 ' Exonuclease in phosphorothioate-based oligonucleotide-directed mutagenesis . Nucleic Acids Res, 791-802. Cuando la O-RS, O-tARN y el ácido nucleico que codifica un polipéptido de interés son combinados, por ejemplo ín vivo, el aminoácido no natural es incorporado en respuesta al codón de retención para dar un polipéptido que contiene el aminoácido no natural en la posición especificada. En una modalidad de la invención, el codón de retención usado como codón selector es un codón ámbar, UAG y/o un codón ópalo, UGA . En un ejemplo, un código genético en el cual UAG y UGA son ambos usados como codón selector pueden codificar 22 aminoácidos en tanto que conservan el codón sin sentido ocre, UAA, que es la señal de terminación más abundante . La incorporación de alqumil aminoácidos activos m vivo se puede hacer sin perturbación significativa de la célula huésped. Por ejemplo en células no eucapónticas , tales como Escherichia coll , debido a que la eficiencia de supresión para el codón UAG depende de la competencia entre el O-tARN, por ejemplo, el tARN supresor ámbar, y el factor de liberación 1 (RF1) (que se enlaza el codón de UAG e inicia la liberación del péptido creciente del ribosoma) , la ef ciencia de supresión puede ser modulada por ejemplo ya sea al incrementar el nivel de expresión de O-tARN, por ejemplo el tARN supresor o al utilizar una cepa deficiente de RF1. En células eucariónticas, debido a que la eficiencia de supresión para el codón de UAG depende de la competencia entre el O-tARN, por ejemplo el tARN supresor ámbar y un factor de liberación eucarióntico (por ejemplo, eRF) (que se enlaza a un codón de retención e inicia la liberación del péptido creciente del ribosoma) , la eficiencia de supresión puede ser modulada por ejemplo al incrementar el nivel de expresión de O-tARN, por ejemplo, el tARN supresor. Además, compuestos adicionales pueden también estar presentes, por ejemplo agentes reductores tales como ditiotretiol (DTT) . Los aminoácidos no naturales pueden también ser codificados con codones raros. Por ejemplo, cuando la concentración de arginina en una reacción de síntesis de proteína in vitro es reducida, el codón de arginina raro, AGG, ha probado ser eficiente para la inserción de Ala mediante un tARN sintético acilado con alanina. Véase, por ejemplo, Ma et al., Biochemistry, 32:7939 (1993). En este caso, el tARN sintético compite con el tARNArg que se presenta de manera estable en la naturaleza, que existe como especie menor en Escherichia coli . Además, algunos organismos no utilizan todos los codones de triplete. Un codón sin asignar AGA en Mi crococcus l u teus ha sido utilizado para la inserción de aminoácidos en un extracto de transcripción/traducción in vitro. Véase, por ejemplo, Kowal and Oliver, Nucí. Acid. Res., 25:4685 (1997). Los componentes de la invención pueden ser generados para usar estos codones raros in vivo. Los codones selectores pueden también comprender codones extendidos, por ejemplo codones de cuatro o más bases, tales como codones de cuatro, cinco, seis o más bases. Ejemplos de codones de cuatro bases incluyen, por ejemplo AGGA, CUAG, UAGA, CCCU, y los semejantes. Ejemplos de codones de cinco bases incluyen, por ejemplo AGGAC, CCCCU, CCCUC, CUAGA, CUACU, UAGGC y los semejantes. Los métodos de la invención incluyen utilizar codones extendidos en base a supresión de desplazamiento de cuadro. Codones de cuatro o más bases pueden insertar por ejemplo uno o múltiples aminoácidos no naturales a la misma proteína. En otras modalidades, los bucles anticodón pueden descodificar, por ejemplo por lo menos un codón de cuatro bases, por lo menos un codón de cinco bases o por lo menos un codón de seis bases o más. Puesto que hay 256 codones de cuatro bases posibles, múltiples aminoácidos no naturales pueden ser codificados en la misma célula utilizando un codón de cuatro o más bases. Véase también, Anderson et al., (2002) Exploring the Limits of codón and Anticodon Size, Chemistry and Biology, 9:237-244; y Magliery, (2001) Expanding the genetic code : Selection of Efficient Suppressors of Four-codons bases and Identification of "Shifty" Four-base Codons with a Library Approach in Escherichia coli, J. Mol. Biol. 307: 755-769. Por ejemplo, codones de cuatro bases se han usado para incorporar aminoácidos no naturales a proteínas utilizando métodos biosintéticos in vitro. Véase, por ejemplo, Ma et al., (1993) Biochemistry, 32:7939; y Hohsaka et al., (1999) J. Am. Chem. Soc, 121:34. CGGG y AGGU fueron usados para incorporar simultáneamente 2-naftilalanina y un derivado de NBD de lisina a estreptavidina in vitro con dos tARN supresores de desplazamiento de cuadro acilados químicamente. Véase, por ejemplo, Hohsaka et al., (1999) J. Am. Chem. Soc. 121:12194. En un estudio in vivo, Moore et al. examinaron la habilidad de derivados de tARNLeu con anticodones NCUA para suprimir codones UAGN (N puede ser U, A, G, o C) , y se encontró que el cuadruplete UAGA puede ser descodificado mediante un tARNEu con un anticodón UCUA con una eficiencia de 13 a 26% con poca descodificación en el cuadro 0 ó 1. Véase Moore et al., (2000) J. Mol. Biol., 298:195. En una modalidad, codones extendidos a base de codones raros o codones sin sentido pueden ser usados en la invención, lo que puede reducir la lectura sin sentido y supresión de desplazamiento de cuadro en otros sitios indeseables. Codones de cuatro bases se han usado como codones selectores en una variedad de sistemas ortogonales. Véase por ejemplo, WO 2005/019415; WO 2005/007870 y WO 2005/07624. Véase también, Wang and Schultz "Expanding the Genetic Code" , Angewandte Chemie Int. Ed., 44(1): 34-66 (2005), el contenido del cual es incorporado por referencia en su totalidad. En tanto que los ejemplos a continuación utilizan un codón selector ámbar, se pueden usar codones de cuatro o más bases también, al modificar los ejemplos en la presente para incluir O-tARN de cuatro bases y sintetasas modificadas para incluir mutaciones similares a aquellas descritas previamente para varios O-RS de aminoácido no naturales. Para un sistema dado, un codón selector puede también incluir uno de los tres codones base naturales, en donde el sistema endógeno no usa (o raramente usa) el codón de base natural. Por ejemplo, esto incluye un sistema que carece de tARN que reconoce el codón de tres bases natural y/o un sistema en donde el codón de tres bases es un codón raro. Codones selectores incluyen opcionalmente pares base no naturales. Estos pares base no naturales expanden adicionalmente el alfabeto genético existente. Un par de base incrementa el número de codones de triplete de 64 a 125. Las propiedades de terceros pares de bases incluyen apareamiento de base simple y selectivo, incorporación enzimática eficiente a ADN con alta afinidad por una polimerasa y la extensión del cebador prolongada eficiente después de la síntesis del par de base no natural naciente. Descripciones de pares de bases no naturales que pueden ser adaptados para métodos y composiciones, incluyen, por ejemplo Hirao, et al., (2002) An unnatural base pair for incorporating amino acid analogues into protein, Nature Biotechnology, 20: 177-182. Véase también Wu, Y., et al., (2002) J. Am. Chem. Soc. 124:14626-14630. Otras publicaciones relevantes son enlistadas posteriormente en la presente . Para uso in vivo, el nucleósido no natural es de membrana permeable y es fosforilado para formar el trifosfato correspondiente. Además, la información genética incrementada es estable y no destruida por enzimas celulares. Los esfuerzos previos de Benner y otros toma ventaja de los patrones de enlace de hidrógeno que son diferentes de aquellos en pares de Watson-Crick canónicos, el ejemplo más notable de los cuales es el par iso-C:iso-G. Véase por ejemplo, Switzer et al., (1989) J. Am. Chem. Soc, 111:8322; y Piccirilli et al., (1990) Nature, 343:33; Kool, (2000) Curr. Opin. Chem. Biol., 4:602. Estas bases en general se mal aparean a un grado con las bases naturales y no pueden ser replicadas enzimáticamente. Kool y colaboradores demostraron que las interacciones de empaque hidrofóbicas entre bases pueden reemplazar el enlace de hidrógeno para conducir a la formación del par de bases. Véase Kool, (2000) Curr. Opin. Chem. Biol., 4:602; y Guckian and Kool, (1998) Angew. Chem. Int. Ed . Engl . , 36, 2825. En un esfuerzo por desarrollar un par de base no natural que satisfaga todos los requerimientos anteriores, Schultz, Romesberg y colaboradores han sintetizado sistemáticamente y estudiado una serie de bases hidrofóbicas no naturales. Se encuentra que un autopar PICS:PICS es más estable que los pares de bases naturales y puede ser incorporado eficientemente a ADN mediante el fragmento de Klenow de polimerasa I de ADN de Escherichia coli (KF) . Véase, por ejemplo, McMinn et al., (1999) J. Am. Chem. Soc, 121:11586; y Ogawa et al., (2000) J. Am. Chem. Soc, 122:3274. Un autopar de 3MN:3MN puede ser sintetizado mediante KF con eficiencia y selectividad suficiente para función biológica. Véase, por ejemplo Ogawa et al., (2000) J. Am. Chem. Soc. 122:8803. Sin embargo, ambas bases actúan como terminador de cadena para replicación adicional. Una polimerasa de ADN mutante se ha desarrollado recientemente que puede ser usada para replicar el autopar de PICS. Además, un autopar 7AI puede ser replicado. Véase, por ejemplo Tae et al., (2001) J. Am. Chem. Soc. 123:7439. Un nuevo par de metalobase, Dipic:Py también se ha desarrollado, que forma un par estable en el enlace de Cu (II) . Véase Meggers et al., (2000) J. Am. Chem. Soc, 122:10714. Debido a que los codones extendidos y los codones no naturales son intrínsecamente ortogonales a los codones naturales, el método de la invención puede tomar ventaja de esta propiedad para generar tARN ortogonales para ellos. Un sistema de desviación de traducción puede también ser usado para incorporar un alquinil aminoácido en un polipéptido deseado. En un sistema de desviación de traducción, una secuencia grande es insertada a un gen pero no es traducida a proteína. La secuencia contiene una estructura que sirve como indicación para inducir la ribosoma a saltar sobre la secuencia y reanudar la traducción corriente abajo de la inserción.
AMINOÁCIDOS NO NATURALES Como se usa en la presente, un aminoácido no natural se refiere a cualquier aminoácido, aminoácido modificado o análogo de aminoácido diferente a selenocisteína y/o pirrolisina y los siguientes alfa-aminoácidos codificados genéticamente: alanina, arginina, asparagina, ácido aspártico, cisteína, glutamina, ácido glutámico, glicina, histidina, isoleucina, leucina, lisina, metionina, fenilalanina, prolina, serina, treonina, triptófano, tirosina, valina. La estructura genérica de un alfa-aminoácido es ilustrada por la fórmula I : I Un aminoácido no natural es comúnmente cualquier estructura que tenga fórmula I en donde el grupo R es cualquier sustituyente diferente al usado en los 20 aminoácidos naturales. Véase, por ejemplo, Biochemistry by L. Stryer, 3rd ed. 1988, Freeman and Company, New York, para estructuras de los veinte aminoácidos naturales. Nótese que, los aminoácidos no naturales de la invención pueden ser compuestos que se presentan de manera estable en la naturaleza diferentes a los veinte alfa-aminoácidos anteriores. Debido a que los aminoácidos no naturales de la invención difieren comúnmente de los aminoácidos naturales en la cadena natural, los aminoácidos no naturales forma enlaces de amida con otros aminoácidos, por ejemplo naturales o no naturales, de la misma manera en la cual son formados en proteínas que se presentan de manera estable en la naturaleza. Sin embargo, los aminoácidos no naturales tienen grupos de cadena lateral que los distinguen de los aminoácidos naturales. De particular interés en la presente son los aminoácidos no naturales provistos en la figura 1. Por ejemplo, estos aminoácidos no naturales incluyen pero no están limitados a p-etiltiocarbonil-L-fenilalanina, p- (3-oxobutanoil) -L-fenilalanina, 1 , 5-dansil-alanina, aminoácido de 7-amino-coumarina, aminoácido de 7 -hidroxi -coumarina, nitrobencil-serina, O- (2 -nitrobencil) -L-tirosina, p-carboximetil -L-fenilalanina, p-ciano-L-fenilalanina, m-ciano-L-fenilalanina, bifenilalanina , 3 -amino-L- tirosina, bipiridil alanina, p-(2-amino-1-hidroxietil) -L-fenilalanina, p-isopropiltiocarbonil -L-fenilalanina, 3 -nitro-L- tirosina y p-nitro-L-fenilalanina . Ambos de los enantiómeros L y D de estos aminoácidos no naturales encuentran uso con la invención. Además de los aminoácidos no naturales de la figura 1, otros aminoácidos no naturales pueden ser incorporados simultáneamente a un polipéptido de interés, por ejemplo, utilizando un segundo par de 0-RS/O-tARN apropiado en conjunción con un par ortogonal provisto por la presente invención. Muchos de tales aminoácidos no naturales adicionales y pares ortogonales apropiados son conocidos. Véanse las referencias citadas en la presente. Por ejemplo, véase Wang and Schultz "Expanding the Genetic Code", Angewandte Chemie Int. Ed., 44(1) :34-66 (2005), el contenido del cual es incorporado por referencia en su totalidad. En otros aminoácidos no naturales, por ejemplo, R en la fórmula I comprende opcionalmente un alquil-, aril-, acil-, hidrazina, ciano-, halo-, hidrazida, alquenil, éter, borato, boronato, fosfo, fosfono, fosfina, enona, imina, éster, hidroxilamina, amina y los semejantes o cualquier combinación de los mismos. Otros aminoácidos no naturales de interés incluyen, pero no están limitados a, aminoácidos que comprenden un agente de reticulación fotoactivable, aminoácidos marcados por espín, aminoácidos fluorescentes, aminoácidos de enlace de metal, aminoácidos que contienen metal, aminoácidos radioactivos, aminoácidos con nuevos grupos funcionales, aminoácidos que interactúan covalentemente o no covalentemente con otras moléculas, aminoácidos fotoenjaulados y/o fotoisomerizables , biotina o aminoácidos que contienen análogo de biotina, aminoácidos que contienen ceto, aminoácidos glicosilados , una porción de sacárido anexada a la cadena lateral de aminoácido, aminoácidos que comprenden polietilenglicol o poliéter, aminoácidos sustituidos por átomos pesados, aminoácidos químicamente escindibles o fotoescindibles, aminoácidos con una cadena lateral alargada en comparación con los aminoácidos naturales (por ejemplo, poliéteres o hidrocarburos de cadena larga, por ejemplo mayores de aproximadamente 5, mayores de aproximadamente 10 átomos de carbono, etc.), aminoácidos que contienen azúcar enlazados a carbono, aminoácidos que contienen amino tioácido y aminoácidos que contienen una o más porciones tóxicas. En otro aspecto, la invención proporciona aminoácidos no naturales que tienen la estructura general ilustrada por la fórmula IV a continuación: Un aminoácido no natural que tiene esta estructura es comúnmente cualquier estructura en donde Ri es un sustituyente usado en uno de los veinte aminoácidos naturales (por ejemplo, tirosina o fenilalanina) y R2 es un sustituyente. Así, este tipo de aminoácido no natural puede ser visto como un derivado de aminoácido natural. Además de los aminoácidos no naturales que contienen nuevas cadenas laterales tales como el grupo alquinilo, los alquinil aminoácidos no naturales pueden también comprender opcionalmente estructuras de cadena fundamente modificadas, por ejemplo como se ilustra por las estructuras de fórmula II y III: en donde Z comprende comúnmente OH, NH2 , SH, NH-R' , o S-R' ; X e Y, que pueden ser los mismos o diferentes comprenden comúnmente S u O, y R y R' , que son opcionalmente los mismos o diferentes, son seleccionados comúnmente de la misma lista de constituyentes para el grupo R descrito anteriormente para los aminoácidos no naturales que tienen fórmula I también como hidrógeno. Por ejemplo, los aminoácidos no naturales de la invención comprenden opcionalmente sustituciones en el grupo amino o carboxilo como se ilustra por las fórmulas II y III. Los aminoácidos no naturales de este tipo incluyen, pero no están limitados a, a-hidroxi ácidos, a-tioácidos, a-aminotiocarboxilatos, por ejemplo con cadenas laterales correspondientes a los veinte aminoácidos naturales comunes o cadenas laterales no naturales. Además, las sustituciones en el carbono a incluyen opcionalmente aminoácidos L, D, o a-a-disustituidos, tales como D-glutamato, D-alanina, D-metil-O-tirosina, ácido aminobutírico y los semejantes. Otras alternativas estructurales incluyen aminoácidos cíclicos, tales como análogos de prolina también como análogos de prolina con 3, 4, 6, 7, 8 y 9 miembros en el anillo, ß y ? aminoácidos tales como ácido ß-alanina y ?-amino butírico sustituido. En algunos aspectos, la invención utiliza aminoácidos no naturales de configuración L. Sin embargo, no se pretende que la invención esté limitada al uso de aminoácidos no naturales de configuración L. Se contempla que los enantiómeros D de estos aminoácidos no naturales también encuentren uso con la invención. Los análogos de tirosina incluyen tirosinas para-sustituidas, tirosinas orto-sustituidas y tirosinas meta-sustituidas, en donde la tirosina sustituida comprende un grupo alquinilo, un grupo acetilo, un grupo benzoilo, grupo amino, hidrazina, hidroxiamina, un grupo tiol, grupo carboxi, grupo isopropilo, grupo metilo, un hidrocarburo de cadena recta o ramificada de C6-C20 un hidrocarburo saturado o insaturado, un grupo O-metilo, grupo poliéter, grupo nitro o los semejantes. Además, también se contemplan anillos de arilo múltiplemente sustituidos. Los análogos de glutamina de la invención incluyen, pero no están limitados a, derivados a-hidroxi, derivados ?-sustituidos, derivados cíclicos y derivados de glutamina aminoácido sustituidos. Análogos de fenilalanina ejemplares incluyen, pero no están limitados a, fenilalaninas para-sustituidas, fenilalaninas orto-sustituidas y fenilalaninas meta-sustituidas, en donde el sustituyente comprende un grupo alquinilo, un grupo hidroxi, un grupo metoxi, un grupo metilo, un grupo alilo, un aldehido, un nitro, un grupo tiol, un grupo ceto o los semejantes. Ejemplos específicos de aminoácidos no naturales incluyen, pero no están limitados a, p-etiltiocarbionil-L-fenilalanina, p-(3-oxobutanoil) -L-fenilalanina, 1 , 5-dansil-alanina, aminoácido de 7-amino-coumarina, aminoácido de 7 -hidroxi -cou arina, nitrobencil-serina, O- (2 -nitrobencil) -L-tirosina, p-carboximetil-L-fenilalanina, p-ciano-L-fenilalanina, m-ciano-L-fenilalanina, bifenilalanina, 3 -amino-L-tirosina, bipiridil alanina, p- (2 -amino-1-hidroxietil) -L-fenilalanina, p-isopropiltiocarbonil-L-fenilalanina, 3 -nitro-L-tirosina y p-nitro-L- fenilalanina . También, una p-propargiloxifenilalanina, una 3 , -dihidroxi-L-fenilalanina (DHP) , una 3 , 4 , 6-trihidroxi -L-fenilalanina, una 3 , 4 , 5-trihidroxi-L-fenilalanina, 4-nitro-fenilalanina, una p-acetil-L-fenilalanina, O-metil-L-tirosina, una L-3 - (2 -naftil) alanina, una 3-metil-fenilalanina, una 0-4-alil-L-tirosina, una 4-propil-L-tirosina, una 3 -nitro-tirosina, una 3-tiol-tirosina, una tri-O-acetil-GlcNAcß-serina, una L-Dopa, una fenilalanina fluorada, una isopropil-L-fenilalanina, una p-azido-L-fenilalanina, una p-acil-L-fenilalanina, una p- benzoil-L-fenilalanina, una L-fosfoserina, una fosfonoserina, una fosfonotirosina, una p-yodo- fenilalanina, una p-bromofenilalanina, una p-amino-L-fenilalanina, y una isopropil-L- fenilalanina y los semejantes. Las estructuras de una variedad de aminoácidos no naturales son provistas en la presente, véase por ejemplo figura 1. Véase también, solicitud internacional publicada WO 2004/094593, intitulada "EXPANDING THE EUKARYOTIC GENETIC CODE" .
Síntesis química de aminoácidos no naturales Muchos de los aminoácidos no naturales proporcionados anteriormente están disponibles comercialmente, por ejemplo de Sigma (USA) o Aldrich (Milwaukee, WI , USA). Aquellas que no están disponibles comercialmente son sintetizadas opcionalmente como se estipula en varias publicaciones o usando métodos estándar conocidos para aquellos de habilidad en el arte. Para técnicas de síntesis orgánica, véase por ejemplo Organic Chemistry by Fessendon and Fessendon, (1982, Second Edition, Willard Grant Press, Boston Mass) ; Advanced Organic Chemistry by March (Third Edition, 1985, Wiley and Sons, New York) ; y Advanced Organic Chemistry by Carey and Sundberg (Third Edition, Parts A and B, 1990, Plenum Press, New York) . Publicaciones adicionales que describen la síntesis de aminoácidos no naturales incluyen por ejemplo WO 2002/085923 intitulado "In vivo Incorporation of Unnatural Amino Acids" ; Matsoukas et al., (1995) J. Med. Chem., 38, 4660-4669; King, F.E. & Kidd, D.A.A. (1949) A New Synthesis of Glutamine and of ?-Dipeptides of Glutamic Acid from Phthylated Intermediates . J. Chem. Soc, 3315-3319; Friedman, O.M. & Chatterrji, R. (1959) Synthesis of Derivatives of Glutamine as Model Substrates for Anti-Tumor Agents . J. Am. Chem. Soc. 81, 3750-3752; Craig, J.C. et al. (1988) Absolute Configuration of Enantiomers of 7-Chloro-4 [ [4- (dietilamino) -1-methylbutyl] amino] quinoline (Chloroquine) . J. Org. Chem. 53, 1167-1170; Azoulay, M., Vilmont, M. & Frappier, F. (1991) Glutamine analogues as Potential Antimalarials , . Eur . J. Med. Chem. 26, 201-5; Koskinen, A.M.P. & Rapoport , H. (1989) Synthesis of 4-Substituted Prolines as Conformationally Constrained Amino Acid Analogues. J. Org. Chem. 54, 1859-1866; Christie, B.D. & Rapoport, H. (1985) Synthesis of Optically Puré Pipecolates from L-Asparagine . Application to the Total Synthesis of ( + ) - Apovincamine through Amino Acid Decarbonylation and Iminium Ion Cyclization. J. Org. Chem. 1989:1859-1866; Barton et al., (1987) Synthesis of Novel a-Amino-Acids and Derivatives Using Radical Chemistry: Synthesis of L- and D-a-Amino-Adipic Acids, L-a-aminopimelic Acid and Appropriate Unsaturated Derivatives. Tetrahedron Lett. 43:4297-4308; y Subasinghe et al., (1992) Quisqualic acid analogues: synthesis of beta-heterocyclic 2-aminopropanoic acid derivatives and their activity at a novel quisqualate-sensitized site. J. Med. Chem. 35:4602-7. Véase también publicación internacional WO 2004/058946, intitulada "PROTEIN ARRAYS" , presentada el 22 de diciembre de 2003.
Absorción celular de aminoácidos no naturales La absorción de aminoácido no natural por una célula es una cuestión que es considerada comúnmente cuando se diseñan y seleccionan aminoácidos no naturales, por ejemplo para incorporación a una proteína. Por ejemplo la alta densidad de carga de los a-aminoácidos sugiere que estos compuestos son improbables de ser permeables a la célula. Los aminoácidos naturales son absorbidos a la célula vía una colección de sistemas de transporte a base de proteína que exhiben frecuentemente varios grados de especificidad de aminoácido. Se puede hacer una selección rápida que determina cuales aminoácidos no naturales, si los hay son absorbidos por las células. Véase por ejemplo los análisis de toxicidad por ejemplo en la publicación internacional WO 2004/058946, intitulada "PROTEIN ARRAYS", presentada el 22 de diciembre de 2003; y Liu and Schultz (1999) Progress toward the evolution of an ogranism with an expanded genetic code. PNAS 96:4780-4785. Aunque la absorción es fácilmente analizada con varios análisis, una alternativa al diseñar aminoácidos no naturales que son propensos a rutas de absorción celular es proporcionar rutas biosintéticas para crear aminoácidos in vivo.
Biosíntesis de aminoácidos no naturales Ya existen muchas rutas biosintéticas en las células para la producción de aminoácidos y otros compuestos, en tanto que un método biosintético para un aminoácido no natural particular puede no existir en la naturaleza, por ejemplo en una célula, la invención proporciona tales métodos. Por ejemplo, rutas biosintéticas para aminoácidos no naturales son generadas opcionalmente en célula huésped al agregar nuevas enzimas o modificar rutas de célula huésped existentes. Enzimas nuevas adicionales son enzimas que se presentan de manera opcional de manera estable en la naturaleza o enzimas evolucionadas artificialmente. Por ejemplo, la biosíntesis de p-aminofenilalanina (tal como se presenta en un ejemplo en WO 2002/085923, supra) depende de la adición de una combinación de enzimas conocidas de otros organismos. Los genes para estas enzimas pueden ser introducidos a una célula al transformar la célula con un plásmido que comprende los genes. Los genes, cuando son expresados en la célula, proporcionan una ruta enzimática para sintetizar el compuesto deseado. Ejemplos de tipos de enzima que son agregadas opcionalmente son proporcionados en los ejemplos a continuación. Secuencias de enzimas adicionales se encuentra, por ejemplo en Genbank. Las enzimas desarrolladas artificialmente son también agregadas opcionalmente a una célula de la misma manera. De esta manera, la maquinaria y recursos celulares de una célula son manipulados para producir aminoácidos no naturales. Por supuesto, cualquiera de una variedad de métodos pueden ser usados para producir nuevas enzimas para uso en rutas biosintéticas o para evolución de las rutas existentes, para la producción de aminoácidos no naturales, in vitro o in vivo. Muchos métodos disponibles comercialmente para desarrollo enzimas y otros componentes de ruta biosintética pueden ser aplicados a la presente invención para producir aminoácidos no naturales (o por supuesto, para evolucionar sintetasas para tener nuevas especificidades de sustrato u otras actividades de interés) . Por ejemplo, se usa redistribución de ADN opcionalmente para desarrollar nuevas enzimas y/o rutas de tales enzimas para la producción de aminoácidos no naturales (o producción de nuevas sintetasas) , in vitro o in vivo. Véase por ejemplo Stemmer (1994), Rapid evolution of a protein in vitro by DNA shuffling, Nature 370 (4) : 389-391 ; y Stemmer, (1994), DNA shuffling by random fragmentation and reassembly: In vitro recombination for molecular evolution, Proc. Nati. Acad. Sci. USA., 91:10747-10751. Un procedimiento relacionado redistribuye familias de genes relacionados (por ejemplo homólogos) para desarrollar rápidamente enzimas con características deseadas. Un ejemplo de tales métodos de "redistribución de gen de familia" es encontrado en Crameri et al. (1998) "DNA shuffling of a family de genes from diverse species accelerates directed evolution" Nature, 391(6664): 288-291. Nuevas enzimas (ya sea componentes de ruta biosintética o sintetasas) pueden también ser generados utilizando un procedimiento de recombinación de ADN conocido como "truncación incremental para la creación de enzimas híbridas" ("ITCHY"), por ejemplo, como se describe en Ostermeier et al. (1999) "A combinatorial approach to hybrid enzimes independent of DNA homology" Nature Biotech 17:1205. Este procedimiento puede también ser usado para generar una biblioteca de enzima y otras variantes de ruta que pueden servir como sustratos para uno o más de métodos de recombinación in vitro o in vivo. Véase también Ostermeier et al. (1999) "Combinatorial Protein Engineering by Incremental Truncation", Proc. Nati. Acad. Sci. USA, 96: 3562-67, y Ostermeier et al. (1999), "Incremental Truncation as a Strategy in the Engineering of Novel Biocatalysts" , Biological and Medicinal Chemistry, 7:2139-44. Otro procedimiento utiliza mutagénesis de conjunto exponencial para producir bibliotecas de enzima y otras variantes de ruta que son, por ejemplo seleccionadas en cuanto a la habilidad para catalizar una reacción biosintética relevante para producir un aminoácido no natural (o una nueva sintetasa) . En este procedimiento, pequeños grupos de residuos en una secuencia de interés son aleatorizados en paralelo para identificar, en cada posición alterada, aminoácidos que conducen a proteínas funcionales. Ejemplos de tales procedimientos, que pueden ser adaptados a la presente invención para producir nuevas enzimas para la producción de aminoácidos no naturales (o nuevas smtetasas) son encontrados en Delegrave & Youvan (1993) Biotechnology Research 11:1548-1552. En todavía otro procedimiento, mutagénesis aleatoria o semi-aleatoria utilizando oligonucleótidos impurificados o degenerados para el diseño de enzima y/o como de ruta pueden ser usados, por ejemplo al utilizar los métodos de mutagénesis generales de Arkm and Youvan (1992) "Optimizmg nucleotide mixtures to encode specific subsets of ammo acids for semi-random mutagenesis" Biotechnology 10.297-300, o Reidhaar-Olson et al. (1991) "Random mutagenesis of protein sequences using oligonucleotide cassettes" Methods Enzymol. 208.564-86 Todavía otro procedimiento, frecuentemente denominado mutagénesis "no estocástica" , que utiliza re-ensamble de polmucleótido y mutagénesis de saturación en el sitio puede ser usado para producir enzimas y/o componentes de ruta, los cuales pueden luego ser seleccionados en cuando a la habilidad para llevar a cabo una o más de funciones de smtetasa o de ruta biosmtética (por ejemplo, para la producción de aminoácidos no naturales m vivo) . Véase, por ejemplo Short "NON-STOCHASTIC GENERATION OF GENETIC VACCINES AND ENZIMES" WO 00/46344. Una alternativa a tales métodos mutacionales involucra la recombinación de genomas enteros de organismos y selección de progenie resultante para funciones de ruta particulares (frecuentemente denominada "redistribución de genoma entero") . Este procedimiento puede ser aplicado a la presente invención, por ejemplo mediante recombinación genómica y selección de un organismo (por ejemplo, una E. coli u otra célula) en cuanto a la habilidad para producir un aminoácido no natural (o intermediario del mismo) . Por ejemplo, los métodos enseñados en las siguientes publicaciones pueden ser aplicados al diseño de ruta para la evolución de rutas existentes y/o nuevas rutas en células para producir aminoácidos no naturales in vivo: Patnaik et al. (2002) "Genome shuffling of lactobacillus for improved acid tolerance" Nature Biotechnology. 20(7): 707-712; y Zhang et al. (2002) "Genome shuffling leads to rapid phenotypic improvement in bacteria" Nature, 7 de febrero 415(6872): 644-646. Otras técnicas para el diseño de organismos y diseño de rutas metabólicas, por ejemplo, para la producción de compuestos deseados están también disponibles y pueden también ser aplicados a la producción de aminoácidos no naturales. Ejemplos de publicaciones que enseñan procedimientos de diseño de rutas útiles incluyen: Nakamura and White (2003) "Metabolic engineering for the microbial production of 1,3 propanediol" Curr. Opin. Biotechnol. 14 (5) : 454-9 ; Berry et al. (2002) "Application of Metabolic Engineering to improve both the production and use of Biotech índigo" J. Industrial Microbilogy and Biotechnology 28:127-133; Banta et al. (2002) "Optimizing an artificial metabolic pathway: Engineering the co- factor specificity of Corynebacterium 2 , 5-diketo-D-gluconic acid reductase for use in vitamin C biosynthesis" Biochemistry. 41(20), 6226-35; Selivonova et al. (2001) "Rapid Evolution of Novel Traits in Microorganisms" Applied and Environmental Microbiology, 67:3645, y muchos otros. Sin consideración del método usado, comúnmente, el aminoácido no notarse producido con una ruta biosintéticas diseñada de la invención es producido en una concentración suficiente para la biosíntesis de proteína eficiente, por ejemplo una cantidad celular natural, pero no a tal grado para afectar significativamente la concentración de otros aminoácidos celulares o para agotar los recursos celulares, las concentraciones típicas producidas in vivo de esta manera son de aproximadamente 10 mM a aproximadamente 0.05 mM. Una vez que una célula es diseñada para producir enzimas deseadas para una ruta específica y se genera un aminoácido no naturales, selecciones in vivo son usadas opcionalmente para optimizar adicionalmente la producción del aminoácido no natural para síntesis de proteína ribosomal y crecimiento celular.
Componentes ortogonales para incorporar aminoácidos no naturales La invención proporciona composiciones y métodos para producir componentes ortogonales para incorporar aminoácidos no naturales, por ejemplo los aminoácidos no naturales provistos en la figura 1, a un cadena de polipéptido creciente en respuesta a un codón selector, por ejemplo, un codón de detención ámbar, un codón sin sentido, un codón de cuatro o más bases, por ejemplo etc. in vivo. Por ejemplo, la invención proporciona tARN ortogonales (O-tARN) , aminoacil-tARN sintetasas ortogonales (O-RS) y pares de los mismos. Estos pares pueden ser usados para incorporar un aminoácido no natural a cadenas de polipéptido crecientes. Una composición de la invención incluye una aminoacil-tARN sintetasa ortogonal (O-RS), en donde la O-RS aminoacila preferiblemente un O-tRNA con p-etiltiocarbonil -L-fenilalanina, p- (3 -oxobutanoil) -L-fenilalanina, 1,5-dansil-alanina, 7-amino-coumarina alanina, 7-hidroxi-coumarina alanina, o-nitrobencil-serina, O- (2 -nitrobencil) -L-tirosina, p-carboximetil-L-fenilalanina, p-ciano-L-fenilalanina, m-ciano-L-fenilalanina, bifenilalanina, 3 -amino-L- tirosina, bipiridilalanina, p- (2 -amino-1-hidroxietil) -L-fenilalanina; p-isopropiltiocarbonil-L-fenilalanina; 3 -nitro-L-tirosina o p-nitro-L-fenilalanina . En ciertas modalidades, la O-RS comprende una secuencia de aminoácidos que comprende cualquiera de las SEQ ID NOS: 7-10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 50, 52-55, 57 y 59-63 y variaciones conservadoras de las mismas. En ciertas modalidades de la invención, la O-RS aminoacila preferiblemente el O-tARN sobre cualquier tARN endógeno con un aminoácido no naturales particular, en donde la O-RS tiene predisposición por el O-tARN y en donde la proporción de O-tRNA cargado con un aminoácido no natural al tARN endógeno cargado con el mismo aminoácido no natural es mayor de 1:1 y más preferiblemente en donde la O-RS carga el O-tARN exclusiva o casi exclusivamente. Una composición que incluye una O-RS puede incluir opcionalmente además un tARN ortogonal (O-tARN) , en donde el 0-tARN reconoce un codón selector. Comúnmente, un O-tARN de la invención incluye por lo menos aproximadamente, por ejemplo una eficiencia de supresión de 45%, 50%, 60%, 75%, 80%, o 90% o más en presencia de una smtetasa cognata en respuesta a un codón selector, en comparación con la eficiencia de supresión de un O-tARN que comprende o es codificado por una secuencia de polmucleótidos como se resume en los listados de secuencias (por ejemplo, SEQ ID NO: 1) y ejemplos en la presente En una modalidad, la eficiencia de supresión de la O-RS y el O-tARN es por ejemplo 5 veces, 10 veces, 15 veces, 20 veces, 25 veces o más mayor que la eficiencia de supresión del O-tARN en ausencia de una O-RS. En algunos aspectos, la eficiencia de supresión del O-RS y el O-tARN conjuntamente es por lo menos 45% de la eficiencia de supresión de un par de tirosil-tARN smtetasa ortogonal derivado de Methanococcus annaschu o alternativamente, un par de leutil-tARN sintetasa ortogonal derivado de E. coli. Una composición que incluye un O-tARN puede incluir opcionalmente una célula (por ejemplo, una célula eubacteriana, tal como una célula E. coli y los semejantes o una célula eucapóntica tal como una célula de levadura) , y/o un sistema de traducción. Una célula (por ejemplo, una célula eubacteriana o una célula de levadura) que comprende un sistema de traducción es también provisto por la invención, en donde el sistema de traducción incluye un tARN ortogonal (O-tARN); una ammoacil-tARN smtetasa ortogonal (O-RS); y un aminoácido no natural, por ejemplo un aminoácido mostrado en la figura 1. Comúnmente, la O-RS ammoacila preferiblemente el O-tARN con respecto a cualquier tARN endógeno con el aminoácido no natural, en donde la O-RS tiene predisposición por el O-tARN, y en donde la proporción de O-tARN cargado con el aminoácido no natural al tARN endógeno cargado con el aminoácido no natural es mayor de 1-1 y más preferiblemente en donde la O-RS carga el O-tARN exclusiva o casi exclusivamente. El O-tARN reconoce el primer codón selector y la O-RS ammoacila preferiblemente el O-tARN con un aminoácido no natural. En una modalidad, el O-tARN comprende o es codificado por una secuencia de polmucleótidos como se resume en SEQ ID NO: 1, SEQ ID NO: 2, o una secuencia de polmucleótidos complementaria de las mismas. En una modalidad, la O-RS comprende una secuencia de aminoácidos como se resume en cualquiera de las SEQ ID NOS: 7-10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 50, 52-55, 57, 59-63, y variaciones conservadoras de las mismas. Una célula de la invención puede comprender además opcionalmente un diferente par de O-tARN/O-RS adicional y un segundo aminoácido no natural, por ejemplo en donde este O-tARN reconoce un segundo codón selector y esta O-RS ammoacila preferiblemente el O-tARN correspondiente con el segundo aminoácido no natural, en donde el segundo aminoácido es diferente del primer aminoácido no natural. Opcionalmente , una célula de la invención incluye un ácido nucleico que comprende un polmucleótido que codifica un polipéptido de interés, en donde el polmucleótido comprende un codón selector que es reconocido por el O-tARN. En ciertas modalidades, una célula de la invención es una célula eubacteriana (tal como E. coll) o una célula de levadura, que incluye un tARN ortogonal (O-tARN) , una ammoacil-tARN smtetasa ortogonal (O-RS), un aminoácido no natural y un ácido nucleico que comprende un polmucleótido que codifica un polipéptido de interés, en donde el polmucleótido comprende el codón selector que es reconocido por el O-tARN. En ciertas modalidades de la invención, la O-RS ammoacila preferiblemente el O-tARN con el aminoácido no natural con una eficiencia que es mayor que la eficiencia con la cual la O-RS aminoacila cualquier tARN endógeno. En ciertas modalidades de la invención, un O-tAR? de la invención comprende o es codificado por una secuencia de polinucleótidos como se resume en los listados de secuencias (por ejemplo, SEQ ID NO: l o SEQ ID NO: 2) o ejemplos en la presente, o una secuencia de polinucleótidos complementaria de las mismas. En ciertas modalidades de la invención, una O-RS comprende una secuencia de aminoácido como se resume en los listados de secuencias o una variación conservadora de las mismas. En una modalidad, una O-RS o una porción de la misma es codificada por una secuencia de polinucleótidos que codifica un aminoácido como se resume en los listados de secuencias o ejemplos en la presente, o una secuencia de polinucleótidos complementaria de las mismas. El O-tARN y/o la O-RS de la invención pueden ser derivados de cualquiera de una variedad de organismos (por ejemplo, organismos eucariónticos y/o no eucariónticos) . Los polinucleótidos son también un aspecto de la invención. Un polinucleótido de la invención incluye un polinucleótido artificial (por ejemplo, artificial y que no se presenta de manera estable en la naturaleza) que comprende una secuencia nucleótidos que codifica un polipéptido como se resume en los listados de secuencias en la presente y/o es complementario a o aquella secuencia de polinucleótidos. Un polinucleótido de la invención puede también incluir un ácido nucleico que hibridiza a un polinucleótido descrito anteriormente, bajo condiciones altamente severas, sobre sustancialmente toda la longitud del ácido nucleico. Un polinucleótido de la invención también incluye un polinucleótido que es por ejemplo, por lo menos 75%, por lo menos 80%, por lo menos 90%, por lo menos 95%, por lo menos 98% o más idéntico a aquel de un tARN que se presenta de manera estable en la naturaleza o ácido nucleico de codificación correspondiente (sin embargo un polinucleótido de la invención es diferente que un tARN que se presenta de manera estable en la naturaleza o un ácido nucleico de codificación correspondiente) en donde, el tARN reconoce un codón selector, por ejemplo, un codón de cuatro bases. Polinucleótidos artificiales que son por ejemplo por lo menos 80%, por lo menos 90%, por lo menos 95%, por lo menos 98% o más idénticos a cualquiera de los anteriores y/o un polinucleótido que comprende una variación conservadora de cualquiera de los anteriores, también son incluidos en los polinucleótidos de la invención . Vectores que comprenden un polinucleótido de la invención son también un aspecto de la invención. Por ejemplo, un vector de la invención puede incluir un plásmido, un cósmido, un virus, un vector de la invención y/o los semejantes. Una célula que comprende un vector de la invención es también un aspecto de la invención. Métodos para producir componentes de un par de 0-tARN/0-RS son también aspectos de la invención. Los componentes producidos mediante estos también son aspectos de la invención.
Por ejemplo, métodos para producir por lo menos un tARN que es ortogonal a una célula (O-tARN) incluyen generar una biblioteca de tAR? mutantes; mutar un bucle anticodón de cada miembro de la biblioteca de tAR? mutantes para permitir el reconocimiento de un codón selector, proporcionando mediante esto una biblioteca de O-tAR? potenciales y someter a selección negativa una primera población de células de una primera especie, en donde las células comprenden un miembro de la biblioteca de O-tAR? potenciales. La selección negativa elimina células que comprenden un miembro de la biblioteca de O-tAR? potenciales que es aminoacilado por una aminoacil- tAR? sintetasa (RS) que es endógena a la célula. Esto proporciona un cúmulo de tAR? que son ortogonales a la célula de la primera especie, proporcionando mediante esto por lo menos un O-tAR?. Un O-tAR? producido por el método de la invención es también proporcionado . En ciertas modalidades, los métodos comprenden además someter a selección positiva una segunda población de células de la primera especie, en donde las células comprenden un miembro del cúmulo de tAR? que son ortogonales a la célula de la primera especie, una aminoacil -tAR? sintetasa cognata y un marcador de selección positivo. Al usar la selección positiva, las células son seleccionadas o filtradas en cuanto a aquellas células que comprenden un miembro del cúmulo de tAR? que son aminoaciladas por la aminoacil -tAR? sintetasa cognata y que muestra una respuesta deseada en presencia del marcador de selección positivo, proporcionado mediante esto un O-tARN . En ciertas modalidades, la segunda población de células comprende células que no fueron eliminadas por la selección negativa. También se proporcionan métodos para identificar un aminoacil- tAR? sintetasa ortogonal que carga un O-tAR? con un alquinil aminoácido. Por ejemplo, los métodos incluyen someter a una población de células de una primera especia a una selección, en donde cada una de las células comprenden: (1) un miembro de una pluralidad de aminoacil- tAR? sintetasas (RS) , (por ejemplo, la pluralidad de RS pueden incluir RS mutantes, RS derivadas de una especie diferente de una primera especie o tanto RS mutantes como RS derivadas de una especie diferente a la primera especie) ; (2) el tAR? ortogonal (O-tAR?) (por ejemplo, de una o más especies) y (3) un polinucleótido que codifica un marcador de selección positivo y comprende por lo menos un codón selector. Las células (por ejemplo una célula huésped) son seleccionadas o filtradas en cuando a aquellas que muestran una mejora en eficiencia de supresión en comparación con células que carecen o tienen una cantidad reducida del miembro de la pluralidad de RS . Estas seleccionadas/filtradas comprenden una RS activa que aminoacila el O-tAR?. Una aminoacil -tAR? sintetasa ortogonal identifica por el método es también un aspecto de la invención.
Métodos para producir una proteína en una célula (por ejemplo, en una célula eubacteriana tal como una célula E. coli o los semejantes o en una célula de levadura) que tienen el aminoácido no natural en una posición seleccionada son también un aspecto de la invención. Por ejemplo, un método involucra cultivar, en un medio apropiado una célula, en donde la célula comprende un ácido nucleico que comprende por lo menos un codón selector y codifica una proteína, proporcionar el aminoácido no natural e incorporar el aminoácido no natural a la posición especificada en la proteína durante la traducción del ácido nucleico con por lo menos un codón selector, produciendo mediante esto la proteína. La célula comprende además: un tARN ortogonal (O-tARN) que funciona en la célula y reconoce el codón selector y una aminoacil-tARN sintetasa ortogonal (O-RS) que aminoacila preferiblemente el O-tARN con el aminoácido no natural . Una proteína producida mediante este método es también un aspecto de la invención. La invención también proporciona composiciones que incluyen proteínas, en donde las proteínas comprenden, por ejemplo, p-etiltiocarbonil -L-fenilalanina, p- (3 -oxobutanoil) -L-fenilalanina, 1 , 5-dansil-alanina, aminoácido de 7-amino-coumarina, aminoácido de 7 -hidroxi -coumarina, nitrobencil -serina, O- (2-nitrobencil) -L-tirosina, p-carboximetil-L-fenilalanina, p-ciano-L-fenilalanina, m-ciano-L-fenilalanina, bifenilalanina, 3-amino-L-tirosina, bipiridil alanina, p-(2- amino-1-hidroxietil) -L-fenilalanina, p-isopropiltiocarbonil-L-fenilalanina, 3-nitro-L-tirosina o p-nitro-L-fenilalanina . En ciertas modalidades, la proteína comprende una secuencia de aminoácido que es por lo menos 75% idéntica a aquella de una proteína conocida, por ejemplo, una proteína terapéutica, una proteína de diagnóstico, una enzima industrial, o porción de las mismas. Opcionalmente, la composición comprende un portador aceptable farmacéuticamente. ÁCIDO NUCLEICO Y SECUENCIA DE POLIPÉPTIDO Y VARIANTES Como se describe en la presente, la invención proporciona secuencias de polinucleótidos que codifican, por ejemplo, O-tARN y O-RS, y secuencias de aminoácido de polipéptido, por ejemplo O-RS y por ejemplo, composiciones, sistemas y métodos que comprenden el polinucleótido o secuencias de polipéptidos. Ejemplos de las secuencias, por ejemplo secuencias de aminoácidos y nucleótidos de O-tARN y O-RS son reveladas en la presente (véase tabla 5, por ejemplo, SEQ ID NOS: 7-10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 50, 52-55, 57 y 59-63) . Sin embargo, el experimentado en el arte apreciará que la invención no está limitada a aquellas secuencias reveladas en la presente, por ejemplo, en el ejemplos y listados de secuencias. El experimentado en el arte apreciará que la invención también proporciona muchas secuencias relacionadas con las funciones descritas en la presente, por ejemplo polinucleótidos y polipéptidos que codifican variantes conservadoras de una O-RS revelada en la presente . La construcción y análisis de especies de sintetasa ortogonales (O-RS) que son aptas de aminoacilar un O-tARN con un aminoácido no natural, por ejemplo, un aminoácido no natural provisto en la figura 1, son descritos en los ejemplos 1 a 16. Estos ejemplos describen la construcción y análisis de especies de O-RS que son aptas de incorporar los aminoácidos no naturales p-etiltiocarbonil -L-fenilalanina, p- (3 -oxobutanoil) -L-fenilalanina, 1 , 5-dansil-alanina, 7 -amino-coumariña alanina, 7-hidroxi-coumarina alanina, o-nitrobencil-serina, O- (2-nitrobencil) -L-tirosina, p-carboximetil-L-fenilalanina, p-ciano-L-fenilalanina, m-ciano-L-fenilalanina, bifenilalanina, 3 -amino-L- tirosina, bipiridilalanina, p- (2 -amino-1-hidroxietil) -L-fenilalanina; p-isopropiltiocarbonil-L-fenilalanina; 3 -nitro-L-tirosina y p-nitro-L-fenilalanina . La invención proporciona polipéptidos (O-RS) y polinucleótidos, por ejemplo O-tARN, polinucleótidos que codifican O-RS o porciones de las mismas, oligonucleótidos usados para aislar clones de aminoacil-tARN sintetasa, etc. Los polinucleótidos de la invención incluyen aquellos que codifican proteínas o polipéptidos de interés de la invención con uno o más codones selectores. Además, los polinucleótidos de la invención incluyen, por ejemplo un polinucleótido que comprende una secuencia de nucleótidos como se resume en SEQ ID NO: 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 51, 56 y 58, y un polinucleótido que es complementario a o que codifica una secuencia de polinucleótidos del mismo. Un polinucleótido de la invención también incluye cualquier polinucleótido que codifica una secuencia de aminoácidos de 0-RS que comprende SEQ ID NO: 7-10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 50, 52-55, 57 y 59-63. Similarmente, un ácido nucleico artificial que se hibridiza a un polinucleótido indicado anteriormente bajo condiciones altamente severas en sustancialmente toda la longitud del ácido nucleico (y es diferente a un polinucleótido que se presentan de manera estable en la naturaleza) es un polinucleótido de la invención. En una modalidad, una composición incluye un polipéptido de la invención y un excipiente (por ejemplo, solución reguladora del pH, agua, excipiente aceptable farmacéuticamente, etc.) . La invención también proporciona un anticuerpo o antisuero específicamente inmunoreactivo con un polipéptido de la invención. Un polinucleótido artificial es un polinucleótido que es artificial y no se presenta de manera estable en la naturaleza. Un polinucleótido de la invención también incluye un polinucleótido artificial que es, por ejemplo, por lo menos 75%, por lo menos 80%, por lo menos 90%, por lo menos 95%, por lo menos 98% o más idéntico a aquel de un tARN que se presenta de manera estable en la naturaleza (pero es diferente a un tARN que se presenta de manera estable en la naturaleza) . Un polinucleótido también incluye un polinucleótido artificial esto es, por ejemplo, por lo menos 75%, por lo menos 80%, por lo menos 90%, por lo menos 95%, por lo menos 98% o más idéntico (pero no 100% idénticos) a aquel de un tARN que se presenta de manera estable en la naturaleza. En ciertas modalidades, un vector (por ejemplo, un plásmido, un cósmido, un fago, un virus, etc.) comprende un polinucleótido de la invención. En una modalidad, el vector es un vector de expresión. En otra modalidad, el vector de expresión incluye un promotor enlazado operativamente a uno o más de los polinucleótidos de la invención. En otra modalidad, una célula comprende un vector que incluye un polinucleótido de la invención. El experimentado en el arte también apreciará que muchas variantes de las secuencias reveladas son incluidas en la invención. Por ejemplo, variantes conservadoras de las secuencias reveladas que producen una secuencia funcionalmente idéntica son incluidas en la invención. Variantes de las secuencias de polinucleótido de ácido nucleico, en donde las variantes hibridizan a por lo menos una secuencia revelada, son considerados incluidos en la invención. Subsecuencias únicas de las secuencias reveladas en la presente, tal como se determina por ejemplo, técnicas de secuencia de comparación estándar, son también incluidas en la invención.
Variantes conservadoras Debido a la degeneración del código genético, "sustituciones silentes" (esto es, sustituciones en una secuencia de ácido nucleico que no da como resultado una alteración en un polipéptido codificado) son un aspecto implicado de cada secuencia de ácido nucleico que codifica una secuencia de ácido nucleico. Similarmente, "sustituciones de aminoácido conservadoras" , en donde uno o un número limitado de aminoácidos en una secuencia de aminoácidos son sustituidos con aminoácidos diferentes con propiedades altamente similares, también son fácilmente identificados como siendo altamente similares a un constructo revelado Tales variaciones conservadoras de cada secuencia revelada son un aspecto de la presente invención "Variantes conservadoras" de una secuencia de ácido nucleico particular se refiere a aquellos ácidos nucleicos que codifican secuencias de aminoácido idénticas o esencialmente idénticas o en donde el ácido nucleico no codifica una secuencia de aminoácido, a secuencias esencialmente idénticas. Aquel de habilidad en el arte reconocerá que sustituciones individuales, cancelaciones o adiciones que alteran, suman o cancelan un solo aminoácido o un pequeño porcentaje de aminoácidos (comúnmente menos de 5%, más comúnmente menos de 4%, 2% o 1%) en una secuencia codificada son "variaciones modificadas conservadoramente" en donde las alteraciones dan como resultado la cancelación de un aminoácido, adición de un aminoácido o sustitución de un aminoácido con un aminoácido químicamente similar. Así, "variantes conservadoras" de una secuencia de polipéptido enlistado de la presente invención incluye sustituciones de un pequeño porcentaje, comúnmente menos de 5%, más comúnmente menos de 2% o 1%, de los aminoácidos de la secuencia de polipéptidos, con un aminoácido del mismo grupo de sustitución conservador. Finalmente, la adición de secuencias que no alteran la actividad codificada de una molécula de ácido nucleico, tal como la adición de una secuencia no funcional, es una variación conservadora del ácido nucleico básico. Tablas de sustitución conservadoras que proporcionan aminoácidos funcionalmente similares son bien conocidas en el arte, en donde un residuo de aminoácido es sustituido por otro residuo de aminoácido que tiene propiedades químicas similares (por ejemplo, cadenas laterales aromáticas o cadenas laterales cargadas positivamente) y por consiguiente no cambia sustancialmente las propiedades funcionales de la cadena de polipéptido. Lo siguiente resume grupos ejemplares que contienen aminoácidos naturales de propiedades semejantes, en donde las sustituciones dentro de un grupo es una "sustitución conservadora" .
TABLA 1 Hibridización de ácido nucleico Se puede usar hibridización comparativa para identificar ácidos nucleicos de la invención, en los que se incluyen variantes conservadoras de ácidos nucleicos de la invención y este método de hibridización comparativo es un método preferido para distinguir ácidos nucleicos de la invención. Además, ácidos nucleicos objetivo que se hibridizan a un ácido nucleico representados por SEQ ID NOS: 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 51, 56 y 58, bajo condiciones de severidad alta, ultra-alta y ultra-ultra alta son un aspecto de la invención. Ejemplos de tales ácidos nucleicos incluyen aquellos con uno o pocas sustituciones de ácido nucleico silentes o conservadoras en comparación con una secuencia de ácido nucleico dada. Se dice que un ácido nucleico de prueba hibridiza específicamente a un ácido nucleico de sonda cuando hibridiza por lo menos 50% también como a la sonda al objetivo complementario perfectamente correspondiente, esto es, con una proporción de señal a ruido por lo menos la mitad tan alta como la hibridización de la sonda al objetivo bajo condiciones en las cuales la sonda perfectamente correspondiente se enlaza al objetivo complementario perfectamente correspondiente con una proporción de señal a ruido que es por lo menos aproximadamente 5x-10x tan alta como aquella observada para la hibridización a cualquiera de los ácido nucleico objetivo no correspondientes. Los ácidos nucleicos "hibridizan" cuando se asocian, comúnmente en solución. Los ácidos nucleicos se hibridizan debe a una variedad de fuerza fisicoquímicas bien caracterizadas, tales como enlace de hidrógeno, exclusión de solvente, apilamiento de base y los semejantes. Una guía extensa para la hibridización de ácidos nucleicos es encontrada en Tijssen (1993) Labora tory Techniques in Biochemi s try and Biology Molecular— Hybridi za tion wi th Nuclei c Acid Probes part I capítulo 2, "Overview of principies de hybridization and the strategy of nucleic acid probé assays," (Elsevier, New York), también como en Current Protocols in Molecular Biology, Ausubel et al., eds., Current Protocols, a joint venture between Greene Publishing Associates, Inc. and John Wiley & Sons, Inc., complementado a través de 2004) ("Ausubel"); Hames and Higgins (1995) Gene Probes 1 IRL Press at Oxford University Press, Oxford, Inglaterra, (Hames and Higgms 1) y Hames and Higgms (1995) Gene Probes 2 IRL Press at Oxford University Press, Oxford, Engly (Hames and Higgms 2) proporciona detalles en cuanto a la síntesis, marcación, detección y cuantificación de ADN y ARN en los qe se incluyen oligonucleótidos . Un ejemplo de condiciones de hibridización severas para la hibridización de ácidos nucleicos complementarios que tienen más de 100 residuos complementarios sobre un filtro en un Southern blot o northern blot es formalma al 50% con 1 mg de hepapna a 42 °C, la hibridización se lleva a cabo durante toda a noche Un ejemplo de condiciones de lavado severas es un lavado de 0.2x SSC a 65°C durante 15 minutos {véase, Sambrook, supra para una descripción de la solución regulador del pH de SSC) . Frecuentemente, el lavado de alta severidad es precedido por un lavado de baja severidad para remover la señal de sonda de fondo Un ejemplo de lavado de baja severidades SSC 2x a 40 °C durante 15 minutos. En general, una proporción de señal a ruido de 5x (o más alta) que aquella observada por una sonda no relacionada en el análisis de hibridización particular indica detección de una hibridazación específica. "Condiciones de lavado de hibridización severas" en el contexto de experimento de hibpdización de ácido nucleico tales como hibridizaciones Southern y northern son dependientes de la secuencia y son diferentes ba o diferentes parámetros ambientales. Una guía extensa en cuanto a la hibpdización de ácidos nucleicos es encontrada en Tijssen (1993), supra, y en Hames and Higgins, 1 y 2. Condiciones de hibridización y lavado severas se pueden determinar fácilmente de manera empírica para cualquier ácido nucleico de prueba. Por ejemplo, en la determinación de condiciones de hibridización y lavado severas, las condiciones de hibridización y lavado son gradualmente incrementadas (por ejemplo, al incrementar la temperatura, disminuir la concentración de sal, incrementar la concentración de detergente y/o incrementar la concentración de solventes orgánicos tales como formalina en la hibridización o lavado) , hasta que se cumple con un conjunto seleccionado de criterios. Por ejemplo, en condiciones de hibridización y lavado altamente severas, las condiciones de hibridización y lavado son gradualmente incrementadas hasta que una sonda se enlaza a un objetivo complementario perfectamente correspondiente con una proporción de señal a ruido que es por lo menos 5x tan alta como aquella observada para la hibridización de la sonda a un objetivo sin corresponder. Condiciones "muy severas" son seleccionadas para ser igual al punto de fusión térmica (Tm) para una sonda particular. La Tm es la temperatura (bajo fuerza iónica y pH definido) a la cual el 50% de la secuencia de prueba se hibridiza a una sonda perfectamente correspondiente. Para los propósitos de la presente invención, en general, condiciones de hibridización y lavado "altamente severas" son seleccionadas para ser aproximadamente 5°C más bajas que la Tm para la secuencia específica a una fuerza iónica y pH definidos. Condiciones de hibridización y lavado de "Ultra-alta severidad" son aquellas en las cuales la severidad de las condiciones de hibridización y lavado son incrementadas hasta que la proporción de señal a ruido para el enlace de la sonda al ácido nucleico objetivo complementario perfectamente correspondiente es por lo menos lOx tan alta como aquella observada para la hibridización a cualquiera de los ácidos nucleicos objetivo sin corresponder. Un ácido nucleico objetivo que se hibridiza a una sonda bajo tales condiciones, con una proporción de señal a ruido de por lo menos 1/2 de aquella del ácido nucleico objetivo complementario perfectamente correspondiente se dice que se enlaza a la sonda bajo condiciones de ultra-alta severidad. Similarmente, niveles aún más alta de severidad pueden ser determinados al incrementar gradualmente las condiciones de hibridización y/o lavado del análisis de hibridización relevante. Por ejemplo, aquellos en los cuales la severidad de las condiciones de hibridización y lavado son incrementadas hasta que la proporción de señal a ruido para el enlace de la sonda al ácido nucleico objetivo complementario perfectamente correspondiente es por lo menos lOx, 20X, 50X, 100X, o 500X o más tan alto como aquella observada para la hibridización a cualquiera de los ácidos nucleicos objetivo sin corresponder. Un ácido nucleico objetivo que se hibridiza a una sonda bajo tales condiciones, con una proporción de señal a ruido de por lo menos 1/2 del ácido nucleico objetivo complementario perfectamente correspondiente se dice que se enlaza a la sonda bajo condiciones de severidad ultra-ultraaltas . Los ácidos nucleicos que no se hibridizan entre sí bajo condiciones severas son todavía sustancialmente idénticos si los polipéptidos que codifican son sustancialmente idénticos. Esto ocurre, por ejemplo, cuando se crea una copia de un ácido nucleico utilizando la degeneración de codón máxima permitida por el código genético.
Subsecuencias únicas En algunos aspectos, la invención proporciona un ácido nucleico que comprende una subsecuencia única en un ácido nucleico seleccionado de las secuencias de O-tARN y O-RS reveladas en la presente. La subsecuencia única es única en comparación con un ácido nucleico correspondiente a cualquier secuencia de ácido nucleico de O-tARN o O-RS conocida. La alineación puede ser efectuada utilizando por ejemplo BLAST ajustada a parámetros predeterminados. Cualquier subsecuente única es útil, por ejemplo, como sonda para identifica los ácidos nucleicos de la invención. Similarmente, la invención incluye un polipéptido que comprende una subsecuencia única en un polipéptido seleccionado de las secuencias de O-RS reveladas en la presente. Aquí, la subsecuencia única es única en comparación con un polipéptido correspondiente a cualquiera de la secuencia de polipéptido conocidas. La invención también proporciona ácidos nucleicos que hibridizan bajo condiciones severas a un oligonucleótido de codificación único que codifica una subsecuencia única en un polipéptido seleccionado de las secuencias de O-RS, en donde la subsecuencia única es única en comparación con un polipéptido correspondiente a cualquiera de los polipéptido de control (por ejemplo, secuencias originales de las cuales las sintetasas de la invención fueron derivadas, por ejemplo mediante mutación) . Las secuencias únicas son determinadas como se indica anteriormente.
Comparación de secuencia, identidad y homología Los términos "idéntico" o "por ciento de identidad" , en el contexto de dos o más secuencias de ácido nucleico o polipéptidos, se refieren a dos o más secuencias o subsecuencias que son las mismas o tienen un porcentaje especificado de residuos de aminoácido o nucleótidos que son los mismos, cuando se comparan y alineados para correspondencia máxima, tal como se mide utilizando uno de los algoritmos de comparación de secuencia descritos posteriormente en la presente (u otros algoritmos disponibles para las personas de habilidad) o mediante inspección visual. La frase "sustancial idéntica" en el contexto de dos ácidos nucleicos o polipéptidos (por ejemplo, ADN que codifican un O-tARN o O-RS o la secuencia de aminoácidos de una O-RS) se refiere a dos o más secuencias o subsecuencias que tienen por lo menos aproximadamente 60%, aproximadamente 80%, aproximadamente 90-95%, aproximadamente 98%, aproximadamente 99% o más de identidad de residuos de nucleótidos o aminoácidos, cuando se compara y son alineadas para correspondencia máxima, tal como se mide usando un algoritmo de comparación de secuencia o mediante inspección visual . Se considera que tales secuencias "sustancialmente idénticas" son "homologas" sin referencia a los ancestros reales. Preferiblemente, la "identidad sustancial" existe sobre una región de las secuencias que es de por lo menos aproximadamente 50 residuos de longitud, más preferiblemente en una región de por lo menos aproximadamente 100 residuos y más preferiblemente, las secuencias son sustancialmente idénticas con respecto a por lo menos aproximadamente 150 residuos o sobre la plena longitud de las dos secuencias a ser comparadas. Proteínas y/o secuencias de proteína son "homólogos" cuando son derivados, natural o artificialmente, de una proteína ancestral común o secuencia de proteína. Similarmente, los ácidos nucleicos y/o secuencias de ácidos nucleicos son homólogos cuando son derivados, natural o artificialmente, a partir de un ácido nucleico ancestral común o secuencia de ácido nucleico. Por ejemplo, cualquier ácido nucleico que se presenta de manera estable en la naturaleza puede ser modificado mediante cualquier método de mutagénesis apropiado para incluir uno o más codones selectores. Cuando es expresado, este ácido nucleico mutagenizado codifica un polipéptido que comprende uno o más aminoácidos no naturales. El proceso de mutación puede por supuesto, alterar adicionalmente uno o más codones estándares, cambiando mediante esto uno o más aminoácidos estándar en la proteína mutante resultante también. La homología es en general inferida de similaridad de secuencia entre dos o más ácidos nucleicos o proteínas (o secuencias de los mismos) . El porcentaje preciso de similaridad entre secuencias que es útil para establecer homología varia con el ácido nucleico y proteína en cuestión, pero tan poco como 25% de similaridad de secuencia es usado sistemáticamente para establecer la homología. Niveles más altos de similaridad de secuencia, por ejemplo 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, o 99% o más, pueden también ser usados para establecer homología. Métodos para determinar porcentajes de similaridad de secuencia (por ejemplo, BLASTP y BLASTN utilizando parámetros predeterminados) son descritos en la presente y están en general disponibles. Para la comparación de secuencia y determinación de homología, comúnmente la secuencia actúa como secuencia de referencia a la cual las secuencias de prueba son comparadas. Cuando se usa un algoritmo de comparación de secuencia, las secuencias de prueba y de referencia son introducidas a una computadora, se designan coordenadas de subsecuencia, si es necesario y se designan los parámetros del programa del algoritmo de secuencia. Luego el algoritmo de comparación de secuencias calcula el por ciento de identidad de secuencia para la(s) secuencia (s) de prueba en relación con la secuencia de referencia, en base a los parámetros de programa designados. La alineación óptima de secuencias para comparación se puede efectuar, por ejemplo mediante el algoritmo de homología local de Smith & Waterman, Adv. Appl. Math. 2:482 (1981) , mediante el algoritmo de alineación de homología de Needleman & Wunsch, J. Mol. Biol. 48:443 (1970), mediante la búsqueda por el método de similaridad de Pearson & Lipman, Proc. Nat'l. Acad. Sci. USA 85:2444 (1988), mediante implementaciones computanzadas de estos algoritmos (GAP, BESTFIT, FASTA, y TFASTA en el Wisconsin Genetics Software Package, Genetics Computer Group, 575 Science Dr . , Madison, WI), o mediante inspección visual (véase, en general Current Protocols in Biology Molecular, Ausubel et al., eds., Current Protocols, a joint venture between Greene Publishing Associates, Inc. y John Wiley & Sons, Inc., complementado a través de 2004) .
Un ejemplo de un algoritmo que es apropiado para determinar el por ciento de identidad de secuencia y similaridad de secuencia es el algoritmo BLAST, que es descrito en Altschul et al, J. Mol. Biol. 215:403-410 (1990). Elementos de programación para efectuar análisis de BLAST están disponibles publicación a través del Centro Nacional para Información de Biotecnología (www.ncbi.nlm.nih.gov/). Este algoritmo involucra identificar primero pares de secuencia de alta puntuación (HSP) al identificar palabras cortas de longitud W en la secuencia de interrogación que ya sea coincide o satisface con la puntuación de umbral de valor positivo T cuando es alineada a una palabra de la misma longitud en una secuencia de base de datos. T es denominada como el umbral de puntuación de palabra vecina (Altschul et al., supra) . Estas puntuaciones de palabra vecina inicial actúan como semillas para búsquedas iniciales para encontrar HP más largas que las contienen. Las puntuaciones de palabra son luego expedidas en ambas direcciones a lo largo de cada secuencia en canto a la puntuación de alineación acumulativa puede ser incrementada. Puntuaciones acumulativas son calculando, para secuencias de nucleótido, los parámetros M (puntuación de recompensa para un par de residuos coincidentes, siempre >0) y N (puntuación de castigo para residuos que no coinciden, siempre <0) . Para secuencias de aminoácidos, se usa una matriz de puntuación para calcular la puntuación acumulativa. La extensión de las anotaciones de palabra en cada anotación son detenidas cuando: la puntuación de alineación acumulativa cae por la cantidad X de su valor obtenido máximo; la puntuación acumulativa va a cero o menor, debido a la acumulación de una o más alineaciones de residuo de puntuación negativa o el extremo de ya sea una u otra secuencia es alcanzado. Los parámetros del algoritmo BLAST W, T y X determinan la sensibilidad y velocidad de la alineación. El programa BLASTN (para secuencias de nucleótidos) utiliza como predeterminados una longitud de palabra (W) de 11, una esperanza (E) de 10, un corte de 100, M = 5, N = -4, y una comparación de ambas hebras, para secuencias de aminoácidos, el programa BLASTP utiliza como predeterminados una longitud de palabra (W) de 3, una esperanza (E) de 10, y la matriz de puntuación BLOSUM62 (véase Henikoff & Henikoff (1989) Proc. Nati. Acad. Sci. USA 89:10915). Además de calcular el por ciento de identidad de secuencia, el algoritmo BLAST también efectúa un análisis estadístico de la similaridad entre dos secuencias (véase, por ejemplo, Karlin & Altschul, Proc. Nat'l. Acad. Sci. USA 90:5873-5787 (1993)). Una medida de similaridad provista por el algoritmo BLAST es la probabilidad de suma más pequeña (P(N)), que proporciona una indicación de probabilidad mediante la cual una coincidencia entre dos secuencias de nucleótidos o aminoácidos ocurriría por probabilidad, por ejemplo, un ácido nucleico se considera similar a una secuencia de referencia si la probabilidad de suma más pequeña en una comparación de ácido nucleico de prueba al ácido nucleico de referencia es menor de aproximadamente 0.1, más preferiblemente menor de alrededor 0.01, y más preferiblemente menos de aproximadamente 0.001.
Mutagénesis y otras técnicas de biología molecular Los polinucleótidos y polipéptidos de la invención y usados en la invención pueden ser manipulados utilizando técnicas de biología molecular. Textos generales que describen técnicas de biología molecular incluyen Berger and Kimmel, Guide to Molecular Cloning Techniques, Methods in Enzymology volume 152 Academic Press, Inc., San Diego, CA (Berger); Sambrook et al., Molecular Cloning - A Laboratory Manual (3rd Ed) ., Vol. 1-3, Cold Spring Harbor Laboratory, Cold Spring Harbor, New York, 2001 ("Sambrook") y Current Protocols in Biología molecular, F.M. Ausubel et al., eds . , Current Protocols, a joint venture between Greene Publishing Associates, Inc. and John Wiley & Sons, Inc., (complementado a través de 2004) ("Ausubel") . Estos textos describen mutagénesis, el uso de vectores, promotores y muchos otros tópicos relevantes concernientes con, por ejemplo, la generación de genes que incluyen codones selectores para la producción de proteínas que incluyen alquinil aminoácidos (por ejemplo pPRO-Phe) , tARN ortogonales, sintetasas ortogonales, y pares de los mismos.
Varios tipos de mutagénesis son usados en la invención, por ejemplo para mutar moléculas de tARN, para producir bibliotecas de tARN, para producir bibliotecas de sintetasas, para insertar codones selectores que codifican un alquinil aminoácido en una proteína o polipéptido de interés. Incluyen pero no están limitados a mutagénesis de punto aleatorio, dirigida al sitio, recombinación homologa, redistribución de AD? u otros métodos de mutagénesis recursivos, construcción quimérica, mutagénesis usando plantillas que contienen uracilo, mutagénesis dirigida al oligonucleótido, mutagénesis de AD? modificada por fosforotioato, mutagénesis utilizando AD? dúplex con espacios o los semejantes o cualquier combinación de los mismos. Métodos apropiados adicionales incluyen reparación de desadaptación puntual, mutagénesis utilizando cepas huésped deficientes de reparación, restricción-selección y restricción-purificación, mutagénesis de cancelación, mutagénesis mediante síntesis de gen total, reparación de ruptura de doble hebra y los semejantes. La mutagénesis, por ejemplo que involucra constructos quiméricos, también está incluida en la presente invención. En una modalidad, la mutagénesis puede ser guiada por información conocida de moléculas que se presentan de manera estable en la naturaleza o moléculas que se presentan de manera estable en la naturaleza alteradas o moduladas, por ejemplo, secuencia, comparaciones de secuencia, propiedades físicas, estructura cristalina o los semejantes. Las células huésped son diseñadas genéticamente (por ejemplo, transformadas, transducidas o transfectadas) con los polinucleótidos de la invención o constructos que incluyen un polinucleótido de la invención, por ejemplo un vector de la invención, que puede ser por ejemplo un vector de clonación o un vector de expresión. Por ejemplo las regiones de codificación para el tARN ortogonal, la tARN sintetasa ortogonal y la proteína a ser derivada son enlazados operativamente a elementos de control de expresión genética que son funcionales en relación a la huésped deseada. Vectores típicos contienen terminadores de transcripción y traducción, secuencias de inicio de transcripción y traducción y promotores útiles para la regulación de la expresión del ácido nucleico objetivo particular. Los vectores comprenden opcionalmente casets de expresión genérica que contienen por lo menos una secuencia terminadora independiente, secuencias que permiten la replicación del caset en eucariontes o procariontes o ambos (por ejemplo, vectores de lanzadera) y marcadores de selección tanto para sistemas procarióticos como eucariónticos . Los vectores son apropiados para replicación y/o integración en procariontes, eucariontes o preferiblemente ambos. Véase Giliman & Smith, Gene 8:81 (1979); Roberts, et al, Nature, 328:731 (1987); Schneider, B., et al., Protein Expr. Purif. 6435:10 (1995); Ausubel, Sambrook, Berger (all supra) . El vector puede por ejemplo estar en forma de un plásmido, una bacteria, un virus, un polinucleótido desnudo o un polinucleótido conjugado. Los vectores son introducidos a las células y/o microorganismos mediante métodos estándar en los que se incluyen electroporación (From et al., Proc. Nati. Acad. Sci. USA 82, 5824 (1985), infección mediante vectores virales, penetración balística de alta velocidad por partículas pequeños con el ácido nucleico ya sea dentro de la matriz de perlas o partículas pequeñas o sobre la superficie (Klein et al . , Nature 327, 70-73 (1987)), y/o los semejantes. Un sistema de un solo plásmido altamente eficiente y versátil fue desarrollado para incorporación específica del sitio de aminoácidos no naturales a proteínas en respuesta al codón de retención ámbar (UAG) en E. Coli. En el nuevo sistema, el par de tARNtyr(CUA) supresor de M. jannaschi i y tirosil-tARN sintetasa son codificados en un solo plásmido, que es compatible con la mayoría de vectores de expresión de E. coli. El operón de tARN monocistrónico bajo el control del promotor y terminador de proK fue construido para estructura secundaria óptima y procesamiento de tARN. La introducción de una forma mutada del promotor de glnS para la sintetasa dio como resultado un incremento significativo tanto en eficiencia de supresión como fidelidad. Incrementos en eficiencia de supresión fueron también obtenidos mediante múltiples copias de gen de tARN también como mediante una mutación específica (D286R) en la sintetasa (Kobayashi et al., "Structural basis for orthogonal tRNA specificities of tyrosyl-tRNA synthetases for genetic code expansión", Nat. Struct. Biol., 10 (6) : 425-432 [2003]) . La generalidad del sistema optimizado fue también demostrada mediante incorporación altamente eficiente y exacta de varios aminoácidos no naturales diferentes, cuyas utilidades únicas en el estudio de la función de proteína y estructura fueron previamente probadas. Un catálogo de bacterias y bacteriófagos útiles para clonación es provisto, por ejemplo por la ATCC, por ejemplo, The ATCC Catalogue of Bacteria and Bacteriophage (1996) Gherna et al. (eds) publicado por la ATCC. Procedimientos básicos adicionales para la secuenciación, clonación y otros aspectos de biología molecular y consideraciones teóricas subyacentes también se encuentran en Sambrook (supra) , Ausubel (supra) , y en Watson et al. (1992) Recombinant DNA Second Edition Scientific American Books , NY . Además, esencialmente cualquier ácido nucleico (y virtualmente cualquier ácido nucleico marcado, ya sea estándar o no estándar) puede ser adaptado u ordenado estándar de cualquiera de una variedad de fuentes comerciales, tales como la Midland Certified Reagent Company (Midland, TX mcrc.com), The Great American Gene Company (Ramona, CA disponible en la web en genco.com), ExpressGen Inc. (Chicago, IL disponible en la web en expressgen.com), Operon Technologies Inc. (Alameda, CA) y muchas otras.
Las células huésped diseñadas pueden ser cultivadas en medios nutrientes convencionales modificados como sea apropiado para tales actividades tales como por ejemplo etapas de selección, activación de promotores o selección de transformantes. Estas células pueden opcionalmente ser cultivadas en organismos transgénicos. Otras referencias útiles, por ejemplo para aislamiento y cultivo de células (por ejemplo, para aislamiento de ácidos nucleicos subsecuentes) incluyen Freshney (1994) Culture of Animal Cells, a Manual of Basic Technique, third edition, Wiley-Liss, New York y las referencias citadas en la misma; Payne et al. (1992) Plant Cell and Tissue Culture in Liquid Systems John Wiley & Sons, Inc. New York, NY; Gamborg and Phillips (eds) (1995) Plant Cell, Tissue and Organ Culture; Fundamental Methods Springer Lab Manual, Springer-Verlag (Berlín Heidelberg New York) y Atlas and Parks (eds) The Handbook de Microbiological Media (1993) CRC Press, Boca Ratón, FL .
PROTEÍNAS Y POLIPÉPTIDOS DE INTERÉS Métodos para producir una proteína en una célula con un alquinil aminoácido en una posición especificada son también un aspecto de la invención. Por ejemplo, un método incluye cultivar, en un medio apropiado, la célula, en donde la célula comprende un ácido nucleico que comprende por lo menos un codón selector y codifica una proteína y proporcionar el alquinil aminoácido; en donde la célula comprende además: un tARN ortogonal (O- tARN) que funciona en la célula y reconoce el codón selector y una aminoacil -tAR? sintetasa ortogonal (O-RS) que aminoacila preferiblemente el O- tARN con el alquinil aminoácido. Una proteína producida mediante este método es también un aspecto de la invención. En ciertas modalidades, la O-RS comprende una predisposición para la aminoacilación de O-tAR? cognato con respecto a cualquier tAR? endógeno en un sistema de expresión. La proporción relativa entre O-tAR? y tAR? endógeno que es cargado por la O-RS cuando el O-tAR? y O-RS están presentes en concentraciones molares o iguales, es mayor de 1:1, preferiblemente por al menos aproximadamente 2:1, más preferiblemente 5:1, todavía más preferiblemente 10:1, todavía más preferiblemente 20:1, todavía más preferiblemente 50:1, todavía más preferiblemente 75:1, todavía más preferiblemente 95:1, 98:1, 99:1, 100:1, 500:1, 1,000:1, 5,000:1 o más alta. La invención también proporciona composiciones que incluyen proteínas, en donde las proteínas comprenden un alquinil aminoácido. En ciertas modalidades, la proteína comprende una secuencia de aminoácidos que es por lo menos 75% idéntica a aquella de una proteína terapéutica, una proteína de diagnóstico, una enzima industrial o porción de las mismas. Las composiciones de la invención y composiciones elaboradas mediante los métodos de la invención opcionalmente están en una célula. Los pares de O-tARN/O-RS o componentes individuales de la invención pueden luego ser usado en una maquinaria de traducción del sistema huésped, que da como resultado un alquinil aminoácido que es incorporado a una proteína. Las publicaciones internacionales números WO 2004/094593, presentada el 16 de abril de 2004, intitulada "EXPA?DI?G THE EUKARYOTIC GE?ETIC CODE," y WO 2002/085923, intitulada "I? VIVO I?CORPORATIO? OF U??ATURAL AMI?O ACIDS" , describen este proceso y son incorporadas en la presente por referencia. Por ejemplo, cuando un par de O-tAR?/O-RS es introducido a un huésped, por ejemplo una célula de Escheri chia coli o una célula de levadura, el par conduce a la incorporación in vivo de un aminoácido no natural tal como p-etiltiocarbonil-L-fenilalanina, p- (3 -oxobutanoil) -L-fenil-alanina, 1 , 5-dansil-alanina, 7-amino-coumarina alanina, 7-hidroxi-coumarina alanina, o-nitrobencil-serina, O- (2-nitrobencil) -L-tirosina, p-carboximetil-L-fenilalanina, p-ciano-L-fenilalanina, m-ciano-L-fenilalanina, bifenilalanina, 3 -amino-L- tirosina, bipiridilalanina, p- (2 -amino-1-hidroxietil) -L-fenilalanina; p-isopropiltiocarbonil-L-fenilalanina; 3 -nitro-L-tirosina o p-nitro-L-fenilalanina a una proteína en respuesta a un codón selector. El aminoácido no natural que es agregado al sistema puede ser un aminoácido sintético, tal como un derivado de una fenilalanina o tirosina, que puede ser agregado exógenamente al medio de cultivo.
Opcionalmente, las composiciones de la presente invención pueden estar en un sistema de traducción in vitro o en un (os) sistema (s) in vivo. Una célula de la invención proporciona la habilidad de sintetizar proteínas que comprenden aminoácidos no naturales en grandes cantidades útiles. En un aspecto, la composición incluye opcionalmente, por ejemplo 10 microgramos, por lo menos 50 microgramos, por lo menos 75 microgramos, por lo menos 100 microgramos , por lo menos 200 microgramos, por lo menos 250 microgramos, por lo menos 500 microgramos, por lo menos 1 miligramo, por lo menos 10 miligramos o más de la proteína que comprende un alquinil aminoácido o una cantidad que puede ser obtenida con métodos de producción de proteína in vivo (detalles en cuando a la producción de proteína recombinante y purificación son proporcionados en la presente) . En otro aspecto, la proteína está opcionalmente presente en la composición a una concentración de por ejemplo, por lo menos 10 microgramos de proteína por litro, por lo menos 50 microgramos de proteína por litro, por lo menos 75 microgramos de proteína por litro, por lo menos 100 microgramos de proteína por litro, por lo menos 200 microgramos de proteína por litro, por lo menos 250 microgramos de proteína por litro, por lo menos 500 microgramos de proteína por litro, por lo menos 1 miligramo de proteína por litro, o por lo menos 10 miligramos de proteína por litro o más en por ejemplo, un lisado de célula, una solución reguladora del pH, una solución reguladora del pH farmacéutica u otra suspensión líquida (por ejemplo, en un volumen de, por ejemplo, cualquiera de aproximadamente 1 nL a aproximadamente 100 L) . La producción de grandes cantidades (por ejemplo, mayores que aquella común posible con otros métodos, por ejemplo traducción in vitro) de una proteína en una célula incluye por lo menos un alquinil aminoácido es un aspecto de la invención. La incorporación de un aminoácido no natural se puede hacer para por ejemplo, adaptar cambios en la estructura y/o función de proteína, por ejemplo para cambiar el tamaño, acidez, nucleofilicidad, enlace de hidrógeno, hidrofobicidad, capacidad de acceso de sitios objetivo de proteasa, apuntamiento a un porción (por ejemplo para una disposición de proteína), incorporación de etiquetas o grupos reactivos, etc. Las proteínas que incluyen un aminoácido no natural pueden tener propiedades catalíticas o físicas mejoradas o aún completamente nuevas. Por ejemplo, las siguientes propiedades son opcionalmente modificadas mediante la inclusión de un aminoácido no natural a una proteína: toxicidad, biodistribución, propiedades estructurales, propiedades espectroscópicas, propiedades químicas y/o fotoquímicas, habilidad catalítica, vida media (por ejemplo vida media en el suero) , habilidad para reaccionar con otras células, por ejemplo covalentemente o no covalentemente y los semejantes.
Las composiciones incluyen proteínas que incluyen por lo menos un aminoácido no natural son útiles para, por ejemplo, nuevos terapéuticos, diagnósticos, enzimas catalíticas, enzimas industriales, proteínas de enlace (por ejemplo, anticuerpos) y por ejemplo el estudio de estructura y función de proteína. Véase por ejemplo, Dougherty, (2000) Amino Acids as Probes of Pro tein Struc ture and Function, Current Opinión in Chemical Biology, 4:645-652. En algunos aspectos de la invención, una composición incluye por lo menos una proteína con por lo menos uno, por ejemplo por lo menos dos, por lo menos tres, por lo menos cuatro, por lo menos cinco, por lo menos seis, por lo menos siete, por lo menos ocho, por lo menos nueve, o por lo menos diez o más aminoácidos no naturales. Los aminoácidos no naturales pueden ser los mismos o diferentes, por ejemplo, pueden haber 1, 2, 3, 4, 5, 6, 7, 8, 9 ó 10 o más sitios diferentes en las proteínas que comprenden 1, 2, 3, 4, 5, 6, 7, 8, 9 ó 10 o más aminoácidos no naturales diferentes. En otro aspecto, una composición incluye una proteína con por lo menos uno, pero menos de todos, de un aminoácido particular presente en la proteína es un aminoácido no natural . Para una proteína dada con más de un aminoácido no natural, los aminoácidos no naturales pueden ser idénticos o diferentes (por ejemplo, la proteína puede incluir dos o más tipos diferentes de aminoácidos no naturales, o puede incluir dos del mismo aminoácido no natural) . Para una proteína dada con más de dos aminoácidos no naturales, los aminoácidos no naturales pueden ser los mismos, diferentes o una combinación de un aminoácido no natural múltiple de la misma clase con por lo menos un aminoácido no natural diferente. Esencialmente cualquier proteína (o porción de la misma) que incluye un alquinil aminoácido (y cualquier ácido nucleico de codificación correspondiente, que incluye uno o más codones selectores) pueden ser producidos usando las composiciones y métodos de la presente. No se hace el intento de identificar los cientos de miles de proteínas conocidas, cualquiera de las cuales puede ser modificada para incluir uno o más aminoácidos no naturales, por ejemplo mediante adaptación de cualesquier métodos de mutación disponibles para incluir uno o más codones selectores apropiados en un sistema de traducción relevante. Repertorios de secuencia comunes para proteínas conocidas incluyen GenBank EMBL, DDBJ y el NCBI . Otros repertorios pueden ser identificados fácilmente al buscar en internet . Comúnmente, las proteínas son por ejemplo, por lo menos 60%, por lo menos 70%, por lo menos 75%, por lo menos 80%, por lo menos 90%, por lo menos 95%, o por lo menos 99% o más idénticas a cualquier proteína disponible (por ejemplo, una proteína terapéutica, una proteína de diagnóstico, una enzima industrial, o porción de las mismas y los semejantes) y comprenden uno o más aminoácidos no naturales. Ejemplos de proteínas terapéuticas, de diagnóstico y otras proteínas que pueden ser modificadas para comprender uno o más aminoácidos no naturales se pueden encontrar, pero no limitadas a, aquellas en las publicaciones internacionales WO 2004/094593, presentado el 16 de abril de 2004, intitulada "Expanding the Eukaryotic Genetic Code", y WO 2002/085923, intitulado "IN VIVO INCORPORATION OF UNNATURAL AMINO ACIDS" . Ejemplos de proteínas terapéuticas, de diagnóstico y otras proteínas que pueden ser modificadas para comprender uno o más aminoácidos no naturales incluyen, pero no están limitadas a, por ejemplo alfa-1 antitripsma, angiostatma, factor antihemolítico, anticuerpos (detalles adicionales en cuanto a anticuerpos se encuentran posteriormente en la presente), apolipoproteína, apoproteína, factor natpurético atrial, polipéptido natriurético atpal, péptidos atriales, C-X-C quimiocmas (por ejemplo, T39765, NAP-2, ENA-78, Gro-a, Gro-b, Gro-c, IP-10, GCP-2, NAP-4, SDF-1, PF4 , MIG) , calcitonina, CC quimiocmas (por ejemplo, proteína-1 quimioatrayente de monocito, proteína-2 quimioatrayente de monocito, proteína-3 qui ioatrayente de monocito, proteína-1 alfa inflamatoria de monocito, proteína-1 beta inflamatoria de monocito, RANTES , 1309, R83915, R91733, HCC1, T58847, D31065, T64262) , ligando CD40, ligando C-kit, colágeno, factor estimulador de colonia (CSF) , factor 5a de complemento, inhibidor de complemento, receptor 1 de complemento, citocmas (por ejemplo, péptido-78 activador de neutrófilo epitelial, GROa/MGSA, GROß, GRO?, MlP-la, MlP-ld, MCP-1) , factor de crecimiento epidérmico (EGF), eritropoyetina ("EPO"), toxinas A y B exfoliadoras, factor IX, factor VII, factor VIII, factor X, factor de crecimiento de fibroblasto (FGF) , fibrinógeno, fibronectina, G-CSF, GM-CSF, glucocerebrosidasa, gonadotropina, factores de crecimiento, proteínas de Hedgehog (por ejemplo, sónica, india, desierto), hemoglobina, factor de crecimiento de hepatocito (HGF) , hirudina, albúmina de suero humano, insulina, factor de crecimiento semejante a insulina (IGF), interferones (por ejemplo, IFN-a, IFN-ß, IFN-?) , interleucinas (por ejemplo, IL-1, IL-2, IL-3, IL-4, IL-5, IL-6, IL-7, IL-8, IL-9, IL-10, IL-11, IL-12, etc.), factor de crecimiento de queratinocito (KGF), lactoferrina, factor inhibidor de leucemia, luciferasa, neurturina, factor inhibidor de neutrófilo (NIF) , oncostatina M, proteína osteogénica, hormona paratiroides, PD-ECSF, PDGF, hormonas de péptido (por ejemplo, hormona de crecimiento humano) , pleiotropina, proteína A, proteína G, exotoxinas pirogénicas A, B y C, relaxina, renina, SCF, receptor de complemento soluble, I -CAM 1 soluble, receptores de interleucina solubles (IL-1, 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 14, 15), receptor de TNF soluble, somatomedina, somatostatina, somatotropina, estreptoquinasa, superantígenos, esto es, enterotoxinas estafilococales (SEA, SEB, SEC1, SEC2 , SEC3 , SED, SEE), superóxido dismutasa (SOD), toxina de síndrome de choque tóxico (TSST-1) , timosina alfa 1, activador de plasminógeno de tejido, factor veta de necrosis de tumor (TNF beta) , receptor del factor de necrosis de tumor (TNFR) , factor-alfa de necrosis de tumor (TNF alfa) , factor de crecimiento endotelial vascular (VEGEF) , urocinasa y muchos otros Una clase de proteínas que pueden ser elaboradas usando las composiciones y métodos para incorporación in vivo de alquinil aminoácidos descritos en la presente incluye moduladores transcripcionales o una porción de los mismos. Moduladores transcripcionales ejemplares incluyen genes y proteínas moduladoras transcripcionales que modula en crecimiento de la célula, diferenciación, regulación o los semejantes. Moduladores transcripcionales son encontrados en procariontes, virus y eucariontes, en los que se incluyen hongos, plantas, levaduras, insectos y animales en los que se incluyen mamíferos que proporcionan un amplio intervalo de objetivos terapéuticos. Se apreciará que los activadores de expresión y transcripción regulan la transcripción mediante muchos mecanismos, por ejemplo mediante enlace a receptores, estimulación de una cascada de transducción de señal, regulación de expresión de factores de transcripción, enlace a promotores y mejoradores, enlace a proteínas que se enlazan a promotores y mejoradores, desenrollamiento de ADN, empalme de pre -mARN , poliadenilación de ARN y degradación de AR?. Una clase de proteínas de la invención (por ejemplo, proteínas con uno o más alquinil aminoácidos) incluyen proteínas biológicamente activas tales como citocinas, moléculas inflamatorias, factores de crecimiento, sus receptores, y productos oncógenos, por ejemplo, interleucinas (por ejemplo, IL-I, IL-2, IL-8, etc.), interferones, FGF, IGF-I, IGF-II, FGF, PDGF, TNF, TGF-a, TGF-ß, EGF, KGF, SCF/c-Kit, CD40L/CD40, VLA-4/VCAM- 1 , ICAM- l/LFA- 1 , e hialaurin/CD44 ; moléculas de traducción de señal y productos oncógenos correspondientes, por ejemplo, Mos, Ras, Raf, y Met; y activadores y supresores transcripcionales, por ejemplo, p53, Tat, Fos, Myc, Jun, Myb, Reí, y receptores de hormona de esteroides tales como aquellos para estrógeno, progesterona, testosterona, aldosterona, el ligando de receptor LDL y corticosterona . Las enzimas (por ejemplo, enzimas industriales) o porciones de las mismas con por lo menos un alquinil aminoácido son también provistas por la invención. Ejemplos de enzimas incluyen, pero no están limitados a, por ejemplo, amidasas, racemasas de aminoácido, acilasas, deshalogenasas , dioxigenasas , diarilpropano peroxidasas, epimerasas, epóxido hidrolasas, esterasas, isomerasas, cinasas, glucosa isomerasas, glicosidasas , glicosil transíerasas, haloperoxidasas, monooxigenasas (por ejemplo, p450) , lipasas, peroxidasas de lignina, nitrilo hidratasas, nitrilasas, proteasas, fosfatasas, subtilisinas, transaminasa y nucleasas.
Muchas de estas proteínas están disponibles comercialmente (véase, por ejemplo, el catálogo de Sigma BioSciences 2002 y lista de precios) y las secuencias de proteína correspondientes y genes y comúnmente, muchas variantes de los mismos, son bien conocidos (véase, por ejemplo, Genbank) . Cualquiera de ellos puede ser modificado mediante la inserción de uno o más alqumil aminoácido de acuerdo con la invención, por ejemplo para alterar la proteína con respecto a una o más propiedades terapéuticas, de diagnóstico o enzimáticas de interés. Ejemplos de propiedades terapéuticamente relevantes incluyen vida media en el suero, vida media en almacenamiento, estabilidad, mmunogenicidad, actividad terapéutica, detectabilidad (por ejemplo, mediante la inclusión de grupos reportero (por ejemplo, etiquetas o sitio de enlace de etiquetas) en los aminoácidos no naturales) , reducción de LD50 u otro efectos laterales, habilidad para entrar el cuerpo a través del sistema gástrico (por ejemplo, disponibilidad oral) o los semejantes Ejemplos de propiedades de diagnóstico incluyen vida media en el suero, estabilidad, actividad de diagnóstico, detectabilidad o los semejantes. Ejemplos de propiedades enzimáticas relevantes incluyen vida media en almacenamiento, estabilidad, actividad enzimática, capacidad de producción o los semejantes. Una variedad de otras proteínas pueden también ser modificaciones para incluir uno o más alqumil aminoácidos utilizando composiciones y métodos de la invención. Por ejemplo, la invención puede incluir sustitución de uno o más aminoácidos naturales en una o más proteínas de vacuna con un alquinil aminoácido, por ejemplo en proteínas de hongos infecciosos, por ejemplo especie Aspergillus, Candida ; bacterias, particularmente E . coli , que sirve como modelo para bacterias patógenas, también como bacterias médicamente importantes tales como Staphylococci (por ejemplo, aureus) o Streptococci (por ejemplo, pneumoniae) ; protozoarios tales como esporozoarios (por ejemplo, Plasmodia) , rhi zopodos (por ejemplo, En tamoeba) y flagelados { Trypanosoma , Lei shmania , Tri chomonas , Giardia , etc.); virus tales como virus (+) ARN (ejemplos incluyen Poxvirus por ejemplo, vaccinia ; Picornavirus , por ejemplo polio; Togavirus, por ejemplo, rubella ; Flavivirus, por ejemplo, HCV; y Coronavirus), virus (-) ARN (por ejemplo, Rhabdoviruses, por ejemplo, VSV; paramixovimces , por ejemplo, RSV; Ortomixovimses , por ejemplo, influenza; Bunyavirus y Arenavirus) , virus de dsADA (Reovirus, por ejemplo) , virus de ARN a ADN, esto es, retrovirus, por ejemplo, HIV y HTLV, y ciertos virus de ADN a ARN tales como Hepatitis B. Las proteínas relacionadas agrícolamente tales como proteínas resistentes a insectos (por ejemplo, las proteínas Cry) , enzimas de producción de almidón y lípido, toxinas de plantas e insectos, proteínas de resistencia a toxina, proteínas de destoxificación de Micotoxina, enzimas de crecimiento de plantas (por ejemplo, Ribulosa 1 , 5-bisfosfato carboxilasa/oxigenasa, "RUBISCO"), lipoxigenasa (LOX), y fosfoeolpiruvato (PEP) carboxilasa son también objetivos apropiados para la modificación de alquinil aminoácido. En ciertas modalidades, la proteína o polipéptido de interés (o porción de la misma) en los métodos y/o composiciones de la invención es codificado por un ácido nucleico. Comúnmente, el ácido nucleico comprende por lo menos un codón selector, por lo menos dos codones selectores, por lo menos tres codones selectores, por lo menos cuadro codones selectores, por lo menos cinco codones selectores, por lo menos seis codones selectores, por lo menos siete codones selectores, por lo menos ocho codones selectores, por lo menos nueve codones selectores, diez o más codones selectores. Genes que codifican para proteínas o polipéptido de interés pueden ser mutagenizados usando métodos bien conocidos para aquel de habilidad en el arte and descritos en la presente bajo "Mutagénesis y otras técnicas de biológica molecular" para incluir, por ejemplo, uno o más codones selectores para la incorporación de un aminoácido no natural. Por ejemplo, un ácido nucleico para una proteína de interés es mutagenizado para incluir uno o más codones selectores, proporcionando la inserción de uno o más aminoácido no naturales. La invención incluye cualquiera de tales variantes, por ejemplo, mutantes, versiones de cualquier proteína, por ejemplo que incluyen por lo menos un aminoácido no natural. Similarmente, la invención también incluye ácidos nucleicos correspondientes, esto es cualquier ácido nucleico con uno o más codones selectores que codifica uno o más aminoácidos no naturales. Para fabricar una proteína que incluye un aminoácido no naturales, se pueden usar células huésped y organismos que están adaptados para incorporación in vivo del aminoácido no natural vía pares de tARN/RS ortogonales. Las células huésped son diseñadas genéticamente (por ejemplo, transformadas, sometidas a transducción o transfectadas) con uno o más vectores que expresan el tARN ortogonal, la tARN sintetasa ortogonal y un vector que codifica la proteína a ser derivada. Cada uno de estos componentes pueden estar en el mismo vector o pueden estar en un vector separado o dos componentes pueden estar en un vector y el tercer componente sobre un segundo vector. El vector puede por ejemplo estar en forma de plásmido, una bacteria, un virus, un polinucleótido desnudo o un polinucleótido conjugado.
Definición de polipéptidos mediante inmunoreactividad Debido a que los polipéptidos de la invención proporcionan una variedad de nuevas secuencias de polipéptidos (por ejemplo, polipéptidos que comprenden alquinil aminoácidos en el caso de proteínas sintetizadas en los sistemas de traducción en la presente o por ejemplo, en el caso de las nuevas sintetasas, nuevas secuencias de aminoácidos estándar), los polipéptidos también proporcionan nuevos aspectos estructurales que pueden ser reconocidos, por ejemplo en pruebas inmunológicas . La generación de antisueros, que se enlazan específicamente a los polipéptidos de la invención, también como los polipéptidos que son enlazados por tales antisueros, son un aspecto de la invención. El término "anticuerpo", como se usa en la presente, incluyen pero no está limitado a un polipéptido codificado sustancialmente por un gen de inmunoglobulina o genes de inmunoglobulina o fragmentos de los mismos que se enlazan específicamente y reconocen un analito (antígeno). Ejemplos incluyen anticuerpos policlonales, monoclonales, quiméricos y anticuerpos de una sola cadena y los semejantes. Fragmentos de inmunoglobulinas en los que se incluyen fragmentos de Fab y fragmentos producidos mediante una biblioteca de expresión, en las que se incluyen exhibición de fago, también están incluidos en el término "anticuerpo" como se usa en la presente. Véase por ejemplo, Paul, Fundamental Immunology, 4th Ed., 1999, Raven Press, New York, para la estructura y terminología de anticuerpos. Con el fin de producir antisueros para el uso en un inmunoanálisis o prueba inmunológica, uno o más de los polipéptidos inmunogénicos es producido y purificado como se describe en la presente. Por ejemplo, se puede producir proteína recombinante en una célula recombinante. Una cepa endógama de ratones (utilizados en este análisis debido a que los resultados son más reproducibles debido a la identidad genética virtual de los ratones) son inmunizados con la(s) proteína (s) inmunógena (s) en combinación con un adyuvante estándar, tal como adyuvante de Freund y un protocolo de inmunización de ratón estándar (véase, por ejemplo Harlow and Lañe (1988) Antibodies, A Laboratory Manual, Cold Spring Harbor Publications, New York, para una descripción estándar de generación de anticuerpos, formatos de pruebas inmunológicas y condiciones que pueden ser usadas para determinar la inmunoreactividad específica. Datos adicionales en cuanto a proteínas, anticuerpos, antisueros, etc. se pueden encontrar en las publicaciones internacionales Números WO 2004/094593, intitulada "EXPANDING THE EUKARYOTIC GENETIC CODE;" WO 2002/085923, intitulada "IN VIVO INCORPORATION OF UNNATURAL AMINO ACID"; WO 2004/035605, intitulada "GLYCOPROTEIN SYNTHESIS"; y WO 2004/058946, intitulada "PROTEIN ARRAYS".
USO DE O-tARN, O-RS Y PARES DE O-tARN/O-RS Las composiciones de la invención y composiciones elaborados mediante los métodos de la invención están opcionalmente en una célula. Los pares de O-tARN/O-RS o componentes individuales de la invención pueden luego ser usados en una maquinaria de traducción del sistema huésped, que da como resultado un alquinil aminoácido que es incorporado a una proteína. La publicación internacional No. WO 2002/085923 de Schultz, et al., intitulada "IN VIVO INCORPORATION OF UNNATURAL AMINO ACIDS," describe este proceso y es incorporado en la presente por referencia. Por ejemplo, cuando se introduce un par de O-tARN/O-RS a un huésped, por ejemplo Escheri chia coli o levadura, el par conduce la incorporación in vivo de un aminoácido no natural, que puede ser agregado exógenamente al medio de cultivo, a una proteína, por ejemplo una proteína de prueba de mioglobina o una proteína terapéutica, en respuesta a un codón selector, por ejemplo un codón sin sentido ámbar. Opcionalmente, las composiciones de la invención pueden estar en un sistema de traducción in vitro o en un (os) sistema (s) in vivo celular. Las proteínas con el aminoácido no natural pueden ser usadas en cualquiera de un amplio intervalo de aplicaciones. Por ejemplo, la porción no natural incorporada a una proteína puede servir como objetivo para cualquiera de un amplio intervalo de modificaciones. Por ejemplo, reticulación con otras proteínas, con moléculas pequeñas tales como etiquetas o tintes y/o biomoléculas. Con estas modificaciones, la incorporación del aminoácido no natural puede dar como resultado proteínas terapéuticas mejoradas y puede ser usado para alterar o mejorar la función catalítica de enzimas. En algunos aspectos, la incorporación y modificación subsecuente de un aminoácido no natural en una proteína puede facilitar estudios en cuanto a estructura de proteína, interacciones con otras proteínas y los semejantes.
FOTOREGULACION Y FOTOENJAULAMIENTO Los aminoácidos fotoregulados (por ejemplo fotocrómicos , fotoescindibles , fotoisomerizables , etc.) pueden ser usados para controlar espacial y temporalmente una variedad de procesos biológicos, por ejemplo, al regular directamente la actividad de enzimas, receptores, canales de iones o los semejantes o al modular las concentraciones intracelulares de varias moléculas de señalización. Véase por ejemplo Shigeri et al., Pharmacol. Therapeut . , 2001, 91:85; Curley, et al., Pharmacol. Therapeut., 1999, 82:347; Curley, et al., Curr. Op . Chem. Bio., 1999, 3:84; "Caged Compounds" Methods in Enzymology, Marriott, G., Ed, Academic Press, NY, 1998, V. 291; Adams, et al., Annu . Rev. Physiol . , 1993, 55:755+; y Bochet, et al., J. Chem. Soc., Perkin 1, 2002, 125. En varias modalidades en la presente, las composiciones y métodos comprenden aminoácidos fotoregulados . Por ejemplo, la invención proporciona sistemas de traducción ortogonales para la incorporación de los aminoácidos no naturales fotoregulados 0-nitrobencil-serina y O- (2-nitrobencil) -L-tirosina (véase, figura 1 y ejemplos 8 y 9) . "Aminoácidos fotoregulados" son comúnmente, por ejemplo aminoácidos fotosensibles. Los aminoácidos fotoregulados son en general aquellos que son controlados de alguna manera por la luz (por ejemplo UV, IR, etc.) . Así, por ejemplo, si un aminoácido fotoregulado es incorporado a un polipéptido que tiene actividad biológica, la iluminación puede alterar el aminoácido, cambiando mediante esto la actividad biológica del péptido. Algunos aminoácidos fotoregulados pueden comprender "aminoácidos fotoenj aulados" , "aminoácidos fotosensibles", "aminoácidos fotolábiles" , "fotoisomerizables" , etc. "Especies enjauladas" tales como aminoácidos enjaulados o péptidos enjaulados, son aquellos atrapados al interior de una entidad más grande (por ejemplo molécula) y que son liberados después de iluminación específica. Véase, por ejemplo Adams , et al., Annu. Rev. Physiol., 1993, 55:755-784. Grupos "enjaulantes" de aminoácido pueden inhibir u ocultar (por ejemplo, al romper enlaces que usualmente estabilizarían interacciones con moléculas objetivo al cambiar la hidrofobicidad o carácter iónico de una cadena lateral particular o mediante impedimento esterico, etc.) la actividad biológica en una molécula, por ejemplo un péptido que comprende tal aminoácido. los aminoácidos "fotoisomerizables" pueden cambiar formas de isómero debido a la exposición a la luz. Los diferentes isómeros de tales aminoácidos pueden terminar hasta teniendo interacciones diferentes con otras cadenas laterales en una proteína después de la incorporación. Los aminoácidos fotoregulados pueden así regular la actividad biológica 8 ya sea por medio de activación, activación parcial, desactivación, desactivación parcial, activación modificada, etc.) de los péptidos en los cuales están presentes. Véase Adams al que se hace referencia anteriormente y otras referencias en esta sección para definiciones y ejemplos adicionales de aminoácidos y moléculas fotoregulados . Un número de aminoácidos fotoregulados son conocidos en el arte y muchos están disponibles comercialmente. Métodos para anexar y/o asociar porciones fotoreguladoras a aminoácidos son también conocidos. Tales aminoácidos fotoregulados en general son propensos a varias modalidades en la presente. Se apreciará que en tanto que un número de porciones fotoreguladoras posibles, por ejemplo grupos fotoenj aulantes y los semejantes, también como un número de aminoácidos fotoregulados son enlistados en la presentado, tal cita o debe ser interpretada como limitante. Así, la presente invención también es propensa a porciones fotoreguladoras y aminoácidos fotoregulados que no son citados específicamente en la presente. Como se afirma, un número de métodos son aplicables opcionalmente para crear un aminoácido fotoregulado. Así, por ejemplo, un aminoácido fotoregulado, por ejemplo un aminoácido fotoenj aulado puede ser creado al proteger su grupo alfa-amino con compuestos tales como BOC (butiloxicarbonilo) , y proteger el grupo a-carboxilo con compuestos tales como un éster t-butilo. Tal protección puede ser seguida por reacción de la cadena lateral de aminoácido con un grupo enjaulante fotolábil tal como 2-nitrobencilo, en una forma reactiva tal como 2-nitrobencilcloroformiato, un metil éster de bromuro de a-carboxil 2 -nitrobencilo o 2 -nitrobencil diazoetano. Después que el grupo fotolábil enjaulado es agregado, los grupos protectores pueden ser removidos vía procedimientos estándar. Véase, por ejemplo, USPN 5,998,580. Como otro ejemplo, residuos de lisina pueden ser enjaulados utilizando 2 -nitrobencilcloroformiato para derivar el grupo e -lisina amino eliminando así la carga positiva. Alternativamente, la lisina puede ser enjaulada al introducir una carga negativa a un péptido (que tiene tal lisina) mediante el uso de un grupo enjaulante de a-carboxi 2-nitrobenciloxicarbonilo . Adicionalmente, fosfoserina y fosfotreonina pueden ser enjaulados mediante tratamiento del fosfoaminoácido o el fosfopéptido con 1(2-nitrofenil) diazoetano . Véase, por ejemplo, Walker et al., Meth Enzymol. 172:288-301, 1989. Un número de otros aminoácidos también son fácilmente propensos a química de enjaulamiento estándar, por ejemplo serina, treonina, histidina, glutamina, asparagina, ácido aspártico y ácido glutámico. Véase, por ejemplo, Wilcox et al., J. Org. Chem. 55:1585-1589, 1990). Otra vez, se apreciará que la cita de aminoácidos fotoregulados particulares (aminoácidos y/o aquellos capaces de ser convertidos en formas fotoreguladas) no deben ser tomado necesariamente como limitante. Residuos de aminoácido pueden también hacerse fotoregulados (por ejemplo, fotosensibles o fotolábiles) de otras maneras. Por ejemplo, ciertos residuos de aminoácidos pueden ser creados en donde la irradiación provoca escisión de una cadena fundamental de péptido que en el residuo de aminoácido particular. Por ejemplo, una glicina fotolábil, 2-nitrofenil glicina, puede funcionar de tal manera. Véase, por ejemplo, Davis, et al., 1973, J. Med. Chem., 16:1043-1045. La irradiación de péptidos que tienen 2-nitrofenilglicina escindirá la cadena fundamental del péptido entre el carbono alfa y el grupo alfa amino de 2 -nitrofenilglicina . Tal estrategia de escisión es en general aplicable a aminoácidos diferentes que la glicina, si el grupo 2 -nitrobencilo es insertado entre el carbono alfa y el grupo alfa amino. Un gran número de grupos fotoreguladores , por ejemplo, grupos enjaulantes y un número de compuestos reactivos usados para anexar covalentemente tales grupos a otras moléculas tales como aminoácidos, son bien conocidos en el arte. Ejemplos de grupos fotoreguladores (por ejemplo, fotolábiles, enjaulantes) incluyen, pero no están limitados a: o-nitrobencil-serina, O- (2-nitrobencil) -L-tirosina, nitroindolinas ; N-acil-7-nitroindolinas ; fenacilos; hidroxifenacilo; 7-hidroxicoumarin-4-ilmetilos bromados (por ejemplo, Bhc) ; esteres de benzoína; dimetoxibenzoína; meta- fenoles; 2-nitrobencilo; 1- (4 , 5-dimetoxi-2-nitrofenil) etilo (DMNPE) ; 4 , 5-dimetoxi-2 -nitrobencilo (DMNB) ; alfa-carboxi-2-nitrobencilo (CNB) ; 1- (2-nitrofenil) etilo (NPE) ; 5-carboximetoxi-2 -nitrobencilo (CMNB) ; (5-carboximetoxi-2 -nitrobencil ) oxi) carbonilo; (4 , 5-dimetoxi-2 -nitrobencil) oxi) carbonilo; desoxibenzoinilo ; y los semejantes. Véase, por ejemplo, USPN 5,635,608 a Haugland y Gee (3 de junio de 1997) intitulado "a-carboxy caged compounds" Neuro 19, 465 (1997); J Physiol 508.3, 801 (1998); Proc Nati Acad Sci USA 1988 Sep, 85 (17) :6571-5; J Biol Chem 1997 Feb 14, 272 (7) : 4172 -8 ; Neuron , 619-624, 1998; Nature Genetics, vol. 28:2001:317-325; Nature, vol. 392,1998:936-941; Pan, P., and Bayley, H. "Caged cistein and thiophosphoryl peptides" FEBS Letters 405:81-85 (1997); Pettit et al. (1997) "Chemical two-photon uncaging: a novel approach to mapping glutamate receptors" Neuron 19:465-471; Furuta et al. (1999) "Brominated 7-hidroxycoumarin-4 -ylmethyls: novel photolabile protecting groups with biologically useful cross-sections for two photon photolysis" Proc. Nati. Acad. Sci. 96 (4 ): 1193 -1200 ; Zou et al. "Catalytic subunit of protein kinase A caged at the activating phosphotreonine" J. Amer. Chem. Soc. (2002) 124:8220-8229; Zou et al. "Caged Thiophosphotyrosine Peptides" Angew. Chem. Int. Ed. (2001) 40:3049-3051; Conrad II et al. "p-Hydroxyphenacyl Phototriggers : The reactive Excited State de Phosphate Photorelease" J. Am. Chem. Soc. (2000) 122:9346-9347; Conrad II et al. "New Phototriggers 10: Extending the p,p* Absorption to Reléase Peptides ín Biological Media" Org. Lett . (2000) 2:1545-1547; Givens et al. "A New Phototriggers 9: p-Hydroxyphenacyl as a C-Termmus Photoremovable Protecting Group for Oligopeptides" J. Am. Chem. Soc. (2000) 122:2687-2697, Bishop et al. "40-Am?nomet?l-2 , 20-b?pyr?dyl-4-carboxyl?c acid (Abe) and Related Derivatives: Novel Bipyridine Ammo Acids for the Solid-Phase Incorporation of a Metal Coordination Site Withm a Peptide Backbone" Tetrahedron (2000) 56:4629-4638; Chmg et al. "Polymers As Surface-Based Tethers with Photolytic tnggers Enablmg Láser- Induced Release/Desorption of Covalently Bound Molecules" Bioconj uga te Chemi s try (1996) 7.525-8, BioPiobes Handbook, 2002 from Molecular Probes, Inc., y Handbook of Fluorescent Probes and Research Products, Ninth Edition or Web Edition, from Molecular Probes, Inc, también como las referencias citadas en las mismas. Muchos compuestos, equipos, etc. para uso en el enj aulamiento de varias moléculas están disponibles comercialmente, por ejemplo de Molecular Probes, Inc. Referencias adicionales se encuentran en, por ejemplo, Memfield, Science 232:341 (1986) and Come, J. E. T. and Trentham, D. R. (1993) En: Biological Applications of Photochemical Switches, ed., Morrison, H., John Wiley and Sons, Inc. New York, pp . 243-305. Ejemplos de grupos en auladores fotosensibles apropiados incluyen, pero no están limitados a, 2-n?trobenc?lo, esteres de benzoína, N-ac?l-7-n?t?ndolmas, meta-fenoles, y fenacilos. En algunas modalidades, un grupo fotoregulador (por ejemplo, enjaulante) puede comprende opcionalmente una primera porción de enlace, la cual se puede enlazar a una segunda porción enlazante Por ejemplo, una fosforamidita enjaulada disponible comercialmente [1-N- (4 , 4 ' -dimetoxitptil) -5- (6-biotmamidocaproamidometil ) -1- (2 -mtrofeml ) -etil] -2 -cianoetil - (N, N-dnsopropil) -fosforamidita (PC Biotina Phosphoramadite, de Glen Research Corp., www.glenres.com) comprende un grupo fotolábil y una biotma (la primera porción enlazante) . Una segunda porción enlazante, por ejemplo estreptavidma o avidma, puede así ser enlazada al grupo enjaulante, incrementando su volumen y su efectividad en el en aulamiento En ciertas modalidades, un componente enjaulado comprende dos o más grupos enjaulantes que comprenden cada uno una primera porción enlazante y la segunda porción enlazante puede enlazar dos o más primeras porciones enlazantes, simultáneamente Por ejemplo, el componente enjaulado puede comprender por lo menos dos grupos enjaulantes biotmilados , en enlace de estreptavidma a múltiples porciones de biotma sobre múltiples moléculas de componentes enjaulados enlaza los componentes enjaulados a una red grande. La escisión del grupo fotolábil que anexa la biotma al componente da como resultado la disociación de la red. Métodos tradicionales para crear polipéptidos enjaulados (en los que se incluyen, por ejemplo sustratos de péptido y proteínas tales como anticuerpos o factores de transcripción) incluyen, por ejemplo al hacer reaccionar un polipéptido con un compuesto enjaulante o mediante incorporación de un aminoácido enjaulado durante síntesis de un polipéptido. Véase, por ejemplo, patente estadounidense No. ,998,580 expedida a Fay et al. (7 de diciembre de 1999) intitulada "Photosensitive caged macromolecules" ; Kossel et al. (2001) PNAS 98:14702-14707; Trends Plant Sci (1999) 4:330-334; PNAS (1998) 95:1568-1573; J. Am. Chem. Soc. (2002) 124:8220-8229; Pharmacology & Therapeutics (2001) 91:85-92; y Angew . Chem. Int. Ed . Engl . (2001) 40:3049-3051. Un enlazador de polipéptido fotolábil (por ejemplo, para conexión de un dominio de transcripción de proteína y un sensor o los semejantes) puede por ejemplo comprender un aminoácido fotolábil tal como aquel descrito en la patente estadounidense No. 5,998,580. La irradiación con luz puede por ejemplo liberar un residuo de cadena lateral de un aminoácido que es importante para la actividad del polipéptido que comprende tal aminoácido. adicionalmente, en algunas modalidades, los aminoácidos sin enjaular pueden escindir la cadena fundamental del péptido del péptido que comprende el aminoácido y puede así, por ejemplo abrir un péptido cíclico a un péptido lineal con diferentes propiedades biológicas, etc. La activación de un péptido enjaulado se puede hacer por medio de destrucción de un grupo enjaulante fotosensible sobre un aminoácido fotoregulado mediante cualquier método estándar conocido para aquellos experimentados en el arte. Por ejemplo, un aminoácido fotosensible puede ser desenjaulado o activado mediante exposición a una fuente de luz convencional apropiado, tales como láseres (por ejemplo, que emiten en el intervalo de UV o intervalo infrarrojo) . Aquellos de habilidad en el arte estarán conscientes y familiarizados con un número de láseres apropiados de longitud de onda y energías apropiadas también como protocolos de aplicación apropiados (por ejemplo duración de exposición, etc.) que son aplicables para uso con aminoácidos fotoregulados tales como aquellos utilizados en la presente. La liberación de aminoácidos enjaulados fotoregulados permite el control de los péptidos que comprende tales aminoácidos. Tal control puede ser tanto en términos como de ubicación como en términos de tiempo. Por ejemplo, la exposición de láser enfocado pueden desenjaular aminoácidos en un sitio, en tanto que no desenjaula aminoácidos en otros sitios . Aquellos experimentados en el arte apreciarán una variedad de análisis que pueden ser usados para evaluar la actividad de un aminoácido fotoregulado, por ejemplo los análisis descritos en los ejemplos en la presente. Un amplio intervalo de por ejemplo, función celular, función de tejido, etc. pueden ser analizados antes y después de la introducción de un péptido que comprende un aminoácido fotoregulado a la célula o tejido, también como después de la liberación de la molécula fotoregulada . Las composiciones y métodos en la presente pueden ser utilizados en un número de aspectos, por ejemplo, los aminoácidos fotoregulados (por ejemplo, en péptido) pueden administrar composiciones terapéuticas a sitios discretos de un cuerpo, puesto que la liberación o activación/desactivación/etc . del aminoácido fotoregulado puede ser localizada a través de la exposición de luz apuntada, etc. También se apreciará que los métodos, estructuras y composiciones de la invención son aplicables para incorporación/uso de aminoácidos naturales fotoregulados (por ejemplo aquellos con porciones fotoreguladoras anexadas/asociadas con ellos) . Grupos fotocrómicos y fotoescindibles pueden ser usados para controlar espacial y temporalmente una variedad de procesos biológicos, ya sea al regular directamente la actividad de enzimas (véase, por ejemplo Westmark, et al., J. Am. Chem. Soc. 1993, 115:3416-19 y Hohsaka, et al., J. A . Chem. Soc. 1994, 116:413-4), receptores (véase, por ejemplo, Bartels, et al., Proc. Nati. Acad. Sci. USA, 1971, 68:1820-3; Lester, et al., Nature 1977, 266:373-4: Cruz, et al., J. Am. Chem. Soc, 2000, 122:8777-8; y Pollitt, et al., Angew. Chem. Int. Ed. Engl . , 1998, 37:2104-7), o canales de iones (véase, por ejemplo, Lien, et al., J. Am. Chem. Soc. 1996, 118:12222-3; Borisenko, et al., J. Am. Chem. Soc. 2000, 122:6364-70; y Banghart, et al., Nat. Neurosci . 2004, 7:1381-6.), o al modular las concentraciones intracelulares de varias moléculas de señalización (véase, por ejemplo, Adams , et al., Annu . Rev. Physiol. 1993, 55:755-84) . En general, esto requiere la modificación química ya sea de una proteína o molécula pequeña con un ligando fotoreactivo tal como azobenceno o un grupo nitrobencilo. La habilidad para incorporar genéticamente aminoácidos fotosensibles a proteínas en sitios definidos directamente en organismos vivientes extendería significativamente el alcance de esta técnica. Véase, por ejemplo, Wu, et al., J. Am. Chem. Soc. 2004, 126:14306-7.
EQUIPOS Los equipos también son un aspecto de la invención. Por ejemplo, un equipo para producir una proteína que comprende por lo menos un alquinil aminoácido en una célula es proporcionado, en donde el equipo incluye un recipiente que contiene una secuencia de polinucleótidos que codifica un O-tARN y/o un O-tARN y/o una secuencia de polinucleótidos que codifica una O-RS, y/o una O-RS. En una modalidad, el equipo incluye además un aminoácido no natural tal como p-etiltiocarbonil-L-fenilalanina, p- (3 -oxobutanoil) -L-fenilala-nina, 1 , 5-dansil-alanina, 7-amino-coumarina alanina, 7-hidroxi- coumarina alanina, o-nitrobencil-serina, 0- (2-nitrobencil) -L-tirosina, p-carboximetil-L-fenilalanina, p-ciano-L-fenilalanina, m-ciano-L-fenilalanina, bifenilalanina, 3-amino-L-tirosina, bipiridilalanina, p- (2 -amino-1-hidroxietil) -L-fenilalanina; p-isopropiltiocarbonil-L-fenilalanina; 3-nitro-L-tirosina o p-nitro-L-fenilalanina . En otra modalidad, el equipo comprende además materiales de instrucciones para producir la proteína .
EJEMPLOS Los siguientes ejemplos son ofrecidos para ilustrar pero no para limitar la invención reivindicada. Aquel de habilidad reconocerá una variedad de parámetros no críticos que pueden ser alterados sin desviarse del alcance de la invención reivindicada.
EJEMPLO 1 Componentes de traducción ortogonales para la incorporación in vivo de 3 -nitro-L- tirosina a proteínas en E. coli El presente ejemplo describe composiciones y métodos para la incorporación biosintética de 3 -nitro-L- tirosina (véase, figura 1) a proteínas utilizando maquinaria de traducción de célula de E. coli. Nuevos pares de tARN/sintetasa ortogonales derivados de M. jannaschii fueron aislados que funcionan en un sistema de célula huésped de E. coli.
Nuevas sintetasas ortogonales fueron derivadas de tirosil tARN sintetasa de M. jannaschii y fueron usadas en conjunción con el tirosil-tARNCuA supreso de M. jannaschii (SEQ ID NO: 1) . Estos nuevos pares ortogonales no tienen afinidad o tienen afinidad muy baja por cualquiera de los aminoácidos comunes (esto es, que se presentan de manera estable en la naturaleza) . Las tARN sintetasas ortogonales derivadas cargan selectivamente el tirosil -tARNCuA supresor ámbar con 3-nitro-L-tirosina. El tARN supresor aminoacilado (esto es, el tARN "cargado") es usado como sustrato mediante el aparato de traducción de E. coli endógeno para incorporar 3-nitro-L-tirosina en respuesta a un codón de retención ámbar TAG (un codón selector) encontrado en un transcripto. La ortogcnalidad de estos pares de tARN/sintetasa asegura que ni el tARN ni las sintetasas reaccionan de manera cruzada con tARN de E. coli endógenos o sintetasas y que el aminoácido no natural es administrado solamente en respuesta a TAG. Las nuevas sintetasas fueron aisladas utilizando protocolos descritos previamente, véase, por ejemplo, Alfonta et al., Journal of the American Chemical Society 125(48) : 14662-14663 (2003) ; y publicación internacional WO 2005/038002, publicada el 28 de abril de 2005. Una biblioteca de tirosil - tARN- sintetasa de M. jannaschii mutantes fue generada mediante mutagénesis de la tirosil-tAR?-sintetasa M. jannaschii tipo silvestre. Las secuencias de aminoácido y de polinucleótidos de la molécula de tirosil - tARN- sintetasa de M. jannaschii tipo silvestre son mostradas en la tabla 5 y provistas en SEQ ID NOS: 3 y 4, respectivamente. La mutagénesis consistió de aleaLorizar residuos de sitio activo predichos en base a la estructura cristalina de la tirosil tARN-smtetasa homologa de Baci ll us s tearo thermophi 1 us . Enseguida de la mutagénesis, el cúmulo de smtetasas en la biblioteca mutante se hizo pasar a través de cinco rondas de selección positiva y negativa. Esta selección produjo siete clones de smtetasa que tenían la habilidad de cargar el O-tARN con 3 -nitro-L-tirosma, denotados como clones A a G. Estos clones de smtetasa seleccionados fueron secuenciados y sus secuencias de aminoácido fueron determinadas, como sigue. Tabla 2 Todos los clones A, B, C, E y G convergieron a la misma secuencia de mutante. Los clones D y F mostraron secuencias diferentes. Las secuencias de aminoácido de estas sintetasas mutantes son provistas en la tabla 5, SEQ ID NOs : 7-9) . EJEMPLO 2 Componentes de traducción ortogonales para la incorporación in vivo de p-nitro-L-fenilalanina (N02-Phe) a proteínas en E. coli Este ejemplo describe la incorporación programada genéticamente, específica del sitio de p-nitro-L-fenilalanina (véase, figura 1; también escrita como N02-Phe) a proteínas en E. coli utilizando un nuevo sistema de traducción ortogonal. El aminoácido no natural N02-Phe se ha usado como sonda de marcación de fotoafinidad para estudiar la estructura del receptor de proteína (Dong, Mol. Pharmacol. 2005, 69, 1892), y como apagador de fluorescencia para investigar la actividad de proteasa (Wang, Biochem. Biophys . Res. Corran. 1994, 201:835) y estructura de proteína (Sisido, J. Am. Chem. Soc. 1998, 120:7520; 2002, 124:14586). Este aminoácido ha sido incorporado específicamente en el sitio a proteínas con un método biosintético in vitro utilizando codones de tres bases (Schultz, Science 1989, 244:182), de cuatro bases (M. Sisido) y cinco bases (M. Sisido, Nucleic Acids Res. 2001,29, 3646). Sin embargo, este procedimiento produce comúnmente solo pequeñas cantidades de proteína.
Además, el método está limitado debido a la necesidad de cantidades estequiométricas de tARN acilado y la incapacidad de regenerar el aminoacil - tARN . En vista de estas limitaciones, se desarrolló un nuevo sistema de traducción ortogonal in vivo para incorporar el aminoácido no natural directamente a proteínas, como se describe posteriormente en la presente. Para codificar genéticamente ?02-Phe en E. coli, la especificidad de una tirosil-tAR? sintetasa de Methanococcus jannaschi i ortogonal (MjTyrRS) fue alterada de tal manera que la sintetasa carga específicamente el tAR? supresor ámbar de tirosma mu it.an ^te i( mutR?AACUA. >) con e-l ami.noá-ci.d,o no natura?l „?„02- Phe . La sintetasa mutante fue derivada de la selección de una biblioteca de MjTyrRS mutante. Las posiciones para la mutagénesis en aquella biblioteca mutante fueron escogidas en vista del análisis de la estructura cristalina de una MjTyrRS mu *t.an«t-e que carga se ilec«t-i•v'amen-te mutR?ACUA con p-bromofenilalanina . Después de varias rondas de selección positiva y negativa utilizando CUA y la biblioteca MjTyrRS mutante en presencia o ausencia de ?02-Phe 1 mM, respectivamente, se desarrolló un clon cuya sobrevivencia a lata concentración de cloranfenicol (90 µg/mL) fue dependiente de la presencia de ?02-Phe. Además, la fluorescencia verde fue solamente observada para el clon seleccionado en presencia de ?02-Phe con un reportero T7/GFPuv con un codón selector ámbar en sitio dentro del gen reportero. Este resultado sugiere que la sintetasa desarrollada tiene especificidad más alta por N02-Phe que por cualquier otro aminoácido natural . La secuenciación del clon reveló las siguientes mutaciones en esta sintetasa evolucionada : Tyr32- Leu Glul07- Ser Aspl58- Pro Ilel59^Leu Hisl60->Asn Leul62- Glu La secuencia de nucleótidos de este clon es proporcionado en la Tabla 5, SEQ ID NO : 11, y la secuencia de aminoácido correspondiente es provista en la Tabla 5, SEQ ID NO: 10. Para probar la habilidad de la sintetasa evolucionada (mutN02 -PheRS) y CUA para incorporar selectivamente N02- Phe a proteínas, un codón de retención ámbar fue sustituido en un sitio permisivo (Lys7) en el gene para la proteína de dominio Z con una etiqueta His examérica C-terminal. Las células transformadas con mutN02-PheRS, CUA y el gen de dominio Z fueron cultivadas en presencia de N02-Phe 1 mM en medio mínimo de GMML. La proteína mutante fue purificada utilizando una columna de afinidad de Nl2+ y analizada subsecuentemente mediante SDS-PAGE (véase, la figura 2) y MALDI-TOF (figura 3) . La masa observada (m/e = 7958) del análisis de MALDI-TOF coincide con la masa esperada (m/e = 7958) para la proteína de dominio Z incorporada con N02-Phe. No se obtuvo ningún dominio Z en ausencia de N0 -Phe (véase, figura 1) , indicando una fidelidad muy alta en la incorporación del aminoácido no natural. Enseguida, se examinó la factibilidad de utilizar N02-Phe incorporado como apagador de fluorescencia. De las contrapartes de fluoróforo reportadas de N02-Phe tales como tirosina, triptófano, 1-pirenilalanina, y ácido ß-antraniloil-1-a, ß-diaminopropiónico, el par de triptófano/N02 fue escogido para incorporar un modelo de cremallera de leucina GCN4 , que forma un homodímero de bobina enrollada paralelo. La región de enlace de ADN del gen GCN4 (676-840 bp) , que no codifican ningún triptofan, fue clonada a partir del genoma de levadura al vector de expresión de proteína pET-26b. Subsecuentemente, se utilizó mutagénesis dirigida al sitio para sustituir aminoácidos en esta proteína en sitios específicos ya sea con triptófano o el aminoácido no natural N02-Phe (codificado por el codón selector TAG) . El vector de expresión GCN4 también como un plásmido que contiene tanto mutN02-PheRS y CUA fueron co-transformados a células BL21 de E. coli (DE3), las cuales fueron cultivadas en presencia de N02-Phe 1 mM en medio mínimo de GMML. Las proteínas mutantes de GCN4pl acumuladas fueron purificadas utilizando una columna de afinidad de Ni2+ y confirmadas mediante análisis de SDS-PAGE y MALDI-TOF. Los espectros de fluorescencia de estado estable fueron medidos para las proteínas mutantes purificadas. La figura 4A muestra el espectro de fluorescencia de la proteína mutante 22Trp sola y aquella de la mezcla de mutantes 22Trp y 22N02-Phe, en tanto que la figura 4B muestra el espectro de fluorescencia de la proteína mutante 55Trp y el espectro de la mezcla de mutantes 55Trp y 22N02-Phe. Un apagado de fluorescencia distinto fue observado en el par mutante 22Trp/22N02-Phe ; por otra parte no se obtuvo ningún apagado de fluorescencia significativo para el par de imitantes 55Trp/22N02-Phe . Este resultado muestra claramente que la interacción de fluoróforo/apagador entre el par de Trp/N02-Phe es dependiente de la distancia. Así, este sistema puede ser aplicado fácilmente al estudio de plegado de proteína y proteína-proteína también como interacciones de proteína-ligando.
EJEMPLO 3 Componentes de traducción ortogonales para la incorporación in vivo del aminoácido 3 -amino-L- tirosina redox activo a proteínas en E. coli El presente ejemplo describe composiciones y métodos para la incorporación biosintética de 3 -amino-L-tirosina (véase, figura 1; también escrita como NH2-YRS) a proteínas utilizando la maquinaria de traducción de célula huésped de E. coli. Nuevos pares de sintetasa/tARN ortogonales derivados de M. jannaschii para incorporar este aminoácido no natural fueron aislados que funcionan en un sistema de célula huésped de E. coli . Esta cadena lateral de aminoácido no natural es fácilmente oxidada a la correspondiente semiquinona y quinona, así puede ser usado tanto para sonda y para manipular el proceso de transferencia de electrones en proteínas. La forma de quinona oxidada se puede conjugar eficientemente con acrilamida por medio de una reacción de hetero-Diels-Alder . Esta última propiedad proporciona otro uso, es decir, en donde el aminoácido no natural sirve como mango para modificación química de proteínas. Nuevas sintetasas ortogonales fueron derivadas de tirosil tirosil-tARN sintetasa de M. jannaschii y fueron usadas en conjunción con el tARNCuA supresor de M. jannaschii (SEQ ID NO: 1) . Este nuevo par ortogonal no tiene afinidad o tiene afinidad muy baja por cualquiera de los aminoácidos comunes (esto es, que se presentan de manera estable en la naturaleza) . La tARN sintetasa ortogonal derivada carga selectivamente el tARNCUA supresor ámbar con 3 -amino-L-tirosina . El tARN supresor aminoacilado (esto es, el tAR? "cargado) es usado como sustrato por el aparato de traducción de E. coli endógeno para incorporar 3 -amino-L-tirosina en respuesta al codón de retención ámbar TABLETA (un codón selector) encontrado en un transcripto. La ortogonalidad de estos pares de tARN/sintetasa asegura que ni el tARN ni las sintetasas reacciona de manera cruzada con tARN de E. coli endógenos o sintetasas y que el aminoácido no natural es administrado solamente en respuesta a TAG. Las nuevas sintetasas fueron aisladas utilizando protocolos que han sido descritos previamente. Una biblioteca de mutantes de tirosil-tARN-sintetasa de M. jannaschii fue generada mediante mutagénesis de la tirosil tARN-sintetasa de M. jannaschii fue generada mediante mutagénesis de la tirosil-tARN-sintetasa de M. jannaschii tipo silvestre. La mutagénesis consistió de aleatorizar residuos de sitio activo predichos en base a la estructura cristalina de otras moléculas de aminoacil -tARN-sintetasa . Enseguida de la mutagénesis, el cúmulo de sintetasas en la biblioteca de mutantes fue sometido a múltiples rondas de selección positiva y negativa. Esta selección produjo un clon de sintetasa que tenía capacidad de cargar el O- tARN con 3-amino-L- tirosina . Este clon de sintetasa seleccionado tiene la secuencia de aminoácido mostrada en la Tabla 5, SEQ ID ?O : 12 y tiene la secuencia de polinucleótidos mostrada en la Tabla 5, SEQ ID ?O: 13.
EJEMPLO 4 Componentes de traducción ortogonales para la incorporación in vivo del aminoácido de p-carboximetil-L-fenilalanina que imita a fosfotirosina a proteínas E. coli El presente ejemplo describe composiciones y métodos para la incorporación biosintética de p-carboximetil-carboximetil-L-fenilalanina (véase figura 1, también escrito como pCMF) a proteínas utilizando la maquinaria de traducción de célula huésped de E. coli. Nuevos pares de sintetasa/tARN ortogonales derivados de M. jannaschii para incorporar este aminoácido no natural fueron aislados que funcionan en un sistema de célula huésped de E. coli. Esta cadena lateral de aminoácidos no natural puede ser usada como un imitador estable para la fosforilación de tirosina. La fosforilación de tirosina juega un papel importante para regular la transducción de señal celular en un amplio intervalo de procesos celulares, tales como crecimiento celular, regulación metabólica, regulación transcripcional y proliferación. La fosforilación de tirosina es un proceso reversible in vivo. La tendencia a desforilar tirosina mediante fosfatasas de tirosina endógenas interfiere con estudios de los efectos de la fosforilación de tirosina, impidiendo así la interpretación de estos estudios. El aminoácido p-carboximetil-L-fenilalanina es un imitador de fosfotirosina, es permeable a la célula y además, no sirve como sustrato para fosfatasas de tirosina. Este aminoácido no natural, cuando es incorporado a proteínas, puede ser usado para generar mutantes de proteína que son constitutivamente activos. Este aminoácido no natural puede también ser usado en el contexto de indicación de fago o exhibición de fago para seleccionar inhibidores a la proteína de fosfatasa tirosina de bibliotecas de péptido que contienen p-carboximetil -L-fenilalanina . Nuevas sintetasas ortogonales fueron derivadas de tirosil-tARN sintetasa de M. jannaschii y fueron usadas en conjunción con el tARNCuA supresor de M. jannaschii . Estos nuevos pares ortogonales no tienen afinidad o tienen afinidad muy baja por cualquiera de los aminoácidos comunes (esto es, que se presentan de manera estable en la naturaleza) . Las tARN sintetasas ortogonales derivadas cargan selectivamente el tARNCUA supresor ámbar con p-carboximetil -L-fenilalanina . El tARN supresor aminoacilado (esto es, el tARN "cargado") se usa como sustrato por el aparato de traducción de E. coli endógeno para incorporar p-carboximetil -L- fenilalanina en respuesta a un codón de retención ámbar TAG (un codón selector) encontrado en un transcripto. La ortogonalidad de estos pares de tARN/sintetasas asegura que ni el tARN ni las sintetasas reaccionan de manera cruzada con tARN de E. coli endógenos o sintetasas y que el aminoácido no natural es administrado solamente en respuesta a TAG. Se emprendió una búsqueda por sintetasas ortogonales que tienen la habilidad para cargar específicamente un tARN ortogonal con p-carboximetil -L-fenilalanina . Esta búsqueda utilizó protocolos que han sido descritos previamente. Una biblioteca de mutantes de tirosil-tARN-sintetasa de M. jannaschi i fue generada mediante mutagénesis de la tirosil-tARN-sintetasa de M. jannaschii de tipo silvestre, en donde la mutagénesis consistió de aleatorizar residuos de sitio activo predichos en base a la estructura cristalina de otras moléculas de aminoacil-tARN-sintetasa . Enseguida de la mutagénesis, la biblioteca de sintetasa mutante se hizo pasar a través de múltiples rondas de selección positiva y negativa. Esta selección produjo cinco clones de sintetasa que tienen la habilidad de cargar el O-tARN con p-carboximetil-L-fenilalanina . Estos clones de sintetasa fueron secuenciados y las secuencias de aminoácido fueron determinadas, como se muestra en la tabla 5. Las secuencias de aminoácido de estos clones de O-RS son proporcionadas en SEQ ID NOS: 14, 16, 18, 20 y 22. Las secuencias de nucleótidos de estos mismos clones de O-RS son provistas en SEQ ID NOS: 15, 17, 19, 21 y 23.
EJEMPLO 5 Componentes de traducción ortogonal para la incorporación in vivo del aminoácido no natural bifenilalanina hidrofóbico a proteínas en E. coli.
El presente ejemplo describe composiciones y métodos para la incorporación biosintética de bifenilalanina (véase, figura 1) a proteínas utilizando la maquinaria de traducción de célula huésped de E. coli. Nuevos pares de sintetasa/tARN ortogonales derivados de M. jannaschi i para incorporar este aminoácido no natural fueron aislados que funcionan en un sistema de célula huésped de E. coli. El aminoácido no natural de bifenilalanina tiene una cadena lateral aromática grande. Las interacciones hidrofóbicas son una de las fuerzas principales que impulsan las interacciones de plegado de proteína y proteína-proteína (las otras fuerza mayores son interacciones electrostáticas, enlaces de hidrógeno y fuerzas de van der waals) . Las interacciones hidrofóbicas están involucradas en muchos eventos biológicos, tales como transporte de proteínas a través de membranas celulares, agregación de proteína y catálisis de enzima. La hidrofobicidad de bifenilalanina es más alta que cualquiera de los veinte aminoácidos comunes. La incorporación de bifenilalanina a proteínas es una herramienta útil en el estudio y modulación de interacciones de empaque hidrofóbicas intramoleculares e intermoleculares en proteínas. Nuevas sintetasas ortogonales fueron derivadas de tirosina-tARN sintetasa de M. jannaschii y son usadas en conjunción con el tARNcuA supresor de M. jannaschii descrito previamente. Estos nuevos pares ortogonales no tienen afinidad o tienen afinidad muy baja por cualquiera de los aminoácidos comunes (esto es, que se presentan de manera estable en la naturaleza) . Las tARN sintetasas ortogonales derivadas cargan selectivamente el tARNCUA supresor ámbar con bifenilalanina . El tARN supresor aminoacilado (esto es, el tARN "cargado" es usado como sustrato para el aparato de traducción de E. coli endógeno para incorporar bifenilalanina en respuesta al codón de retención ámbar TAG (un codón selector) encontrado en un transcripto. La ortogonalidad de estos pares de tARN/sintetasa asegura que ni el tARN ni las sintetasas reaccionan de manera cruzada con tARN de E. coli endógenos o sintetasas y que el aminoácido no natural es suministrado solamente en respuesta a TAG. Se emprendió una búsqueda por sintetasas ortogonales que tienen la habilidad para cargar específicamente un tARN ortogonal con bifenilalanina . Esta búsqueda utilizó protocolos que han sido descritos previamente. Una biblioteca de mutantes de tirosil-tARN-sintetasa de M. jannaschii fue generada mediante mutagénesis de la tirosil- tARN-sintetasa de M. jannaschii de tipo silvestre, en donde la mutagénesis consistió de aleatorizar los residuos de sitio activo predichos en base a la estructura cristalina de otras moléculas de aminoacil tARN-sintetasa . Enseguida de la mutagénesis, la biblioteca de sintetasa mutante se hizo para a través de múltiples rondas de selección positiva y negativa. Esta selección produjo siete clones de sintetasa que tenían la capacidad de cargar el O-tARN con bifenilalanina . Estos clones de sintetasa fueron secuenciados, como se muestra en la Tabla 5. Las secuencias de aminoácidos de estos clones de O-RS son proporcionadas en SEQ ID NOS: 24, 26, 28, 30, 32, 34 y 36. Las secuencias de nucleótidos correspondientes de estos mismos clones de O-RS son proporcionadas en SEQ ID NOS: 25, 27, 29, 31, 33, 35 y 37.
EJEMPLO 6 Componentes de traducción ortogonal para la incorporación in vivo del aminoácido no natural quelante de metal bipiridilalanina a proteínas en E. coli El presente ejemplo describe composiciones y métodos para la incorporación biosintética de bipiridilalanina (véase figura 1) a proteínas utilizando la maquinaria de traducción de célula huésped de E. coli. Nuevos pares de sintetasa/tARN ortogonales derivados de M. jannaschii para incorporar este aminoácido no natural fueron aislados que funcionan en un sistema de célula huésped de E. coli. El aminoácido no natural bipiridilalanina tiene la habilidad de quelar iones de metal. La porción N, N-bidentada de esta cadena lateral de aminoácido es un quelador fuerte para iones de metal de transición, tales como Cu2+, Fe2+, Ni2+, Zn2+ y Ru2+, etc. Este aminoácido quelador de metal puede ser usado para (1) introducir iones de metal redox activos o electrofílicos a proteínas, (2) forma complejos de ion de metal fluorescente tales como Ru(bpy)3, o (3) moderar la dimerización dependiente de ion de metal de proteínas que contienen bipiridilalanina. Nuevas sintetasas ortogonales fueron derivadas de tirosil tARN sintetasa de M. jannaschi i y fueron usadas en conjunción con el tARNCUA supresor de M. jannaschii . Los nuevos pares ortogonales no tienen afinidad o tienen afinidad muy baja por cualquiera de los aminoácidos comunes (esto es, que se presentan de manera estable en la naturaleza) . La tARN sintetasa ortogonal derivada carga selectivamente el tARNCUA supresor ámbar con bipiridilalanina. El tARN supresor aminoacilado (esto es, el tARN "cargado") es usado como sustrato por el aparato de traducción de E. coli endógeno para incorporar bipiridilalanina en respuesta al codón de retención ámbar TAG (un codón selector) encontrado en un transcripto. La ortogonalidad de estos pares de tAR?/sintetasas asegura que ni el tAR? ni las sintetasas reaccionan de manera cruzada con los tAR? de E. coli endógenos o sintetasas y que el aminoácido no natural es administrado solamente en respuesta a TAG. Se emprendió una búsqueda por sintetasa ortogonales que tienen la habilidad para cargar específicamente un tAR? ortogonal con bipiridilalanina. Esta búsqueda utilizó protocolos que han sido descritos previamente. Una biblioteca de mutantes de tirosil tARN- sintetasa de M. jannaschii fue generada mediante mutagénesis de la tirosil-tAR?-sintetasa de M. jannaschii de tipo silvestre, en donde la mutagénesis consistió de aleatorizar residuos de sitio activo predichos en base a la estructura cristalina de otra moléculas de aminoacil-tAR?- sintetasa . Enseguida de la mutagénesis, la biblioteca de sintetasa mutante se hizo pasar a través de múltiples rondas de selección positiva y negativa. Esta selección produjo dos clones de sintetasa que tenían la capacidad de cargar el O-tAR? con bipiridilalanina. Estos clones de sintetasa fueron secuenciados, como se muestra en la Tabla 5. Las secuencias de aminoácido de estos clones de O-RS son provistas en SEQ ID NOS: 38 y 40. Las secuencias de nucleótidos correspondientes de estos mismos clones de O-RS son provistas en SEQ ID NOS: 39 y 41.
EJEMPLO 7 Componentes de traducción ortogonales para la incorporación in vivo del aminoácido no natural fluorescente 1, 5-dansilalanina a proteínas en células huésped de levadura. El presente ejemplo describe composiciones y métodos para la incorporación biosintética de 1 , 5-dansilalanina (véase, figura 1) a proteínas utilizando la maquinaria de traducción de célula huésped de levadura. Nuevos pares de sintetasa/tARN ortogonales derivados de E. coli para incorporar este aminoácido no natural fueron aislados que funcionan en el sistema de célula huésped de levadura. La fluorescencia se ha convertido en una de las señales de detección más importantes en biotecnología debido a su alta sensibilidad y seguridad de manejo. Además, procesos como transferencia de energía de resonancia fluorescencia (FRET) o polarización de fluorescencia hacen posible el análisis en tiempo real de eventos de enlace biomoleculares , movimientos o cambios conformacionales . La metodología fluorescente actual para estudiar proteínas in vivo depende frecuentemente de constructos de fusión con proteínas fluorescentes grandes. Alternativamente, etiquetas orgánicas pequeñas pueden ser usadas para minimizar la perturbación estructural, pero exhiben regioselectividad deficiente, son citotóxicas y demandan la introducción de porciones de proteína de enlace de tinte y están más bien restringidas a la superficie de proteína. En contraste, un aminoácido fluorescente no contiene necesariamente grupos con potencial citotóxico, su introducción es solamente una alteración menor de la estructura de proteína y la marcación específica es posible en cualquier posición de la proteína in vivo. La presente invención proporciona componentes del sistema de traducción ortogonal que incorporan el aminoácido fluorescente alanina 1 , 5-dansil-modificada (véase, figura 5A) en cadenas de polipéptido crecientes en levadura. Este aminoácido no natural puede también ser identificado por su nomenclatura de la IUPAC : ácido 2-ammo-3- (5-d?met?lam?no-naftalen-1-sulfon?lam?no) -propiónico. El cromóforo de dansilo tiene propiedades espectrales interesantes, en los que se incluyen una separación excepcionalmente de máximos de excitación y emisión (>200 nm) y una alta dependencia de intensidad de emisión en la polaridad del medio ambiente Esto lo hace apropiado para estudiar cambios conformacionales de proteína o eventos de enlace en donde el ambiente de proteína local y así la polaridad es afectado La síntesis del aminoácido no natural fue obtenida en un procedimiento de dos etapas que incluye el acoplamiento de N-Boc-ammoalanma a dansilcloruro utilizando trietilamma en diclorometano y desprotección acida subsecuente con TFA en diclorómetaño Nuevas smtetasas para incorporar 1 , 5-dans?lalanma fueron aisladas utilizando protocolos descritos previamente, véase por ejemplo, Wu et al , Journal de the American Chemical Society 126:14306-14307 (2004), y solicitud internacional No. PCT/US 2005/034002, presentada el 21 de septiembre de 2005 por Deiters et al. Un clon de leucil-tARN smtetasa de E coll mutante (clon B8) que mostró actividad de carga inicial fue aislado de una biblioteca de leucil -tARN smtetasa de E. coll aleatorizada en un sistema de célula huésped de levadura. Véase, Tabla 5 y SEQ ID NOS: 42 y 43. Los sitios en la biblioteca de leucil-tARN sintetasa de E. coli mutante fueron M40, L41, Y499, Y527 y H537. Mutaciones adicionales (provocadas durante la construcción de bibliotecas) encontradas en todos los clones a través de la biblioteca fueron H67R, N196T, R262A y S497C. Sin embargo, la sintetasa de E. coli mutante B8 exhibió actividad de fondo hacia uno o más aminoácidos naturales con un peso similar a leucina tal como se juzga mediante MALDI TOF MS de la dismutasa de superóxido humana de proteína expresada que lleva un codón ámbar permisivo en posición 33 (hSOD-33TAG-His6) . Estudios de atracadero teóricos con dansilalanina-AMP amida y una estructura cristalina de la leucil-tARN sintetasa homologa de Thermus thermophil us (T. th . ) sugirió la formación de una cavidad de enlace ampliada que enlaza el ligando mediante interacciones principalmente hidrofóbicas sin participación de p-apilado a la porción de naftilo (véase, figura 5B) . Una actividad a prueba de lectura está presente en la leucil-tARN sintetasa de E. coli y puesto que la activación y actividad de carga hacia 1 , 5-dansilalanina ya fue desarrollada en el mutante seleccionado, se ideó una estrategia que apuntaba a remoción selectiva de aminoácidos naturales activados o cargados al remodelar el sitio de edición. Se contempló que el fondo observado fue debido a la incorporación de leucina como sugiere por MS de MALDI TOF. Las estructuras cristalinas de la leucil-tARN sintetasa homologa de T. th. y estudios mutacionales sugieren que un bloque esterico simple de aminoácidos no polares hacia la cadena lateral de ?-metilo impide que la leucina activada o cargada se enlace al sitio hidrolítico (Lmcecum et al., Mol Cell., 4:951-963 [2003]). Para incrementar la actividad hidrolítica hacia leucma, los residuos T252 y V338 en el dominio de edición de smtetasa de E. coll fueron intercambiados a alamna mediante mutagénesis de Quikchange con el fin de ampliar la cavidad de enlace (véase, figura 6A) . La smtetasa V338A (véase, Tabla 5, SEQ ID NOS: 46 y 47) no exhibió diferencia significativa en estudios de expresión utilizando la dismutasa de superóxido humana de proteína modelo (hSOD) , mientras que la smtetasa T252A (véase, Tabla 5, SEQ ID NOS: 44 y 45) mostró una reducción marcada en el fondo (véase, figura 6B) . La alta selectividad de este mutante fue confirmada adicionalmente mediante MS de MALDI TOF de hSOD-33TAG-H?s6. Así, la invención proporciona nuevas tARN-smtetasas mutantes deriva de leucil-tARN smtetasa de E. coll que tienen la habilidad para incorporar biosmtéticamente 1,5-dansilalanina a proteínas usando la maquinaria de traducción de célula huésped de levadura (por ejemplo, Saccharomyces cerevisiae) .
EJEMPLO 8 Componentes de traducción ortogonales para la incorporación in vivo del aminoácido no natural fotoenj aulado o-nitrobencilserina a proteínas en células huésped de levadura El presente ejemplo describe composiciones y métodos para la incorporación biosintética de o-nitrobencilserina (véase, figura 1) a proteínas utilizando la maquinaria de traducción de célula huésped de levadura. Nuevos pares de sintetasa/tARN ortogonales derivados de E. coli para incorporar este aminoácido no natural fueron aislados que funcionan en el sistema de célula huésped de levadura. La investigación de la función de un gen específico en organismos vivos depende en su mayoría de su desactivación o activación y el estudio de los efectos resultantes. Los estudios de expulsión genética clásicos apuntan el gen al nivel de ADN, conduciendo a la desactivación de la producción de todas las variantes de proteína codificadas y no permiten investigación en tiempo real de efectos resultantes. En años recientes, el uso de moléculas orgánicas pequeñas ha incrementado espectacularmente la especificidad de desactivación genética. Utilizando tales herramientas, una sola variante de proteína (o un solo dominio de aquella variante) puede ser apuntado y los efectos pueden ser investigados en tiempo real después de la adición de la molécula. La introducción de aminoácidos fotoenj aulados a proteínas como expulsiones activables transitorias puede incrementar adicionalmente la exactitud de tales estudios. Utilizando estrategias de expulsión química, el tiempo de difusión del compuesto a su proteína objetivo puede ser limitante de la velocidad y es solamente posible investigar una célula entera. En contraste, el fotodesenj aulamiento de aminoácidos específicos se puede efectuar en una escala de tiempo rápida y compartimientos específicos de una célula pueden ser investigados utilizando luz de láser pulsada y altamente enfocada. Una leucil-tARN sintetasa de E. coli mutante ha sido desarrollada previamente de una biblioteca de leucil-tARN sintetasa de E. coli mutante en células huésped de levadura que reconoce específicamente el derivado de cisteína enjaulado o-nitrobencilcisteína, también escrito como o-NBC (véase, Wu et al., Journal of the American Chemical Society 126:14306-14307 (2004); y solicitud internacional No. PCT/US2005/034002 , presentada el 21 de septiembre de 2005, por Deiters et al . ) .
Para expandir la aplicación de este procedimiento, se contempló la evolución de una aminoacil-tARN sintetasa que incorpora específicamente o-nitrobencilserina (oNBS) . Cuando se incorpora genéticamente a proteínas, este aminoácido no natural fotoenj aulado podría ser usado para fotoregular cualquier función que involucra residuos de serina, por ejemplo pero no limitados a, fosforilación de serina mediante cinasas, que representan uno de los marcadores químicos más importantes en las rutas de transducción de seña. El aminoácido oNBS puede ser sintetizado mediante acoplamiento de bromuro de o-nitrobencílico a Boc-N-Ser-O-tBu en DMF utilizando NaH como base y desprotección acida subsecuente con TFA en cloruro de metileno ba o presencia de tretilsilano como depurador con 52% de rendimiento global La leucil-tARN smtetasa de E. coll mutante evolucionó para incorporación de oNBC (clon 3H11, véase Tabla 5, SEQ ID NOS 48 y 49) ya exhibía alguna actividad limitada para incorporar oNBS, pero con aproximadamente dos veces eficiencia reducida en comparación con un aminoácido de oNBC Para evolucionar un sistema de traducción de oNBS más eficiente, la smtetasa de 3H11 clon seleccionada fue diversificada mediante PCR propensa a error, otra vez utilizando tres mutagemcidades diferentes, para inducir una, dos o cinco mutaciones por gen, produciendo una diversidad global de 1 x 107 clones. Las posiciones en la enzima de leucil-tARN-smtetasa que fueron apuntadas para aleatorización fueron M40, L41, Y499, Y527 y H537. Los protocolos usados en la presente siguen las metodologías generales descritas en el arte, por ejemplo Wu et al., Journal of the American Chemical Society 126:14306-14307 (2004); y solicitud internacional No. PCT/US2005/034002, presentada el 21 de septiembre de 2005, por Deiters et al .
La selección de la nueva biblioteca de sintetasa mutante produjo una sintetasa mejorada (clon G2-6) con eficiencia de incorporación de oNBS mejorada dos veces. La secuenciación del clon G2-6 identificó cinco mutaciones adicionales en toda la enzima en comparación con el material de partida de sintetasa de 3H11 inicial (posiciones S31G, T247A, T248S, M617I y V673A) . Mutaciones adicionales (provocadas durante la construcción de la biblioteca) encontradas en todos los clones en toda la biblioteca fueron también observadas como sigue: H67R, N196T, R262A y S497C. Las secuencias de aminoácidos y nucleótidos completas de este aislado de sintetasa son provistos en la Tabla 5, SEQ ID NOs : 50 y 51. Esta sintetasa mutante mejorada es ilustrada esquemáticamente en la figura 7A, y la mejora en actividad de incorporación de oNBS en la sintetasa G2-6 mutante es ilustrada experimentalmente en la figura 7B . La incorporación selectiva de oNBS fue confirmada adicionalmente mediante MS de MALDI otra vez usando hSOD como sistema modelo para estudios de expresión. Así, la invención proporciona una nueva tARN-sintetasa mutante derivada de la leucil-tARN sintetasa de E. coli que tiene la habilidad para incorporar biosintéticamente oNBS a proteínas utilizando la maquinaria de traducción de célula huésped de levadura (por ejemplo, Saccharomyces cerevisiae) .
EJEMPLO 9 Componentes de traducción ortogonales para la incorporación in vivo del aminoácido no natural fotoenjaulado 0- (2 -nitrobencil) - L-tirosina a proteínas en E. coli El presente ejemplo describe composiciones y métodos para la incorporación biosintética de 0- (2 -nitrobencil) -L-tirosina (véase, la figura 1) a proteínas utilizando la especie de sintetasa Archae y la maquinaria de traducción de célula huésped de E. coli. Nuevos pares de sintetasa/tARN ortogonales derivados de M. jannaschi i para incorporar este aminoácido no natural fueron aislados que funcionan en el sistema de célula huésped de E. coli. Las "proteínas enjauladas" son proteínas modificadas cuya actividad biológica puede ser controlada por la luz, usualmente mediante conversión fotolítica de una forma inactiva a una forma activa. Esto es particularmente útil puesto que la irradiación puede ser controlada fácilmente en la sincronización, ubicación y amplitud, permitiendo estudios detallados de función de proteína (para revisiones, véase Shigeri et al., Pharmacol. Therapeut. 2001, 91:85; Curley and Lawrence Pharmacol. Therapeut. 1999, 82:347; Curley and Lawrence, Curr. Op . Chem. Bio. 1999, 3:84; "Caged Compounds", Methods in Enzymology; Marriott, G., Ed. ; Academic Press: New York, 1998; V. 291; y Adams and Tsien, Annu. Rev. Physiol. 1993, 55:755) .
Los grupos enjaulantes más comunes son grupos 2-nitrobencilo (véase, Bochet , J. Chem. Soc., Perkin 1 2002, 125; Givens et al., Methods in Enzymology 1998, 291, 1; y Pillai, Synthesis 1980, 1), que son instalados en grupos hidroxi, carboxi, tio, o amino de polipéptidos o proteínas y son escindidos fácilmente en la irradiación con luz UV no fotodañante . Previamente, las proteínas enjauladas fueron producidas mediante modificación química de proteínas aisladas sin control de posición sobre la instalación del grupo de en aulamiento y también la mayoría dando como resultado la incorporación de múltiples grupos de enj aulamiento (por ejemplo Self and Thompson, Nature Med. 1996, 2, 817). Otros ejemplos emplean la incorporación in vitro de un aminoácido enjaulado utilizando una técnica de supresión de codón sin sentido (véase, Philipson et al., Am. J. Physiol. Cell. Physiol. 2001, 281, C195; Pollitt and Schultz Angew. Chem. Int. Ed. 1998, 37, 2105; Cook et al., Angew. Chem. Int. Ed. 1995, 34, 1629). Puesto que el tARN aminoacilado tiene que ser sintetizado químicamente, solamente pequeñas cantidades de proteína son accesibles y los estudios in vivo están limitados. El uso de tecnología de sistema de traducción ortogonal ha superado las limitaciones inherentes en estas tecnologías. Utilizando sistemas celulares, los aminoácidos no naturales pueden ser incorporados específicamente en el sitio con alta fidelidad de traducción a proteínas in vivo mediante adición de nuevos componentes a la maquinaria de traducción de E. coli (para revisión, véase, por ejemplo, Wang and Schultz, Angew. Chem. Int. Ed. 2004, 44, 34; Cropp and Schultz, Trend. Gen. 2004, 20, 625; y Wang and Schultz, Chem. Commun. 2002, 1). El presente ejemplo describe la adicional de una tirosina fotoenj aulada, O- (2-nitrobencil) -L-tirosina (véase figura 1) , al código genético de E. coli. La tirosina es un aminoácido importante en sustratos de proteína de tirosina cinasa y fosfatasa, es un residuo esencialmente en varios sitios activos de enzima y está frecuentemente localizado en las interfases de proteína-proteína. La irradiación de O- (2 -nitrobencil) -L-tirosina (sintetizada de l-tirosina como se describe en Miller et al., Neuron 1998, 20, 619) a 365 nm induces escisión del enlace CO bencílico y formación rápida del aminoácido desenjaulado (tM = 4 min, véase información de soporte) , como se ilustra esquemáticamente en la figura 8. El fotodesenj aulamiento de O- (2 -nitrobencil ) -L-tirosina se puede observar experimentalmente, como se ilustra en los resultados experimentales mostrados en la figura 9. Como se muestra en esta figura, el fotodesenj aulamiento de O- (2-nitrobencil) -L-tirosina fue estudiado mediante irradiación de una solución 0.2 mM en agua (una cavidad de una caja de seis cavidades) utilizando una lámpara UV portátil (365 nm a 10 mm de distancia) . Se tomaron alícuotas en puntos en el tiempo específicos y se analizaron mediante LC/MS. Las concentraciones de O- (2-nitrobencil) -L-tirosina (cuadrados) y las especies desenjauladas (círculos) son mostradas en la figura. Se obtiene 50% de desenj aulamiento después de aproximadamente cuatro minutos. La tirosil-tARN-sintetasa de Methanococcus jannaschii (MjYRS) fue usada como punto de partida para la generación de una sintetasa ortogonal que acepta O- (2 -nitrobencil) -L-tirosina, pero no ninguno de los veinte aminoácidos comunes como sustrato. MjYRS no aminoacila ningún tARN de E. coli endógeno con tirosina, pero aminoacila un supresor de ámbar de tirosina mutante (mutRNACuA) • Para alterar la especificidad de la MjYRS para reconocer selectivamente O- (2 -nitrobencil) -L-tirosina, una biblioteca de aproximadamente 109 mutantes YRS fue generada al aleatorizar seis residuos (Tyr32, Leu65, Phel08, Glnl09, Aspl58 y Leul62) en la cavidad de enlace de tirosina, en base a la estructura cristalina del complejo de YRS/tRNATyr-tirosina de M. jannaschii (Zhang et al., Prot . Sci. 2005, 14, 1340; Kobayashi et al., Nat. Struct. Biol. 2003, 10, 425) . Estos seis residuos fueron escogidos su proximidad estrecha a la posición para del anillo de fenilo de tirosina, entre los cuales Tyr32 y Aspl58 forman enlaces de hidrógeno con el grupo hidroxilo de tirosina. Se espera que las mutaciones de estos residuos expandan la cavidad de enlace de sustrato de la sintetasa para reconocer específicamente O- (2-nitrobencil) -L- tirosina y otros aminoácidos no naturales. Variantes de sintetasa activas fueron seleccionadas de la biblioteca de MjYRS mutante utilizando cloranfenicol acetil transferasa (CAT) y sistemas de reportero de barnasa para las selecciones positiva y negativa, respectivamente. Después de cinco rondas de selección positiva y negativa alternantes 96 clones fueron seleccionados en cuando a un fenotipo en la presencia y ausencia de O- (2 -nitrobencil) -L-tirosina. Tres sintetasas fueron caracterizadas adicionalmente utilizando un análisis in vivo en base a la supresión del codón Aspll2TAG en el gen CAT. La expresión de E. coli de los tres pares de MjYRS /mutRNACUA sobrevivió en cloranfenicol con valores de IC50 de 110 mg/L y menos de 10 mg/L en presencia y ausencia de O- (2 -nitrobencil) -L-tirosina (1 mM) , respectivamente. La gran diferencia en resistencia a cloranfenicol sugiere una especificidad in vivo sustancialmente de los pares de sintetasa/tARN seleccionados para inserción de O- (2 -nitrobencil ) -L-tirosina con respecto a todos los veinte aminoácidos naturales en respuesta a un codón ámbar. Los ácidos nucleicos que codifican estas tres O- (2-nitrobencil) -L-tirosina- tARN sintetasas fueron secuenciados y sus secuencias de aminoácido fueron deducidas. Las secuencias de aminoácidos completas de los tres clones de sintetasa ONBY son proporcionadas en la Tabla 5, SEQ ID NOs : 52-54. Los resultados de esta secuencia son mostrados en la Tabla 3.
TABLA 3 Concebiblemente, las mutaciones Tyr32—>Gly32/Ala32 y Aspl58—>Glul58 , Alal58, o Serl58 dan como resultado la pérdida de enlaces de hidrógeno entre Tyr32, Aspl58 y el sustrato natural tirosma, desfavoreciendo así su enlace. Para medir la fidelidad y eficiencia de los tres ONB-MjYRS, O- (2 -mtrobencil) -L-tirosma fue incorporada en respuesta a un codón ámbar en posición cuatro en un gen de mioglobma de ballena de esperma mutante hexahistidma marcada C-termmalmente . Para expresar proteína recombinante, el plásmido pBAD/JYAMB-4TAG (que codifica el gen de mioglobma de ballena de esperma mutante con un promotor de arabmosa y un terminador rrnB; el tirosil - tARNcuA sobre un promotor de Ipp y un terminador rrnC; y un marcador resistente a tetraciclma) fue co-transfectado con un vector de pBK (que codifica la sintetasa mutante y un gen resistente a canamicina) en E. coli DH10B E. coli en presencia tanto del par de sintetasa/mutRNACuA y 0- (2-nitrobencil) -L-tirosina (1 mM) . Las células fueron amplificadas en un medio de Luria-Bertani (5 mL) complementado con tetraciclina (25 mg/L) y canamicina (30 mg/L) , lavados con solución reguladora del pH de fosfato y usadas para inocular 500 mL de medio mínimo de glicerol líquido (GMML; medio mínimo de glicerol complementado con leucina 0.3 mM) que contiene los antibióticos apropiados, tirosina fotoenjaulada (1 mM) , y arabinosa (0.002%) . Las células fueron cultivadas a saturación y luego cosechadas mediante centrifugación. La proteína de mioglobina mutante purificada fue obtenida mediante cromatografía de afinidad de Ni-NTA con un rendimiento de aproximadamente 2-3 mg/L y se juzga que es >90% homogénea mediante SDS-PAGE y teñido de azul de Gelcode. El rendimiento es comparable a la expresión de mioglobina utilizando el par de Mj YRS/mutRNACUA tipo silvestre que suprime el mismo codón ámbar. No fue detectable mioglobina si el aminoácido no natural era retenido o en presencia de tirosina 1 mM, revelando una selectividad muy alta de todas las tres sintetasas por 0- (2 -nitrobencil) -L-tirosina (véase, figura 10). Para confirmar adicionalmente la identidad de la proteína fotoenjaulada específicamente en el sitio, un mutante de mioglobina diferente con un codón ámbar en Gly74 (debido a las propiedades de espectrometría de masa superiores) fue expresado en presencia de pONB-MjYRS-1 , tARNCuA, y 0-(2-nitrobencil) -L-tirosina (1 mM) . El mutante de mioglobina 74TAG fue expresado, bajo las mismas condiciones como el mutante 4TAG, utilizando la sintetasa pONB-1 en presencia de 0- (2-nitrobencil) -L-tirosina (1 mM) y purificado mediante columna de afinidad de níquel. Las bandas de proteínas fueron visualizadas mediante teñido de azul de Gelcode de un gel de SDS-PAGE y extirpadas del gel de poliacrilamida . Las piezas de gel fueron cortadas en cubos de 1.5 mm y sometidas a hidrólisis de tripsina, esencialmente como se describe (Shevchenko et al., Anal. Chem. 1996, 68, 850-858). Los péptidos trípticos fueron analizados mediante análisis de espectrometría de masas en tándem de cromatografía líquida (LC-MS/MS) efectuado en un espectrómetro de masas de trampa iónica Finnigan LCQ Deca (Thermo Finnigan) equipado con una HPLC de Nanospray (Serie Agilent 1100) . Los iones precursores correspondiente a los iones individual y doblemente cargados del péptido HGVTVLTALGJILK que contienen el aminoácido no natural (denotado como J) fueron separados y fragmentados con un espectrómetro de masas de trampa iónica. El análisis de LC-MS/MS muestra tirosina en posición 74 (péptido tríptico HGVTVLTALGYILK) . Las masas iónicas del fragmento podrían ser asignadas, indicando la incorporación específica en el sitio de tirosina (3) en posición 74 (véanse figuras HA y 11B) . La detección de Tyr74 es más probable debido a una fragmentación del benciléter lábil en O- (2-n?trobencil) -L-tirosina durante el análisis de MS . Para confirmar la incorporación previa del aminoácido enjaulado 0- (2 -mtrobencil) -L-tirosma, el derivado deuterado fue sintetizado y usado en una expresión del mismo mutante de mioglobma bajo condiciones idénticas. Luego la proteína fue tripsimzada y sometida a un análisis mediante espectrometría de masas. Una asignación de las masas de ion fragmento reveló la incorporación de d2-t?rosma en posición 74 de mioglobma, demostrando de manera no ambigua la incorporación del aminoácido no natural 2 (véase figuras 12A y 12B) . El análisis de LC MS/MS no indicó incorporación de ningún aminoácido natural en esta posición, proporcionando evidencia adicional para la alta fidelidad de la smtetasa evolucionada. Adicionalmente , la activación fotoquímica m vivo de una proteína que tiene 0- (2 -mtrobencil) -L- tirosma incorporada puede ser demostrada al emplear lacZ como gen reportero, ß-galactosidasa de E coll exhibe una t rosma esencial en posición 503 (Juers et al., Biochemistry 2001, 40, 14781; Penner et al., Biochem. Cell Biol . 1999, 77, 229). El codón correspondiente fue mutado a un codón de retención ámbar TAG para la incorporación de la 0- (2 -nitrobencil) -L-tirosma enjaulada. La ß-galactosidasa es verificada antes y después del desenj aulamiento de tirosina. La actividad de ß-galactosidasa es restaurada enseguida de la irradiación in vivo.
EJEMPLO 10 Componentes de traducción ortogonales para la incorporación in vivo del aminoácido no natural p-cianofenilalanina a proteínas en E. coli El presente ejemplo describe composiciones y métodos para la incorporación biosintética de p-cianofemlalamna (véase, figura 1, también escrito como 4-c?anofe lalanma) a proteínas usando la maquinaria de traducción de célula huésped de E coli Nuevos pares de smtetasa/tARN ortogonales derivados de M. j annaschu para incorporar este aminoácido no natural fueron aislados que funcionan en un sistema de célula huésped de E. coli. El grupo ciano es una sonda de IR ambiental local excelente, ya que su vibración de estiramiento CN (v2) sufre un desplazamiento de frecuencia del orden de diez números de onda cuando es movido de los alrededores hidrofóbicos a hidrofílicos Getahun et al., "Usmg Nitrile-Derivatized Ammo Acids as Infrared Probes of Local Environment" , JACS 125, 405-411
[2003]) La para-cianofe lalamna (posición 4) y meta-cianofe lalamna (posición 3) cianofemlalamna son así útiles para estudiar un surtido de propiedades de proteínas en las que se incluyen enlace de proteína-proteína, conformación de proteína y plegado o aplastamiento hidrofóbico. Las formas para y meta de cianofenilalanma pueden existir tanto en ambientes polares como hidrofóbicos, en tanto que en una cadena de péptido y sus efectos sobre la conformación son despreciables. Así, es ya sea probable que residan en el mismo ambiente como el residuo de tipo silvestre que reemplaza en una proteína o péptido. Además, la vibración de estiramiento de CN de los componentes es estrecha, no se superpone con cualesquier otras absorciones de proteína, es extensamente desacoplada de las otras vibraciones de proteína y es bastante sensible a cambios en polaridad del solvente. Por estas razones, ambos son excelentes herramientas para estos conformacionales de péptido.
Nitrilos aromáticos como sondas de IR de ambiente local en péptidos pequeños Getahun y colaboradores (Getahun et al . , "Using Nitrile-Derivatized Amino Acids as Infrared Probes of Local Environment" , JACS 125, 405-411 [2003]) han mostrado (véase, figura 13) que la vibración de estiramiento ciano de para-cianofenilalanina es diez números de onda más altas en agua que en THF. Cuando el péptido anfifático de 14 residuos de mastoparan x (MPx) es mutado para incorporar para-cianofenilalanina a su porción de enlace de lípido, el estiramiento de ciano es a 2229.6 cm"1 cuando MPx es enlazado a una bicapa de lípido de POPC . En agua, la vibración de estiramiento de CN del mutante MPx PheCN ocurre a 2235.7 cm"1. En suma, el estiramiento ciano en un péptido hidratado es similar al estiramiento ciano de para-cianofenilalanina libre en agua, en tanto que el estiramiento ciano de PheCN en un péptido enterrado es similar al THF de estiramiento ciano de PheCN libre (Tucker et al., "A New METHOD for Determining the Local Environment and Orientation Of Individual Side Chains of Membrane-Binding Peptides", JACS 126 5078-5079 [2004]). Una nueva sintetasa ortogonal fue derivada de tirosil tARN sintetasa de M. jannaschi i y usada en conjunción con el tARNCUA supresor de M. jannaschii descrito previamente. Este nuevo par ortogonal no tiene afinidad o tiene afinidad muy baja por cualquiera de los aminoácidos comunes (esto es, que se presentan de manera estable en la naturaleza) . La tARN sintetasa ortogonal derivada carga selectivamente el tARNCUA supresor ámbar con p-cianofenilalanina . El tARN supresor aminoacilado (esto es, el tARN "cargado") es usado como sustrato por el aparato de traducción de E. coli endógeno para incorporar p-cianofenilalanina en respuesta al codón de retención ámbar TAG (un codón selector) encontrado en un transcripto. La ortogonalidad de estos pares de tARN/sintetasas asegura que ni el tARN ni las sintetasas reaccionan de manera cruzada con tARN de E. coli endógenos o sintetasas y que el aminoácido no natural es administrado solamente en respuesta a TAG. Se emprendió una búsqueda por sintetasas ortogonales que tienen la habilidad para cargar específicamente un tARN ortogonal con p-cianofenilalanina . Esta búsqueda usó protocolos que han sido descritos previamente. Una biblioteca de mutantes de tirosil-tARN-sintetasa de M. jannaschii fue generada mediante mutagénesis de la tirosil-tARN-sintetasa de M. jannaschi i de tipo silvestre, en donde la mutagénesis consistió de aleatorizar residuos de sitio activo predichos en base a la estructura cristalina de otras moléculas de aminoacil - tARN-sintetasa . Enseguida de la mutagénesis la biblioteca de sintetasa mutante se hizo pasar a través de múltiples rondas de selección positiva y negativa. Esta solución produjo un clon de sintetasa que tenía la habilidad de cargar el O-tARN con p-cianofenilalanina . Este clon de sintetasa fue secuenciado y la secuencia de aminoácidos fue determinada, como se muestra en Tabla 5, SEQ ID NOs : 55 y 56) . Esta sintetasa mutante muestra las siguientes sustituciones en relación con la secuencia de sintetasa tipo silvestre: Tyr32Leu, Leu65Val, Phel08Trp, Glnl09Met, Aspl58Gly y Ilel59Ala.
EJEMPLO 11 Componentes de traducción ortogonales para la incorporación in vivo del aminoácido no natural m-cianofenilalanina a proteínas en E. coli El ejemplo presente describe composiciones y métodos para la incorporación biosintética de m-cianofenilalanina (véase, figura 1; también escrita como 3-c?anofenilalanma) a proteínas usando la maquinaria de traducción de célula huésped de E. coli. Nuevos pares de smtetasa/tARN ortogonales derivados de M. j annaschu para incorporar este aminoácido no natural fueron aisladas que funcionan en un sistema de célula huésped de E. coll. El grupo ciano es una excelente sonda de IR de ambiente local, ya que su vibración de estiramiento de CN (v2) sufre un desplazamiento de frecuencia del orden de diez números de onda cuando es movido de alrededores hidrofóbicos a hidrofílicos (Getahun et al , "Using Nitrile-Depvatized Ammo Acids as Infrared Probes of Local Environment" , JACS 125, 405-411 [2003]) . La para cianofemlalamna (posición 4) y meta-cianofemlalanma (posición 3) son así útiles en el estudio de un surtido de propiedades de proteínas en las que se incluyen enlace de proteína-proteína, conformación de proteína y plegado o aplastamiento hidrofóbico. Las formas para y meta de cianofenilalanina pueden existir en ambientes polares e hidrofóbicos en tanto que están en una cadena de péptido y sus efectos sobre la conformación son despreciables. Así, es probable que ya sea una u otra resida en el mismo ambiente como el residuo de tipo silvestre que reemplaza en una proteína o péptido. Además, la vibración de estiramiento de CN de los compuestos es estrecha, no se superpone con cualesquier otras absorciones de proteínas, es extensamente desacoplada de las otras vibraciones de la proteína y es bastante sensible a cambios en polaridad del solvente. Por estas razones, ambas son excelentes herramientas para estudios conformacionales de péptido.
NITRILOS AROMÁTICOS EN PROTEÍNAS Siguiendo protocolos de evolución dirigidos establecidos, un nuevo par de Methanococcus jannaschi i tRNATyrCuA~ irosil- ARN sintetasa (TyrRS fue desarrollado que incorpora específicamente en el sitio meta-cianofenilalanina con alta fidelidad en respuesta a un codón TAG ámbar. Este nuevo par ortogonal no tiene afinidad o tiene afinidad muy baja por cualquiera de los aminoácidos comunes (esto es, que se presentan de manera estable en la naturaleza) . La tARN sintetasa ortogonal derivada carga selectivamente el tARNCUA supresor ámbar con m-cianofenilalanina . El tARN supresor aminoacilado (esto es, el tARN "cargado") es usado como un sustrato mediante el aparato de traducción de E. coli endógeno para incorporar m-cianofenilalanina en respuesta al codón de retención ámbar de TAG (un codón selector) encontrado en un transcripto. La ortogonalidad de estos pares de tARN/sintetasas asegura que ni el tARN ni las sintetasas reaccionan de manera cruzada con el tARN de E. coli endógeno o sintetasas y que el aminoácido no natural es administrado solamente en respuesta a un codón sin sentido ámbar, TAG.
La construcción de la smtetasa ortogonal tiene la habilidad de cargar específicamente un tARN ortogonal con m-cianofemlala na utilizando protocolos que han sido descritos previamente Una biblioteca de mutantes de tirosil-tARN-smtetasa de M. j annaschu fue generada mediante mutagénesis de la tirosil- ARN-smtetasa de M. jannaschu tipo silvestre, en donde la mutagénesis consistió de aleatorizar residuos de sitio activo predichos en base a la estructura cristalina de otras moléculas de ammoacil- tARN-smtetasa . Enseguida de la mutagénesis, la biblioteca de smtetasa mutante se hizo pasar a través de múltiples rondas de selección positiva y negativa Esta selección produjo un clon de smtetasa que tenía la habilidad de cargar el O-tARN con m-cianofemlala na . Este clon de smtetasa fue secuenciado y la secuencia de aminoácidos fue determinada (véase, Tabla 5, SEQ ID NOs 57 y 58) Esta smtetasa mutante sigue las siguientes substituciones en relación con la secuencia de smtetasa tipo silvestre Tyr32H?s, H?s70Ser, Aspl58Ser, Ilel59Ser y Leul62Pro. Se intentó suprimir un mutante Tyr7 —> TAG de la proteína de dominio Z c terminal H?s6-et?quetada tanto en presencia como en ausencia de m-cianofenilalanina y p-cianofemlala na, utilizando su respectivo para de tARN/smtetasa ortogonal. En ambos casos, se produjo proteína de plena longitud en presencia de aminoácido no natural, en tanto que ningún producto fue detectable mediante teñido de azul de Coomasssie en un gel de SDS-PAGE en ausencia del aminoácido no natural respectivo. Además, se obtuvieron espectros de IR de esta proteína tanto con meta como para-cianofemlalamna incorporada en posición 7. Después de la sustracción de fondo del espectro de IR de dominio Z tipo silvestre, se obtienen los espectros mostrados en las figuras 14A y 14B. La figura 14A muestra que la para-cianofenilalanma tiene una sola absorbancia entre los extremos mostrados en la figura 13, sugiriendo que el residuo número siete cae a lo largo de la superficie de la proteína, pero no apunta directamente a la solución. La figura 14B muestra el espectro de meta-cianofemlalanma como la suma de dos distribuciones Gaussianas con picos a 2236 y 2228 cm"1. El valor de R2 para las curvas es mayor de 0.99, un ajuste de curva excelente y los datos de la figura 14B sugieren así que la meta-cianofe lalamna tiene dos confirmaciones. Como se hace evidente por el pico a 2228 cm"1, una conformación coloca el grupo ciano en una región hidrofóbica de la proteína. El pico a 2236 cm 1 sugiere que los otros lugares de conformación están en un ambiente hidratado.
EJEMPLO 12 Componentes de traducción ortogonales para la incorporación in vivo del aminoácido no natural p- (2-amino-l-hidroxietil) -L- fenilalanina a proteínas en E. coli El ejemplo presente describe composiciones y métodos para la incorporación biosintética de p- (2 -amino-1-hidroxietil) -L-fenilalanina (véase, figura 1) a proteínas utilizando la maquinaria de traducción de célula huésped de E. coli. Nuevos pares de sintetasa/tARN ortogonales derivados de M. jannaschi i para incorporar este aminoácido no natural fueron aislados que funcionan en un sistema de célula huésped de E. coli . La modificación específica del sitio de proteínas con sondas biofísicas, agentes citotóxicos, agentes de reticulación, y otros agentes que han sido usados ampliamente para analizar la estructura y función de proteína y en el desarrollo de diagnósticos, agentes terapéuticos y selección de alto rendimiento. Un procedimiento para la modificación selectiva de proteínas involucra la oxidación de una serina o treonina N-terminal al aldehido correspondiente y acoplamiento subsecuente con derivados de hidrazina, alcoxiamina o hidrazida. Desafortunadamente, este método está limitado puesto que puede solamente ser usado para modificar la posición N-terminal de una proteína. El procedimiento para colocar el grupo funcional crítico de aminoalcohol de 2 -amino- 1- hidroxietilo sobre una cadena lateral de la proteína objetivo removerá la limitación de modificación de proteína selectiva sobre el término N solamente con el beneficio adicional de controlar la posición del grupo aminoalcohol en la proteína. Una nueva sintetasa ortogonal fue derivada de tirosil-tARN sintetasa de M. jannaschii y es usada en conjunción con el tARNCUA supresor de M. jannaschii descrito previamente. Este nuevo par ortogonal no tiene afinidad o tiene afinidad muy baja por cualquiera de los aminoácidos comunes (esto es, que se presentan de manera estable en la naturaleza) . La tARN sintetasa ortogonal derivada carga selectivamente el tARNcuA supresor ámbar con p- (2 -amino-1-hidroxietil) -L-fenilalanina . El tARN supresor aminoacilado (esto es, el tARN "cargado") es usado como sustrato por el aparato de traducción de E. coli endógeno para incorporar p- (2 -amino-1-hidroxietil) -L-fenilalanina en respuesta a un codón de retención ámbar TAG (un codón selector) encontrado en un transcripto. La ortogonalidad de este par de tARN/sintetasa asegura que ni el tARN ni la sintetasa reacciona de manera cruzada con el ARN de E. coli endógeno o sintetasas y que el aminoácido no natural es incorporado solamente en respuesta a un codón sin sentido ámbar, TAG. Se emprendió una búsqueda por sintetasas ortogonales que tienen la habilidad para cargar específicamente un tARN ortogonal con p- (2-amino-l-hidroxietil) -L-fenilalanina. Esta búsqueda usó protocolos que han sido descritos previamente. Una biblioteca de mutantes de tirosil-tARN-sintetasa de M. jannaschii fue generada mediante mutagénesis de la tirosil-tARN-sintetasa de M. jannaschii de tipo silvestre, en donde la mutagénesis consistió de aleatorizar residuos de sitio activo predichos en base a la estructura cristalina de otras moléculas de aminoacil -tARN-sintetasa . Enseguida de la mutagénesis, la biblioteca de sintetasa mutante se hizo pasar a través de múltiples rondas de selección positiva y negativa. Esta selección produjo un clon de sintetasa que tenía la capacidad de cargar el O-tARN con p- (2 -amino-1-hidroxietil ) -L-fenilalanina . Aquel clon de sintetasa fue secuenciado y la secuencia de aminoácidos fue determinada (véase, Tabla 5, SEQ ID NO: 59) . Esta sintetasa mutante muestra las siguientes sustituciones en relación con la secuencia de sintetasa M. jannaschii de tipo silvestre: EJEMPLO 13 Componentes de traducción ortogonales para la incorporación in vivo del aminoácido no natural p-etiltiocarbonil-L-fenilalanina a proteínas en E. coli El presente ejemplo describe composiciones y métodos para la incorporación biosintética de p-etiltiocarbonil-L-fenilalanina (véase, figura 1) a proteínas utilizando la maquinaria de traducción de célula huésped de E. coli. Nuevos pares de sintetasa/tARN ortogonales derivados de M. jannaschii para incorporar este aminoácido no natural fueron aislados que funcionan en un sistema de célula huésped de E. coli. Un método útil para la generación de proteínas semisintéticas es la ligación química natural en la cual dos fragmentos de péptido plenamente desprotegidos pueden ser acoplados por un enlace de amida bajo condiciones fisiológicas moderadas a temperatura ambiente (Nilsson et al., Annu . Rev. Biophys. Biomol . Struct. 2005, 34, 91-118; Dawson et al., Science 1994, 266, 776-779). Una variación de este método, denominada ligación de proteína expresada, en la cual uno o ambos socios de reacción han sido producidos mediante medios recombinantes, es útil para la síntesis de proteínas que consisten de más de 100 residuos (Muir, Annu. Rev. Biochem 2003, 72, 249-289; David et al. Eur . J. Biochem. 2004, 271, 663-677) . En la práctica, ambas técnicas requieren la presencia de un -tioéster C-terminal, limitando estos métodos a modificación en el término C de un fragmento de péptido. La colocación de un grupo tioéster reactivo en cualquier residuo en un péptido/proteína expresado bacterianamente expandiría significativamente en alcance de estas técnicas, permitiendo por ejemplo la síntesis de estructuras cíclicas o ramificadas o la modificación selectiva de cadenas laterales con sondas biofísicas, polietilenglicoles o varias etiquetas. Los métodos para la generación de proteínas que tienen cadenas laterales que contienen tioéster encuentran uso en que las cadenas laterales que contienen tioéster pueden particular en reacciones de ligación químicas subsecuentes m vitro y posiblemente m vivo (Camarero y Muir, J. Am. Chem. Soc 1999, 121, 5597-5598; Camarero et al , Bioorg Med Chem 2001, 9, 2479-2484; Scott et al., Proc. Nati. Acad. Sci. USA 1999, 96, 13638-13643, Evans et al , J. Biol Chem. 2000, 275, 9091-9094, Yeo et al., Chem. Commun. 2003, 2870-2871).
SÍNTESIS DE P-ETILTIOCARBONIL-L-FENILALANINA La p-etiltiocarboml-L-fenilalanma (estructura 1 ; también denominada 4 - (etiltiocarbonil) -L-femlalamna) fue sintetizado en cuatro etapas (véase, figura 15) partiendo del ácido a-bromo-p-toluico disponible comercialmente (la) y ter-butil éster de N- (difemlmetilen) glicina (le) . Estas etapas son resumidas a continuación.
Síntesis de 4- (bromómetil) benzotioato de S-etilo (estructura lb) : a una solución de la (2.15 g, 10.0 mmoles) en THF (50 ml) se agrega cloruro de tionilo (2 ml , 28 mmoles), seguido por la adición de DMF (50 µl) y la mezcla de reacción fue agitada durante 5 horas a temperatura ambiente. Los solventes orgánicos fueron removidos bajo presión reducida hasta que apareció un sólido blanco, el cual fue luego disuelto en THF (50 ml ) y la solución fue enfriada a 0°C. Una solución de etantiol (0.78 ml , 10.0 mmoles) y trietilamina (2 ml , 14 mmoles) en THF (10 ml) fue agregada gota a gota en el curso de minutos. La mezcla de reacción fue agitada por otras cuatro horas y solvente fue removido. Se agregan agua (100 ml) y éter (200 ml ) . La fase orgánica fue lavada con H20 (2 x 50 mL) , secada sobre NaS04, y removida bajo presión reducida. El producto crudo fue purificado mediante cromatografía instantánea, sobre gel de sílice (acetato de etilo al 8% en hexano), produciendo lb (2.18 g, 78%) como un aceite incoloro. RMN (400 MHz, CDCl3) d 7.94 (d, J = 8.0 Hz, 2H) , 7.46 (d, J = 8.0 Hz, 2H) , 4.50 (s, 2H) , 3.07 (q, J = 7.6, 15.2 Hz, 2H) , 1.35 (t, J = 9.2 Hz, 3H) . Masa exacta m/z calculada para C10H?:LBrOS 258.0/260.0, encontrada (LC/MS) 259.1/260.1.
Síntesis de 2- (difenilmetilenamino) -3 - (4- (etiltiocarbonil) fenil) propanoato de ter-butilo (estructura ld) : una solución que contiene lb (0.455 g, 1.76 mmoles) , le (0.47 g, 1.60 mmoles), 18-corona-6 (0.42 g, 1.59 mmoles) y K2C03 anhidro (0.344 g, 2.50 mmoles) en CH3CN anhidro (10 ml) fue agitada durante 24 horas a temperatura ambiente. Los solventes orgánicos fueron removidos bajo presión reducida. Se agregan agua (100 ml) y CH2C12 (200 ml) . La fase orgánica fue lavada con H20 (2 x 50 mL) , secada sobre NaS04, y removida bajo presión reducida. El producto crudo fue usado directamente en la siguiente etapa sin purificación. Masa exacta m/z calculada para C29H31N03S 473.2, encontrada (LC/MS) 474.3.
Síntesis de (4- (etiltiocarbonil) ) fenilalanina (1) : una solución de ld (0.94 g, 2.0 mmoles) de la etapa previa en ácido trifluoroacético (8 ml) y CH2C12 (2 ml) fue agitada durante una hora a temperatura ambiente. Después que los solventes orgánicos fueron removidos completamente bajo presión reducida, se agrega solución de HCl concentrado (0.8 ml) y MeOH (10 ml) y la solución resultante fue agitada durante 1 hora a temperatura ambiente, después de tal tiempo, todo el solvente fue removido y se agrega acetona anhidra (10 ml) . La solución fue filtrada y el sólido recuperado fue titulado con MeOH anhidro (2 ml) . Después de la filtración, el filtrado metanólico fue sometido a presión reducida para producir 1 como sólido blanco (> 0.55 g, 95%). RMN XH (400 MHz, DMSO-d6) d 7.85 (d, J = 8.0 Hz, 2H) , 7.44 (d, J = 8.0 Hz, 2H) , 4.21 (t, J = 6.4 Hz, 1H) , 3.06 (q, J = 14.8, 17.2 Hz, 2H) , 3.00 (s, 2H) , 1.26 (t, J = 7.2 Hz, 3H) . Masa exacta m/z calculada para C?2H15N03S 253.1, encontrada (LC/MS) 254.2.
PROGRAMACIÓN GENÉTICA DE INCORPORACIÓN DE P-ETILTIOCARBONIL-L-FENILALANINA Para codificar genéticamente p-etiltiocarbonil-L-fenilalanina en E. coli, fue necesario generar un par de aminoacil-tARN sintetasa/tARN ortogonal específico para esta aminoácido. En base a la estructura cristalina, del complejo de TyrRS-tARN L-tirosina de M. jannaschii (Kobayashi et al., Nat. Struct. Biol. 2003, 10, 425-432), seis residuos (Tyr32, Leu65, Phel08, Glnl09, Aspl58 y Leul62) en el sitio de enlace de tirosina de TyrRS de M. jannaschi i fueron mutados aleatoriamente. Una biblioteca de 109 de TyrRS se hizo pasar a través de tres rondas de selección positiva (en base a la supresión de un codón ámbar en cloranfenicol acetiltransferasa) alternadas con dos rondas de selección negativa (en base a la supresión de tres codones ámbar en el gen de barnasa) en presencia y ausencia de p-etiltiocarbonil-L-fenilalanina, respectivamente y un número de clones emergieron cuya sobreviviencia en cloranfenicol fue dependiente de p-etiltiocarbonil-L-fenilalanina . Se encontró que uno de estos mutantes soporta el crecimiento de células en 120 µg mL de cloranfenicol en presencia de p-etiltiocarbonil-L-fenilalanina, y 10 µg mL"1 de cloranfenicol en su ausencia.
La secuenciación de este clon reveló las siguientes mutaciones: Tyr32Ala, Leu65Phe, PhelOdTrp, Glnl09Ser, Aspl58Ser y Leul62His (véase, Tabla 5, SEQ ID NO: 60) . La mutación de Tyr32 a Ala32 remueve probablemente el enlace de hidrógeno entre el grupo hidroxilo fenólico de tirosina enlazada y Tyr32.
Para confirmar que el fenotipo observado es provocado por la incorporación específica del sitio de p-etiltiocarbonil -L-fenilalanina por el par de mutRNACuA-mutTyrRS, nn codón ámbar fue sustituido por la séptima posición (Tyr) en el gene que codifica la proteína de dominio Z (Nilsson et al., Protein Eng . 1987, 1, 107-113) fusionada a una etiqueta de His6 C-terminal. La proteína fue expresada en presencia o ausencia de p-etiltiocarbonil-L-fenilalanina 1 mM y purificada mediante cromatografía de Ni-NTA. El análisis mediante SDS-PAGE mostró que la expresión de la proteína de dominio Z mutante fue completamente dependiente de la presencia de p-etiltiocarbonil-L-fenilalanina . La proteína mutante fue expresada en aproximadamente 10-30% de rendimiento en relación con la proteína de dominio Z de tipo silvestre (~8 mg/L en medio mínimo que contienen glicerol al 1%, leucina 0.3 mM y p-etiltiocarbonil-L-fenilalanina 1 mM con antibióticos apropiados) . Se obtuvo evidencia adicional para la incorporación específica del sitio de p-etiltiocarbonil-L-fenilalanina mediante espectrometría de masas de tiempo de vuelo de desorción/ionización de láser auxiliada por matriz (MS de MALDI-TOF) . Además de la observación de una masa promedio experimental de 8006 Da para la proteína Tyr > p-etiltiocarbonil-L-fenilalanina (MTeórico = 8002 Da, véase figura 16) , un pico menor correspondiente a la proteína mutante sin la primera porción de metionina en forma acetilada (MExperimeneai = 7913 Da vs . MTeórico = 7913 Da) y un pico mayor correspondiente a la proteína mutante sin la primera porción de metionina (MExperienai = 7871 Da vs . MTeórico =7871 Da) fueron también detectados (figura 16) . Otro pico mayor de 7828 Da estaba presente que corresponde a la proteína de dominio Z que contiene un grupo de ácido carboxílico libre en lugar de una porción de tioéster en posición 7, que tiene una masa calculada de 7827 Da en su forma protonada. Con la suposición de que tanto las proteínas mutantes que contienen ácido y tioéster tienen eficiencias de ionización comparables bajo condiciones de detección de masa, la integración de sus áreas pico de masa correspondientes sugieren que alrededor del 40% de la proteína mutante que contiene tioéster es hidrolizada. El hecho de que la sintetasa mutante no incorpora el aminoácido no natural p-etiltiocarbonil-L-fenilalanina en su forma hidrolizada in vivo y que la p-etiltiocarbonil-L-fenilalanina parece ser estable tanto in vitro como in vivo, sugiere que la hidrólisis del tioéster al ácido ocurre después de su incorporación de la proteína de dominio Z mediante la sintetasa mutante específica de tioéster. Para determinar si la cadena lateral de tioéster de las proteínas mutantes puede ser modificada selectivamente, se efectuó una ligación química in vitro con 20-60 µg/de proteína mutante que contiene tioéster cruda y etiléster de cisteína 10 mM en una solución de pH regulado con fosfato que contiene ditiotreitol 100 mM (DTT) y cloruro de guanidinio 2 M a un pH de 8.0. Luego la proteína modificada resultante fue purificada y analizada mediante MS de MALDI-TOF. Las masas promedio experimentales de 7956 Da y 7998 Da, correspondientes a las proteínas que contienen tioéster modificadas con una molécula de cisteína (MTeórico = 7958 Da y 8000 Da para proteínas sin la primera porción de metionina y sin la primera porción de metionina en forma acetilada, respectivamente), fueron obtenidos (figura 17) . La eficiencia de marcación podría ser estimada cualitativamente para ser mayor de 85% mediante la integración de sus áreas pico de masas. Como se muestra en la figura 16, las proteínas de dominio Z son expresadas predominantemente sin el primer residuo de metionina. En esta forma, la proteína mutante que contiene tioéster sin modificar tiene un peso molecular de 7872, que se puede superponer con las proteínas que contienen ácido en forma acetilada (MTeórico = 7869 Da) . Por consiguiente, en el cálculo de la eficiencia de marcación, el área pico de 7867 Da fue tomada como el valor de límite superior para las proteínas que contienen tioéster sin modificar, conduciendo a un valor estimativo mayor de 85% de eficiencia de marcación. Los picos a 7825 Da y 7867 Da (MTedrico = 7827 Da y 7869 Da) son indicadores de la presencia de proteínas de dominio Z que contienen un grupo de ácido carboxílico en posición 7, que no es reactivo hacia el etil éster de cisteína. Como se espera, ningún producto de marcación fue detectado para proteínas de dominio Z WT, indicando que la reacción de marcación ocurría solamente entre la molécula de cisteína y el grupo tioéster pero no ningún grupo funcional existente en la proteína WT . Por otra parte, ni la ciclización de cadena lateral intramolecular ni la auto-dimerización que involucra el grupo tioéster y cualquier grupo e-amino de los cinco residuos de lisina en proteínas mutantes que contienen tioéster fueron observados. Por consiguiente, estos datos demuestran la excelente selectividad y reactividad del mango de tioéster para la modificación in vitro confiable y selectiva de proteínas.
LIGACIÓN QUÍMICA ENTRE PROTEÍNAS DE DOMINIO Z QUE CONTIENEN ETIL ÉSTER DE CISTEÍNA Y TIOÉSTER Células DH108 de E. coli (60 ml) que albergan el plásmido que codifica la tARN sintetasa mutante y el vector de expresión pLEIZ que codifica el gen de dominio Z con un codón ámbar en la séptima posición y una etiqueta His6 COOH-terminal fueron cultivados a 37CC, inducidos por cuatro horas a una OD60o de 0.5 mediante la adición de isopropil-ß-D-tiogalactopiranosuro 1 mM (IPTG) y aglomeradas. A las células aglomeradas se agrega 1 L de solución reguladora del pH (cloruro de guanidinio 6 M, fosfato de sodio 100 mM, cloruro de sodio 200 mM, pH = 8.0) . La solución fue agitada durante 1 hora a temperatura ambiente, sonicada durante tres minutos y centrifugada para remover cualesquier desechos celulares. Al sobrenadante claro se agregan 2 ml de solución reguladora del pH de fosfato (fosfato de sodio 100 mM, cloruro de sodio 200 mM, etil éster de cisteína 0.01 M, pH = 8.0), 150 solución de ditiotreitol (2 M) y 60 mg de 2 -mercaptoetenesufonato de sodio (MESNA) . La mezcla de solución fue agitada durante 12 horas a temperatura ambiente. La solución que contiene proteínas modificadas fue intercambiada y concentrada en 500 µl de solución reguladora del pH (urea 8 M, fosfato de sodio 100 mM, Trizma 10 mM, pH 8.0) . Las proteínas modificadas fueron purificadas mediante cromatografía de afinidad de Ni2+ de acuerdo con protocolo del fabricante (Qiagen, Chatsworth, CA) , dializadas contra agua destilada y analizadas mediante MS de MALDI-TOF.
CONCLUSIÓN En conclusión, se han proporcionado una nueva sintetasa ortogonal derivada de tirosil tARN sintetasa de M. jannaschi i . Cuando se usa en conjunción con un tARNCuA supresor de M. jannaschii usado en conjunción con un tARNCuA supresor de M. jannaschi, estos reactivos permiten la incorporación in vivo del aminoácido no natural p-etiltiocarbonil-L-fenilalanina en cadenas de polipéptido. Este trabajo ilustra un protocolo biosintético para la producción bacteriana de proteínas que contienen un mango de tioéster de cadena lateral en sitios definidos. Esto permite la ligación química altamente selectiva y eficiente de una amplia variedad de ligandos al grupo reactivo sobre el residuo de aminoácido de p-etiltiocarbonil-L-fenilalanina del aminoácido a una proteína.
EJEMPLO 14 Componentes de traducción ortogonales para la incorporación in vivo del aminoácido no natural de Dicetona p- (3 -oxobutanoil) -L- fenilalanina a proteínas en E. coli El ejemplo presente describe composiciones y métodos para la incorporación biosintética del aminoácido no natural de dicetona p- (3 -oxobutanoil) -L-fenilalanina (véase, figura 1) a proteínas utilizando la maquinaria de traducción de célula huésped de E. coli. Nuevos pares de sintetasa/tARN ortogonales derivados de M. jannaschii para incorporar este aminoácido no natural fueron aislados que funcionan en un sistema de célula huésped de E. coll. Los estudios comparativos en cuanto a la habilidad de la monocetona simple o grupos funcionales ß-dicetona para formar ímmas con butilamma y las estabilidades de las íminas así formadas en solución reguladora del pH de fosfato a diferentes pH demuestran la fácil producción de enol ímma formada a partir de la porción de ß-dicetona a pH que fluctúan de 6.5 a 10.5, también como su estabilidad superior hacia la hidrólisis acida hasta pH 3.9. En comparación, a un pH de hasta 10.5 bajo las condiciones idénticas, el grupo monocetona permanece esencialmente como una forma libre sin ninguna formación de ímma detectable. Así, un aminoácido no natural que lleva una porción de ß-dicetona en su cadena lateral fue sintetizado y se emprendió la identificación de un par de tAR?-smtetasa ortogonal capaz de incorporar este aminoácido no natural. La invención proporciona una sintetasa mutante evolucionada exitosamente que específicamente la incorporación de este aminoácido que contiene dicetona a proteínas in vivo con alta eficiencia de traducción y fidelidad. Como se describe más plenamente posteriormente en la presente, un derivado de hidroxilamina biotina fue luego acoplado selectivamente a este grupo de dicetona que fue codificado genéticamente a una proteína de dominio Z, sugiriendo que la porción de acetona podría servir como mango químico poderoso cuya reactividad es ortogonal a las químicas biológicas normales para traer una variedad de propiedades externas a las proteínas objetivo. Se ha demostrado previamente que al agregar nuevos componentes a la maquinaria de traducción de Escheri chia coli o levadura, aminoácidos no canónicos podrían ser incorporados específicamente en el sitio con alta eficiencia y fidelidad de traducción a proteínas in vitro o in vivo utilizando componentes de traducción ortogonales . Este procedimiento ha sido usado para incorporar genéticamente aminoácidos que contienen cetona a proteínas, las cuales podrían ser conjugadas subsecuentemente con moléculas no peptídicas con diversas propiedades biológicas y/o físicas (por ejemplo, polietilenglicol, biotina, glicomiméticos, etc.) por medio de la formación de enlaces de hidrazona y oxima . Aunque estos enlaces de hidrazona y oxima son estables a las condiciones fisiológicas, son desventajosas por el requerimiento de la presencia simultánea de dos grupos funcionales que no son encontrados entre los veinte aminoácidos comunes. Si se tuviera un grupo funcional reactivo tal como un tioéster o ß-dicetona que formara directamente aductos estables con el grupo e-amino de Usinas o grupos a-amino, se podrían formar reticulaciones de proteína intermoleculares o intramoleculares. Para este fin, se reporta ahora la codificación genética del aminoácido que contiene dicetona 2 en Escherichia coli . Véase, figura 21. Se contempló que el producto conjugado de una aril dicetona 2 con una amina alifática puede conducir a la formado de aductos de imina 3 (véase, figura 21) , que se pueden tautomerizar a las enaminas correspondientes estabilizadas mediante un enlace de hidrógeno intramolecular de seis miembros. Esto puede dar como resultado un aducto estable al pH fisiológico. Para verificar experimentalmente este razonamiento, se comienza al medir la reactividad relativa de un sistema modelo simple que incluye una serie de formaciones de imina entre butilamina y la aril monocetona la y la aril dicetona 2 en solución reguladora del pH de fosfato 100 mM a diferentes pH que fluctúan de 6.5 a 10.5. Los varios aductos (lb y 3a-3d) fueron analizados utilizando espectrometría de masas cromatografía líquida (LC/MS) . Véase, Tabla 4. Esta Tabla describe los resultados de la formación de imina entre butilamina (10 mM) y ya sea aril monocetona 1 (1 mM) o 2 (1 mM) en solución reguladora del pH de PBS (K(P04)1 100 mM, NaCl 500 mM) a diferentes pH . Las reacciones fueron llevadas a cabo durante una semana a temperatura ambiente .
TABLA 4 Tiempo de reacción de 12 horas a temperatura ambiente Este análisis demostró que un pH de hasta 10.5, la permanece esencialmente como una forma libre sin ninguna formación detectable de lb . En contraste a un pH de 7.4, 50% de 2 ya se ha convertido 3 y este porcentaje se incrementa a un valor impresivo de 75% a pH 10.5. Esto, tomado conjuntamente con las observaciones previas que la forma ceto 2B y la forma de enol -imina 3b domina con respecto a los tautómeros correspondientes en medio acuoso (Iglesias, Curr. Org. Chem. 2004, 8, 1-24; Patteux et al., Org. Lett. 2003, 5, 3061 -3063; Aly, Tetrahedron 2003, 50, 1739- 1747; López et al., Tetrahedron: Asymmetry 1998, 9, 3741-3744; Mazzone et al., S. Eur . J. Med. Chem. 1986, 21, 277-284; y Kim and Ryu, Bull. Korean. Chem. Soc. 1992, 13, 184-187), confirmando mediante esto que el enlace de hidrógeno induce la estabilización no facilita significativamente la producción de 3 (predominantemente 3b) cuando se compara con la. Para corroborar adicionalmente que el enlace H intramolecular estabilizado proporciona a 3 una mayor estabilidad hacia la hidrólisis de la ímma simple lb, también se efectuaron análisis de LC/MS en lb y 3 a un pH que fluctúa de 1.9 a 9.4. Como se demuestra en la figura 1, 3 (supuestamente 3b) permanece esencialmente intacto al pH fisiológico 7.4 o mayor. Solamente -40% de conversión de 3 a 2 ocurre a un pH de esta 3.9 después de 4 días a temperatura ambiente. Un tratamiento más ácido de 3 condujo a la desinstalación completa del grupo amino (figura 18) . En contraste agudo pero como se esperaba, lb es fácilmente hidrolizado a un pH de 10.5 después de agitación durante toda la noche (datos no mostrados) SÍNTESIS DE AMINOÁCIDO NO NATURAL Alentados por estos hallazgos, se desea establecer la química para derivar un aminoácido no natural p-(3-oxobutanoil) -L-femlalamna que contiene una porción de ß-dicetona en su cadena lateral. La estrategia de síntesis (véase, figura 19) inicia a partir de la p-acetil- (+) -L-fenilalamna fácilmente accesible al proteger los grupos ammo y ácido de la cadena fundamental mediante química de Boc y estepficación, respectivamente. La adición de un segundo grupo carbomlo se llevó a cabo bajo condiciones de reacción que involucran ter-butóxido de potasio en un solvente mezclado (2:3 [v/v] acetato de metilo: THF) . La remoción del grupo Boc con TFA, seguida por hidrólisis alcalina, proporcionó la p-(3- oxobutanoil) -L-fenilalanina deseada con un rendimiento global de 40%.
IDENTIFICATION DE COMPONENTES DE TRADUCCIÓN ORTOGONALES Nuevos pares de aminoacil-tARN sintetasa/tARN ortogonales fueron construidos para la incorporación in vivo de p- (3 -oxobutanoil) -L-fenilalanina a proteínas utilizando protocolos establecidos. En base a la estructura cristalina del complejo de TyrRS- RNA (Tyr) de M. jannaschi i L-tirosina (Kobayashi et al., Nat. Struct. Biol. 2003, 10, 425-432), seis residuos (Tyr32, Leu65, PhelOd, Glnl09, Aspl58 y Leul62) alrededor del sitio de enlace de tirosina de TyrRS de M. jannaschi i fueron mutados aleatoriamente. Después de hacer pasar secuencialmente la biblioteca generada de aproximadamente 109 imitantes a través de tres rondas de selección positiva, alternadas con dos rondas de selección negativa de acuerdo con el protocolo publicado, un número de clones emergieron cuya sobrevivencia en cloranfenicol fue dependiente de a presencia de p- (3 -oxobutanoil) -L-fenilalanina . Dos mutantes TyrRS fueron identificados al utilizar un análisis in vivo en base a la supresión del codón TAG Aspll2 en el gen CAT. Estos dos mutantes pueden soportar el cultivo celular en cloranfenicol 120 µg L"1 en presencia de p- (3 -oxobutanoil) -L-fenilalanina, y hasta 10 µg mL"1 de cloranfenicol sin p- (3 -oxobutanoil) -L-fenilalanina. Este resultado sugiere que las dos sintetasas evolucionadas tienen tanto una actividad más alta por p-(3-oxobutanoil) -L-fenilalanina que por cualquier aminoácido natural . La secuenciación de ADN de estos mutantes reveló que convergen a la misma secuencia (véase Tabla 5, SEQ ID NO 61) Ambos enlaces de hidrógeno entre el grupo hidroxi fenólico de tirosma enlazada y Tyr32 y Aspl58 son rotos por mutaciones a Gly. Leu65 es convertido a Val65, proporcionado posiblemente más espacio para acomodar la cadena fundamental extendida de la ß-dicetona Las mutaciones del PhelOdThr y Leul62Ser también como un Glnl09 conservado pueden así indicar su implicación en el enlace de H al oxígeno de carbonilo en la porción de ß-dicetona. Las secuencias de estos clones de smtetasa son resumidas a continuación.
Para confirmar que el fenotipo observado es provocado por la incorporación especifica del sitio de p- (3-oxobutano?l) - Tyr L-fen?lalan?na por el par mutRNACUA -mutTyrRS, se introdujo un codón ámbar en lugar del codón para tirosina en la séptima posición en el gen que codifica la proteína de dominio Z (?ilsson et al., Protein Eng . 1987, 1, 107-113) fusionada a una etiqueta H?s6 C-terminal. La proteína fue expresada en presencia o ausencia de p- (3-oxobutano?l) -L-femlalamna 1 mM y purificada mediante cromatografía de ?i-?TA. El análisis mediante SDS-PAGE reveló expresión de proteína dependiente de aminoácido no natural (figura 20) . El volumen de proteína mutante cargada al gel es tres veces la proteína tipo amplio (WT) en donde el aminoácido no natural que contiene dicetona es reemplazado con un residuo de tirosma, indicado alrededor de 30% de eficiencia de incorporación de p- (3 -oxobutanoil) -L-femlalamna en comparación con tirosma. Una evidencia más convincente para la incorporación no ambigua de p- (3 -oxobutanoil) -L-fenilalanina fue obtenida mediante espectrometría de masas de tiempo de vuelo de desorción/ionización de láser auxiliada por matriz (MS de MALDI-TOF) . Además de la observación de una masa promedio experimental de 7991 Da (MTe?r?co = 7997 Da) para la proteína intacta, un pico mayor correspondiente a la proteína sin la primera porción de metionina (MExper?mentai = 7867 Da, MTeor?co = 7866 Da) fue también detectado. La proporción de señal a ruido fue > 400, sugiriendo una fidelidad para la incorporación de p- (3-oxobutano?l) -L-fenilalanina mejor de 99%, utilizando el par Tyr de mutRNACUA -mutTyrRS desarrollado, La posibilidad de usar una porción de dicetona como mango químico para la modifica específica del sitio de proteína con propiedades externas fue probada al llevar a cabo la marcación ín vitro de proteínas que contienen dicetona expresadas con derivado de hidroxilamina biotma (PM = 331.39, comprada de Molecular Probes) . Las proteínas mutantes purificada y proteínas de dominio Z WT fueron tratadas con biotina hidroxilamma 2 mM en solución reguladora del pH de fosfato a un pH de 4.0 a 25°C durante 12 horas. Después de la diálisis contra agua para remover el exceso de biotina hidroxilamma, las proteínas fueron analizadas mediante MS de MALDI-TOF. Las masas promedio experimentales de 8315 Da (MTeópco = 8310 Da, proteína mutante intacta biotma-marcada) , 8182 Da (MTeónco = 8179 Da, proteína mutante biotma-marcada sin el primer residuo de metiomna) y 8225 Da (MTeónco = 8221 Da, proteína mutante biotina-marcada sin el primer residuo de metionma a su forma acetilada) fueron obtenidas, confirmando que la biotina hidroxilamina reaccionó con las proteínas de dominio Z mutantes en una proporción molar de 1:1. Como se esperaba, no se detectó ningún producto de marcación para las proteínas de dominio Z WT, indicando que la reacción de marcación ocurría solamente entre la hidroxilamina y el grupo dicetona, pero no ningún grupo funcional existente en la proteína de WT. Tomados conjuntamente con ninguna observación de proteínas mutantes que contienen dicetonas sin marcar en el espectro de masas, estos datos demuestran la excelente especificidad y alta reactividad del mango de dicetona para la modificación m vitro selectiva de proteínas. El ejemplo presente demuestra que la incorporación de un mango de ß-dicetona a proteína m vivo utilizando un sistema de traducción ortogonal evolucionado y altamente específico ocurre específicamente en el sitio con una alta fidelidad y eficiencia que es comparable con su contraparte natural Dada tanto la alta estabilidad como la fase de producción de 3 con respecto a un amplio intervalo de pH, la modulación de interacciones de proteína-proteína por medio de la formación de base de Schiff entre la porción de ß-dicetona y el grupo ammo de un residuo de hsina es altamente posible, especialmente cuando p- (3 -oxobutanoil ) -L-femlalamna es colocada en un hidrofóbico favorable.
EJEMPLO 15 Componentes de traducción ortogonales para la incorporación in vivo del aminoácido no natural p-isopropiltiocarbonil-L- fenilalanina a proteínas en E. coli El ejemplo presente describe composiciones y métodos para la incorporación biosmtética de p-isopropiltiocarbonil-L-femlalanma (véase, figura 1) a proteínas utilizando la maquinaria de traducción de célula huésped de E. coll. Nuevos pares de sintetasa/tARN ortogonales derivados de M. jannaschii para incorporar este aminoácido no natural fueron aislados que funcionan en un sistema de célula huésped de E. coli. Este aminoácido no natural encuentra uso como objetivo para modificaciones post-traducción cuando son incorporados a proteínas y es además ventajoso debido a que la porción químicamente reactiva sobre el aminoácido no natural es resistente a las actividades de hidrólisis de enzimas celulares . Una nueva sintetasa ortogonal fue derivada de tirosil -tAR? sintetasa de M. jannaschii y es usada en conjunción con el tAR?CuA supresor de M. jannaschii . Este nuevo par ortogonal no tiene afinidad o tiene afinidad muy baja por cualquiera de los aminoácidos comunes (esto es, que se presentan de manera estable en la naturaleza) . La tAR? sintetasa ortogonal derivada carga selectivamente el tAR?CUA supresor ámbar con p-isopropiltiocarbonil -L-fenilalanina . El tAR? supresor aminoacilado (esto es, el tAR? "cargado") es usado como un sustrato por el aparato de traducción de E. coli endógeno para incorporar p-isopropiltiocarbonil-L-fenilalanina en respuesta al codón de retención ámbar TAG (un codón selector) encontrado en un transcripto. La ortogonalidad de este par de tAR?/sintetasa asegura que ni el tAR? ni la sintetasa reacciona de manera cruzada con la tAR? de E. coli endógenos o sintetasas y que el aminoácido no natural es incorporado solamente en respuesta a un codón sin sentido ámbar, TAG. Se emprendió una búsqueda por sintetasas ortogonales que tienen la habilidad para cargar específicamente un tARN ortogonal con p-isopropiltiocarbonil-L-fenilalanina . Esta búsqueda usó los protocolos que han sido descritos previamente.
Una biblioteca de mutantes de tirosil-tARN-sintetasa de M. jannaschi i fue generada mediante mutagénesis de la tirosil -tARN-sintetasa de M. jannaschi i de tipo silvestre, en donde la mutagénesis consistió de aleatorizar residuos de sitio activo predichos en base a la estructura cristalina de otras moléculas de aminoacil tARN-sintetasa . Enseguida de la mutagénesis, la biblioteca de sintetasa mutante se hizo pasar a través de múltiples rondas de selección positiva y negativa. Esta selección produjo un clon de sintetasa que tenía la capacidad de cargar el O-tARN con p-isopropiltiocarbonil-L-fenilalanina . Aquel clon de sintetasa fue secuenciado y la secuencia de aminoácido fue determinada (véase, Tabla 5, SEQ ID NO: 62) . Esta sintetasa mutante muestra las siguientes sustituciones en relación con la secuencia de sintetasa de M. j annaschi i tipo silvestre: EJEMPLO 16 Componentes de traducción ortogonales para la incorporación in vivo de aminoácidos no naturales fluorescentes que contienen coumarina a proteínas en E. coli El ejemplo presente describe composiciones y métodos para la incorporación biosintética de 7-amino-coumarina alanina y 7-hidroxi-coumarina alanina (véase, la figura 1) a proteínas utilizando la maquinaria de traducción de célula huésped de E. coli. Nuevos pares de sintetasa/tARN ortogonales derivados de M. jannaschii para incorporar este aminoácido no natural fueron aislados que funcionan en un sistema de célula huésped de E. coli . La fluorescencia es una de las técnicas más sensibles y útiles en biología molecular. El descubrimiento de proteína fluorescente verde (GFP) ha conducido a una revelación espectacular en biología celular, permitiendo el estudio de expresión de proteína, localización, dinámica e interacción en células vivas mediante visualización directa (Lippincott- Schwartz et al., Nat. Rev. Mol. Cell Bio. (2001) 2:444-456). Sin embargo, la interacción y dinámica de proteínas no pueden ser apuntadas en la resolución atómica debido al tamaño de GFP. GFP también requiere muchos transcriptos para obtener una señal apropiada y requiere un retraso de tiempo para su plegado y maduración de fluoróforo. La incorporación de aminoácidos fluorescentes, en contraposición a una porción de proteína fluorescente entera, superaría algunas de las limitaciones en el sistema de fluorescencia de GFP. La incorporación específica del sitio de aminoácidos fluorescentes introduciría mínima perturbación a la proteína huésped, que permite la medición de transferencia de energía de resonancia de fluorescencia (FRET) con mucha mayor precisión. (Truong e I ura, Curr. Opin. Struct. Bio. 2001, 11:573-578) . Además, el uso de un aminoácido fluorescente permitirá el sondeo del ambiente local de cada posición de aminoácido y apuntaría residuos que moderan la interacción con otros componentes celulares al hacer variar la posición del aminoácido fluorescente en la proteína. Esto también sería muy útil al estudio de plegado de proteína in vitro (Lakowicz, J. R. Principies of Fluorescence Spectroscopy Ed . 2; Kluwer Academic/Plenum Publishers: New York, 1999), especialmente en un sistema de una sola molécula (Lipman et al., Science 2003, 301:1233-1235), debido a que una molécula de proteína contiene normalmente más de un residuo de triptófano y la marcación química específica de proteínas con sondas fluorescentes es extremadamente difícil. Las coumarin alaninas mostradas en la figura 1 han sido sintetizadas químicamente. Una nueva sintetasa ortogonal fue derivada de tirosil tARN sintetasa de M. jannaschi i y es usada en conjunción con el tARNCuA supresor M. jannaschii descrito previamente para incorporar estos aminoácidos de coumarina. Este nuevo par ortogonal no tiene afinidad o tiene afinidad muy baja para cualquiera de los aminoácidos comunes (esto es, que se presenta de manera estable en la naturaleza) . La tARN sintetasa ortogonal carga selectivamente el tARNCuA supresor ámbar con 7-amino-coumarina alanina y 7-hidroxi-coumarina alanina. El tARN supresor aminoacilado (esto es, el tARN "cargado") es usado como sustrato por el aparato de traducción de E. coli endógeno para incorporar 7-amino-coumarina alanina y 7 -hidroxi -coumarina alanina en respuesta al codón de retención ámbar TAG (un codón selector) encontrado en un transcripto. La ortogonalidad de este par de tARN/sintetasa asegura ni el tARN ni la sintetasa reacciona de manera cruzada con tARN de E. coli endógeno o sintetasas y que el aminoácido no natural es incorporado solamente en respuesta a TAG. Se emprendió una búsqueda por sintetasas ortogonales que tienen la habilidad para cargar específicamente un tARN ortogonal con 7 -amino-coumarina alanina o 7 -hidroxi -coumarina alanina. Esta búsqueda utilizó protocolos que han sido descritos previamente. Una biblioteca de mutantes de tirosil-tARN-sintetasa de M. jannaschii fue generada mediante mutagénesis de la tirosil-tARN-sintetasa de M. jannaschi i de tipo silvestre, en donde la mutagénesis consistió de aleatorizar seis residuos de sitio activo predichos en base a la estructura cristalina de otras moléculas de aminoacil-tARN sintetasa. La biblioteca tiene a diversidad de aproximadamente 109 especies. Enseguida de la mutagénesis, la biblioteca de sintetasa mutante se hizo pasar a través de múltiples rondas de selección positiva y negativa. Esta selección produjo un clon de sintetasa que tenía la habilidad de cargar el O-tARN con 7-amino-coumarina alanina o 7-hidroxi-coumarina alanina. Luego aquel clon de sintetasa fue secuenciado y la secuencia de aminoácidos fue determinada (véase, Tabla 5, SEQ ID NO: 63) . Esta sintetasa mutante muestra las siguientes sustituciones en relación con la secuencia de tirosil-tARN sintetasa de M. jannaschi i tipo silvestre: Y32R, L65A, H70M, D158N y L162T. Se han obtenido datos adicionales que demuestran la incorporación selectiva de los aminoácidos de coumarina alanina a proteínas en respuesta a un codón selector en un sistema de traducción ortogonal que comprende la especie de sintetasa aislada. Estos datos incluyen (a) estudios de expresión en donde un gen de mioglogina que tiene un codón selector de TAG en posición 4 es expresado solamente en presencia del aminoácido no natural; (b) la mioglobina mutante sintetizada en presencia del aminoácido no natural aparece como una banda fluorescente en un análisis de gel de SDS-PAGE; y (c) la smtetasa mutante aislada ha sido cristalizada y la estructura de co-cristal de la smtetasa mutante en presencia del aminoácido no natural es fluorescente.
EJEMPLO 17 Especies O-RS y O-tARN para la incorporación de aminoácidos no naturales Una variedad de especies de O-tARN pueden ser usadas con la presente invención y la invención no está limitada al uso de algún O-tARN particular. Por ejemplo, especies de O-tARN que comprende la secuencia de nucleótidos SEQ ID NO: 1 o SEQ ID NO: 2 encuentran uso con la invención. Con las enseñanzas proporcionadas en la presente, especies de O-tARN adicionales pueden ser construidas para uso con la invención. Similarmente , también se proporcionan especies O-RS (véase, Tabla 5) para uso en protocolos para la incorporación de aminoácidos no naturales, por ejemplo un aminoácido no natural seleccionado de p-etiltiocarbonil-L-fe lalamna , p-(3-oxobutanoil) -L-femlalanma, 1 , 5-dans?l-alamna, 7-ammo-coumapna alamna, 7 -hidroxi -coumarina alamna, o-mtrobencil-sepna, O- (2-n?trobenc?l) -L-tirosina, p-carboximetil-L-fenilalanina, p-ciano-L-fenilalanina, m-ciano-L-fenilalanina, bifenilalanina, 3-amino-L-tirosina, bipiridilalanina, p-(2-amino-1 -hidroxietil) -L-fenilalanina; p- isopropiltiocarbonil -L-fenilalanina; 3-nitro-L-tirosina y p-nitro-L-fenilalanina . Los polipéptidos de O-RS de la invención incluyen aquellos polipéptidos que comprenden las secuencias de aminoácidos proporcionados en la Tabla 5, SEQ ID NOS: 7-10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 50, 52-55, 57 y 59-63. Ejemplos de polinucleótidos que codifican O-RS o porciones de las mismas son también proporcionados. Por ejemplo, polinucleótidos que codifican moléculas de O-RS de la invención incluyen SEQ ID NOS: 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 51, 56, 58. Sin embargo, no se pretende que los polinucleótidos de la invención estén limitados a aquellos provistos en la Tabla 5. Por supuesto, cualquier polinucleótido que codifique una secuencia de aminoácidos de O-RS de la invención, por ejemplo, SEQ ID NOS: 7-10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 50, 52-55, 57 y 59-63, es también un aspecto de la invención. Se comprenderá que los ejemplos, y modalidades descritos en la presente son por propósitos ilustrativos solamente y que varias modificaciones o cambios a la luz de los mismos serán sugeridos para las personas experimentadas en el arte y serán incluidos en el espíritu y alcance de esta solicitud y alcance de las reivindicaciones adjuntas. En tanto que la invención anterior ha sido descrita en algún detalle por propósitos de claridad y entendimiento, será claro para el experimentado en al arte a partir de esta revelación que varios cambios en forma y detalles se pueden efectuar sin desviarse del verdadero alcance de la invención.
Por ejemplo, todas las técnicas y aparatos descritos anteriormente pueden ser usados en varias combinaciones. Todas las publicaciones, patentes, solicitudes de patente y/u otros documentos citados en esta solicitud son incorporados por referencia en su totalidad para todos los propósitos a la misma extensión como si cada publicación, patente, solicitud de patente y/u otro documento individual fueran indicados individualmente para ser incorporados por referencia para todos los propósitos.
EJEMPLO 18 Secuencias de nucleótidos y aminoácidos Este ejemplo proporciona secuencias de nucleótidos y aminoácidos para varios polinucleótidos y polipéptidos, respectivamente. Las secuencias proporcionadas en la Tabla 5 a continuación se proponen proporcionar ejemplos solamente y no se pretende que la invención esté limitada de ninguna manera por las secuencias proporcionadas en la Tabla 5.
TABLAS Secuencias de nucleótidos y aminoácidos SEQ ID Descripción SECUENCIA NO: tirusil -tRNAc?A upi-esor el e ? íeíhon c cc us ja nasc hii CCGGCGGUAGUUCAGCAGGGCAGAACGGCGGACUCUAAAUCCG CAUGGCGCUGGUUCAAAUCCGGCCCGCCGGACCA mutRNA^A GCCCGGAUGGUGGAAUCGGUAGACACAAGGGAUUCUAAAUCCC tRNA CUA supre.ssor C culi UCGGCGUUCGCGCUGUGCGGGUUCAAGUCCCGCUCCGGGUACC A MDEFEMIKRNTSEIISEEE REVLKKDEKGAYIGFEPSGK?IL secuencia de umiimácidos de GHYLQIKKMJ DLQNACFUJ 11 LLADLHAYL.NQKGELÜEI X LO tirosil-tARN sintetnsfl de DYNKKVFEA GLKAKYVYGSEFQLDKDYTLNVYRLA KTTLKR ? leihan coccus jannaschii ARRSMELIAREDENPKVAEVIYPIMQVNDIHYLGVDVAVGGM? QRKTHM ARE PKKVVCIHNPVLTGL.DGEGKMSSS G FIAV (MjTyrRS) tipo silvestre DDSPEEIRAKTKKAYCPAGVVEGNPIMEIAKYF EYP TIKRP E FGGDLTVNSYEELES FKNKE HPMDI.KNAVAEELI ILEP IRKR ATGGACGAATTTGAAATGATAAAGAGAAACACATCTGAAATTATCAG CGAGGAAGAGTTAAGAGAGGTTTTAAAAAAAGATGAAAAATCTGCTT ACATAGGTTl'TGA?CCA?OTGGTAAA?TACAT'rT?GGGCATTArCTC CAAATAAAAAAGATGATTGATTTACAAAATGCTGGATTTGATATAAT TATATTGTTGGCTGATTTACACGCCTATTTAAACCAGAAAGGAGAGT TGGATG?GATTAGAAAAATAGGAGATTATAACAAAAA?GTTTTTGA? GCAATGGGGTTAAAGGCAAAATATGTTTATGGAAGTGAATTCCAGCT TGATAAGGATTATACACTGA?TGTCTATAGATTGGCTTTAAAAACTA secuencia de aminoácidos de CCTTAAAAAGAGCAAGAAGGAGTATGGAACTTATAGCAAGAGAGGAT IÍGUMI-I?RIN de GAAAATCCAAAGGTTGCTGAAGTTATCTATCCAATAATGCAGGTTA? Melhanococciis jannaschii TGATATTCATTATTTAGGCGTTGATGTTGCAGTTGGAGGGATGGAGC AGAGAAAAATACACATGTTAGCAAGGGAGCTTTTACCAAAAAAGGTT ( MjTyrRS) tipo silvestre GtTTGT?TTCAC??CCCTGTCTTA?CGGGTTTCG?tGCACAACC?7- GATGAGTTCTTCAAAAGGGAATTTTATAGCTGTTGATGACTCTCCAG AAGAGATTAGGGCTAAGATAAAGAAAGCATACTGCCCAGCTGGAGTT GTtGAAGGAAATCCAATAATGGAGATAGCTAAATACTTCCTTGAATA TCCTTTAACCATAAAAAGGCCAGAAAAATTTGGTGGAGATTTGACAG TTAATAGCTATGAGGAGTTAGAGAGTTTATTTAAAAATAAGGAATTG CATCCAATGGATTTAAAAAATGCTGTAGCTGAAGAACTTATAAAGAT TTTAGAGCCAATTAGAAAGAGATTA MQEQYRPEEIESKVQLHWDEKRTFEVTEDESKEKYYCLSM PY PSGRLHMGHVRNYTIGDVIARYQRMLGKNVLQPIGWDAFGLPA EGAAVK NTAPAPWTYDNIAYMKNQLKMLGFGYDWSRE ?TCT PEYYRWEQKFFTELYKKGLVYKKT?AVNWCPNDQTVLANEQVI DGCCWRCDTKVERKEIPQWFIKITAYADE 1.NDLDK DHWPDT VKTMQRNWIGRSEGVEITFNVND DNTL.TVYTTRPDTFMGCTY LAVAAGHPI?QKAAENNPELAAFIDECRNTKVAEAEMATHE K secuencia de aminoácidos de GVDTGFKAVHP TGEEIPVWAANFVLMEYGTGAVMAVPGHDQR Icucil-t?RN .sintetasa ( Ec euRS) DYEFASKYGLNIKPVILAADGSEPD SQQALTEKGV FNSGEF tipo silvestre NGLDHEAAFNAIADKLTAMGVGERKVNYRLRD GVSRQRYWGA PIPMVTLEDGTVMFTPDDQLPVILPEDVVMDGITSPIKADPE AKTTVNGMPA RETDTFDTFMESSWYYARYTCPQYKEGM1.DSF. AANYWLPVDIYIGGIEHAIMHLLYFRFFHK MRDAG VNSDEP AKQLLCQGMVLADAFYYVGENGERNWVSPVDAIVERDEKGRIV K?KDAAGHELVYTGMSKMS SKNNGIDPQVMVERYGAOrVR F MHFASP?DMT E QESGVEGANRFLKRV LVYEHTAKGDVAA LNVDALTENQKALRRDVHKTIAKVTDDIGRRQTFNTA1AAIME LMNKLAKAPTDGEQDRA MQEAL AVVRMLN PFTPliICFTLWQ ELKGEGDIDNAPWPVADEKAMVEDSTLVVVQVNGKVRAKITVP VDATEEQVRERAGQEH VAKYLDGVTVRKVIYVPGKI. N VVG ATGCAAGAGCAATACCGCCCGGAAGAGATAGAATCCAAAGTAC AGCTTCATTGGGATGAGAAGCGCACATTTGAAGTAACCGAAGA CGAGAGCAAAGAGAAGTATTACTGCCTGTCTATGCTTCCCT?T CCTTCTGGTCGACTACACATGGGCCACGTACGTAACTACACCA TCGGTGACGTGATCGCCCGCTACCAGCATATGCTGGGCAAAAA CGTCCTGCAGCCGATCGGCTGGGACGCGTTTGGTCTGCCTGCG GAAGGCGCGGCGGTGAAAAACAACACCGCTCCGGCACCGTGGA CGTACGACAACATCGCGTATATGAAAAACCAGCTCAAAATGCT GGGCTTTGGTTATGACTGGAGCCGCGAGCTGGCAACCTGTACG CCGGAATACTACCGTTGGGAACAGAAATTCTTCACCGAGCTGT ATAAAAAAGGCCTGGTATATAAGAAGACTTCTGCGGTCAACTG GTGCCCGAACGACCAGACCGTACTGGCGAACGAACAAGTTATC GACGGCTGC?GCTGGCGCTGCGATACCAAAGTTGAACGTAAAG AGATCCCGCAGTGGTTTATCAAAATCAATGCTTACGCTGACGA GCTGCTCAACGATCTGGATAAACTGGATCACTGGCCAGACACC GTTAAAACCATGCAGCGTAACTGGATCGGTCGTTCCGAAGGCG TGG?GATCACCTTCAACGTTAACGACTATGACAACACGCTGAC CGTTTACACTACCCGCCCGGACACCTTTATGGGTTGTACCTAC CTGGCGGTACGTGCGGGTCATCCGCTGGCGCAGAAAGCGGCGG AAAATAATCCTGAACTGGCGGCCTTTATTGACGAATGCCGTAA CACCAAAGTTGCCGAAGCTGAAATGGCGACGATGGAGAAAAAA GGCGTCGATACTGGCTTTAAAGCGGTTCACCCATTAACGGGCG ??G?AATTCCCGTTTGGGCAGCAAACTTCGTATTGATGGAGTA CGGCACGGGCGCAGTTATGGCGGTACCGGGGCACCACCAGCGC GACTACGAGTTTGCCTCTAAATACGGCCTGAACATCAAACCGG TTATCCTGGCAGCTGACGGCTCTGAGCCAGATCTTTCTCAGCA AGCCCTGACTGAAAAAGGCGTGCTGTTCAACTCTGGCGAGTTC AACGGTCTTGACC?TGAAGCGGCCTTCAACGCCATCGCCGATA AACTGACTGCGATGGGCGTTGGCGAGCGTAAAGTGAACTACCG CCTGCGCGACTGGGGTGTTTCCCGTCAGCGTTACTGGGGCGCG CCGATTCCG?TGGTGACGCTGGAAGACGGTACCGTAATGCCGA secuencia de nucleútiU?s (le CCCCGGACGACCAGCTGCCGGTGATCCTGCCGGAAGATGTGGT le?cil-t?RN sinfetasa (EcLen S) AATGGACGGCATTACCAGCCCGATTAAAGCAGATCCGGAGTGG tipo silvestre GCGAAAACTACCGTTAACGGTATGCCAGCACTGCG?GAAACCG ACACTTTCGACACCTTTATGGAGTCCTCCTGGTACTATGCGCG CTACACTTGCCCGCAGTACAAAGAAGGTATGCTGGATTCCGAA GCGGCTAACTACTGGCTGCCGGTGGATATCTACATTGGTGGTA TTGAACACGCCATTATGCACCTGCTCTACTTCCGCTTCTTCCA CAAACTGATGCGTGATGCAGGCATGGTGAACTCTGACGAACCA GCGAAACAGTTGCTGTGTCAGGGTATGGTGCTGGCAGATGCCT TCTACTATGTTGGCGAAAACGGCGAACGTAACTGGGTTTCCCC GGTTGATGCTATCGTTGAACGTGACGAGAAAGGCCGTATCGTG AAAGCGAAAGATGCGGCAGGCCATGAACTGGTTTATACCGGCA TGAGCAAAATGTCCAAGTCGAAGAACAACGGTATCGACCCGCA GGTGATGGTTGAACGTTACGGCGCGGACACCGTTCGTCTGTTT ATGATGTTTGCTTCTCCGGCTGATATGACTCTCGAATGGCAGG AATCCGGTGTGGAAGGGGCTAACCGCTTCCTGAAACGTGTCTG GAAACTGGTTTACGAGCACACAGCAAAAGGTGATGTTGCGGCA CTGAACGTTGATGCGCTGACTGAAAATCAGAAAGCGCTGCGTC GCGATGTGCATAAAACGATCGCTAAAGTGACCGATGATATCGG CCGTCGTCAGACCTTCAACACCGCAATTGCGGCGATTATGGAG CTGATGAACAAACTGGCGAAAGCACCAACCGATGGCGAGCAGG ACCGCGCTCTGATGCAGGAAGCACTGCTGGCCGTTGTCCGTAT GCTTAACCCGTTCACCCCGCACATCTGCTTCACGCTGTGGCAG GAACTGAAAGGCGAAGGCGATATCGACAACGCGCCGTGGCCGG TTGCTGACGAAAAAGCGATGGTGGAAGACTCCACGCTGGTCGT GGTGCAGGTTAACGGTAAAGTCCGTGCCAAAATCACCGTTCCG GTGGACGCAACGGAAGAACAGGTTCGCGAACGTGCTGGCCAGG TAGAGAGTTTATTTAAAAATAAGGAATTGCATCCAATGGATTT AAAAAATGCTGTAGCTGAAGAACTTATAAAGATTTTAGAGCCA ATTAGAAAGAGATTATAA MDEFEMIKRNTSEIISEEELREVLKKDEKSAQIGFEPSGKIHL secuencia de aminoácidos de GHYLQIKKMIDLQNAGFDIIIELADLHAYLNQKGELDEIRKIG aminoacil-tARN sintetasa 3-a?ni??o-Ltirosina (derivada de DYNKKVFEAMGLKAKYVYGSEGLLDKDYTLNVYRLALKTTLKR tirosil tARN sintetasa de ARRS ELIAREDENPKVAEVI PIMQVNSIHYTGVDVAVGGME Mcthanococcus jannaschii QRKIHMLARELLPKKVVCIHNPVLTGLDGEGKMSSSKGNFIAV tipo silvestre) DDSPEEIRAKIKKAYCPAGVVEGNPIMEIAKYFLEYPLTIKRP EKFGGDLTVNSYEELESLFKNKELHPMDLKNAVAEELIKILE? IRKRL ATGGACGAATTTGAAATGATAAAGAGAAACACATCTGAAATTA TCAGCGAGGAAGAGTTAAGAGAGGTTTTAAAAAAAGATGAAAA ATCTGCTCAGATAGGTTTTGAACCAAGTGGTAAAATACATTTA GGGCATTATCTCCAAATAAAAAAGATGATTGATTTACAAAATG CTGGATTTGATATAATTATAGAGTTGGCTGATTTACACGCCTA TTTAAACCAGAAAGGAGAGTTGGATGAGATTAGAAAAATAGGA GATTATAACAAAAAAGTTTTTGAAGCAATGGGGTTAAAGGCAA AATATGTTTATGGAAGTGAAGGTTTGCTTGATAAGGATTATAC ACTGAATGTCTATAGATTGGCTTTAAAAACTACCTTAAAAAGA secuencia de nucleótidos de GCAAGAAG3AGTATGGA?CTTAT?GCAAGAGAGGATGA??ATC apiinoacil-tARN sintetasa CAAAGGTTGCTGAAGTTATCTATCCAATAATGCAGGTTAATTC 3-amino- -tirosina TATTCATTATACTGGCGTTGATGTTGCAGTTGGAGGGñTGGAG CAGAGAAAAATACACATGTTAGCAAGGGAGCTTTTACCAAAAA AGGTTGTTTGTATTCACAACCCTGTCTTAACGGGTTTGGATGG AGAAGGAAAGATGAGTTCTTCAAAAGGGAATTTTATAGCTGTT GATGACTCTCCAGAAGAGATTAGGGCTAAGATAAAGAAAGCAT ACTGCCCAGCTGGAGTTGTTGAAGGAAATCCAATAATGGAGAT AGCTAAATACTTCCTTGAATATCCTTTAACCATAAAAACGCCA GAAAAATTTGGTGGAGATTTGACAGTTAATAGCTATGAGGAGT TAGAGAGTTTATTTAAAAATAAGGAATTGCATCCAATGGATTT AAAAAATGCTGTAGCTGAAGAACTTATAAAGATTTTAGAGCCA ATTAGAAAGAGATTATAA secuencia de aminoácidos de clon MDEFEMIKRNTS?IISEE?LREVLKKDEKSAAIGFEPSGKÍHL #1 de aminoacil-tARN sintetasa GHYLQIKKMIDLQNAGFDIIIS ADLHAY NQ GELDEIRKIG p-carboximetil- -fenila la nina DYNKKVFEAMGLKAKYVYGSERNLDKDYTLNVYRLALKTTLKR (derivada de tirosil tARN sinteARRSMELIAREDENPKVAEVIYPIMQV SIHYHGVDVAVGGME tasa de Methanococcus jannaschii QRKIHMLARELLPKKVVCIHNPVLTGLDGEGKMSSS GNFIAV tino silvestre) DDSPEEIRAKIKKAYCP?G VEGNPIMEIAKYFLEYPLTIKRP EKFGGDLTVNSYEELESLFKNKELHPMDLKNAVAEELIKILEP IRKRL ATGGACGAATTTGAAATGATAAAGAGAAACACATCTGAAATTA TCAGCGAGGAAGAGTTAAGAGAGGTTTTAAAAAAAGATGAAAA ATCTGCTGCGATAGGTTTTGAACCAAGTGGTAAAATACATTTA GGGCATTATCTCCAAATAAAAAAGATGATTGATTTACAAAATG CTGGATTTGATATAATTATATCGTTGGCTGATTTACACGCCTA TTTAAACCAGAAAGGAGAGTTGGATGAGATTAGAAAAATAGGA secuencia de nucleótidos de clon GATTATAACAAAAAAGTTTTTGAAGCAATGGGGTTAAAGGCAA #1 de aminoacil-tARN sintetasa AATATGTTTATGGAAGTGAACGTAATCTTGATAAGGATTATAC p-carboximetil-L-fcnilalanina ACTGAATGTCTATAGATTGGCTTTAAAAACTACCTTAAAA?GA GCAAGAAGGAGTATGGAACTTATAGCAAGAGAGGATGAAAATC CAAAGGTTGCTGAAGTTATCTATCCAATAATGCAGGTTAATTC TATTCATTATCATGGCGTTGATGTTGCAGTTGGAGGGATGGAG CAGAGAAAAATACACATGTTAGCAAGGGAGCTTTTACCAAAAA AGGTTGTTTGTATTCACAACCCTGTCTTAACGGGTTTGGATGG AGAAGGAAAGATGAGTTCTTCAAAAGGGAATTTTATAGCTGTT GATGACTCTCCAGAAGAGATTAGGGCTAAGATAAAGAAAGCAT ACTGCCCAGCTGGAGTTGTTGAAGGAAATCCAATAATGGAGAT AGCTAAATACTTCCTTGAATATCCTTTAACCATAAAAAGGCCA GAAAAATTTGGTGGAGATTTGACAGTTAATAGCTATGAGGAGT TAGAGAGTTTATTTAAAAATAAGGAATTGCATCCAATGGATTT AAAAAATGCTGTAGCTGAAGAACTTATAAAGATTTTAGAGCCA ATTAGAAAGAGATTATAA MDEFEMIKRNTSEIISEEELREVLKKDEKSASIGFEPSGKIHL secuencia de aminoácidos de clon GHYLQIKKMIDLQNAGFD?IALADLHAYLNQKGELDEIRKIG #2 de aminoacil-tARN sintetasn DYNKKVFEAMGLKAKYVYGSENYLDKDYTLNVYRLALKTT KR p-carboximetil-L-fcnilalanina ARRSMELIAREDENPKVAEVIYPIMQVNGIHYKGVDVAVGGME (derivada de tirosil tARN-sinteQRKTKMLARELLPKKVVCIHNPVLTGLDGEGKMSSSKGNFIAV tasa de Methanococcus jannaschii DDSPEEIRAKIKKAYCPAGVVEGNPIMEIAKYFLEYPLTTKRP tipo silvestre) EKFGGDLTVNSYEELESLFKNKELHPMDLKNAVAEELIKILEP IRKRL ATGGACGAATTTGAAATGATAAAGAGAAACACATCTGAAATTA TCAGCGAGGAAG?GTTAAGAGAGGTTTTAAAAAAAGATGAAAA ATCTGCTTCTATAGGTTTTGAACCAAGTGGTAAAATACATTTA GGGCATTATCTCCAAATAAAAAAGATGATTGATTTACAAAATG CTGGATTTGATATAATTATAGCTTTGGCTGATTTACACGCCTA TTTAAACCAGAAAGGAGAGTTGGATGAGATTAGAAAAATAGG? GATTATAACAAAAAAGTTTTTGAAGCAATGGGGTTAAAGGCAA AATATGTTTATGGAAGTGAAAATTATCTTGATAAGGATTATAC ACTGAATGTCTATAGATTGGCTTTAAAAACTACCTTAAAAAGA secuencia de nucleotidos de clon GCAAGAAGGAGTATGGAACTTATAGCAAGAGAGGATGAAAATC #2 e a inoacil-tARN sintetasa CAAAGGTTGCTGAAGTTATCTATCCAAT?ATGC?GGTT?ATGG p-curl>o?i?netil-L-fcn?lulnnina T?TTC?TT?T??GGGCGTTG?TGTTGCAGTTGGAGGGATGG?G CAGAGAAAAATACACATGTTAGCAAGGGAGCTTTTACCAAAAA ?GGTTGTTTGTATTCACAACCCTGTCTT?ACGGGTTTGGATr-G AGAAGGAAAGATGAGTTCTTCAAAAGGGAATTTTATAGCTGTT GATGACTCTCCAGAAGAGATTAGGGCTAAGATAAAGAAAGCAT ACTGCCCAGCTGGAGTTGTTGAAGG???TCC??TA?TGGA ?T AGCTAAATACTTCCTTGAATATCCTTTAACCATAAAAAGGCCA GAAAAATTTGGTGGAGATTTGACAGTTAATAGCTATGAGGAGT TAGAGAGTTTATTTAAAAATAAGGAATTGCATCCA?TGG?T?T AAAAAATGCTGTAGCTGAAGAACTTATAAAGATTTTAGAGCCA ATTAGAAAGAGATTATAA MDEFEMlKRNTSr.IISEEELREVLKKDEKSASI FEPSGKIHL, ecuencia de aminoácidos de clon GHYLQIKKMIDLUNAGFDIIIALADLHAYLNQKGELDEIRKIG #3 de aminoacil-tARN sintetasa DYNKKVFEAMGLKAKYVYGSERQLDKDYTLNVYRLALKTTLKR p-carbo in?etiI-L-lcnilalani??a ARRSMELIAREDENPKVAEVIYPIMQVNGIHYKGVDVAVGGME (derivada de tirosil t RN sintetasa de Methanococcui jannaschii QRKIHMLARELLPKKVVCIHNPVLTGLDGEGKMSSSKGNFIAV tipo sihestre) DDSPEEIRAKIKKAYCPAG VEGNPIMEIAKYFLEYPLTtKRP EKFGGDLTVNSYEELESLFKNKELHPMDLKNAVAEELIKILEP IRKRL ATGGACGAATTTGAAATGATAAAGAGAAACACATCTGAAATTA TCAGCGAGGAAGAGTTAAGAGAGGTTTTAAAAAAAGATGAAAA ATCTGCTTCGATAGGTTTTGAACCAAGTGGTAAAATACATTTA GGGCATTATCTCCAAATAAAAAAGATGATTGATTTACAAAATG CTGGATTTGATATAATTATAGCGTTGGCTGATTTACACGCCTA TTTAAACCAGA?AGGAGAGTTCGATGAGATTAGAAAA?TAGG? GATTATAACAAAAAAGTTTTTGAAGCAATGGGGTTAAAGGCAA secuencia de nuclcótidns de clon AATATGTTTATGGAAGTGAACGTCAGCTTGATAAGGATTATAC # «le ap?¡??o»cil-tARN .sintetasa ACTGAATGTCTATAGATTGGCTTTAAAAACTACCTTAAAAAGA p-cnrboximctil-L-fenilalanina GCAAGAAGGAGTATGGAACTTATAGCAAGAGAGGATGAAAATC CAAAGGTTGCTGAAGTTATCTATCCAATAATGCAGGTTAATGG TATTCATTATAAGGGCGTTGATGTTGCAGTTGGAGGGATGGAG CAGAGAAAAATACACATGTTAGCAAGGGAGCTTTTACCAAAAA AGGTTGTTTGTATTCACAACCCTGTCTTAACGGGTTTGGATGG AGAAGGAAAGATGAGTTCTTCAAAAGGGAATTTTAT?GCTGTT GATGACTCTCCAGAAGAGATTAGGGCTAAGATAAAGAAAGCAT ACTGCCCAGCTGGAGTTGTTGAAGGAAATCCAATAATGGAGAT AGCTAAATACTTCCTTGAATATCCTTTAACCATAAAAAGGCCA GAAAAATTTGGTGGAGATTTGACAGTTAATAGCTATGAGGAGT TAGAGAGTTTATTTAAAAATAAGGAATTGCATCCAATGGATTT AAAAAATGCTGTAGCTGAAGAACTTATAAAGATTTTAGAGCCA ATTAGAAAGAGATTATAA MDEFEMIKRNTSEIISEEELREVLKKDEKSASIGFEPSGKIHL secuencia de aminoácidos de clon GHYLQIKKMIDLQNAGFDIIIALADLHAYLNQKGELDEIRKIG #4 de aminoacil-tARN sintelasa DYNKKVFEAMGLKAKYVYGSEAQLDKDYTLNVYRLALKTTLKR p-carboxunetil-L-fcnilalanina (derivada de tirosil tARN-sinte- ARR?MELIAREDENPKVAEVIYPIMQVNGIHYKGVDVAVGGME tasa de Methanococcus jannaschii QRKIHMLARELLPKKVVCGHNPVLTGLDGEGKMSSSKGNFIAV tipo silvestre) DDSPEEIRAKIKKAYCPAGVVEGNPIMEIAKYFLEYPLTIKRP EKFGGDLTVNSYEELESLFKNKELHPMDLKNAVAEELIKILEP TRKRL ATGGACGAATTTGAAATGATAAAGAGAAACACATCTGAAATTA TCAGCGAGGAAGAGTTAAGAGAGGTTTTAAAAAAAGATGAAAA ATCTGCTTCGATAGGTTTTGAACCAAGTGGTAAAATACATTTA GGGCATTATCTCCAAATAAAAAAGATGATTGATTTACAAAATG CTGGATTTGATATAATTATAGCGTTGGCTGATTTACACGCCTA TTTAAACCAGAAAGGAGAGTTGGATGAGATTAGAAA?ATAGGA GATTATAACAAAAAAGTTTTTGAAGCAATGGGGTTAAAGGCAA AATATGTTTATGGAAGTGAAGCGCAGCTTGATAAGGATTAT?C ACTGAATGTCTATAGATTGGCTTTAAAAACTACCT?AAAAAGA GCAAGAAGGAGTATGGAACTTATAGCAAGAGAGGATGAAAATC secuencia de micleótidos de clon CAAAGGTTGCTG?AGTTATCTATCCAATAATGCAGGTTAATGC # de ainiíi?acLl-tARN iutetasa TATTCATTATAAGGGCGTTGATGTTGCAGTTGGAGG3ATGGAG p-carboximetil-L- fenilalanina C?GAGAA?AATACAC?TGTTAGCA?GGGAGCTTTTACC???AA AGGTTGTTTGTATTCACAACCCTGTCTTAACGGGTTTCGATGG AGAAGGAAAGATGAGTTCTTCAAAAGGGAATTTTATAGCTGTT GATGACTCTCCAGAAGAGATTAGGGCTAAGATAAAGAAAGCAT ?CTGCCCAGCTGGAGTTGTTGAAGG?A?TCCAATAATGG?G?T ACCTAAATACTTCCTTGAATATCCTTTAACCATAAAAAGGCCA GAAAAATTTGGTGGAGATTTGACAGTTAATAGCTATGAGGAGT TAGAGAGTTTATTTAAAAAT?AGGAATTGCATCCAATGGATTT AAAAAATGCTGTAGCTGAAGAACTTATAAAGATTTTAGAGCCA ATT?GAAAGAGATTATAA MDEFEMIKRNTSEIISEEELREVLKKDEKSASIGFEPSGKIHL secuencia de aminoácidos de clon GHYLQIKKMIDLQNAGFDIIIALADLHAYLNQKGELDEIRKIG #5 de aminoacil-tARN sin rerasa DYNKKVFEAMGLKAKYVYGSEKHLDKDYTLNVYRLALKTTLKR p-carboximetil- L-fcnilalaninu ARRSMELIAREDENPKVAEVIYPIMQVNGIHYKGVDVAVGGME (derivada de lirosil tARN sinteQRKIHMLARELLPKKVVCIHNPVLTGLDGEGKMSSSKGNFIAV íasa ile Mahanococcw; jannaichii tipo silvestre) DDSPEEIRAKIKK?YCPAGVVEGNPIME1AKYFLEYPLTIKRP EKFGGDLTVNSYEELESLFKNKELHPMDLKNAVAEELIKILEP IRKRL ATGGACGAATTTGAAATGATAAAGAGAAACACATCTGAAATTA TCAGCGAGGAAGAGTTAAGAGAGGTTTTAAAAAAAGATGAAAA ATCTGCTTCTATAGGTTTTGAACCAAGTGGTAAAATACATTTA GGGCATTATCTCCAAATAAAAAAGATGATTGATTTACAAAATG CTGGATTTGATATAATTATAGCGTTGGCTGATTTACACGCCTA TTTAAACCAGAAAGGAGAGTTGGATGAGATTAGAAAAATAGGA secuencia de nucleótidos de clon GATTATAACAAAAAAGTTTTTGAAGCAATGGGGTTAAAGGCAA tfS de aminoacil-tARN sintetasn AATATGTTTATGGAAGTGAAAAGCATCTTGATAAGGATTATAC p-carboximetil- -fenilalanina ACTGAATGTCTATAGATTGGCTTTAAAAACTACCTTAAAAAGA GCAAGAAGGAGTATGGAACTTATAGCAAGAGAGGATGAAAATC CAAAGGTTGCTGAAGTTATCTATCCAATAATGCAGGTTAATGG TATTCATTATAAGGGCGTTGATGTTGCAGTTGGAGGGATGGAG CAGAGAAAAATACACATGTTAGCAAGGGAGCTTTTACCAAAAA AGGTTGTTTGTATTCACAACCCTGTCTTAACGGGTTTGGATGG AGAAGGAAAGATGAGTTCTTCAAAAGGGAATTTTATAGCTGTT GATGACTCTCCAGAAGAGATTAGGGCT?AGATA??GAAAGCAT ACTGCCCAGCTGGAGTTGTTGAAGGAAATCCAATAATGGAG?l' AGCTAAATACTTCCTTGAATATCCTTTAACCATAAAAAGGCe.-' GAAAAATTTGGTGGAGATTTGACAGTTAATAGCTATGAGG?C-'l TAGAGAGTTTATTTAAAAATAAGGAATTGCATCCAATGGA I": ' AAAAAATGCTGTAGCTGAAGAACTTATAAAGATTTTAGAGC^- ATTAGAAAGAGATTATAA MDEFEMIKRNTSEIISEEELREVLKKDEKSAAIGFEPSG . secuencia de aminoácidos de clon GHYLQIKKMIDLQNAGFDIIIGLADLHAYLNQKGELDSi: #1 de aminoacil-tARN sintetasa DYNKKVFEAMGLKAK YGSEEPLDKDYTLNVYRLALKT " . bifcnilalanina (derivada de RRSMELIAREDE PKVAEVIYPIMQVNCIHYHGVDVAVr tirosil tARN-sintetasa de Methanococcus jannaschii QRKIHMLARELLPKKVVCIHNPVLTGLDGEGKMSSSKGH . tipo silvestre) DDSPEEIRAKIKKAYCP?GVVEGNPIMEIAKYFLEYPLT- EKFGGDLTVNSYEELESLFKNKELHPMDLKNAVAEELI IRKRL ATGGACGAATTTGAAATGATAAAGAGAAACACATCTGA' TCAGCGAGGAAGAGTTAAGAGAGGTTTTAAAAAAAGAIf-, ATCTGCTGCTATAGGTTTTGAACCAAGTGGTAAAATAC?'; GGGCATTATCTCCAAATAAAAAAGATGATTGATTTACAA. CTGGATTTGATATAATTATAGGGTTGGCTGATTTACACG TTTAAACCAGAAAGGAGAGTTGGATGAGATTAGAAAAAT GATTAtAACAAAAAAGTTTTTGAAGCAATGGGGTTAA?. AATATGTTTATGGAAGTGAAGAGCCGCTTGATAAGGATT ?CTGAATGTCTATAGATTGGCTTTAAAAACTACCTT?.." secuencia de nucleótidos de clon GCAAGAAGGAGTATGGAACTTATAGCAAGAGAGGATGA/> #1 de aminoatil-tARN sintetasa CAAAGGTTGCTGAAGTTATCTATCC?ATA?TGCAGGT'' " " bifenilalanina TATTCATTATCATGGCGTTGATGTTGCAGTTGGAGGG.?. CAGAGAAAAATACACATGTTAGCAAGGGAGCTTTTACC?, AGGTTGTTTGTATTCACAACCCTGTCTTAACGGGTTTr ' AGAAGGAAAGATGAGTTCTTCAAAAGGGAATTTTATAtj GATGACTCTCCAGAAGAGATTAGGGCTAAGATAAAGAA7- ACTGCCCAGCTGGAGTTGTTGAAGGA/?TCCAAT.A T'' AGCTAAATACTTCCTTGAATATCCTTTAACCATAAAAA' GAAAAATTTGGTGGAGATTTG?CAGTTAATAGCTATG?r. ?AGAGñGTTTATTTAAAAATAAGGAATTGCATCCAAT• . AAAAAATGCTGTAGCTGAAGAACTTATAAAGATTTTAC ATTAGAAAGAGATTATAA MDEFEMIKRNTSEIISEEELREVLKKDEKSALIGFEPÍ^ secuencia de aminoácidos de clon GHYLQIKKMIDLQNAGFDiriTLADLSAYLNOKGELDE- #2 de ainin?acil-tARN siatetasa DYNKKVFEAMGLK?KYV?GSEFQLDKDYTLNVYRL?I,:,. bifenilalanina (derivada de ARRSMELIAREDENPKVAEVIYPIMGVNVIHYHGVDVA í; tirosil tARN-sintetasa de QRKIHMLARELLPKKVVCIHNPVLTGLDGEGKMSSSKG;-' Melhanococcus ¡annaschii DDSPEEIRAKIKKAYCPAGVVEGNPIM IAKYFLEYP . tipo silvcsti-e) EKFGGDLTVNSYEELESLFKNKELHPMDLKNAVAEELIK IRKRL ATGGACGAATTTGAAATGATAAAGAGAAACACATCTGA;. TCAGCGAGGAAGAGTTAAGAGAGGTTTTAAAAAAAGAT ATCTGCTCTGATAGGTTTTGAACCAAGTGGTAAAATAC.. GGGCATTATCTCCAAATAAAAAAGATGATTGATTTACAA, CTGGATTTGATATAATTATAACTTTGGCTGATTTATCTC- TTTAAACCAGAAAGGAGAGTTGGATGAGATTAGAAAAA-. secuencia de nucleótidos de clon #2 de amiiioacil-tARN sintetasa GATTATAACAAAAAAGTTTTTGAAGCAATGGGGTTAAAG bifenilnlanina AATATGTTTATGGAAGTGAATTCCAGCTTGATAAGGATI ACTGAATGTCTATAGATTGGCTTTAAAAACTACCTTA/»/ • GCAAGAAGGAGTATGGAACTTATAGCAAGAGAGGATGA?.. CAAAGGTTGCTGAAGTTATCTATCCAATAATGGGTGTTÍ- TATTCATTATCATGGCGTTGATGTTGCAGTTGGAGGGA: CAGAGAAAAATACACATGTTAGCAAGGGAGCTTTTACC/- AGGTTGTTTGTATTCACAACCCTGTCTTAACGGGTTTGC . AGAAGGAAAGATGAGTTCTTCAAAAGGGAATTTTATAGC- ACTGCCCAGCTGGAGTTGTTGAAGGAAATCCAATAATGGAGAT AGCTAAATACTTCCTTGAATATCCTTTAACCATAAAAAGGCCA GAAAAATTTGGTGGAGATTTGACAGTTAATAGCTATGAGGAGT TAGAGAGTTTATTTAAAAATAAGGAATTGCATCCAATGGATTT AAAAAATGCTGTAGCTGAAGAACTTATAAAGATTTTAGAGCCA ATTAGAAAGAGATTATAA MDEFE IKRNTSEIISEEELREVLKKDEKSAAIGFEPSGKIHL secuencia de aminoácidos de clon GHYLQIKKKIDLQNAGFDIIIGLADLHAYLNQKGELDE1RKIG #1 de aminoacil-tARN sintetasa DYNKKVFEAMGLKAKYVYGSEEPLDKDYTLNVYRLALKTTLKR bifcn H l n in (derivada de tirosil tARN-sintetasa de ARRSMELIAREDENPKVAEVIYPIMQVNCIHYHGVDVAVGGME Methanococcus jannaschii QRKIHMLARELLPKKVVCIHNPVLTGLDGEGKMSSSKGNFXAV tipo silvestre) DDSPEEIRAKIKKAYCPAGVVEGNPIMEIAKYFLEYPLTIKRP EKFGGDLTVNSYEELESLFKNKELHPMDLKNAVAEELIKILEP IRKRL ATGGACGAATTTGAAATGATAAAGAGAAACACATCTGAAATTA TCAGCGAGGAAGAGTTAAGAGAGGTTTTAAAAAAAGATGAAAA ATCTGCTGCTATAGGTTTTGAACCAAGTGGTAAAATACATTTA GGGCATTATCTCCAAATAAAAAAGATGATTGATTTACAAAATG CTGGATTTGATATAATTATAGGGTTGGCTGATTTACACGCCTA TTTAAACCAGAAAGGAGAGTTGGATGAGATTAGAAAAATAGGA GATTATAACAAAAAAGTTTTTGAAGCAATGGGGTTAAAGGCAA AATATGTTTATGGAAGTGAAGAGCCGCTTGATAAGGATT?TAC ACTGAATGTCTATAGATTGGCTTTAAAAACTACCTTAAAAAGA secuencia de nucleótidos de clon GCAAGAAGGAGTATGGAACTTATAGCAAGAGAGGATGAAAATC #1 de aminoacil-t?RN sintetasa CAAAGGTTGCTGAAGTTATCTATCCAATAATGCAGGTTAATTG bifenilaianina TATTCATTATCATGGCGTTGATGTTGCAGTTGGAGGGATGGAG CAGAGAAAAATACACATGTTAGCAAGGGAGCTTTTACCAAAAA AGGTTGTTTGTATTCACAACCCTGTCTTAACGGGTTTGGATGG AGAAGGAAAGATGAGTTC?TCAAAAGGGAATTTTATAGCTGTT GATGACTCTCCAGAAGAGATTAGGGCTAAGATAAAGAAAGCAT ACTGCCCAGCTGGAGTTGTTGAAGGAAATCCAATAATGGAG?T AGCTAAATACTTCCTTGAATATCCTTTAACCATAAAAAGGCCA GAAAAATTTGGTGGAGATTTGACAGTTAATAGCTATGAGGAGT TAGAGAGTTTATTTAAAAATAAGGAATTGCATCCAATGGATTT AAAAAATGCTGTAGCTGAAGAACTTATAAAGATTTTAGAGCCA ATTAGAAAGAGATTATAA MDEFEMIKRNTSEIISEEELREVLKKDEKSALIGFEPSGKIHL secuencia de aminoácidos de clon GH LQIKKMIDLQNAGFDIIITLADLSAYLNQKGELDEIRKIG #2 de ainiíioacil-tARN sintctasa DYNKKVFEAMGLKAKYVYGSEFQLDKDYTLNVYRLALKTTLKR bifenilalanina (derivada de ARRSMELIAREDENPKVAEVIYPIMGVNVIHYHGVDVAVGGME tirosil tARN-sintetasa de QRKIHMLARELLPKKVVCIHNPVLTGLDGEGKMSSSKGNFIAV Methanococcus jannaschii DDSPEEIRAKIKKAYCPAGVVEGNPIMEIAKYFLEYPLTIKRP tipo silvestre) EKFGGDLTVNSYEELESLFKNKELHPMDLKNAVAEELIKILEP IRKRL ATGGACGAATTTGAAATGATAAAGAGAAACACATCTGAAATTA TCAGCGAGGAAGAGTTAAGAGAGGTTTTAAAAAAAGATGAAAA ATCTGCTCTGATAGGTTTTGAACCAAGTGGTAAAATACATTTA GGGCATTATCTCCAAATAAAAAAGATGATTGATTTACAAAATG CTGGATTTGATATAATTATAACTTTGGCTGATTTATCTGCCTA TTTAAACCAGAAAGGAGAGTTGGATGAGATTAGAAAAATAGGA secuencia de nucleótidos de clon #2 de amiii?acil-tARN sintetasa GATTATAACAAAAAAGTTTTTGAAGCAATGGGGTTAAAGGCAA bifcnilnlanina AATATGTTTATGGAAGTGAATTCCAGCTTGATAAGGATTATAC ACTGAATGTCTATAGATTGGCTTTAAAAACTACCTTAAAAAGA GCAAGAAGGAGTATGGAACTTATAGCAAGAGAGGATGAAAATC CAAAGGTTGCTGAAGTTATCTATCCAATAATGGGTGTTAATGT TATTCATTATCATGGCGTTGATGTTGCAGTTGGAGGGATGGAG CAGAGAAAAATACACATGTTAGCAAGGGAGCTTTTACCAAAAA AGGTTGTTTGTATTCACAACCCTGTCTTAACGGGTTTGGATGG AGAAGGAAAGATGAGTTCTTCAAAAGGGAATTTTATAGCTGTT AGAAGGAAAGATGAGTTCTTCAAAAGGGAATTTTATAGCTGTT GATGACTCTCCAGAAGAGATTAGGGCTAAGATAAAGAAAGCAT ACTGCCCAGCTGGAGTTGTTGAAGGAAATCCAATAATGGAGAT AGCTAAATACTTCCTTGAATATCCTTTAACCATAAAAAGGCCA GAAAAATTTGGTGGAGATTTGACAGTTAATAGCTATGAGGAGT TAGAGAGTTTATTTAAAAATAAGGAATTGCATCCAATGGATTT AAAAAATGCTGTAGCTGAAGAACTTATAAAGATTTTAGAGCCA ATTAGAAAGAGATTATAA MDEFEMIKRNTSEIISEEELREVLKKDEKSAGIGFEPSGKIHL secuencia de aminoácidos de clon GHYLQIKKMIDLQNAGFDIIIVLADLHAYLNQKGELDEIRKIG #5 de aminoacil-tARN sintetasa DYNKKVFEAMGLKAKYVYGSEADLDKDYTLNVYRLALKTTLKR bifenilalanina (derivada de ARRSMELIAREDENPKVAEVIYPIMQVNSIHYRGVDVAVGGME tirosil tARN-sintelasa de CRKIHMLARELLPKK'VCIHMPVLTGLDGEGKMSSSKC.MFIAV Methanococcus jannaschii DDSPEEIRAKIKKAYCPAGVVEGNPIMEIAKYFLEYPLTIKRP tipo silvestre) EKFGGDLTVNSYEELESLFKNKELHPMDLK AVAEEL1KILEP IRKRL ATGG?CGAATTTGAAATGATAAAGAGAAACACATCTGA?ATTA TCAGCGAGGAAGAGTTAAGAGAGGTTTTAAAAAAAGATGAAAA ATCTGCTGGGATAGGTTTTGAACCAAGTGGTAAAATACATTTA GGGCATTATCTCCAAATAAAAAAGATGATTGATTTACAAAATG CTGGATTTGATATAATTATAGTTTTGGCTGATTTACACGCCTA TTTAAACCAGAAAGGAGAGTTGGATGAGATTAGAAAAATAGGA GATTATAACAAAAAAGTTTTTGAAGCAATGGGGTTAAAGGCAA AATATGTTTATGGAAGTGAAGCGGATCTTGATAAGGATTATAC ACTGA?TGTCTATAGATTGGCTTTAAAAACTACCTTAAAAAGA GCAAGAAGGAGTATGGAACTTATAGCAAGAGAGGATGAAAATC secuencia de nuclcótidos de clon #5 de apiinoacil-tARN siutetasa CAAAGG?TGCTGAAGTTATCTATCCAATAATGCAGGTTAATTC blfenilalanina GATTCATT?TCGTGGCGTTGATGTTGCAGTTGGAGGGATGGAG CAGAGAAAAATACACATGTTAGCAAGGGAGCTTTTACCAAAAA AGGTTG?TTGTATTCACAACCCTGTCTTAACGGGTTTGGATGG AGAAGGAAAGATGAGTTCTTCAAAAGGGAATTTTATAGCTGTT GATGACTCTCCAGAAGAGATTAGGGCTAAGATAAAGAAAGCAT ACTGCCCAGCTGGAGTTGTTGA?GGAAATCCAATAATGGAGAT AGCTAAATACTTCCTTGAATATCCTTTAACCATAAAAAGGCCA GA AATTTGGTGGAGATTTGAC?GTTA?TAGCT?TGAGGAGT TAGAGAGTTTATTTA?A??TAAGG?ATTGCATCCA?TGGATTt AAAAAATGCTGTAGCTGAAGAACTTATAAAGATTTTAGAGCCA ATTAGAAAGAGATTATAA MDEFEMIKRNTSEIISEEELREVLKKDEKSAHIGFEPSGK 1L secuencia de aminoácidos de clon GHYLQIKKMIDLQNAGFDIIIVLADLHAYLNQKGELDE1RKIG #6 de nmiiioacM-t?RN sintetasa DYNKKVFEAMGLKAKYVYG3ERPLDKDYTLNVYRLALKTTLKR bifenilalanina (derivada de ARRSMELIAREDENPKVAEVIYPIMQVNGIHYLGVDVAVGGME tirosil tARN-sintetasa de Methanococcus jannaschii QRKIHMLARELLPKKVVCIHNPVLTGLDGEGKMSSSKGNFIAV tipo silvestre) DDSPEEIRAKIKKAYCPAGVVEGNPIMEIAKYFLEYPLTTKRP EKFGGDLTVNSYEELESLFKNKELHPMDLKNAVAEELIKILEP IRKRL ATGGACGAATTTGAAATGATAAAGAGAAACACATCTGAAATTA TCAGCGAGGAAGAGTTAAGAGAGGTTTTAAAAAAAGATGAAAA ATCTGCTCATATAGGTTTTGAACCAAGTGGTAAAATACATT A GGGCATTATCTCCAAATAAAAAAGATGATTGATTTACAAAATG CTGGATTTGATATAATTATAGTTTTGGCTGATTTACACGCCTA secuencia de nucleótidos de clon TTTAAACCAGAAAGGAGAGTTGGATGAGATTAGAAAAATAGGA #6 je aminoacil-tARN .sintetasa GATTATAACAAAAAAGTTTTTGAAGCAATGGGGTTAAAGGCAA bifenilalanina AATATGTTTATGGAAGTGAAAGGCCTCTTGATAAGGATTATAC ACTGAATGTCTATAGATTGGCTTTAAAAACTACCTTAAAAAGA GCAAGAAGGAGTATGGAACTTATAGCAAGAGAGGATGAAAATC CAAAGGTTGCTGAAGTTATCTATCCAATAATGCAGGTT?ATGG TATTCATTATCTGGGCGTTGATGTTGCAGTTGGAGGGATGGAG CAGAGAAAAATACACATGTTAGCAAGGGAGCTTTTACCAAAAA AGGTTGTTTGTATTCACAACCCTGTCTTAACGGGTTTGGATGG AGAAGGAAAGATGAGTTCTTCAAAAGGGAATTTTATAGCTGTT GATGACTCTCCAGAAGAGATTAGGGCTAAGATAAAGAAAGCAT ACTGCCCAGCTGGAGTTGTTGAAGGAAATCCAATAATGGAGAT AGCTAAATACTTCCTTGAATATCCTTTAACCATAAAAAGGCCA GAAAAATTTGGTGGAGATTTGACAGTTAATAGCTATGAGGAGT TAGAGAGTTTATTTAAAAATAAGGAATTGCATCCAATGGATTT AAAAAATGCTGTAGCTGAAGAACTTATAAAGATTTTAGAGCCA ATTAGAAAGAGATTATAA MDEFEMIKRNTSEIISEE?LREVLKKDEKSAHIGFEPSGKIHL secuencia de aminoácidos de clon GHYLQ1KKMIDLQNAGFDIIIHLADLHAYLNQKGELDEIRKIG #7 de aminoacil-tARN sintetasa DYNKKVFEAMGLKAKYVYGSEWMLDKDYTLNVYRLALKTTLKR bil'enilalaniua (derivada de ARRSMELIAREDENPKVAEVIYPIMQVNGIHYKGVDVAVGGME rirosil tARN-sintetasa de QRKIHMLARELLPKKVVCIHNPVLTGLDGEGKMSSSKGNFIAV Melhanococcus jannaschii tipo silvestre) DDSPEEIRAKIKKAYCPAGVVEGNPIMEIAKYFLEYPLTIKRP EKFGGDLTVNSYEELESLFKNKELHPMDLK AVAEELIKILEP IRKRL ATGGACGAATTTGAAATGATAAAGAGAAACACATCTGA/iATTA TCAGCGAGGAAGAGTTAAGAGAGGTTTTAAAAAAAGATGAAAA ATCTGCTCATATAGGTTTTGAACCAAGTGGTAAAATACATTT? GGGCATTATCTCCAAATAAAAAAGATGATTGATTTACAAAATG CTGGATTTGATATAATTATACATTTGGCTGATTTACACGCCTA TTTAAACCAGAAAGGAGAGTTGGATGAGATTAGAAAAATAGGA GATTATAACAAAAAAGTTTTTGAAGCAATGGGGTTAAAGGCAA AATATGTTTATGGAAGTGAATGGATGCTTGATAAGGATTATAC ACTGA?TGTCTATAGATTGGCTTTAAAAACTACCTTAA??AGA GCAAGAAGGAGTATGGAACTTATAGCAAGAGAGGATGAAAATC secuencia de n?cleótidos de clon CAAAGGTTGCTGAAGTTATCTATCCAATAATGCAGGTTAATGG #7 de aminoacil-tARN sintetasa GATTCATTATAAGGGCGTTGATGTTGCAGTTGGAGGGATGGAG bifenilaianina CAGAGAAAAATACACATGTTAGCAAGGGAGCTTTTACC?AAAA AGGTTGTTTGTATTCACAACCCTGTCTTAACGGGTTTGGATGG AGAAGGAAAGATGAGTTCTTCAAAAGGGAATTTTATAGCTGTT GATGACTCTCCAGAAGAGATTAGGGCTAAGATAAAGAAAGCAT ACTGCCCAGCTGGAGTTGTTGAAGGAAATCCAATAATGGAG?T AGCTAAATACTTCCTTGAATATCCTTTAACCATAAAAAGGCCA GAAAAATTTGGTGGAGATTTGACAGTTAATAGCTATGAGGAGT TAGAGAGTTTATTTAAAAATAAGGAATTGCATCCAATGGATTT AAAAAATGCTGTAGCTGAAGAACTTATAAAGATTTTAGAGCCA ATTAGAAAGAGATTATAA MDEFEMIKRNTSEIISEEELREVLKKDEKSAEIGFEPSGKIHL secuencia de aminoácidos de clon #1 de aminoacil-tARN sintetasa GHYLQIKKMIDLQNAGFDIIIHLADLHAYLNQKGELDEIRKIG bipiridilalanina (derivada de DYNKKVFEAMGLKAKYVYGSEWMLDKDYTLNVYRLALKTTLKR tirosil tARN-sintetasa de ARRSMELIAREDENPKVAEVIYPIMQVNGHHYHGVDVAVGGME A fe thanococc us jannaschii QRKIHMLARELLPKKVVCIHMPVLTGLDGEGKMSSSKGNFIAV tipo silvestre) DDSPEEIRAKIKKAYCPAGVVEGNPIMEIAKYFLEYPLTIKRP EKFGGDLTVNSYEELESLFKNKELHPMDLKNAVAEELIKILEP IRKRL ATGGACGAATTTGAAATGATAAAGAGAAACACATCTGAAATTA TCAGCGAGGAAGAGTTAAGAGAGGTTTTAAAAAAAGATGAAAA ATCTGCTGAGATAGGTTTTGAACCAAGTGGTAAAATACATTTA GGGCATTATCTCCAAATAAAAAAGATGATTGATTTACAAAATG secuencia de nucleótidos de clon CTGGATTTGATATAATTATACATTTGGCTGATTTACACGCCTA #1 de aminoacil-tARN sintetnsa TTTAAACCAGAAAGGAGAGTTGGATGAGATTAGAAAAATAGGA bipiridilalanina GATTATAACAAAAAAGTTTTTGAAGCAATGGGGTTAAAGGCAA AATATGTTTATGGAAGTGAATGGATGCTTGATAAGGATTATAC ACTGAATGTCTATAGATTGGCTTTAAAAACTACCTTAAAAAGA GCAAGAAGGAGTATGGAACTTATAGCAAGAGAGGATGAAAATC CAAAGGTTGCTGAAGTTATCTATCCAATAATGCAGGTTAATGG TCATCATTATCATGGCGTTGATGTTGCAGTTGGAGGGATGGAG CAGAGAAAAATACACATGTTAGCAAGGGAGCTTTTACCAAAAA AGGTTGTTTGTATTCACAACCCTGTCTTAACGGGTTTGGATGG AGAAGGAAAGATGAGTTCTTCAAAAGGGAATTTTATAGCTGTT GATGACTCTCCAGAAGAGATTAGGGCTAAGATAAAGAAAGCAT ACTGCCC?GCTGGAGTTGTTGAAGGAAATCCAATAATGGAGAT AGCTAAATACTTCCTTGAATATCCTTTAACCATAAAAAGGCCA GAAAAATTTGGTGGAGATTTGACAGTTAATAGCTATGAGGAGT TAGAGAGTTTATTTAAAAATAAGGAATTGCATCC TGGATTT AAAAAATGCTGTAGCTGAAGAACTTATAAAGATTTTAGAGCCA ATTAGAAAGAGATTATAA MDEFEMIKRNTSEIISEEELREVLKKDEKSAGIGFEPSGKTHL secuencia de aminoácidos de clon GHYLQIKKMIDLQNAGFDIIIYLADLAñYLNQKGELDEIRKIG #2 de aminoaril-tARN sintetasa DY KKVFEAMGLKAKYVYGSEFQLDKDYTLNVYRLALKTTLKR bipiridilnlamna (derivada de ARRSMELIAREDENPKVA?VIYPIMEVNG HYSGVDVAVGGME tirosil tARN-sintetasa de QRKIHMLARELLPKKVVCIHNPVLTGLDGEGKMSSSKGNFI?V Methanococcus jannaschii DDSPEEIRAKIKKAYCPAG VEGNPI EIAKYFLEYPLTIKRP tipo silvestre) EKFGGDLTVNSYEELESLFKNKELHPMD KNAVAEELIKILEP IRKRL ATGGACGAATTTGAAATGATAAAGAGAAACACATCTGAAATTA TCAGCGAGG?AGAGTTAAGAGAGGTTTTAAAAAAAGA?GAAAA ATCTGCTGGTATAGGTTTTGAACCAAGTGGTAAAATACATTTA GGGCATTATCTCCAAATAAAAAAGATGATTGATTTACAAAATG CTGGATTTGATATAATTATATATTTGGCTGATTTAGCTGCCTA TTTAAACCAGAAAGGAGAGTTGGATGAGATTAGAAAAATAGG? GA?TATAAC??????GTTTTTGA.AGC??TGGGGTTAAAGGCAA AATATGTTTATGGAAGTGAATTCCAGCTTGATAAGGATTATAC AC?GAATGTCTATAGATTGGCTTTAAAAACTACCTTAAAAAGA GCAAGAAGGAGTATGGAACTTATAGCAAGAGAGGATGAAAATC secuencia tie nucle?tidos de clon CAAAGGTTGCTGAAGTTATCTATCCAATAATGGAGGTTAATGG # ile «minnacil-tARN sintetasa bipiridilalanina TTGGCATTATAGTGGCGTTGATGTTGCAGTTGGAGGGATGGAG CAGAGAAAAATACACATGTTAGCAAGGGAGCTTTTACCAAAAA AGGTTGTTTGTATTCACAACCCTGTCTTAACGGGTTTGGATGG AGAAGGAAAGATGAGTTCTTCAAAAGGGAATTTTATAGCTGTT GATGACTCTCCAGA?G?GATTAGGGCTAAGAT?AAGAAAGCA? ACTGCCCAGCTGGAGTTGTTGAAGGAAATCCAATAATGGAGAT AGCTAAATACTTCCTTGAATATCCTTTAACCATAAAAAGGCCA GAAAAATTTGGTGGAGATTTGACAGTTAATAGCTATGAGGAGT TAGAGAGTTTATTTAAAAATAAGGAATTGCATCCAATGGATTT AAAAAATGCTGTAGCTGAAGAACTTATAAAGATTTT?G?GCCA ATTAGAAAGAGATTATAA MEEQYRPEEIESKVQLHWDEKRTFEVTEDESKEKYYCLSANPY PSGRLHMGHVRNYTIGDVIARYQRMLGKNVLQPIGWDAFGLPA EGAAVK NTAPAPWTYDNIAYMKNQLKMLGFGYDWSRELATCT PEYYRWEQKFFTELYKKGLVYKKTSAVNWCPNDQTVLANEQVI DGCC RCDTKVERKEIPQ FIKITAYADELLNDLDKLDHWPDT VKTMQRNWIGRSEGVEITF VNDYDNTLTVYTTRPDTF GCTY LAVAAGHPLAQKAAENNPELAAFIDECRNTKVAEAEMATMEKK secuencia de aminoácidos de clon GVDTGFKAVHPLTGEEIPVWAANFVLMEYGTGAVMAVPGHDQR B8 de aminoacil-tARN sintetasa DYEFASKYGLNIKPVILAADGSEPDLSQQALTEKGVLFNSGEF 1,5-dansilalanina (derivada de NGLDHEAAFNAIADKLTAMGVGERKVNYRLRDWGVSRQRYWGA leucil-tARN .sintetasa de E. coli PIPMVTLEDGTVMPTPDDQLPVILPEDVVMDGITSPIKADPE tipo silvestre) AKTTVNGMPALRETDTFDTFMESCWIYARYTCPQYKEGMLDSE AANYWLPVDIGIGGIEHAIMTLLYFRFFHKLMRDAGMVNSDEP AKQLLCQGMVLADAFYYVGENGERNWVSPVDAIVERDEKGRIV KAKDAAGHELVYTGMSKMSKSKNNGIDPQVMVERYGADTVRLF MMFASPADMTLE QESGVEGANRFLKRVWKLVYEHTAKGDVAA LNVDALTENQKALRRDVHKTIAKVTDDIGRRQTFNTAIAAIM? LMNKLAKAPTDGEQDRALN1QEALLAVVRMLNPFTPHICFTL Q ELKGEGDIDNAPWPVADEKAMVEDSTLVVVQVNGKVRAKITVP VDATEEQVRERAGQEHLVAKYLDGVTVRKVIYVPGKLLNLVVG ATGGAAGAGCAATACCGCCCGGAAGAGATAG?ATCCAAAGTAC AGCTTCATTGGGATGAGAAGCGCACATTTGAAGTAACCGAAGA CGAGAGCAAAGAGAAGTATTACTGCCTGTCTGCTAATCCCTAT CCTTCTGGTCGACTACACATGGGCCACGTACGTAACTACACCA TCGGTGACGTGATCGCCCGCTACCAGCGTATGCTGGGCAAAAA CGTCCTGCAGCCGATCGGCTGGGACGCGTTTGGTCTGCCTGCG GAAGGCGCGGCGGTGAAAAACAACACCGCTCCGGCACCGTGGA CGTACGACAACATCGCGTATATGAAAAACCAGCTCAAAATGCT GGGCTTTGGTTATGACTGGAGCCGCGAGCTGGCAACCTGTACG CCGGAATACTACCGTTGGGAACAGAAATTCTTCACCGAGCTGT ATAAAAAAGGCCTGGTATATAAGAAGACTTCTGCGGTCAACTG GTGTCCGAACGACCAGACCGTACTGGCGAACGAACAAGTT?TC GACGGCTGCTGCTGGCGCTGCGATACCAAAGTTGAACGTAAAG AGATCCCGCAGTGGTTTATCAAAATCACTGCTTACGCTGACGA GCTGCTCAACG?TCTGGATAAACTGGATCACTGGCCAGAC?CC GTTAAAACCATGCAGCGTAACTGGATCGGTCGTTCCGAAGGCG TGGAGATCACCTTCAACGTTAACGACTATGACAACACGCTGAC CGTTTACACTACCCGCCCGGACACCTTTATGGGTTGTACCT/C secuencia de nuclc?tidos de clon CTGGCGGTAGCTGCGGGTCATCCGCTGGCGCAGAA.AGCGGCGG tie aminoacil-?ARN .siutclasa AAAATAATCCTGAACTGGCGGCCTTTATTGACGAA.TGCCGTA/i 1,5-dansilalanina CACCAAAGTTGCCGAAGCTGAAATGGCGACGATGGAGAAAAAA GGCGTCGATACTGGCTTTAAAGCGGTTCACCCATTAACGGGCG AAGAAATTCCCGTTTGGGCAGCAAACTTCGTATTGATGGAGTA CGGCACGGGCGCAGTTATGGCGGTACCGGGGCACGACCAGCGC GACTACGAGTTTGCCTCTAAATACGGCCTGAACATCAAACCGG TTATCCTGGCAGCTGACGGCTCTGAGCCAGATCTTTCTCAGCA AGCCCTGACTGAAAAAGGCGTGCTGTTCAACTCTGGCGAGTTC AACGGTCTTGACCATGAAGCGGCCTTCAACGCCATCGCCGATA AACTGACTGCGATGGGCGTTGGCGAGCGTAAAGTGAACTACCG CCTGCGCGACTGGGGTGTTTCCCGTCAGCGTTACTGGGGCGCG CCGATTCCGATGGTGACTCTAGAAGACGGTACCGTAATGCCGA CCCCGGACGACCAGCTGCCGGTGATCCTGCCGGAAGATGTGGT AATGGACGGCATTACCAGCCCGATTAAAGCAGATCCGGAGTGG GCGAAAACTACCGTTAACGGTATGCCAGCACTGCGTGAAACCG ACACTTTCGACACCTTTATGGAGTCCTGCTGGATTTATGCGCG CTACACTTGCCCGCAGTACAAAGAAGGTATGCTGGATTCCGAA GCGGCTAACTACTGGCTGCCGGTGGATATCGGTATTGGTGGTA TTGAACACGCCATTATGACGCTGCTCTACTTCCGCTTCTTCCA CAAACTGATGCGTGATGCAGGCATGGTGAACTCTGACGAACCA GCGAAACAGTTGCTGTGTCAGGGTATGGTGCTGGCAGATGCCT TCTACTATGTTGGCGAAAACGGCGAACGTAACTGGGTTTCCCC GGTTGATGCTATCGTTGAACGTGACGAGAAAGGCCGTATCGTG AAAGCGAAAGATGCGGCAGGCCATGAACTGGTTTATACCGGCA TGAGCAAAATGTCCAAGTCGAAGAACAACGGTATCGACCCGCA GGTGATGGTTGAACGTTACGGCGCGGACACCGTTCGTCTGTTT ATGATGTTTGCTTCTCCGGCTGATATGACTCTCGAATGGCAGG AATCCGGTGTGGAAGGGGCTAACCGCTTCCTGAAACGTGTCTG GAAACTGGTTTACGAGCACACAGCAAAAGGTGATGTTGCGGCA CTGAACGTTGATGCGCTGACTGAAAATCAGAAAGCGCTGCGTC GCGATGTGCATAAAACGATCGCTAAAGTGACCGATGATATCGC CCGTCGTCAGACCTTCAACACCGCAATTGCGGCGATTATGGAG CTGATGAACAAACTGGCGAAAGCACCAACCGATGGCGAGCAGG ATCGCGCTCTGATGCAGGAAGCACTGCTGGCCGTTGTCCGT?T GCTTAACCCGTTCACCCCGCACATCTGCTTCACGCTGTGGCAG GAACTGAAAGGCGAAGGCGATATCGACAACGCGCCGTGGCCGG TTGCTGACGAAAAAGCGATGGTGGAAGACTCCACGCTGGTCGT GGTGCAGGTTAACGGTAAAGTCCGTGCCAAAATCACCGTTCCG GTGGACGCAACGGAAGAACAGGTTCGCGAACGTGCTGGCCAGG AACATCTGGTAGCAAAATATCTTGATGGCGTTACTGTACGTA? AGTGATTTACGTACCAGGTAAACTCCTCAATCTGGTCGTTGGC TAA MEEQYRPEEIESKVQLH DEKRTFEVTEDESKEKYYCLSANP? PSGRLHMGHVRNYTIGDVIARYQRMLGKNVLQPIG DAFGLPA EGAAVKKWAPAPWTYDNIAYMKNQLKMLGFGYDV7SRELATCT PEYYRWEQKFFTELYKKGLVYKKTSAVNWCPNDQTVLANEQVI DGCCWRCDTKVERKEIPQWFIKITAYADELLNDLDKLDHWPDT VKTMQRNWIGRSEGVEITFNVNDYDNTLTVYTTRPDAFMGCTY LAVAAGHPLAQKAAENNPELAAFIDECRNTKVAEAEMATMEKK GVDTGFKAVHPLTGEEIPV AANFVLH?YGTGAVMAVPGHDQR secuencia de aminoácidos T252A de aminoacil-IARN siutctasa DYEFASKYGLNIKPVILAADGSEPDLSQQALTE GVLFNSGEF 1,5-dunsils?luipnu (derivada de NGLDHEAAFNAIADKLTAMGVGERKVNYRLRDWGVSRQRY GA leucil-tARN síntetasa de E. coli PIPMVTLEDGTVMPTPDDQLPVILPEDVVMDGITSPIKADPEW tipo silvestre) AKTTVNGMPALRETD?FDTFMESCHIYARYTCPOY EGM DSE AANYWLPVDIGIGGIEHAIMTLLYFRFFHKLMRDAGMVNSDEP AKQLLCQGMVLADAFYYVGENGERNWVSPVDAIVERDEKGRIV KAKDAAGHELVYTGMSKMSKS NNGIDPQVMVERYGADTVRLF MMFASPADMTLEWQESGVEGANRFLKRVWKLVYEHTAKGDVAA LNVDALTENQKALRRDVHKTIAKVTDDIGRRQTFNTAIAA?ME LMNKLAKAPTDGEQDRALMQEALLAWRMLNPFTPHICFTLWQ ELKGEGDIDNAPWPVADEKAMVEDSTLVVVQVNGKVRAKITVP VDATEEQVRERAGQEHLVAKYLDGVTVRKVIYVPGKLLNLVVG ATGGAAGAGCAATACCGCCCGGAAGAGATAGAATCCAAAGTAC AGCTTCATTGGGATGAGAAGCGCACATTTGAAGTAACCGAAGA CGAGAGCAAAGAGAAGTATTACTGCCTGTCTGCTAATCCCTAT CCTTCTGGTCGACTACACATGGGCCACGTACGTAACTACACCA TCGGTGACGTGATCGCCCGCTACCAGCGTATGCTGGGCAAAAA CGTCCTGCAGCCGATCGGCTGGGACGCGTTTGGTCTGCCTGCG GAAGGCGCGGCGGTGAAAAACAACACCGCTCCGGCACCGTGGA CGTACGACAACATCGCGTATATGAAAAACCAGCTCAAAATGCT GGGCTTTGGTTATGACTGGAGCCGCGAGCTGGCAACCTGTACG CCGGAATACTACCGTTGGGAACAGAAATTCTTCACCGAGCTGT ATAAAAAAGGCCTGGTATATAAGAAGACTTCTGCGGTCAACTG GTGTCCGAACGACCAGACCGTACTGGCGAACGAACAAGTTATC GACGGCTGCTGCTGGCGCTGCGATACC?AAGTTGAACGTAAAG AGATCCCGCAGTGGTTTATCA?AATCACTGCTTACGCTGACGA GCTGCTCAACGATCTGGATAAACTGGATCACTGGCCAGACACC GTTAAAACCATGCAGCGTAACTGGATCGGTCGTTCCGAAGGCG TGGAGATCACCTTCAACGTTAACGACTATGACAACACGCTGAC CGTTTACACTACCCGCCCGGACGCGTTTATGGGTTGTACCTAC CTGGCGGTAGCTGCGGGTCATCCGCTGGCGCAGAAAGCGGCGG AAAATAATCCTGAACTGGCGGCCTTTATTGACGAATGCCGTAA CACCAAAGTTGCCGAAGCTGAAATGGCGACG?TGGAG?AAAAA GGCGTCGATACTGGCTTTAAAGCGGTTCACCC?TTAACGGGCG AAGAAATTCCCGTTTGGGCAGCAAACTTCGTATTGATGGAGTA CGGCACGGGCGCAGTTATGGCGGTACCGGGGCACGACCAGCGC GACTACGAGTTTGCCTCTAAATACGGCCTGAACATCAAACCGG TTATCCTGGCAGCTGACGGCTCTGAGCCAG?TCTTTCTCAGC? AGCCCTGACTGAAAAAGGCGTGCTGTTCAACTCTGGCGAGTTC AACGGTCTTGACCATGAAGCGGCCTTCAACGCCATCGCCGATA secuencia tie niicleótidos T252A AACTGACTGCGATGGGCGTTGGCGAGCGTAAAGTGAACTACCG de aiiiinoacil-tARNsintetasa 1 ,5-dansilalanina CCTGCGCGACTGGGGTGTTTCCCGTCAGCGTTACTGGGGCGCG CCGATTCCGATGGTGACTCTAGAAGACGGTACCGTAATGCCGA CCCCGG?CGACCA.GCTGCCGGTGATCCTGCCGGA?GATGTGGT AATGGACGGCATTACCAGCCCGATTAAAGCAG?TCCGGAGTGG GCGAAAACTACCGTTAACGGTATGCCAGCACTGCGTGAAACCG ACACTTTCGACACCTTTATGGAGTCCTGCTGGATTTATGCGCG CTACACTTGCCCGCAGTACAAAGAAGGTATGCTGGATTCCGAA GCGGCTAACTACTGGCTGCCGGTGGATATCGGTATTGGTGGTA TTGAACACGCCATTATGACGCTGCTCTACTTCCGCTTCTTCCA C???CTGATGCGTGATGCAGGCATGGTGA?CTCTG?CCA?CC? GCGAAACAGTTGCTGTGTCAGGGTATGGTGCTGGCAGATGCCT TCTACTATGTTGGCGAAAACGGCGAACGTAACTGGGTTTCCCC GGTTGATGCTATCGTTGAACGTGACGAGAAAGGCCGTATCGTG AAAGCGAAAGATGCGGCAGGCCATGAACTGGTTTATACCGGCA TGAGCAAAATGTCCAAGTCGAAGAACAACGGTATCGACCCGCA GGTGATGGTTGAACGTTACGGCGCGGACACCGTTCGTCTGTTT ATGATGTTTGCTTCTCCGGCTGATATGACTCTCGAATGGCAGG AATCCGGTGTGGAAGGGGCTAACCGCTTCCTGAAACGTGTCTG GAAACTGGTTTACGAGCACACAGCAAAAGGTGATGTTGCGGCA CTGAACGTTGATGCGCTGACTGAAAATCAGAAAGCGCTGCGTC GCGATGTGCATAAAACGATCGCTAAAGTGACCGATGATATCGG CCGTCGTCAGACCTTCAACACCGCAATTGCGGCGATTATGGAG CTGATGAACAAACTGGCGAAAGCACCAACCGATGGCGAGCAGG ATCGCGCTCTGATGCAGGAAGCACTGCTGGCCGTTGTCCGTAT GCTTAACCCGTTCACCCCGCACATCTGCTTCACGCTGTGGCAG GAACTGAAAGGCGAAGGCGATATCGACAACGCGCCGTGGCCGG TTGCTGACGAAAAAGCGATGGTGGAAGACTCCACGCTGGTCGT GGTGCAGGTTAACGGTAAAGTCCGTGCCAAAATCACCGTTCCG GTGGACGCAACGGAAGAACAGGTTCGCGAACGTGCTGGCCAGG AACATCTGGTAGCAAAATATCTTGATGGCGTTACTGTACGTAA AGTGATTTACGTACCAGGTAAACTCCTCAATCTGGTCGTTGGC TAAGCGGCC MEEQYRPEEIESKVQLHWDEKRTFEVTEDESKEKYYCLSANPY PSGRLHMGHVRNYTIGDVTARYQRMLGKNVLQPIGWDAFGLPA EGAAVKNNTAPAPWTYDNIAYMKNQLKMLGE'GYDWSRELATCT PEYYRWEQKFFTELYKKGLVYKKTSAVNWCPNDQTVLANEQV? DGCCWRCDTKVERKEIPQWFIKITAYADELLNDLDKLDHWPDT VKTMQRN IGRSEGVEITFNVNDYDNTLTVYTTRPDTFMGCTY LAVAAGHPLAQKAAENNPELAAFIDECRNTKVAEAEMATMEKK secuencia de aminoácidos V338A GVDTGFKAVHPLTGEEIPV AANFVLMEYGTGAVMAAPGHDQR de a inoacil-tARN sintetasa DYEFASKYGLNIKPVILAADGSEPDLSQQALTEKGVLFNSGEF 1,5-dnnsilalanina (derivada de NGLDHEAAF AIADKLTAMGVGERKVNYRLRDWGVSRQRY GA leucil-tARN sintetasa de E. coli PIPMVTLEDGTVMPTPDDQLPVILPEDVVMDGITSPIKADPEW tipo silvestre) AKTTVNGMPALRETDTFDTFMESCWIYARYTCPQYKEGKLDSE AANYWLPVDIGIGGIEHAIMTLLYFRFFHKLMRDAGMVNSDEP AKQLLCOGMVLADAFYYVGENGERNWVSPVDAIVERDEKGRIV KAKDAAGHELVYTGMSKMSKSKNL-JGIDPQVMVERYGADTVRLF MMFASPADMTLEWQESGVEGANRFLKRV KLVYEHTAKGDVAA LNVDALTENQKALRRDVHKTIAKVTDDIGRRQTFNTATAA1ME LMMKLAKAPTDGEQDRALMQEALLAVVRMLNPFTPIÍICFTLWQ ELKGEGDIDNAP PVADEKAMVEDSTLVVVQVNGKVRAKITVP VDATEEQVRERAGQEHLVAKYLDGVTVRKVIYVPGKLLNLVVG ATGGA?GAGCAATACCGCCCGGAAGAGAT?GAATCC?A?GTAC AGCTTCATTGGGATGAGAAGCGCACATTTGAAGTAACCGAAGA CGAG?GCAAAGAGAAGTATTACTGCCTGTCTGCTAATCCCT?T CCTTCTGGTCGACTACACATGGGCCACGTACGTAACTACACCA TCGGTGACGTGATCGCCCGCTACC?GCGTATGCTGGGCAAAAA CGTCCTGCAGCCG?TCGGCTGGGACGCGTTTGGTCTGCCTGCG GAAGGCGCGGCGGTGAAAAACAACACCGCTCCGGCACCGTGGA CGTACGACAACATCGCGTATATGAAAAACCAGCTCAAAATGCT GGGCTTTGGTTATGACTGGAGCCGCGAGCTGGCAACCTGTACG CCGGAATACTACCGTTGGGAACAGAAATTCTTCACCGAGCTGT ATAAAAAAGGCCTGGTATATAAGAAGACTTCTGCGGTCAAC7G GTGTCCGAACGACCAGACCGTACTGGCGAACGAACAAGTTATC GACGGCTGCTGCTGGCGCTGCGATACCAAAGTTGAACGTAAAG AGATCCCGCAGTGGTTTATCAAAATCACTGCTTACGCTGACGA GCTGCTCAACGATCTGGATAAACTGGATCACTGGCCAGACACC GTTAAAACCATGCAGCGTAACTGGATCGGTCGTTCCGAAGGCG secuencia de nuclcótidos V338A TGGAGATCACCTTCAACGTTAACGACTATGACAACACGCTGAC de aminoacil-tARN sintetasa CGTTTACACTACCCGCCCGGACACCTTTATGGGTTGTACCTAC 1,5-dansilalanina CTGGCGGTAGCTGCGGGTCATCCGCTGGCGCAGAAAGCGGCGG AAAATAATCCTGAACTGGCGGCCTTTATTGACGAATGCCGTAA CACCAAAGTTGCCGAAGCTGAAATGGCGACGATGGAGAAAAAA GGCGTCGATACTGGCTTTAAAGCGGTTCACCCATTAACGGGCG AAGAAATTCCCGTTTGGGCAGCAAACTTCGTATTGATGGAGTA CGGCACGGGCGCAGTTATGGCGGCGCCGGGGCACGACCAGCGC GACTACGAGTTTGCCTCTAAATACGGCCTGAACATCAAACCGG TTATCCTGGCAGCTGACGGCTCTGAGCCAGATCTTTCTCAGC? AGCCCTGACTGAAAA?GGCGTGCTGTTCAACTCTGGCGAGTTC AACGGTCTTGACCATGAAGCGGCCTTCAACGCCATCGCCGATA AACTGACTGCGATGGGCGTTGGCGAGCGTAAAGTGAACTACCG CCTGCGCGACTGGGGTGTTTCCCGTCAGCGTTACTGGGGCGCG CCGATTCCGATGGTGACTCTAGAAGACGGTACCGTAATGCCGA CCCCGGACGACCAGCTGCCGGTGATCCTGCCGGAAGATGTGGT AATGGACGGCATTACCAGCCCGATTAAAGCAGATCCGGAGTGG GCGAAAACTACCGTTAACGGTATGCCAGCACTGCGTGA?ACCG ACACTTTCGACACCTTTATGGAGTCCTGCTGGATTTATGCGCG CTACACTTGCCCGCAGTACAAAGAAGGTATGCTGGATTCCG?A GCTGCTCAACGATCTGGATAAACTGGATCACTGGCCAGACACC GTTAAAACCATGCAGCGTAACTGGATCGGTCGTTCCGAAGGCG TGGAGATCACCTTCAACGTTAACGACTATGACAACACGCTGAC CGTTTACACTACCCGCCCGGACACCTTTATGGGTTGTACCTAC CTGGCGGTAGCTGCGGGTCATCCGCTGGCGCAGAAAGCGGCGG AAAATAATCCTGAACTGGCGGCCTTTATTGACGAATGCCGTAA CACCAAAGTTGCCGAAGCTGAAATGGCGACGATGGAGAAAAAA GGCGTCGATACTGGCTTTAAAGCGGTTCACCCATTAACGGGCG AAGAAATTCCCGTTTGGGCAGCAAACTTCGTATTGATGGAGTA CGGCACGGGCGCAGTTATGGCGGTACCGGGGCACGACCAGCGC GACTACGAGTTTGCCTCTAAATACGGCCTGAACATCAAACCGG TTATCCTGGCAGCTGACGGCTCTGAGCCAGATCTTTCTCAGCA AGCCCTGACTGAAAAAGGCGTGCTGTTCAACTCTGGCGAGTTC AACGGTCTTGACCATGAAGCGGCCTTCAACGCCATCGCCGATA AACTGACTGCGATGGGCGTTGGCGAGCGTAAAGTGAACTACCG CCTGCGCGACTGGGGTGTTTCCCGTCAGCGTTACTGGGGCGCG CCGATTCCGATGGTGACGCTGGA?GACGGTACCGTAATGCCGA CCCCGGACGACCAGCTGCCGGTGATCCTGCCGGAAGATGTGGT AATGGACGGCATTACCAGCCCGATTAAAGCAGATCCGGAGTGG GCGAAAACTACCGTTAACGGTATGCCAGCACTGCGTGAAACCG ACACTTTCG?CACCTTTATGG?GTCCTGCTGGATTTATGCGCG CTACACTTGCCCGCAGTACAAAGAAGGTATGCTGGATTCCGAA GCGGCTAACTACTGGCTGCCGGTGGATATCGCGATTGGTGGTA TTGAACACGCCATTATGGGGCTGCTCTACTTCCGCTTCTTCCA CAAACTGATGCGTGATGCAGGCATGGTGAACTCTGACGAACC? GCGAAACAGTTGCTGTGTCAGGGTATGGTGCTGGCAGATGCCT TCTACTATGTTGGCGAAAACGGCGAACGTAACTGGGTTTCCCC GGTTGATGCTATCGTTGAACGTGACGAGAAAGGCCGTATCGTG AAAGCGAAAGATGCGGCAGGCCATGAACTGGTTTATACCGGCA TGAGCAAAATGTCCAAGTCGAAGAACAACGGTATCGACCCGCA GGTGATGGTTGAACGTTACGGCGCGGACACCGTTCGTCTGTTT ?TGATGTTTGCTTCTCCGGCTGATATGACTCTCG?ATGGC?GG AATCCGGTGTGGAAGGGGCTAACCGCTTCCTGAAACGTGTCTG GAAACTGGTTTACGAGCACACAGCAAAAGGTGATGTTGCGGCA CTGAACGTTGATGCGCTGACTGAAAATCAGAAAGCGCTGCGTC GCGATGTGCATAAAACGATCGCTAAAGTGACCGATGATATCGG CCGTCGTCAGACCTTCAACACCGCAATTGCGGCGATTATGGAG CTGATGAACAAACTGGCGAAAGCACCAACCGATGGCGAGCAGG ACCGCGCTCTGATGCAGGAAGCACTGCTGGCCGTTGTCCGTAT GCTTAACCCGTTCACCCCGCACATCTGCTTCACGCTGTGGCAG GAACTGAAAGGCGAAGGCGATATCGACAACGCGCCGTGGCCGG TTGCTGACGAAAAAGCGATGGTGGAAGACTCCACGCTGGTCGT GGTGCAGGTTAACGGTAAAGTCCGTGCCAAAATCACCGTTCCG GTGGACGCAACGGAAGAACAGGTTCGCGAACGTGCTGGCCAGG AACATCTGGTAGCAAAATATCTTGATGGCGTTACTGTACGTAA AGTGATTTACGTACCAGGTAAACTCCTCAATCTGGTCGTTGGC TAA MEEQYRPEEIESKVQLHWDEKRTFEVTEDEGKEKYYCLS SPY PSGRLHMGHVRNYTIGDVIARYQRMLGKNVLQPIG DAFGLPA EGAAVKNNTAPAP TYDNIAYMKNQLKMLGFGYDWSRELATCT secuencia de aminoácidos de clon PEYYR EQKFFTELYKKGLVYKKTSAVNWCPNDQTVLANEQVI G2-6 de amínoacil-tARN sinte- DGCCWRCDTKVERKEIPQ FIKITAYADELLNDLDKLDHWPDT tnsa o-nltrobencllscrina (deriVKTMQRNWIGRSEGVEITFNVNDYDNTLTVYASRPDTFMGCT vada de leucil-tARN sintetasa LAVAAGHPLAQKAAENNPELAAFIDECRNTKVAEAEMATMEKK de E. coli tipo silvestre) GVDTGFKAVHPLTGEEIPV AANFVLMEYGTGAVMAVPGHDQR DYEFASKYGLNIKPVILAADGSEPDLSQQALTEKGVLF SGEF NGLDHEAAFNAIADKLTAMGVGERKVNYRLRDWGVSRQRY GA PIPMVTLEDGTVMPTPDDQLPVILPEDVVMDGITSPIK?DPEW AKTTVNGMPALRETDTFDTFMESCWIYARYTCPQYKEGMLDSe AANYWLPVDIAIGGIEHAIMGLLYFRFFHKLMRDAGMVNSDEP AKQLLCQGMVLADAFYYVGENGERNWVSPVDAIVERDEKGRIV KAKDAAGHELVYTGISKMSKSKNNGIDPQVMVERYGADTVRLF MMFASPADMTLEWQESGVEGANRFLKRA KLVYEHTAKGDVAA LNVDALTENQKALRRDVHKTIAKVTDDIGRRQTFNTAIAAIME LMNKLAKAPTDGEQDRALMQEALLAVVRMLNPFTPHICFTLWQ ELKGEGDIDNAPWPVADEKAMVEDSTLVVVQVNGKVRAKITVP VDATEEQVRERAGQEHLVAKYLDGVTVRKVIYVPGKLLNLVVG ATCTCGAAGCACACGAAACTTTTTCCTTCCTTCATTCACGC?C ACTACTCTCTAATGAGCAACGGTATACGGCCTTCCTTCCAGTT ACTTGAATTTGAAATAAAAAAAAGTTTGCTGTCTTGCTATCAA GT?TAAATAGACCTGCAATTATTAATCTTTTGTTTCCTCGTCA TTGTTCTCGTTCCCTTTCTTCCTTGTTTCTTTTTCTGCACAAT ATTTCAAGCTATACCAAGCATACAATCAACTGAATTCAGTATG GAAGAGCAATACCGCCCGGAAGAGATAGAATCCAAAGTACAGC TTCATTGGGATGAGAAGCGCACATTTGAAGTAACCGAAGACGA GGGCAAAGAGAAGTATTACTGCCTGTCTTGGTCGCCCTATCCT TCTGGTCGACTACACATGGGCCACGTACGTAACTACACCATCG GTGACGTGATCGCCCGCTACCAGCGTATGCTGGGCAAAAACGT CCTGCAGCCGATCGGCTGGGACGCGTTTGGTCTGCCTGCGG?A GGCGCGGCGGTGAAAAACAACACCGCTCCGGCACCGTGGACGT ACGACAACATCGCGTATATGAAAAACCAGCTCAAAATGCTGGG CTTTGGTTATGACTGGAGCCGCGAGCTGGCAACCTGT&CGCCG GAATACTACCGTTGGGAACAGAAATTCTTCACCGAGCTGTAT? ?A?AAGGCCTGGTATAT?AGA?GACTTCTGCGGTCA?CTGGTG TCCGAACGACCAGACCGTACTGGCGAACGAACAAGTT?TCGAC GGCTGCTGCTGGCGCTGCGATACCAAAGTTGAACGTAAAGAGA TCCCGC?GTGGTTTATCAAA?TCACTGCTTACGCTGACGAGCT GCTCAACGATCTGGATAAACTGGATCACTGGCCAGACACCGTT AAAACCATGCAGCGTAACTGGATCGGTCGTTCCGAAGGCGTGG AGATCACCTTCAACGTTAACGACTATGACAACACGCTGACCGT TTACGCTTCCCGCCCGG?CACCTTTATGGGTTGTACCTACCTG secuencia de nucleótidos de clon GCGGTAGCTGCGGGTCATCCGCTGGCGCAGAAAGCGGCGGAAA G2-? de aminoacil-tARN sinteATAATCCTGAACTGGCGGCCTTTATTGACGAATGCCGTAACAC tasa o-riiti bencilserina CAAAGTTGCCGAAGCTGAAATGGCGACGATGGAG?A?A??GGC GTCGATACTGGCTTTAAAGCGGTTCACCCATTAACGGGCGAAG AAATTCCCGTTTGGGCAGCAAACTTCGTATTGATGGAGTACGG CACGGGCGCAGTTATGGCGGTACCGGGGCACGACCAGCGCGAC TACGAGTTTGCCTCTAAATACGGCCTGAACATCAAACCGGTTA TCCTGGCAGCTGACGGCTCTGAGCCAGATCTTTCTCAGCAAGC CCTGACTGAA?AAGGCGTGCTGTTCAACTCTGGCGAGTTC?AC GGTCTTG?CCATGAAGCGGCCTTCA?CGCCATCGCCGATA??C TGACTGCGATGGGCGTTGGCGAGCGTAAAGTGAACTACCGCCT GCGCGACTGGGGTGTTTCCCGTCAGCGTTACTGGGGCGCGCCG ATTCCGATGGTGACTCTAGAAGACGGTACCGTAATGCCGACCC CGGACGACCAGCTGCCGGTGATCCTGCCGGAAGATGTGGTAAT GGACGGCATTACCAGCCCGATTAAAGCAGATCCGGAGTGGGCG AAAACTACCGTTAACGGTATGCCAGCACTGCGTGAAACCGACA CTTTCGACACCTTTATGGAGTCCTGCTGGATTTATGCGCGCTA CACTTGCCCGCAGTACAAAGAAGGTATGCTGGATTCCGAAGCG GCTAACTACTGGCTGCCGGTGGATATCGCGATTGGTGGTATTG AACACGCCATTATGGGGCTGCTCTACTTCCGCTTCTTCCACAA ACTGATGCGTGATGCAGGCATGGTGAACTCTGACGAACCAGCG AAACAGTTGCTGTGTCAGGGTATGGTGCTGGCAGATGCCTTCT ACTATGTTGGCGAAAACGGCGAACGTAACTGGGTTTCCCCGGT TGATGCTATCGTTGAACGTGACGAGAAAGGCCGTATCGTGAAA GCGAAAGATGCGGCAGGCCATGAACTGGTTTATACCGGCATAA GC?AAATGTCCAAGTCGAAGAACAACGGTATCGACCCGCAGGT GATGGTTGAACGTTACGGCGCGGACACCGTTCGTCTGTTTATG

Claims (3)

  1. REIVINDICACIONES 1. Un sistema de traducción caracterizado porque comprende : (a) un primer aminoácido no natural seleccionado del grupo que consiste de: p-etiltiocarbonil-L-fenilalanina, p-(3-oxobutanoil) -L-fenilalanina, 1 , 5-dansil-alanina, 7-amino-coumarin-alanina, 7-hidroxi-coumarin-alanina, o-nitrobencil-serina, 0- (2 -nitrobencil) -L-tirosina, p-carboximetil -L-fenilalanina, m-ciano-L-fenilalanina, bifenilalanina, 3-amino-L-tirosina, bipiridilalanina, p- (2 -amino-1-hidroxietil) -L-fenilalanina y p-isopropiltiocarbonil-L-fenilalanina; (b) una primera aminoacil-tARN sintetasa ortogonal (O-RS) ; y (c) un primer tARN ortogonal (O-tARN) ; en donde la primera O-RS aminoacila preferiblemente el primer O-tARN con el primer aminoácido no natural. 2. El sistema de traducción de conformidad con la reivindicación 1, caracterizado porque la primera O-RS es derivada de una aminoacil-tARN sintetasa de Methanococcus jannaschii. 3. El sistema de traducción de conformidad con la reivindicación 1, caracterizado porque la primera O-RS es derivada de una tirosil-tARN sintetasa de Methanococcus jannaschii de tipo silvestre. 4. El sistema de traducción de conformidad con la reivindicación 1, caracterizado porque la primera O-RS es derivada de una ammoacil - tARN sintetasa de E. coli. 5. El sistema de traducción de conformidad con la reivindicación 1, caracterizado porque la primera O-RS es derivada de una leucil-tAR? sintetasa de E. coll tipo silvestre . 6. El sistema de traducción de conformidad con la reivindicación 1, caracterizado porque la primera O-RS comprende una secuencia de aminoácidos seleccionada de las secuencias de aminoácidos resumidas en SEQ ID ?Os : 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 50, 52-54, 57, 59-63 y variantes conservadoras de las mismas. 7. El sistema de traducción de conformidad con la reivindicación 1, caracterizado porque el primer O-tAR? es un tAR? supresor ámbar. 8. El sistema de traducción de conformidad con la reivindicación 1, caracterizado porque el primer O-tAR? comprende o es codificado por una secuencia de polmucleótidos resumida en SEQ ID ?O: 1 ó 2. 9. El sistema de traducción de conformidad con la reivindicación 1, caracterizado porque comprende además un ácido nucleico que codifica una proteína de interés, el ácido nucleico comprende por lo menos un codón selector, en donde el codón selector es reconocido por el primer O- tARN . 10. El sistema de traducción de conformidad con la reivindicación 9, caracterizado porque comprende además una segunda O-RS y un segundo O-tARN, en donde la segunda O-RS aminoacila preferiblemente el segundo O-tARN con un segundo aminoácido no natural que es diferente del primer aminoácido no natural y en donde el segundo O-tARN reconoce un codón selector que es diferente del codón selector reconocido por el primer 0-tARN. 11. El sistema de traducción de conformidad con la reivindicación 1, caracterizado porque el sistema comprende una célula huésped que comprende el primer aminoácido no natural, la primera O-RS y el primer O-tARN. 12. El sistema de traducción de conformidad con la reivindicación 11, caracterizado porque la célula huésped es seleccionada de una célula eubactepana y una célula de levadura. 13. El sistema de traducción de conformidad con la reivindicación 11, caracterizado porque la célula eubactepana es una célula de E. coll. 14. El sistema de traducción de conformidad con la reivindicación 11, caracterizado porque la célula huésped comprende un polmucleótido que codifica la primera O-RS. 15. El sistema de traducción de conformidad con la reivindicación 14, caracterizado porque el polmucleótido comprende una secuencia de polmucleótidos resumida en SEQ ID NOs: 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 51 ó 58. 16. El sistema de traducción de conformidad con la reivindicación 11, caracterizado porque la célula huésped comprende un polmucleótido que codifica el primer O-tARN. 17. Un método para la producción en un sistema de traducción de proteína que comprende un aminoácido no natural en una posición seleccionada, el método está caracterizado porque comprende • (a) proporcionar un sistema de traducción que comprende : (i) un primer aminoácido no natural seleccionado de p-etiltiocarbonil-L-femlalamna, p- (3-oxobutano?l) -L-fenilalanina, 1 , 5-dans?l -alanma, 7-am?no-coumann-alam na, 7-hidroxi-coumapn-alanina, o-mtrobencil-senna, O- (2-nitrobencil) -L-tirosma, p-carboximetil-L-fenilalanina, m-ciano-L-fenilalanina, bifenilalanina, 3-am?no-L-t?rosma, bipipdilalanma, p- (
  2. 2-ammo-l-h?drox?et?l) -L-fenilalanma y p-ísopropiltiocarbonil-L-femlalamna; (n) una primera ammoacil-tARN smtetasa ortogonal (O-RS) ; (m) un primer tARN ortogonal (O-tARN) , en donde la primera O-RS ammoacila preferiblemente el primer O-tARN con el aminoácido no natural ; y (ív) un ácido nucleico que codifica la proteína, en donde el ácido nucleico comprende por lo menos un codón selector que es reconocido por el primer O-tARN; y (b) incorporar el aminoácido no natural en la posición seleccionada en la proteína durante la traducción de la proteína en respuesta al codón selector, produciendo mediante esto la proteína que comprende el aminoácido no natural en la posición seleccionada. 18. El método de conformidad con la reivindicación 17, caracterizado porque la provisión de un sistema de traducción comprende proporcionar un polmucleótido que codifica la O-RS. 19. El método de conformidad con la reivindicación 17, caracterizado porque la provisión de un sistema de traducción comprende proporcionar una O-RS derivada de una aminoacil-tARN smtetasa de Methanococcus jannaschi i . 20. El método de conformidad con la reivindicación 27, caracterizado porque la provisión de un sistema de traducción comprende proporcionar una O-RS derivada de una tirosil-tARN smtetasa de Methanococcus jannaschii de tipo silvestre . 21. El método de conformidad con la reivindicación 17, caracterizado porque la provisión de un sistema de traducción comprende proporcionar una O-RS derivada de una aminoacil - tARN sintetasa de E. coll. 22. El método de conformidad con la reivindicación 17, caracterizado porque la provisión de un sistema de traducción comprende proporcionar una O-RS derivada de una leucil-tARN sintetasa de E. coli tipo silvestre. 23. El método de conformidad con la reivindicación 17, caracterizado porque la provisión de un sistema de traducción comprende proporcionar una O-RS que comprende una secuencia de aminoácidos seleccionado de las secuencias de aminoácidos resumida en SEQ ID NOs : 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 50, 52-54, 57, 59-63 y variantes conservadoras de las mismas. 24. El método de conformidad con la reivindicación 17, caracterizado porque la provisión de un sistema de traducción comprende mutación de una cavidad de enlace de aminoácido de una aminoacil-tARN sintetasa tipo silvestre mediante mutagénesis dirigida al sitio y seleccionar una O-RS resultante que aminoacil preferiblemente el O-tARN con el aminoácido no natural . 25. El método de conformidad con la reivindicación 24, caracterizado porque la etapa de selección comprende seleccionar positivamente y seleccionar negativamente la O-RS de un cúmulo que comprende una pluralidad de moléculas de aminoacil-tARN sintetasa resultantes enseguida de la mutagénesis dirigida al sitio. 26. El método de conformidad con la reivindicación 17, caracterizado porque la provisión de un sistema de traducción comprende proporcionar un polinucleótido que codifica el O-tARN. 27. El método de conformidad con la reivindicación 17, caracterizado porque la provisión de un sistema de traducción comprende proporcionar un O-tARN que es un tARN supresor ámbar. 28. El método de conformidad con la reivindicación 17, caracterizado porque la provisión de un sistema de traducción comprende proporcionar un O-tARN que comprende o es codificado por una secuencia de polinucleótidos resumida en SEQ ID NO: 1 ó 2. 29. El método de conformidad con la reivindicación 17, caracterizado porque la provisión de un sistema de traducción comprende proporcionar un ácido nucleico que comprende un codón selector ámbar. 30. El método de conformidad con la reivindicación 17, caracterizado porque la proteína comprende un segundo aminoácido no natural que es diferente del primer aminoácido no natural y en donde la provisión de un sistema de traducción comprende además una segunda o-RS y un segundo O-tARN, en donde la segunda O-RS aminoacila preferiblemente el segundo O-tARN con un segundo aminoácido no natural que es diferente del primer aminoácido no natural y en donde el segundo O-tARN reconoce un codón selector en el ácido nucleico que es diferente del codón selector reconocido por el primer O-tARN. 31. El método de conformidad con la reivindicación 17, caracterizado porque la provisión de un sistema de traducción comprende proporcionar una célula huésped, en donde la célula huésped comprende el primer aminoácido no natural, la primera O-RS, el primer O-tARN y el ácido nucleico, y en donde la etapa de incorporación comprende cultivar la célula huésped. 32. El método de conformidad con la reivindicación 31, caracterizado porque la provisión de una célula huésped comprende proporcionar una célula huésped eubacteriana o una célula huésped de levadura. 33. El método de conformidad con la reivindicación 32, caracterizado porque la provisión de una célula huésped eubacteriana comprende proporcionar una célula huésped de E. coli . 34. El método de conformidad con la reivindicación 31, caracterizado porque la provisión de una célula huésped comprende proporcionar una célula huésped que comprende un polinucleótido que codifica la O-RS. 35. El método de conformidad con la reivindicación 34, caracterizado porque la etapa de proporcionar una célula huésped que comprende un polinucleótido que codifica la O-RS comprende proporcionar una célula huésped que comprende un polinucleótido que comprende una secuencia de nucleótidos resumida en SEQ ID NOs: 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 51 ó 58. 36. El método de conformidad con la reivindicación 17, caracterizado porque la provisión de un sistema de traducción comprende proporcionar un extracto de célula. 37. Un sistema de traducción caracterizado porque comprende : (a) un primer aminoácido no natural seleccionado de
  3. 3 -nitro-L- tirosina y p-nitro-L-fenilalanina; (b) una primera aminoacil-tARN sintetasa ortogonal (O-RS) ; y (c) un primer tARN ortogonal (O-tARN) ; en donde la primera O-RS aminoacila el primer O-tARN con el primer aminoácido no natural con una eficiencia que es por lo menos 50% de la eficiencia observada para un sistema de traducción que comprende el primer aminoácido no natural, el primer O-tARN y una O-RS que comprende una secuencia de aminoácidos seleccionado de SEQ ID NOs : 7-10. 38. El sistema de traducción de conformidad con la reivindicación 37, caracterizado porque la primera O-RS es derivada de una aminoacil-tARN sintetasa de Methanococcus jannaschii . 39. El sistema de traducción de conformidad con la reivindicación 37, caracterizado porque la primera O-RS es derivada de una tirosil-tARN sintetasa de Me thanococcus jannaschii de tipo silvestre. 40. El sistema de traducción de conformidad con la reivindicación 37, caracterizado porque la primera O-RS comprende una secuencia de aminoácidos seleccionada de las secuencias de aminoácidos resumidas en SEQ ID NOs: 7-10 y variantes conservadoras de las mismas. 41. El sistema de traducción de conformidad con la reivindicación 37, caracterizado porque el primer O-tARN es un tARN supresor ámbar. 42. El sistema de traducción de conformidad con la reivindicación 37, caracterizado porque el primer O-tARN comprende o es codificado por una secuencia de polinucleótidos resumida en SEQ ID NO: 1. 43. El sistema de traducción de conformidad con la reivindicación 37, caracterizado porque comprende además un ácido nucleico que codifica una proteína de interés, el ácido nucleico comprende por lo menos un codón selector, en donde el codón selector es reconocido por el primer O-tARN. 44. El sistema de traducción de conformidad con la reivindicación 43, caracterizado porque comprende además una segunda O-RS y un segundo O-tARN, en donde la segunda O-RS aminoacila preferiblemente el segundo O-tARN con un segundo aminoácido no natural que es diferente del primer aminoácido no natural y en donde el segundo O-tARN reconoce un codón selector que es diferente del codón selector reconocido por el primer 0-tARN. 45. El sistema de traducción de conformidad con la reivindicación 37, caracterizado porque el sistema comprende una célula huésped en donde la célula huésped comprende el primer aminoácido no natural, la primera O-RS y el primer 0-tARN. 46. El sistema de traducción de conformidad con la reivindicación 45, caracterizado porque la célula huésped es una célula eubacteriana. 47. El sistema de traducción de conformidad con la reivindicación 46, caracterizado porque la célula eubacteriana es una célula de E. coli. 48. El sistema de traducción de conformidad con la reivindicación 45, caracterizado porque la célula huésped comprende un polinucleótido que codifica la primera O-RS. 49. El sistema de traducción de conformidad con la reivindicación 48, caracterizado porque el polinucleótido comprende una secuencia de nucleótidos resumida en SEQ ID NO: 11. 50. El sistema de traducción de conformidad con la reivindicación 45, caracterizado porque la célula huésped comprende un polinucleótido que codifica el primer O-tARN. 51. Un método para producir en una célula huésped una proteína que comprende un aminoácido no natural en una posición especificada, el método está caracterizado porque comprende: (a) proporcionar una célula huésped que comprende: (i) un primer aminoácido no natural seleccionado de 3 -nitro-L-tirosina y p-nitro-L-fenilalanina; (ii) un primer tARN ortogonal (O-tARN) ; (iii) una primera aminoacil-tARN sintetasa ortogonal (O-RS) , en donde la primera O-RS amínoacila preferiblemente el primer O-tARN con el aminoácido no natural con una eficiencia que es por lo menos 50% de la eficiencia observada para la célula huésped que comprende el primer aminoácido no natural, el primer O-tARN y una O-RS que comprende una secuencia de aminoácidos seleccionado de SEQ ID NOs : 7-10; y (iv) un ácido nucleico que codifica la proteína, en donde el ácido nucleico comprende por lo menos un codón selector que es reconocido por el primer O-tARN; y (b) cultivar la célula huésped; y (c) incorporar el aminoácido no natural en la posición seleccionada en la proteína durante traducción de la proteína, en donde la posición seleccionada en la proteína corresponde a la posición del codón selector en el ácido nucleico, produciendo mediante esto la proteína que comprende el aminoácido no natural en la posición seleccionada. 52. El método de conformidad con la reivindicación 51, caracterizado porque la provisión de un sistema de traducción comprende proporcionar un polinucleótido que codifica la O-RS. 53. El método de conformidad con la reivindicación 51, caracterizado porque la provisión de un sistema de traducción comprende proporcionar una O-RS derivada de una aminoacil-tARN sintetasa de Methanococcus jannaschii . 54. El método de conformidad con la reivindicación 51, caracterizado porque la provisión de un sistema de traducción comprende proporcionar una O-RS derivada de una tirosil-tARN sintetasa de Methanococcus jannaschii tipo silvestre . 55. El método de conformidad con la reivindicación 51, caracterizado porque la provisión de un sistema de traducción comprende proporcionar una O-RS que comprende una secuencia de aminoácido seleccionada de las secuencias de aminoácidos resumidas en SEQ ID NOs : 7-10 y variantes conservadoras de las mismas. 56. El método de conformidad con la reivindicación 51, caracterizado porque la provisión de un sistema de traducción comprende la mutación de una cavidad de enlace de aminoácido de una aminoacil-tARN sintetasa tipo silvestre mediante mutagénesis dirigida al sitio y seleccionar una O-RS resultante que aminoacila preferiblemente el O-tARN con el aminoácido no natural . 57. El método de conformidad con la reivindicación 56, caracterizado porque la etapa de selección comprende seleccionar positivamente y seleccionar negativamente la O-RS de un cúmulo que comprende una pluralidad de moléculas de aminoacil-tARN sintetasa resultantes enseguida de la mutagénesis dirigida al sitio. 58. El método de conformidad con la reivindicación 51, caracterizado porque la provisión de un sistema de traducción comprende proporcionar un polinucleótido que codifica el O-tARN. 59. El método de conformidad con la reivindicación 51, caracterizado porque la provisión de un sistema de traducción comprende proporcionar un O-tARN que es un tARN supresor ámbar. 60. El método de conformidad con la reivindicación 51, caracterizado porque la provisión de un sistema de traducción comprende proporcionar un O-tARN que comprende o es codificado por una secuencia de polinucleótidos resumida en SEQ ID NO: 1. 61. El método de conformidad con la reivindicación 41, caracterizado porque la provisión de un sistema de traducción comprende proporcionar un ácido nucleico que comprende un codón selector ámbar. 62. El método de conformidad con la reivindicación 51, caracterizado porque la proteína comprende un segundo aminoácido no natural que es diferente del primer aminoácido no natural y en donde la provisión de un sistema de traducción comprende además una segunda O-RS y un segundo O-tARN, en donde la segunda O-RS aminoacila preferiblemente el segundo O-tARN con un segundo aminoácido no natural que es diferente del primer aminoácido no natural y en donde el segundo O-tARN reconoce un codón selector en el ácido nucleico que es diferente del codón selector reconocido por el primer O-tARN. 63. El método de conformidad con la reivindicación 51, caracterizado porque la provisión de un sistema de traducción comprende proporcionar una célula huésped, en donde la célula huésped comprende el primer aminoácido no natural, la primera O-RS, el primer O-tARN y el ácido nucleico y en donde la etapa de incorporación comprende cultivar la célula huésped. 64 El método de conformidad con la reivindicación 63, caracterizado porque la provisión de una célula huésped comprende proporcionar una célula huésped eubacteriana a una célula huésped de levadura. 65. El método de conformidad con la reivindicación 64, caracterizado porque la provisión de una célula huésped eubacteriana comprende proporcionar una célula huésped de E. coli . 66. El método de conformidad con la reivindicación 63, caracterizado porque la provisión de una célula huésped comprende proporcionar una célula huésped que comprende un polmucleótido que codifica la O-RS. 67. El método de conformidad con la reivindicación 66, caracterizado porque la etapa de proporcionar una célula huésped que comprende un polmucleótido que codifica la O-RS comprende proporcionar una célula huésped que comprende un polinucleótido que comprende una secuencia de nucleótidos resumida en SEQ ID NO: 11. 68. El método de conformidad con la reivindicación 51, caracterizado porque la provisión de un sistema de traducción comprende proporcionar un extracto de célula. 69. una composición caracterizada porque comprende un polipéptido que comprende una secuencia de aminoácidos resumida en SEQ ID NO: 7-10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 50, 52-54, 57, 59-63 o una variante conservadora de las mismas, en donde el polipéptido de variante conservadora aminoacila un tARN ortogonal cognato (O-tARN) con un aminoácido no natural con una eficiencia que es por lo menos 50% de la eficiencia observada para un sistema de traducción que comprende el O-tARN, el aminoácido no natural, y una aminoacil-tARN sintetasa que comprende una secuencia de aminoácidos seleccionada de SEQ ID NOs : 7-10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 50, 52-54, 57 y 59-63. 70. Un polinucleótido caracterizado porque codifica el polipéptido de conformidad con la reivindicación 69. 71. El polinucleótido de conformidad con la reivindicación 70, caracterizado porque el polinucleótido es seleccionado de SEQ ID NOs : 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 51 y 58. 72. La composición de conformidad con la reivindicación 69, caracterizada porque la composición es una célula que comprende el polipéptido. 73. Una composición caracterizada porque comprende un polinucleótido que comprende una secuencia de nucleótidos resumida en SEQ ID NOs: 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 51 ó 58. 74. Un vector caracterizado porque comprende un polmucleótido de conformidad con la reivindicación 73. 75. Un vector de expresión caracterizado porque comprende un polmucleótido de conformidad con la reivindicación 73. 76. Una célula caracterizada porque comprende un vector, el vector comprende un polinucleótido de conformidad con la reivindicación 73.
MX2007004892A 2004-10-27 2005-10-27 Componentes de traduccion ortogonales para la incorporacion in vivo de aminoacidos no naturales. MX2007004892A (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US62273804P 2004-10-27 2004-10-27
PCT/US2005/039210 WO2006110182A2 (en) 2004-10-27 2005-10-27 Orthogonal translation components for the in vivo incorporation of unnatural amino acids

Publications (1)

Publication Number Publication Date
MX2007004892A true MX2007004892A (es) 2007-08-16

Family

ID=37087466

Family Applications (1)

Application Number Title Priority Date Filing Date
MX2007004892A MX2007004892A (es) 2004-10-27 2005-10-27 Componentes de traduccion ortogonales para la incorporacion in vivo de aminoacidos no naturales.

Country Status (10)

Country Link
US (2) US8216804B2 (es)
EP (3) EP1807515A4 (es)
JP (2) JP5135504B2 (es)
CN (2) CN101048506B (es)
AU (1) AU2005330514B2 (es)
BR (1) BRPI0517381A (es)
CA (1) CA2583735A1 (es)
IL (2) IL182495A0 (es)
MX (1) MX2007004892A (es)
WO (1) WO2006110182A2 (es)

Families Citing this family (57)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IL158419A0 (en) * 2001-04-19 2004-05-12 Scripps Research Inst Methods and composition for the production of orthoganal trna-aminoacyl trna synthetase pairs
ES2333422T3 (es) * 2002-10-16 2010-02-22 The Scripps Research Institute Sintesis de glicoproteinas.
ATE542894T1 (de) 2003-04-17 2012-02-15 Scripps Research Inst Ausweitung des eukaryotischen genetischen codes
MXPA06000242A (es) * 2003-07-07 2006-04-07 Scripps Research Inst Composiciones de pares de lisil-trna ortogonal y aminoacil- trna sintetasa y sus usos.
EP1794323B1 (en) 2004-09-21 2014-08-06 The Scripps Research Institute In vivo incorporation of alkynyl amino acids into proteins in eubacteria
WO2006136197A1 (en) * 2005-06-21 2006-12-28 V. Mane Fils Smoking device incorporating a breakable capsule, breakable capsule and process for manufacturing said capsule
US8586340B2 (en) 2005-10-12 2013-11-19 The Scripps Research Institute Selective posttranslational modification of phage-displayed polypeptides
MX2008011470A (es) * 2006-03-09 2008-09-24 Scripps Research Inst Sistemas para la expresion de componentes de traduccion ortogonales en celulas huesped eubacterianas.
KR20080113226A (ko) 2006-03-16 2008-12-29 더 스크립스 리서치 인스티튜트 비천연 아미노산 페닐셀레노시스테인을 함유하는 단백질의 유전자적으로 프로그램된 발현
CA2652894A1 (en) 2006-05-23 2007-12-06 The Scripps Research Institute Genetically encoded fluorescent coumarin amino acids
BRPI0716963A2 (pt) 2006-09-21 2013-11-05 Scripps Research Inst Expressão geneticamente programada de proteínas seletivamente sulfatadas em eubactéria
CN101535338A (zh) 2006-10-18 2009-09-16 斯克利普斯研究院 在哺乳动物细胞中将非天然氨基酸遗传掺入蛋白质
WO2009049223A2 (en) * 2007-10-10 2009-04-16 Irm Llc Methods and compositions for the site-selective incorporation of fluorinated amino acids into polypeptides
CN102203257B (zh) 2007-10-25 2014-01-08 斯克利普斯研究院 3-氨基酪氨酸遗传掺入还原酶
EP2271662A4 (en) * 2008-03-21 2012-03-21 Univ California HIGH SENSITIVITY FLUORESCENT ENERGY TRANSFER ASSAY USING FLUORESCENT AMINO ACIDS AND FLUORESCENT PROTEINS
US8637306B2 (en) 2008-12-10 2014-01-28 The Scripps Research Institute Production of carrier-peptide conjugates using chemically reactive unnatural amino acids
JP5725467B2 (ja) * 2010-08-27 2015-05-27 国立大学法人 東京大学 新規人工翻訳合成系
US8658394B2 (en) * 2011-02-02 2014-02-25 Waterstone Pharmaceuticals Methods, cells and systems for incorporating non-canonical amino acids into proteins
CN102888387B (zh) * 2011-07-21 2015-03-18 中国科学院生物物理研究所 3-氯代酪氨酸翻译系统及其应用
CN103215235B (zh) * 2012-01-18 2014-11-05 中国科学院生物物理研究所 3-咪唑基酪氨酸翻译系统及其应用
US20150148525A1 (en) 2012-05-18 2015-05-28 Medical Research Council Methods of incorporating an amino acid comprising a bcn group into a polypeptide using an orthogonal codon encoding it and an orthorgonal pylrs synthase
JP6498600B2 (ja) 2012-06-08 2019-04-10 ストロ バイオファーマ インコーポレーテッド 部位特異的な非天然アミノ酸残基を含む抗体、その調製方法、及びその使用方法
US9732161B2 (en) 2012-06-26 2017-08-15 Sutro Biopharma, Inc. Modified Fc proteins comprising site-specific non-natural amino acid residues, conjugates of the same, methods of their preparation and methods of their use
CN103571804B (zh) * 2012-08-10 2015-08-12 中国科学院生物物理研究所 3-吡唑基酪氨酸翻译系统及其应用
CN104981254B (zh) 2012-08-31 2018-05-22 苏特罗生物制药公司 含有叠氮基的经修饰的氨基酸
CN104004723B (zh) * 2013-02-22 2016-08-17 中国科学院生物物理研究所 3,5-二氟代酪氨酸翻译系统及其应用
JO3564B1 (ar) 2013-03-08 2020-07-05 Novartis Ag ببتيدات وتركيبات لعلاج ضرر المفاصل
CN106047846B (zh) * 2013-03-22 2020-02-04 中国科学院生物物理研究所 8-羟基喹啉丙氨酸翻译系统及其应用
EP3019522B1 (en) 2013-07-10 2017-12-13 Sutro Biopharma, Inc. Antibodies comprising multiple site-specific non-natural amino acid residues, methods of their preparation and methods of their use
WO2015009948A1 (en) 2013-07-19 2015-01-22 Regents Of The University Of California Milk fat globule epidermal growth factor 8 regulates fatty acid uptake
US9840493B2 (en) 2013-10-11 2017-12-12 Sutro Biopharma, Inc. Modified amino acids comprising tetrazine functional groups, methods of preparation, and methods of their use
EP3055320B1 (en) 2013-10-11 2018-10-03 Sutro Biopharma, Inc. NON-NATURAL AMINO ACID tRNA SYNTHETASES FOR PYRIDYL TETRAZINE
WO2015054587A1 (en) * 2013-10-11 2015-04-16 Sutro Biopharma, Inc. NON-NATURAL AMINO ACID tRNA SYNTHETASES FOR PARA-METHYLAZIDO-L-PHENYLALANINE
GB2528227A (en) 2014-03-14 2016-01-20 Medical Res Council Cyclopropene amino acids and methods
GB201419109D0 (en) * 2014-10-27 2014-12-10 Medical Res Council Incorporation of unnatural amino acids into proteins
MX2018009085A (es) 2016-01-27 2019-05-09 Sutro Biopharma Inc Conjugados de anticuerpos anti-cd74, composiciones que comprenden conjugados de anticuerpos anti-cd74 y metodos de uso de congujados de anticuerpos anti-cd74.
WO2018031531A1 (en) * 2016-08-08 2018-02-15 President And Fellows Of Harvard College Engineered bacteria for non-invasive imaging and therapeutic applications
EP3538546A1 (en) 2016-11-14 2019-09-18 Novartis AG Compositions, methods, and therapeutic uses related to fusogenic protein minion
IL266361B2 (en) 2016-11-14 2024-02-01 Novartis Ag Methods and preparations for the treatment of cartilage damage and arthritis
WO2019005973A1 (en) * 2017-06-30 2019-01-03 President And Fellows Of Harvard College SYNTHASE VARIANTS FOR INCORPORATING BIPHENYLALANINE INTO A PEPTIDE
US11364275B2 (en) * 2017-08-04 2022-06-21 Bioventures, Llc Linear lipopeptide paenipeptins and methods of using the same
US20210356377A1 (en) * 2018-09-07 2021-11-18 Medimmune, Llc Methods Of Cell Selection
CN113454211A (zh) * 2019-02-20 2021-09-28 诺和诺德股份有限公司 氨酰基-tRNA合成酶及其用途
AU2020295571A1 (en) * 2019-06-21 2022-01-06 Trustees Of Boston College Enhanced platforms for unnatural amino acid incorporation in mammalian cells
JP2022545625A (ja) * 2019-08-08 2022-10-28 ブリックバイオ,インコーポレイテッド 非天然アミノ酸の部位特異的組込みのためのアミノアシルtrnaシンテターゼおよび細胞株
CN114761546A (zh) * 2019-10-08 2022-07-15 波士顿学院董事会 含有多个不同非天然氨基酸的蛋白质以及制备和使用此类蛋白质的方法
US20230069218A1 (en) * 2019-12-12 2023-03-02 Chugai Seiyaku Kabushiki Kaisha Method for producing peptide containing non-natural amino acid
EP4107258A4 (en) * 2020-02-20 2024-04-17 B G Negev Technologies And Applications Ltd At Ben Gurion Univ MUTANT AMINOACYL-ARNT SYNTHETASES
TW202207988A (zh) 2020-05-05 2022-03-01 美商建南德克公司 用於酪胺酸酶媒介的位點特異性蛋白質結合的系統及方法
AU2021320894A1 (en) * 2020-08-07 2023-03-02 Brickbio, Inc. Stable cell lines for site-specific incorporation of unnatural amino acids
CN114250243B (zh) * 2020-09-24 2024-05-03 深圳华大生命科学研究院 一种检测极端嗜盐生物中氨酰-tRNA合成酶和tRNA活性的系统及方法
CN113481218A (zh) * 2021-06-13 2021-10-08 中国药科大学 巨型病毒或巨型噬菌体来源氨酰tRNA合成酶/tRNA正交体系构建方法及正交体系
WO2023069816A2 (en) 2021-09-20 2023-04-27 The Broad Institute, Inc. Compositions and methods for multiplex decoding of quadruplet codons
WO2023049774A1 (en) * 2021-09-21 2023-03-30 University Of Washington Genetically encoded and exogenously triggered protein-protein ligation
CN114134141B (zh) * 2021-11-03 2024-01-30 杭州嵌化合生医药科技有限公司 一种引入非天然氨基酸的嵌合体苯丙氨酸翻译系统及其构建方法
CN115717130A (zh) * 2022-09-02 2023-02-28 凯莱英医药集团(天津)股份有限公司 氨酰-tRNA合酶突变体及烯基酪氨酰-tRNA的制备方法
WO2024091824A1 (en) 2022-10-26 2024-05-02 Ada Forsyth Institute, Inc. Differentiation and reprogramming of chondrocyte

Family Cites Families (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5580953A (en) * 1991-08-14 1996-12-03 Amylin Pharmaceuticals, Inc. Amylin antagonist peptides and uses therefor
US5635608A (en) 1994-11-08 1997-06-03 Molecular Probes, Inc. α-carboxy caged compounds
KR20040041639A (ko) 1995-04-24 2004-05-17 크로막솜 코포레이티드 새로운 대사 경로를 만들고 이를 스크리닝하는 방법
US5958672A (en) 1995-07-18 1999-09-28 Diversa Corporation Protein activity screening of clones having DNA from uncultivated microorganisms
CN1156180A (zh) * 1995-09-05 1997-08-06 底古萨股份公司 用大肠杆菌生产色氨酸
US5998580A (en) 1995-10-13 1999-12-07 Fay; Frederick F. Photosensitive caged macromolecules
US5756316A (en) 1995-11-02 1998-05-26 Genencor International, Inc. Molecular cloning by multimerization of plasmids
US6238884B1 (en) 1995-12-07 2001-05-29 Diversa Corporation End selection in directed evolution
US6171820B1 (en) 1995-12-07 2001-01-09 Diversa Corporation Saturation mutagenesis in directed evolution
US5783431A (en) 1996-04-24 1998-07-21 Chromaxome Corporation Methods for generating and screening novel metabolic pathways
JP2000301808A (ja) * 1999-04-19 2000-10-31 Canon Inc テストパターン記録方法、情報処理装置および記録装置
CN1297999A (zh) * 1999-11-24 2001-06-06 上海博容基因开发有限公司 一种新的多肽——人谷氨酰转移核糖核酸合成酶58和编码这种多肽的多核苷酸
AU2001227280A1 (en) * 2000-04-10 2001-10-23 The Scripps Research Institute Proteomic analysis using activity-based probe libraries
IL158419A0 (en) * 2001-04-19 2004-05-12 Scripps Research Inst Methods and composition for the production of orthoganal trna-aminoacyl trna synthetase pairs
AU2003250559A1 (en) 2002-07-23 2004-02-09 Yong-Seok Jeong Beverage can
ES2333422T3 (es) * 2002-10-16 2010-02-22 The Scripps Research Institute Sintesis de glicoproteinas.
ATE429500T1 (de) 2002-10-16 2009-05-15 Scripps Research Inst Stellenspezifischer einbau von ketoaminosäuren in proteine
WO2004058946A2 (en) 2002-12-22 2004-07-15 The Scripps Research Institute Protein arrays
ATE542894T1 (de) 2003-04-17 2012-02-15 Scripps Research Inst Ausweitung des eukaryotischen genetischen codes
US7993872B2 (en) * 2003-06-18 2011-08-09 The Scripps Research Institute Unnatural reactive amino acid genetic code additions
MXPA06000242A (es) 2003-07-07 2006-04-07 Scripps Research Inst Composiciones de pares de lisil-trna ortogonal y aminoacil- trna sintetasa y sus usos.
EP1704242A4 (en) 2003-07-07 2008-06-18 Scripps Research Inst COMPOSITIONS WITH PAIRS OF ORTHOGONAL LEUCYL-TRNA AND AMINOACYL-TRNA-SYNTHETASE AND USES THEREOF
EP1658366A4 (en) * 2003-07-07 2006-08-09 Scripps Research Inst COMPOSITIONS OF ORTHOGONAL GLUTAMYL-TRNA AND AMINOACYL-TRNA-SYNTHETASEPAARES AND THEIR USES
US7134031B2 (en) 2003-08-04 2006-11-07 Arm Limited Performance control within a multi-processor system
CN101532046A (zh) * 2003-10-14 2009-09-16 斯克利普斯研究院 将氧化还原活性氨基酸位点特异地掺入蛋白质
US7741071B2 (en) * 2003-12-18 2010-06-22 The Scripps Research Institute Selective incorporation of 5-hydroxytryptophan into proteins in mammalian cells
JP2005322288A (ja) * 2004-05-07 2005-11-17 Sony Corp ディスク記録及び/又は再生装置
JP2005321568A (ja) * 2004-05-07 2005-11-17 Canon Inc 画像形成装置
BRPI0511482A (pt) * 2004-05-25 2007-12-26 Scripps Research Inst incorporação sìtio-especìfica de aminoácidos artificiais contendo átomos pesados em proteìnas para determinação de estrutura cristalina
WO2006034410A2 (en) * 2004-09-21 2006-03-30 The Scripps Resarch Institute Adding photoregulated amino acids to the genetic code
EP1794323B1 (en) * 2004-09-21 2014-08-06 The Scripps Research Institute In vivo incorporation of alkynyl amino acids into proteins in eubacteria
JP2008513806A (ja) * 2004-09-22 2008-05-01 ザ スクリップス リサーチ インスティテュート Nmr試験のための蛋白質の部位特異的標識
JP2008516637A (ja) * 2004-10-20 2008-05-22 ザ スクリップス リサーチ インスティテュート 真正細菌へのn−アセチルガラクトサミンアミノ酸のインビボ部位特異的組込み
US8586340B2 (en) * 2005-10-12 2013-11-19 The Scripps Research Institute Selective posttranslational modification of phage-displayed polypeptides
MX2008011470A (es) 2006-03-09 2008-09-24 Scripps Research Inst Sistemas para la expresion de componentes de traduccion ortogonales en celulas huesped eubacterianas.
KR20080113226A (ko) * 2006-03-16 2008-12-29 더 스크립스 리서치 인스티튜트 비천연 아미노산 페닐셀레노시스테인을 함유하는 단백질의 유전자적으로 프로그램된 발현

Also Published As

Publication number Publication date
WO2006110182A3 (en) 2006-12-21
EP1807515A2 (en) 2007-07-18
WO2006110182A2 (en) 2006-10-19
EP2383340B1 (en) 2014-07-16
EP2383340A2 (en) 2011-11-02
JP2012254073A (ja) 2012-12-27
CN101048506B (zh) 2013-06-26
EP2383340A3 (en) 2012-03-21
IL211229A0 (en) 2011-04-28
US20130244245A1 (en) 2013-09-19
EP2380982B1 (en) 2014-07-16
JP2008517631A (ja) 2008-05-29
EP2380982A1 (en) 2011-10-26
US20080233611A1 (en) 2008-09-25
AU2005330514B2 (en) 2011-05-12
BRPI0517381A (pt) 2008-10-07
CN102827827B (zh) 2014-10-29
AU2005330514A1 (en) 2006-10-19
IL182495A0 (en) 2007-09-20
US8216804B2 (en) 2012-07-10
CA2583735A1 (en) 2006-10-19
US9102932B2 (en) 2015-08-11
JP5539948B2 (ja) 2014-07-02
EP1807515A4 (en) 2008-06-18
JP5135504B2 (ja) 2013-02-06
CN101048506A (zh) 2007-10-03
CN102827827A (zh) 2012-12-19

Similar Documents

Publication Publication Date Title
US8216804B2 (en) Orthogonal translation components for the in vivo incorporation of unnatural amino acids
US8394605B2 (en) Genetically programmed expression of proteins containing the unnatural amino acid phenylselenocysteine
US7824893B2 (en) In vivo incorporation of alkynyl amino acids into proteins in eubacteria
JP5385143B2 (ja) 真正細菌における選択的に硫酸化された蛋白質の遺伝的にプログラムされた発現
US20090181858A1 (en) Adding photoregulated amino acids to the genetic code
JP2009538136A (ja) 遺伝的にコードされた蛍光クマリンアミノ酸
AU2011204773B2 (en) Orthogonal translation components for the in vivo incorporation of unnatural amino acids

Legal Events

Date Code Title Description
FG Grant or registration