MX2008011470A - Sistemas para la expresion de componentes de traduccion ortogonales en celulas huesped eubacterianas. - Google Patents

Sistemas para la expresion de componentes de traduccion ortogonales en celulas huesped eubacterianas.

Info

Publication number
MX2008011470A
MX2008011470A MX2008011470A MX2008011470A MX2008011470A MX 2008011470 A MX2008011470 A MX 2008011470A MX 2008011470 A MX2008011470 A MX 2008011470A MX 2008011470 A MX2008011470 A MX 2008011470A MX 2008011470 A MX2008011470 A MX 2008011470A
Authority
MX
Mexico
Prior art keywords
trna
nucleotide sequence
amino acid
promoter
coli
Prior art date
Application number
MX2008011470A
Other languages
English (en)
Inventor
Peter G Schultz
Youngha Ryu
Original Assignee
Scripps Research Inst
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Scripps Research Inst filed Critical Scripps Research Inst
Publication of MX2008011470A publication Critical patent/MX2008011470A/es

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/24Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Enterobacteriaceae (F), e.g. Citrobacter, Serratia, Proteus, Providencia, Morganella, Yersinia
    • C07K14/245Escherichia (G)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/02Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Medicinal Chemistry (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

La invención es concerniente con composiciones y métodos para la producción in vivo de polipéptidos que comprenden uno más aminoácidos no naturales. Específicamente, la invención proporciona sistemas de plásmido para la expresión eubacteriana eficiente de polipéptidos que comprenden uno o más aminoácidos no naturales en posiciones programadas genéticamente.

Description

SISTEMAS PARA LA EXPRESION DE COMPONENTES DE TRADUCCION ORTOGONALES EN CELULAS HUESPED EUBACTERIANAS CAMPO DE LA INVENCION La invención es concerniente con el campo de química de proteínas, por ejemplo, bioquímica de traducción. La invención es concerniente con composiciones y métodos para la producción in vivo de polipéptidos que comprenden uno o más aminoácidos no naturales.
ANTECEDENTES DE LA INVENCION El estudio de estructura y función de proteína ha dependido de las propiedades químicas que están disponibles utilizando los grupos R de los aminoácidos que se presentan de manera estable en la naturaleza. Desafortunadamente, cada organismo conocido, de bacterias a humanos, codifica los mismos veinte aminoácidos comunes (con las raras excepciones de selenocisteína (véase, por ejemplo, Bock et al., (1991), Molecular Microbiology 5:515-20) y pirrolisina (véase, por ejemplo, Srinivasan, et al., (2002), Science 296:1459-62). Esta selección limitada de grupos R ha restringido el estudio de estructura y función de proteína, en donde los estudios están confinados por las propiedades químicas de los aminoácidos que se presentan de manera estable en la naturaleza. Se ha desarrollado una metodología general para la incorporación específica del sitio in vivo de aminoácidos no naturales químicamente diversos con nuevas propiedades físico-químicas y biológicas a proteínas tanto en organismos procariónticos como eucariónticos ( ang et al., Science 292, 498-500 (2001); Chin, et al. Science 301, 964-967 (2003); Wang y Schultz, Angew. Chem. Int. Ed. 44, 34-66 (2005)). Este método depende del par de codón tARN único y correspondiente aminoacil-tARN sintetasa (aaRS o simplemente RS) para cada aminoácido no natural que funciona eficientemente en la traducción de proteínas, pero no reacciona de manera cruzada con cualquiera de los tARN, RS, aminoácidos o codones endógenos en el organismo huésped (esto es, debe ser ortogonal) . El uso de tales pares de tARN-RS ortogonales ha hecho posible codificar genéticamente un gran número de aminoácidos estructuralmente diversos en los que se incluyen aquellos con reactividad química (Wang et al., Proc. Nati. Sci. Acad. USA. 100, 56-61 (2003)) y fotoquímica (Chin et al., Proc. Nati. Acad. Sci. USA 99, 11020-11024 (2002) única; Wu et al., J. Am. Chem. Soc, 126, 14306-14307 (2004)) también como glicosilado (Zhang et al., Science 303, 371-373 (2004)) fluorescente (Wang y Schultz, Angew. Chem. Int. Ed. 44:34-66 (2005)), enlace de metal (Wang y Schultz, Angew. Chem. Int. Ed. 44:34-66 (2005)) y aminoácidos redox activos (Alfonta et al., J. Am. Chem. Soc. 125:14662-14663 (2003)). Un par MjtARN-Tyr (CUA) -MjTyrRS mutante particular ha sido particularmente útil para codificar nuevos aminoácidos en E. coli (Wang y Schultz, Chem. Biol. 8:883-890 (2001) ) . Sin embargo, a pesar del éxito de esta técnica para incorporar un arreglo diverso de aminoácidos no naturales in vivo, la eficiencia del sistema de expresión para la producción de proteínas mutantes que contienen aminoácidos no naturales no ha sido optimizad y la eficiencia de supresión del sistema ortogonal para superar el codón selector puede ser deficiente. Hay necesidad en el arte por desarrollar reactivos para mejorar la eficiencia de supresión de sistemas de traducción ortogonales. La invención descrita en la presente satisface estas y otras necesidades, como se hará evidente después de la revisión de la siguiente revelación.
BREVE DESCRIPCION DE LA INVENCION La invención proporciona sistemas de vector de expresión mejorados útiles para la expresión bacteriana eficiente de proteínas mutantes que comprenden uno o más aminoácidos no naturales en sitios específicos codificados genéticamente por cocones selectores (por ejemplo, codones sin sentido ámbar) . Estos sistemas dan como resultado una eficiencia significativamente mejorada en la incorporación de aminoácidos no naturales a proteínas en eubacterias (por ejemplo, E. coli) . Los nuevos elementos de vector de expresión de la invención son ampliamente compatibles con una variedad de cadenas fundamentales de vector de expresión de E. coli y cepas de E. coli y son también fácilmente adaptados para la expresión de otras proteínas o tARN de interés, además de la expresión de aminoacil-tARN sintetasas ortogonales o tARN supresores ortogonales . Esta tecnología de traducción ortogonal utilizada por la invención es conocida en el arte. Sin embargo, la invención no está limitada en algún aspecto con respecto a los componentes de traducción ortogonales particulares que son usados (esto es, aminoacil-tARN sintetasa ortogonal particular o el tARN supresor ortogonal particular) . Por supuesto, la invención proporciona composiciones y métodos mejorados que encuentran uso amplio en sistemas de vector de expresión bacterianos que no están limitados a la expresión de aminoacil-tARN sintetasas ortogonales o tARN supresores. En algunos aspectos, la invención proporciona varios constructos de ácido nucleico. Estas modalidades incluyen, por ej emplo : Constructo A: Constructos que tienen secuencias de nucleótido de promotor y terminador derivados del gen de tARN de prolina de Escherichia coli y una secuencia de nucleótidos expresable, en donde secuencias de promotor y de terminador están ambas enlazadas operativamente a la secuencia de nucleótidos expresable y en donde la secuencia de nucleótidos expresable es heteróloga a la secuencia de nucleótidos de promotor y terminador. Constructo B: Constructos que tienen una secuencia de nucleótidos de promotor que es un promotor de glnS de E. coli modificado que tiene una secuencia de nucleótidos de SEQ ID NO: 13 y una secuencia de nucleótidos expresable, en donde la secuencia de nucleótidos de promotor de glnS de E. coli modificada está enlazada operativamente a la secuencia de nucleótidos expresable. En algunos aspectos, los elementos de los constructos A y B son usados en el mismo vector, y en donde las secuencias de nucleótidos expresables son diferentes. Constructo C: Constructos que tienen una secuencia de nucleótidos que codifica un tARN ortogonal (0-tARN) y una secuencia de nucleótidos que codifica una aminoacil-tARN sintetasa ortogonal (O-RS) , en donde la O-RS aminoacila preferiblemente el O-tARN con un aminoácido no natural. Constructo D: Constructos que tienen un operon policistrónico que comprende una pluralidad de secuencias de nucleótidos de gen de tARN, en donde por lo menos un gen de tARN está separado de por lo menos un gen de tARN adyacente por un enlazador de polipéptidos heterólogo derivado de un enlazador de polinucleótido que se presenta de manera estable en la naturaleza de un operon de tARN que se presenta de manera estable en la naturaleza.
En algunas modalidades, en el caso en donde lo constructos A, B y C son usados simultáneamente, la secuencia de nucleotidos expresable en A codifica el O-tARN, y en donde la secuencia de nucleotidos expresable en B codifica la O-RS . En algunas modalidades de estos constructos, el gen de tARN de prolina de E. coli es seleccionado de genes de tARN proK, proL y proM de E. coli. En algunas modalidades, las secuencias de promotor y terminador de tARN de prolina de E. coli derivadas de las secuencias de promotor y terminador de proK de E. coli provistas en SEQ ID NOS: 32 (promotor) y 33 (terminador), respectivamente. En algunas modalidades, la secuencia de nucleotidos expresable en el constructo A es un operon policistrónico que comprende una pluralidad de una o más secuencias de nucleotidos. En algunas modalidades, la secuencia de nucleotidos expresable en el constructo A codifica un tARN, por ejemplo, en donde el tARN es derivado de uno o más tARN de Arquea o en donde el tARN es codificado por una secuencia de nucleotidos de SEQ ID NO: 1 (MjtARN-Tyr (CUA) ) . En algunas modalidades, la secuencia de nucleotidos expresable es un operon policistrónico que comprende una pluralidad de secuencias de nucleotidos de SEQ ID NO: 1 (MjtARN-Tyr (CUA) ) . En algunos aspectos, la secuencia de nucleotidos expresable es una pluralidad del operon policistrónico. Cuando se usa el constructo B, la secuencia de nucleotidos expresable puede codificar un polipéptido, por ejemplo, una aminoacil-tARN sintetasa. En algunos aspectos, la secuencia de nucleótidos expresable del constructo B codifica una aminoacil-tARN sintetasa ortogonal (O-RS), en donde la O-RS aminoacila preferiblemente un O-tARN correspondiente con un aminoácido no natural. En algunos aspectos, la O-RS es derivada de una aminoacil-tARN sintetasa de Methanococcus jannaschii , por ejemplo, una tirosil-tARN sintetasa de Methanococcus jannaschii. En estos aspectos, opcionalmente la O-RS tiene una sustitución de ácido aspártico a arginina en posición de aminoácido 286 o en una posición análoga a la posición 286, en relación con la secuencia de aminoácidos de la tirosil-tARN sintetasa de Methanococcus jannaschii tipo silvestre provista en SEQ ID NO: 2 (Mj-tARN-Tyr RS tipo silvestre) . Este constructo de la invención puede ser usado en una célula huésped, por ejemplo, una célula huésped eubacteriana tal como una célula de E. coli. En donde se usa el constructo D, el operon policistrónico puede comprender una pluralidad de enlazadores de polinucleótidos heterólogos idénticos. En algunos de estos casos, por lo menos dos de los enlazadores de polinucleótidos heterólogos son diferentes. Este operon policistrónico de D puede comprender una pluralidad de enlazadores de polinucleótidos heterólogos. En algunas modalidades, el enlazador de polipéptidos heterólogo de D puede comprender un nucleótido de timidina 5' terminal, un nucleótido de adenosina 3' terminal o tanto un nucleótido de timidina 5' terminal y un nucleótido de adenosina 3' terminal. El enlazador de polinucleótidos heterólogo puede ser derivado del enlazador de polinucleótidos que se presenta de manera estable en la naturaleza localizado entre los genes de tARN de Escherichia coli endógenos seleccionados de: valU y valX; íleT y alaT; serV y argV; valV y valW; glyT y thrT; metT y leuW; glnW y etU; hisR y leuT; glnU y glnW; leuP y leuV; glnV y glnX; alaW y alaX; ileü y alaU; ileV y alaV; metU y glnV; glyW y cyst; argX y hisR; y argY y argZ. En algunos aspectos, el enlazador de polinucleótidos heterólogo de D es derivado de la secuencia de nucleótidos de SEQ ID NO: 14 {valU/valX enlazador) o 15 (enlazador de ileT/alaT) . En otros aspectos, la invención proporciona sistemas de traducción para la expresión de un polipéptido de interés que comprende por lo menos un aminoácido no natural en una posición especificada. Estos sistemas de la invención contienen : (a) un aminoácido no natural; (b) un constructo de ácido nucleico, el constructo comprende una secuencia de nucleótidos que codifica un tARN ortogonal (O-tARN) y una secuencia de nucleótidos que codifica una aminoacil-tARN sintetasa ortogonal (O-RS), en donde la O-RS aminoacila preferiblemente el O-tARN con el aminoácido no natural; y (c) un polinucleótido que codifica el polipéptido de interés, el polinucleótido comprende por lo menos un codón selector que es reconocido por el O-tARN, en donde la posición del codón selector en el polinucleótido controla la posición especificada del aminoácido no natural en el polipéptido de interés después de la expresión del polinucleótido para producir el polipéptido. En estos sistemas de la invención, el constructo de ácido nucleico puede comprender uno o más aspectos enlistados como sigue: (1) secuencias de nucleótidos de promotor y terminador derivadas de un gen de tARN de prolina de Escherichia coli, en donde las secuencias de promotor y terminador están ambas enlazadas operativamente a la secuencia de nucleótidos que comprende o codifica el O-tARN, y en donde el O-tARN es heterólogo a las secuencias de nucleótidos de promotor y terminador; (2) una secuencia de nucleótidos correspondiente a un promotor de glnS de E. coli modificado que tiene una secuencia de nucleótidos de SEQ ID NO: 13, en donde la secuencia de nucleótidos de glnS de E. coli modificada está enlazada operativamente a la secuencia de nucleótidos que codifica la 0-RS; o (3) un operon policistrónico que comprende una pluralidad de las secuencias de nucleótidos de gen de O-tARN, en donde por lo menos un gen de O-tARN está separado de por lo menos un gen de O-tARN adyacente por un enlazador de polinucleótidos heterólogos derivado de un enlazador de polinucleótidos que se presenta de manera estable en la naturaleza de un operon de tARN que se presenta de manera estable en la naturaleza. En estos sistemas, el gen de tARN de prolina de E. coli puede ser seleccionado de los genes de tARN proK, proL y proM de E. coli. Las secuencias de promotor y terminador de tARN de prolina de E. coli pueden ser derivadas de las secuencias de promotor y terminador de proK de E. coli provistas en SEQ ID NOS: 32 (promotor) y 33 (terminador), respectivamente. El operon policistrónico puede comprender una pluralidad de enlazadores de polinucleótidos heterólogos idénticos, por ejemplo, en donde por lo menos dos de los enlazadores de polinucleótidos heterólogos son diferentes. En estos sistemas, el enlazador de polinucleótidos heterólogo puede comprender un nucleótido de timidina 5' terminal o un nucleótido de adenosina 3' terminal, o tanto un nucleótido de timidina 5' terminal y un nucleótido de adenosina 3' terminal. El enlazador de polinucleótidos heterólogo puede ser derivado de un enlazador de polinucleótidos que se presenta de manera estable en la naturaleza localizado entre los genes de tARN de Escherichia coli endógenos seleccionados de: valU y valX; ileT y alaT; serV y argV; valV y valW; glyT y thrT; metT y leuW; glnW y metU; hisR y leuT; glnU y glnW; leuP y leuV; glnV y glnX; alaW y alaX; ileU y alaU; ileV y alaV; metU y glnV; glyW y cyst; argX y hisR; y argY y argZ. En algunos aspectos, el enlazador de polinucleótidos heterólogo es derivado de la secuencia de nucleótidos de SEQ ID NO: 14 (enlazador valU/ valX) o 15 (enlazador ileT/alaT) . En estos sistemas, el O-tARN puede ser derivado de uno o más tARN de Arquea. En algunos aspectos del sistema, la secuencia de nucleótidos que codifica un O-tARN es un operon policistrónico que comprende una pluralidad de secuencias de nucleótidos que codifican un O-tARN. En algunos aspectos, la secuencia de nucleótidos que codifica un O-tARN comprende una secuencia de nucleótidos de SEQ ID NO: 1 (MjtARN-Tyr (CUA) ) . En otros aspectos del sistema, la secuencia de nucleótidos que codifica un O-tARN es un operon policistrónico que comprende una pluralidad de la secuencia de nucleótidos de SEQ ID NO: 1 (MjtARN-Tyr (CUA) ) . En otros aspectos, el sistema de traducción puede utilizar una O-RS que es derivada de una aminoacil-tARN sintetasa de Methanococcus jannaschii , por ejemplo, una tirosil-tARN sintetasa de Methanococcus jannaschii . En algunos aspectos, esta O-RS tiene una sustitución de ácido aspártico a arginina en posición de aminoácido 286 o en una posición análoga a la posición 286, en relación con la secuencia de aminoácidos de tirosil-tARN sintetasa de Methanococcus jannaschii tipo silvestre provista en SEQ ID NO: 2 (Mj-tARN yr RS tipo silvestre) . En algunos aspectos de este sistema, los componentes están contenidos en una célula huésped, por ejemplo, una célula huésped eubacteriana tal como una célula de E. coli. En otros aspectos, la invención proporciona métodos para producir, en una célula huésped, un polipéptido de interés que comprende un aminoácido no natural en una posición especificada. Estos métodos tienen las siguientes etapas: (a) proporcionar: (i) un aminoácido no natural; (ii) un constructo de ácido nucleico que comprende una secuencia de nucleótidos que codifica una tARN ortogonal (O-tARN) y una secuencia de nucleótidos que codifica una amirioacil-tARN sintetasa ortogonal (O-RS), en donde la O-RS aminoacila preferiblemente el O-tARN con el aminoácido no natural; y (iii) un polinucleótido que codifica el polipéptido de interés, el polinucleótido comprende por lo menos un codón selector que es reconocido por el O-tARN, y en donde la posición del codón selector se correlaciona con la posición especificada del aminoácido no natural en el polipéptido de interés; (iv) una célula huésped que comprende (i), (ii) y (iii); y (b) cultivar la célula huésped; y (c) incorporar el aminoácido no natural en la posición especificada en el polipéptido durante la traducción del polipéptido en la célula huésped, produciendo mediante esto el polipéptido de interés que comprende el aminoácido no natural en la posición especificada. En estos métodos, el O-tARN puede ser derivado de uno o más tARN de Archaea . El constructo usado en los métodos puede utilizar un operon policistrónico que comprende una pluralidad de secuencias de nucleótidos que codifican una o más especies de O-tARN. El O-tARN usado puede comprender una secuencia de nucleótidos de SEQ ID NO: 1 (MjtARN-Tyr (CUA) ) o alternativamente, un operon policistrónico que comprende una pluralidad de la secuencia de nucleótidos de SEQ ID NO: 1 ( jtARN-Tyr (CUA) ) . En algunos aspectos de este método, la O-RS puede ser derivada de una aminoacil-tARN sintetasa de Methanococcus jannaschii , por ejemplo, una tirosil-tARN sintetasa de Methanococcus jannaschii . En algunos aspectos, la O-RS tiene una sustitución de ácido aspártico a arginina en posición de aminoácido 286 o en una posición análoga a la posición 286, en relación con la secuencia de aminoácidos de tirosil-tARN sintetasa de Methanococcus jannaschii tipo silvestre provista en SEQ ID NO: 2 (Mj-tARNTyrRS tipo silvestre) . Estos métodos para producir los polipéptidos pueden utilizar una variedad de constructos de ácido nucleico, en donde los constructos pueden usar cualquiera de: (I) secuencias de nucleótidos de promotor y terminador derivadas de un gen de tARN de prolina de Escherichia coli, en donde las secuencias de promotor y terminador están ambas enlazadas operativamente a la secuencia de nucleótidos que codifica el O-tARN, y en donde la secuencia de nucleótidos que codifica el O-tARN es heteróloga a las secuencias de promotor y de terminador; (II) una secuencia de nucleótidos de promotor correspondiente a un promotor de glnS de E. coli modificada que tiene una secuencia de nucleótidos de SEQ ID NO: 13, en donde la secuencia de nucleótidos de glnS de E. coli modificada está enlazada operativamente a la secuencia de nucleótidos que codifica la O-RS; y (III) un operon policistrónico que comprende una pluralidad de secuencias de nucleótidos de gen de O-tARN, en donde por lo menos un gen de O-tARN está separado de por lo menos un gen de O-tARN adyacente por un enlazador de polinucleótidos heterólogo derivado de un enlazador de polinucleótidos que se presentan de manera estable en la naturaleza de un operon de tARN que se presentan de manera estable en la naturaleza. En donde se usa (I), el tARN de prolina de E. coli puede ser seleccionado de tARN proK, proL y proM de E. coli. En donde se usa proK de E. coli, se pueden utilizar SEQ ID NOS: 32 (promotor) y 33 (terminador). En donde se usa un operon policistrónico de (III), una pluralidad de enlazadores de polinucleótidos heterólogos idénticos pueden ser utilizados, alternativamente en donde por lo menos dos de los enlazadores de polinucleótidos heterólogos son diferentes. En algunos aspectos, el operon policistrónico de (III) utiliza un nucleótido de timidina 5' terminal, un nucleótido de adenosina 3' terminal o ambos un nucleótido de timidina 5' terminal y un nucleótido de adenosina 3' terminal. Además, el enlazador de polinucleótidos heterólogo puede ser derivado del enlazador de polinucleótidos que se presenta de manera estable en la naturaleza localizado entre los genes de tARN de Escherichia coli endógenos seleccionados de: valU y valX; ileT y alaT; serV y argV; valV y valW; glyT y thrT; metT y leuW; glnW y metU; hisR y leuT; glnU y glnW; leuP y leuV; glnV y glnX; alaW y alaX; ileU y alaU; ileV y alaV; metU y glnV; glyW y cyst; argX y hisR; y argY y argZ. En particular, la secuencia de nucleótidos de SEQ ID NO: 14 (enlazador valU/valX) o 15 (enlazador HeT/alaT) pueden ser usadas. En algunos aspectos, la célula huésped es una célula huésped eubacteriana, por ejemplo, una célula huésped de Escherichia coli . En otros aspectos, la invención proporciona métodos para producir proteínas que tienen aminoácidos no naturales. Estos métodos utilizan nuevos sistemas de vector de la invención, haciendo posible la producción mejorada de las proteínas contienen los aminoácidos no naturales. Estos métodos para producir un polipéptido de interés que comprende un aminoácido no natural en una posición especificada se llevan a cabo en una célula huésped, en donde las etapas del método incluyen: (a) proporcionar: (i) un aminoácido no natural; (ii) un constructo de ácido nucleico que comprende una secuencia de nucleótidos que codifica un tARN ortogonal (0-tARN ) ; (iii) un constructo de ácido nucleico que comprende una secuencia de nucleótidos que codifica una aminoacil-tARN sintetasa ortogonal (0-RS) , en donde la 0-RS aminoacila preferiblemente el 0-tARN con el aminoácido no natural; (iv) un polinucleótido que codifica el polipéptido de interés, el polinucleótido comprende por lo menos un codón selector que es reconocido por el 0-tARN, y en donde la posición del codón selector se correlaciona con la posición especificada del aminoácido no natural en el polipéptido de interés; y, (v) una célula huésped que comprende (i), (ii), (iii) y (iv) . Estos métodos requieren que los constructos de ácido nucleico de (ii) y (iii) comprendan colectivamente por lo menos uno de los siguientes tres aspectos: (I) secuencias de nucleótidos de promotor y terminador derivadas de un gen de tARN de prolina de Escherichia coli, en donde las secuencias de promotor y terminador están ambas enlazada operativamente a la secuencia de nucleótidos que codifica el O-tARN, y en donde la secuencia de nucleótidos que codifica el O-tARN es heteróloga a las secuencias de promotor y terminador; (II) un secuencia de nucleótidos promotora correspondiente a un promotor de glnS de E. coli modificada que tiene una secuencia de nucleótidos de SEQ ID NO: 13, en donde la secuencia de nucleótidos de glnS de E. coli modificada está enlazada operativamente a la secuencia de nucleótidos que codifica la O-RS; y (III) un operon policistrónico que comprende una pluralidad de secuencias de nucleótidos de gen de O-tARN, en donde por lo menos un gen de O-tARN está separado de por lo menos uno gen de O-tARN adyacente por un enlazador de polinucleótidos heterólogo derivado de un enlazador de polinucleótidos que se presenta de manera estable en la naturaleza de un operón de tARN que se presenta de manera estable en la naturaleza. El método se lleva a cabo al (b) cultivar la célula huésped; y (c) incorporar el aminoácido no natural en la posición especificada en el polipéptido durante la traducción del polipéptido en la célula huésped, produciendo mediante esto el polipéptido de interés que comprende el aminoácido no natural en la posición especificada.
Opcionalmente , la secuencia de nucleótidos que codifica un O-tARN es derivada de uno o más tARN de Archaea. El O-tARN puede ser provisto en un operon policistrónico que comprende una pluralidad de secuencias de nucleótidos que codifican una o más especies de O-tARN. En algunos aspectos, la secuencia de nucleótidos que codifica un O-tARN comprende una secuencia de nucleótidos de SEQ ID NO: 1 (MjtARN-Tyr (CUA) ) . Un operon policistrónico puede utilizar opcionalmente una pluralidad de la secuencia de nucleótidos de SEQ ID NO: 1 (MjtARN-Tyr (CUA) ) . En otros aspectos, la O-RS es derivada de una aminoacil-tARN sintetasa de Methanococcus jannaschii , tal como la tirosil-tARN sintetasa de Methanococcus jannaschii. Opcionalmente, la O-RS tiene una sustitución de ácido aspártico a arginina en posición de aminoácido 286 o en una posición análoga a la posición 286, en relación con la secuencia de aminoácidos de tirosil-tARN sintetasa de Methanococcus jannaschii de tipo silvestre provista en SEQ ID NO: 2 (Mj-tARNTyrRS tipo silvestre) . En otras modalidades de estos métodos, el constructo de ácido nucleico de (I) comprende un tARN de prolina de E. coli seleccionado de tARN proK, proL y proM de E. coli. Además, el constructo de (I) puede usar las secuencias de promotor y de terminador de proK de E. coli provistas en SEQ ID NOS: 32 (promotor) y 33 (terminador), respectivamente.
En otras modalidades de método, el constructo de ácido nucleico de (III) utiliza una pluralidad de enlazadores de polinucleotidos heterologos idénticos. Opcionalmente , por lo menos dos de los enlazadores de polinucleótidos heterologos son diferentes . Opcionalmente, el operon policistrónico de (III) en estos métodos usa un enlazador de polinucleótidos heterólogo que comprende un nucleótido de timidina 5' terminal, un nucleótido de adenosina 3' terminal, o tanto un nucleótido de timidina 5' terminal como un nucleótido de adenosina 3' terminal. El enlazador de polinucleótidos heterólogo usado en la presente puede ser derivado de un enlazador de polinucleótidos que se presentan de manera estable en la naturaleza localizado entre los genes de tARN de Escherichia coli endógenos seleccionados de: valU y valX; ileT y alaT; serV y argV; valV y valW; glyT y thrT; metT y leuW; glnW y metU; hisR y leuT; glnU y glnW; leuP y leuV; glnV y glnX; alaW y alaX; ileU y alaU; ileV y alaV; metU y glnV; glyW y cyst; argX y hisR; y argY y argZ. Por ejemplo, el enlazador de polinucleótidos heterólogo puede ser derivado de la secuencia de nucleótidos de SEQ ID NO: 14 (enlazador valU/valX) o 15 (enlazador ileT/alaT) . Opcionalmente, estos métodos se llevan a cabo en una célula huésped eubacteriana tal como Escherichia coli .
En otros aspectos, la invención también proporciona sistemas de traducción para la expresión de un polipéptido de interés que tiene por lo menos un aminoácido no natural en una posición especificada. Esencialmente, estos sistemas incluyen: (a) un aminoácido no natural; (b) un constructo de ácido nucleico, el constructo comprende una secuencia de nucleótidos que codifica un tARN ortogonal (O-tARN) y una secuencia de nucleótidos que codifica una aminoacil-tARN sintetasa ortogonal (O-RS) , en donde la O-RS aminoacila preferiblemente el O-tARN con el aminoácido no natural; y (c) un polinucleótido que codifica el polipéptido de interés, el polinucleótido comprende por lo menos un codón selector que es reconocido por el O-tARN, en donde la posición del codón selector en el polinucleótido controla la posición especificada del aminoácido no natural en el polipéptido de interés después de expresión del polinucleótido para producir el polipéptido. Opcionalmente , estos sistemas son integrados en una célula huésped. En todavía otras modalidades, la invención proporciona métodos para producir un polipéptido de interés que tiene un aminoácido no natural en una posición especificada. Esencialmente, estos métodos usan las etapas de: (a) proporcionar un sistema de traducción, el sistema de traducción comprende: (i) un aminoácido no natural; (ii) un constructo de ácido nucleico que comprende una secuencia de nucleótidos que codifica un tARN ortogonal (0-tARN) y una secuencia de nucleótidos que codifica una aminoacil-tARN sintetasa ortogonal (0-RS) , en donde la 0-RS aminoacila preferiblemente el 0-tARN con el aminoácido no natural; y (iii) un polinucleótido que codifica el polipéptido de interés, el polinucleótido comprende por lo menos un codón selector que es reconocido por el 0-tARN, y en donde la posición del codón selector se correlaciona con la posición especificada del aminoácido no natural en el polipéptido de interés ; (iv) una célula huésped que comprende (i) , (ii) y (iü) - Estos métodos requieren además (b) cultivo de la célula huésped; y (c) incorporar el aminoácido no natural en la posición especificada en el polipéptido durante la traducción del polipéptido en la célula huésped, produciendo mediante esto el polipéptido de interés que comprende el aminoácido no natural en la posición especificada.
DEFINICIONES Antes de describir la invención en detalle, se comprenderá que esta invención no está limitada a los sistemas biológicos particulares, que pueden por supuesto variar. También se comprenderá que la terminología usada en la presente es por el propósito de describir modalidades particulares solamente y es no pretende ser limitante. Como se usa en esta especificación y las reivindicaciones adjuntas, las formas singulares "un", "uno" y "el" incluyen referencias plurales a no ser que el contexto lo determine claramente de otra manera. Así, por ejemplo, la referencia a "una célula" incluye combinaciones de dos o más células; la referencia a "un polinucleótido" incluye como materia práctica, muchas copias de aquel polinucleótido. A no ser que se defina en la presente y a continuación en el resto de la especificación, todos los términos técnicos y científicos usados en la presente tienen el mismo significado como son entendidos comúnmente por aquel de habilidad ordinaria en el arte por la cual la invención es concerniente. Al describir y reivindicar la presente invención, la siguiente terminología será usada de acuerdo con las definiciones resumidas a continuación. Ortogonal : Como se usa en la presente, el término "ortogonal" se refiere a una molécula (por ejemplo, un tARN ortogonal (O-tARN) y/o una aminoacil-tARN sintetasa ortogonal (O-RS)) que funciona con componentes endógenos de una célula con eficiencia reducida en comparación con una molécula correspondiente que es endógena a la célula o sistema de traducción o que falla para funcionar con componentes endógenos de la célula. En el contexto de tARN y aminoacil-tARN sintetasas, ortogonal se refiere a la incapacidad o eficiencia reducida, por ejemplo, menos de 20% de eficiencia, menos de 10% de eficiencia, menos de 5% de eficiencia o menos de 1% de eficiencia, de un tARN ortogonal para funcionar con una tARN sintetasa endógena en comparación con un tARN endógeno para funcionar con la tARN sintetasa endógena o de una aminoacil-tARN sintetasa ortogonal para funcionar con un tARN endógeno en comparación con una tARN sintetasa endógena para funcionar con el tARN endógeno. La molécula ortogonal carece de funcionalidad normal a molécula complementaria endógena en la célula. Por ejemplo, un tARN ortogonal en una célula es aminoacilado por cualquier RS endógena de la célula con eficiencia reducida o aún eficiencia cero, cuando se comparación con la aminoacilación de un tARN endógeno mediante la RS endógena. En otro ejemplo, una RS ortogonal aminoacila cualquier tARN endógeno de una célula de interés con eficiencia reducida o aún eficiencia cero, en comparación con la aminoacilación del tARN endógeno por una RS endógena. Una segunda molécula ortogonal puede ser introducida a la célula que funciones con la primera molécula ortogonal. Por ejemplo, un par de tARN/RS ortogonal incluye componentes complementarios introducidos que funcionan conjuntamente en la célula con una eficiencia (por ejemplo, 45% de eficiencia, 50% de eficiencia, 60% de eficiencia, 70% de eficiencia, 75% de eficiencia, 80% de eficiencia, 90% de eficiencia, 95% de eficiencia o 99% o más eficiencia) en comparación con aquella de un control, por ejemplo, un par de tARN/RS endógeno correspondiente o un par ortogonal activo (por ejemplo, un par de tirosil tARN/RS ortogonal). Tirosil-tARN ortogonal: Como se usa en la presente, un tirosil-tARN ortogonal ( tirosil-O-tAR ) es un tARN que es ortogonal a un sistema de traducción de interés, en donde el tARN es: (1) idéntico o sustancialmente similar a un tirosil-rARN que se presentan de manera estable en la naturaleza, (2) derivado de un tirosil-tARN que se presentan de manera estable en la naturaleza mediante mutagénesis natural o artificial, (3) derivado de cualquier proceso que toma una secuencia de una secuencia de tirosil-tARN tipo silvestre o mutante de (1) o (2) en cuenta, (4) homólogo a un tirosil-tARN tipo silvestre o mutante; (5) homólogo a cualquiera tARN ejemplar que está diseñado como sustrato para una tirosil-tARN sintetasa, por ejemplo, sintetasas de SEQ ID NOS: 2, 4, 6, 8 ó 10, (6) una variante conservadora de cualquier tARN ejemplar que está diseñado como sustrato para una tirosil-tARN sintetasa en, por ejemplo, el 0-tARN de SEQ ID NO: 1. El tirosil-tARN puede existir cargado con un aminoácido o en un estado sin cargar.
También se comprenderá que un "tirosil-O-tARN" está opcionalmente cargado (aminoacilado) por una sintetasa cognata con un aminoácido diferente a tirosina o leucina-, respectivamente, por ejemplo, con un aminoácido no natural. Por supuesto, se apreciará que un tirosil-O-tARN de la invención es usado ventajosamente para insertar esencialmente cualquier aminoácido, ya sea natural o artificial, a un polipéptido creciente, durante la traducción, en respuesta a un codón selector . Tirosil aminoácido sintetasa ortogonal: Como se usa en la presente, una tirosil aminoácido sintetasa ortogonal ( tirosil-O-RS ) es una enzima que aminoacila preferiblemente el tirosil-O-tARN con un aminoácido en un sistema de traducción de interés. El aminoácido con la tirosil-O-RS carga el tirosil-O-tARN puede ser cualquier aminoácido, ya sea natural, no natural o artificial y no está limitado en la presente. La sintetasa es opcionalmente la misma como u homologa con una tirosil aminoácido sintetasa que se presentan de manera estable en la naturaleza o la misma como u homologa con una sintetasa diseñada como una 0-RS en, por ejemplo, SEQ ID NOS: 4, 6, 8 ó 10. Por ejemplo, la O-RS puede ser una variante conservadora de una tirosil-O-RS de por ejemplo, SEQ ID NOS: 4, 6, 8 ó 10 y/o puede ser por lo menos 50%, 60%, 70%, 80%, 90%, 95%, 98%, 99% o más idéntica en secuencia a una O-RS de por ejemplo, SEQ ID NOS: 4, 6, 8 ó 10.
Cognato: el término "cognato" se refiere a componentes que funcionan conjuntamente, por ejemplo, un tARN ortogonal y una aminoacil-tARN sintetasa ortogonal. Los componentes pueden también ser denominados como complementarios . Aminoacila preferiblemente: como se usa en la presente con referencia sistemas de traducción ortogonales, una O-RS "aminoacila preferiblemente" un tARN cognato cuando la 0-RS carga el 0-tARN con un aminoácido más eficientemente que lo carga con cualquier tARN endógeno en un sistema de expresión. Esto es, cuando el 0-tARN y cualquier tARN endógeno dado están presentes en un sistema de traducción en proporciones molares aproximadamente iguales, la O-RS cargará el 0-tARN más frecuentemente que cargará el tARN endógeno. Preferiblemente, la proporción relativa de 0-tARN cargado por la O-RS al tARN endógeno cargado por la O-RS es alta, dando como resultado preferiblemente que la O-RS cargue el 0-tARN exclusiva o casi exclusivamente, cuando el 0-tARN y el tARN endógeno están presentes en concentraciones molares iguales en el sistema de traducción. La proporción relativa entre 0-tARN y tARN endógeno que es cargado por la O-RS, cuando el 0-tARN y O-RS están presentes en concentraciones molares iguales, es mayor de 1:1, preferiblemente por lo menos aproximadamente 2:1, más preferiblemente 5:1, todavía más preferiblemente 10:1, todavía más preferiblemente 20:1, todavía más preferiblemente 50:1, todavía más preferiblemente 75:1, todavía más preferiblemente 95:1, 98:1, 99:1, 100:1, 500:1, 1,000:1, 5,000:1 o más alta. La O-RS "aminoacila preferiblemente un O-tARN con un aminoácido no natural" cuando (a) la O-RS aminoacila preferiblemente el O-tARN en comparación con un tARN endógeno y (b) en donde aquella aminoacilación es específica por el aminoácido no natural, en comparación con la aminoacilación del O-tARN por la O-RS con cualquier aminoácido natural. Esto es, cuando los aminoácidos no naturales y naturales están presentes en cantidades molares iguales en un sistema de traducción que comprende la O-RS y O-tARN, la O-RS cargará el O-tARN con el aminoácido no natural más frecuentemente que con el aminoácido natural. Preferiblemente, la proporción relativa de O-tARN cargado con el aminoácido no natural a O-tARN cargado con el aminoácido natural es alta. Más preferiblemente, O-RS carga el O-tARN exclusiva o casi exclusivamente, con el aminoácido no natural. La proporción relativa entre la carga del O-tARN con el aminoácido no natural y la carga del O-tARN con el aminoácido natural, cuando tanto los aminoácidos naturales como no naturales están presentes en el sistema de traducción en concentraciones molares iguales, es mayor de 1:1, preferiblemente por lo menos aproximadamente 2:1, más preferiblemente 5:1, todavía más preferiblemente 10:1, todavía más preferiblemente 20:1, todavía más preferiblemente 50:1, todavía más preferiblemente 75:1, todavía más preferiblemente 95:1, 98:1, 99:1, 100:1, 500:1, 1,000:1, 5,000:1 o más alta. Codón selector: El término "codón selector" se refiere a codones reconocidos por el O-tARN en el proceso de traducción y no reconocidos por un tARN endógeno. El bucle anti-codón de O-tARN reconoce el codón selector en el mARN e incorpora su aminoácido, por ejemplo, un aminoácido no natural, en este sitio en el polipéptido. Codones selectores pueden incluir, por ejemplo, codones sin sentido, tales como codones de retención, por ejemplo, codones ámbar, ocre y ópalo; codones de cuatro o más bases; codones raros; codones derivados de pares de bases naturales o no naturales y/o los semejantes. tARN supresor: Un tARN supresor es un tARN que altera la lectura de un ARN mensajero (mARN) en un sistema de traducción dado, por ejemplo al proporcionar un mecanismo para incorporar un aminoácido a una cadena de polipéptidos en respuesta a un codón selector. Por ejemplo, un tARN supresor puede leer a través, por ejemplo de un codón de retención (por ejemplo, un codón ámbar, ocre u ópalo) , un codón de cuatro bases, un codón raro, etc. Actividad de supresión: Como se usa en la presente, el término "actividad de supresión" se refiere en general a la habilidad de un tARN (por ejemplo, un tARN supresor) para permitir la lectura de traducción de un codón (por ejemplo, un codón selector que es un codón ámbar o un codón de 4 o más bases) que de otra manera daría como resultado la terminación de traducción o mala traducción (por ejemplo, desplazamiento de cuadro) . La actividad de supresión de un tARN supresor puede ser expresada como porcentaje de actividad de lectura de traducción observada en comparación con un segundo tARN supresor o en comparación con un sistema de control, por ejemplo un sistema de control que carece de una O-RS. La presente invención proporciona varios métodos mediante los cuales la actividad de supresión puede ser cuantificada . El por ciento de supresión de un O-tARN particular y O-RS contra un codón selector (por ejemplo, un codón ámbar) de interés se refiere al porcentaje de actividad de un marcador de prueba expresado dado (por ejemplo, LacZ), que incluye un codón selector, en un ácido nucleico que codifica el marcador de prueba expresado, en un sistema de traducción de interés, en donde el sistema de traducción de interés incluye una O-RS y un O-tARN, en comparación con un constructo de control positivo, en donde el control positivo carece de O-tARN, la O-RS y el codón selector. Así, por ejemplo, si un constructo de marcador de control positivo activo que carece de un codón selector tiene actividad observada de X en un sistema de traducción dado, en unidades relevantes al análisis de marcador en cuestión, entonces el por ciento de supresión de un constructo de prueba que comprende el codón selector es el porcentaje de X que el constructo de marcador de prueba exhibe bajo esencialmente las mismas condiciones ambientales como el marcador de control positivo fue expresado bajo, excepto que el constructo marcador de prueba es expresado en un sistema de traducción que incluye el O-tARN y la O-RS. Comúnmente, el sistema de traducción que expresa el marcador de prueba también incluye un aminoácido que es reconocido por la O-RS y O-tARN. Opcionalmente , la medición del por ciento de supresión puede ser refinada por comparación del marcador de prueba con un constructo de marcador de control "de fondo" o "negativo", que incluye el mismo codón selector como el marcador de prueba, pero en un sistema que no incluye el O-tARN, O-RS y/o un aminoácido relevante reconocido por el O-tARN y/o O-RS. Este control negativo es útil para normalizar mediciones de por ciento de supresión para tomar en cuenta los efectos de señal de fondo del marcador en el sistema de traducción de interés. La eficiencia de supresión puede ser determinada mediante cualquiera de un número de análisis conocidos en el arte. Por ejemplo, se puede usar un análisis reportero de ß-galactosidasa , por ejemplo, un plásmido lacZ derivado (en donde el constructo tiene un codón selector en la secuencia de ácido nucleico de lacZ) es introducido a células de un organismo apropiado (por ejemplo, un organismo en donde los componentes ortogonales pueden ser usado) junto con plásmidos que comprende un O-tARN de la invención. Una sintetasa cognata puede también ser introducida (ya sea como un polipéptido o un polinucleótido que codifica la sintetasa cognata cuando es expresado) . Las células son cultivadas en un medio a una densidad deseada, por ejemplo a una OD60o de aproximadamente 0.5 y se efectúan análisis de ß-galactosidasa , por ejemplo utilizando el equipo de análisis de ß-galactosidasa BetaFluor™ (Novagen) . El por ciento de supresión puede ser calculado como el porcentaje de actividad para una muestra en relación con un control comparable, por ejemplo el valor observado del constructo de lacZ derivado, en donde el constructo tiene un codón de sentido correspondiente en posición deseada en lugar de un codón selector . Sistema de traducción: el término "sistema de traducción" se refiere a componentes que incorporan un aminoácido a una cadena de polipéptidos creciente (proteina). Los componentes de un sistema de traducción pueden incluir, por ejemplo ribosomas, tARN, sintetasa, mARN y los semejantes. El O-tARN y/o la O-RS de la invención pueden ser agregados a o ser parte de un sistema de traducción in vitro o in vivo, por ejemplo en una célula no eucarióntica , por ejemplo una eubacteria (tal como E. coli) o en una célula eucarióntica, por ejemplo una célula de levadura, una célula mamifera, una célula de planta, una célula de algas, una célula de hongo, una célula de insecto y/o los semejantes.
Aminoácido no natural: Como se usa en la presente, el término "aminoácido no natural" se refiere a cualquier aminoácido, aminoácido modificado y/o análogo de aminoácido, que no es uno de los 20 aminoácido que se presentan de manera estable en la naturaleza o seleno cisteina o pirrolisina. Por ejemplo, los aminoácidos no naturales p-benzoil-L-fenilalanina (Bpa), para-acetil-L-fenilalanina (pAcPhe), para-azido-L-fenilalanina (pAzPhe) y para-yodo-L-fenilalanina (plPhe) encuentran uso con la invención. En respuesta a: Como se usa en la presente, el término "en respuesta a" se refiere al proceso en el cual un 0-tARN de la invención reconoce un codón selector y modera la incorporación del aminoácido no natural, que es acoplado al tARN, a la cadena de polipéptidos creciente. Polipéptido : Un polipéptido es cualquier oligómero de aminoácidos (natural o no natural o una combinación de los mismos) de cualquier longitud, comúnmente pero no exclusivamente unido por enlace de péptido covalente. Un polipéptido puede ser de cualquier fuente, por ejemplo un polipéptido que se presentan de manera estable en la naturaleza, un polipéptido producido mediante técnicas genéticas moleculares recombinantes , un polipéptido de una célula o sistema de traducción o un polipéptido producido mediante medios sintéticos libres de células. Un polipéptido está caracterizado por su secuencia de aminoácidos, por ejemplo, la estructura primaria de sus aminoácidos componentes. Como se usa en la presente, la secuencia de aminoácidos de un polipéptido no está limitada a secuencia de plena longitud, sino que pueden ser secuencias parciales o secuencias completas. Además, no se pretende que un polipéptido esté limitado a poseer o no poseer alguna actividad biológica particular. Como se usa en la presente, el término "proteína" es sinónimo con polipéptido. El término "péptido" se refiere a un polipéptido pequeño, por ejemplo pero no limitado a, de 2-25 aminoácidos de longitud. Variante conservadora: Como se usa en la presente, el término "variante conservadora", en el contexto de un componente de traducción, se refiere a un componente de traducción, por ejemplo un 0-tARN de variante conservadora o una O-RS de variante conservadora, que funciona de manera similar a un componente base que la variante conservadora es similar, por ejemplo un O-tARN o O-RS, que tiene variaciones en la secuencia en comparación con un 0-tARN u O-RS de referencia. Por ejemplo, una O-RS o una variante conservadora de aquella 0-RS, aminoacilará un 0-tARN cognato con un aminoácido no natural, por ejemplo un aminoácido que comprende una porción de N-acetilgalactosamina . En este ejemplo, la O-RS y la O-RS de variante conservadora no tienen las mismas secuencias de aminoácidos. La variante conservadora puede tener por ejemplo una variación, dos variaciones, tres variaciones, cuatro variaciones o cinco o más variaciones en secuencia, en tanto que la variante conservadora todavía sea complementaria con el O-tARN u O-RS correspondiente. En algunas modalidades, una O-RS de variante conservadora comprende una o más sustituciones de aminoácido conservadoras en comparación con la O-RS de la cual fue derivada. En algunas modalidades, una O-RS de variante conservadora comprende una o más sustituciones de aminoácidos conservadoras en comparación con la O-RS de la cual fue derivada y además retiene la actividad biológica de O-RS; por ejemplo, una O-RS variante conservadora que retiene por lo menos 10% de la actividad biológica de la molécula de O-RS original de la cual fue derivada o alternativamente, por lo menos 20%, por lo menos 30% o por lo menos 40%. En algunas modalidades preferidas, la O-RS de variante conservadora retiene por lo menos 50% de la actividad biológica de la molécula de O-RS original de la cual fue derivada. Las sustituciones de aminoácido conservadoras de una O-RS de variante conservadora se pueden presentar en cualquier dominio de la O-RS, en las que se incluyen la actividad de enlace de aminoácido . Polinucleótido o ácido nucleico: Los términos "ácido nucleico", "secuencia de ácido nucleico", "secuencia de nucleótidos", "oligonucleótido", "polinucleótido" o "molécula de ácido nucleico" o términos similares como se usa en la presente se refieren a oligómeros de bases enlazadas comúnmente por una cadena fundamental de azúcar-fosfato, tales como oligonucleótidos o polinucleótidos y fragmentos o porciones de los mismos y a ADN o ARN de origen genómico o sintético que pueden ser de una sola hebra o de doble hebra y representan una hebra de sentido o hebra antisentido. Los términos ácido nucleico, polinucleótido y nucleótido también incluyen específicamente ácidos nucleicos compuestos de bases diferentes a las cinco bases que se presentan biológicamente (esto es, adenina, guanina, timina, citocina y uracilo) , y también incluyen ácidos nucleicos que tienen estructuras de cadena fundamental no naturales, tales como moléculas de PNA. Se dice que las moléculas de ácido nucleico, (por ejemplo, ADN o ARN) tienen "extremos 5'" y "extremos 3'" debido a que los mononucleótidos se hacen reaccionar para elaborar oligonucleótidos o polinucleótidos de tal manera que el fosfato 5' de un anillo de pentosa de mononucleótido está anexado al oxígeno 3 ' de su vecino en una dirección vía un enlace de fosfodiéster . Así, un polinucleótido tendrá comúnmente un "extremo 5'" que comprende un fosfato 5' y un "extremo 3'" que comprende un oxígeno 3'. Una secuencia de polinucleótidos, aún si está interna a un ácido nucleico más grande, también se puede decir que tiene direccionalidad 5' y 3'. Ya sea en una molécula de ADN lineal o circular, los elementos discretos son denominados como "corriente arriba" o 5' de los elementos "corriente abajo" o 3'. Esta terminología refleja el hecho de que la transcripción procede de manera 5' a 3' a lo largo de la hebra de ADN. Gen : Como se usa en la presente, el término "gen" se refiere más en general a una combinación de elementos de polinucleótido, que cuando son enlazados operativamente ya sea de manera natural o recombinante , proporcionan algún producto o función. El término "gen" será interpretado ampliamente en la presente, abarcando mARN, cADN, cRNA y formas de ADN genómicas de un gen. En algunos casos, un gen es heredable. En algunos aspectos, genes que comprenden secuencias de codificación (por ejemplo, un "cuadro de lectura abierta" o "región de codificación") necesarias para la producción de un polipéptido, en tanto que en otros aspectos, los genes no codifican un polipéptido. Ejemplos de genes que no codifican polipéptidos incluyen genes de ARN ribosomales (rARN) y genes de ARN de transferencia (tARN) . El término "gen" puede abarcar opcionalmente genes regulatorias sin codificación que residen en un sitio genético. Por ejemplo, además de una región de codificación de un ácido nucleico, el término "gen" también abarca las secuencias de nucleótidos transcritas del mARN de plena longitud adyacente a los extremos 5' y 3' de la región de codificación. Estas regiones sin codificación son variables en tamaño y se extienden comúnmente sobre ambos de los extremos 5' y 3' de la región de codificación. Las secuencias que están localizadas 5' y 3' de la región de codificación y están contenidas en el mARN son denominadas como secuencias sin traducir 5' y 3' (5' UT y 3' UT) . Ambas de las UT 5 ' y 3' pueden servir para papeles regulatorios , en las que se incluyen inicio de traducción, escisión post-traducción y poliadenilación . El término "gen" abarca mARN, cADN y formas genómicas de un gen. En algunos aspectos, la forma genómica o con genómico de un gen incluye las secuencias del mARN transcrito, también como otras secuencias no transcritas que caen fuera del transcrito. Las regiones regulatorias que caen fuera de la unidad de transcripción de mARN son algunas veces llamadas "secuencias de flanqueo 5' o 3' ". Una forma genómica funcional de un contiene comúnmente elementos regulatorios necesarios para la regulación de transcripción. Por ejemplo, el término "promotor" es usado usualmente para describir una región de ADN, comúnmente pero no exclusivamente 5' del sitio de inicio de transcripción, suficiente para conferir inicio de transcripción exacta. En algunas modalidades, un promotor es constitutivamente activo, en tanto que en modalidades alternativas, el promotor es condicionalmente activo (por ejemplo, en donde la transcripción es iniciada solamente bajo ciertas condiciones fisiológicas) . En procariontes , la actividad de un promotor puede ser modulada por una secuencia de "operador" adyacente. En algunas modalidades, la región de flanqueo 3' contiene secuencias adicionales que regulan la terminación de transcripción, algunas veces llamada secuencia de "terminador" . En general, el término "elemento regulador" se refiere a cualquier elemento genético que controla algún aspecto de la expresión de secuencias de ácidos nucleicos. Secuencia de nucleótidos expresable: Como se usa en la presente, el término "secuencia de nucleótidos expresable" se refiere a cualquier secuencia de nucleótidos que es apta de ser transcrita (por ejemplo, transcripta por una ARN polimerasa ADN-dependiente ) para generar un transcripto. La secuencia del transcripto no está limitada y puede ser codificación de proteina (por ejemplo, puede codificar una aminoacil-tARN sintetasa) o puede de codificación sin proteina (por ejemplo, puede codificar una molécula de tARN) . Enlazado operativamente: Como se usa en la presente, los términos "en combinación operable", "en orden operable", "enlazado operativamente", "unido operativamente" y frases similares, cuando son usados con referencia a ácidos nucleicos, se refieren al enlace de secuenciad de ácido nucleico colocadas en relación funcional entre si. Por ejemplo, una secuencia de promotor enlazada operativamente, cuadro de lectura abierta y secuencia de terminador da como resultado la producción exacta de una molécula de ARN. En algunos aspectos, elementos de ácido nucleico enlazados operativamente dan como resultado la transcripción de un cuadro de lectura abierta y finalmente la producción de un polipéptido (esto es, expresión del cuadro de lectura abierta) . Operon: Como se usa en la presente, el término "operon" se refiere a una unidad genética (por ejemplo, una región cromosomal) que controla la expresión genética en procariontes . Un operon comprende comúnmente uno o más genes que codifican uno o más polipéptido ( s ) o ARN y la región (o regiones) reguladora adyacente que controla la transcripción de los genes. La región reguladora comprende comúnmente un promotor y un operador. La región de codificación de un gen procarionte es denominada históricamente un "cistrón". Los operones que contienen múltiples cistrones son denominados "policistrónicos" . Los genes en un operon policistrónico están relacionados comúnmente en función y son comúnmente co-transcritas como una solo unidad y expresados de manera coordinada . Constructo : Como se usa en la presente, el término "constructo" es usado con referencia a cualquier polinucleótido u otra molécula que pueda transferir segmento (s) de ácido nucleico a una célula. El término "vector" o "vehículo" es algunas veces usado intercambiablemente con "vector". Ün vector comprende opcionalmente partes que moderan la propagación y manipulación del vector (por ejemplo, secuencias necesarias para replicación, genes que imparten resistencia a fármaco o antibiótico, un sitio de clonación múltiple, elementos de promotor/mej orador enlazados operativamente que permiten la expresión de un gen clonado, etc.) . Los vectores son frecuentemente derivados de plásmidos, bacteriófagos o virus de plantas o animales. Un "vector de clonación" o "vector de lanzadera" o "vector de subclonación" contiene partes enlazadas operativamente que facilitan las etapas de subclonación (por ejemplo, un sitio de clonación múltiple que contiene múltiples sitios de endonucleasa de restricción) . Vector de expresión: el término "vector de expresión" como se usa en la presente se refiere a un vector recombinante que comprende secuencias de polinucleótidos enlazadas operativamente que facilitan la expresión de una secuencia de codificación en un organismo huésped particular (por ejemplo, un vector de expresión bacteriano) . Secuencias de polinucleótidos que facilitan la expresión en procariontes incluyen comúnmente, por ejemplo secuencias de promotor, secuencias de terminación de transcripción, esto es, secuencias de terminador, un operador (opcional) o un sitio de enlace de ribosoma, frecuentemente junto con otras secuencias. Codifica: Como se usa en la presente, el término "codifica" se refiere a cualquier proceso mediante el cual la información en una macromolécula polimérica o cadena de secuencias es usada para dirigir la producción de una segunda molécula o cadena de secuencias que es diferente de la primera molécula o cadena de secuencias. Como se usa en la presente, el término es usado ampliamente y puede tener una variedad de aplicaciones. En algunos aspectos, el término "codifica" describe el proceso de replicación de ADN semi-conservadora , en donde una hebra de una molécula de ADN de doble hebra es usada como plantilla para codificar la hebra hermana complementaria recién sintetizada mediante una ADN polimerasa ADN-dependiente . En otro aspecto, el término "codifica" se refiere a cualquier proceso mediante el cual la información en una molécula es usada para dirigir la producción de una segunda molécula que tiene una naturaleza química diferente de la primera molécula. Por ejemplo, una molécula de ADN puede codificar una molécula de ARN (por ejemplo, mediante el proceso de transcripción que incorpora una enzima de ARN polimerasa ADN-dependiente) . También, una molécula de ARN puede codificar un polipéptido, como en el proceso de traducción. Cuando se usa para describir el proceso de traducción, el término "codifica" también se extiende al codón de triplete que codifica un aminoácido. En algunos aspectos, una molécula de ARN puede codificar una molécula de ADN, por ejemplo, mediante el proceso de transcripción inversa que incorpora una ADN polimerasa ARN-dependiente. En otro aspecto, una molécula de ADN puede codificar un polipéptido, en donde se comprenderá que "codifica" como se usa en aquel caso incorpora tanto el proceso de transcripción como traducción.
Heterólogo : Como se usa en la presente, los términos "heterólogo" o "exógeno" como son aplicados a polinucleótidos o polipéptidos se refiere a moléculas que han sido rearregladas o suministradas artificialmente a un sistema biológico y no están en una configuración natural (por ejemplo, con respecto a secuencia, posición genómica o arreglo de partes) o no son naturales para aquel sistema biológico particular. Los términos indican que el material relevante originado de una fuente diferente a aquel que se presenta de manera estable en la naturaleza o se refiere a moléculas que tienen una configuración no natural, ubicación o arreglo genético de partes. Los términos "exógeno" y "heterólogo" son algunas veces usados intercambiablemente con "recombinante". Recombinante : El término "recombinante" con referencia a un ácido nucleico o polipéptido indica que el material (por ejemplo, un ácido nucleico recombinante, gen, polinucleótido, polipéptido, etc.) ha sido alterado mediante intervención humana. En general, el arreglo de partes de una molécula recombinante no es una configuración natural la secuencia primaria del polinucleótido o polipéptido recombinante ha sido de alguna manera manipulada. La alteración para producir el material recombinante puede ser efectuada sobre el material dentro o removido de su medio ambiente o estado natural. Por ejemplo, un ácido nucleico que se presenta de manera estable en la naturaleza se convierte en ácido nucleico recombinante si es alterado o si es transcrito de AN que ha sido alterado, por medio de intervención humana efectuado dentro de la célula de la cual se origina. Un cuadro de lectura abierta de secuencia genética es recombinante si aquella secuencia de nucleótidos ha sido removida de su contexto natural y clonada a partir de cualquier tipo de vector de ácido nucleico artificial. El término recombinante también se puede referir a un organismo que alberga material recombinante. Protocolos y reactivos para producir moléculas recombinantes , especialmente ácidos nucleicos recombinantes , son comunes y de rutina en el arte (véase, por ejemplo, Maniatis et al. (eds.), Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory Press, NY, [1982]; Sambrook et al. (eds.), Molecular Cloning: A Laboratory Manual, Segunda Edición, Volúmenes 1-3, Cold Spring Harbor Laboratory Press, NY, [1989]; y Ausubel et al. (eds.), Current Protocols in Molecular Biology, Vol . 1-4, John Wiley & Sons, Inc., New York [1994] ) . Natural o endógeno: En contraste a una molécula heteróloga o exógeno, una "natural" o "endógena" es natural al sistema biológico, especie o cromosoma bajo estudio. Un gen "natural" o "endógeno" es un gen que no contiene elementos de ácido nucleico codificados por fuentes diferentes al cromosoma en el cual es encontrado normalmente en la naturaleza. Un gen endógeno, transcripto o polipéptido es codificado por su sito cromosomal natural y no suministrado artificialmente a la célula . Célula huésped: El término "célula huésped" se refiere comúnmente a una célula que contiene un ácido nucleico heterólogo, tal como un vector y soporta la replicación y/o expresión del ácido nucleico. Las células huésped pueden ser células procariónticas , tales como E. coli o células eucariónticas tales como células de levadura, insectos, anfibios o mamíferos. Preferiblemente, las células huésped son células de plantas. En el contexto de la invención, una célula huésped particularmente preferida es una célula huésped de soya . Eucarionte : Como se usa en la presente, el término "eucarionte" se refiere a organismos pertenecientes al Reino de Eucarya. Los eucariontes son en general distinguibles de los procariontes por su organización comúnmente multicelular (pero no exclusivamente multicelular, por ejemplo, levadura), la presencia de un núcleo enlazado a membrana y otros organelos enlazados a la membrana, material genético lineal (esto es, cromosomas lineales) , la ausencia de operones, la presencia de intrones, coronación de mensaje y poli-A mARN, y otras características biológicas, tal como una estructura ribosomal de estructura distintiva. Los organismos eucariónticos incluyen, por ejemplo, animales (por ejemplo, mamíferos, insectos, reptiles, aves, etc.), ciliados, plantas (por ejemplo, monocotiledóneas , dicotiledóneas, algas, etc.), hongos, levaduras, flagelados, microsporidia , protistas, etc. Procarionte : Como se usa en la presente, el término "procarionte" se refiere a organismos pertenecientes al Reino de Monera (también denominado Procarya). Los organismos procariónticos son en general distinguibles de los eucariontes por su organización unicelular, reproducción asexual mediante gemación o fusión, la carencia de un núcleo enlazado a membrana u otros organelos enlazados a membrana, un cromosoma circular, la presencia de operones, la ausencia de intrones, coronación de mensaje y poli-A mARN, y otras características bioquímicas, tales como una estructura ribosomal distintiva. Los Prokarya incluyen subreinos Eubacteria y Archaea (algunas veces denominados "Arqueobacteria" Las cianobacterias (algas azul verde) y micoplasma son algunas veces dados clasificaciones separadas bajo el Reino de Monera. Bacterias : Como se usa en la presente, los términos "bacterias" y "eubacterias" se refieren a organismos procariónticos que son distinguibles de Archaea . Similarmente, Archaea se refiere a procariontes que son distinguibles de eubacterias. Eubacteria y Archaea pueden ser distinguidos por una diversidad de criterios morfológicos y bioquímicos. Por ejemplo, diferencias en secuencias de ARN ribosomales, estructura de ARN polimer sa, la presencia o ausencia de intrones, sensibilidad a antibióticos, la presencia o ausencia de peptidoglicanas de pared celular y otros componentes de pared celular, las estructuras ramificadas contra sin ramificar de líquidos de membrana y la presencia/ausencia de histonas y proteínas semejantes a histona como se usan para asignar un organismo a Eubacteria o Archaea . Ejemplos de Eubacteria incluyen Escherichia coli, Thermus thermophilus y Bacillus stearothermophilus . Ejemplos de Archaea incluyen Methanococcus jannaschíi (Mj ) , Methanosarcina mazei (Mm) , Methanobacterium thermoautotrophicum (Mt) , Methanococcus maripaludis, Methanopyrus kandleri, Halobacterium tal como Haloferax volcanii y especie Halobacterium NRC-1, Archaeoglobus fulgidus (Af) , Pyrococcus f riosus (Pf) , Pyrococcus horikoshii (Ph) , Pyrobaculum aerophilum, Pyrococcus abyssi, Sulfolobus solfataricus (Ss) , Sulfolobus tokodaii, Aeuropyrum pernix (Ap) , Thermoplasma acidophilum y Thermoplasma volcanium . Derivado de: Como se usa en la presente, el término "derivado de" se refiere a un componente que está aislado de o fabricado utilizando una molécula o organismo específico o información de la molécula u organismo especificado. Por ejemplo, un polipéptido que es derivado de un segundo polipéptido puede incluir una secuencia de aminoácidos que es idéntica o sustancialmente similar a la secuencia de aminoácidos del segundo polipéptido. En el caso de polipéptidos , las especies derivadas pueden ser obtenidas por ejemplo mediante mutagénesis que se presenta de manera estable en la naturaleza, mutagénesis dirigida artificial o mutagénesis aleatoria artificial. La mutagénesis es usada para derivar polipéptidos puede ser dirigida intencionalmente o intencionalmente aleatoria o una mezcla de cada una. La mutagénesis de un polipéptido para crear un polipéptido diferente derivado del primero puede ser un evento aleatorio (por ejemplo, provocado por infidelidad de polimerasa) y la identificación del polipéptido derivado se puede hacer mediante métodos de selección apropiados, por ejemplo, como se discute en la presente. La mutagénesis de un polipéptido abarca comúnmente manipulación del polinucleótido que codifica el polipéptido . Similarmente , el término "derivado de" se puede aplicar a polinucleótidos . Un polipéptido que es derivado de un polinucleótido fuente puede incluir una secuencia de nucleótidos que es idéntica o sustancialmente similar a la secuencia de nucleótidos de fuente. En el caso de polinucleótidos, la especie derivada puede ser obtenida por ejemplo, mediante mutagénesis que se presentan de manera estable en la naturaleza, mutagénesis dirigida artificial o mutagénesis aleatoria artificial. La mutagénesis usada para derivar polinucleótidos puede ser dirigida intencionalmente o intencionalmente aleatoria o una mezcla de cada una. En algunos aspectos, un polinucleótido derivado es generado al colocar un polinucleótido fuente a un contexto heterólogo, esto es, a un contexto que es diferente de su contexto natural o endógeno. Por ejemplo, un promotor de gen puede ser derivado de un promotor de gen endógeno al remover aquel dominio de promotor endógeno y colocarlo en combinación operable con diferentes secuencias de nucleótidos con las cuales no está normalmente asociado . Marcador de selección o filtración positivo: Como se usa en la presente, el término "marcador de selección o filtración positivo" se refiere a un marcador que, cuando está presente, por ejemplo, expresado, activado o los semejantes, da como resultado la identificación de una célula, que comprende el rasgo por ejemplo, una célula con el marcador de selección positivo de aquellos sin el trato. Marcador de selección o filtración negativo: Como se usa en la presente, el término "marcador de selección o filtración negativo" se refiere a un marcador que, cuando está presente, por ejemplo expresado, activado o los semejantes, permite la identificación de una célula que no comprende una propiedad o rasgo seleccionado (por ejemplo, en comparación con una célula que posee la propiedad o rasgo) . Agente de selección o filtración: Como se usa en la presente, el término "agente de selección o filtración" se refiere a un agente que, cuando está presente, permite la selección/filtración de ciertos componentes de una población.
Por ejemplo, un agente de selección o filtración puede ser, pero no está limitado a, por ejemplo, un nutriente, un antibiótico, una longitud de onda de luz, un anticuerpo, un polinucleótido expresado o los semejantes. El agente de selección se puede hacer variar, por ejemplo por concentración, intensidad, etc. Reportero : Como se usa en la presente, el término "reportero" o términos equivalentes se refiere en un sentido general a cualquier componente que puede ser detectado fácilmente en un sistema bajo estudio, en donde la detección del reportero se correlaciona con la presencia o ausencia de alguna otra molécula o propiedad o puede ser usada para identificar, seleccionar y/o filtrar objetivos en un sistema de interés. La elección del reportero más apropiado a usar para una aplicación particular depende del uso propuesto y otras variables conocidas para aquellos familiarizados en el arte. En algunos aspectos, un reportero es un gen reportero. Una amplia variedad de molécula reporteros y genes son conocidos en el arte. Cada reportero tiene un análisis particular para la detección de aquel reportero. Algunos análisis de detección de reportero pueden ser análisis enzimático, en tanto que otros análisis pueden ser inmunológicos por naturaleza (por ejemplo, ELISA o análisis inmunohistoquimico) o colorimétrico, por ejemplo. Todavía además, un reportero puede incluir una proteína, por ejemplo, una enzima, que confiere resistencia o sensibilidad a antibiótico (por ejemplo, ß-lactamasa, cloranfenicol acetiltransferasa (CAT) y los semejantes), un marcador fluorescente (por ejemplo, una proteina fluorescente verde tal como GFP, YFP, EGFP, RFP, etc.), un marcador luminiscente (por ejemplo, una proteina de luciferasa de luciérnaga), un marcador de selección a base de afinidad, una actividad enzimática tal como lacZ ( ß-galactosidasa ) , u otros genes marcadores seleccionables positivos o negativos tales como ADH (alcohol deshidrogenasa ) , his3, ura3, leu2, lys2, o los semejantes.
BREVE DESCRIPCION DE LAS FIGURAS La Figura ] proporciona las estructuras y nombres correspondientes de cuatro aminoácidos no naturales, que son p-benzoil-L-fenilalanina (Bpa) , para-acetil-L-fenilalanina (pAcPhe) , para-azido-L-fenilalanina (pAzPhe) y para-yodo-L-fenilalanina (plPhe) . La Figura 2 proporciona un histograma que muestra las eficiencias de supresión de plásmidos (en relación con ß-galactosidasa tipo silvestre) cuando el promotor y terminador proK para el gen MjtARN-Tyr (CUA) , la mutación D286R en el gen BpaRS, una forma mutada del promotor glnS para el gen BpaRS, y/o múltiples copias del gen de tARN . Las barras de error indican desviación estándar y n=3.
La Figura 3 proporciona una imagen quimioluminiscente de un análisis de northern blot del supresor ámbar MjtARN-Tyr(CUA) expresado de los plásmidos de supresión enlistados. La Figura 4 proporciona una imagen de quimioluminiscencia enseguida de un análisis de western blot de BpaRS expresado bajo el control del promotor glnS tipo silvestre y la forma mutada del promotor glnS. La inmunoabsorción utilizó un conjugado de anticuerpo anti-HRP anti-His (término C) ( Invitrogen ) . La Figura 5 muestra un mapa de plásmido de pSup- BpaRS-6TRN. Otros genes de sintetasa fueron sub-clonados de sus plásmidos de pBK correspondientes a los sitios Ndel/PstI de este plásmido. La Figura 6 muestra las eficiencias de supresión del nuevo sistema para Bpa, pAcPhe, pAzPhe e incorporación de plPhe. Las barras de error indican desviación estándar y n=3. La Figura 7 proporciona una imagen de quimioluminiscencia enseguida del western blot de una mioglobina mutante que contiene Bpa en lugar de Ser-4 expresado en ausencia o presencia de Bpa. La inmunoabsorción utilizó el conjugado de anticuerpo-HRP anti-His ( término C) (Invitrogen). La Figura 8 proporciona varias secuencias de polinucleótidos y polipéptidos que encuentran uso con la invención .
DESCRIPCION DETALLADA DE LA INVENCION La invención proporciona sistemas de vector de expresión mejorados útiles para la expresión bacteriana eficiente de proteínas mutantes que comprenden uno o más aminoácidos no naturales en sitios específicos codificados genéticamente por codones selectores (por ejemplo, codones sin sentido ámbar) . Estos sistemas utilizan tecnología de traducción ortogonal conocida en el arte para la incorporación in vivo de los aminoácidos no naturales. La invención no está limitada en algún aspecto con respecto a los componentes de traducción ortogonales particulares que son usados (esto es, la aminoacil-tARN sintetasa ortogonal particular o el tARN supresor ortogonal particular). Además, en algunas modalidades, la invención proporciona composiciones y métodos mejorados que encuentran amplio uso en los sistemas de vector de expresión bacteriano que no están limitados a la expresión de aminoacil-tARN sintetasas ortogonales o tARN supresores. La invención proporciona nuevos aspecto de vector de expresión que dan como resultado una eficiencia significativamente mejorada en la incorporación de aminoácidos no naturales a proteínas en eubacterias (por ejemplo, E. coli) y dan como resultado expresión de alto rendimiento de proteínas mutantes que contienen los aminoácidos no naturales en sitios específicos diseñados genéticamente por codones selectores. La eficiencia mejorada en la incorporación de aminoácidos no naturales a una proteína de interés es supuestamente debida (por lo menos en parte) a la expresión mejorada de la aminoacil-tARN sintetasa ortogonal y tARN supresor, aunque no se requerimiento entendimiento del mecanismo de la eficiencia mejorada para fabricar o usar la invención. Los nuevos aspectos de vector de expresión de la invención son ampliamente compatibles con una variedad de cadenas fundamentales de vector de expresión de E. coli y cepas de E. coli y son también fácilmente adaptados para la expresión de otras proteínas o tARN de interés, además de la expresión de aminoacil-tARN sintetasas ortogonales o tARN supresores ortogonales . En algunos aspectos, los elementos de vector de expresión nuevos proporcionados por la invención son usados independientemente sobre plásmidos separados. En otros aspectos, un solo nuevo elemento o combinación de elementos son usados en una pluralidad de plásmidos. En todavía otras modalidades, una pluralidad de estos elementos son usados en combinación sobre el mismo plásmido. La invención proporciona un número de mejoras a sistemas de vector de expresión bacterianos que pueden ser usados para mejorar la expresión de proteínas mutantes que comprenden uno o más aminoácidos no naturales y en algunos casos, pueden ser usados más ampliamente para mejorar la expresión de cualquier polipéptido particular o tARN de interés.
La invención proporciona, por ejemplo, las siguientes mejoras a los sistemas de vector de expresión bacterianos: (A) La invención proporciona vectores de expresión en donde el gen de aminoacil-tARN sintetasa ortogonal y el gen de tARN supresor ortogonal son transportados en el mismo plásmido. Esto simplifica la expresión de estos componentes ortogonales, en donde previamente, estos dos componentes fueron cada uno transportados en plásmidos separados; (B) La invención proporciona secuencias de promotor y terminador mejoradas derivadas de operones de tARN de prolina de E. coli para expresar una secuencia de tARN heteróloga, por ejemplo, un gen MjtARN-Tyr (CUA) ortogonal o cualquier otro gen de tARN ortogonal. El gen de tARN de prolina de E. coli usado para derivar las secuencias de promotor y terminador pueden ser los genes de tARN proK, proL o proM de E. coli. (C) La invención proporciona operones policistrónicos recombinantes mejorados para la expresión de genes de tARN, en donde cualquier dos genes de tARN en el operon están separados por una secuencia de enlazador heteróloga derivada de un enlazador de un operón policistrónico de tARN que se presenta de manera estable en la naturaleza, por ejemplo, el enlazador que se presenta de manera estable en la naturaleza entre los genes valU y valX de E. coli o alternativamente, entre los genes ileT y alaT.
(D) La invención proporciona una secuencia de promotor nueva derivada del promotor glnS de E. coli para la expresión mejorada de un cuadro de lectura abierto, por ejemplo un cuadro de lectura abierta que codifica una aminoacil-tARN sintetasa ortogonal.
SISTEMAS DE VECTOR PARA COEXPRESIÓN DE GENES DE Q-tARN y O-RS En algunos aspectos, la invención proporciona vectores de expresión en donde el gen de aminoacil-tARN sintetasa ortogonal y gen de tARN supresor tARN son transportados en el mismo plásmido. Este elemento es una mejora con respecto a la técnica previa, en donde previamente es necesario co-transformar una célula huésped con dos vectores de expresión separados que portaban independientemente los genes de O-tARN y O-RS. Como se describe en los ejemplos, una serie de vectores de expresión relacionados son construidos que son apropiados para la co-expresión de especies de O-tARN y O-RS. Estos plásmidos incluyen: pYR-BpaRSl pYR-BpaRS5 pYR-BpaRS5 (D286R) pYR-BpaRS-TRN pYR-BpaRS-TRN (D286R) pYR-BpaRS-3TRN (D286R) pYR-BpaRS-6TRN (D286R) pSup-BpaRS-6TRN (D286R) pSup-pAcPheRS-6TRN pSup-pAzPheRS-6TRN pSup-pIPheRS-6TRN Cada uno de estos plásmidos es un aspecto de la invención. Sin embargo, no se pretende que la invención esté limitada a estos plásmidos, ya que aquel de habilidad reconocerá que la construcción de variantes de estos plásmidos está dentro del alcance de la invención. Por ejemplo, no se pretende que cualquier plásmido de la invención esté limitado a la expresión cualquier especie de O-tARN o O-RS particular para producir una proteina que comprende cualquier aminoácido no natural particular. Los ejemplos provistos en la presente describen el uso exitoso de un jtARN-Tyr (CUA) (SEQ ID NO: 1) y cuatro especies de O-RS diferentes que tienen especificidad de carga de tARN por p-benzoil-L-fenilalanina (Bpa), para-acetil-L-fenilalanina (pAcPhe) , para-azido-L-fenilalanina (pAzPhe) y para-yodo-L-fenilalanina (plPhe) (véase Figura 1 y Figura 8, SEQ ID NOS: 4, 6, 8 y 10) . Estos ejemplos de trabajo anteriores sirven para ilustrar la posibilidad de aplicación más amplia de la invención a ser usada con otras especies de O-tARN y O-RS. Por supuesto, la invención encuentra uso en la expresión de cualquier O-tARN o cualquier O-RS de interés y en particular, componentes de traducción ortogonales que operan óptimamente en células eubacterianas . En algunos aspectos, la invención encuentra uso particular con especies de O-RS que son derivadas de aminoacil-tARN sintetasa de Archaea (por ejemplo, Methanococcus jannaschii) que se presentan de manera estable en la naturaleza o especies O-tARN derivada de tARN de Archaea. La amplia variedad de especies de O-tARN y O-RS que encuentran uso con la invención son conocidas en el arte y son descritas en numerosas fuentes. Véase, por ejemplo, Números de publicación internacional O 2002/086075, intitulada "METHODS AND COMPOSITION FOR THE PRODUCTION OF ORTHOGONAL tRNA-AMINOACYL-tRNA SYNTHETASE PA1RS;" WO 2002/085923, intitulada "IN VIVO INCORPORATION OF UNNATURAL AMINO ACIDS;" WO 2004/094593, intitulada "EXPANDING THE EUKARYOTIC GENETIC CODE;" WO 2005/019415, presentada el 7 de julio de 2004; WO 2005/007870, presentada el 7 de julio de 2004; WO 2005/007624, presentada el 7 de julio de 2004 y WO 2006/110182, presentada el 27 de octubre de 2005, intitulada "ORTHOGONAL TRANSLATION COMPONENTS FOR THE IN VIVO INCORPORATION OF UNNATURAL AMINO ACIDS." Cada una de estas solicitudes es incorporada en la presente por referencia en su totalidad. Para discusión adicional de sistemas de traducción ortogonales que incorporan aminoácidos no naturales y métodos para su producción y uso, véase también Wang y Schultz "Expanding the Genetic Code, " Angewandte Chemie Int. Ed., 44(l):34-66 (2005), Xie y Schultz, "An Expanding Genetic Code", Methods 36 ( 3 ) : 227-238 (2005); Xie y Schultz, "Adding Amino Acids to the Genetic Repertoire", Curr. Opinión in Chemical Biology 9 ( 6) : 548-554 ; y Wang et al., "Expanding the Genetic Code", Annu . Rev. Bíophys . Biomol. Struct., epub 13 de enero de 2006; el contenido de cada una de las cuales es incorporado en la presente por referencia en su totalidad. El arte previo (por ejemplo, el arte citado en la presente) también proporciona guia para la construcción y uso de numerosas variantes (por ejemplo, variantes conservadoras) y fragmentos de especies de O-RS y O-tARN conocidas. Estas variantes y fragmentos también encuentran uso con los vectores de expresión de la invención. El arte también proporciona guia para la identificación y construcción de nuevas especies de 0-RS y O-tARN, que también encuentran uso con la invención.
CONSTRUCCIONES DE PLÁSMIDO Y CÉLULAS HUÉSPED EUBACTERIANAS Como se describe y usa en el Ejemplo 6, los plásmidos provistos en la especificación están basados en una cadena fundamental de vector de pACYC184. Sin embargo, no se pretende que los plásmidos de la invención estén limitados al uso de aquel vector de cadena fundamental particular. Aquel de habilidad ordinaria en el arte reconoce que cualquiera de una variedad de plásmidos (en los que se incluyen otros plásmidos técnicamente disponibles o disponibles comercialmente ) pueden ser usados para construir los plásmidos de la invención. Por ejemplo, los plásmidos pACYC177 y vector pRARE2 (Novagen; véase inNovations, No. 12, Junio de 2001) pueden también ser usados en conjunción con la invención. En algunos aspectos, cualquier plásmido que porte un origen compatible de replicación (por ejemplo, el origen de replicación pl5A) y por lo menos un marcador de selección pueden ser usados en conjunción con la invención. Derivados del plásmido pSClOl pueden también ser usados con la invención. También como se describe en el Ejemplo 6, los plásmidos provistos por la invención fueron usados para transformar E. coli electrocompetente ( Invitrogen™) de One Shot® TOP10. Sin embargo, no se pretende que la cepa eubacteriana usada como célula huésped para producir proteínas que comprenden uno o más aminoácidos no naturales esté limitada al uso de aquella célula huésped particular. Aquel de habilidad en el arte reconoce que cualquiera de una variedad de células huésped (en los que se incluyen otros plásmidos disponibles comercialmente también como cepas producidas por el usuario) pueden ser usados fácilmente para producir proteínas que comprenden aminoácidos no naturales. Por ejemplo, otras células huésped tales como DH10B™ de cepas de E. coli (Invitrogen™), Electrocomp™ GeneHogs® (Invitrogen™), BL21 One Shot® (Invitrogen™) y BL21(DE3) One Shot® (Invitrogen™). Por supuesto, cualesquier cepas de E. coli sin ningún gen supresor de tARN endógeno es una célula huésped apropiada. Otras especies de eubacterias, además de E. coli también encuentran uso con la invención. Por ejemplo, se contempla que cepas de Bacillus subtilus pueden también ser usadas como células huésped para los vectores de la invención.
SECUENCIAS DE PROMOTOR Y DE TERMINADOR MEJORADAS PARA EXPRESIÓN DE O-tARN Con el fin de mejorar la eficiencia de supresión del sistema de traducción ortogonal, un nuevo operón de tARN supresor ámbar con un promotor y terminador de tARN de E. coli que se presenta de manera estable en la naturaleza fue construido. Un estudio de genes de tARN de E. coli reveló que tARN de prolina de E. coli tienen el mismo par de C1-G72 como los tARN de Archaea; este par de bases es un determinante de identidad principal para el reconocimiento colectivo de Mj'tRNA-Tyr(CUA) mediante MjTyrRS en E. coli (Wang and Schultz, Chem. Biol. , 8:883-890 (2001) ) . En vista de esta observación, un gen de tARN supresor ámbar sintético fue construido de tal manera que un gen de 0-tARN heterólogo reemplaza al gen proK de E. coli de la misma longitud (77 nucleótidos) en el operón proK monocistrónico . Un vector de expresión mejorado (pYR-BpaRS5) fue generado al sustituir el operón de tARN supresor original en pYR-BpaRSl con el gen MjtRNA-Tyr (CUA) bajo el control del promotor proK (SEQ ID NO: 32) y el terminador proK (SEQ OD NO: 33) . Este constructo de expresión mostró un incremento de 2 veces en la expresión de o-tARN (Véase Figura 3) y dio como resultado una eficiencia de supresión significativamente mejorada (véase Figura 2), pero ambas en relación con las actividades del vector de BpaBSl. Asi, la invención proporciona vectores de expresión mejorados para la exresión de un tARN de interés, en donde la expresión de un tARN policistrónico es impulsada por las secuencias de nucleótidos edl promotor y terminador derivadas del gen de tARN de prolina de E. coli proK. Como se describe en el Ejemplo 1, el tARN particular usado para demostrar este vector de expresión mejorado fue un tARN ortogonal (O-tARN), más específicamente, MjtRNA-Tyr (CUA) . Sin embargo, no se pretende que la eficiencia mejorada de tARN esté limitada a MjtRNA-Tyr (CUA) ni limitada a un O-tARN. Por supuesto, este aspecto de la invención puede ser usado para mejorar la expresión de cualquier tARN de interés. En E. coli, tres especies de tARN son cargadas con prolina durante la traducción. Además del gen de tARN proK, E. coli también usa dos genes de prolil-tARN adicionales. Estos son proL y proM. En vista de su estructura similar al sitio proK, se contempla que la secuencia de promotor de proL ( DEQ ID NO: 34) y las secuencias de terminador de proL y proM (SRQ ID NOS: 35 y 36, respectivamente) también encuentran uso en la construcción de vectores de expresión mejorados de la invención. Es también un aspecto de la invención que combinaciones de promotores y exterminadores de diferentes genes de prolil-tARN de E. coli diferentes puedan también ser usadas para obtener expresión mejorada. Por ejemplo, la secuencia de promotor de proK (SEQ ID NO: 32) puede ser usada en conjunción con la secuencia del terminador de proL (SEQ ID NO: 35) .
ESTRUCTURAS DE OPERÓN POLICISTRÓNICO MEJORADAS La invención proporciona operones policistrónicos recombinantes mejorados para la expresión de genes de tARN. Estos operones policistrónicos comprenden múltiples copias (por ejemplo, tres copias) de genes de tARN de interés, en donde las secuencias de tARN están separadas por una secuencia de enlazador heteróloga derivada de un enlazador de un operón policistrónico de tARN que se presenta de manera estable en la naturaleza, por ejemplo, el enlazador que se presenta de manera natural entre los genes valU y valX de E. coli (SEQ ID NO: 14) o alternativamente por ejemplo, entre los genes de tARN ileT y alaT de E. coli (SEQ ID NO: 15) . Asi, la invención proporciona vectores de expresión mwejorados para la expresión de operones tARN policistrónicos, en donde el operón comprende por lo menos un enlazador tARN heterólogo que separa por lo menos dos secuencias de tARN expresadas. En algunas modalidades, como se describe en el ejemplo 3, múltiples enlazadores de tARN son usados para separar tres o más secuencias de tARN expresadas en el operón. En aquel caso, el enlazador de tARN usado entre cada par de tARN expresado puede ser diferente (como en el Ejemplo 3) o puede ser el mismo enlazador entre cada gen de tARN. No se pretende que la invención esté limitada al uso del enlazador de gen valU y valX de E. coli (SEQ ID NO: 14) o el enlazador de gen de tARN íleT y alaT de E. coli (SEQ ID NO: 15) . Por supuesto, enlazadores de tARN que se presentan de manera estable en la naturaleza adicionales también encuentran uso con la invención. Por ejemplo, cada uno de los siguientes enlaadores ubicados entre los genes de tARN de E. coli naturales enlistados a continuación encuentran uso con la invención, en donde el enlazador que es usado en el sistema recombinante es heterólogo a cualesquier secuencias tARN expresadas están en el operón recombinante. Estos enlazadore de tARN útiles incluyen: En algunas modalidades, enlazadores de tARN preferidos que encuentran uso con la invención contienen ya sea uno u otro o ambos de los nucleótidos U(-l) y A(77). Estas dos posiciones de nucleótidos en enlazadores de tARN han demostrado ser óptimas para el procesamiento 5' y 3' eficiente de precursores de tARN cuando están en su contexto natural (por ejemplo, endógenos). Véase por ejemplo, Li y Deutscher, "Maturation pathways for E. coli tRNA precursors: A random multienzyme process in vivo/' Cell 86:503-512 (1996) y Zahler et al., "Recognition of the 5' leader of pre-tRNA substrates by the active site of ribonuclease P, " RNA 9:734-745 (2003). En otras modalidades, los enlazadores de tARN que encuentran uso con la invención, comprenden ciclos de restricción (que se presentan de manera estable en la naturaleza o diseñados). En algunas modalidades, la invención proporciona constructor que comprenden una pluralidad del mismo operón policistrónico, opcionalmente en tándem. Asi, si un solo operón policistrónico comprende tres copias de una secuencia de nucleótidos expresable (tal como un gen tARN) , entonces dos de los operones darán como resultado un total de seis secuencias de gen tARN que son expresadas. Este tipo de configuración de grupos de genes es demostrada en el Ejemplo 3 y Figura 5. El operón policistrónico recombinante mejorado descrito en el Ejemplo 3 expresa el MjtRNA-Tyr (CUA) de tARN ortogonal. Sin embargo, no se pretende que la invención esté limitada a la expresión de MjtRNA-Tyr (CUA) . Tampoco está la invención limitada a la expresión de especies de tARN ortogonales. Por supuesto, los operones policistrónicos mejorados de la invención pueden ser usados para expresar cualquier especie tARN deseada.
UN PROMOTOR DE glnS de E. coli MEJORADO PARA EXPRESIÓN DE POLIPÉPTIDOS La invención proporciona una nueva secuencia de promotor derivada del promotor glnS de E. coli para la expresión mejorada de un cuadro de lectura abierta. Como se describe en el Ejemplo 2, el promotor glnS mutante (SEQ ID NO: 12) descrito en Plumbridge y Solí {Biochimie 69:539-541 (1987)) fue subclonado a un vector de expresión de la invención. La secuenciación de la región del promotor glnS subclonada reveló la introducción inadvertida de una cancelación a la secuencia del promotor (además de la sustitución descrita en Plumbridge y Solí). Esta variante de promotor de glnS nueva modificada adicional fue denominada glr¡S-TNR (provista en SEQ ID NO: 13) . Sorprendentemente, esta mutación dio como resultado una mejora en la eficiencia de producción del sistema en comparación con la actividad del promotor glnS de tipo silvestre tal como se determina mediante Western blot (véase Figura 4 ) . Como se describe en los Ejemplos 2 y 5, el promotor glnS-TNR fue usado para expresar las sintetasas ortogonales BpaRS, pAcPheRS, pAzPheRS y pIPheRS. Sin embargo, no se pretende que la invención esté limitada a la expresión de alguna aminoaci 1-tARN sintetasa ortogonal particular o limitada a una aminoacil-tARN sintetasa en general. Este promotor mejorado encuentra uso amplio en la expresión bacteriana de cualquier cuadro de lectura abierta de polipéptido deseado.
TECNOLOGÍA DE Tarn/AMINOACIL-tARN SINTETASA ORTOGONAL Un entendimiento de las nuevas composiciones y métodos de la presente invención es facilitado por el entendimiento de las actividades asociadas con pares de tARN ortogonales y arainoacil-tARN sintetasa ortogonales. Con el fin de agregar aminoácidos no naturales adicionales al código genético, se necesitan nuevos pares ortogonales que comprendan una aminoacil-tARN sintetasa y un tARN apropiado que funcionen eficientemente en la maquinaria de traducción del huésped, pero que sean "ortogonales" al sistema de traducción en cuestión, es decir que funcionen independientemente de las sintetasas y tARN endógenos al sistema de traducción. Las características deseadas del par ortólogo incluyen tARN que descodifica o reconoce solamente un codón específico, por ejemplo, un codón selector, que no es descodificado por ningún tARN endógeno y aminoacil-tARN sintetasas que aminoacila (o "cargan") preferiblemente su tARN cognato con solamente un aminoácido no natural específico. El O-tARN tampoco es comúnmente aminoacilado por sintetasas endógenas. Por ejemplo, en E. coli, un par ortogonal incluirá una aminoacil-tARN sintetasa que no reacciona de manera cruzada con ninguno del tARN endógeno, por ejemplo, que son los 40 en E. coli y un tARN ortogonal que no es aminoacilado por ninguna de las sintetasas endógenas, por ejemplo, de las cuales hay 21 en E. coli. A la fecha, una amplia variedad de aminoácidos no naturales estructuralmente diversos han sido incorporados a proteínas utilizando tecnología de traducción ortogonal, como es conocido en el arte .
La habilidad de incorporar un aminoácido no natural específicamente en el sitio a un polipéptido puede facilitar el estudio de proteínas al permitir la modificación posttraducción altamente selectiva de aquellas proteínas, también como el diseño de proteínas con nuevas propiedades. Por ejemplo, la expresión de proteínas que contienen uno o más aminoácidos no naturales puede facilitar el estudio de proteínas mediante marcación específica, alterar la función catalítica de enzimas, mejorar la actividad biológica o reducir la reactividad cruzada a un sustrato, reticulación de una proteína con otras proteínas, moléculas pequeñas o biomoléculas , reducir o eliminar la degradación de proteína, mejorar la vida media de proteínas in vivo (por ejemplo, mediante recubrimiento con PEG u otras modificaciones de sitios reactivos introducidos), etc. Sistemas de traducción ortogonales que son apropiados para elaborar las proteínas que comprenden uno o más aminoácidos no naturales son conocidos en el arte, como los son los métodos generales para producir sistemas de traducción ortogonales. Por ejemplo, véase Publicación Internacional Número WO 2002/086075, intitulada "METHODS AND COMPOSITIONS FOR THE PRODUCTION OF ORTHOGONAL tRNA-AMINOACYL-tRNA SYNTHETASE PAIRS"; WO 2002/085923, intitulada "IN VIVO INCORPORATION OF UNNATURAL AMINO ACIDS;" WO 2004/094593, intitulada "EXPANDING THE EUKARYOTIC GENETIC CODE;" WO 2005/019415, presentada el 7 de julio 2004; WO 2005/007870, presentada el 7 de julio de 2004; WO 2005/007624, presentada el 7 de julio de 2004 y WO 2006/110182, presentada el 27 de octubre de 2005, intitulada "ORTHOGONAL TRANSLATION COMPONENTS FOR THE IN VIVO INCORPORATION OF UNNATURAL AMINO ACIDS". Cada una de estas solicitudes es incorporad en la presente por referencia en su totalidad. Para discusión de sistemas de traducción ortogonales que incorporan aminoácidos no naturales y métodos para su producción y uso, véase también, Wang y Schultz "Expanding the Genetic Code," Angewandte Chemie Int. Ed. , 44(1): 34-66 (2005), Xie y Schultz, "An Expanding Genetic Code," Methods 36(3) :227-238 (2005) ; Xie y Schultz, "Adding Amino Acids to the Genetic Repertoire, " Curr. Opinión in Chemical Biology 9 ( 6) : 548-554 ; Wang et al., "Expanding the Genetic Code," Annu . Rev. Biophys. Biomol. Struct., 35:225-249 (2006); y Xie y Schultz, "A chemical toolkit for proteins - an expanded genetic code", Nat. Rev. Mol. Cell Biol., 7 ( 10 ): 775-782 (2006; epub 23 de agosto de 2006) , el contenido de cada uno de los cuales es incorporado por referencia en la presente en su totalidad. Tales sistemas de traducción comprenden en general células (que pueden ser células procariónticas tales como E. coli o célula eucariónticas tales como levadura) que incluyen un tARN ortogonal (O-tARN) , una aminoacil tARN sintetasa ortogonal (O-RS) y un aminoácido no natural, en donde la O-RS aminoacila el O-tARN con el aminoácido no natural. Un par ortogonal de la invención puede incluir un O-tARN, por ejemplo, un tARN supresor, un tARN de desplazamiento de cuadro o los semejantes y una O-RS cognata. En general, cuando un par ortogonal reconoce un codón selector y carga un aminoácido en respuesta al codón selector, se dice que par ortogonal "suprime" el codón selector. Esto es, un codón selector que no es reconocido por la maquinaria endógena del sistema de traducción (por ejemplo, la célula) no es cargado ordinariamente, lo que da como resultado el bloqueo de la producción de un polipéptido que de otra manera seria traducido del ácido nucleico. En un sistema de par ortogonal, la O-RS aminoacila el O-tARN con un aminoácido no natural especifico. El O-tARN cargado reconoce el codón selector y suprime el bloque de traducción provocado por el codón selector. La célula usa el par de 0-tARN/O-RS para incorporar el aminoácido no natural a una cadena de polipéptidos creciente, por ejemplo vía un ácido nucleico que comprende un polinucleótido que codifica un polipéptido de interés, en donde el polinucleótido comprende un codón selector que es reconocido por el O-tARN. En ciertas aspectos deseables, la célula puede incluir un par O-tARN/O-RS adicional, en donde el O-tARN adicional es cargado por la O-RS adicional con un aminoácido no natural diferente. Por ejemplo, uno de los O-tARN puede reconocer un codón de cuatro bases y el otro puede reconocer un codón de retención. Alternativamente, múltiples codones de retención diferentes o múltiples codones de cuatro bases diferentes pueden reconocer específicamente diferentes codones selectores . En ciertas modalidades, los sistemas comprenden una célula tal como una célula de E. coli o una célula de levadura que incluye un tARN ortogonal (O-tARN) , una aminoacil-tARN sintetasa ortogonal (O-RS), un aminoácido no natural y un ácido nucleico que comprende un polinucleótido que codifica un polipéptido de interés, en donde el polinucleótido comprende el codón selector que es reconocido por el O-tARN. El sistema de traducción puede también ser un sistema libre de célula, por ejemplo cualquiera de una variedad de sistemas de transcripción/traducción "in vitro" disponibles comercialmente en combinación con un par 0-tARN/ORS y un aminoácido no natural como se describe en la presente. Como se indica, en algunas modalidades, existen múltiples pares de 0-tARN/O-RS en una célula u otro sistema de traducción, que permite la incorporación de más de un aminoácido no natural a un polipéptido. Por ejemplo, la célula puede incluir además un par de 0-tARN/O-RS diferente adicional y un segundo aminoácido no natural, en donde este O-tARN adicional reconoce un segundo codón selector y esta O-RS adicional aminoacila preferiblemente el O-tARN con el segundo aminoácido no natural. Por ejemplo, una célula que incluye un par de 0-tARN/O-RS (en donde el O-tARN reconoce, por ejemplo un codón selector ámbar) , puede comprender además un segundo par ortogonal, en donde el segundo O-tARN reconoce un codón selector diferente, por ejemplo un codón ópalo, un codón de cuatro bases o los semejantes. De manera deseable, los diferentes pares ortogonales son derivados de diferentes fuentes, lo que puede facilitar el reconocimiento de diferentes codones selectores. El O-tARN y/o la O-RS se pueden puede presentar de manera estable en la naturaleza o pueden ser, por ejemplo derivados mediante mutación de un tARN y/o RS que se presenta de manera estable en la naturaleza, por ejemplo al generar bibliotecas de tARN y/o bibliotecas de RS, de cualquiera de una variedad de organismos y/o al usar cualquiera de una variedad de estrategias de mutación disponibles. Por ejemplo, una estrategia para producir un par de tARN/aminoacil-tARN ortogonal involucra importar un par de tARN/sintetasa heterólogo (a la célula huésped) de por ejemplo, una fuente diferente a la célula huésped o múltiples fuentes, a la célula huésped. Las propiedades de la sintetasa heteróloga candidata incluyen, por ejemplo que no cargue cualquier tARN de célula huésped y las propiedades del tARN heterólogo candidato incluyen, por ejemplo que no sea aminoacilado por cualquier sintetasa de célula huésped. Además, el tARN heterólogo es ortogonal a todas las sintetasas de célula huésped.
Una segunda estrategia para generar un par ortogonal involucra generar bibliotecas mutantes de las cuales se puede seleccionar y/o filtrar un O-tARN u O-RS. Estas estrategias pueden también ser combinadas. tARN Ortogonal (O-tARN) Un tARN ortogonal (O-tARN) modera de manera deseable la incorporación de un aminoácido no natural a una proteina que es codificada por un polinucleótido que comprende un codón selector que es reconocido por el O-tARN, por ejemplo in vivo o in vitro, con una alta eficiencia de supresión. La eficiencia de supresión puede ser determinada mediante cualquiera de un número de análisis conocidos en el arte. Por ejemplo, un análisis de reportero de /?-galactosidasa puede ser usado, por ejemplo un plásmido de lacZ derivado (en donde el constructo tiene un codón selector n en la secuencia de ácidos nucleicos lacZ) es introducido a las células de un organismo apropiado (por ejemplo, un organismo en donde los componentes ortogonales pueden ser usados) junto con plásmido que comprende un O-tARN de la invención. Una sintetasa cognata puede también ser introducida (ya sea como un polipéptido o un polinucleótido que codifica la sintetasa cognada cuando es expresado) . Las células son cultivadas en medio a' una densidad deseada, por ejemplo a una OD600 de aproximadamente 0.5 y se efectúan análisis de ß-galactosidasa, por ejemplo utilizando el equipo de análisis de ß-galactosidasa BetaFluor™ (Novagen) . El por ciento de supresión puede ser calculado como el porcentaje de actividad para una muestra en relación con un control o testigo comparable, por ejemplo el valor observado del constructo lacZ derivado, en donde el constructo tiene un codón de sentido correspondiente en posición deseada en lugar de un codón selector . Los 0-tARN pueden también ser derivados de variaciones conservadoras de 0-tARN conocidos. Por ejemplo, variaciones conservadoras de 0-tARN incluyen aquellas moléculas que funcionan como el 0-tARN particular, por ejemplo como en la secuencia enlistada en la presente y que mantiene la estructura en forma de L de tARN en virtud de una auto-complementareidad apropiada, pero que no tiene una secuencia idéntica a aquellos, por ejemplo en el listado de secuencias, figuras o ejemplos en la presente (y deseablemente, que sean diferentes a moléculas de tARN tipo silvestre) . La composición que comprende un 0-tARN puede incluir además una aminoacil-tARN sintetasa ortogonal (O-RS), en donde la O-RS aminoacila preferiblemente el 0-tARN con un aminoácido no natural. En ciertas modalidades, una composición que incluye un 0-tARN puede incluir además un sistema de traducción (por ejemplo, in vitro o in vivo) . Un ácido nucleico que comprende un polinucleótido que codifica un polipéptido de interés, en donde el polinucleótido comprende un codón selector que es reconocido por el O-tARN o una combinación de uno o más de estos pueden también estar presentes en la célula. Métodos para producir un tARN ortogonal (O-tARN) son conocidos. En ciertas modalidades de la invención, los O-tARN pueden ser producido al generar una biblioteca de mutantes . La biblioteca de tARN mutantes puede ser generada utilizando varias técnicas de mutagénesis conocidas en el arte. Por ejemplo, los tARN mutantes pueden ser generado mediante mutaciones especificas del sitio, mutaciones de punto aleatorio, recombinación homologa, entremezcla de ADN u otros métodos de mutagénesis recursivos, construcción quimérica o cualquier combinación de los mismos. Mutaciones adicionales pueden ser introducidas en una (s) posición (es) especifica ( s ) , por ejemplo en una posición no conservada o en una posición conservada, en una(s) posición (es) aleatorizada ( s ) o una combinación de ambos en un bucle o región deseada de un tARN, por ejemplo un bucle anticodón, el tallo aceptor, brazo o bucle D, bucle variable, brazo o bucle TPC, otras regiones de la molécula de tARN o una combinación de los mismos. Comúnmente, mutaciones en un tARN incluyen mutación del bucle anticodón de cada miembro de la biblioteca de tARN mutantes para permitir el reconocimiento de un codón selector. El método puede incluir además agregar secuencias adicionales al O-tARN. Comúnmente, un O-tARN posee una mejora de ortogonalidad o un organismo deseado en comparación con el material de partida, por ejemplo, la pluralidad de secuencias de tARN, en tanto que conserva su afinidad hacia una RS deseada. Los métodos incluyen opcionalmente analizar la similaridad (y/u homología inferida) de secuencias de tARN y/o aminoacil-tARN sintetasas para determinar candidatos potenciales para un O-tARN, O-RS y/o pares de los mismos, que aparecen ser ortogonales para un organismo específico. Programas de computadora conocidos en el arte y descritos en la presente pueden ser usados para el análisis, por ejemplo BLAST y programas de apilado pueden ser usados. En un ejemplo, para escoger componentes de traducción ortogonales potenciales para uso en E. coli, una sintetasa y/o un tARN es escogido que no similaridad de secuencia estrecha a organismos eubacterianos . Comúnmente, un O-tARN es obtenido al someter a, por ejemplo selección negativa, una población de células de una primera especie, en donde las células comprenden un miembro de la pluralidad de O-tARN potenciales. La selección negativa elimina células que comprenden un miembro de la biblioteca de O-tARN potenciales que es aminoacilado por una aminoacil-tARN sintetasa (RS) que es endógena a la célula. Esto proporciona un cúmulo de tARN que son ortogonales a la célula de la primera especie . En ciertas modalidades, en la selección negativa, un (os) codón(es) selector(s) es (son) introducido ( s ) a un polinucleot ido que codifica un marcador de selección negativo, por ejemplo una enzima que confiere resistencia a antibiótico, por ejemplo ß-lactamasa, una enzima que confiere a un producto detectable, por ejemplo ß-galactosidasa, cloranfenicol acetiltransferasa (CAT) , por ejemplo un producto tóxico, tal como barnasa, en una posición no esencial (por ejemplo que todavía produce una barnasa funcional), etc. La filtración/selección se hace opcionalmente al cultivar la población de células en presencia de un agente selectivo (por ejemplo un antibiótico, tal como ampicilina) . En una modalidad, se hace variar la concentración del agente de selección. Por ejemplo, para medir la actividad de tARN supresor, se usa un sistema de selección que está basado en la supresión in vivo del codón selector, por ejemplo mutaciones sin sentido (por ejemplo retención) o mutaciones de desplazamiento de cuadro introducidas a un polinucleótido que codifica un marcador de selección negativo, por ejemplo un gen para ß-lactamasa (bla) . Por ejemplo variantes de polinucleot idos , por ejemplo variantes de bla, con un codón selector en una cierta posición (por ejemplo A184), son construidos. Las células, por ejemplo bacterias, son transformadas con estos polinucleótidos . En el caso de un tARN ortogonal, que no pueden ser cargados eficientemente por sintetasas de E. coli endógenas, la resistencia a antibiótico, por ejemplo resistencia a ampicilina, debe ser aproximadamente o menor a aquella para una bacteria transformada sin plásmido. Si el tARN no es ortogonal o si una sintetasa heteróloga capaz de cargar el tARN es co-expresada en el sistema, se observará un nivel más alto de resistencia a antibiótico, por ejemplo ampicilina. Células, por ejemplo bacterias, son escogidas que no son aptas de crecer sobre placas de agar de LB con concentraciones de antibiótico aproximadamente igual a células transformadas sin plásmidos. En el caso de un producto tóxico (por ejemplo ribonucleasa o barnasa), cuando un miembro de la pluralidad de tARN potenciales es aminoacilado por un huésped endógeno, por ejemplo sintetasa de Escherichia coli (esto es, no es ortogonal al huésped, por ejemplo sintetasa de Escherichia coli), el codón selector es suprimido y el producto de polinucleótido tóxico producido conduce a muerte celular. Las células que albergan tARN ortogonales o tARN no funcionales sobreviven. En una modalidad, la acumulación de tARN que son ortogonales a un organismo deseado son luego sometidos a una selección positiva en la cual un codón selector es colocado en un marcador de selección positivo, por ejemplo codificado por un gen de resistencia a fármaco, tal como un gen de ß-lactamasa. La selección positiva es efectuada sobre una célula que comprende un polinucleótido que codifica o comprende un miembro de la acumulación de tARN que son ortogonales a la célula, por ejemplo un polinucleótido que codifica un marcador de selección positivo y un polinucleótido que codifica una RS cognata. En ciertas modalidades, la segunda población de células comprende células que no fueron eliminadas por la selección negativa. Los polinucleótidos son expresados en la célula y la célula es cultivada en presencia de un agente de selección, por ejemplo ampicilina. Luego tARN son seleccionados en cuanto a su habilidad para ser aminoacilados por la sintetasa cognata coexpresada y para insertar un aminoácido en respuesta a este codón selector. Comúnmente, estas células muestran una mejora en la eficiencia de supresión en comparación con células que albergan tARN no funcionales o tARN que no pueden eficientemente ser reconocidos por la sintetasa de interés. La célula que alberga los tARN no funcionales o tARN que no son reconocidos eficientemente por la sintetasa de interés, son sensibles al antibiótico. Por consiguiente, tARN que: (i) no son sustratos para el huésped endógeno, por ejemplo sintetasas de Escherichia coli; (ii) pueden ser aminoacilados por la sintetasa de interés; y (iii) son funcionales en traducción, sobreviven a ambas selecciones. Asi, el mismo marcador puede ser ya sea un marcador positivo o un marcador negativo, dependiendo del contexto en el cual es seleccionado. Esto es, el marcador es un marcador positivo si es seleccionado para, pero un marcador negativo si es seleccionado contra.
La severidad de la selección, por ejemplo la selección positiva, la selección negativa o tanto la selección positiva como selección negativa en los métodos descritos anteriormente, incluye opcionalmente hacer variar la severidad de selección. Por ejemplo debido a que la barnasa es una proteina extremadamente tóxica, la severidad de la selección negativa puede ser controlada al introducir números diferentes de codones selectores al gen de barnasa y/o al usar un promotor inducible. En otro ejemplo, la concentración del agente de selección o filtración se hace variar (por ejemplo, concentración de ampicilina) . En algunos aspectos de la invención, la severidad se hace variar debido a que la actividad deseada puede ser baja durante las rondas prematuras. Asi, criterios de solución menos severos son aplicados en las rondas prematuras y criterios más severos son aplicados en rondas de selección posteriores. En ciertas modalidades, la selección negativa, la selección positiva o tanto la selección negativa como la selección positiva pueden ser repetidas múltiples veces. Múltiples marcadores de selección negativos diferentes, marcadores de selección positivos o tanto marcadores de selección negativos como positivos pueden ser usados. En ciertas modalidades, el marcador de selección positivo y negativo pueden ser los mismos. Otros tipos de selecciones/filtraciones pueden ser usados en la invención para producir componentes de traducción ortogonales, por ejemplo un O-tARN, una O-RS y un par de 0-tARN/O-RS que carga un aminoácido no natural en respuesta a un codón selector. Por ejemplo el marcador de selección negativo, el marcador de selección positivo o tanto los marcadores de selección positivos como negativos pueden incluir un marcador que fluoresce o cataliza una reacción luminescente en presencia de un reactivo apropiado. En otra modalidad, un producto del marcador es detectado mediante clasificación de célula activada por fluorescencia (FACS) o mediante luminiscencia. Opcionalmente , el marcador incluye un marcador de selección a base de afinidad. Véase también, Francisco, J. A., et al., (1993) Production and fluorescence-activated cell sorting of Escherichia coli expressing a functional antíbody fragment on the external surface. Proc Nati Acad Sci U S A. 90:10444-8. Métodos adicionales para producir un tARN ortogonal recombinante pueden ser encontrados, por ejemplo, Publicaciones de solicitud internacional WO 2002/086075, intitulada "METHODS AND COMPOSITIONS FOR THE PRODUCTION OF ORTHOGONAL tRNA AMINOACYL-tRNA SYNTHETASE PAIRS"; WO 2004/094593, intitulada "EXPANDING THE EUKARYOTIC GENETIC CODE;" y WO 2005/019415, presentada el 7 de julio de 2004. Véase también Forster et al., (2003) Programming peptidomimetic synthetases by translating genetic codes designed de novo PNAS 100 ( 11 ): 6353-6357 ; y, Feng et al., (2003), Expanding tRNA recognition of a tRNA synthetase by a single amino acid change, PNAS 100(10): 5676-5681.
Aminoacil-tARN sintetasa ortogonal (O-RS) Una O-RS que encuentra uso con la invención aminoacila preferiblemente un O-tARN con un aminoácido no natural, in vitro o in vivo. Una O-RS puede ser provista al sistema de traducción, por ejemplo una célula, mediante un polipéptido que incluye una O-RS y/o mediante un polinucleótido que codifica una O-RS o una porción de la misma. Por ejemplo una O-RS comprende una secuencia de aminoácidos como es conocido en el arte o una variante conservadora de la misma. En otro ejemplo, una O-RS o una porción de la misma, es codificada por una secuencia de polinucleótidos que codifica un aminoácido que comprende secuencia en el listado de secuencias o ejemplos en la presente o una secuencia de polinucleótidos complementaria de la misma. Véase, por ejemplo la Figura 8 para secuencias de moléculas de O-RS útiles. Métodos para identificar una aminoacil-tARN sintetasa ortogonal (O-RS), por ejemplo una O-RS, para uso con un O-tARN, son conocidos. Por ejemplo un método incluye someter a selección, por ejemplo selección positiva, una población de células de una primera especie, en donde las células comprenden individualmente: 1) un miembro de una pluralidad de aminoacil-tARN sintetasas (RS) , (por ejemplo, la pluralidad de RS puede incluir RS mutantes, RS derivadas de una especie diferente a la primera especie o tanto RS mutantes como RS derivadas de una especie diferente a la primera especie); 2) el tARN ortogonal (O-tARN) (por ejemplo, de una o más especies); y 3) un polinucleótido que codifica un marcador de selección (por ejemplo positivo) y comprende por lo menos un codón selector. Las células son seleccionadas o filtradas en cuanto a aquellas que muestran una mejora en eficiencia de supresión en comparación con células que carecen o con una cantidad reducida del miembro de la pluralidad de RS . La eficiencia de supresión puede ser medida mediante técnicas conocidas en el arte y como se describe en la presente. Células que tienen una mejora en eficiencia de supresión comprenden una RS activa que aminoacila el O-tARN. Un nivel de aminoacilación (in vitro o in vivo) por la RS activa de un primer conjunto de tARN de la primera especie es comparado con el nivel de aminoacilación (in vitro o in vivo) por la RS activa de un segundo conjunto de tARN de la segunda especie. El nivel de aminoacilación puede ser determinado por una sustancia detectable (por ejemplo un aminoácido no natural marcado) . La RS activa que aminoacila más eficientemente el segundo conjunto de tARN en comparación con el primer conjunto de tARN es seleccionada comúnmente, proporcionando mediante esto una aminoacil-tARN sintetasa eficiente (optimizada) para uso con el O-tARN. Una O-RS, identificada por el método, es también un elemento de la invención . Cualquier número de análisis pueden ser usados para determinar la aminoacilación. Estos análisis pueden ser efectuado in vitro o in vivo. Por ejemplo análisis de aminoacilación in vitro son descritos en, por ejemplo Hoben y Solí (1985) Methods Enzymol. 113:55-59. La aminoacilación puede también ser determinada al utilizar un reportero junto con componente de traducción ortogonales y detectar el reportero en una célula que expresa un polinucleótido que comprende por lo menos un codón selector que codifica una proteina . Véase también, O 2002/085923, intitulada "IN VIVO INCORPORATION OF UNNATURAL AMINO ACIDS"; y WO 2004/094593, intitulada "EXPANDING THE EUKARYOTIC GENETIC CODE" . Las O-RS identificadas pueden ser manipuladas adicionalmente para alterar la especificidad del sustrato de la sintetasa, de tal manera que solamente un aminoácido no natural deseado, pero no cualquiera de los 20 aminoácidos comunes, son cargadas al 0-tARN. Métodos para generar una aminoacil tARN sintetasa ortogonal con una especificidad de sustrato por un aminoácido no natural incluyen mutación de la sintetasa, por ejemplo en el sitio activo en la sintetasa, en el sitio de mecanismo de edición en la sintetasa, en sitios diferentes al combinar diferentes dominios de sintetasas o los semejantes y aplicación de un proceso de selección. Se usa una estrategia, que está basada en la combinación de una selección positiva seguida por una selección negativa. En la selección positiva, la supresión del codón selector introducido en una(s) posición (s) no esencial (es) de un marcador positivo permite que las células sobrevivan bajo presión de selección positiva. En presencia tanto de aminoácidos naturales como no naturales, los sobrevivientes codifican asi sintetasas activas que cargan el tARN supresor ortogonal ya sea con un aminoácido natural o no natural. En la selección negativa, la supresión de un codón selector introducido en una (s) posición (es) no esencial de un marcador negativo remueve sintetasas con especificidades de aminoácidos naturales. Los sobrevivientes de la selección negativa y positiva codifican sintetasas que aminoacilan (cargan) el tARN supresor ortogonal con aminoácidos no naturales solamente. Luego Estas sintetasas pueden ser sometidas a mutagénesis adicional, por ejemplo entremezcla de ADN u otros métodos de mutagénesis recursivos. Una biblioteca de O-RS mutantes puede ser generada utilizando varias técnicas de mutagénesis conocidas en el arte. Por ejemplo las RS mutantes pueden ser generadas mediante mutaciones especificas del sitio, mutaciones de punto aleatorio, recombinación homologa, entremezcla de ADN u otros métodos de mutagénesis recursivos, construcción quimérica o cualquier combinación de los mismos. Por ejemplo una biblioteca de RS mutantes puede ser producida a partir de dos o más de otras "sub-bibliotecas" por ejemplo más pequeñas, menos diversas. Bibliotecas quiméricas de RS son también incluidas en la invención. Se debe notar que bibliotecas de tARN sintetasas de varios organismos (por ejemplo microorganismos tales como eubacteria o archaebacteria ) tales como bibliotecas que comprenden diversidad natural (véase, por ejemplo patente estadounidense No. 6,238,884 expedida a Short et al; patente estadounidense No. 5,756,316 expedida a Schallenberger et al; patente estadounidense No. 5,783,431 expedida a Petersen et al; patente estadounidense No. 5,824,485 expedida a Thompson et al; patente estadounidense No. 5,958,672 expedida a Short et al), son construidas opcionalmente y seleccionadas en cuanto a pares ortogonales . Una vez que las sintetasas son sometidas a la estrategia de selección/filtración positiva y negativa, estas sintetasas pueden luego ser sometidas mutagénesis adicional. Por ejemplo un ácido nucleico que codifica la O-RS puede ser aislado; un conjunto de polinucleótidos que codifican O-RS mutadas (por ejemplo mediante mutagénesis aleatoria, mutagénesis especifica del sitio, recombinación o cualquier combinación de las mismas) pueden ser generados a partir del ácido nucleico; y estas etapas individuales o una combinación de estas etapas pueden ser repetidas hasta que se obtiene una O-RS mutada que aminoacila preferiblemente el O-tARN con el aminoácido no natural. En algunos aspectos de la invención, las etapas son efectuadas múltiples veces, por ejemplo por lo menos dos veces. Niveles adicionales de severidad de selección/filtración pueden también ser usados en los métodos de la invención, para producir O-tARN, O-RS o pares de los mismos. La severidad de selección o filtración se puede hacer variar en una o ambas etapas del método para producir una O-RS. Esto podría incluir, por ejemplo, hacer variar la cantidad del agente de selección/filtración que es usado, etc. Rondas adicionales de selecciones positivas y/o negativas pueden también ser efectuadas. La selección o filtración puede también comprender uno o más de un cambio en permeabilidad de aminoácido, un cambio en eficiencia de traducción, un cambio en fidelidad de traducción, etc. Comúnmente, el uno o más cambios están basados en una mutación en uno o más genes en un organismo en el cual un par de tARN-tARN sintetasa ortogonal es usado para producir proteína. Detalles generales adicionales para producir O-RS y alterar la especificidad de sustrato de la sintetasa se pueden encontrar en la población internacional Número WO 2002/086075, intitulada "METHODS AND COMPOSITIONS FOR THE PRODUCTION OF ORTHOGONAL tRNA AMINOACYL-tRNA SYNTHETASE PAIRS"; y WO 2004/094593, intitulada "EXPANDING THE EUKARYOTIC GENETIC CODE". Véase también, Wang y Schultz "Expanding the Genetic Code," Angewandte Chemie Int. Ed. , 44(1): 34-66 (2005), el contenido del cual es incorporado por referencia en su totalidad .
Organismos fuente y organismos huésped Los componentes de traducción ortogonales (O-tARN y O-RS) encuentran uso con la invención pueden ser derivados de cualquier organismo (o una combinación de organismos) para uso en un sistema de traducción huésped a partir de cualesquier otras especies, con la condición de que los componentes de 0-tARN/O-RS en el huésped trabajen de manera ortogonal. No es requerimiento que el O-tARN y la 0-RS de un par ortogonal sean derivados de mismo organismo. En algunos aspectos, los componentes ortogonales son derivados de genes Archaea (esto es, arqueobacteria ) para uso en un sistema huésped bacteriano. Por ejemplo el O-tARN ortogonal puede ser derivado de un organismo de Archae, por ejemplo una arqueobacteria, tal como Methanococcus jannaschii , Methanobacterium thermoautotrophicum, Halobacterium tal como Haloferax volcanii y especie Halobacterium NRC-1, Archaeoglobus fulgidus , Pyrococcus furiosus , Pyrococcus horikoshii , Aeuropyrum pernix, Methanococcus maripaludis , Methanopyrus kandleri , Methanosareina mazei (Mm) , Pyrobaculum aerophilum , Pyrococcus abyssi, Sulfolobus solfataricus (Ss) , Sulfolobus tokodaii, Thermoplasma acidophilum , Thermoplasma volcanium , o los semejantes o una eubacteria, tal como Escherichia coli , Thermus thermophilus , Bacillus stearothermphilus , o los semejantes, en tanto que la 0-RS ortogonal puede ser derivada de un organismo o combinación de organismos, por ejemplo una arqueobacteria, tal como Methanococcus j annaschii , Methanobacterium thermoautotrophicum, Halobacterium tal como Haloferax volcanii y especie Halobacterium NRC-1, Archaeoglobus fulgidus , Pyrococcus furiosus, Pyrococcus horikoshii, Aeuropyrum pernix, Methanococcus maripaludis, Methanopyrus kandleri, Methanosarcina mazei, Pyrobaculum aerophilum , Pyrococcus abyssi, Sulfolobus solfataricus , Sulfolobus tokodaii , Thermoplasma acidophilum , Thermoplasma volcanium , o los semejantes o una eubacteria, tal como Escherichia coli, Thermus thermophilus , Bacillus stearothermphilus, o los semejantes. En una modalidad, fuentes eucariónticas , por ejemplo plantas, algas, protistas, hongos, levaduras, animales (por ejemplo mamíferos, insectos, artrópodos, etc.), o los semejantes, pueden también ser. usados como fuentes de O-tARN y O-RS. Los componentes individuales de un par de 0-tARN/O-RS pueden ser derivados del mismo organismo o diferentes organismos. En una modalidad, el par de 0-tARN/O-RS es del mismo organismo. Alternativamente, el O-tARN y la O-RS del par de 0-tARN/O-RS son de diferentes organismos. El O-tARN, la O-RS o el par 0-tARN/O-RS pueden ser seleccionados o filtrados in vivo o in vitro y/o usado en una célula, por ejemplo una célula eubacteriana , para producir un polipéptido con un aminoácido no natural. La célula eubacteriana usada no está limitada, por ejemplo Escherichia coli, Thermus thermophilus, Bacillus stearothermophilus , o los semejantes. Composiciones de células eubacterianas que comprenden componentes de traducción de la invención son también un aspecto de la invención. Véase también, Publicación de solicitud internacional Número WO 2004/094593, intitulada "EXPANDING THE EUKARYOTIC GENETIC CODE", presentada el 16 de abril de 2004, para seleccionar O-tRNA y/o O-RS en una especie para uso en otra especie . En algunos aspectos, el O-tARN, O-RS o par O-tARN/O-RS pueden ser seleccionados o filtrados in vivo o in vitro y/o usados en un célula, por ejemplo una célula eucarióntica , para producir un polipéptido con un aminoácido no natural. La célula eucarióntica usada no está limitada; por ejemplo cualquier célula de levadura apropiada, tal como Saccharomyces cerevisiae {S. cerevisiae) o los semejantes, pueden ser usados. Composiciones de células eucariónticas que comprenden componentes de traducción de la invención son también un aspecto de la invención. Aunque los sistemas de traducción ortogonales (por ejemplo que comprenden una O-RS, un O-tARN y un aminoácido no natural) pueden utilizar células huésped cultivadas para producir proteínas que tienen aminoácidos no naturales, no se pretende que un sistema de traducción ortogonal de la invención requiera una célula huésped viable intacta. Por ejemplo un sistema de traducción ortogonal puede utilizar un sistema libre de células en presencia de un extracto de célula. Por supuesto, el uso de sistemas de transcripción/traducción in vitro, libres de células, para la producción de proteínas es una técnica bien establecida. La adaptación de estos sistemas in vitro para producir proteínas que tienen aminoácidos no naturales utilizando componentes de sistema de traducción ortogonales descritos en la presente está dentro del alcance de la invención .
COPONES SELECTORES Codones selectores en sistemas de traducción ortogonales expanden la estructura codón genético de maquinaria biosintética de proteínas. Por ejemplo un codón selector incluye, por ejemplo un codón de tres bases único, un codón sin sentido, tal como un codón de retención, por ejemplo un codón ámbar (UAG) o un codón ópalo (UGA) , un codón no natural, por lo menos un codón de cuatro bases, un codón raro o los semejantes. Un número de codones selectores pueden ser introducidos a un deseado, por ejemplo uno o más, dos o más, más de tres, etc. al utilizar diferentes codones selectores, múltiples pares de tARN/sintetasa ortogonales pueden ser usados que permiten la incorporación específica del sitio simultánea de múltiples aminoácidos no naturales, por ejemplo que incluyen por lo menos un aminoácido no natural, utilizando estos diferentes codones selectores . En una modalidad, los métodos involucran el uso de un codón selector que es un codón de retención para la incorporación de un aminoácido no natural in vivo en una célula a un polipéptido. Por ejemplo un O-tARN es producido que reconoce el codón de retención y es aminoacilado por una 0-RS con un aminoácido no natural. Este O-tARN no es reconocido por las aminoacil-tARN sintetasas del huésped que se presenta de manera estable en la naturaleza. Mutagénesis dirigida al sitio convencional puede ser usada para introducir el codón de retención en el sitio de interés en un polinucleótido que codifica un polipéptido de interés. Véase, por ejemplo Sayers et al. (1988), 5', 3' Exonuclease in phosphorothioate-based oligonucleotide-directed mutagenesis . Nucleic Acids Res/ 791-802. Cuando la 0-RS, O-tARN y el ácido nucleico que codifica un polipéptido de interés son combinados, por ejemplo in vivo, el aminoácido no natural es incorporado en respuesta al codón de retención para dar un polipéptido que contiene el aminoácido no natural en la posición especificada. En una modalidad de la invención, el codón de retención usado como codón selector es un codón ámbar, UAG y/o un codón ópalo, UGA. En un ejemplo, un código genético en el cual UAG y UGA son ambos usados como codón selector pueden codificar 22 aminoácidos, en tanto que preservan el codón sin sentido ocre, UAA, que es la señal de terminación más abundante. La incorporación de aminoácidos no naturales in vivo se puede hacer sin alteración significativa de la célula huésped. Por ejemplo en células no eucariónticas , tales como Escherichia coli, debido a que la eficiencia de supresión para el codón UAG depende de la competencia entre el O-tARN, por ejemplo el tARN supresor ámbar y el factor 1 de liberación (RF1) (que se enlaza al codón UAG e inicia la liberación del péptido creciente del ribosoma) , la eficiencia de supresión puede ser modulada por ejemplo ya sea al incrementar el nivel de expresión de O-tARN, por ejemplo el tARN supresor o utilizando una cepa deficiente de RF1. En células eucariónticas , debido a que la eficiencia de supresión para el codón UAG depende de la competencia entre el O-tARN, por ejemplo el tARN supresor ámbar y un factor de liberación eucarióntico (por ejemplo eRF) (que se enlaza a un codón de retención e inicia la liberación del péptido creciente del ribosoma) , la eficiencia de supresión puede ser modulada por ejemplo al incrementar el nivel de expresión de O-tARN, por ejemplo el tARN supresor. Además, compuestos adicionales pueden también estar presentes, por ejemplo agentes reductores tales como ditiotretiol (DTT) . Aminoácidos no naturales pueden también ser codificados con codones raros. Por ejemplo cuando la concentración de arginina en una reacción de síntesis de proteína in vitro es reducida, el codón de arginina raro, AGG, ha probado ser eficiente para la inserción de Ala mediante un tARN sintético acilado con alanina. Véase, por ejemplo Ma et al., Biochemistry, 32:7939 (1993). En este caso, el tARN sintético compite con el tARNArg que se presenta de manera estable en la naturaleza, existe como especie menor en Escherichia coli. Además, algunos organismos no utilizan todos los codones de triplete. Un codón sin asignar AGA en Micrococcus luteus ha sido utilizado para la inserción de aminoácidos en un extracto de transcripción/traducción in vitro. Véase, por ejemplo Kowal y Oliver, Nucí . Acid . Res . , :4685 (1997). Los componentes de la invención pueden ser generados para usar estos codones raros in vivo. Los codones selectores pueden también comprender codones extendidos, por ejemplo codones de cuatro o más bases, tales como, codones de cuatro, cinco, seis o más bases. Ejemplos de codones de cuatro bases incluyen, por ejemplo AGGA, CUAG, UAGA, CCCU y los semejantes. Ejemplos de codones de cinco bases incluyen, por ejemplo AGGAC, CCCCU, CCCUC, CUAGA, CUACU, UAGGC y los semejantes. Métodos de la invención incluyen utilizar codones extendidos basados en supresión de desplazamiento de cuadro. Codones de cuatro o más bases pueden insertar, por ejemplo uno o múltiples aminoácidos no naturales, a la misma proteina. En otras modalidades, los bucles anticodón pueden descodificar, por ejemplo un codón de cuatro bases, un codón de por lo menos cinco bases o un codón de por lo menos seis bases o más. Puesto que hay 256 codones de cuatro bases posibles, múltiples aminoácidos no naturales pueden ser codificados en la misma célula utilizando un codón de cuatro o más bases. Véase también, Anderson et al., (2002) Exploring the Limits of Codon and Anticodón Size, Chemistry and Biology, 9:237-244; y, Magliery, (2001) Expanding the Genetic Code : Selection of Efficient Suppressors of Four-base Codons and Identification of "Shifty" Four-base Codons with a Library Approach in Escheríchia coli, J. Mol. Biol . 307: 755-769.
Por ejemplo codones de cuatro bases han sido usados para incorporar aminoácidos no naturales a proteínas utilizando métodos biosintéticos in vitro. Véase, por ejemplo Ma et al., (1993) Biochemistry, 32:7939; y Hohsaka et al., (1999) J. Am. Chem . Soc . , 121:34. CGGG y AGGU fueron usados para incorporar simultáneamente 2-naftilalanina y un derivado de NBD de lisina a estreptavidina in vitro con dos tARN supresor de desplazamiento de cuadro acilado químicamente. Véase, por ejemplo Hohsaka et al., (1999) J. Am. Chem. Soc, 121:12194. En un estudio in vivo, Moore et al. Examinaron la habilidad de derivados de tARNLeu con anticodones NCUA para suprimir codones UAGN (N puede ser U, A, G o C) y encontraron que el cuadruplete UAGA puede ser codificado mediante un tARNLeu con un anticodón UCUA con una eficiencia de 13 a 26% con poca decodificación en el cuadro 0 ó -1. Véase Moore et al., (2000) J. Mol. Biol . , 298:195. En una modalidad, codones extendidos basados en codones raros o codones sin sentido pueden ser usados en la invención, que pueden reducir la localización sin sentido y supresión de desplazamiento de cuadro en otros sitios indeseables codones de cuatro bases han sido usados como codones selectores en una variedad de sistemas ortogonales. Véase, por ejemplo WO 2005/019415; WO 2005/007870 y WO 2005/07624. Véase también, Wang y Schultz "Expanding the Genetic Code, " Angewandte Chemie Int. Ed., 44(l):34-66 (2005), el contenido de la cual es incorporado por referencia en su totalidad. En tanto que los ejemplos a continuación utilizan un codón selector ámbar, codones de cuatro o más bases pueden ser usados también, al modificar los ejemplos en la presente para incluir O-tARN de cuatro bases y sintetasas modificadas para incluir mutaciones similares a aquellas descritas previamente para varios O-RS de aminoácido no naturales. Para un sistema dado, un codón selector puede también incluir uno los codones de tres bases naturales, en donde el sistema endógeno no usa (o raramente usa) el codón de base natural. Por ejemplo esto incluye un sistema que es carente de un tARN que reconoce el codón de tres bases natural y/o un sistema en donde el codón de tres bases es un codón raro. Codones selectores incluyen opcionalmente pares de base no naturales. Estos pares de base no naturales expanden adicionalmente el alfabeto genético existente. Un par de base extra incrementa el número de codones de triplete de 64 a 125. Propiedades de pares de tercera parte incluyen apareamiento de base estable y selectivo, incorporación enzimática eficiente a ADN con alta fidelidad mediante una polimerasa y la extensión de cebador continua eficiente después de la síntesis del par de base no natural naciente. Descripciones de pares de base no naturales que pueden ser adaptados para los métodos y composiciones incluyen, por ejemplo Hirao, et al., (2002) An unnatural base pair for incorporating amino acid analogues into protein, Nature Biotechnology, 20:177-182. Véase también u, Y., et al., (2002) J. Am. Chem. Soc. 124:14626-14630. Otras publicaciones relevantes son enlistadas posteriormente en la presente . Para uso in vivo, el nucleósido no natural es permeable a la membrana y es fosforilado para formar el trifosfato correspondiente. Además, la información genética incrementada es estable y no es destruida por enzimas celulares. Esfuerzos previos por Benner y otros tomaron ventaja de patrones de enlace de hidrógeno que son diferentes de aquellos en pares de Watson-Crick canónicos, el ejemplo más notable del cual es el par iso-C:iso-G. Véase, por ejemplo S itzer et al., (1989) J. Am. Chem. Soc, 111:8322; y Piccirilli et al., (1990) Nature, 343:33; Kool, (2000) Curr . Opin . Chem. Biol . , 4:602. Estas bases en general se malaparean a algún grado con bases naturales y no pueden ser replicados enzimáticamente . Kool y colaboradores demostraron que interacciones de empaque hidrofóbicas entre bases pueden reemplazar el enlace de hidrógeno al impulsar la formación de par de bases. Véase Kool, (2000) Curr. Opin. Chem. Biol., 4:602; y Guckian y Kool, (1998) Angew . Chem. Int. Ed. Engl., 36, 2825. en un esfuerzo por desarrollar un par de bases no natural que satisfaga todos los requerimientos anteriores, Schultz, Romesberg y colaboradores han sintetizado sistemáticamente y estudiado una serie de bases hidrofóbicas no naturales. Se encuentra que un autopar PICS:PICS es más estable que los pares de base naturales y puede ser incorporado eficientemente a ADN mediante el fragmento de Klenow de ADN polimerasa I de Escherichia colí (KF) . Véase, por ejemplo McMinn et al., (1999) J. Am. Chem. Soc, 121:11586; y Ogawa et al., (2000) J. Am. Chem. Soc, 122:3274. Un autopar de 3MN : 3MN puede ser sintetizado con KF con eficiencia y selectividad suficientes para función biológica. Véase, por ejemplo Ogawa et al., (2000) J. Am. Chem. Soc, 122:8803. Sin embargo, ambas bases actúan como terminador de cadena para replicación adicional. Una ADN polimerasa mutante ha sido desarrollada recientemente que puede ser usada para replicar el autopar PICS. Además, un autopar 7AI puede ser replicado. Véase, por ejemplo Tae et al., (2001) J. Am. Chem. Soc, 123:7439. Un nuevo par de metalobase, DipicPy, también ha sido desarrollada, que forma un par estable después del enlace a Cu(II). Véase Meggers et al., (2000) J. Am. Chem. Soc, 122:10714. Debido a que los codones extendidos y codones no naturales son intrínsecamente ortogonales a los codones naturales, los métodos de la invención pueden tomar ventaja de esta propiedad para generar tARN ortogonales para ellos. Un sistema de desviación de traducción puede también ser usado para incorporar un aminoácido no natural en un polipéptido deseado. En un sistema de desviación de traducción, una secuencia grande es insertada a un gen pero no es traducida a proteína. La secuencia contiene una estructura que sirve como pista para inducir a un ribosoma a salgar sobre la secuencia y reanudar la traducción corriente abajo de la inserción.
AMINOÁCIDOS NO NATURALES Como se usa en la presente, un aminoácido no natural se ' refiere a cualquier aminoácido, aminoácido modificado o análogo de aminoácido diferente a selenocisteina o pirrolosina y los siguientes 20 aminoácidos alfa codificados genéticamente: alanina, arginina, asparagina, ácido aspártico, cisteina, glutamina, ácido glutámico, glicina, histidina, isoleucina, lisina, metionina, fenilalanina , prolina, serina, treonina, triptófano, tirosina, valina. La estructura genérica de un alfa-aminoácido es ilustrada por la fórmula I: I Un aminoácido no natural es comúnmente cualquier estructura que tenga la fórmula I, en donde el grupo R es cualquier sustituyente diferente al utilizado en los 20 aminoácidos naturales. Véase por ejemplo, Biochemistry de L. Stryer, 3a. edición 1988, Freeman and Company, New Cork, para estructuras de los veinte aminoácidos naturales. Nótese que, los aminoácidos no naturales de la invención pueden ser compuestos que se presentan de manera estable en la naturaleza diferentes a los veinte alfa-aminoácidos anteriores. Debido a que los aminoácidos no naturales de la invención difieren comúnmente de los aminoácidos no naturales en cadena lateral, los aminoácidos no naturales forman enlaces de amida con otros aminoácidos, por ejemplo naturales o no naturales, de la misma manera que son formados en proteínas que se presentan de manera estable en la naturaleza. Sin embargo, los aminoácidos no naturales tienen grupo de cadena lateral que los distingue de los aminoácidos naturales. La figura 1 proporciona las estructuras de aminoácidos no naturales que son usados en los ejemplos de trabajo de la presente invención. Estos aminoácidos no naturales pueden ser incorporados a proteínas utilizando pares de O-RS y O-tARN apropiados. Por ejemplo, p-benzoil-L-fenilalanina (Bpa) puede ser incorporada usando un par de traducción ortogonal que comprende el O-tARN de SEQ ID NO: 1 y la O-RS cognata de SEQ ID NO: 4. para-acetil-L-fenilalanina (pAcPhe) puede ser incorporada usando un par de traducción ortogonal que comprende el O-tARN de SEQ ID NO: 1 y la O-RS cognata de SEQ ID NO: 6. para-azido-L-fenilalanina (pAzPhe) puede ser incorporada usando un par de traducción ortogonal que comprende el O-tARN de SEQ ID NO: 1 y la O-RS cognata de SEQ ID NO: 8. para-yodo-L-fenilalanina (plPhe) puede ser incorporada usando un par de traducción ortogonal que comprende el O-tARN de SEQ ID NO: 1 y la O-RS cognata de SEQ ID NO: 10. Sin embargo, los aminoácidos no naturales usados en la presente sirven solamente para ilustrar la posibilidad de aplicación más amplia de la invención y la invención no está limitada al uso de estos aminoácidos mostrados en la figura 1. Una pluralidad de diferentes aminoácidos no naturales pueden ser incorporados simultáneamente a un polipéptido de interés, por ejemplo, utilizando un segundo par de O-RS/O-tRNA apropiado en conjunción con el primer par ortogonal y en donde los primeros y segundos pares ortogonales utilizan codones selectores diferentes. En otros aminoácidos no naturales, por ejemplo R en fórmula I comprende finalmente un alquil-, aril-, acil-, hidracina, ciano, halo, hidracida, alquenil, éter, borato, bonorato, fósforo, fosfono, enona, imina, hidroxilamina , amina y los semejantes o cualquier combinación de los mismos. Otros aminoácidos no naturales de interés incluyen pero no están limitados a aminoácidos que comprenden agente de reticulación fotoactivables , aminoácidos espin marcados, aminoácidos fluorescentes, aminoácidos de enlace de metal, aminoácidos que contienen metal, aminoácidos radioactivos, aminoácidos con nuevos grupos funcionales, aminoácidos que interactúan covalente o no covalentemente con otras moléculas, aminoácidos fotoenj aulados y/o fotoisomerisables , aminoácidos que contienen biotina o análogos de biotina, aminoácidos de contienen ceto, aminoácidos glicosilados , una porción de sacárido anexada a la cadena lateral de aminoácido, aminoácidos que comprenden polietilenglicol o polieter, aminoácidos sustituidos por átomo pesado, aminoácidos escindibles químicamente o fotoescindibles , aminoácidos con una cadena natural alargada en comparación con aminoácidos naturales (por ejemplo, poliéteres o hidrocarburos de cadena larga, por ejemplo mayor de 5, mayor de aproximadamente 10 átomos de carbono, etc.), aminoácidos que contienen azúcar carbono-enlazados, aminoácidos que contienen aminotioácido y aminoácidos que contienen una o más porciones tóxicas . En otro aspecto, la invención proporciona aminoácidos no naturales que tienen una estructura general interpretada por la formula IV a continuación: Un aminoácido no natural que tiene esta estructura es comúnmente cualquier estructura en donde Ri es un sustituyente usado en uno de los veinte aminoácidos naturales ( por ejemplo, tirosina o fenilanina) y í½ es un sustituyente. Así, este tipo de aminoácidos no natural puede ser visto como un derivado de aminoácido natural . Aminoácidos naturales pueden también comprender opcionalmente estructuras de cadena fundamental modificada, por ejemplo como se ilustra por las estructuras de II Y III: en donde Z comprende comúnmente OH, NH2, SH, NH-R' o S-R'; X y Y, que pueden ser los mismos o diferentes, comprenden comúnmente S u O y R y R' , que son opcionalmente los mismos o diferentes, son seleccionados comúnmente de la misma lista de constituyentes para el grupo R descrita anteriormente para los aminoácidos no naturales que tienen fórmula I, también como hidrógeno. Por ejemplo, los aminoácidos no naturales de la invención comprenden opcionalmente substituciones en el grupo amino o carboxilo, como se ilustra por las fórmulas II y III. Los aminoácidos no naturales de este tipo se incluyen pero no están limitados a alfa-hidroxiácidos , alfa-tioácidos , alfa-aminotiocarboxilatos , por ejemplo con cadenas laterales correspondientes a los 20 aminoácidos naturales comunes o cadenas laterales no naturales. Además, sustituciones*en el carbono alfa incluyen opcionalmente aminoácidos L, D, o a, a- disustituidos, tales como D-glutamato, D-alanina, D-metil-O-tirosina, ácido aminobutí rico y los semejantes. Otras alternativas estructurales incluyen aminoácidos cíclicos, tales como análogos de prolina, también como análogos de prolina de anillo de 3, 4, 6, 7, 8 y 9 miembros, ß y ? aminoácidos, tales como ß-alanina y ácido ?-aminobutírico . En algunos aspectos, la invención utiliza aminoácidos naturales en configuración L. Sin embargo, no se pretende que la invención esté limitada el uso de aminoácidos no naturales de configuración L. Se contempla que los D-enantiómeros de estos aminoácidos no naturales también encuentren uso con la invención . Los análogos de tirosina incluyen tirosinas para-sustituidas, tirosinas orto-sustituidas y tirosinas meta-sustituidas, en donde las tirosinas sustituidas comprenden un grupo alquinilo, grupo aralquilo, un grupo benzoilo, un grupo amino, una hidracina, una hidroxiamina , un grupo tiol, un grupo carboxi, un grupo isopropilo, un grupo metilo, un hidrocarburo de cadena recta o ramificada de C6-C20 un hidrocarburo saturado o insaturado, un grupo O-metilo, un grupo poliéter, un grupo nitro o los semejantes. Además, también se concentran anillos de arilo muchas veces sustituidos. Los análogos de vitaminas de la invención incluyen pero no están limitados a derivados alfa-hidroxi, derivados gamma-sustituidos, derivados cíclicos y derivados de glutamina amida-sustituidos. Ejemplos de análogos de fenilalanina incluyen pero no están limitados a fenilalanina para-sustituida, fenilalanina orto-sustituida y fenilalanina meta-sustituda , en donde el siguiente comprende un grupo alquinilo, un grupo hidroxi, un grupo metoxi, un grupo metilo, un grupo alilo, un grupo aldehido, un nitro, un grupo tiol o un grupo ceto y los semejantes. Ejemplos específicos de aminoácidos no naturales que incluyen pero no están limitados a p-etiltiocarbonil-L-fenilalanina, p- ( 3-oxo-butanoil ) -L-fenilalanina , 1 , 5- (dansil-alanina ) , aminoácido de 7-amino-cumarina, aminoácido de 7-hidroxi-cumarina , nitrobenvil . serina , 0- ( 2-nitrobencil ) -L-tirosina , p-carboximetil-L-fenilalanina, p-ciano-L-fenilalanina, m-ciano-L-fenilalanina , bifenilalanina , 3-amino-L-t irosina , bipiridilalanina , p- ( 2-amino-l-hidroxietil ) -L-fenilalanina , p-isopropiltiocarbonil-L-fenilalanina, 3-nitro-L-tirosina y p-nitro-L-fenilalanina . También, una p-propargiloxifenilalanina , una 3 , 4 -dihidroxi-L-fenilalanina (DHP), una 3 , 4 , 6-trihidroxi-L-fenilalanina , una 3 , 4 , 5-trihidroxi-L-fenilalanina , 4-nitro-fenilalanina, una p-acetil-L-fenilalanina, O-metil-L-tirosina, una L-3-(2-naftil ) alanina , una 3-metil-fenilalanina , una 0-4-alil-L-tirosina, una 4 -propil-L-tirosina , una 3-nitro-tirosina, una 3-tiol-tirosina , una tri-O-acetil-GlcNacp-serina, una L-Dopa, una fenilalanina fluorada, una isopropil-L-fenilalanina, una p-azido-L-fenilalanina , una p-acil-L-fenilalanina, una p-benzoil-L-fenilalanina , una L-fosfoserina , una fosfonoserina, una fosfonotirosina, una p-yodo-fenilalanina , una p-bromofenilalanina, una p-amino-L-fenilalanina y una isopropil-L-fenilalanina y los semejantes. Las estructuras de una variedad de aminoácidos no naturales pueden ser incorporadas utilizando sistemas de traducción ortogonales son conocidas. Véanse las referencias citadas en la presente, cada una de las cuales es incorporada en la presente por referencia en su totalidad .
Síntesis química de aminoácidos no natirales Muchos de los aminoácidos no naturales provistos anteriormente están disponibles comercialmente , por ejemplo de Sigma (EUA) o Aldrich (Milwaukee, WI, EUA) . Aquellos que no están disponibles comercialmente son sintetizados opcionalmente como se estipula en varias publicaciones o usando métodos estándar conocidos para aquellos de habilidad en el arte. Para técnicas de síntesis orgánica, véase por ejemplo, Organic Chemistry por Fessendon y Fessendon (1982, 2a edición, Willard Grant Press, Boston Mass.); Advanced Organic Chemistry por March (3a edición, 1985, Wiley and Sons, nueva York) y Advanced Organic Chemistry, por Carey y Sundberg (3a edición, Partes A y B, 1990, Plenum Press, Nueva York). Publicaciones adicionales que describen la síntesis de aminoácidos no naturales incluyen por ejemplo, WO 2002/085923 intitulado "In vivo incorporation of Unnatural Amino Acids;" Matsoukas et al., (1995) J. Med.
Chem. , 38, 4660-4669; King y Kidd (1949) A New Synthesis of Glutamine and of ?-Dipeptides of Glutamic Acid from Phthylated Intermediates . J . Chem . Soc . , 3315-3319; Friedman y Chatterrji (1959) Synthesis of Derivatives of Glutamine as Model Substrates for Anti-Tumor Agents. J. Am. Chem. Soc. 81, 3750-3752; Craig et al. (1988) Absolute Configuration of the Enantiomers of l-Chloro-4 [ [ 4- (diethylamino) -1-methylbutyl] amino] quinoline (Chloroquine) . J. Qrg. Chem. 53, 1167-1170; Azoulay et al., (1991) Glutamine analogues as Potential Antimalarials , . Eur. J. Med. Chem. 26, 201-5; Koskinen y Rapoport (1989) Synthesis of 4 -Substítuted Prolines as Conforma tionally Constrained Amino Acid Analogues . J. Qrg. Chem. 54, 1859-1866; Christie y Rapoport (1985) Synthesis of Optically Puré Pipecolates from L-Asparagine . Application to the Total Synthesis of (+) -Apovincamine through Amino Acid Decarbonylation and Iminium Ion Cyclization. J. Qrg. Chem. 1989:1859-1866; Barton et al. (1987) Synthesis of Novel a-Amino-Acids and Derivatives Using Radical Chemistry : Synthesis of L- and D-a-Amino-Adipic Acids, L-a-aminopimelic Acid and Appropriate Unsaturated Derivatives. Tetrahedron Lett . 43:4297-4308; y Subasinghe et al., (1992) Quisqualic acid analogues: synthesis of beta-heterocyclic 2-aminopropanoic acid derivatives and their activity at a novel quisqualate-sensitized site. J. Med. Chem. 35:4602-7. Véase también Publicación Internacional WO* 2004/058946, intitulada "PROTEIN ARRAYS," presentada el 22 de diciembre de 2003.
Absorción celular de aminoácidos no naturales La absorción de aminoácido no natural por una célula es una cuestión que es considerada comúnmente cuando se designan y seleccionan aminoácidos no naturales, por ejemplo, para la incorporación a una proteina. Por ejemplo, la alta densidad de carga de -aminoácidos sugiere que es improbable que estos compuestos sean permeables a la célula. Los aminoácidos naturales son absorbidos a la célula vía una colección de sistemas de transporte a base de proteina que exhiben frecuentemente grados variables de especificidad de aminoácidos. Se puede hacer una selección rápida que determina cuáles aminoácidos no naturales, si los hay, son absorbidos por las células. Véase, por ejemplo, los análisis de toxicidad en la Publicación Internacional WO 2004/058946, intitulada " PROTEIN ARRAYS" presentada el 22 de diciembre de 2003 y Liu y Schiltz (1999) Progress toward the evolution of an organism with an expanded genetic code. PNAS 96:4780-4785. Aunque la solución es fácilmente analizada con varios análisis, una alternativa a diseñar aminoácidos no naturales que son propensos a rutas de absorción celular es proporcionar rutas biosintéticas para crear aminoácidos in vivo.
Biosinstesis de aminoácidos no naturales Existen ya muchas rutas biosintéticas en células para la producción de aminoácidos y otros compuestos. En tanto que un método biosintético para un aminoácido no natural particular puede no existir en la naturaleza, por ejemplo, en una célula, la invención proporciona tales métodos. Por ejemplo, rutas biosintéticas para aminoácidos no naturales son generadas opcionalmente en células huésped al agregar nuevas enzimas o modificar rutas de células huésped existentes. Nuevas enzimas adicionales son opcionalmente enzimas que se presentan de manera estable en la naturaleza o enzimas desarrolladas artificialmente. Por ejemplo, la biosinteis de p-aminofenilalanina (tal como se presenta en un ejemplo en WO 2002/085923, supra) depende de la adición de una combinación de enzimas conocidas de otros organismos. Los genes para estas enzimas pueden ser introducidos a una célula al transformar la célula con un plásmido que comprende los genes. Los genes, cuando son expresados en las células, proporcionan una ruta enzimática para sintetizar el compuesto deseado. Ejemplos de los tipos de enzimas que son agregadas opcionalmente son provistos en los ejemplos a continuación. Secuencias de enzimas adicionales son encontradas por ejemplo en GenBank. Enzimas desarrolladas artificialmente también son agregadas opcionalmente a una célula de la misma manera. De esta manera, la maquinaria y recursos celulares de una célula son manipulados para producir aminoácidos no naturales.
Idealmente, cualquiera de una variedad de métodos pueden ser usados para producir nuevas enzimas para uso en rutas biosintéticas o para evolución de rutas existentes, para la producción de aminoácidos no naturales, in Vitro o in vivo. Muchos métodos disponibles para desarrollar enzimas y otros componentes de ruta biosintética pueden ser aplicados a la presente invención para producir aminoácidos no naturales (o por supuesto, para desarrollar sintetasas que tienen nuevas especificidades de sustrato u otras actividades de interés). Por ejemplo, entremezclas de ADN es usado opcionalmente para desarrollar nuevas enzimas y/o rutas de tales enzimas para la producción de aminoácidos no naturales (o producción de nuevas sintetasas) in Vitro o in vivo. Véase, por ejemplo, Stemmer (1994), Rapid evolution of a protein in vitro by DNA shuffling, Nature 370 (4 ): 389-391; y Stemmer, (1994), DNA shuffling by random fragmentation and reassembly: In vitro recombination for molecular evolution, Proc. Nati. Acad. Sci . USA., 91:10747-10751. Un procedimiento relacionado entremezcla familias de genes relacionados (por ejemplo, homólogos) para desarrollar rápidamente enzimas con características deseadas. Un ejemplo de tales métodos de "entremezcla de gen de familia" es encontrado en Crameri et al. (1998) "DNA shuffling of a family of genes from diverse species accelerates directed evolution" Nature , 391(6664): 288-291. Nuevas enzimas (ya sea componentes de rutas biosintéticas o sintetasas) pueden también ser generadas utilizando un procedimiento de recombinación de ADN conocido como "truncación incremental para la creación de hidroenzimas" ("ITCHY"), por ejemplo, como se describe en Ostermeier et al. (1999) "A combinatorial approach to hybrid enzymes independent of DNA homology" Nature Biotech 17:1205. Este procedimiento puede también ser usado para generar una biblioteca de enzimas u otras variantes de rutas que pueden servir como sustratos para uno o más métodos de recombinación in Vitro o in vivo. Véase, también Ostermeier et al. (1999) "Combinatorial Protein Engineering by Incremental Truncation, " Proc . Nati. Acad. Sci. USA, 96: 3562-67 y Ostermeier et al. (1999), "Incremental Truncation as a Strategy in the Engineering of Novel Biocatalysts , " Biological and Medicinal Chemistry, 7: 2139-44. Otro procedimiento utilize mutagenesis de ensamble exponencial para producer biblioteca de enzimas y otras variantes de ruta que son, por ejemplo, seleccinadas en cuanto a una habilidad para catalizar una reacción biosintética relevante para producir un aminoácido no natural (o una nueva sintetasa) . En este procedimiento, grupos pequeños de residuos en una secuencia de interés son aleatorizados en paralelo para identificar, en cada condición alterada, aminoácidos que conducen a proteínas funcionales. Ejemplos de tales procedimientos, que pueden ser adaptados a la presente invención para producir nuevas enzimas para la producción de aminoácidos no naturales (o nuevas sintetasas) son encontrados en Delegrave y Youvan (1993) Biotechnology Research 11:1548-1552. En todavía otro procedimiento, mutagénesis aleatoria o semi-aleatoria utilizando oligonucleótidos purificados u oligonucleótidos degenerados para el diseño de enzimas y/o diseño de componentes de ruta pueden ser usados, por ejemplo, al utilizar los métodos de mutagénesis general de por ejemplo, Arkin y Youvan (1992) "Optimizing nucleotide mixtures to encode specific subsets of amino acids for semi-random mutagenesis" Biotechnology 10:297-300; o Reidhaar-Olson et al. (1991) "Random mutagenesis of protein sequences using oligonucleótide cassettes" Methods Enzymol. 208:564-86. Todavía otro procedimiento, denominado frecuentemente mutagénesis "no estocástica" , que utiliza el re-ensamble de polinucleótidos y mutagénesis de saturaciones de sitio pueden ser usados para producir enzimas y/o componentes de ruta, que pueden luego ser seleccionados por capacidad para efectuar una o más funciones de sintetasa o de ruta biosintética (por ejemplo, para la producción de aminoácidos no naturales in vivo) . Véase, por ejemplo, WO 2000/046344, intitulada "NON-STOCHASTIC GENERATION OF GENETIC VACCINES AND ENZYMES" de Short . Una alternative para tales métodos mutacionales involucra recombinar genomas enteros de organismos y seleccionar la progenie resultante en cuanto a funciones de ruta particulares (denominado frecuentemente como "entremezcla de genoma entero") . Este procedimiento puede ser aplicado a la presente invención, por ejemplo, mediante recombinación y selección genómica de uno de los organismos (por ejemplo, un E. coli u otra célula) por la habilidad para producir un aminoácido no natural (o intermediario del mismo). Por ejemplo, métodos enseñados en las siguientes publicaciones pueden ser aplicados al diseño de rutas para la evolución de rutas existentes y/o nuevas rutas en células para proteger aminoácidos no naturales in vivo: Patnaik et al. (2002) "Genome shuffling of lactobacillus for improved acid tolerance" Nature Biotechnology, 20(7): 707-712; and Zhang et al. (2002) "Genome shuffling leads to rapid phenotypic improvement in bacteria" Nature, 7 de febrero, 415(6872): 644-646. Otras técnicas para el diseño de organismos y diseño de rutas metabólicas, por ejemplo, para la producción de compuestos deseados también están disponibles y pueden también ser aplicados a la producción de aminoácidos no naturales. Ejemplos de publicaciones que enseñan procedimientos de diseños de rutas útiles incluyen: Nakamura y White (2003) "Metabolic engineering for the microbial production of 1,3 propanediol" Curr. Opin. Biotechnol . 14(5):454-9; Berry et al. (2002) "Application of Metabolic Engineering to improve both the production and use of Biotech Indigo" J. Industrial Microbiology and Biotechnology 28:127-133; Banta et al. (2002) "Optimizing an artificial metabolic path ay: Engineering the cofactor specificity of Corynebacterium 2 , 5-diketo-D-gluconic acid reductase for use in vitamin C biosynthesis" Biochemistry, 41(20), 6226-36; Selivonova et al. (2001) "Rapid Evolution of Novel Traits in Microorganisms" Applied and Environmental Microbiology, 67:3645 y muchas otras. Sin consideración del método usado, comunmente, el aminoácido no natural producido por una ruta biosintética diseñada de la invención es producido en una concentración suficiente para la biosintesis de proteina eficiente, por ejemplo, una cantidad celular natural, pero no a tal grado para afectar significativamente la concentración de otros aminoácidos celulares o para agotar los recursos celulares. Las concentraciones típicas producidas in vivo de esta manera son de aproximadamente 10 mM a aproximadamente 0.05 mM . Una vez que una célula es diseñada para producir las enzimas deseadas, para una ruta específica y se genera un aminoácido no natural, selecciones in vivo son usadas opcionalmente para optimizar adicionalmente la producción del aminoácido no natural para la síntesis de proteína ribosomal y crecimiento celular.
Componentes ortogonales que encuentran uso con la Invención La incorporación del aminoácido no natural en la proteína se lleva a cabo por pares ortogonales que incorporan el aminoácido no natural en respuesta a la señal sinérgica del codón selector en E. coli, en donde los componentes ortogonales no reaccionan de manera cruzada con componentes de E. coli endógenos de la maquinaria de traducción de la máquina, pero reconocen el aminoácido no natural deseado y la incorporan a proteínas en respuesta al codón selector (por ejemplo, un codón sin sentido ámbar, TAG) . Los componentes ortogonales que encuentran uso con la invención incluyen aminoacil-tARN sintetasas ortogonales derivadas de tirosil tARN-sintetasa de Methanococcus jannaschii y el supresor ámbar tirosil tARNCuA mutante, que funciona como par ortogonal en una célula huésped eubacteriana tal como E. coli. En este sistema, las aminoacil-tARN sintetasas mutantes aminoacilan el tARN supresor con su respectivo aminoácido no natural y no con cualquiera de los veinte aminoácidos comunes. Métodos para producir componentes ortogonales encuentran uso con la invención, en donde estos métodos dan como resultado la incorporación de aminoácidos no naturales, por ejemplo pero no limitados a los aminoácidos no naturales provistos en la Figura 1, a una cadena de polipéptidos creciente en respuesta a un codón selector, por ejemplo, un codón de retención ámbar, un codón sin sentido, un codón de cuatro o más base, etc., por ejemplo, in vivo. Por ejemplo, tARN ortogonales (O-tARN) , aminoacil-tARN sintetasas ortogonales (O-RS) y pares de los mismos encuentran uso con la invención . En algunas modalidades, estos pares pueden ser usados para incorporar un aminoácido no natural a cadenas de polipéptidos crecientes y subsecuentemente el polipéptido es modificado pos-traduccionalmente . Para información adicional con respecto a aminoácidos no naturales que pueden ser modificados pos-traduccionalmente véase, por ejemplo, los sistemas ortogonales de aminoácidos no naturales descritos en Chin et al., Science (2003) 301:964-967; Zhang et al., Proc. Nati. Acad. Sci. U.S. A. 2004, 202:8882-8887; Anderson et al., Proc. Nati. Acad. Sci. U.S. A. 2004, 202:7566-7571; Wang et al., (2001) Science 292:498-500; Chin et al., (2002) Journal of the American Chemical Society 124:9026-9027; Chin y Schultz, (2002) ChemBioChem 11:1135-1137; Chin, et al., (2002) PNAS United States of America 99:11020-11024; Wang y Schultz, (2002) Chem. Comm . , 1-10; Wang y Schultz "Expanding the Genetic Code, " Angewandte Chemie Int. Ed. , 44(1): 34-66 (2005); Xie y Schultz, "An Expanding Genetic Code," Methods 36:227-238 (2005); y Deiters et al, Bioorganic & Medicinal Chemistry Letters 15:1521-1524 (2005), cada una de las cuales es incorporada por referencia en su totalidad. Véanse también los sistemas ortogonales de aminoácidos no naturales descritos en las Publicaciones Internacionales WO 2002/086075, intitulada "METHODS AND COMPOSITIONS FOR THE PRODUCTION OF ORTHOGONAL tRNA AMINOACYL-tRNA SYNTHETASE PAIRS;" WO 2002/085923, intitulada "IN VIVO INCORPORATION OF UNNATURAL AMINO ACIDS;" WO 2004/094593, intitulada "EXPANDING THE EUKARYOTIC GENETIC CODE;" WO 2005/019415, presentada el 7 de Julio de 2004; WO2005/007870, presentada el 7 de Julio de 2004; O 2005/007624, presentada el 7 de Julio de 2004; WO 2006/034332, presentada el 20 de septiembre de 2005; y WO 2006/110182 intitulada "ORTHOGONAL TRANSLATION COMPONENTS FOR THE IN VIVO INCORPORATION OF UNNATURAL AMINO ACIDS" presentada el 27 de octubre de 2005 por Schultz et al. En ciertas modalidades, las O-RS que encuentran uso con la invención aminoacilan preferiblemente el I-tARN sobre cualquier tARN endógeno con el aminoácido no natural particular, en donde la O-RS tiene predisposición por el O-tARN y en donde la proporción de la O-tARN cargado con un aminoácido no natural al tARN endógeno cargado con el mismo aminoácido no natural es mayor de 1:1 y más preferiblemente, en donde la O.RS carga el O-tARN exclusova o casi exclusivamente. La invención también hace uso de tARN ortogonales (0-tARN), en donde el O-tARN reconoce un codón selector. Comúnmente, un O-tARN incluye por lo menos aproximadamente, por ejemplo, un 45%, un 50%, un 60%, un 75%, un 80% o un 90% o más eficiencia de supresión en presencia de una sintetasa cognata en respuesta a un codón selector en comparación con la eficiencia de supresión de un O-tARN que comprende o es codificado por una secuencia de polinucleótidos como se resume en los listados de secuencias (por ejemplo, SEQ ID NO: 1) . En una modalidad, la eficiencia de supresión de la O-RS y el O- tARN conjuntamente es, por ejemplo, 5 veces, 10 veces, 15 veces, 20 veces, 25 veces o mayor que la eficiencia de supresión de O-tARN en ausencia de una O-RS. En algunos aspectos, la eficiencia de supresión de la O-RS y el O-tARN conjuntamente es por lo menos 45% de la eficiencia de supresión de un par de tirosin-tARN sintetasa ortogonal derivado de Methanococcus jannaschii. La invención hace uso de células (por ejemplo, E. coli) que comprenden un sistema de traducción y secuencias de nucleótidos que programan la producción de proteínas, en donde el sistema de traducción incluye un t-ARM ortogonal (O-tARN) , una aminoacil-tARN sintetasa ortogonal (O-RS) y un aminoácido no natural. Comúnmente, la O-RS aminoacila preferiblemente el O-tARN con respecto a cualquier tARN endógeno con el aminoácido no natural, en donde la O-RS tiene predisposición por el O-tARN y en donde la proporción de O-tARN cargado con el aminoácido no natural al tARN endógeno cargado con el aminoácido no natural es mayor de 1:1 y más preferiblemente, en donde la O-RS carga el O-tARN exclusivamente o casi exclusivamente. El O-tARN reconoce el codón selector y la O-RS aminoacila preferiblemente el O-tARN con un aminoácido no natural. Varios polinucleótidos también encuentran uso con la invención. Estos polinucleótidos incluyen un polinucleótido artificial (por ejemplo, artificial y que no se presenta de manera estable en la naturaleza, por ejemplo, recombinante ) que comprende una secuencia de nucleótidos que codifica una O-RS. Un polinucleótido que encuentra uso con la invención pueden también incluir un ácido nucleico que se hibridiza a un polinucleótido descrito anteriormente, a condiciones altamente severas, en sustancialmente toda la longitud del ácido nucleico. Vectores que comprenden pol inucleótidos también encuentran uso con la invención. Por ejemplo, un vector puede incluir un plásmido, un cósmico, un fago, un virus, un vector de expresión y/o los semejantes. Métodos para producir componentes del par de O-tARN/O-RS son conocidos y encuentran uso con la invención. Véase la presente revelación y las referencias citadas en la misma.
SECUENCIAS Y VARIANTES DE ÁCIDOS NUCLEICOS Y POLIPÉPTIDOS Como se describe en la presente, secuencias de polinucleótidos que codifican, por ejemplo, O-tARN y O-RS encuentran uso con la invención, como también las respectivas secuencias de aminoácidos codificadas por los polinucleótidos. La revelación proporciona ejemplos y referencias de secuencias de polinucleótidos y polipéptidos que encuentran uso con la invención. Sin embargo, se apreciará que el uso de la invención no está limitado a aquellas secuencias reveladas en la presente. Aquel de habilidad apreciará que la invención también proporciona muchas secuencias relacionadas con las funciones descritas en la presente, por ejemplo, polinucleótidos y polipéptidos que codifican variantes conservadoras de una O-RS revelada en la presente. Un polinucleótido que encuentra un uso con la invención también incluye un polinucleótido artificial que es, por ejemplo, por lo menos 75%, por lo menos 80%, por lo menos 90%, por lo menos 95%, por lo menos 98% o más idéntico a aquel de un tARN que se presenta de manera estable en la naturaleza (pero que es diferente a un tARN que se presenta de manera estable en la naturaleza. Un polinucleótido que encuentra junto con la invención también incluye un polinucleótido artificial que es, por ejemplo, por lo menos 75%, por lo menos 80%, por lo menos 90%, por lo menos 95%, por lo menos 98% o más idéntico (pero no 100% idéntico) a aquel de un tARN que se presenta de manera estable en la naturaleza. En ciertas modalidades, un vector que encuentra uso con la invención (por ejemplo, un plásmido, un cósmico, un fago, un virus, etc.) comprende un polinucleótido que encuentra uso con la invención. En algunas modalidades, el vector es un vector de expresión. En otras modalidades, el vector de expresión incluye un promotor enlazado operativamente a uno o más de los polinucleótidos de la invención. En otras modalidades, una célula comprende un vector que incluye un polinucleótido que encuentra uso con la invención. Aquellos de habilidad en el arte apreciará que muchas variantes de las secuencias reveladas también encuentran el uso con la invención. Por ejemplo, variantes conservadoras de las secuencias reveladas que producen una secuencia funcionalmente idéntica encuentran uso con la invención. Variantes de las secuencias de polipéptidos de ácidos nucleicos, en donde las variantes se purifican a por lo menos una secuencia revelada, encuentran uso con la invención.
Variantes conservadoras Debido a la degeneración del código genético, "sustituciones silentes" (esto es, sustituciones en una secuencia de ácido nucleico que no da como resultado una alteración en un polipéptido codificado) son un aspecto implicado de cada secuencia de ácidos nucleicos que codifica una secuencia de aminoácidos. Simi larmente , "sustituciones de aminoácidos conservadoras", en donde uno o un número limitado de aminoácidos en una secuencia de aminoácidos son sustituidos con diferentes aminoácidos con propiedades altamente similares, son también fácilmente identificados como siendo altamente similares a un constructo revelado. Tales variantes conservadoras de cada secuencia revelada son un aspecto de la presente invención. "Variantes conservadoras" de una secuencia de ácido nucleico particular se refiere a aquellos ácidos nucleicos que codifican secuencias de aminoácidos idénticas o esencialmente idénticas o en donde el ácido nucleico no codifica una secuencia de aminoácidos, a secuencias sustancialmente idénticas. Aquellos de habilidad en el arte reconocerán que sustituciones, cancelaciones o adiciones individuales que alteran, se agregan o cancelan un solo aminoácido o un pequeño porcentaje de aminoácidos (comúnmente menos de 5%, más comúnmente menos de 4%, 2% o 1%) en una secuencia codificada con "variantes codificadas conservadoramente" , en donde las alteraciones dan como resultado la cancelación de un aminoácido, adición de un aminoácido o sustitución de un aminoácido con un aminoácido químicamente similar. Así, las "variaciones conservadoras" de una secuencia de polipéptidos enlistadas de la presente invención incluye sustituciones de un pequeño porcentaje, comúnmente menos de 5%, más comúnmente menos de 2% o 1% de los aminoácidos de la secuencia de polipéptidos con un aminoácido del mismo grupo de sustitución conservadora. Finalmente, la adición de secuencias que no alteran la actividad codificada de una molécula de ácido nucleico, tal como la adición de una secuencia no funcional, es una variación conservadora del ácido nucleico básico. Tablas de sustitución conservadoras que proporcionan aminoácidos funcionalmente similares son bien conocidas en el arte, en donde un residuo de aminoácidos es sustituido por otro residuo de aminoácido que tiene propiedades químicas similares (por ejemplo, cadenas laterales aromáticas o cadenas laterales cargadas positivamente) y por consiguiente no cambia sustancialmente las propiedades funcionales de la molécula de polipéptido. Lo siguiente resume grupos ejemplares que contienen aminoácidos naturales de propiedades químicas similares, en donde las sustituciones dentro de un grupo es una "sustitución conservadora".
TABLA 1 Sustituciones de aminoácidos conservadoras Hibridización de ácido nucleico Se puede usar hibridización comparativa para identificar ácidos nucleicos que encuentran uso con la invención, en las que se incluyen variaciones conservadoras de ácidos nucleicos provistas en la presentes y este método de hibridi zación comparativo es un método preferido para distinguir ácidos nucleicos que encuentran uso con la invención. Ácidos nucleicos objetivo que se hibridizan a ácidos nucleicos provistos o a los que se hace referencia en la presente bajo condiciones de alta, ultra alta y ultra-ultra alta severidad también encuentran uso con la invención. Ejemplos de tales ácidos nucleicos incluyen aquellos con una o unas pocas sustituciones de ácido nucleico silente o conservadoras en comparación con una secuencia de ácidos nucleicos dada. Se dice que un ácido nucleico de prueba se hibridiza específicamente a un ácido nucleico de sonda cuando se hibridiza por lo menos 50% también a las sondas como el objetivo complementario perfectamente coincidente, esto es, con una proporción de señal a ruido por lo menos la mitad tan alta como la hibridización de la sonda al objetivo bajo condiciones en las cuales la sonda perfectamente coincidente se enlaza al objetivo complementario perfectamente coincidente con una proporción de señal a ruido que es por lo menos a aproximadamente 5x-10x tan alta como aquella observada para la hibridización a cualquiera de los ácidos nucleicos objetivo sin coincidir . Los ácidos nucleicos se "hibridizan" cuando se asocian, comúnmente en solución. Los ácidos nucleicos se hibridizan debido a una variedad de fuerzas fisicoquímicas bien caracterizadas, tales como enlace de hidrógeno, exclusión de solvente, apilado de base y los semejantes. Una guia extensa a la hibridi zación de ácidos nucleicos se encuentra en Tijssen (1993) Laboratory Techniques in Biochemistry and Molecular Biology--Hybridization with Nucleic Acid Probes part I chapter 2, "Overview of principies of hybridization and the strategy of nucleic acid probé assays," (Elsevier, New York), asi como en Current Protocols in Molecular Biology, Ausubel et al., eds . , Current Protocols, a joint venture between Greene Publishing Associates, Inc. y John Wiley & Sons, Inc., (complemento desde 2004) ("Ausubel"); Hames y Higgins (1995) Gene Probes 1 IRL Press en Oxford University Press, Oxford, England, (Hames y Higgins 1) y Hames y Higgins (1995) Gene Probes 2 IRL Press en Oxford University Press, Oxford, Inglaterra (Hames y Higgins 2) proporciona detalles en cuanto a la síntesis, marcación, detección y cuantificación de ADN y ARN que incluye oligonucleótidos . Un ejemplo de condiciones de hibridización severas para la hibridización de ácidos nucleicos complementarios que tienen más de 100 residuos complementarios en un filtro en un Southern o Northern blot es formalina al 50% con 1 mg de heparina a 42°C, la hibridización se lleva a cabo durante toda la noche. Un ejemplo de condiciones de lavado severas es un lavado con SSC 0.2x a 65°C durante 15 minutos (véase, Sambrook, supra para una descripción de la selección reguladora del pH SSC) . Frecuentemente el lavado de alta severidad es precedido por un lavado de baja severidad para remover la señal de sonda de fondo. Un lavado de baja severidad ejemplar es 2x SSC a 40°C durante 15 minutos. En general, una proporción de señal a ruido de 5x (o más alta) que aquella observada para una sonda no relacionada en el análisis de hibridi zación particular indica detección de una hibridi zación especifica. "Condiciones de lavado de hibridización severa" en el contexto de experimentos de hibridización de ácido nucleico tales como hibridizaciones Southern y Northern son dependientes de secuencia y son diferentes bajo diferentes parámetros ambientales. Una guia extensa para la hibridización de ácidos nucleicos se encuentra en Tijssen (1993), supra . y en Hames y Higgins, 1 y 2. Las condiciones de hibridización y lavado severas pueden fácilmente ser determinadas empíricamente para cualquier ácido nucleico de prueba. Por ejemplo en la determinación de condiciones de hibridización y lavado severas, las condiciones de hibridización y lavado son incrementadas gradualmente (por ejemplo, al incrementar la temperatura, disminuir la concentración de sal, incrementar la concentración de detergente y/o incrementar la concentración de solventes orgánicos tales como formalina en la hibridización o lavado) , hasta que se cumple con un conjunto seleccionado de criterios. Por ejemplo, en condiciones de hibridización y lavado altamente severas, las condiciones de hibridización y lavado son incrementadas gradualmente hasta que una sonda se enlaza a un objetivo complementario perfectamente coincidente con una proporción de señal ruido que es por lo menos 5x tan alta como aquella observada' para la hibridi zación de la sonda a un objetivo sin coincidir. Condiciones "muy severas" son seleccionadas para ser iguales al punto de fusión térmico (Tm) para una sonda particular. La Tm es la temperatura (bajo fuerza iónica y pH definido) a la cual el 50% de la secuencia de prueba se hibridiza a una sonda perfectamente coincidente. Para los propósitos de la presente invención, en general, las condiciones de hibridi zación y lavado "altamente severas" son seleccionadas para ser de aproximadamente 5°C más baja que la Tm para secuencia especifica a una fuerza iónica y pH definidos . Condiciones de hibridización y lavado de "ultra alta severidad" son aquellas en las cuales la severidad de las condiciones de hibridización y lavado son incrementadas hasta que la proporción de señal a ruido para el enlace de la sonda al ácido nucleico objetivo complementario perfectamente coincidente en por lo menos lOx tan alta como aquella observada para la hibridización a cualquiera de los ácidos nucleicos objetivo sin coincidir. Un ácido nucleico objetivo que se hibridiza a una sonda bajo tales condiciones, con una proporción de señal a ruido de por lo menos 1/2 de aquella del ácido nucleico objetivo complementario perfectamente coincidente se dice que se enlaza a la sonda bajo condiciones de ultra-alta severidad. Similarmente , aún niveles más altos de severidad pueden ser determinados al incrementar gradualmente las condiciones de hibridización y/o lavado del análisis de hibridi zación relevante. Por ejemplo, aquellos en los cuales la severidad de las condiciones de hibridización y lavado son incrementadas hasta que la proporción de señal de ruido para enlace de la sonda al ácido nucleico objetivo complementario perfectamente coincidente es por lo menos ???, 20X, 50X, 100X o 500X o más tan alta como aquella observada para la hibridización a cualquiera de los ácidos nucleicos objetivos sin coincidir. Un ácido nucleico objetivo que se hibridiza a una sonda bajo tales condiciones, con una proporción de señal a ruido de por lo menos 1/2 de aquella del ácido nucleico objetivo complementario perfectamente coincidente se dice que se enlaza a la sonda bajo condiciones de ultra-ultra-alta severidad . Los ácidos nucleicos que no se hibridizan entre si bajo condiciones severas son todavía sustancialmente idénticos si los polipéptidos que codifican son sustancialmente idénticos. Esto ocurre, por ejemplo, cuando se crea una copia de un ácido nucleico utilizando la degeneración de codón máxima permitida por el código genético.
Subsecuencias únicas En algunos aspectos, la invención utiliza un ácido nucleico que comprende una subsecuencia única en un ácido nucleico seleccionado de las secuencias de O-tARN y O-RS reveladas o a las que se hace referencia en la presente. La subsecuencia única es única en comparación con un ácido nucleico correspondiente a cualquier secuencia de ácido nucleico de O-tARN u O-RS conocida. La alineación puede ser efectuada utilizando, por ejemplo BLAST, ajustado a parámetros predeterminados. Cualquier subsecuencia única es útil, por ejemplo como sonda para identificar los ácidos nucleicos de la invención . Similarmente , la invención utiliza un polipéptido que comprende una subsecuencia única en un polipéptido seleccionado de las secuencias de O-RS reveladas o a las que se hace referencia en la presente. Aquí, la subsecuencia única es única en comparación con un polipéptido correspondiente a cualquiera ' de la secuencia de polipéptidos conocida. La invención también proporciona ácidos nucleicos objetivo que se hibridizan bajo condiciones severas a un oligonucleótido de codificación único que codifica una subsecuencia única en un polipéptido seleccionado de las secuencias de O-RS, en donde la subsecuencia única es única en comparación con un polipéptido correspondiente a cualquiera de los polipéptidos de control (por ejemplo secuencias originales o secuencias padre de las cuales la sintetasas de la invención fueron derivada, por ejemplo mediante mutación). Las secuencias únicas son determinadas como se indica anteriormente.
Comparación de secuencia, identidad y homología Los términos "idéntico" o "por ciento de identidad", en el contexto de dos o más secuencias de ácidos nucleicos o polipéptidos , se refieren a dos o más secuencias o subsecuencias que son las mismas o tienen un porcentaje especificado de residuos de aminoácidos o nucleótidos que son los mismos, cuando son comparados y alineados para máxima correspondencia, tal como se mide utilizando uno de los algoritmos de comparación de secuencias descritos posteriormente en la presente (u otros algoritmos disponibles para personas experimentadas en el arte) o mediante inspección visual . La frase "sustancialmente idéntico", en el contexto de dos ácidos nucleicos o polipéptidos (por ejemplo ADN que codifican un O-tARN u O-RS o la secuencia de aminoácidos de una O-RS) se refiere a dos o más secuencias o subsecuencias que tienen por lo menos aproximadamente 60%, aproximadamente 80%, aproximadamente 90-95%, aproximadamente 98%, aproximadamente 99% o más identidad de residuos de nucleótidos o aminoácidos, cuando son comparados y alineados para máxima correspondencia, tal como se mide utilizando un algoritmo de comparación de secuencias o mediante inspección visual. Tales secuencias "sustancialmente idénticas" se consideran comúnmente "homologas", sin referencia a los ancestros reales. Preferiblemente, la "identidad sustancial" existe sobre una región de las secuencias que es de por lo menos aproximadamente 50 residuos de longitud, más preferiblemente sobre una región de por lo menos aproximadamente 100 residuos y más preferiblemente, las secuencias son sustancialmente idénticas sobre por lo menos aproximadamente 150 residuos o sobre la plena longitud de las dos secuencias a ser comparadas. Proteínas y/o secuencias de proteínas son "homologas" cuando son derivadas, natural o artificialmente, de una proteína o secuencia de proteínas ancestral común. Similarmente, ácidos nucleicos y/o secuencias de ácidos nucleicos son homólogos cuando son derivados, natural o artificialmente, de un ácido nucleico o secuencia de ácidos nucleicos ancestral común. Por ejemplo cualquier ácido nucleico que se presenta de manera estable en la naturaleza puede ser modificado mediante cualquier método de mutagénesis disponible para incluir uno o más codones selectores. Cuando es expresado, este ácido nucleico mutagenizado codifica un polipéptido que comprende uno o más aminoácidos no naturales. El proceso de mutación puede por supuesto alterar adicionalmente uno o más codones estándar, cambiando mediante esto uno o más aminoácidos estándar en la proteína mutante resultante también. La homología es en general inferida a partir de la similaridad de secuencias entre dos o más ácidos nucleicos o proteínas (o secuencias de los mismos). El porcentaje preciso de similaridad entre secuencias que es útil para establecer homología varía con el ácido nucleico y proteína en cuestión, pero tan poco como 25% de similaridad de secuencia es usado sistemáticamente para establecer homología. Los niveles más altos de similaridad de secuencia, por ejemplo 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95% o 99% o más, pueden también ser usados para establecer homología. Métodos para determinar porcentajes de similaridad de secuencias (por ejemplo BLASTP y BLASTN utilizando parámetros predeterminados) son descritos en la presente y están en general disponibles. Para la comparación de secuencia y determinación de homología, comúnmente una secuencia actúa como secuencia de referencia con la cual las secuencias de prueba son comparadas. Cuando se usa un algoritmo de comparación de secuencias, las secuencias de prueba y las secuencias de referencia son introducidas a una computadora, se designan coordenadas de subsecuencias , si es necesario y se designan los parámetros del programa de algoritmo de secuencias. Luego el algoritmo de comparación de secuencias calcula el por ciento de identidad de secuencia para la(s) secuencia (s) de prueba en relación con la secuencia de referencia, basada en los parámetros del programa designados .
La alineación óptima de secuencias para comparación se puede llevar a cabo, por ejemplo mediante el algoritmo de homología local de Smith y Waterman, Adv. Appl . ath. 2:482 (1981), mediante el algoritmo de alineación de homología de Needleman y Wunsch, J. Mol. Biol . 48:443 (1970), mediante el método de búsqueda por similaridad de Pearson y Lipman, Proc . Nat'l. Acad. Sci. USA 85:2444 (1988), mediante implementaciones computarizadas de estos algoritmos (GAP, BESTFIT, FASTA y TFASTA en el Wisconsin Genetics Software Package, Genetics Computer Group, 575 Science Dr., Madison, WI) o mediante inspección visual (véase en general Current Protocols in Molecular Biology, Ausubel et al., eds . , Current Protocols, una sociedad de participación entre Greene Publishing Associates, Inc. y John Wiley & Sons, Inc., complementado al 2004). Un ejemplo de un algoritmo que es apropiado para determinar el por ciento de identidad de secuencias y similaridad de secuencia es el algoritmo BLAST, que es descrito en Altschul et al., J. Mol. Biol. 215:403-410 (1990). Elementos de programación para efectuar análisis de BLAST están disponibles públicamente a través del Centro Nacional para Información de Biotecnología el sitio web. Este algoritmo involucra identificar primero pares de secuencia de alta puntuación (HSP) al identificar palabras cortas de longitud W en la secuencia de interrogación, que ya sea coinciden o satisfacen alguna puntuación T de umbral de valor positivo cuando son alineadas con una palabra de la misma longitud en una secuencia de base de datos. T es denominada como el 'umbral de puntuación de palabra vecina (Altschul et al., supra) . Estos aciertos de palabra vecina inicial actúan como semillas para iniciar búsquedas para encontrar HSP más largos que las contienen. Luego los aciertos de palabras son extendidos en ambas direcciones a lo largo de cada secuencia por tanto como la puntuación de alineación acumulativa p.uede ser incrementada. Puntuaciones acumulativas son calculadas, usando, para secuencias de nucleótidos, los parámetros M (puntuación hacia atrás para un par de residuos coincidentes; siempre > 0) y N (puntuación de penalidad para residuos de desajuste; siempre < 0) . Para secuencias de aminoácidos, se usa una matriz de puntuación para calcular la puntuación acumulativa. La extensión de los aciertos de palabra en cada dirección son detenidos cuando: la puntuación de alineación acumulativa cae por la cantidad X de su valor obtenido máximo; la puntuación acumulativa va a cero o debajo, debido a la acumulación de una o más alineaciones de residuos de puntuación negativa o se llega al final ya sea de una secuencia u otra. Los parámetros W, T y X del algoritmo BLAST determinan la sensibilidad y velocidad de la alineación. El programa BLASTN (para secuencias de nucleótidos) utiliza como predeterminados una longitud de palabra (W) de 11, una esperanza (E) de 10, un corte de 100, =5, N=-4 y una comparación de ambas hebras. Para secuencias de aminoácidos, el programa BLASTP utiliza como predeterminados una longitud de palabra (W) de 3, una esperanza (E) de 10 y la matriz de puntuación BLOSUM62 (véase Henikoff y Henikoff (1989) Proc. Nati. Acad. Sci. USA 89:10915). Además de calcular el por ciento de identidad de secuencia, el algoritmo BLAST también efectúa un análisis estadístico de la similaridad entre dos secuencias (véase, por ejemplo Karlin y Altschul, Proc. Nat'l. Acad. Sci. USA 90:5873-5787 (1993)). Una medida de similaridad proporcionada por el algoritmo BLAST es la probabilidad de suma más pequeña (P(N)), que proporciona una indicación de la probabilidad por la cual una coincidencia entre dos secuencias de nucleótidos o aminoácidos se presentaría por probabilidad. Por ejemplo un ácido nucleico es considerado similar a una secuencia de referencia si la probabilidad de suma más pequeña en una comparación del ácido nucleico de prueba al ácido nucleico de referencia es menor de aproximadamente 0.1, más preferiblemente menor de alrededor de 0.01 y más preferiblemente menor de aproximadamente 0.001.
Mutagénesis y Otras Técnicas de Biología Molecular Los polinucleótidos y polipéptidos de la invención y usados en la invención pueden ser manipulados utilizando técnicas biológicas moleculares. Textos generales que describen técnicas de biología molecular incluyen Berger y Kimmel, Guide to Molecular Cloning Techniques, Methods in Enzymology volume 152 Academic Press, Inc., San Diego, CA (Berger) ; Sambrook et al . , Molecular Cloning - A Laboratory Manual (3rd Ed.), Vol . 1-3 , Cold Spring Harbor Laboratory, Cold Spring Harbor, New York, 2001 ("Sambrook") y Current Protocols in Molecular Biology, F.M. Ausubel et al., eds . , Current Protocols, una sociedad de participación entre Greene Publishing Associates, Inc. y John iley & Sons, Inc., (complementada en 2004) ("Ausubel"). Estos textos describen mutagénesis, el uso de vectores, promotores y muchos otros tópicos relevantes concernientes con por ejemplo la generación de genes que incluyen codones selectores para producción de proteínas que incluyen aminoácidos no naturales, tARN ortogonales, sintetasas ortogonales y pares de los mismos. Varios tipos de mutagénesis pueden ser usados en conjunción con la invención, por ejemplo para mutar moléculas de tARN, para producir bibliotecas de tARN, para producir bibliotecas de sintetasas, para insertar codones selectores que codifican un aminoácido no natural en una proteína o polipéptido de interés. Incluyen pero no están limitados a mutagénesis dirigida al sitio, mutagénesis de punto aleatorio, recombinación homologa, entremezcla de ADN u otros métodos de mutagénesis recursivos, construcción quimérica, mutagénesis utilizando plantillas que contienen uracilo, mutagénesis oligonucleótido-dirigida, mutagénesis de ADN fosforotioato-modificada, mutagénesis utilizando ADN dúplex con espacios o los semejantes, o cualquier combinación de las mismas. Métodos apropiados adicionales incluyen reparación de desadaptación puntual, mutagénesis utilizando cepas huésped deficientes de reparación, restricción-selección y restricción-purificación, mutagénesis de cancelación, mutagénesis mediante síntesis de gen total, reparación de ruptura de doble-hebra y los semejantes. Mutagénesis, por ejemplo que involucra constructos quiméricos, también es incluida en la presente invención. En una modalidad, la mutagénesis puede ser guiada por información conocida de la molécula que se presenta de manera estable en la naturaleza o molécula que se presenta de manera estable en la naturaleza alterada o mutada, por ejemplo secuencia, comparaciones de secuencia, propiedades físicas, estructura cristalina o los semejantes. Células huésped son diseñadas genéticamente (por ejemplo, transformadas, transducidas o transfectadas ) con los polinucleótidos de la invención o constructor que incluyen un polinucleótido, por ejemplo, un vector, que puede ser por ejemplo, in vector de clonación o un vector de expresión. Por ejemplo, las regiones de codificación para el tARN ortogonal, la tARN sintetasa ortogonal y la proteína a ser disgregada son enlazados operativamente a elementos de control de expresión genética que son funcionales en la célula huésped deseada. Vectores típicos contienen terminadores de transcripción y trasducción, secuencias de inicio de transcripción y traducción y promotores para regular la expresión del ácido nucleico objetivo particular. Los vectores comprenden opcionalmente casetes de expresión genética que contienen por lo menos una secuencia de terminador independiente, secuencias que permiten la replicación del cásete en eucariontes o procariontes o ambos (por ejemplo, vectores de lanzadera) y marcadores de selección tanto para sistemas procariónticos como eucariónticos . Los vectores son apropiados para replicación y/o interacción en procariontes, eucariontes o preferiblemente ambos. Véase Giliman y Smith, Gene 8:81 (1979); Roberts, et al., Nature, 328:731 (1987); Schneider, B., et al., Protein Expr. Purif. 6435:10 (1995); Ausubel, Sambrook, Berger {todos supra) . El vector puede por ejemplo estar en forma de un plásmido, una bacteria, un virus, un polinucleótido desnudo o un polinucleótido conjugado. Los vectores son introducidos a las células y/o microorganismos mediante métodos estándar en los que se incluyen electroporación (From et al., Proc. Nati. Acad. Sci. USA 82, 5824 (1985)), infección mediante vectores virales, penetración balística de alta velocidad mediante partículas pequeñas con el ácido nucleico ya sea dentro de la matriz de células pequeñas o partículas o sobre la superficie (Klein et al., Nature 327, 70-73 (1987)) y/o los semejantes. Un sistema de un solo plásmido altamente eficiente y versátil puede ser desarrollado para la incorporación específica del sitio de aminoácidos no naturales en las proteínas en respuesta al codón de retención ámbar (UAG) en E. coli. En el nuevo sistema, el par de tARNtir (CUA) supresor de M. jannaschii y tirosil-tARN sintetasa son codificados en un solo plásmido, que es compatible con la mayoría de los vectores de expresión de E. coli. El operón de tARN monocistrónico bajo el control del promotor y terminador de proK fue construido para estructura secundaria óptima y procesamiento de tARN. La introducción de una forma mutada del promotor glnS para la sintetasa dio como resultado un uncremento significativo tanto en eficiencia de supresión como de fidelidad. Incrementos en eficiencia de supresión fueron también obtenidos mediante múltiples copias de tARN también como mediante una mutación específica (D286R) sobre la sintetasa (Kobayashi et al., "Structural basis for orthogonal tRNA specificities of tyrosyl-tRNA synthetases for genetic code expansión," Nat . Struct. Biol., 10 (6) : 25-432 [2003]). La generalidad del sistema optimizado fue también demostrada por la incorporación altamente eficiente y exacta de varios aminoácidos no naturales diferentes, cuyas utilidades únicas en estudiar la función y estructura de proteínas fueron probadas previamente. Un catálogo de bacterias y bacteriógafos útiles para la clonación es proporcionado por ejemplo, por la ATCC, por ejemplo, The ATCC Catalogue of Bacteria and Bacteriophage (1996) Gherna et al. (eds) publicado por la ATCC. Procedimientos básicos adicionales para secuenciación, clonación y otros aspectos de biología molecular y consideraciones teóricas fundamentales también son encontrados en Sambrook (supra) , Ausubel (supra) y en Watson et al. (1992) Recombinant DNA Segunda Edición, Scientific American Books, NY . Además, esencialmente cualquier ácido nucleico (y virtualmente cualquier ácido nucleico marcado, ya sea estándar o no estándar) puede ser ordenado sobre pedido o estándar de cualquiera de una variedad de fuentes comerciales, · tales como la Midland Certified Reagent Company (Midland, TX) , The Great American Gene Company (Ramona, CA) , ExpressGen Inc. (Chicago, IL) , Operon Technologies Inc. (Alameda, CA) y muchos otros. Las células huésped diseñadas pueden ser cultivadas en medios nutrientes convencionales modificados como sea apropiado para tales aditivos tales como, por ejemplo, etapas de selección, promotores de activación o transformantes de selección. Estas células pueden opcionalmente ser cultivadas en organismos transgénicos . Otras referencias útiles, por ejemplo, para aislamiento y cultivo celular (por ejemplo, para aislamiento de ácido nucleico subsecuente) incluyen Freshney (1994) Culture of Animal Cells, a Manual of Basic Technique, tercera edición, Wiley- Liss, New York y las referencias citadas en la presente; Payne et al. (1992) Plant Cell and Tissue Culture in Liquid Systems John Wiley & Sons, Inc. Nueva York, NY; Gamborg y Phillips (eds) (1995) Plant Cell, Tissue and Organ Culture; Fundamental Methods Springer Lab Manual, Springer-Verlag (Berlín Heidelberg Nueva York) y Atlas y Parks (eds) The Handbook of Microbiological Media (1993) CRC Press, Boca Ratón, FL.
PROTEÍNAS Y POLIPÉPTIDOS DE INTERÉS Métodos para producir una proteína que comprende un aminoácido natural en una posición especificada son también un aspecto de la invención. Por ejemplo, un método puede incluir cultivar, en un medio apropiado, una célula (por ejemplo, en una célula de E. coli) , en donde la célula comprende un ácido nucleico que comprende por lo menos un codón selector y codifica una proteína y se proporciona el aminoácido no natural en donde la célula comprende además: un tARN ortogonal (O-tARN) que funciona en la célula y reconoce el codón selector y una aminoacil-tARN sintetasa ortogonal (O-RS) que aminoacila preferiblemente el O-tARN con el aminoácido no natural. La proteína así producida en E. coli comprende un aminoácido no natural en la posición correspondiente al codón selector. La proteína puede luego opcionalmente hacerse reaccionar bajo condiciones en donde el aminoácido no natural sufre modificación covalente, produciendo mediante esto una proteína pos-traduccionalmente . En ciertas modalidades, la O-RS comprende una predisposición por la aminoacilación de O-tARN cognato sobre cualquier tARN endógeno en un sistema de expresión. La proporción relativa entre O-tARN y tARN endógeno que es cargado por la O-RS, en donde la tARN y O-RS están presentes en concentraciones molares iguales, es mayor de 1:1, preferiblemente por lo menos a aproximadamente 2:1, más preferiblemente 5:1, todavía más preferiblemente 10:1, aún más preferiblemente 2:1, todavía más preferiblemente 50:1, todavía más preferiblemente 75:1, aún más preferiblemente 95:1, 98:1, 99:1, 100:1, 500:1, 1,000:1, 5,000:1 o mayor. La proteína que comprende un aminoácido no natural en una posición especificada que es modificada pos-traduccionalmente es también un aspecto de la invención. La proteína es producida en una célula, por ejemplo una célula de E. coli. Los pares de O-tARN/O-RS también residen en la célula y utilizan la maquinaria de traducción de la célula huésped, lo que da como resultado la incorporación in vivo de un aminoácido no natural o una proteína de fusión en respuesta a un codón selector. La habilidad de un sistema de un sistema O-tARN/O-RS para funcionar en una célula huésped para incorporar una amplia variedad de aminoácidos no naturales que pueden ser modificados pos-traduccionalmente es conocida. Véase, por ejemplo, Chin et al., Science (2003) 301:964-967; Zhang et al., Proc. Nati. Acad. Sci. U.S. A. 2004, 202:8882-8887; Anderson et al., Proc. Nati. Acad. Sci. U.S. A. 2004, 202:7566-7571; ang et al., (2001) Science 292:498-500; Chin et al., (2002) Journal of the American Chemical Society 124:9026-9027; Chin y Schultz, (2002) ChemBioChem 11:1135-1137; Chin, et al., (2002) PNAS United States of America 99:11020-11024; Wang y Schultz, (2002) Chem. Comm. , 1-10; Wang y Schultz "Expanding the Genetic Code, " Angewandte Chemie Int. Ed. , 44(l):34-66 (2005); Xie y Schultz, "An Expanding Genetic Code," Methods 36:227-238 (2005); y Deiters et al, Bioorganic & Medicinal Chemistry Letters 15:1521-1524 (2005), cada una de las cuales es incorporada por referencia en su totalidad. Véanse también los sistemas ortogonales de aminoácidos no naturales descritos en Publicaciones Internacionales WO 2002/086075, intitulada "METHODS AND COMPOSITIONS FOR THE PRODUCTION OF ORTHOGONAL tRNA AMINOACYL-tRNA SYNTHETASE PAIRS;" WO 2002/085923, intitulada "IN VIVO INCORPORATION OF UNNATURAL AMINO ACIDS;" WO 2004/094593, intitulada "EXPANDING THE EUKARYOTIC GENETIC CODE;" WO 2005/019415, presentada el 7 de Julio de 2004; WO2005/007870 , presentada el 7 de Julio de 2004; WO 2005/007624, presentada el 7 de Julio de 2004; WO 2006/034332, presentada el 20 de septiembre de 2005; y WO 2006/110182 intitulada "ORTHOGONAL TRANSLATION COMPONENTS FOR THE IN VIVO INCORPORATION OF UNNATURAL AMINO ACIDS," presentada el 27 de octubre de 2005 por Schultz et al. Cada una de estas referencias es incorporada por referencia en su totalidad. La incorporación de un aminoácido no natural se puede hacer para por ejemplo, confeccionar cambios en la estructura y/o función de proteínas, por ejemplo, para cambiar el tamaño, acidez, nucleofilicidad, enlace de hidrógeno, hidrofobicidad, capacidad de acceso de sitios objetivo de proteasa, apuntar a una porción (por ejemplo, para un arreglo de proteína) , incorporación de marcadores o grupos reactivos, etc. Proteínas que incluyen un aminoácido no natural pueden tener propiedades catalíticas o físicas mejoradas o aún completamente nuevas. Por ejemplo, las siguientes propiedades son modificadas opcionalmente mediante inclusión de un aminoácido no natural a una proteína: toxicidad, biodistribución , propiedades estructurales, propiedad espectroscópica , propiedades químicas y/o fotoquímica, habilidad catalítica, vida media (por ejemplo, vida media en el suero) , habilidad para reaccionar con otras moléculas, por ejemplo, covalente o no covalentemente y los semejantes. Las composiciones que incluyen proteínas que incluyen por lo menos un aminoácido no natural son útiles para, por ejemplo, nuevos terapéuticos, diagnósticos, enzimas catalíticas, enzimas industriales, proteínas de enlace (por ejemplo, anticuerpos) y por ejemplo, el estudio de estructura y función de proteínas. Véase, por ejemplo, Dougherty, (2000) Unnatural Amino Acids as Probes of Protein Structure and Function, Current Opinión in Chemical Biology, 4:645-652. Las proteínas que comprenden un aminoácido no natural pueden ser modificadas pos-traduccionalmente de manera selectiva (por ejemplo, mediante una [3+2] cicloadición o una modificación de Staudinger) pueden ser diseñadas para contener cualquier funcionalidad deseada que puede ser acoplada al socio de reacción. La naturaleza del socio de reacción no está limitada de ninguna manera, excepto que solamente comprenda una porción reactiva apropiada que de cómo resultado una anexión covalente al residuo de aminoácido no natural en el polipéptido. En algunos aspectos, una composición incluye una proteina con por lo menos uno, por ejemplo por lo menos dos, por lo menos tres, por lo menos cuatro, por lo menos cinco, por lo menos seis, por lo menos, siete, por lo menos ocho, por lo menos nueve o por lo menos diez o más aminoácidos no naturales. Los aminoácidos no naturales pueden ser los mismos o diferentes, por ejemplo, pueden haber 1, 2, 3, 4, 5, 6, 7, 8, 9 o 10 o más sitios diferentes en las proteínas que comprenden 1, 2, 3, 4, 5, 6, 7, 8, 9 o 10 o más diferentes aminoácidos no naturales. En otro aspecto, una composición incluye una proteína con por lo menos uno pero menos de todos de un aminoácido particular presente en la proteína es un aminoácido no natural. Para una proteína dada con más de un aminoácido no natural, los aminoácidos no naturales pueden ser idénticos o diferentes (por ejemplo, la proteína puede incluir dos o más tipos diferentes de aminoácidos no naturales o puede incluir dos del mismo aminoácido no natural) . Para una proteína dada con más de dos aminoácidos no naturales, los aminoácidos no naturales pueden ser los mismos, diferentes o una combinación de múltiples aminoácidos no naturales de la misma clase con por lo menos un aminoácido no natural diferente. Esencialmente cualquier proteina (o porción de la misma) que incluye un aminoácido no natural (y un ácido nucleico de codificación correspondiente, por ejemplo que incluye uno o más codones selectores) puede ser producido utilizando las composiciones y métodos en la presente. No se hace intento de identificar los cientos de miles de proteínas conocidas, cualquiera de las cuales pueden ser unificadas para incluir uno o más aminoácidos no naturales, por ejemplo, al confeccionar cualesquier métodos de mutación disponibles para incluir uno o más codones selectores apropiados en un sistema de traducción relevante. Depósitos de secuencias comunes para proteínas conocidas incluyen GenBank EMBL, DDBJ y el NCBI . Otros depósitos pueden fácilmente ser identificados al buscar en Internet. Comúnmente, las proteínas son por ejemplo, por lo menos 60%, por lo menos 70%, por lo menos 75%, por lo menos 80%, por lo menos 90%, por lo menos 95% o por lo menos 99% o más idénticas a cualquier proteína disponible (por ejemplo, una proteína terapéutica, una proteína de diagnóstico, una enzima industrial o porción de las mismas y los semejantes) y comprenden uno o más aminoácidos no naturales. Ejemplos de proteínas terapéuticas, de diagnóstico y otras proteínas que pueden ser modificadas para comprender uno o más aminoácidos no naturales se pueden encontrar, pero no limitados a, aquellas en las Publicaciones Internacionales WO 2004/094593, presentada el 16 de abril de 2004, intitulada "Expanding the Eukaryotic Genetic Code;" y WO 2002/085923, intitulada "IN VIVO INCORPORATION OF UNNATURAL AMINO ACIDS." Ejemplos de proteínas terapéuticas, de diagnóstico y otras proteínas que pueden ser modificadas para comprender uno o más aminoácidos no naturales incluyen pero no están limitadas a, por ejemplo, alfa-1-antitripsina , angiostatina, factor antihemolítico, anticuerpos (detalles adicionales en cuanto a anticuerpos se encuentran posteriormente en la presente), apolipoproteínas , apoproteína, factor natriurético atrial, polipéptido natriurético atrial, péptidos atriales, quimiocinas C-X-C (por ejemplo, T39765, NAP-2, ENA-78, Gro-a, Gro-b, Gro-c, IP-10, GCP-2, NAP-4, SDF-1, PF4 , MIG) , calcitonina, quimiocinas CC (por ejemplo, proteína-1 quimiatrayente de monolito, proteína-2 quimioatrayente de monolito, proteína-3 quimioatrayente de monocito, proteína-1 alfa inflamatoria de monocito, proteína-1 beta inflamatoria de monocito, RANTES, 1309, R83915, R91733, HCC1, T58847, D31065, T64262), ligando CD40, ligando C-kit, colágeno, factor estimulador de colonia (CSF) , factor 5a de complemento, inhibidor de complemento, receptor 1 de complemento, citocinas (por ejemplo, péptido-78 activador de neutrófilo epitelial, GRO /MGSA, GROP, GROy, MIP-l , ???-?d, MCP-1), factor de crecimiento epidérmico (EGF) , eritropoyetina ("EPO"), toxinas A y B exfoliantes, Factor IX, Factor VII, Factor VIII, Factor X, factor de crecimiento de fibroblasto (FGF), finrinógeno, fibronectina , G-CSF, GM-CSF, glucocerebrosidasa, gonadotropina , factores de crecimiento, proteínas de Hedgehog (por ejemplo, Sonic, Indian, Desert), hemoglobina, factor de crecimiento de hepatocito (HGF) , hirudina, albúmina de suero humano, insulina, factor de crecimiento semejante a insulina' (IGF), interferones (por ejemplo, IFN-a, IFN-ß, IFN-?) , interleucinas (por ejemplo, IL-1, IL-2, IL-3, IL-4, IL-5, IL-6, IL-7, IL-8, IL-9, IL-10, IL-11, IL-12, etc.), factor de crecimiento de queratinocito (KGF) , lactoferrina , factor inhibidor de leucemia, luciferasa, neurturina, factor inhibidor de neutrófilo (NIF) , oncostatina M, proteína osteogénica, hormona paratiroides, PD-ECSF, PDGF, hormonas de péptido 8por ejemplo, hormona de crecimiento humano) , pleyptropina , proteína A, proteína G, exotoxinas A, B y C pirogénicas, relaxina, renina, SCF, receptor I de complemento soluble, CAM 1 soluble I-, receptores de interleucina solubles (IL-1, 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 14, 15), receptores TNF solubles, sometomedina , somatostatina , somatotropina , estreptocinasa , superantígenos, es decir, enterotoxinas estafilococales (SEA, SEB, SEC1, SEC2, SEC3, SED, SEE) , dismutasa de superóxido (SOD) , toxina de síndrome de choque tóxico (TSST-1), limosina alfa 1, activador de plasminógeno de tejido, factor beta de necrosis de tumor (TNF beta) , receptor de factor de necrosis de tumor (TNFR) , factor alfa de necrosis de tumor (TNF alfa) , factor de crecimiento endotelial vascular (VEGEF) , urocinasa y muchos otros . Una clase de proteínas que pueden ser fabricadas utilizando las composiciones y métodos para la incorporación ín vivo de aminoácidos no naturales con proteínas descritas en la presente incluyen moduladores de transcripción o una porción de los mismos. Moduladores de transcripción ejemplares incluyen genes y proteínas de moduladores de transcripción que modulan el crecimiento celular, diferenciación, regulación o los semejantes. Moduladores de transcripción son encontrados en procariontes , virus y eucariontes, en los que se incluyen hongos, plantas, levaduras, insectos y animales en los que se incluyen mamíferos, que proporcionan un amplio intervalo de objetivos terapéuticos. Se apreciará que los activadores de expresión de transición regulan la transcripción mediante muchos mecanismos, por ejemplo, mediante enlace a receptores, estimulación de una cascada de transducción de señal, regulación de expresión de factores de transcripción, enlace a promotores y mejoradores, enlace a proteínas que se enlazan a promotores y mejoradores, ADN de desarrollamiento, empalmende pre-mARN, poliadenilación de ARN y degradación de ARN. Otra clase de proteínas de la invención (por ejemplo, proteínas con uno o más aminoácidos no naturales) incluyen proteínas biológicamente activas tales como citocinas, moléculas inflamatorias, factores de crecimiento, sus receptores y productos de oncógeno, por ejemplo, interleucinas (por ejemplo, IL-1, IL-2, IL-8, etc.), interferones , FGF, IGF-I, IGF-II, FGF, PDGF, TNF, TGF-a, TGF-ß, EGF, KGF, SCF/c-Kit, CD40L/CD40, VLA- /VCA -1 , ICAM-l/LFA-1 y hialurina /CD , moléculas de transducción de señal y productos encógenos correspondientes, por ejemplo, Mos, Ras, Raf y Met; y activadores y supresores de transcripción, por ejemplo, p53, Tat, Fos, Myc, Jun, Myb, Reí y receptores de hormonas de esferoides tales como aquellos de estrógeno, progesterona , testosterona , aldosterona, el ligando de receptor LDL y corticosterona . Enzimas (por ejemplo, enzimas industriales) o porciones de las mismas con por lo menos un aminoácido no natural son también provistas por la invención. Ejemplos de enzimas incluyen, pero no están limitadas a, por ejemplo amidasas, racemasas de aminoácido, acilasas, geshalogenasas , dioxigenasas , diarilpropanoperoxidasas , epimerasas, epóxidohidrolasas , esterasas, isomerasas, cinasas, glucosaisomerasas , glicosidasas , flicosiltransferasas, haloperoxidasas , monooxigenasas (por ejemplo, p450), lipasas, peroxidasas de lignina, nitrilohidratasas, nitrilasas, protreasas, fosfatasas, subtilisinas , transaminasa y nucleasas. Muchas de estas proteínas están disponibles comercialmente (véase por ejemplo, el catálogo de Sigma BioSciences) y las secuencias y genes de proteína correspondientes y comúnmente, muchos variantes de los mismos, son bien conocidos (véase, por ejemplo GenBank). Cualquiera de ellos pueden ser modificados mediante la inserción de uno o más aminoácidos no naturales de acuerdo con la invención, por ejemplo, para alterar la proteína con respecto a una o más propiedades terapéuticas, de diagnóstico o enzimáticas de interés. Ejemplos de propiedades terapéuticamente relevantes incluyen vida media del suero, vida media en almacenamiento, estabilidadm inmunogenicidad, actividad terapéutica, detectabilidad (por ejemplo, mediante la inclusión de grupos reporteros (por ejemplo, marcadores o sitios de enlace de marcador) en los aminoácidos no naturales), reducción de LD50 u otros efectos secundarios, habilidad para entrar al cuerpo a través del sistema gástrico (por ejemplo, disponibilidad oral) o los semejantes. Ejemplos de propiedades de diagnóstico incluyen vida media de almacenamiento, estabilidad, actividad de diagnóstico, detectabilidad o los semejantes. Ejemplos de propiedades enzimáticas relevantes incluyen vida media en almacenamiento, estabilidad, actividad enzimática, capacidad de producción o los semejantes. Una variedad de otras proteínas pueden también ser modificadas para incluir uno o más aminoácidos no naturales utilizando las composiciones y métodos de la invención. Por ejemplo, la invención puede incluir sustituir uno o más aminoácidos no naturales en una o más proteínas de vacuna con un aminoácido no natural, por ejemplo, en proteínas de hongos infecciosos, por ejemplo, especies Aspergillus , Candida; bacterias, particularmente E. coli, que sirve como modelo para bacterias patógenas, también como bacterias médicamente importantes tales como Staphylococcus (por ejemplo, aureus) o Streptococcus (por ejemplo, pneumoniae) ; protozoarios tales como esporozoa (por ejemplo, Plasmodia) , rizópodos (por ejemplo, Entamoeba) y flagelados (Tripanosoma , Leishmania, Tricomonas, Giardia, etc.); virus tales como virus ( + ) ARN (ejemplos incluyen Poxvirus, por ejemplo, vacuna, Picornavirus , por ejemplo, polio; Togavirus, por ejemplo, rubéola; Flavivirus, por ejemplo, HCV y Coronavirus), (-) ARN virus (por ejemplo, Rabdovirus, por ejemplo, VSV; Paramixovirus , por ejemplo, RSV; Ortomixovirus , por ejemplo, influenza, Bunyavirus y Arenavirus), virus de dsADN (por ejemplo, Reovirus), virus ARN a ADN, esto es, Retrovirus, por ejemplo, HIV y HTLV y ciertos virus ADN a ARN tales como Hepatitis B. Proteínas agrícolamente relacionadas tales como proteínas de resistencia a insectos (por ejemplo, las proteínas Cry) , enzimas de producción de almidón y lípidos, toxinas de plantas e insectos, proteínas de resistencia a toxinas, proteínas de destoxificación de Micotoxina, enzimas de crecimiento de plantas (por ejemplo, Ribulosa, 1 , 5-bifosfato carboxilasa/oxigenasa, "RUBISCO"), lipoxigenasa (LOX) y fosfoenolpiruvato (PEP) carboxilasa son también objetivos apropiados para la modificación de aminoácido no natural. En ciertas modalidades, la proteina de interés (o porción de la misma) es codificada por un ácido nucleico. Comúnmente, el ácido nucleico comprende por lo menos un codón selector, por lo menos dos codones selectores, por lo menos tres codones selectores, por lo menos cuatro codones selectores, por lo menos cinco cod'ones selectores, por lo menos seis codones selectores, por lo menos siete codones selectores, por lo menos ocho codones selectores, por lo menos nueve codones selectores, diez o más codones selectores. Genes que codifican para proteínas o polipéptidos de interés pueden ser mutageni zadas usando métodos bien conocidos para aquel de habilidad en el arte y descritos en la presente bajo "Mutagénesis y otras técnicas de biología molecular" · para incluir, por ejemplo, uno o más codones selectores para la incorporación de un aminoácido no natural. Por ejemplo, un ácido nucleico para una proteína de interés es mutagenizado para incluir uno o más codones selectores, proporcionando la inserción de uno o más aminoácidos no naturales. La invención incluye cualesquiera de tales variantes, por ejemplo, mutantes, versiones de cualquier proteína, por ejemplo, se incluyen por lo menos un aminoácido no natural. Similarmente, la invención incluye ácidos nucleicos correspondientes, esto es, cualquier ácido nucleico con uno o más codones selectores que codifica uno o más aminoácidos no naturales. Para fabricar una proteína que incluye un aminoácido no natural modificado pos-traduccionalmente , se pueden usar células huésped y organismos que están adaptados para la incorporación in vivo del aminoácido no natural vía pares tARN/RS ortogonales. Las células huésped son diseñadas genéticamente (por ejemplo, transformadas, transducidas o transfectadas ) con uno o más vectores que expresan el tARN ortogonal, la tARN sintetasa ortogonal que codifica la proteína a ser derivada. Cada uno de estos componentes pueden estar en el mismo vector o cada uno puede estar en un vector separado o dos componentes pueden estar en un vector y el tercer componente en un segundo vector. El vector puede estar por ejemplo, en forma de un plásmido, una bacteria, un virus, un polinucleótido desnudo o un polinucleótido conjugado.
Definición de Polipéptidos mediante Inmunoreactividad Debido a que los polipéptidos de la invención proporcionan una variedad de nuevas secuencia de polipéptidos (por ejemplo polipéptidos que comprenden aminoácidos no naturales en el caso de proteínas sintetizada en los sistemas de traducción en la presente, o por ejemplo en el caso de las nuevas sintetasas, nuevas secuencias de aminoácidos estándar) , los polipéptidos también proporcionan nuevos aspectos estructurales que pueden ser reconocidos, por ejemplo en análisis inmunológico . La generación de antisueros, que se enlazan específicamente a los polipéptidos de la invención, también como los polipéptidos que son enlazados por tales antisueros, son un aspecto de la invención. El término "anticuerpo", como se usa en la presente, incluye, pero no está limitado a un polipéptido codificado sustancialmente por un gen de inmunoglobulina o genes de inmunoglobulina , o fragmentos de los mismos que se enlazan específicamente y reconocen un analito (antígeno) . Ejemplos incluyen anticuerpos policlonales , monoclonales , quiméricos y anticuerpos de una sola cadena y los semejantes. Fragmentos de inmunoglobulinas , en los que se incluyen fragmentos de Fab y fragmentos producidos por una biblioteca de expresión, en los que se incluyen despliegue de fago, también son incluidos en el término "anticuerpo" como se usa en la presente. Véase, por ejemplo Paul, Fundamental Immunology, 4a Ed., 1999, Raven Press, New York, para la estructura y terminología de anticuerpos. Con el fin de producir antisuero para uso en un inmunoanálisis, uno o más de los polipéptidos inmunogénicos es producido purificado como se describe en la presente. Por ejemplo proteína recombinante puede ser producida en una célula recombinante . Una cepa de cruce de ratones (utilizados en este análisis debido a que los resultados son más reproducibles debido a la identidad genética virtual de los ratones) es inmunizada con la(s) proteína (s) inmunogénica ( s ) en combinación con un adyuvante estándar, tal como adyuvante de Freund y un protocolo de inmunización de ratón estándar {véase, por ejemplo Harlow y Lañe (1988) Antibodies, A Laboratory Manual, Cold Spring Harbor Publications , New York, para una descripción estándar de generación de anticuerpos, formato de inmunoanálisis y condiciones que pueden ser usadas para determinar la inmunoreactividad especifica. Detalles adicionales en cuanto a proteínas, anticuerpos, antisueros, etc. se pueden encontrar en la publicación internacional números WO 2004/094593, intitulada "EXPANDING THE EUKARYOTIC GENETIC CODE"; WO 2002/085923, intitulada "IN VIVO INCORPORATION OF UNNATURAL AMINO ACIDS"; WO 2004/035605, intitiulada "GLYCOPROTEIN SYNTHESIS" ; y WO 2004/058946, intitulada "PROTEIN ARRAYS" .
Equipos Los equipos son también un aspecto de la invención. Por ejemplo un equipo para producir un polipéptido que comprende por lo menos un aminoácido no natural es un aspecto de la invención, en donde el equipo comprende por lo menos un constructo de la invención. Por ejemplo tales equipos pueden comprender varios componentes seleccionados de: un recipiente para contener los componentes del . equipo, materiales de instrucciones para producir el polipéptido, ácido nucleico que comprende una secuencia de polinucleótidos que codifica un O- tARN, ácido nucleico que comprende un polinucleótido que codifica una O-RS, un aminoácido no natural, reactivos para la modificación post-traducción del aminoácido no natural y una cepa apropiada de células huésped de E. coli para expresión del 0-tARN/O-RS.
EJEMPLOS Los siguientes ejemplos son ofrecidos para ilustrar, pero no para limitar la invención reivindicada. Aquellos de habilidad en el arte reconocerán una variedad de parámetros no críticos que pueden ser alterados sin desviarse del alcance de la invención reivindicada. Se comprenderá que los ejemplos y modalidades descritos en la presente son por propósitos ilustrativos solamente y que varias modificaciones o cambios a la luz de los mismos serán sugeridos para las personas experimentadas en el arte y se proponen estar incluidos en el espíritu y alcance de esta solicitud y alcance de las reivindicaciones adjuntas.
EJEMPLO 1 Construcción de un Sistema de un solo Plásmido para la Expresión de Polipeptidos que comprenden Aminoácidos No Naturales El presente ejemplo describe la construcción de un plásmido que codifica ambos miembros de un par de aminoacil- tARN ortogonal y aminoacil-tARN sintetasa ortogonal para la incorporación de p-benzoil-L-fenilalanina . Un plásmido fue construido (llamado pYR-BpaRSl) que contiene secuencias de nucleótidos que codifican ambos componentes de un par de traducción ortogonal que funciona en una célula huésped de E. coli. Es decir, estos dos componentes son el WjtARN-Tyr (CUA) de tARN ortogonal y la MjTyrRS sintetasa mutante (BpaRS) que aminoacila específicamente el tARN ortogonal con el aminoácido de fotoreticulación , p-benzoil-L-fenilalanina (Bpa, véase Figura 1) . Véase, Chin et al., Proc . Nati. Acad. Sci . USA 99:11020-11024 (2002) . Para determinar la eficiencia de supresión de este sistema de pYR-BpaRSl PLASMID, la actividad de ß-galactosidasa fue medida para células de E. coli TOP10 ( Invit rogen™) co-transformadas con pYR-BpaRSl y un plásmido reportero lacZ que codifica ß-galactosidasa con una mutación ámbar en un sitio permisivo en la secuencia líder del gen lacZ. Desafortunadamente, cuando las células son cultivadas en presencia de Bpa 1 mM, se observaron niveles muy bajos de actividad de ß-galactosidasa (Figura 2) . Los intentos para incrementar la eficiencia de supresión al modificar las secuencias de flanqueo del tARN no fueron exitosos. Con el fin de mejorar esta eficiencia de supresión, un nuevo operon de tARN supresor ámbar con un promotor y terminador de tARN de E. coli que se presenta de manera estable en la naturaleza fue construido. Un estudio de genes de tARN de E. coli reveló que las prolil tARN de E. coli tienen el mismo par C1-G72 como tARN de Arqueas; este par de bases es un determinante de identidad mayor para el reconocimiento selectivo de jtARN-Tyr (CUA) mediante MjTyrRS en E. coli (Wang y Schultz, Chem. Biol . 8:883-890 (2001)). En vista de esta observación, un gen de tARN supresor ámbar sintético fue construido de tal manera que el gen MjtARN-Tyr (CUA) reemplaza el gen proK de E. coli de la misma longitud (77 nucleótidos) en el operón proK monocistrónico . Puesto que el gen proK codifica el tARN que reconoce el codón de prolina más frecuentemente usado (CCG) en E. coli (Nakamura et al., Nucleic Acids Res. 28:292 (2000)), se espera que el gen MjtARN-Ty (CUA) sea transcrito eficientemente bajo el control del promotor proK. Un sitio de enlace de FIS localizado naturalmente corriente arriba del promotor proK fue también incluido en el constructo de gen sintético para mejorar la transcripción de tARN (Muskhelishvili et al., EMBO J. 16:3655-3665 (1997)). El vector de expresión final pYR-BpaRS5 fue generado al sustituir el operon de tARN supresor original en pYR-BpaRSl con el gen MjtARN-Tyr (CUA) bajo el control del promotor y terminador del proK. Cuando es transformado a E. coli, este plásmido condujo a un incremento de 2 veces (en relación con el gen de tARN original bajo el control del promotor lpp y el terminador rrnC) en la expresión de MjtARN-Tyr (CUA) como se observa mediante análisis de Northern (véase Figura 3). Este incremento en expresión corresponde a 8% de eficiencia de supresión (en relación con la expresión de ß-galactosidasa tipo silvestre) tal como se determina mediante análisis de actividad de ß-galactosidasa (Figura 2) . EJEMPLO 2 La Generación de Genes y Promotores de Sintetasa Mejorados El presente ejemplo describe la construcción de sistemas mejorados para la expresión de componentes de sistema de traducción ortogonales, en donde los efectos de mutaciones en el gen de sintetasa y el promotor de sintetasa son determinados . Kobayashi et al. Reportaron previamente que un sustitución de un solo aminoácido de Asp286 a Arg (D286R) en MjTyrRS incrementó significativamente la velocidad de aminoacilación global (kcat/Km 67 veces más alta) de MjtARN-Tyr(CUA) in vitro, debido principalmente al reconocimiento mejorado (Km 57 veces más baja) del anti-codón (CUA) en el tARN supresor ámbar mediante la sintetasa cognata (Kobayashi et al., Wa . Struct. Biol. 10:425-432 (2003)). Utilizando esta información, esta misma mutación de D286R fue introducida al gen BpaRS en pYR-BpaRS5 mediante mutagénesis dirigida al sitio. Por supuesto, el mutante D286R de BpaRS condujo a un incremento de 4.5 veces en la actividad de ß-galactosidasa (véase la figura 2) .
Un promotor glnS mutante (SEQ ID NO: 12), que tiene una secuencia TATC en lugar de GATC en la región -10 fue previamente mostrado que incrementa la expresión genética (Plumbridge y Solí, Biochimie 69:539-541 (1987)). Sabiendo esto, el promotor de glnS tipo silvestre en pYR-BpaRS5 fue reemplazado con la forma mutada del promotor glnS descrito en Plumbridge y Sóll en un intento por mejorar la eficiencia del sistema. Sin embargo, enseguida de la inserción de esta secuencia de promotor a pYR-BpaRS5, la secuenciación reveló que además de la mutación propuesta, mutaciones de cancelación no propuestas adicionales fueron también identificadas. De los mutantes de cancelación analizados en cuanto a actividad de ß-galactosidasa , un mutante particular, pYR-BpaRS-TRN , que tiene una cancelación de un solo nucleótido (residuo A en la posición -15) además de la sustitución de un nucleótido propuesta (G a T en la posición -11) en el promotor glnS, exhibió un incremento de 5 veces en actividad de ß-galactosidasa en comparación con pYR-BpaRS5 (véase Figura 2) . La secuencia de nucleótidos completa de este nuevo dominio de promotor de glnS mutante, denominada glnS-TRN identificado a continuación de nuestra secuencia es proporcionada en SEQ en NO: 13.
La expresión de BpaRS bajo el control de la forma mutada del promotor de glnS fue mejorada 2 veces tal como se determina en análisis de Western blot (véase Figura 4) . Un incremento de 1.5 veces adicionales en la actividad de ß- galactosidasa fue observado en combinación de la sustitución de D286R de BpaRS y el nuevo promotor de glnS mutante, correspondiente a una eficiencia de supresión global de 57% para pYR-BpaRS-TRN (D286R) .
EJEMPLO 3 La Generación de Sistemas de Expresión de tARN Mejorados El presente ejemplo describe la construcción de sistemas mejorados para la expresión de componentes de sistema de traducción ortogonales, en donde se determinan los efectos de colocar múltiples copias de M tARN-Tyr (CUA) en un operon policistrónico. El efecto de múltiples copias del tARN supresor ámbar sobre la eficiencia de supresión fue observado. Un operon de jtARN-Tyr (CUA) policistrónico que contiene tres copias del gen de tARN supresor ámbar bajo el control de un solo promotor proK y terminador fue construido. Las tres secuencias de O-tARN en tándem en el operon policistrónico fueron separadas entre si mediante secuencias de enlazador de tARN derivadas de secuencia de enlazador de tARN de E. coli que se presentan de manera estable en la naturaleza.
Estas secuencias de enlazador particulares fueron escogidas debido a que contienen los nucleótidos T(-l) y A(77). Estas dos posiciones de nucleótidos en enlazadores de tARN han mostrado ser óptimas para el procesamiento 5' y 3' eficiente de precursores de tARN cuando están en su contexto natural (esto es , endógeno) . Los primeros y segundos genes de MjtARN-Tyr (CUA) en el operon policistrónico recombinante son separados mediante un enlazador de tARN derivado del enlazador que se presenta de manera estable en la naturaleza entre los genes de tARN valU y valX de E. coli (SEQ ID NO: 14) . Los segundos y terceros genes de MjtARN-Tyr (CUA) en el operon policistrónico recombinante son separados por un enlazador de tARN derivado del enlazador que se presenta de manera estable en la naturaleza entre los genes de tARN e ileT y alaT de E. coli ( SEQ ID NO: 15) . El uso de estos enlazadores tiene una ventaja práctica adicional en que estos polinucleótidos contienen sitios de restricción convenientes . Dos copias idénticas de operon de tARN policistrónico sintético que contienen tres copias del tARN supresor fueron ligadas para generar grupos genéticos con seis copias del gen MjtARN-Tyr (CUA) . Los grupos genéticos ensamblados con tres y seis copias de los tARN fueron clonados a pYR-BpaRS-TRN (D286R) para generar pYR-BpaRS-3TRN (D286R) y pYR-BpaRS-6TRN (D286R) , respectivamente. Cuando son expresados en E. coli, estos plásmidos proporcionaron un incremento de 30% y 50% en la expresión de M tARN-Tyr (CUA) , respectivamente, tal como se determina mediante análisis de Northern (véase Figura 3) . Este incremento en expresión de mensajes proporcionó un incremento de 30-40% en la actividad de ß-galactosidasa (véase Figura 2) . Debido a que los tARN de codón raro de E. coli codificados en estos plásmidos pueden ser innecesarios para la expresión de la mayoría de las proteínas, estos genes de tARN de E. coli fueron removidos del plásmido pYR-BpaRS-6TRN (D286R) para proporcionar pSup-BpaRS-6TR ( D268R) (mostrada en la Figura 5) . Como se esperaba, la eficiencia de supresión de este plásmido, determinad mediante análisis de actividad de ß-galactosidasa in vivo, siguió siendo la misma como aquella de su plásmido padre (véase Figura 6) .
EJEMPLO 4 Expresión de una Proteina Modelo que comprende un Aminoácido No Natural Utilizando Sistemas de Expresión Mejorados El presente ejemplo describe la expresión de una mioglobina de ballena de esperma de proteina modelo que comprende un aminoácido no natural utilizando los sistemas de expresión mejorados de la invención. Para examinar adicionalmente mejoras en campo y fidelidad de la incorporación de aminoácido no natural a proteínas utilizando los sistemas de la invención, un mutante Ser-4 a Bpa de mioglobina de ballena de esperma (descrita en Chin et al., Proc . Nati. Acad. Sci . USA 99:11020-11024 (2002)) fue expresada en E. coli. Células de E. coli TOP10 ( Invitrogen™) co-transforinadas con pBAD/Myc-His/MB (S4TAG) y pSup-BpaRS-6TRN ( D286R) fueron cultivadas en medio de Luria-Bertani a 37 °C en presencia de Bpa 1 mM. Consistente con lo anterior, los datos de análisis de ß-galactosidasa in vivo, la mioglobina mutante de longitud total fue producida en un rendimiento purificado global de 40 mg/L, mientras que el sistema previo proporcionó 2 mg/L de proteína mutante (Chin et al., Proc. Nati. Acad. Sci. USA 99:11020-11024 (2002)). No se observó ninguna proteína mutante mediante gel de SDS-PAGE en ausencia del aminoácido (Figura 6) . La espectrometría de masa de ALDI-TOF de la mioglobina mutante que contiene Bpa en lugar de Ser-4 dio una masa promedio de 18521, que está en buen acuerdo con la masa predicha calculada de 18520. No se detectó evidencia de alguna incorporación de aminoácido natural en posición 4 en el espectro de masa.
EJEMPLO 5 Amplia Posibilidad de Aplicación del Sistema de Expresión Mejorado de la Invención El presente ejemplo describe la expresión de ß-galactosidasa que comprende cuatro aminoácidos no naturales diferentes en donde los sistemas de expresión utilizan sintetasas mutantes diferentes que tienen especificidades de carga para diferentes aminoácidos no naturales. Para probar a generalidad de estos sistemas de expresión de la invención, tres aminoacil-tARN sintetasas ortogonales adicionales fueron probadas en el sistema. Estas 0-RS aminoacilan (esto es, cargan) específicamente el 0-tARN MjtARN-Tyr (CUA) con, alternativamente, p-acetil-L-fenilalanina (pAcPhe) , p-azido-L-fenilalanina (pAzPhe) y p-yodo-L-fenilalanina (plPhe) (Figura 1). Estos aminoácidos no naturales son exitosos para marcación química (Wang et al., Proc. Nati. Sci. Acad. USA 100:56-61 (2003)), fotoreticulación (Chin et al., J. Am. Chem. Soc, 124:9026-9027 (2002)) y Experimentos de fases cristalográficas de rayos X (Xie et al., Nat. Biotechnol., 22:1297-1301 (2004)). Vectores de expresión de la invención que codifican estos genes de MjTyrRS mutantes fueron construidos mediante sub-clonación la O-RS respectiva a los sitios Ndel/PstI de pSup-BpaRS-6TRN ( D286R) , para producir los vectores pSup-pAcPheRS-6TRN, pSup-pAzPheRS-6TRN y pSup-pI PheRS-6TRN. Como fue el caso con Bpa, cuando células de E. coli que albergan estos plásmidos son cultivadas en presencia de estos aminoácidos (1 mM) , el nivel de actividad de ß-galactosidasa es similar a aquel de la ß-galactosidasa tipo silvestre (Figura 7), indicando producción de la ß-galactosidasa que comprende el aminoácido no natural respectivo.
EJEMPLO 6 Construcciones de plásmido pYR-BpaRSl pYR-BpaRSl, un replicón pl5A que contiene un marcador de resistencia a cloranfenicol , MjtRNA-Tyr (CUA) bajo el control del promotor Ipp y terminador rrnC y BpaRS bajo el control del promotor glnS, fue generado al insertar el BpaRS y genes de MjtRNA-Tyr (CUA) a los sitios SacI y Spel del plásmido pRARE2 (Novagen) .
GEN DE MjtRNA-Tyr (CUA) CON EL PROMOTOR Y TERMINADOR proK Un operón MjtRNA-Tyr (CUA) monocistrónico que contiene el promotor y terminador de proK fue construido mediante PCR utilizando cuatro oligonucleótidos sintéticos en una estrategia de PCR de superposición para construir todo el operón tARN en una sola reacción de PCR.
El amplicón de PCR fue amplificado subsecuentemente mediante PCR utilizando dos cebadores.
El amplicón resultante fue insertado entre los sitios BcII y Xhol (subrayados) de pYR-BpaRSl para generar el plásmido pYR-BpaRS5.
PROMOTOR DE glnS MUTANTE Un promotor glnS mutante fue construido mediante utilizando cuatro oligonucleótidos sintéticos .
El producto fue insertado entre los sitios Xmal y Ndel de pYR-NpaRS5. Un número de clones fueron seleccionados con un análisis de actividad in vivo LacZ y un mutante de cancelación de una sola base particular con actividad mejorada fue identificado y secuenciado (determinado pYR-BpaRS-TR ) .
CASETES GENÉTICOS DE tARN EN TÁNDEM Dos secuencias de enlazador tARN que se presentan de manera estable en la naturaleza entre los genes valU y valX (SEQ ID NO: 14) y entre los genes ileT y alaT (SEQ ID NO: 15) en el genoma de E. coli fueron usados como separadores entre los genes de MjtRNA-Tyr (CUA) . Estas secuencias de enlazador contienen sitios de restricción BsmAI y EarI a los cuales los genes MjtRNA-Tyr (CUA) fueron ligados. Estas secuencias de flanqueo también contienen residuos T(-l) y A (77), que son óptimos para el procesamiento 5' y 3' eficiente de los precursores de tARN. El cásete genético de tARN fue amplificado mediante PCR utilizando tres conjuntos de cebadores.
El producto de cada conjunto fue sometido a digestión con BsmAl (Conjunto 1), EarI (Conjunto 2) o ambos (Conjunto 3) . La ligación de estos tres fragmentos de restricción produjo un operón de tARN policistrónico que contiene tres copias del gen de tARN conectado mediante dos secuencias de enlazador que se presentan de manera estable en la naturaleza diferentes. El grupo de genes resultantes fue amplificado mediante PCR utilizando dos conjuntos de cebadores: Los productos de PCR de los Conjuntos 4 y 5 fueron sometidos a digestión con Sphl y ligados entre si para generar un conjunto eléctrico de tARN en tándem unidireccional, que consiste de dos operones de tARN policist rónicos idénticos, cada uno que codifican tres genes de tARN bajo el control de un solo promotor y terminador de proK. Cada grupo de genes tARN que contiene una o dos copias idénticas del operón de tARN policistrónico fue clonado a los sitios ApaLI y Xhol de YR-BpaRS-TRN para producir pYR-BpaRS-3TRN y pYR-BpaRS- 6TRN , respectivamente .
PLÁSMIDOS DE pSup Cada uno de los doce genes de tARM de E. coli, que fueron codificados originalmente en el plásmido pRARE2 gueron removidos de pYR-BpaRS-6TRN ( D286R) mediante digestión con Spel y DrdI seguido por tratamiento con nucleasa de habichuela de Mung. La re-ligación de los vectores linearizados generó pSup-BpaRS-6TRN (D286R) . Genes de WjTyrRS mutantes para p-acetil-L-fenilalanina , p-azido-L-fenilalanina y p-yodo-L-fenilalanina fueron sub-clonados de sus correspondientes plásmidos pBK a los sitios de Ndel y PstI de pSup-PbaRS-6TRN ( D286R) para generar pSup-pAcPheRS-6TRN, pSup-pAzPheRS-6TRN y pSup-pIodoPheRS-6TRN, respectivamente .
PLÁSMIDO REPORTERO DE lacZ Y ANÁLISIS DE ACTIVIDAD DE ß-GALACTOS I PASA in vivo El codón de fenilalanina (TTC) en el residuo 13 (subrayado) de la secuencia líder (MDPLVTAASVLEFGLFET ; SEQ ID NO: 57) localizada corriente arriba del gen lacZ de pBAD/Myc-His/LacZ ( Invitrogen™) fue mutado a un codón ámbar (TAG) meiante mutagénesis dirigida al sitio para producir un plásmido reportero de LacZ pBAD/Myc-His /LacZ (TAG) . Este plásmido fue co-transformado con cada plásmido supresor a células TOP10 de E. coli (Invitrogen™). Las células fueron incubadas a 37°C durante toda la noche en un medio de Luria-Bertani (LB) que contiene arabinosa al 0.02% y aminoácido no natural 1 mM. La actividad de LacZ ( ß-galactosidasa ) fue medida de acuerdo con el método descrito por Millar (millar, J. H. Experiments in Molecular Genetics. (Cold Spring Harbor Laboratory, New York, 1972) ) - EJEMPLO 7 Metodologías generales Células de E. coli XLl-Blue (Stratagene) fueron usadas para cloanción y mantenimiento de plásmidos. ADN polimerasa de alta fidelidad PfuUltra™ (Stratagene®) fue usada para la reacción en cadena de polimerasa (PCR) . El equipo de mutagénesis dirigido al sitio QuikChange® II (Stratagene®) fue usado para la mutasgénesis dirigida al sitio. Las secuencias de todos los plásmidos construidos fueron identificadas mediante secuenciación .
EXPRESIÓN DE PROTEÍNAS Un gen de mioglobina de ballena de esperma mutante marcada con hexagistidina C-terminal con un codón ámbar en posición cuatro (Ser-4) fue insertado a pBAD-JYAMB-4TAG entre los sitios Ncol y Kpnl de pBAD/Myc-His ( Invitrogen™) para generar pBAD/Myc-His/MB ( S4TAG) . El plásmido fue transformado con pSup-BpaRS-6TRN (D286R) a TOP10 de E. coli (Invitrogen™). Las células fueron incubadas a 37°C en LB que contiene 100 mg/ml de carbenicilina , 50 mg/ml de cloranfenicol y Bpa 1 mM. A OD600 = 0.6, las células fueron inducidas mediante la adición de arabinosa al 0.2% e incubadas durante 12 horas. Las células fueron cosechadas mediante centrifugación y sometidas a lisis con reactivo de BugBuster® (Novagen®) . La proteina obtenida de los cuerpos de inclusión fueron purificados con resina de afinidad de metal TALON® (Clontech®) bajo condiciones de desnaturalización de acuerdo con el protocolo del fabricante. La proteina purificada fue configurada mediante ult rafiltración y analizada mediante espectrometría de masa de MALDI-TOF. La concentración de proteína fue medida mediante el método de Bradford .
ANÁLISIS DE NORTHERN Célilas TOP10 de E. coli ( Invotrogen™) transformadas con cada plásmido de supresión fueron incubadas en LB a 37°C. A ID600 = 0.8, las células fueron cosechadas. El tARN total fue aislado mediante extracción con fenol y fraccionamiento con isopropanol como se describe previamente (Deutscher y Hilderman, "Isolation and partial characterization of Escherichia coli mutants with low levéis of transfer ribonucleic acid nucleot idyltransferase , " J. Bacteriol., 118:621-627 (1974) ) . Las muestras de ARN fueron separadas en un gel de poliacrilamida desnaturalizante al 15% y transferidas a la membrana de GeneScreen Plus® ( PerkinElmer®) . La membrana fue hibridizada durante toda la noche a 55°C con: 5 ' -biot ina-CCCTGCTGAACTACCGCC-3 ' (SEQ ID NO: 58) . La sonda biotinilada hibridizada fue detectada utilizando el equipo de hibridización de quimioluminiscencia de North2South y detección (Pierce) de acuerdo con el protocolo del fabricante.
ANÁLISIS DE WESTERN DE EXPRESIÓN DE BPA Un gen de BpaRS marcado con hexahistidina C-terminal fue construido mediante PCR e insertado entre los sitios Ndel y PstI de pYR-BpaRS5 y pYR-BpaRS-TRN para generar pYR-BpaRS5 (C-His) y pYR-BpaRS-TRN (C-His) , respectivamente. Células TOP10 de E. coli transformadas con cada plásmido fueron intubadas en LB a 37°C. Las células fueron cultivadas a OD600 = 1 y lisis con reactivo de Bugbuster. La proteina total fue separada sobre gel de poliacrilamida al 10% y transferida a membrana PVDF ( Invitrogen ) . La membrana fue hibridizada con conjugado de anticuerpo de anti-His (término C)-HRP (Invitrogen) y detecato mediante quimioluminiscencia . *** Se comprenderá que los ejemplos y modalidades descritos en la presente son por propósitos ilustrativos solamente y que varios cambios y modificaciones a los mismos se sugerirán para las personas experimentadas en el arte y serán incluidos en el espíritu y alcance de esta solicitud y alcance de las reivindicaciones adjuntas. En tanto que la invención anterior ha sido descrita en algún detalle por propósitos de claridad y entendimiento, será claro para el experimentado en el arte a partir de una lectura de esta revelación que varios cambios en forma y detalle se pueden efectuar sin desviarse del verdadero alcance de la invención. Por ejemplo, todas las técnicas y aparatos descritos anteriormente pueden ser usados en varias combinaciones. Todas las publicaciones, patentes, publicaciones de patente u otros documentos citados en esta solicitud son incorporados por referencia en su totalidad para todos los propósitos a la misma extensión como si cada publicación, patente, solicitud de patente individual y/u otros documentos fueran indicados individualmente para ser incorporados por referencia para todos los propósitos.

Claims (82)

  1. REIVINDICACIONES 1. Una composición que comprende un constructo de ácido nucleico, el constructo está caracterizado porque comprende : (a) secuencias de nucleótidos de promotor y terminador derivadas de un gen de tARN prolina de Escherichia coli y una secuencia de nucleótidos expresable, en donde las secuencias de promotor y terminador son ambas enlazadas operativamente a la secuencia de nucleótidos expresable y en donde la secuencia de nucleótidos expresable es heteróloga a las secuencias de nucleótidos del promotor y terminador; (b) una secuencia de nucleótidos del promotor correspondiente a un promotor de glnS de E. coli modificado que tiene una secuencia de nucleótidos de SEQ ID NO: 13 y un nucleótido expresable, en donde la secuencia de nucleótidos del promotor glnS de E. coli modificada es enlazada operativamente a la secuencia de nucleótidos expresable; (c) una secuencia de nucleótidos que codifica un tARN ortogonal (O-tARN) y una secuencia de nucleótidos que codifica una aminoacil-tARN sintetasa ortogonal (O-RS) , en donde la O-RS aminoacila preferiblemente el O-tARN con un aminoácido no natural o (d) un operón policistrónico que comprende una pluralidad de secuencias de nucleótidos de gen tARN, en donde por lo menos un gen de tARN es separado de por lo menos un gen de tARN adyacente por un enlazador de polinucleótidos heterólogo derivado de un enlazador de polinucleótidos que se presenta de manera estable en la naturaleza de un operón de tARN que se presentan de manera estable en la naturaleza.
  2. 2. La composición de conformidad con la reivindicación 1, caracterizada porque el constructo comprende tanto (a) como (b) , en donde las secuencias de nucleótidos expresables en (a) y (b) son diferentes.
  3. 3. La composición de conformidad con la reivindicación 1, caracterizada porque el constructo comprende (a), (b) y (c) , en donde la secuencia de nucleótidos expresable en (a) codifica el O. tARN y en donde la secuencia de nucleótidos expresable en (b) codifica la O-RS .
  4. 4. La composición de conformidad con la reivindicación 1, caracterizada porque el gen de tARN de prolina de E. coli es seleccionado de genes de tARN proK, proL y proM en E. coli.
  5. 5. La composición de conformidad con la reivindicación 1, caracterizada porque las secuencias de promotor y terminador de tARN de prolina de E. coli derivadas de las secuencias de promotor y terminador de proK de E. coli provistas en SEQ ID NOS: 32 (promotor) y 33 (terminador), respectivamente .
  6. 6. La composición de conformidad con la reivindicación 1, caracterizada porque la secuencia de nucleótidos expresable en (a) es un operón policistrónico que comprende una pluralidad de una o más secuencias de nucleótidos .
  7. 7. La composición de conformidad con la reivindicación 1, caracterizada porque la secuencia de nucleótidos expresable en (a) codifica un tARN .
  8. 8. La- composición de conformidad con la reivindicación 7, caracterizada porque el tARN es derivado de uno o más tATN de Archaea .
  9. 9. La composición de conformidad con la reivindicación 7, caracterizada porque el tARN es codificado por una secuencia de nucleótidos de SEQ ID NO. 1 (MjtRNA-Tyr (CUA) ) .
  10. 10. La composición de conformidad con la reivindicación 7, caracterizada porque la secuencia de nucleótidos expresable es uno operón policistrónico que comprende una pluralidad de la secuencia de nucleótidos de SEQ ID NO: 1 (M tRNA-Tyr (CUA) ) .
  11. 11. La composición de conformidad con la reivindicación 10, caracterizada porque la secuencia de nucleótidos expresable es una pluralidad del operón policistrónico .
  12. 12. La composición de conformidad con la reivindicación 1, caracterizada porque la secuencia de nucleótidos expresable de (b) codifica un polipéptido.
  13. 13. La composición de conformidad con la reivindicación 1, caracterizada porque la secuencia de nucleótidos es expresable de (b) codifica una aminoacil-tARN sintetasa .
  14. 14. La composición de conformidad con la reivindicación 1, caracterizada porque la secuencia de nucleótidos expresable de (b) codifica una aminoacil-tARN sintetasa ortogonal (O-RS), en donde la O-RS aminoacila preferiblemente una O-tARN correspondiente con un aminoácido no natural.
  15. 15. La composición de conformidad con la reivindicación 14 caracterizada porque la O-RS es derivada de una aminoacil-tARN sintetasa de Methanococcus jannaschii.
  16. 16. La composición de conformidad con la reivindicación 14, caracterizada porque la O-RS es derivada de una tirosil-tARN sintetasa de Methanococcus jannaschii.
  17. 17. La composición de conformidad con la reivindicación 16,· caracterizada porque la O-RS tiene una sustitución de ácido aspártico a arginina en la posición de aminoácido 286 o en una posición análoga a la posición 286, en relación con las secuencias de aminoácidos de la tirosil-tARN sintetasa de Methanococcus jannaschii tipo silvestre provista en SEQ ID NO: 2 (Mj-tRNA-Tyr RS tipo silvestre) .
  18. 18. Una célula huésped caracterizada porque comprende la composición de conformidad con la reivindicación 1.
  19. 19. La célula huésped de conformidad con la reivindicación 18, caracterizada porque la célula huésped es una célula huésped eubacteriana .
  20. 20. La célula huésped de conformidad con la reivindicación 18, caracterizada porque la célula huésped es una célula de E. coli.
  21. 21. La composición de conformidad con la reivindicación 1, caracterizada porque el operón policistrónico de (d) comprende una pluralidad de enlazadores de polinucleótidos heterólogos idénticos.
  22. 22. La composición de conformidad con la reivindicación 1, caracterizada porque el operón policistrónico de (d) comprende una pluralidad de enlazadores de polinucleótidos heterólogos, en donde por lo menos dos de los enlazadores de polinucleótidos heterólogos son diferentes.
  23. 23. La composición de conformidad con la reivindicación 1, caracterizada porque el enlazador de polinucleótidos heterólogo de (d) comprende un nucleótido de timidita 5' terminal, un nucleótido de ademosina 3' terminal o tanto un nucleótido de timidina 5' terminal como un nucleótido de ademnosina 3' terminal.
  24. 24. La composición de conformidad con la reivindicación 1, caracterizada porque el enlazador de polinucleótidos heterólogo es derivado del enlazador de polinucleótidos que se presenta de manera estable en la naturaleza localizado entre los genes de tARN de Escherichia coli seleccionado de: valU y valX; ileT y alaT; serV y argV; valV y valW; glyT y thrT; metT y leuW; glnW y metU; hisR y leuT; glnU y glnW; leuP y leuV; glnV y glnX; alaW y alaX; i le£7 y alaU; ileV y alaV; metU y glnV; glyW y cysT; argX y hisR; y argY y argZ.
  25. 25. La composición de conformidad con la reivindicación 1, caracterizada porque el enlazador de polinucleótidos heterólogo de (d) es derivado de la secuencia de nucleótidos de SEQ ID NO: 14 (enlazador valU/valX) o 15 (enlazador ileT/ alaT) .
  26. 26. Un sistema de traducción para la expresión de un polipéptido de interés que comprende por lo menos un aminoácido no natural en una posición especificada, el sistema está caracterizado porque comprende: (a) un aminoácido no natural; (b) un constructo de ácido nucleico, el constructo comprende una secuencia de nucelótidos que codifica un tARN ortogonal (O-tARN) y una secuencia de nucleótidos que codifica una aminoacil-tARN sintetasa ortogonal (O-RS) , en donde la O-RS aminoacila preferiblemente el O-tARN con el aminoácido no natural y (c) un polinucleótido que codifica el polipéptido de interés, el polinucleótido que comprende por lo menos un codón selector que es reconocido por el O-tARN, en donde la posición del codón selector en el polinucleót ido controla la posición especificada del aminoácido no natural en el polipéptido de interés después de expresión del polinucleót ido para producir el polipéptido.
  27. 27. El sistema de traducción de conformidad con la reivindicación 26, caracterizado porque el constructo de ácido nucleico comprende por lo menos uno de: (i) secuencias de nucleótidos de promotor y terminador derivadas de un gen de tARN prolina de Escherichia coli, en donde las secuencias de promotor y de terminador están ambas enlazadas operativamente a la secuencia de nucleótidos que comprende o codifica el O-tARN, y en donde el O-tARN es heterólogo a las secuencias de nucleótidos de promotor y terminador; (ii) una secuencia de nucleótidos correspondiente a un promotor glnS de E. coli modificado que tiene una secuencia de nucleótidos de SEQ ID NO: 13, en donde la secuencia de nucleótidos de glnS de E. coli modificada está enlazada operati amente a la secuencia de nucleótidos que codifica la 0-RS; y (iii) un operon policistrónico que comprende una pluralidad de las secuencias de nucleótidos del gen de O-tARN, en donde por lo menos un gen de O-tARN está separado de por lo menos un gen de O-tARN adyacente mediante un enlazador de polinucleótidos heterólogo derivado de un enlazador de polinucleótidos que se presenta de manera estable en la naturaleza de un operón de tARN que se presenta de manera estable en la naturaleza.
  28. 28. El sistema de traducción de conformidad con la reivindicación 27, caracterizado porque el gen de tARN de prolina de E. coli es seleccionado de genes de tARN proK, proL y proM de E. coli.
  29. 29. El sistema de traducción de conformidad con la reivindicación 27, caracterizado porque las secuencias de promotor y terminador de tARN de prolina de E. coli son derivadas de las secuencias de promotor y terminador de proK de E. coli provistas en SEQ ID NOS: 32 (promotor) y 33 (terminador), respectivamente.
  30. 30. El sistema de traducción de conformidad con la reivindicación 27, caracterizado porque el operon policistrónico comprende una pluralidad de enlazadores de polinucleótidos heterologos idénticos.
  31. 31. El sistema de traducción de conformidad con la reivindicación 27, caracterizado porque el operon policistrónico comprende una pluralidad de enlazadores de polinucleótidos heterologos, en donde por lo menos dos de los enlazadores de polinucleótidos heterologos son diferentes.
  32. 32. El sistema de traducción de conformidad con la reivindicación 27, caracterizado porque el enlazador de polinucleótidos heterólogo comprende un nucleótido de timidina 5' terminal o un nucleótido de adenosina 3' terminal, o tanto un nucleótido de timidina 5' terminal como un nucleótido de adenosina 3' terminal.
  33. 33. El sistema de traducción de conformidad con la reivindicación 27, caracterizado porque el enlazador de polinucleótidos heterólogo es derivado de un enlazador de polinucleótidos que se presenta de manera estable en la naturaleza localizado entre los genes de tARN ' de Escherichia coli endógenos seleccionado de: valU y valX; ileT y alaT; serV y argV; valV y valW; glyT y thrT; metT y leuW; glnN y metU; hisR y leuT; glnU y glnW; leuP y leuV; glnV y glnX; alaW y alaX; íleU y alaU; ileV y alaV; metU y glnV; glyW y cyst; argX y hisR; y argY y argZ.
  34. 34. El sistema de traducción de conformidad con la rei indicación 27, caracterizado porque el enlazador de polinucleótidos heterólogo es derivado de la secuencia de nucleótidos de SEQ ID NO: 14 (enlazador valU/valX) o 15 (enlazador ileT/alaT) .
  35. 35. El sistema de traducción de conformidad con la reivindicación 26, caracterizado porque el 0-tARN es derivado de uno o más tARN de Archaea .
  36. 36. El sistema de traducción de conformidad con la reivindicación 26, caracterizado porque la secuencia de nucleótidos que codifica un 0-tARN es un operon policistrónico que comprende una pluralidad de secuencias de nucleótidos que codifican un O-tARN.
  37. 37. El sistema de traducción de conformidad con la reivindicación 26, caracterizado porque la secuencia de nucleótidos que codifica un O-tARN comprende una secuencia de nucleótidos de SEQ ID NO: 1 (MjtARN-Tyr (CUA) ) .
  38. 38. El sistema de traducción de conformidad con la reivindicación 26, caracterizado porque la secuencia de nucleótidos que codifica un O-tARN es un operon policistrónico que comprende una pluralidad de la secuencia de nucleótidos de SEQ ID NO: 1 (WjtARN-Tyr ( CUA) ) .
  39. 39. El sistema de traducción de conformidad con - la reivindicación 26, caracterizado porque la O-RS es derivada de una aminoacil-tARN sintetasa de Methanococcus jannaschii .
  40. 40. El sistema de traducción de conformidad con la reivindicación 26, caracterizado porque la O-RS es derivada de una tirosil-tARN sintetasa de Methanococcus jannaschii .
  41. 41. El sistema de traducción de conformidad con la reivindicación 26, caracterizado porque la O-RS tiene una sustitución de ácido aspártico a arginina en posición de aminoácido 286 o en una posición análoga a la posición 286, en relación con la secuencia de aminoácidos de la tirosil-tARN sintetasa de Methanococcus jannaschii tipo silvestre provista en SEQ ID NO: 2 (Mj-tARNTyr RS tipo silvestre) .
  42. 42. El sistema de traducción de conformidad con la reivindicación 26, caracterizado porque comprende una célula huésped que comprende (a) , (b) y (c) .
  43. 43. El sistema de traducción de conformidad con la reivindicación 42, caracterizado porque la célula huésped es una célula huésped eubacteriana .
  44. 44. El sistema de traducción de conformidad con la reivindicación 42, caracterizado porque la célula huésped es una célula de E. coli.
  45. 45. Un método para producir en una célula huésped, un polipéptido de interés que comprende un aminoácido no natural en una posición especificada, el método está caracterizado porque comprende: (a) proporcionar: (i) un aminoácido no natural; (ii) un constructo de ácido nucleico que comprende una secuencia de nucleótidos que codifica un tARN ortogonal (0-tARN) y una secuencia de nucleótidos que codifica una aminoacil-tARN sintetasa ortogonal (0-RS) , en donde la 0-RS aminoacila preferiblemente el 0-tARN con el aminoácido no natural; y, (iii) un polinucleótido que codifica el polipéptido de interés, el polinucleótido comprende por lo menos un codón selector que es reconocido por el 0-tARN, y en donde la posición del codón selector se correlaciona con la posición especificada del aminoácido no natural en el polipéptido de interés ; (iv) una célula huésped que comprende (i), (ii) y (üi) ; y (b) cultivar la célula huésped; y (c) incorporar el aminoácido no natural en la posición especificada en el polipéptido durante la traducción del polipéptido en la célula huésped, produciendo mediante esto el polipéptido de interés que comprende el aminoácido no natural en la posición especificada.
  46. 46. El método de conformidad con la reivindicación 45, caracterizado porque la provisión del constructo de ácido nucleico comprende proporcionar una secuencia de nucleótidos que codifica un O-tARN derivado de uno o más tARN de Archaea .
  47. 47. El método de conformidad con la reivindicación 45, caracterizado porque la provisión de constructo de ácido nucleico comprende proporcionar un operon policistrónico que comprende una pluralidad de secuencias de nucleótidos que codifican una o más especies de O-tARN.
  48. 48. El método de conformidad con la reivindicación 45, caracterizado porque la provisión del constructo de ácido nucleico comprende proporcionar una secuencia de nucleótidos que codifica un O-tARN que comprende una secuencia de nucleótidos de SEQ ID NO: 1 (MjtARN-Tyr (CUA) ) .
  49. 49. El método de conformidad con la reivindicación 45, caracterizado porque la provisión del constructo de ácido nucleico comprende proporcionar un operon policistrónico que comprende una pluralidad de la secuencia de nucleótidos de SEQ ID NO: 1 {MjtARN-Tyr ( CUA) ) .
  50. 50. El método de conformidad con la reivindicación 45, caracterizado porque la provisión de constructo de ácido nucleico comprende proporcionar una secuencia de nucleótidos que codifica una O-RS derivada de una aminoácido-tARN sintetasa de Methanococcus jannaschii .
  51. 51. El método de conformidad con la reivindicación 45, caracterizado porque la provisión del constructo de ácido nucleico comprende proporcionar una secuencia de nucleótidos que codifica una O-RS derivada de una tirosil-tARN sintetasa de Methanococcus jannaschii.
  52. 52. El método de conformidad con la reivindicación 45, caracterizado porque la provisión del constructo de ácido nucleico comprende proporcionar una secuencia de nucleótidos que codifica una O-RS que tiene sustitución de ácido aspártico a arginina en posición de aminoácidos 286 o en una posición análoga a la posición 286, en relación con la secuencia de aminoácidos de la tirosil-tARN sintetasa de Methanococcus jannaschii tipo silvestre provista en SEQ ID NO: 2 (Wj-tARNTyrRS tipo silvestre) .
  53. 53. El método de conformidad con la reivindicación 45, caracterizado porque la provisión del constructo de ácido nucleico comprende proporcionar por lo menos uno de: (I) secuencias de nucleótidos de promotor y terminador derivadas de un gen de tARN de prolina de Escherichia coli, en donde las secuencias de promotor y de terminador están ambas enlazadas operativamente a la secuencia de nucleótidos que codifica el O-tARN, y en donde la secuencia de nucleótidos que codifica el O-tARN es heteróloga a las secuencias de promotor y terminador; (II) un secuencia de nucleótidos de promotor correspondiente a un promotor de glnS de E. coli modificado que tiene una secuencia de nucleótidos de SEQ ID NO: 13, en donde la secuencia de nucleótidos de glnS de E. coli modificada está enlazada operativamente a la secuencia de nucleótidos que codifica la O-RS; y (III) un operon policistrónico que comprende una pluralidad de secuencias de nucleótidos de gen de O-tARN, en donde por lo menos un gen de O-tARN está separado de por lo menos un gen de O-tARN adyacente por un enlazador de polinucleótidos heterólogo derivado de un enlazador de polinucleótidos que se presenta de manera estable en la naturaleza de un operón de tARN que se presenta de manera estable en la naturaleza.
  54. 54. El método de conformidad con la reivindicación 53, caracterizado porque la provisión del constructo de ácido nucleico de (I) comprende proporcionar secuencias de nucleótidos correspondiente a secuencias de promotor y terminador de tARN de prolina de Escherichia colí, en tARN de prolina de E. coli es seleccionado de tARN proK, proL y proM de E. coli.
  55. 55. El método de conformidad con la reivindicación 53, caracterizado porque la provisión del constructo de ácido nucleico de (I) comprende proporcionar secuencias de nucleótidos correspondientes a secuencias de promotor y terminador de tARN de prolina de Escherichia coli, la secuencia de promotor y terminador de tARN de prolina de E. coli que comprenden las secuencias de promotor y terminador de proK de E. coli provistas en SEQ ID NOS: 32 (promotor) y 33 (terminador), respectivamente.
  56. 56. El método de conformidad con la reivindicación 53, caracterizado porque la provisión de un operon policistrónico de (III) comprende proporcionar una pluralidad de enlazadores de polinucleotidos heterologos idénticos.
  57. 57. El método de conformidad con la reivindicación 53, caracterizado porque la provisión de un operon policistrónico de (III) comprende proporcionar una pluralidad de enlazadores de polinucleotidos heterologos, en donde por lo menos dos de los enlazadores de polinucleótidos heterologos son diferentes .
  58. 58. El método de conformidad con la reivindicación 53, caracterizado porque la provisión de un operon policistrónico de (III) comprende proporcionar un enlazador de polinucleótidos heterólogo que comprende un nucleótido de timidina 5' terminal, un nucleótido de adenosina 3' terminal, o tanto un nucleótido de timidina 5' terminal como un nucleótido de adenosina 3' terminal.
  59. 59. El método de conformidad con la reivindicación 53, caracterizado porque la provisión de un operon policistrónico de (III) comprende proporcionar un enlazador de polinucleótidos heterólogo derivado del enlazador de polinucleótidos que se presenta de manera estable en la naturaleza localizado entre los genes de tARN de Escherichia coli endógenos seleccionados de: valU y valX; ileT y alaT; serV y argV; valV y valW; glyT y thrT; metT y leuW; glnW y metU; hisR y leuT; glnU y glnW; leuP y leuV; glnV y glnX; alaW y alaX; ileU y alaU; ileV y alaV; metU y glnV; glyW y cyst; argX y hisR; y argY y argZ.
  60. 60. El método de conformidad con la reivindicación 53, caracterizado porque la provisión de un operon policistrónico de (III) comprende proporcionar un enlazador de polinucleótidos heterólogo derivado de la secuencia de nucleótidos de SEQ ID NO: 14 (enlazador valU/valX) o 15 (enlazador HeT/alaT) .
  61. 61. El método de conformidad con la reivindicación 45, caracterizado porque la provisión de la célula huésped comprende proporcionar una célula huésped eubacteriana .
  62. 62. El método de conformidad con la reivindicación 45, caracterizado porque la provisión de la célula huésped comprende proporcionar una célula huésped de Escherichia coli.
  63. 63. Un método para producir en una célula huésped un polipéptido de interés que comprende un aminoácido no natural en una posición especificada, el método está caracterizado porque comprende: (a) proporcionar: (i) un aminoácido no natural; (ii) un constructo de ácido nucleico que comprende una secuencia de nucleótidos que codifica un tARN ortogonal (0-tARN) ; (iii) un constructo de ácido nucleico que comprende una secuencia de nucleótidos que codifica una aminoacil-tARN sintetasa ortogonal (0-RS) , en donde la 0-RS aminoacila preferiblemente el 0-tARN con el aminoácido no natural; (iv) un polinucleótido que codifica el polipéptido de interés, el polinucleótido comprende por lo menos un codón selector que es reconocido por el 0-tARN, y en donde la posición del codón selector se correlaciona con la posición 1 5 especificada del aminoácido no natural en el polipéptido de interés; y, (v) una célula huésped que comprende (i), (ii), (iii) y (iv) ; en donde los constructos de ácido nucleico de (ii) y (iii) comprenden colectivamente por lo menos uno de: (I) secuencias de nucleótidos de promotor y terminador derivadas de un gen de tARN de prolina de Escherichia coli, en donde las secuencias de promotor y terminador están ambas enlazadas operativamente a la secuencia de nucleótidos que codifica el O-tARN, y en donde la secuencia de nucleótidos que codifica el O-tARN es heteróloga a las secuencias de promotor y terminador; (II) un secuencia de nucleótidos de promotor correspondiente a un promotor de glnS de E. coli modificado que tiene una secuencia de nucleótidos de SEQ ID NO: 13, en donde la secuencia de nucleótidos de glnS de E. coli modificada está enlazada operativamente a la secuencia de nucleótidos que codifica la O-RS; y (III) un operon policistrónico que comprende una pluralidad de secuencias de nucleótidos de gen de O-tARN, en donde por lo menos un gen de O-tARN está separado de por lo menos un gen de O-tARN adyacente por un enlazador de polinucleótidos heterólogo derivado de un enlazador de polinucleótidos que se presenta de manera estable en la naturaleza de un operón de tARN que se presenta de manera estable en la naturaleza; (b) cultivar la célula huésped; y (c) incorporar el aminoácido no natural en la posición especificada en el polipéptido durante la traducción del polipéptido en la célula huésped, produciendo mediante esto el polipéptido de interés que comprende el aminoácido no natural en la posición especificada.
  64. 64 . El método de conformidad con la reivindicación 63 , caracterizado porque la provisión del constructo de ácido nucleico comprende proporcionar una secuencia de nucleótidos que codifica un O-tARN derivado de uno o más tARN de Archaea.
  65. 65 . El método de conformidad con la reivindicación 63 , caracterizado porque la provisión de constructo de ácido nucleico comprende proporcionar un operon policistrónico que comprende una pluralidad de secuencias de nucleótidos que codifican una o más especies de O-tARN.
  66. 66 . El método de conformidad con la reivindicación 63 , caracterizado porque la provisión del constructo de ácido nucleico comprende proporcionar una secuencia de nucleótidos que codifica un O-tARN que comprende una secuencia de nucleótidos de SEQ ID NO: 1 ( jtARN-Tyr (CUA) ) .
  67. 67 . El método de conformidad con la reivindicación 63 , caracterizado porque la provisión del constructo de ácido nucleico comprende proporcionar un operon policistrónico que comprende una pluralidad de la secuencia de nucleótidos de SEQ ID NO: 1 {MjtARN-Tyr (CUA) ) .
  68. 68. El método de conformidad con la reivindicación 63, caracterizado porque la provisión del constructo de ácido nucleico comprende proporcionar una secuencia de nucleótidos que codifica una O-RS derivada de una aminoacil-tARN sintetasa de Methanococcus jannaschii.
  69. 69. El método de conformidad con la reivindicación 63, caracterizado porque la provisión del constructo de ácido nucleico comprende proporcionar una secuencia de nucleótidos que codifica una O-RS derivada de una tirosil-tARN sintetasa de Methanococcus jannaschii.
  70. 70. El método de conformidad con la reivindicación 63, caracterizado porque la provisión del constructo de ácido nucleico comprende proporcionar una secuencia de nucleótidos que codifica una O-RS que tiene sustitución de ácido aspártico a arginina en posición de aminoácidos 286 o en una posición análoga a la posición 286, en relación con la secuencia de aminoácidos de tirosil-tARN sintetasa de Methanococcus jannaschii tipo silvestre provista en SEQ ID NO: 2 (Mj-tARNTyrRS tipo silvestre) .
  71. 71. El método de conformidad con la reivindicación 63, caracterizado porque la provisión del constructo de ácido nucleico de (I) comprende proporcionar secuencias de nucleótidos correspondiente a secuencias de promotor y terminador de tARN de prolina de Escherichia coli, el tARN de prolina de E. coli es seleccionada de tARN proK, proL y proM de E. coli.
  72. 72. El método de conformidad con la reivindicación 63, caracterizado porque la provisión del constructo de ácido nucleico de (I) comprende proporcionar secuencias de nucleótidos correspondiente a secuencias de promotor y terminador de tARN de prolina de Escherichia coli, las secuencias de promotor y terminador de tARN de prolina de E. coli comprenden las secuencias de promotor y terminador de proK de E. coli proporcionadas en SEQ ID NOS: 32 (promotor) y 33 (terminador), respectivamente.
  73. 73. El método de conformidad con la reivindicación 63, caracterizado porque la provisión del constructo de ácido nucleico de (III) comprende proporcionar una pluralidad de enlazadores de polinucleótidos heterologos idénticos.
  74. 74. El método de conformidad con la reivindicación 63, caracterizado porque la provisión del constructo de ácido nucleico de (III) comprende proporcionar una pluralidad de enlazadores de polinucleótidos heterologos, en donde por lo menos dos de los enlazadores de polinucleótidos heterologos son diferentes .
  75. 75. El método de conformidad con la reivindicación 63, caracterizado porque la provisión de un operon policistrónico de (III) comprende proporcionar un enlazador de polinucleótidos heterólogo que comprende un nucleótido de timidina 5' terminal, un nucleótido de adenosina 3' terminal, o tanto un nucleótido de timidina 5' terminal como un nucleótido de adenosina 3' terminal.
  76. 76. El método de conformidad con la reivindicación 63, caracterizado porque la provisión del operon policistrónico de (III) comprende proporcionar un enlazador de polinucleótidos heterólogo derivado de un enlazador de polinucleótidos que se presenta de manera estable en la naturaleza localizado entre los genes de tARN de Escherichia coli endógenos seleccionados de: valU y vaIX; íleT y alaT; serV y argV; vaIV y valW; glyT y thrT; metT y leuW; glnW y metU; hisR y leuT; glnU y glnW; leuP y leuV; glnV y glnX; alaW y alaX; ileU y alaU; ileV y alaV; metü y glnV; glyW y cyst; argX y hisR; y argY y argZ.
  77. 77. El método de conformidad con la reivindicación 63, caracterizado porque la provisión del operon policistrónico de (III) comprende proporcionar un enlazador de polinucleótidos heterólogo derivado de la secuencia de nucleótidos de SEQ ID NO: 14 (enlazador valU/valX) o 15 (enlazador HeT/alaT) .
  78. 78. El método de conformidad con la reivindicación 63, caracterizado porque la provisión de la célula huésped comprende proporcionar una célula huésped eubacteriana .
  79. 79. El método de conformidad con la reivindicación 63, caracterizado porque la provisión de la célula huésped comprende proporcionar una célula huésped de Escherichia coli.
  80. 80. Un método para producir un sistema de traducción para la expresión de un polipéptido de interés que comprende por lo menos un aminoácido no natural en una posición especificada, el método está caracterizado porque comprende proporcionar: (a) un aminoácido no natural; (b) un constructo de ácido nucleico, el constructo comprende una secuencia de nucleótidos que codifica un tARN ortogonal (O-tARN) y una secuencia de nucleótidos que codifica una aminoacil-tARN sintetasa ortogonal (O-RS) , en donde la O-RS aminoacila preferiblemente el O-tARN con el aminoácido no natural; y (c) un polinucleótido que codifica el polipéptido de interés, el polinucleótido que comprende por lo menos un codón selector que es reconocido por el O-tARN, en donde la posición del codón selector en el polinucleótido controla la posición especificada del aminoácido no natural en el polipéptido de interés después de expresión del polinucleótido para producir el polipéptido.
  81. 81. El método de conformidad con la reivindicación 80, caracterizado porque comprende una célula huésped que comprende (a) , (b) y (c) .
  82. 82. Un método para producir un polipéptido de interés que comprende un aminoácido no natural en una posición especificada, el método está caracterizado porque comprende: (a) proporcionar un sistema de traducción, el sistema de traducción comprende: (i) un aminoácido no natural; (ii) un constructo de ácido nucleico que comprende una secuencia de nucleótidos que codifica un tARN ortogonal (0-tARN) y una secuencia de nucleótidos que codifica una aminoacil-tARN sintetasa ortogonal (0-RS) , en donde la 0-RS aminoacila preferiblemente el 0-tARN con el aminoácido no natural; y, (iii) un polinucleótido que codifica el polipéptido de interés, el polinucleótido comprende por lo menos un codón selector que es reconocido por el 0-tARN, y en donde la posición del codón selector se correlaciona con la posición especificada del aminoácido no natural en el polipéptido de interés ; (iv) una célula huésped que comprende (i), (ii) y (üi) ; y (b) cultivar la célula huésped; y (c) incorporar el aminoácido no natural en la posición especificada en el polipéptido durante la traducción del polipéptido en la célula huésped, produciendo mediante esto el polipéptido de interés que comprende el aminoácido no natural en la posición especificada.
MX2008011470A 2006-03-09 2007-03-07 Sistemas para la expresion de componentes de traduccion ortogonales en celulas huesped eubacterianas. MX2008011470A (es)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US78097306P 2006-03-09 2006-03-09
US78349706P 2006-03-17 2006-03-17
US85533606P 2006-10-29 2006-10-29
PCT/US2007/005914 WO2007103490A2 (en) 2006-03-09 2007-03-07 System for the expression of orthogonal translation components in eubacterial host cells

Publications (1)

Publication Number Publication Date
MX2008011470A true MX2008011470A (es) 2008-09-24

Family

ID=38475556

Family Applications (1)

Application Number Title Priority Date Filing Date
MX2008011470A MX2008011470A (es) 2006-03-09 2007-03-07 Sistemas para la expresion de componentes de traduccion ortogonales en celulas huesped eubacterianas.

Country Status (14)

Country Link
US (3) US8198044B2 (es)
EP (1) EP1991680B1 (es)
JP (1) JP5589186B2 (es)
KR (1) KR20080106430A (es)
CN (1) CN101400796B (es)
AU (1) AU2007223830A1 (es)
BR (1) BRPI0709935A2 (es)
CA (1) CA2638763A1 (es)
ES (1) ES2432391T3 (es)
IL (1) IL193394A0 (es)
MX (1) MX2008011470A (es)
PL (1) PL1991680T3 (es)
PT (1) PT1991680E (es)
WO (1) WO2007103490A2 (es)

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2444098C (en) * 2001-04-19 2016-06-21 The Scripps Research Institute Methods and composition for the production of orthogonal trna-aminoacyltrna synthetase pairs
WO2004035605A2 (en) * 2002-10-16 2004-04-29 The Scripps Research Institute Glycoprotein synthesis
CN103215228A (zh) 2003-04-17 2013-07-24 斯克利普斯研究院 扩展真核生物遗传密码
DE602004011789T2 (de) 2003-07-07 2009-02-12 The Scripps Research Institute, La Jolla Zusammensetzungen der orthogonalen Lysyl-tRNA und Aminoacyl-tRNA Synthetase Paaren und ihre Verwendungen
JP2008513806A (ja) * 2004-09-22 2008-05-01 ザ スクリップス リサーチ インスティテュート Nmr試験のための蛋白質の部位特異的標識
JP5135504B2 (ja) 2004-10-27 2013-02-06 ザ スクリプス リサーチ インスティチュート 非天然アミノ酸のインビボ組込み用直交翻訳成分
WO2007103490A2 (en) 2006-03-09 2007-09-13 The Scripps Research Institute System for the expression of orthogonal translation components in eubacterial host cells
CN101405401B (zh) 2006-03-16 2013-03-27 斯克利普斯研究院 含非天然氨基酸苯基硒代半胱氨酸的蛋白质的遗传编程表达
US8192952B2 (en) 2006-05-23 2012-06-05 The Scripps Research Institute Genetically encoded fluorescent coumarin amino acids
JP5385143B2 (ja) 2006-09-21 2014-01-08 ザ スクリプス リサーチ インスティチュート 真正細菌における選択的に硫酸化された蛋白質の遺伝的にプログラムされた発現
CN101535338A (zh) 2006-10-18 2009-09-16 斯克利普斯研究院 在哺乳动物细胞中将非天然氨基酸遗传掺入蛋白质
EP2220218A4 (en) * 2007-11-02 2010-12-08 Scripps Research Inst BORONIC AMINO ACID GENETICALLY CODED
US8647840B2 (en) 2007-12-11 2014-02-11 The Scripps Research Institute In vivo unnatural amino acid expression in the methylotrophic yeast Pichia pastoris
MX2010008633A (es) * 2008-02-08 2010-09-30 Scripps Research Inst Ruptura de tolerancia inmunologica con un aminoacido no natural geneticamente codificado.
ES2660000T3 (es) 2008-09-26 2018-03-20 Ambrx, Inc. Vacunas y microorganismos dependientes de la replicación de aminoácidos no naturales
US20090197339A1 (en) * 2008-12-10 2009-08-06 The Scripps Research Institute In vivo unnatural amino acid expression in the methylotrophic yeast pichia pastoris
JP5959201B2 (ja) * 2008-12-10 2016-08-02 ザ スクリプス リサーチ インスティテュート 化学的に反応性の非天然アミノ酸を使用するキャリア−ペプチド接合体の製造
PL2605789T3 (pl) * 2010-08-17 2019-11-29 Ambrx Inc Zmodyfikowane polipeptydy relaksyny i ich zastosowania
KR101761464B1 (ko) 2012-05-23 2017-07-25 에프. 호프만-라 로슈 아게 내배엽 및 간세포를 수득하고 사용하는 조성물 및 방법
UY35368A (es) 2013-03-08 2014-10-31 Irm Llc Péptidos y composiciones para el tratamiento de daño articular
EP3021942A4 (en) 2013-07-19 2017-04-19 The Regents of The University of California Milk fat globule epidermal growth factor 8 regulates fatty acid uptake
CN109996809A (zh) 2016-11-14 2019-07-09 诺华股份有限公司 与促融合蛋白minion相关的组合物、方法和治疗用途
WO2018087727A1 (en) 2016-11-14 2018-05-17 Novartis Ag Methods and compositions for treatment of cartilage damage and arthritis
MX2019008449A (es) 2017-02-08 2019-09-09 Bristol Myers Squibb Co Polipetidos de relaxina modificada que comprenden un mejorador farmacocinetico y sus usos.
JP2022554396A (ja) * 2019-11-05 2022-12-28 ニトロ バイオサイエンシーズ, インコーポレイテッド パラ-ニトロ-l-フェニルアラニンの生合成
CN111304234A (zh) * 2020-02-27 2020-06-19 江南大学 一种适用于枯草芽孢杆菌的非天然氨基酸利用工具
CN113322267B (zh) * 2021-03-15 2024-01-05 天津大学 系统在提高非天然氨基酸的插入效率中的应用
WO2024091824A1 (en) 2022-10-26 2024-05-02 Ada Forsyth Institute, Inc. Differentiation and reprogramming of chondrocyte

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5024939A (en) 1987-07-09 1991-06-18 Genentech, Inc. Transient expression system for producing recombinant protein
EP1124939B1 (en) 1998-10-08 2003-04-23 AstraZeneca AB Microfabricated cell injector
EP2177627B1 (en) 1999-02-23 2012-05-02 Caliper Life Sciences, Inc. Manipulation of microparticles in microfluidic systems
CA2444098C (en) 2001-04-19 2016-06-21 The Scripps Research Institute Methods and composition for the production of orthogonal trna-aminoacyltrna synthetase pairs
US8220494B2 (en) 2002-09-25 2012-07-17 California Institute Of Technology Microfluidic large scale integration
WO2004035605A2 (en) 2002-10-16 2004-04-29 The Scripps Research Institute Glycoprotein synthesis
PT1578949E (pt) 2002-10-16 2009-07-14 Scripps Research Inst Incorporação específica do local de cetoaminoácidos em proteínas
MXPA05006836A (es) 2002-12-22 2005-08-16 Scripps Research Inst Colecciones ordenadas de proteinas.
CN103215228A (zh) * 2003-04-17 2013-07-24 斯克利普斯研究院 扩展真核生物遗传密码
MXPA05013833A (es) * 2003-06-18 2006-05-17 Scripps Research Inst Adiciones al codigo genetico de aminoacidos reactivos no naturales.
DE602004011789T2 (de) * 2003-07-07 2009-02-12 The Scripps Research Institute, La Jolla Zusammensetzungen der orthogonalen Lysyl-tRNA und Aminoacyl-tRNA Synthetase Paaren und ihre Verwendungen
US7527943B2 (en) 2003-07-07 2009-05-05 The Scripps Research Institute Compositions of orthogonal glutamyl-tRNA and aminoacyl-tRNA synthetase pairs and uses thereof
EP1704242A4 (en) * 2003-07-07 2008-06-18 Scripps Research Inst COMPOSITIONS WITH PAIRS OF ORTHOGONAL LEUCYL-TRNA AND AMINOACYL-TRNA-SYNTHETASE AND USES THEREOF
EP1687401B1 (en) 2003-10-14 2012-11-21 The Scripps Research Institute Site-specific incorporation of redox active amino acids into proteins
WO2006001832A2 (en) 2003-12-18 2006-01-05 The Scripps Research Institute Selective incorporation of 5-hyroxytryptophan into proteins in mammalian cells
MXPA06013586A (es) 2004-05-25 2007-11-09 Scripss Res Inst Incorporacion especifica del sitio de aminoacidos no naturales que contienen atomos pesados en proteinas para la determinacion de la estructura cristalina.
JP2008513039A (ja) 2004-09-21 2008-05-01 ザ スクリップス リサーチ インスティテュート 真正細菌の蛋白質へのアルキニルアミノ酸のインビボ組込み
EP1797177A4 (en) 2004-09-21 2008-07-09 Scripps Research Inst ADDITION OF PHOTOREGULATED AMINO ACIDS TO THE GENETIC CODE
JP2008513806A (ja) 2004-09-22 2008-05-01 ザ スクリップス リサーチ インスティテュート Nmr試験のための蛋白質の部位特異的標識
WO2006045116A2 (en) 2004-10-20 2006-04-27 The Scripps Research Institute In vivo site-specific incorporation of n-acetyl-galactosamine amino acids in eubacteria
JP5135504B2 (ja) 2004-10-27 2013-02-06 ザ スクリプス リサーチ インスティチュート 非天然アミノ酸のインビボ組込み用直交翻訳成分
BRPI0617191A2 (pt) 2005-10-12 2011-07-19 Scripps Research Inst modificação pós-traducional de polipeptìdeos expressos em fagos
WO2007103490A2 (en) 2006-03-09 2007-09-13 The Scripps Research Institute System for the expression of orthogonal translation components in eubacterial host cells
CN101405401B (zh) 2006-03-16 2013-03-27 斯克利普斯研究院 含非天然氨基酸苯基硒代半胱氨酸的蛋白质的遗传编程表达

Also Published As

Publication number Publication date
CA2638763A1 (en) 2007-09-13
US20090181429A1 (en) 2009-07-16
ES2432391T3 (es) 2013-12-03
US20070281335A1 (en) 2007-12-06
PT1991680E (pt) 2013-10-30
BRPI0709935A2 (pt) 2011-08-02
US8198044B2 (en) 2012-06-12
JP5589186B2 (ja) 2014-09-17
JP2009529328A (ja) 2009-08-20
IL193394A0 (en) 2009-09-22
PL1991680T3 (pl) 2014-01-31
WO2007103490A3 (en) 2008-06-12
US20120252067A1 (en) 2012-10-04
WO2007103490A2 (en) 2007-09-13
CN101400796A (zh) 2009-04-01
US7960141B2 (en) 2011-06-14
EP1991680A4 (en) 2009-10-21
CN101400796B (zh) 2013-03-27
AU2007223830A1 (en) 2007-09-13
EP1991680A2 (en) 2008-11-19
EP1991680B1 (en) 2013-08-21
KR20080106430A (ko) 2008-12-05
US8357512B2 (en) 2013-01-22

Similar Documents

Publication Publication Date Title
US8357512B2 (en) Systems for the expression of orthogonal translation components in eubacterial host cells
JP5192150B2 (ja) 直交リシルtRNAとアミノアシルtRNAシンテターゼの対の組成物及びその使用
EP1994165B1 (en) Genetically programmed expression of proteins containing the unnatural amino acid phenylselenocysteine
JP5823941B2 (ja) 真正細菌の蛋白質へのアルキニルアミノ酸のインビボ組込み
JP5385143B2 (ja) 真正細菌における選択的に硫酸化された蛋白質の遺伝的にプログラムされた発現
US20100021963A1 (en) Genetic incorporation of unnatural amino acids into proteins in mammalian cells
MXPA06004087A (es) Incorporacion especifica de sitio de amino acidos redox activos en proteinas.
MX2008014776A (es) Aminoacidos de cumarina fluorescentes geneticamente codificados.
WO2009064416A2 (en) Genetic incorporation of an alpha-hydroxy acid into proteins to generate ester backbone linkages at defined sites
EP1914314B1 (en) Compositions of orthogonal lysyl-tRNA and aminoacyl-tRNA synthetase pairs and uses thereof

Legal Events

Date Code Title Description
FG Grant or registration