MXPA05013833A - Adiciones al codigo genetico de aminoacidos reactivos no naturales. - Google Patents

Adiciones al codigo genetico de aminoacidos reactivos no naturales.

Info

Publication number
MXPA05013833A
MXPA05013833A MXPA05013833A MXPA05013833A MXPA05013833A MX PA05013833 A MXPA05013833 A MX PA05013833A MX PA05013833 A MXPA05013833 A MX PA05013833A MX PA05013833 A MXPA05013833 A MX PA05013833A MX PA05013833 A MXPA05013833 A MX PA05013833A
Authority
MX
Mexico
Prior art keywords
amino acid
protein
trna
natural amino
polypeptide
Prior art date
Application number
MXPA05013833A
Other languages
English (en)
Inventor
Alexander Deiters
Original Assignee
Scripps Research Inst
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Scripps Research Inst filed Critical Scripps Research Inst
Publication of MXPA05013833A publication Critical patent/MXPA05013833A/es

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/58Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving labelled substances
    • G01N33/583Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving labelled substances with non-fluorescent dye label
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P3/00Drugs for disorders of the metabolism
    • A61P3/08Drugs for disorders of the metabolism for glucose homeostasis
    • A61P3/10Drugs for disorders of the metabolism for glucose homeostasis for hyperglycaemia, e.g. antidiabetics
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/12Antivirals
    • A61P31/14Antivirals for RNA viruses
    • A61P31/18Antivirals for RNA viruses for HIV
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07CACYCLIC OR CARBOCYCLIC COMPOUNDS
    • C07C227/00Preparation of compounds containing amino and carboxyl groups bound to the same carbon skeleton
    • C07C227/22Preparation of compounds containing amino and carboxyl groups bound to the same carbon skeleton from lactams, cyclic ketones or cyclic oximes, e.g. by reactions involving Beckmann rearrangement
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07CACYCLIC OR CARBOCYCLIC COMPOUNDS
    • C07C229/00Compounds containing amino and carboxyl groups bound to the same carbon skeleton
    • C07C229/02Compounds containing amino and carboxyl groups bound to the same carbon skeleton having amino and carboxyl groups bound to acyclic carbon atoms of the same carbon skeleton
    • C07C229/34Compounds containing amino and carboxyl groups bound to the same carbon skeleton having amino and carboxyl groups bound to acyclic carbon atoms of the same carbon skeleton the carbon skeleton containing six-membered aromatic rings
    • C07C229/36Compounds containing amino and carboxyl groups bound to the same carbon skeleton having amino and carboxyl groups bound to acyclic carbon atoms of the same carbon skeleton the carbon skeleton containing six-membered aromatic rings with at least one amino group and one carboxyl group bound to the same carbon atom of the carbon skeleton
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07CACYCLIC OR CARBOCYCLIC COMPOUNDS
    • C07C269/00Preparation of derivatives of carbamic acid, i.e. compounds containing any of the groups, the nitrogen atom not being part of nitro or nitroso groups
    • C07C269/06Preparation of derivatives of carbamic acid, i.e. compounds containing any of the groups, the nitrogen atom not being part of nitro or nitroso groups by reactions not involving the formation of carbamate groups
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07CACYCLIC OR CARBOCYCLIC COMPOUNDS
    • C07C311/00Amides of sulfonic acids, i.e. compounds having singly-bound oxygen atoms of sulfo groups replaced by nitrogen atoms, not being part of nitro or nitroso groups
    • C07C311/30Sulfonamides, the carbon skeleton of the acid part being further substituted by singly-bound nitrogen atoms, not being part of nitro or nitroso groups
    • C07C311/37Sulfonamides, the carbon skeleton of the acid part being further substituted by singly-bound nitrogen atoms, not being part of nitro or nitroso groups having the sulfur atom of at least one of the sulfonamide groups bound to a carbon atom of a six-membered aromatic ring
    • C07C311/38Sulfonamides, the carbon skeleton of the acid part being further substituted by singly-bound nitrogen atoms, not being part of nitro or nitroso groups having the sulfur atom of at least one of the sulfonamide groups bound to a carbon atom of a six-membered aromatic ring having sulfur atoms of sulfonamide groups and amino groups bound to carbon atoms of six-membered rings of the same carbon skeleton
    • C07C311/39Sulfonamides, the carbon skeleton of the acid part being further substituted by singly-bound nitrogen atoms, not being part of nitro or nitroso groups having the sulfur atom of at least one of the sulfonamide groups bound to a carbon atom of a six-membered aromatic ring having sulfur atoms of sulfonamide groups and amino groups bound to carbon atoms of six-membered rings of the same carbon skeleton having the nitrogen atom of at least one of the sulfonamide groups bound to hydrogen atoms or to an acyclic carbon atom
    • C07C311/41Sulfonamides, the carbon skeleton of the acid part being further substituted by singly-bound nitrogen atoms, not being part of nitro or nitroso groups having the sulfur atom of at least one of the sulfonamide groups bound to a carbon atom of a six-membered aromatic ring having sulfur atoms of sulfonamide groups and amino groups bound to carbon atoms of six-membered rings of the same carbon skeleton having the nitrogen atom of at least one of the sulfonamide groups bound to hydrogen atoms or to an acyclic carbon atom to an acyclic carbon atom of a hydrocarbon radical substituted by nitrogen atoms, not being part of nitro or nitroso groups
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K1/00General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length
    • C07K1/107General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length by chemical modification of precursor peptides
    • C07K1/1072General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length by chemical modification of precursor peptides by covalent attachment of residues or functional groups
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K1/00General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length
    • C07K1/13Labelling of peptides
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/001Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof by chemical synthesis
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/18Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans
    • CCHEMISTRY; METALLURGY
    • C09DYES; PAINTS; POLISHES; NATURAL RESINS; ADHESIVES; COMPOSITIONS NOT OTHERWISE PROVIDED FOR; APPLICATIONS OF MATERIALS NOT OTHERWISE PROVIDED FOR
    • C09BORGANIC DYES OR CLOSELY-RELATED COMPOUNDS FOR PRODUCING DYES, e.g. PIGMENTS; MORDANTS; LAKES
    • C09B11/00Diaryl- or thriarylmethane dyes
    • C09B11/04Diaryl- or thriarylmethane dyes derived from triarylmethanes, i.e. central C-atom is substituted by amino, cyano, alkyl
    • C09B11/06Hydroxy derivatives of triarylmethanes in which at least one OH group is bound to an aryl nucleus and their ethers or esters
    • C09B11/08Phthaleins; Phenolphthaleins; Fluorescein
    • CCHEMISTRY; METALLURGY
    • C09DYES; PAINTS; POLISHES; NATURAL RESINS; ADHESIVES; COMPOSITIONS NOT OTHERWISE PROVIDED FOR; APPLICATIONS OF MATERIALS NOT OTHERWISE PROVIDED FOR
    • C09BORGANIC DYES OR CLOSELY-RELATED COMPOUNDS FOR PRODUCING DYES, e.g. PIGMENTS; MORDANTS; LAKES
    • C09B57/00Other synthetic dyes of known constitution
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/67General methods for enhancing the expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/93Ligases (6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/02Oxygen as only ring hetero atoms
    • C12P17/04Oxygen as only ring hetero atoms containing a five-membered hetero ring, e.g. griseofulvin, vitamin C
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/02Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/531Production of immunochemical test materials
    • G01N33/532Production of labelled immunochemicals
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/58Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving labelled substances
    • G01N33/582Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving labelled substances with fluorescent label
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2510/00Genetically modified cells
    • C12N2510/02Cells for production

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Immunology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Microbiology (AREA)
  • General Chemical & Material Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Hematology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biophysics (AREA)
  • Urology & Nephrology (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Cell Biology (AREA)
  • General Physics & Mathematics (AREA)
  • Food Science & Technology (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Diabetes (AREA)
  • Veterinary Medicine (AREA)
  • Public Health (AREA)
  • Animal Behavior & Ethology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Plant Pathology (AREA)
  • Virology (AREA)
  • Emergency Medicine (AREA)

Abstract

Esta invencion proporciona composiciones y metodos para producir componentes de traduccion que expanden el numero de aminoacidos geneticamente codificados en celulas eucarioticas. Los componentes incluyen ARNts ortogonales, aminoacil-ARNt sintetasas ortogonales, pares ortogonales de ARNts/sintetasas y aminoacidos no naturales. Tambien se proporcionan proteinas y metodos para producir proteinas con aminoacidos no naturales en celulas eucarioticas.

Description

ADICIONES AL CÓDIGO GENÉTICO DE AMINOÁCIDOS REACTIVOS NO NATURALES REFERENCIA CRUZADA A SOLICITUDES RELACIONADAS Esta solicitud es una solicitud de patente de utilidad normal basada en la USSN 60/479,931 titulada "Expanding the Eukariotic Genetic Code" (Expandiendo el Código Genético Eucariótico) por Chin et al., presentada en Junio 18 de 2003; USSN 60/493,014 titulada "Expanding the Eukariotic Genetic Code" (Expandiendo el Código Genético Eucariótico) por Chin et al., presentada en Agosto 5 de 2003; y la USSN 60/496,548 titulada "Expanding the Eukariotic Genetic Code" (Expandiendo el Código Genético Eucariótico) por Chin et al., presentada en Agosto 19 de 2003. Se reivindica en la presente prioridad y beneficio de cada una de estas solicitudes anteriores. DECLARACIÓN EN CUANTO A LOS DERECHOS PARA INVENCIONES HECHAS BAJO INVESTIGACIÓN y DESARROLLO CON PATROCINIO FEDERAL Este invención se hizo con apoyo gubernamental bajo el No. de Concesión GM 62159 de los National Institutes of Health y con apoyo bajo la Concesión DE-FG0300ER45812 del Department of Energy. El gobierno tiene ciertos derechos a esta invención. CAMPO DE LA INVENCIÓN La invención se refiere al campo de la bioquímica de traducción en células eucarióticas . La invención se - - refiere a métodos de producción y composiciones de ANts ortogonales, sintetasas ortogonales y pares de los mismos, en células eucarióticas . La invención también se refiere a composiciones de aminoácidos no naturales, proteínas y métodos para producir proteínas en células eucarióticas que incluyen aminoácidos no naturales . ANTECEDENTES DE LA INVENCIÓN El código genético de todo organismo conocido, desde bacterias hasta humanos, codifica para los mismos veinte aminoácidos comunes. Diferentes combinaciones de los mismos veinte aminoácidos naturales forman proteínas que contienen virtualmente todos los procesos complejos de la vida, desde la fotosíntesis hasta la transduccion de señal, y la respuesta inmune . A fin de estudiar y modificar la estructura y función de las proteínas, los científicos han intentado manipular tanto el código genético como la secuencia de aminoácidos de las proteínas. Sin embargo, ha sido difícil retirar las restricciones impuestas por el código genético que limitan las proteínas a veinte bloques de construcción estándar genéticamente codificados (con la rara excepción de la selenocisteína (ver, e.g., A. Bock et al., (1991), Molecular Microbiology 5:515-20) y pirrolisina (ver e.g., G. Srinivasan et al., (2002), Science 296:1459-62). Se ha hecho algún progreso para retirar estas restricciones, aunque este progreso ha sido limitado y la - - capacidad para controlar racionalmente la estructura y función de la proteína se encuentra aún en su infancia. Por ejemplo, los químicos han desarrollado métodos y estrategias para sintetizar y manipular la estructura de moléculas pequeñas (ver, e.g., E. J. Corey, & X. M. Cheng, The Logic of Chemical Synthesis (Wiley-Interscience, New York, 1995) ) . La síntesis total (ver, e.g., B. Merrifield (1986), Science 232:341-7 (1986)) y las metodologías semi-sintéticas (ver, e.g., D. Y. Jackson et al., (1994), Science 266:243-7; y P. E. Dawson & S . B. Kent (2000), Annual . Review of Biochemistry 69:923-60), han hecho posible sintetizar péptidos y protexnas pequeñas, pero estas metodologías han limitado la utilidad con proteínas sobre los 10 kilo Daltons (kDa) . Los métodos de mutagénesis, aunque poderosos, se encuentran restringidos a un número limitado de cambios estructurales. En una variedad de casos, ha sido posible incorporar competitivamente análogos estructurales cercanos de aminoácidos comunes a lo largo de las proteínas. Ver, e.g., R. Furter (1998), Protein Science, 7:419-26; K. irshenbaum et al., (2002), ChemBioChem 3:235-7; y V. Doring et al., (2001), Science 292:501-4. En un intento por extender la capacidad para manipular la estructura y función de las proteínas, se desarrollaron métodos in vitro utilizando AR ts ortogonales químicamente acilados que permitieron incorporar - - selectivamente aminoácidos no naturales en respuesta a un codón sin sentido in vitro (ver, e.g., J. A. Ellman et al., (1992), Science 255:197-200). Los aminoácidos con nuevas estructuras y propiedades físicas se incorporaron selectivamente en proteínas para estudiar el plegamiento y estabilidad de las proteínas y el reconocimiento y catálisis biomolecular. Ver, e.g., D. Mendel et al., (1995), Annual Review of Biophysics and Biomolecular Structure 24:435-462; y V. W. Cornish et al., (Marzo 31, 1995), Angewandte Chemie-International Edition in English 34:621-633. Sin embargo, la naturaleza estequiométrica de este proceso limitó severamente la cantidad de proteína que podía generarse. Se han micro inyectado en células aminoácidos no naturales. Por ejemplo, se introdujeron aminoácidos no naturales en el receptor nicotínico de acetilcolina en oocitos Xenopus (e.g., M. W. Nowak et al., (1998), In vivo incorporation of unnatural aminoacids into ion channels in Xenopus oocite expression system, (Incorporación in vivo de aminoácidos no naturales en canales iónicos en sistema de expresión de oocito Xenopus), Method Enzymol 293:504-529) mediante micro inyección de un ARNt de Tetrahymena thermophila químicamente mal acilado (e.g., M. E. Saks et al., (1996) . An engineered Tetrahymena tRNAGln for in vivo incorporation of unnatural aminoacids into proteins by nonsense suppression (Un AR tGln de Tetrahymena diseñado para - - la incorporación in vivo de aminoácidos no naturales en proteínas mediante supresión sin sentido) , J . Biol . Chem. 271:23169-23175), y en el ARNm relevante. Esto ha permitido estudios biofísicos detallados del receptor en oocitos mediante la introducción de aminoácidos que contienen cadenas laterales con propiedades físicas o químicas únicas. Ver, e.g., D. A. Dougherty (2000), Unnatural amino acids as probes of protein structure and function, (Aminoácidos no naturales como sondas de estructura y función de proteínas) , Curr . Opin. Chem. Biol. 4:645-652. Desafortunadamente, esta metodología se limita a proteínas en células que pueden micro inyectarse, y debido a que el AR t relevante se encuentra químicamente acilado in vitro, y no puede re-acilarse, el rendimiento de proteínas es muy bajo. Para superar estas limitaciones, se agregaron nuevos componentes a la maquinaria biosintética de las proteínas del procarioto de Escherichia coli (E. coli) (e.g., L. ang et al., (2001) Science 292:498-500), que permitió la codificación genética de los aminoácidos no naturales in vivo. Se ha incorporado eficientemente y con alta fidelidad en proteínas una cantidad de nuevos aminoácidos con nuevas propiedades químicas, físicas o biológicas incluyendo aminoácidos de marcas de fotoafinidad y fotoisomerizables , aminoácidos ceto, y aminoácidos glicosilados , en E. coli en respuesta al codón ámbar TAG, utilizando esta metodología.
- - Ver, e.g., J. W. Chin et al., (2002), Journal of the American Chemical Society 124:9026-9027; J. W. Chin & P. G. Schultz (2002), ChemBioChem 11:1135-1137; J. W. Chin et al., (2002), PNAS United States of America 99:11020-11024; y L. Wang & P. 6. Schultz, (2002), Chem. Comm. 1-10. Sin embargo, la maquinaria de traducción de procariotos y eucariotos no se encuentra altamente conservada; por tanto, los componentes de la maquinaria biosintética agregados a E. Coli, no pueden utilizarse frecuentemente para incorporar específicamente en el sitio aminoácidos no naturales en proteínas en células eucarióticas . Por ejemplo, el par de sintetasas/AENt de ethanococcus jannaschii tirosil-AR t que se utilizó en E. coli no es ortogonal en células eucarióticas. Adicionalmente . La transcripción de ARNt en eucariotos, pero no en procariotos, se lleva a cabo mediante R A Polymerasa III y esto establece restricciones en la secuencia primaria de los genes estructurales del ARNt que pueden transcribirse en células eucarióticas. Además, en contraste con las células procarióticas, los ARNts en células eucarióticas necesitan exportarse desde el núcleo, en donde se encuentran transcritos, en el citoplasma, para funcionar en la traducción. Finalmente, el ribosoma eucariótico 8OS es distinto al ribosoma procariótico 70S. En consecuencia, existe la necesidad de desarrollar componentes mejorados de la maquinaria biosintética para extender el código genético - - eucariótico. Esta invención cumple estas y otras necesidades, como será aparente al revisar la siguiente descripción. SUMARIO DE LA. INVENCIÓN La invención proporciona células eucarióticas con componentes de traducción, e.g., pares de aminoacil-ARNt sintetasas ortogonales (O-RSs) y ARNts ortogonales (O-ARNts) y sus componentes individuales, que se utilizan en la maquinaria sintética de proteínas eucarióticas para incorporar un aminoácido no natural en una cadena de polipéptido creciente, en una célula eucariotica. Las composiciones de la invención incluyen una célula eucariotica (e.g., una célula de levadura, (tal como una célula de Saccharomyces cerevisiae) , una célula de mamífero, una célula vegetal, una célula de alga, una célula de hongo, una célula de insecto, etc.) que comprende una aminoacil-ARNt sintetasa ortogonal (O-RS) (e.g., derivada de un organismo no eucariótico, tal como Escherichia coli, Bacillus stearothermophilus , etc.), en donde la O-RS preferentemente amxnoacila un ARNt ortogonal (0-ARNt) con al menos un aminoácido no natural en la célula eucariotica. Opcionalmente, dos o más OARNts pueden aminoacilarse en una célula eucariotica dada. En un aspecto, una O-RS amxnoacila un 0-ARNt con el aminoácido no natural, e.g., al menos 40%, al menos 45%, al menos 50%, al menos 60%, al menos 75%, al - - menos 80% o incluso 90% o más, tan eficientemente como una 0-RS que tiene una secuencia de aminoácidos, e.g., como se describe en la SEQ ID NO: 86 o 45. En una modalidad, una 0-RS de la invención aminoacila el O-ARNt con el aminoácido ño natural, e.g., al menos 10 veces, al menos 20 veces, al menos 30 veces, etc., más eficientemente que la O-RS aminoacila el O-ARNt con un aminoácido natural . En una modalidad, la O-RS o una porción de la misma se codifica por una secuencia de polinucleótidos como se describe en cualquiera de SEQ ID NO: 3-35 (e.g., 3-19, 20-35, o cualquier otro subconjunto de las secuencias 3-35) , o por una secuencia de polinucleótidos complementaria de las mismas. En otra modalidad, la O-RS comprende una secuencia de aminoácidos como se describe en cualquiera de las SEQ ID NO: 36-63 (e.g., 36-47, 48-63, o cualquier otro subconjunto de 36-63) , y/o 86, o una variación conservadora de las mismas. Aún en otra modalidad, la O-RS comprende una secuencia de aminoácidos que es e.g., al menos 90%, al menos 95%, al menos 98%, al menos 99% o al menos 99.5% o más, idéntica a la de una tirosil aminoacil-ARNt sintetasa (TyrRS) de origen natural y comprende dos o más aminoácidos de los grupos A-E. El grupo A incluye valina, isoleucina, glicina, serina, alanina, o treonina en una posición correspondiente a Tyr37 de una TyrRS de E. coli. El grupo B incluye aspartato en una posición correspondiente a Asnl26 de una TyrRS de E. coli. El grupo C incluye treonina, serina, arginina, asparagina, o glicina en una posición correspondiente a Aspl82 de una TyrRS de E. coli. El grupo D incluye metionina, alanina, valina o tirosina en una posición correspondiente a Phel83 de una TyrRS de E. coli; y el grupo E incluye serina, metionina, valina, cisteína, treonina o alanina en una posición correspondiente a Leul86 de una TyrRS de E. coli. Cualquier subconjunto de combinaciones de estos grupos es una característica de la invención. Por ejemplo, en una modalidad, la 0-RS tiene dos o más aminoácidos seleccionados de presentaciones de valina, isoleucina, leucina o treonina en una posición correspondiente a Tyr37 de la TyrRS de E. coli; treonina, serina, arginina, o glicina en una posición correspondiente a Aspl82 de una TyrRS de E. coli; metionina, o tirosina en una posición correspondiente a Phel83 de una TyrRS de E. coli; y serina, o alanina en una posición correspondiente a Leul86 de una TyrRS de E. coli. En otra modalidad, la 0-RS tiene dos o más aminoácidos seleccionados de glicina, serina o alanina en una posición correspondiente a Tyr37 de la TyrRS de E. coli; aspartato en una posición correspondiente a Asnl26 de una TyrRS de E. coli; asparagina en una posición correspondiente a Aspl82 de una TyrRS de E. coli; alanina o valina en una posición correspondiente a Phel83 de una TyrRS de E. coli; y/o - - metionina, valina, cisteína o treonina en una posición correspondiente a Leul86 de una TyrRS de E. coli. En otra modalidad, la G-RS tiene una o más propiedades enzimáticas mejoradas o aumentadas para el aminoácido no natural en comparación con un aminoácido natural. Por ejemplo, las propiedades mejoradas o aumentadas para el aminoácido no natural en comparación con un aminoácido natural incluyen cualquiera de e.g., un Km más alto, un Km más bajo, un kcat más alto, un kcat más bajo, un kcat/km más bajo, un kcat/km más alto, etc. La célula eucariotica también incluye opcionalmente un aminoácido (s) no natural (es) . La célula eucariotica incluye opcionalmente un ARNt ortogonal (0-AR t) (e.g., derivado de un organismo no eucariótico, tal como Escherichia coli, Bacillus stearothermophilus, y/o lo similar) , en donde el O-ARNt reconoce un codón selector y preferentemente se aminoacila con el aminoácido no natural por la O-RS. En un aspecto, el O-ARNt media la incorporación del aminoácido no natural en una protexna, e.g., con al menos al menos 45%, al menos 50%, al menos 60%, al menos 75%, al menos 80% o incluso 90%, al menos 95% o 99%, o la eficiencia de un ARNt que comprende o se procesa en una célula proveniente de una secuencia de polinucleótidos como se describe en la SEQ ID NO: 65. En otro aspecto, el O-ARNt comprende la secuencia SEQ ID NO: 65, y la O-RS comprende una secuencia de - - polipéptidos seleccionada de una secuencia de aminoácidos como se describe en cualquiera de SEQ ID NO: 36-63 (e.g., 36-47, 48-63 o cualquier otro subconjunto de la 36-63) , y/o 86, y/o una variación conservadora de las mismas. En otra modalidad, la célula eucariótica comprende un ácido nucleico que comprende un polinucleótido que codifica para un polipéptido de interés, en donde el polinucleótido comprende un codón selector reconocido por el O-ARNt . En un aspecto, el rendimiento del, polipéptido de interés, que comprende un aminoácido no natural, e.g., es de al menos 2.5%, al menos 5%, al menos 10%, al menos 25%, al menos 30%, al menos 40%, 50% o más, el obtenido por el polipéptido de origen natural de interés de una célula en la cual el polinucleótido carece del codón selector. En otro aspecto, la célula produce el polipéptido de interés en ausencia del aminoácido no natural, con un rendimiento que es, e.g., menor que 35%, menor que 30%, menor que 20%, menor que 15%, menor que 10%, menor que 5%, menor que 2.5%, etc., del rendimiento del polipéptido en presencia del aminoácido no natural. La invención proporciona también una célula eucariótica que comprende una aminoacil-ARNt sintetasa ortogonal (O- S) , un ARNt ortogonal (O-ARNt) , un aminoácido no natural y un ácido nucleico que comprende un polinucleótido que codifica para un polipéptido de interés.
- - El polinucleótido comprende un codón selector reconocido por el O-ARNt. Adicionalmente, la O-RS preferentemente aminoacila el ARNt ortogonal (O-ARNt) con el aminoácido no natural en la célula eucariótica, y la célula produce el polipéptido de interés en ausencia del aminoácido no natural, con un rendimiento que es, e.g., menor que 30, menor que 20%, menor que 15%, menor que 10%, menor que 5%, menor que 2.5%, etc., del rendimiento del polipéptido en presencia del aminoácido no natural . Las composiciones que incluyen una célula eucariótica que comprende un ARNt ortogonal (O-ARNt) también son una característica de la invención. Típicamente, el O-AR t media la incorporación de un aminoácido no natural en una proteína codificada por un polinucleótido que comprende un codón de selección reconocido por el O-ARNt in vivo. En una modalidad, el O-ARNt media la incorporación del aminoácido no natural en la proteína con, e.g., al menos 45%, al menos 50%, al menos 60%, al menos 75%, al menos 80%, al menos 90%, al menos 95% o incluso 99% o más, la eficiencia de un ARNt que comprende o se procesa en una célula proveniente de una secuencia de polinucleótidos como se describe en la SEQ ID NO: 65. En otra modalidad, el O-ARNt comprende o se procesa a partir de una secuencia de polinucleótidos como se describe en la SEQ ID NO: 65 o una variación conservadora de la misma. Aún en otra modalidad, el O-ARNt comprende un O- - 3 - AR t reciclable. En un aspecto de la invención, el 0-ARNt se modifica de manera post-transcripcional . La invención proporciona también un ácido nucleico que codifica para un 0-ARNt en una célula eucariótica, o un polinucleótido complementario de la misma. En una modalidad, el ácido nucleico comprende una casilla A y una casilla B. La invención caracteriza también métodos para producir componentes de traducción, e.g., pares de 0-RSs o de O-ARNt/0-RS (y componentes de traducción producidos mediante estos métodos) . Por ejemplo, la- invención proporciona métodos para producir una aminoacil-ARNt sintetasa ortogonal (0-RS) que preferentemente aminoacila un ARNt ortogonal con un aminoácido no natural en una célula eucariótica. El método incluye, e.g., (a) someter a selección positiva, en presencia de un aminoácido no natural, una población de células eucarióticas de una primera especie, en donde las células eucarióticas comprenden cada una: i) un miembro de una biblioteca de aminoacil-ARNt sintetasas (RSs) , ii) un ARNt ortogonal (0-ARNt) , iii) un polinucleótido que codifica para un marcador de selección positiva, y iv) un polinucleótido que codifica para un marcador de selección negativa; en donde las células que sobreviven la selección positiva comprenden una RS activa que aminoacila el ARNt ortogonal (0-ARNt) en presencia de un aminoácido no natural.
Las células que sobreviven la selección positiva se someten a selección negativa en ausencia del aminoácido no natural para eliminar las RSs activas que aminoacilan el O-ARNt con un aminoácido natural . Esto proporciona la O-RS que preferentemente aminoacila el O-ARNt con el aminoácido no natural . En ciertas modalidades, el polinucleotido que codifica para el marcador de selección positiva, se encuentra operablemente enlazado a un elemento de respuesta y las células comprenden además un polinucleotido que: a) codifica para una proteína moduladora de transcripción (e.g., una proteína eucariótica moduladora de transcripción etc.) que modula la transcripción proveniente del elemento de respuesta, y b) comprende al menos un codón selector. La incorporación del aminoácido no natural en la proteína moduladora de transcripción mediante el O-ARNt aminoacilado con el aminoácido no natural, da como resultado la transcripción del marcador de selección positiva. En una modalidad, la proteína moduladora de transcripción es una proteína activadora de transcripción (e.g., GAL4, etc.), y el codón selector es un codón ámbar de detención, e.g., cuando el codón ámbar de detención se localiza en o sustancialmente cercano a una porción del polinucleotido que codifica para un dominio de enlace de ADN de la proteína activadora de transcripción.
- - El marcador de selección positiva puede ser cualquiera de una variedad de moléculas. En una modalidad, el marcador de selección positiva comprende un suplemento nutritivo para el crecimiento y la selección se lleva a cabo en un medio carente del suplemento nutritivo. En otra modalidad, el polinucleotido que codifica para el marcador de selección positiva es, e.g., un gen ura3, leu2, lys2, lacZ, his3 (e.g., cuando el gen his3 codifica para una imidazolo glicerol fosfato dehidratasa, detectada proporcionando 3-aminotriazolo (3-AT) ) , y/o lo similar. Aún en otra modalidad, el polinucleotido que codifica para el marcador de selección positiva comprende un codón selector. Como con el marcador de selección positiva, el marcador de selección negativa también puede ser cualquiera de una diversidad de moléculas. En ciertas modalidades, el polinucleotido que codifica para el marcador de selección negativa se encuentra operablemente enlazado a un elemento de respuesta a partir del cual se media la transcripción por la proteína moduladora de transcripción. La incorporación de un aminoácido natural en la proteína moduladora de transcripción por el 0-ARNt aminoacilado con un aminoácido natural da como resultado la transcripción del marcador de selección negativa. En una modalidad, el polinucleotido que codifica para el marcador de selección negativa es e.g., un gen ura3 y se logra la selección negativa en un medio que comprende - - ácido 5-fluoroacético (5-FOA) . En otra modalidad, el medio utilizado para la selección negativa comprende un agente de selección o filtración que se convierte en una sustancia detectable mediante el marcador de selección negativa. En un aspecto de la invención, la sustancia detectable es una sustancia tóxica. En una modalidad, el polinucleótido que codifica para el marcador de selección negativa comprende un codón selector. En ciertas modalidades, el marcador de selección positiva y/o el marcador de selección negativa comprende un polipéptido que hace fluorescente o cataliza una reacción luminiscente en presencia de un reactivo adecuado. En un aspecto de la invención, el marcador de selección positiva y/o el marcador de selección negativa se detecta mediante selección celular activada por fluorescencia (FACS) , o mediante luminiscencia. En ciertas modalidades, el marcador de selección positiva y/o el marcador de selección negativa comprende un marcador de selección basado en la afinidad, o una protexna moduladora de transcripción. En una modalidad, el mismo polinucleótido codifica tanto para el marcador de selección positiva como para el marcador de selección negativa . En una modalidad, el polinucleótido que codifica para el marcador de selección positiva y/o para el marcador de selección negativa de la invención, puede comprender al menos dos codones selectores, que pueden comprender cada uno o ambos al menos dos diferentes codones selectores o al menos dos de los mismos codones selectores. También pueden utilizarse niveles adicionales de rigidez de selección/filtración en los métodos de la invención. En una modalidad, los métodos pueden comprender, e.g., proporcionar una cantidad variable de una sintetasa inactiva en la etapa (a) , (b) o tanto (a) como (b) , en donde la cantidad variable de la sintetasa inactiva proporciona un nivel adicional de rigidez de selección o filtración. En una modalidad, la etapa (a) , (b) , o ambas etapas (a) y (b) del método para producir una O-RS incluyen variar la rigidez de selección o filtración, e.g., del marcador de selección positiva y/o negativa. El método incluye opcionalmente someter la O-RS que preferentemente aminoacila el O-AR t con el aminoácido no natural, a una ronda de selección adicional, e.g., una ronda(s) adicional (es) de selección positiva, una ronda (s) adicional (es) de selección negativa, o combinaciones de ambas rondas adicionales de selección positiva y negativa. En una modalidad, la selección/filtración comprende una o más selecciones/filtraciones positivas o negativas seleccionadas de, e.g., un cambio en la permeabilidad del aminoácido, un cambio en la eficiencia de traducción, un cambio en la fidelidad de traducción, etc. El uno o más cambios basados en una mutación en uno o más de los - 8 - polinucleótidos que codifican para un componente del par de ARNt-ARNt sintetasa ortogonal, se utilizan para producir la proteina. Típicamente, la biblioteca de RSs (e.g., la biblioteca de RSs mutantes) comprende RSs derivadas de al menos una aminoacil-AR t sintetasa (RS) , e.g., de un organismo no eucariótico. En una modalidad, la biblioteca de RSs se deriva de una RS inactiva, e.g., cuando la Rs inactiva se genera mediante la mutación de una RS activa. En otra modalidad, la RS inactiva comprende una bolsa de enlace de aminoácidos, y uno o más aminoácidos que comprenden la bolsa de contención se sustituyen con uno o más aminoácidos diferentes, e.g., los aminoácidos sustituidos se sustituyen con alaninas . En ciertas modalidades, el método para producir una 0-RS incluye además efectuar una mutación aleatoria, mutación específica en el sitio, recombinación, construcción quimérica o cualquier combinación de las mismas, en un ácido nucleico que codifica una RS, con lo cual se produce la biblioteca de RSs mutantes. En ciertas modalidades, el método incluye además, e.g., (c) aislar un ácido nucleico que codifica para la O-RS; (d) generar a partir del ácido nucleico, un conjunto de polinucleótidos que codifica para las O-RSs mutantes (e.g., mediante mutagénesis aleatoria, mutación específica en el sitio, construcción quimérica, recombinación o cualquier - - combinación de las mismas) ; y (e) repetir las etapas (a) y/o (b) hasta obtener una O-RS mutada que preferentemente aminoacila el O-ARNt con el aminoácido no natural . En un aspecto de la invención, las etapas (c) - (e) se llevan a cabo al menos dos veces. Los métodos para producir pares de 0-ARNt-O-RS también son una característica de la invención. En una modalidad, la O-RS se obtiene como se describió anteriormente y el O-ARNt se obtiene sometiendo a selección negativa una población de células eucarióticas de una primera especie, en donde las células eucarióticas comprenden un miembro de una biblioteca de ARNts, para eliminar las células que comprenden un miembro de la biblioteca de ARNts que se aminoacila mediante una aminoacil-ARNt sintetasa (RS) endógena para las células eucarióticas. Esto proporciona un depósito de ARNts ortogonales para la célula eucariotica de la primera especie. En un aspecto de la invención, la biblioteca de ARNts comprende ARNts derivadas de al menos un ARNt, e.g., proveniente de un organismo no eucariótico. En otro aspecto de la invención, la biblioteca de aminoacil-ARNt sintetasas (RSs) comprende RSs derivadas de al menos una aminoacil-ARNt sintetasa (RS) , e.g., proveniente de un organismo no eucariótico. Aún en otro aspecto de la invención, la biblioteca de ARNts comprende ARNts derivados de al menos un ARNt proveniente de un primer organismo no eucariótico. La - - biblioteca de aminoacil-ARNt sintetasa (RSs) comprende opcionalmente RSs derivadas de al menos una aminoacil-ARNt sintetasa proveniente de un segundo organismo no eucariótico. En una modalidad, los primero y segundo organismos no eucarióticos son el mismo. Alternativamente, los primero y segundo organismos no eucarióticos pueden ser diferentes. Los pares específicos de 0-ARNt/O-RS producidos mediante los métodos de la invención también son una característica de la invención. Otra característica de la invención es un método para producir componentes de traducción en una especie, e introducir los componentes de traducción seleccionados/filtrados en una segunda especie. Por ejemplo, el método para producir un par de O-ARNt/0-RS en una primera especie, (e.g., una especie eucariótica, tal como levadura y lo similar) , incluye además introducir un ácido nucleico que codifica para el O-ARNt y un ácido nucleico que codifica para la O-RS en una célula eucariótica de una segunda especie (e.g., un mamífero, un insecto, un hongo, un alga, una planta y lo similar) . La segunda especie puede utilizar los componentes de traducción introducidos para incorporar el aminoácido no natural en una cadena de polipéptido creciente in vivo, e.g., durante la traducción. En otro ejemplo, un método para producir una aminoacil-ARNt sintetasa ortogonal (O-RS) que preferentemente - - aminoacila un ARNt ortogonal con un aminoácido no natural en una célula eucariótica incluye: (a) someter a selección positiva, en presencia de un aminoácido no natural, a una población de células eucarióticas de una primera especie (e.g., una especie eucariótica, tal como levadura o lo similar) . Las células eucarióticas de la primera especie comprenden cada una: i) un miembro de una biblioteca de aminoacil-ARNt sintetasas (RSs) , ii) un ARNt ortogonal (0-ARNt, iii) un polinucleótido que codifica para un marcador de selección positiva, y iv) un polinucleótido que codifica para un marcador de selección negativa. Las células que sobreviven la selección positiva comprenden una RS activa que aminoacila el AR t ortogonal )0-AR t) en presencia de un aminoácido no natural . Las células que sobreviven la selección positiva se someten a una selección negativa en ausencia del aminoácido no natural para eliminar las RSs activas que amino'acilan el 0-ARNt con un aminoácido natural, con lo cual se proporciona una 0-RS que preferentemente aminoacila el 0-AR t con el aminoácido no natural . Un ácido nucleico que codifica el 0-ARNt y un ácido nucleico que codifica la O-RS se introducen en una célula eucariótica de una segunda especie (e.g., mamífero, un insecto, un hongo, un alga, una planta y/o lo similar) . Estos componentes, al trasladarse en la segunda especie, pueden utilizarse para incorporar aminoácidos no naturales en una proteína o - - polipéptido de interés en la segunda especie. En una modalidad, el O-ARNt y/o la O-RS se introducen en una célula eucariótica de una segunda especie . En ciertas modalidades, el O-ARNt se obtiene sometiendo a selección negativa a una población de células eucarióticas de una primera especie, en donde las células eucarióticas comprenden un miembro de la biblioteca de ARNts para eliminar las células que comprenden un miembro de la biblioteca de ARNts que se aminoacila mediante una aminoacil-ARNt sintetasa (RS) endógena para las células eucarióticas. Esto proporciona un depósito de ARNts ortogonales a la célula eucariótica de la primera especie y de la segunda especie. En un aspecto, la invención comprende una composición que comprende una proteína, en donde la proteina comprende al menos un aminoácido no natural y al menos una modificación de post-traducción, en donde al menos una modificación post-traducción comprende la unión de una molécula que comprende un segundo grupo reactivo por medio de una cicloadición [3+2] para el al menos un aminoácido no natural que comprende un primer grupo reactivo. De este modo, las proteínas (o polipéptidos de interés) con al menos un aminoácido no natural también son una característica de la invención. En ciertas modalidades de la invención, una proteína con al menos un aminoácido no natural incluye al menos una modificación de post-traducción.
- - En una modalidad, la al menos una modificación posttraducción comprende la unión de una molécula (e.g., un colorante, un polímero, e.g., un derivado de polietilen glicol, un foto reticulador, un compuesto citotóxico, una marca de afinidad, un derivado de biotina, una resina, una segunda proteína o polipéptido, un quelador metálico, un cofactor, un ácido graso, un carbohidrato, un polinucleótido (e.g., ADN, ARN, etc.), que comprende un segundo grupo reactivo por medio de una cicloadición [3+2] al menos un aminoácido no natural que comprende un primer grupo reactivo. Por ejemplo, el primer grupo reactivo es un residuo alquinilo (e.g., en el aminoácido no natural p-propargiloxifenilalanina) (este grupo también se refiere algunas veces como un residuo acetileno) , y el segundo grupo reactivo es un residuo azido. En otro ejemplo, el primer grupo reactivo es el residuo azido (e.g., en el aminoácido natural p-azido-L-fenilalanina) y el segundo grupo reactivo es el residuo alquinilo. En ciertas modalidades, una proteína de la invención incluye al menos un aminoácido no natural (e.g., un aminoácido ceto no natural) que comprende al menos una modificación de post-traducción, en donde la al menos una modificación post-traducción comprende un residuo sacárido. En ciertas modalidades, la modificación posttraducción se produce in vivo en una célula eucariótica. En ciertas modalidades, la proteína incluye al menos una modificación post-traducción que se produce in vivo por medio de una célula eucariótica, en donde la modificación post-traducción no se produce por medio de una célula procariótica . Ejemplos de modificaciones de post-traducción incluyen pero no se limitan a acetilación, acilación, modificación de lípidos, palmitoilación, adición de palmitato, fosforilación, modificación de enlace de glicolípidos, y lo similar. En una modalidad, la modificación post-traducción comprende la unión de un oligosacárido a una asparagina mediante un enlace de GlcNAc-asparagina (e.g., en donde el oligosacárido comprende (GlcNAc- an) 2-Man-GlcNAc-GlcNAc, y lo similar). En otra modalidad, la modificación post-traducción comprende la unión de un oligosacárido (e.g., Gal-GalNAc, Gal-GlcNAc, etc.) a una serina o treonina mediante un enlace GalNAc-serina, GalNAc-treonina, GlcNAc-serina o GlcNAc-treonina. En ciertas modalidades, una proteína o polipéptido de la invención puede comprender una secuencia de secreción o localización, una marca de epítope, una marga FLAG, una marca de polihistidina, una fusión GST, y/o lo similar. Típicamente, las proteínas son, al menos 60%, al menos 70%, al menos 75%, al menos 80%, al menos 90%, al menos 95% o incluso al menos 99% o más, idénticas a cualquier proteína disponible (e.g., una proteína terapéutica, una proteína diagnóstica, una enzima industrial, o una porción de - - las mismas y/o lo similar) , y comprenden uno o más aminoácidos no naturales. En una modalidad, una composición de la invención incluye una proteína o polipeptido de interés y un excipiente (e.g., un amortiguador, un excipiente farmacéuticamente aceptable, etc.). La proteína o polipeptido de interés puede contener al menos uno, al menos dos, al menos tres, al menos cuatro, al menos cinco, al menos seis, al menos siete, al menos ocho, al menos nueve, o diez o más aminoácidos no naturales. Los aminoácidos no naturales pueden ser el mismo o diferentes, e.g., puede haber 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 o más sitios diferentes en la proteína que comprenden, 1, 2, 3, 4, 5, 6, 7, 8, 9, 19 o más aminoácidos no naturales diferentes. En ciertas modalidades, al menos uno, pero menos que todos, los aminoácidos particulares presentes en una versión de origen natural de la proteína, se sustituyen con un aminoácido no natural . Ejemplos de una proteína (o polipeptido de interés) incluyen, pero no se limitan a, e.g., citosina, un factor de crecimiento, un receptor del factor de crecimiento, un interferón, una interleucina, una molécula inflamatoria, un producto oncógeno, una hormona de péptido, una molécula de transducción de señal, un receptor de hormona esteroide, eritropoyetina (EPO) , insulina, hormona de crecimiento humana, una antitripsina Alpha-1, una angiostatina, un factor - - antihemolítico, un anticuerpo, una apolipoproteína, una apoproteína, un factor atrial natriurético, un polipéptido atrial natriurético, un péptido atrial, una quimiosina C-X-X, T39765, NAP-2, ENA-78, una Gro-a, una Gro-b, una Gro-c, una IP-10, una GCP-2, una NAP-4, una SDF-1, una PF4, una MIG, una calcitonina, un ligante c-kit, una citosina, una quimiosina CC, una proteína-1 quimioatrayente de monocito, una proteína-2 quimioatrayente de monocito, una proteína-3 quimioatrayente de monocito, una proteína-1 alfa inflamatoria de monocito, una proteina-1 beta inflamatoria de monocito, A TES, 1309, R83915, R91733, HCC1, T58847, D310S5, T64262, una CD40, un ligante de CD40, un ligante c-kit, un colágeno, un factor de estimulación de colonia (CSF) , un factor 5a de complemento, un inhibidor de complemento, un receptor 1 de complemento una citosina, DHFR, un péptido-78 epitelial de activación de neutrófilo, una Groa/MGSA, un GRO/3, un GRO7, un MIP-la, un ???-?d, un MCP-1, un factor de crecimiento epidérmico (EGF) , un péptido epitelial de activación de neutrófilo, una eritropoyetina (EPO) , una toxina exfoliante, un factor IX, un factor VII, un factor VIII, un factor X, un factor de crecimiento de fibroblasto (FGF) , un fibrinógeno, una fibronectina, un G-CSF, un GM-CSF, una glucocerebrosidasa, una gonadotropina, un factor de crecimiento, un receptor de factor de crecimiento, una proteína Hedgehog, una hemoglobina, un factor de crecimiento de hepatocito (HGF) , - - una hirudina, una albúmina de suero humana, una ICA -1, un receptor de ICAM-1, una LFA-1, un receptor de LFA-1, una insulina, un factor de crecimiento similar a insulina (IGF) , un IGF-1, un IGF-II, un interferón, una IFN-a, una IFN-3, una IFN-7, una interleucina, una IL-1, una IL-2, una IL-3, una IL-4, una IL-5, una IL-6, una IL-7 una IL-8, una IL-9, una IL-10, una IL-11, una IL-12, un factor de crecimiento de queratinocito ( GF) , una lactoferrina, un factor inhibidor de leucemia, una luciferasa, una neurturina, un factor inhibidor de neutrófilo (NIF) , una oncostatina M, una proteína osteogénica, un producto oncógeno, una hormona paratiroidea, un PD-EDSF, un PDGF, una hormona péptido, una hormona de crecimiento humana, una pleyotropina, una proteína A, una proteína G, exotoxinas pirogénicas A, B o C, una relaxina, una reni a, un SCF, un receptor I de complemento soluble, un I-CAM 1 soluble, receptores de interleucina solubles, un receptor TNF soluble, una somatomedina, una somatostatina, una somatotropina, una estreptocinasa, superantlgenos, enterotoxinas , una SEA, una SEB, una SEC1, una SEC2 , una SEC3 , una SED, una SEE, un receptor de hormona esteroide, una superóxido dismutasa (SOD) , una toxina de síndrome de choque tóxico, una timosina alfa 1, un activador de tejido plasminógeno, un factor de crecimiento tumoral (TGF) , un TGF- , un TGF-3, un factor de necrosis tumoral, un factor alfa de necrosis tumoral, un factor beta de necrosis tumoral, un - - receptor del f ctor de necrosis tumoral (TNFR) , una proteína VLA-4, una proteína VCAM-1, un factor de crecimiento endotelial vascular (VEGEF) , una urocinasa, una Mos, una Ras, una Raf, una Met; una p53, una Tat, una Fos, una Myc, una Jun, una Myb, una Reí, un receptor de estrógenos, un receptor de progesterona, un receptor de testosterona, un receptor de aldosterona, un receptor de LDL, un SCF/c- it, un CD40L/CD40, una VLA-4/VCAM-1, una ICAM-I/LFA-I , una ialaurin/CD44 , una corticosterona, una proteína presente en el Genebank u otras bases de datos disponibles, y lo similar, y/o una porción de las mismas. En una modalidad, el polipéptido de interés incluye una protexna moduladora de transcripción (e.g., una proteína activadora de transcripción (tal como GAL4) o una proteína represora de transcripción, etc.) o una porción de la misma. Las composiciones de proteína GAL4, o una porción de la misma, en células eucarióticas también son una característica de la invención. Típicamente, la proteína GAL4 o una porción de la misma comprende al menos un aminoácido no natural. Una célula eucariótica de la invención proporciona la capacidad para sintetizar proteínas que comprenden aminoácidos no naturales en grandes cantidades útiles. Por ejemplo, las proteínas que comprenden un aminoácido no natural pueden producirse en una concentración de e.g., al - - menos 10 /¿g/litro, al menos 50 /¿g/litro, al menos 75 /¿g/litro, al menos 100 /¿g/litro, al menos 200 µg/litro, al menos 250 /¿g/litro o al menos 500 g/litro o más de proteína en una extracto celular, un amortiguador, un excipiente farmacéuticamente aceptable, y/o lo similar. En ciertas modalidades, una composición de la invención incluye e.g., al menos 10 µg, . , al menos 50 /xg, al menos 75 µg, al menos 100 /¿g, al menos 200 Mg, al menos 250 /¿g o al menos 500 ¿¿g o más de proteína que comprende un aminoácido no natural . En ciertas modalidades, la proteína o polipéptido de interés (o una porción del mismo) se codifica por un ácido nucleico. Típicamente, el ácido nucleico comprende al menos un codón selector, al menos dos codones selectores, al menos tres codones selectores, al menos cuatro codones selectores, al menos cinco codones selectores, al menos seis codones selectores, al menos siete codones selectores, al menos ocho codones selectores, al menos nueve codones selectores, o incluso diez o más codones selectores. La invención proporciona también métodos para producir, en una célula eucariótíca, al menos una proteína que comprende al menos un aminoácido no natural (así como las proteínas producidas mediante tales métodos) . Los métodos incluyen, e.g., desarrollar en un medio apropiado, una célula eucariótica que comprende un ácido nucleico que comprende al menos un codón selector y codifica para la proteína. La - - célula eucariótica comprende también un ARNt ortogonal (O-ARNt) que funciona en la célula y reconoce el codón selector y una aminoacil-ARNt sintetasa ortogonal (O-RS) que pre erentemente aminoacila el O-ARNt con el aminoácido no natural, y el medio comprende un aminoácido no natural. En una modalidad, la O-RS aminoacila el O-ARNt con el aminoácido no natural, e.g., al menos 45%, al menos 50%, al menos 60%, al menos 75%, al menos 80%, al menos 90%, al menos 95% o incluso 99%, o más, tan eficientemente como la O-RS que tiene una secuencia de aminoácidos, e.g., como se describe en la SEQ ID NO: 86 o 45. En otra modalidad, el O-ARNt comprende, se procesa de o se codifica por la SEQ ID NO: 64 o 65, o una secuencia de polinucleótidos complementaria de las mismas. Aún en otra modalidad, la O-RS comprende una secuencia de aminoácidos como se describe en cualquiera de SEQ ID NO: 36-63 (e.g., 36-47, 48-63 o cualquier otro subconjunto de la 36-63) , y/o 86. En una modalidad, el método incluye además incorporar en la proteína un aminoácido no natural, en donde el aminoácido no natural comprende un primer grupo reactivo,-y poner en contacto la proteína con una molécula (e.g., un colorante, un polímero, e.g., un derivado de polietilen glicol, un foto reticulador, un compuesto citotóxico, una marca de afinidad, un derivado de biotina, una resina, una segunda proteína o polipéptido, un quelador metálico, un - - cofactor, un ácido graso, un carbohidrato, un polinucleótido (e.g., ADN, ARIST, etc.), que comprende un segundo grupo reactivo. El primer grupo reactivo reacciona con el segundo grupo reactivo para unir la molécula al aminoácido no natural por medio de una cicloadición [3+2] . En una modalidad, el primer grupo reactivo es un residuo alquinilo o azido, y el segundo grupo reactivo es un residuo azido o alquinilo. Por ejemplo, el primer grupo reactivo es el residuo alquinilo (e.g., en el aminoácido natural p-propargiloxifenilalanina) y el segundo grupo reactivo es el residuo azido. En otro ejemplo, el primer grupo reactivo es el residuo azido (e.g., en el aminoácido natural p-azido-L-fenilalanina) y el segundo grupo reactivo es el residuo alquinilo. En ciertas modalidades, la proteina codificada comprende una proteína terapéutica, una proteína diagnóstica, una enzima industrial, o una porción de las mismas. En una modalidad, la proteína que se produce mediante el método se modifica adicionalmente a través del aminoácido no natural . Por ejemplo, el aminoácido no natural se modifica mediante, e.g., una reacción nucleofílica-electrofílica, mediante una cicloadición [3+2], etc. En otra modalidad, la proteína producida mediante el método se modifica por al menos una modificación post-traducción (e.g., N- glicosilación, O-glicosilación, acetilación, acilación, modificación de lípidos, palmitoilación, adición de palmitato, fosforilación, - - modificación de enlace de glicolípidos, y lo similar) in vivo . También se proporcionan métodos para producir una proteina moduladora de transcripción de filtración o selección (así como las proteínas moduladoras de transcripción de filtración o selección producidas mediante tales métodos). Los métodos incluyen, e.g., seleccionar una primera secuencia de polinucleótidos, en donde la secuencia de polinucleótidos codifica para un dominio de enlace de ácido nucleico; y mutar la primera secuencia de polinucleótidos para incluir al menos un codón selector. Esto proporciona una secuencia de polinucleótidos de filtración o selección. Los métodos incluyen también, e.g., seleccionar una segunda secuencia de polinucleótidos, en donde la segunda secuencia de polinucleótidos codifica para un dominio de activación de transcripción; proporcionando una estructura que comprende la secuencia de polinucleótido de filtración o selección operablemente enlazada a la segunda secuencia de polinucleótidos; e introducir la estructura, un aminoácido no natural, una ARNt sintetasa ortogonal (O-RS) y un ARNt ortogonal (O-ARNt) , en una célula. Con estos componentes, la 0-RS preferentemente aminoacila el 0-ARNt con el aminoácido no natural y el O-ARNt reconoce el codón selector e incorpora el aminoácido no natural en el dominio de enlace de ácido nucleico, en respuesta al codón selector - - en la secuencia de polinucleótido de filtración o selección. Esto proporciona la proteína moduladora de transcripción de filtración o selección. En ciertas modalidades, las composiciones y los métodos de la invención incluyen células eucarióticas . Una célula eucariótica de la invención incluye cualquiera de e.g., una célula de mamífero, una célula de levadura, una célula de hongo, una célula vegetal, una célula de insecto, etc. los componentes de traducción de la invención pueden derivarse de una diversidad de organismos, e.g., organismos no eucarióticos, tales como organismos procarióticos (e.g., E. coli, Bacillus stearothermophilus, o lo similar), o una archaebacterium, o e.g., un organismo eucariótico. Un codón selector de la invención expande la estructura genética de codón de la maquinaria biosintética de la proteina eucariótica. Cualquiera de una diversidad de codones puede utilizarse en la invención, incluyendo codones de detención (e.g., un codón ámbar, un codón ocre, o un codón ópalo de detención) , codones sin sentido, codones raros, codones de cuatro (o más) bases, y/o lo similar. Ejemplos de aminoácidos no naturales que pueden utilizarse en las composiciones y métodos descritos en la presente incluyen, (pero no se limitan a) : un p-acetil-L-fenilalanina, un p-yodo-L-fenilalanina, un O-metil-L-tirosina, un p-propargiloxifenilalanina, un p-propargil- - - fenilala iña, un L-3- (2-naftil) alanina, un 3-metil-fenilalanina, un ?-4-alil-L-tirosina, un 4-propil-L-tirosina, un tri-O-acetil-GlcNAc/3-serina, un L-Dopa, un fenilalanina fluorinado, un isopropil-L-fenilalanina, un p-azido-L-fenilalanina, un p-acil-L-fenilalanina, un p-benzoil-L-fenilalanina, un fosfoserina, un fosfonoserina, un fosfonotirosina, un p-bromofenilalanina, un p-amino-L-fenilalanina, un isopropil-L-fenilalanina, un análogo no natural de un aminoácido tirosina; un análogo no natural de un aminoácido glutamina; un análogo no natural de un aminoácido fenilalanina; un análogo no natural de un aminoácido serina; un análogo no natural de un aminoácido treonina; un alquilo, arilo, acilo, azido, ciano, halo, hidrazina, hidrazida, hidroxilo, alquenilo, alquinilo, éter, tiol, sulfonilo, seleno, éster, tioácido, borato, boronato, fosfo, fosfono, fosfina, heterocíclico, enona, imina, aldehido, hidroxilamina, ceto, o aminoácido amino sustituido, o cualquier combinación de los mismos; un aminoácido con un reticulador fotoactivable; un aminoácido marcado por giro; un aminoácido fluorescente; un aminoácido de enlace metálico; un aminoácido que contiene metal; un aminoácido radiactivo; un aminoácido foto encasillado y/o fotoisomerizable; un aminoácido que contiene análogo de biotina; un aminoácido que contiene ceto; un aminoácido que comprende polietilen glicol o poliéter; un aminoácido sustituido con un átomo pesado; un - - aminoácido químicamente divisible o fotodivisible un aminoácido con una cadena lateral alargada; un aminoácido que contiene un grupo tóxico; un aminoácido sustituido con azúcar; un aminoácido que contiene azúcar enlazado a carbono; un aminoácido activo redox; un aminoácido que contiene a-hidroxi; un amino tio ácido; un aminoácido a, a disustituido; un aminoácido ß; un aminoácido cíclico diferente de prolina o histidina, un aminoácido aromático diferente de fenilalanina, tirosina o triptofan, y/o lo similar. La invención proporciona también polipéptidos (O- RS) y polinucleótidos, e.g., O-ARNTs , polinucleó idos que codifican O-RSs o porciones de las mismas (e.g., el sitio activo de la sintetasa) , oligonucleótidos utilizados para construir mutantes de aminoacil-ARNt sintetasa, polinucleótidos que codifican una proteína o un polipéptido 'de interés que comprende uno o más codones selectores, etc. Por ejemplo, un polipéptido de la invención incluye un polipéptido que comprende una secuencia de aminoácidos como se describe en cualquiera de las SEQ ID NO: 36-63 (e.g., 36-47, 48-63 o cualquier otro subconjunto de 36-63), y/o 86, un polipéptido que comprende una secuencia de aminoácidos codificado por una secuencia de polinucleótidos como se describe en cualquiera de las SEQ ID NO: 3-35 (e.g., 3-19, 20-35, o cualquier otro subconjunto de las secuencias 3-35), y un polipéptido que es específicamente inmunorreactivo con - - un anticuerpo especifico para un polipeptido que comprende una secuencia de aminoácidos como se describe en cualquiera de SEQ ID NO: 36-63 (e.g., 36-47, 48-63, o cualquier otro subconjunto de 36-63), y/o 86 o un polipeptido que comprende una secuencia de aminoácidos codificada por una secuencia de polinucleótidos como se describe en cualquiera de las SEQ ID NO: 3-35 (e.g., 3-19, 20-35 o cualquier otro subconjunto de las secuencias 3-35) . También se encuentra incluido entre los polipéptidos de la invención un polipéptido que comprende una secuencia de aminoácidos que es al menos 90% idéntica a la de una tirosil aminoacil-ARNt sintetasa (TyrRS) de origen natural (e.g., SEQ ID NO: 2), y comprende dos o más grupos A-E (abajo anotados) de aminoácidos. De manera similar, los polipéptidos de la invención también incluyen opcionalmente un polipéptido que comprende al menos 20 aminoácidos contiguos de cualquiera de las SEQ ID NO: 36-63 (e.g., 36-47, 48-63, o cualquier otro subconjunto de 36-63), y/o 86, y dos o más sustituciones de aminoácido como se indicó anteriormente en los grupos A-E. Una secuencia de aminoácidos que comprende una variación conservadora de cualquiera de los polipéptidos anteriores también se encuentra incluida como un polipéptido de la invención. En una modalidad, una composición incluye un polipéptido de la invención y un excipiente (e.g., - - amortiguador, agua, excipiente farmacéuticamente aceptable, etc.). La invención proporciona también un anticuerpo o antisuero específicamente inmunorreactivo con un polipéptido de la invención. También se proporcionan polinucleotidos en la invención. Los polinucleotidos de la invención incluyen aquellos que codifican para las proteínas o polipéptidos de interés de la invención con uno o más codones selectores. Adicionalmente, los polinucleotidos de la invención incluyen, e.g., un polinucleotido que comprende una secuencia de nucleótidos como se describe en cualquiera de las SEQ ID NO: 3-35 (e.g., 3-19, 20-35 o cualquier otro subconjunto de las secuencias 3-35) , 64-85; un polinucleotido complementario a o que codifica para una secuencia de polinucleotidos del mismo; y/o un polinucleotido que codifica un polipéptido que comprende una secuencia de aminoácidos como se describe en cualquiera de las SEQ ID NO: 36-63 (e.g., 36-47, 48-63 o cualquier otro subconjunto de 36-63) , y/o 86, o una variación conservadora de las mismas . Un polinucleotido de la invención incluye también un polinucleotido que codifica para un polipéptido de la invención. De manera similar, es un polinucleotido de la invención un ácido nucleico que híbrida a un polinucleotido anteriormente indicado bajo condiciones altamente rigurosas sustancialmente sobre la longitud total del ácido nucleico.
- - Un polinucleótido de la invención incluye también un polinucleótido que codifica para un polipéptido que comprende una secuencia de aminoácidos que es al menos 90% idéntica a la de una tirosil aminoacil-ARNt sintetasa (TyrRS) de origen natural (e.g., SEQ ID NO: 2) y comprende dos o más mutaciones como se indicó anteriormente en los grupos A-E (anotados anteriormente) . Un polinucleótido que es al menos 70% (o al menos 75%, al menos 80%, al menos 85%, al menos 90%, al menos 95%, al menos 98% o al menos 99% o más) idéntico a un polinucleótido indicado anteriormente y/o a un polinucleótido que comprende una variación conservadora de cualquiera de los polinucleótidos anteriormente indicados, también se incluyen entre los polinucleótidos de la invención. En ciertas modalidades, un vector (e.g., un plásmido, un cósmido, un fago, un virus, etc.) comprende un polinucleótido de la invención. En una modalidad, el vector es un vector de expresión. En otra modalidad, el vector de expresión incluye un promotor operablemente enlazado a uno o más de los polinucleótidos de la invención. En otra modalidad, una célula comprende un vector que incluye un polinucleótido de la invención. En otro aspecto, la invención proporciona composiciones de compuestos y métodos para producir tales compuestos. Por ejemplo, los compuestos incluyen, e.g., un - - aminoácido no natural (tal como p- (propargiloxi) -fenilalanina (e.g., 1 en la Figura 11), colorantes azido (tales como los mostrados en la estructura química 4 y en la estructura química 6), un alquinil polietilen glicol (e.g., como se muestra en la estructura química 7) , en donde n es un entero entre, e.g., 50 y 10,000, 75 y 5,000, 100 y 2,000, 100 y 1000, etc., y lo similar. En la modalidad de la invención, el alquinil polietilen glicol tiene un peso molecular de, e.g., aproximadamente 5,000 a aproximadamente 100,000 Da, aproximadamente 20,000 a aproximadamente 50,000 Da, aproximadamente 20,000 a aproximadamente 10,000 Da (e.g., 20,000 Da) .
- - También se proporcionan diversas composiciones que comprenden estos compuestos, e.g., con proteínas y células.
En un aspecto, la composición que incluye el aminoácido no natural p- (propargiloxi) -fenilalanina, incluye además un ARNt ortogonal. El aminoácido no natural puede enlazarse (e.g., de manera covalente) al ARNt ortogonal, e.g., enlazado de manera covalente al ARNt ortogonal a través de un enlace amino-acilo, enlazado de manera covalente a un 3' OH o un 2?? de un azúcar de terminación ribosa del ARNt ortogonal, etc. En un aspecto de la invención, una proteina que comprende un colorante azido (e.g., de la estructura química 4 o la estructura química 6) incluye además al menos un aminoácido no natural (e.g., un aminoácido alquinilo) , en donde el colorante azido se encuentra unido al aminoácido no natural mediante una cicloadición [3+2] . En una modalidad, una proteína comprende el alquinil polietilen glicol de la estructura química 7. En otra modalidad, - la composición incluye además al menos un aminoácido no natural (e.g., un aminoácido azido), en donde el alquinil polietilen glicol se encuentra unido al aminoácido no natural mediante una cicloadición [3+2] . Se incluyen en la invención métodos para sintetizar diversos compuestos. Por ejemplo, se proporciona un método para sintetizar un compuesto p- (propargiloxi) -fenilalanina. Por ejemplo, el método comprende (a) suspender una N-ter- - - butoxicarboriil-tirosiría y K2C03 en DMF anhidro; (b) agregar bromuro de propargilo a la mezcla de reacción de (a) y alquilatar el grupo hidroxilo y carboxilo, dando como resultado un compuesto intermediario protegido que tiene la estructura: y (c) mezclar el compuesto intermediario protegido con HC1 anhidro en MeOH y desproteger el residuo amina, con lo cual se sintetiza el compuesto p- (propargiloxi) -fenilalanina . En una modalidad, el método comprende además (d) disolver el HC1 p- (propargiloxi) -fenilalanina en MaOH acuoso y MeOH y agitar a temperatura ambiente; (e) ajustar el pH a un pH 7; y (f) precipitar el compuesto p- (propargiloxi) fenilalanina . También se proporcionan métodos para sintetizar colorantes azido. Por ejemplo, un método comprende: (a) proporcionar un compuesto colorante que comprende un residuo sulfonil haluro; (b) calentar el compuesto colorante a temperatura ambiente en presencia de 3-azidopropilamina y trietilamina y acoplar un residuo amina de la 3-azidopropilamina en la posición haluro del compuesto colorante, con lo cual se sintetiza el colorante azido. En una modalidad, el compuesto colorante comprende dansil - - cloruro, y el colorante azido comprende la composición de la estructura química 4. En un aspecto, el método comprende además purificar el colorante azido de la mezcla de reacción. En otro ejemplo, el método para sintetizar un colorante azido comprende (a) proporcionar un compuesto colorante que contiene amina; (b) combinar el compuesto colorante que contiene amina con una carbodiimida y ácido 4-(3-azidopropilcarbamoil) -butírico en un solvente adecuado, y acoplar un grupo carbonilo del ácido al residuo amina del compuesto colorante, con lo cual se sintetiza el colorante azido. En una modalidad, la carbodiimina comprende idrocloruro de l-etil-3 - (3-dimetilaminopropil) carbodiimida (EDCI) . En un aspecto, el colorante que contiene amina comprende fluoresceinamina, y el solvente adecuado comprende piridina. Por ejemplo, el colorante que contiene amina comprende fluoresceinamina y el colorante azido comprende la composición de la estructura química 6. En una modalidad, el método comprende (c) precipitar el colorante azido; (d) lavar el precipitado con HC1; (e) disolver el precipitado lavado en EtOAc; y (f) precipitar el colorante azido en hexanos. También se proporcionan métodos para sintetizar un propargil amida polietilen glicol . Por ejemplo, el método comprende hacer reaccionar propargilamina con polietilen glicol (PEG) -éster de hidroxisuccinimida en un solvente orgánico (e.g., CH2C12) a temperatura ambiente, dando como - - resultado el propargil amida polietilen glicol de la estructura química 7. En una modalidad, el método comprende además precipitar el propargilamida polietilen glicol utilizando etil acetato. En un aspecto, el método incluye además recristalizar el propargilamida polietilen glicol en metanol; y secar el producto bajo un vacío. Los equipos también son una característica de la invención. Por ejemplo, se proporciona un equipo que produce una proteína que comprende al menos un aminoácido no natural en una célula, en donde el equipo incluye un contenedor que contiene una secuencia de polinucleotido que codifica para un 0-ARNt o un 0-ARNt, y una secuencia de polinucleotido que codifica para una 0-RS o una 0-RS. En una modalidad, el equipo comprende además al menos un aminoácido no natural . En otra modalidad, el equipo comprende además materiales instructivos para producir la proteína. DEFINICIONES Antes de describir la presente invención en detalle, debe entenderse que esta invención no se limita a los aparatos o sistemas biológicos particulares, que, por supuesto, pueden variar. También se entiende que la terminología utilizada en la presente es para el solo propósito de describir las modalidades particulares, y no pretende ser limitante. Como se utilizan en esta especificación y en las reivindicaciones anexas, las formas - 4 - singulares "un" , "una" , y "el "la" incluyen referentes plurales a menos que el contenido lo indique claramente de otra manera. De este modo, por ejemplo, la referencia a "una célula" incluye una combinación de dos o más células; la referencia a "bacteria" incluye mezclas de bacterias, y lo similar. A menos que se defina de otra manera en la presente, o más adelante en el resto de la especificación, todos los términos técnicos y científicos utilizados en la presente tienen el mismo significado comúnmente comprendido por los de experiencia ordinaria en la técnica a la cual pertenece la invención. Homologas : Las proteínas y/o secuencias de proteínas son "homologas" cuando se derivan, natural o artificialmente, de una proteína o secuencia de proteínas común ancestral. De manera similar, los ácidos nucleicos y/o las secuencias de ácidos nucleicos son homólogos cuando se derivan natural o artificialmente, de un ácido nucleico o secuencia de ácido nucleico común ancestral. Por ejemplo, cualquier ácido nucleico de origen natural puede modificarse mediante cualquier método de mutagénesis disponible para incluir uno o más codones selectores. Al expresarse, este ácido nucleico mutagenizado codifica para un polipéptido que comprende uno o más aminoácidos no naturales . El proceso de mutación, por supuesto, puede alterar adicionalmente uno o - - más codones estándar, con lo cual cambia también uno o más aminoácidos estándar en la proteína mutante resultante. La homología generalmente se infiere a partir de la similitud de secuencia entre dos o más ácidos nucleicos o proteínas (o sus secuencias) . El porcentaje preciso de similitud entre las secuencias útil para establecer la homología varía con el ácido nucleico y proteína en cuestión, pero se utiliza rutinariamente una similitud de secuencia tan pequeña , como 25% para establecer la homología. También pueden utilizarse niveles más altos de similitud de secuencia, e.g., 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, o 99% o más, para establecer la homología. Se describen en la presente y se encuentran disponibles generalmente métodos para determinar los porcentajes de similitud de secuencia (e.g., BLASTP y BLASTN utilizando parámetros de falla) . Ortogonal : Como se utiliza en la presente, el término "ortogonal" se refiere a una molécula (e.g., un AR t ortogonal (O-ARNt) y/o aminoacil-ARNt sintetasa ortogonal (O-RS) ) que funcionas con componentes endógenos de una célula con eficiencia reducida en comparación con una molécula correspondiente endógena a la célula o al sistema de traducción, o que no funciona con componentes endógenos de la célula. En el contexto de los ARNts y aminoacil-ARNt sintetasas, ortogonal se refiere a una incapacidad o eficiencia reducida, e.g., menor que 20% eficiente, menor que - - 10% eficiente, menor que 5% eficiente o menor que 1% eficiente, de un ARNt ortogonal para funcionar con una ARNt sintetasa endógena en comparación con un ARNt endógeno para funcionar con la ARNt sintetasa endógena, o de una aminoacil-ARNt sintetasa ortogonal para funcionar con un ARNt endógeno en comparación con una ARNt sintetasa endógena para funcionar con el ARNt endógeno. La molécula ortogonal carece de una molécula complementaria endógena funcional en la célula. Por ejemplo, un ARNt ortogonal en una célula se aminoacila mediante cualquier RS endógena de la célula con eficiencia reducida o incluso de cero, al compararse con la aminoacilacíón de un ARNt endógeno mediante la RS endógena. En otro ejemplo, una RS aminoacila cualquier ARNt endógeno en una célula de interés con eficiencia reducida o incluso de cero, en comparación con la aminoacilacion del ARNt endógeno mediante una RS endógena. Puede introducirse una segunda molécula ortogonal en la célula que funciona con la primera molécula ortogonal. Por ejemplo, un par ARNt/RS ortogonal incluye componentes complementarios introducidos que funcionan conjuntamente en la célula con una eficiencia (e.g., 50% de eficiencia, 60% de eficiencia, 70% de eficiencia, 75% de eficiencia, 80% de eficiencia, 90% de eficiencia, 95% de eficiencia, o 88% o más de eficiencia) a la correspondiente al par ARNt/RS endógeno. Complementariedad: El término "complementariedad" - - se refiere a componentes de un par ortogonal, O-AR t y O-RS que pueden funcionar conjuntamente, e.g., cuando la O-RS aminoacila el O-ARMt . Preferentemente aminoacila: El término "preferentemente aminoacila" se refiere a una eficiencia, e.g., 70% eficiente, 75% eficiente, 85% eficiente, 90% eficiente, 95% eficiente, o 99% eficiente o más, a la cual una O-RS aminoacila un 0-ARNt con un aminoácido no natural en comparación con la O-RS que aminoacila un ARNt de origen natural o un material de inicio utilizado para generar el 0-ARNt . El aminoácido no natural se incorpora en una cadena de polipeptido creciente con alta fidelidad, e.g., a más de 75% de eficiencia para un codón selector dado, a más de aproximadamente 80% de eficiencia para un codón selector dado, a más de aproximadamente 90% de eficiencia para un codón selector dado, a más de aproximadamente 95% de eficiencia para un codón selector dado, o a más de aproximadamente 99% o más de eficiencia para un codón selector dado . Codón selector: El término "codón selector" se refiere a codones reconocidos por el O-AR t en el proceso de traducción y no reconocidos por un ARNt endógeno. La curva anticodón de O-ARKTt reconoce el codón selector en el ARNm e incorpora su aminoácido, e.g., un aminoácido no natural, en este sitio en el polipéptido. Los codones selectores pueden - - incluir e.g., codones sin sentido, tales como, codones de detención, e.g., codones ámbar, ocre y ópalo; codones de cuatro o más bases; codones raros; codones derivados de pares de base naturales o no naturales y/o lo similar. ARNt de supresión: Un ARNt de supresión es un ARNt que altera la lectura de un ARN mensajero (AR m) en un sistema de traducción dado, e.g., proporcionando un mecanismo para incorporar un aminoácido en una cadena de polipéptido en respuesta a un codón selector. Por ejemplo, un ARNt de supresión puede leer a través de e.g., un codón de detención, un codón de cuatro bases, un codón raro y/o lo similar. ARNt reciclable: El término "ARNt reciclable" se refiere a un ARNt que se aminoacila y puede re-aminoacilarse repetidamente con un aminoácido (e.g., un aminoácido no natural) para la incorporación del aminoácido (e.g., el aminoácido no natural) en una o más cadenas de polipéptido durante la traducción. Sistema de traducción: El término "sistema de traducción" se refiere al conjunto colectivo de componentes que incorporan un aminoácido de origen natural en una cadena de polipéptido creciente (proteína) . Los componentes de un sistema de traducción pueden incluir, e.g., ribosomas, ARNts, sintetasas, ARNm, aminoácidos y lo similar. Los componentes de la invención (e.g., ORS, OARNts, aminoácidos no naturales, etc.) pueden agregarse a un sistema de traducción in vitro o - - in vivo, e.g., una célula eucariótica, e.g., una célula de levadura, una célula de mamífero, una célula vegetal, una célula de alga, una célula de hongo, una célula de insecto y/o lo similar. Aminoácido no natural : Como se utiliza en la presente, el término "aminoácido no natural" se refiere a cualquier aminoácido, aminoácido modificado, y/o análogo de aminoácido que no es de los 20 aminoácidos comunes de origen natural, seleno cisteína o pirrolisina. Derivado de : Como se utiliza en la presente, el término "derivado de" se refiere a un componente que se aisla de o se prepara utilizando información de una molécula u organismo especifico. RS inactiva: Como se utiliza en la presente, el término "RS inactiva" se refiere a una sintetasa que se ha mutado de modo que ya no puede aminoacilar su AR t cognado natural con un aminoácido. Marcador de selección o filtración positiva: Como se utiliza en la presente, el término "marcador de selección o filtración positiva" se refiere a un marcador que cuando se encuentra presente, e.g., expresado, activado o lo similar, da como resultado la identificación de una célula con el marcador de selección positiva de aquellas sin el marcador de selección positiva. Marcador de selección o filtración negativa : Como - - se utiliza en la presente, el término "marcador de selección o filtración negativa" se refiere a un marcador que cuando se encuentra presente, e.g., expresado, activado o lo similar, permite la identificación de una célula que no posee la propiedad deseada (e.g., en comparación con una célula que posee la propiedad deseada) . Informante : Como se utiliza en la presente, el término "informante" se refiere a un componente que puede utilizarse para seleccionar componentes objetivo de un sistema de interés. Por ejemplo, un informante puede incluir un marcador de selección fluorescente (e.g., proteína verde fluorescente), un marcador luminiscente (e.g., una proteína luciérnaga luciferasa) , un marcador de selección basado en afinidad, o genes marcadores elegibles tales como his3, ura4, leu2, lys2, lacZ, /3-gal/lacZ (3-galactosidasa) , Adh (alcohol dehidrogenasa) o lo similar. Eucarioto : Como se utiliza en la presente, el término "eucarioto" se refiere a organismos que pertenecen al dominio filogenético Eucarya tal como los animales (e.g., mamíferos, insectos, reptiles, aves, etc.) ciliatos, plantas, (e.g., monocotiledóneas, dicotiledóneas, algas, etc.), hongos, levaduras, flagelados, microsporidia, protists, etc. No eucarioto : Como se utiliza en la presente, el término "no eucarioto" se refiere a organismos no eucarióticos . Por ejemplo, un organismo no eucariótico puede - - pertenecer al dominio filogenético Eubacteria (e.g., Escherichia coli, Thermus Thermophilus, Bacillus stearothermophilus, etc.)/ o al dominio filogenético Archaea (e.g., Methanococcus jannaschii, Methanobacterium thermoautotropiiicum, Halobacteri m tal como Haloferax volcanii y especies Halobacterium NRC-1, Archaeglobus fulgldus, Pyrococcua furiosus, Pyrococcus horikoshii, Aeuropyrum pernix, etc.) . Anticuerpo : El término "anticuerpo", como se utiliza en la presente, incluye, pero no se limita a, un polipéptido sustancialmente codificado por un gen de inmunoglobulina o genes de inmunoglobulina, o sus fragmentos, que se enlaza específicamente y reconoce un analito (antígeno) . Ejemplos incluyen anticuerpos monoclonales, quiméricos y monocatenarios , y lo similar. También se encuentran incluidos en el término "anticuerpo" como se utiliza en la presente, fragmentos de inmunoglobulinas, incluyendo fragmentos Fab y fragmentos producidos por una biblioteca de expresión, incluyendo despliegue fago. Ver, e.g., Paul, Fundamental Immunology, 4a Ed. , 1999, -Raven Press, New. York, para estructura y terminología de anticuerpos . Variante conservadora : El término "variante conservadora" se refiere a un componente de traducción, e.g., un O-ARNt de variante conservadora, o una O-RS de variante - - conservadora, que funcionalmente se desempeña como el componente a partir del cual se basa la variante conservadora, e.g., un O-ARNt o una O-RS, pero tiene variaciones en la secuencia. Por ejemplo, una O-RS aminoacilará un O-ARNt complementario o un O-ARNt de variante conservadora con un aminoácido no natural, aunque el O-ARNt y el O-ARNt de variante conservadora no tienen la misma secuencia. La variante conservadora tiene, e.g., una variación, dos variaciones, tres variaciones, cuatro variaciones, o cinco o más variaciones en secuencia, mientras que la variante conservadora sea complementaria al O-ARNt o a la O-RS correspondiente. Agente de selección o filtración: Como se utiliza en la presente "agente de selección o filtración" se refiere a un agente que, cuando se encuentra presente, permite la selección/filtracion de ciertos componentes de una población.
Por ejemplo, un agente de selección o filtración incluye, pero no se limita a, e.g., un nutriente, un antibiótico, una longitud de onda luminosa, un anticuerpo, un polinucleótido expresado (e.g., una proteína moduladora de transcripción), o lo similar. El agente de selección puede variar, e.g., por concentración, intensidad, etc. Sustancia detectable: El término "sustancia detectable" , como se utiliza en la presente, se refiere a un agente que, al activarse, alterarse, expresarse o lo similar, - - permite la selección/filtración de ciertos componentes provenientes de una población. Por ejemplo, la sustancia detectable puede ser un agente químico, e.g., ácido 5-fluroorótico (5-FOA) , que bajo ciertas condiciones, e.g., expresión de un informante URA3, se vuelve detectable, e.g., un producto tóxico que destruye células que expresan el informante URA3. BREVE DESCRIPCIÓN DE LOS DIBUJOS La Figura 1, Paneles A, B y C, ilustra esquemáticamente un esquema general de selección positiva y negativa para expandir el código genético de una célula eucariótica, e.g., S. Cerevisiae. El Panel A ilustra esquemáticamente la transcripción activada de genes informantes, que se conducen mediante supresión ámbar de los codones TAG en GAL4. El dominio de enlace de ADN se indica por la casilla listada y los dominios de activación principal y críptico se indican en la casilla sombreada. El Panel B ilustra ejemplos de genes informantes, e.g., HIS3, LacZ, URA3 en MaV203. El Panel C ilustra esquemáticamente los plásmidos que pueden utilizarse en el esquema de selección, e.g., pEcTyRS/ARNtCUA Y pGADGAL4xxTAG . La Figura 2 ilustra los fenotipos dependientes de EcTyrRS y ARNtCuA de la Ia generación de informantes GAL4 en el medio selectivo. DB-AD es una fusión entre el dominio de enlace GAL4 ADN y el dominio de activación. DB-TAG tiene un - - codón TAG que reemplaza un codón tirosina en el enlazador sintético entre DB y AD. A5 es una versión inactiva de EcTyrRS en la cual 5 residuos en el sitio activo han sido imitados a alanina. La Figura 3 , Panel A y B ilustra los fenotipos dependientes de EcTyrRS y ARNtcuA de la 2 a generación de informantes GAL4 en medio selectivo . El dominio de enlace de ADN se indica por la casilla listada y los dominios de activación principal y críptico se indican en la casilla sombreada. El Panel A ilustra estructuras cada una con una sola mutación de aminoácido en GAL4. El Panel B ilustra estructuras cada una con dos mutaciones de aminoácido en GAL . La Figura 4, Paneles A, B y C ilustra pGADGAL4 (T44TAG, R110TAG) con y sin EcTyrRS y varios informantes en MaV203. El Panel A muestra los resultados en presencia de X-gal, -Ura o -Leu, -Trp. El Panel B muestra los resultados en presencia de concentraciones variables de 3-AT. El Panel C muestra los resultados en la presente de porcentajes variables de 5-FOA. La Figura 5, Paneles A y B ilustra la hidrólisis de ONPG con varios mutantes GAL4, e.g., en donde los residuos T44 (A) y RUO (B) son sitios permisivos. El Panel A ilustra la medición de la hidrólisis de ONPG con varios tipos de mutaciones en el sitio T4 . El Panel B ilustra la medición - - de la hidrólisis de ONPG con varios tipos de mutaciones en el sitio RUO. x GAL4 ' se encuentra MaV203 transformado con pCLl y se graduó a -600 ONPG unidades de hidrólisis. NNone' se encuentra MaV203 transformado con plásmidos que codifican para el GAL4 DB y GAL4 AD por separado. La Figura 6 muestra la selección de clones activos EcTyrRS. MaV203 conteniendo una mezcla de 1:10 de pEcTyrRS-A NtCüA:p 5-A NtCuA se emplacaron a una dilución de 103 en placas (-Leu, -Trp) (izquierda) o placas (-Leu, -Trp, -His + 50 mM 3-AT) (derecha) y se procesó utilizando un recubrimiento de XGAL . Figura 7, Paneles A y B. El Panel A ilustra una vista estéreo del sitio activo de tirosil-ARNt sintetasa de B. Stearothermophilus con tirosina enlazada. Se muestran los residuos mutados y corresponden a los residuos de tirosil-ARNt sintetasa de E. coli Tyr37 (TyrRS de B. Stearothermophilus residuo Tyr34) , Asn126, (Asn123) , Asp 182 (Asp176) , Phe183 (Phe177) y Leu186 (Leu180) . El Panel B ilustra las fórmulas estructurales de los ejemplos de aminoácidos no naturales (de izquierda a derecha) p-acetil-L-fenilalanina (1) , p-benzoil-L-fenilalanina (2) , p-azido-L-fenilalanina (3) , O-metil-L-tirosina (4) , y p-yodo-L-tirosina (5) . Figura 8, Paneles A, B, C y D. El Panel A ilustra vectores y estructuras de informante que pueden utilizarse en la selección/filtración de ARNts ortogonales, aminoacil - - sintetasas ortogonales o pares de ARNt ortogonal/RS en células eucarióticas . El Panel B ilustra fenotipos de levadura que albergan los informantes de respuesta HIS3, URA3 y lacZ que responden a GAL4 en respuesta a aminoacil-ARNt sintetasas activas (TyrRS) o inactivas (A5RS) en el medio selectivo. El Panel C ilustra un ejemplo de un esquema de selección utilizado para seleccionar sintetasas imitantes que codifican aminoácidos adicionales en una célula eucariótica, e.g., S. cerevisiae, en donde UAA es un aminoácido no natural. El Panel D ilustra fenotipos de levadura aislados a partir de una selección con p-acetil-L-fenilalanina. La Figura 9 ilustra la expresión de proteínas de superóxido dismutasa humana (hSOD) (33/AG)HIS en S. cerevisiae que codifica genéticamente para aminoácidos no naturales como se indicó en la Figura 7, Panel B. La Figura 10, Paneles A-H ilustra el espectro de masa en serie del péptido tríptico VY*GSIK (SEQ ID NO: 87) conteniendo aminoácidos no naturales (denotados Y*) como se indicó en la Figura 7, Panel B. El Panel A ilustra el espectro de masa en serie del péptido tríptico con el aminoácido no natural p-acetil-L-fenilalanina (1) . El Panel B ilustra el espectro de masa en serie del péptido tríptico con el aminoácido no natural p-benzoil-L-fenilalanina (2) . El Panel C ilustra el espectro de masa en serie del péptido tríptico con el aminoácido no natural p-azido-L-fenilalanina - - (3) . El Panel D ilustra el espectro de masa en serie del péptido tríptico con el aminoácido no natural O-metil-L-tirosina (4) . El Panel E ilustra el espectro de masa en serie del péptido tríptico con el aminoácido no natural p-yodo-L-tirosina (5) . El Panel F ilustra el espectro de masa en serie del péptido tríptico con el aminoácido triptofan (W) en la posición Y* . El Panel G ilustra el espectro de masa en serie del péptido tríptico con el aminoácido tirosina (Y) en la posición Y* . El Panel H ilustra el espectro de masa en serie del péptido tríptico con el aminoácido leucina (L) en la posición Y* . La Figura 11 ilustra ejemplos de dos aminoácidos no naturales (1) para-propargiloxifenilalanina y (2) para-azidofenilalani a . La Figura 12 , Paneles A, B y C ilustra la expresión de SOD en presencia o ausencia de los aminoácidos no naturales 1 y 2 indicados en la Figura 11. El Panel A ilustra el experimento de coloración de Gelcode Blue. El Panel B ilustra un inmunoanálísis western con un anticuerpo anti-SOD. El Panel C ilustra un inmunoanálísis western con anticuerpo anti-6xHis . La Figura 13, Paneles A, B y C ilustra el marcado de proteínas mediante cicloadición [3+2] . El Panel A ilustra las marcas de colorante sintetizado 3-6. El Panel B ilustra la reacción entre el SOD y el colorante. El Panel C ilustra - - la exploración de fluorescencia en gel y la coloración Gelcode Blue . La Figura 14 ilustra el crecimiento de células eucarióticas, e.g., células de S. cerevisiae, transformadas con mutantes de sintetasa en ausencia o en presencia de 1 o 2 como se indicó en la Figura 11 en un medio SD carente de uracilo . La Figura 15, Paneles A y B, ilustra el espectro de masa en serie del péptido tríptico VY*GSKI (SEQ ID NO: 87) conteniendo los aminoácidos no naturales azido (Az) (Panel A) o alquino (Al) (Panel B) en la posición Y* mostrados con sus masas de fragmento de ion esperadas . La flecha indica las series de ion b (azul) y, y (rojo) observadas para cada péptido . La Figura 16 ilustra esquemáticamente la incorporación in vivo de un aminoácido no natural , e.g., par-a-propargiloxifenilalanina, en una cadena creciente de polipéptido y la bioconjugación con moléculas orgánicas pequeñas mediante una reacción de cicloadición [3+2] a través de este aminoácido no natural. La Figura 17, Paneles A, B y C ilustra la PEGilación de una proteína que comprende un aminoácido no natural utilizando una cicloadición [3+2] . El Panel A ilustra la reacción de un propargil amida PEG con una proteína que comprende un aminoácido azido (e.g., N3-S0D) en - 5 - presencia de Cu(l) y amortiguador de fosfato (PB) . El Panel B ilustra la PEGilacion de la proteína mediante análisis de gel . El Panel C ilustra la síntesis del propargil amida PEG. DESCRIPCIÓN DETALLADA La capacidad para modificar genéticamente las estructuras de proteínas directamente en células eucarióticas , más allá de las restricciones químicas impuestas por el código genético, proporciona una poderosa herramienta molecular tanto para sondear como para manipular los procesos celulares . La invención proporciona componentes de traducción que expanden el número de aminoácidos codificados genéticamente en células eucarióticas . Estas incluyen ARNts (e.g., AR ts ortogonales (O-ARNts)), aminoacil-ARNt sintetasas (e.g., sintetasa ortogonal (0-RS) ) , pares de O-ARNt/O-RSs , y aminoácidos no naturales. Típicamente, los O-ARNts de la invención se expresan y procesan eficientemente, y funcionan en la traducción en una célula eucariótica, pero no se aminoacilan significativamente por las aminoacil-ARNt sintetasas del huésped. En respuesta a un codón selector, un O-ARNt de la invención suministra un aminoácido no natural, que no codifica ninguno de los veinte aminoácidos comunes, a una cadena creciente de polipéptido durante la traducción de ARNm. Una 0-RS de la invención preferentemente aminoacila un O-ARNt de la invención con un aminoácido no natural en una célula eucariotica, pero no aminoacila ninguno de los ARNts del huésped citoplásmico. Además, la especificidad de una aminoacil-ARNt sintetasa de la invención proporciona la aceptación de un aminoácido no natural mientras que excluye cualquier aminoácido endógeno. Los polipéptidos que incluyen secuencias de aminoácidos de las 0-RSs ejemplares o sus porciones, también son una característica de la invención. Adicionalmente, son características de la invención los polinucleótidos que codifican para componentes de traducción, O-AR ts, O-RSs y sus porciones. La invención también proporciona métodos para producir los componentes de traducción deseados, e.g., 0-RS y o un par ortogonal (AR t ortogonal y aminoacil-ARNt sintetasa ortogonal) que utilizan un aminoácido no natural para su uso en una célula eucariotica (y los componentes producidos por tales métodos) . Por ejemplo, un par tirosil-ARNt sintetasa/ARNtcuA de E. coli es un par O-ARNt/O-RS de la invención. Adicionalmente, la invención también caracteriza métodos para seleccionar/filtrar componentes de traducción en una célula eucariotica, y una vez seleccionados/filtrados, utilizar esos componentes en una célula eucariotica diferente (una célula eucariotica que no se utilizó para la selección/filtración) . Por ejemplo, los métodos de selección/filtración para producir los componentes de - - traducción para células eucarioticas que pueden prepararse en levadura, e.g., Saccharomyces cerevisiae, y después aquellos componentes seleccionados pueden utilizarse en otra célula eucariótica, e.g., otra célula de levadura, una célula de mamífero, una célula de insecto, una célula vegetal, una célula de hongo, etc. La invención proporciona además métodos para producir una proteína en una célula eucariótica, en donde la proteína comprende un aminoácido no natural . La proteína se produce utilizando los componentes de traducción de la invención. La invención proporciona también proteínas (y proteínas producidas mediante los métodos de la invención) que incluyen aminoácidos no naturales . La proteína o polipéptido de interés también puede incluir una modificación de post-traducción, e.g., que se agrega mediante una cicloadición [3+2] , o una reacción nucleofílica-electrofílica que no se produce por una célula eucariótica, etc. En ciertas modalidades, también se incluyen en la invención métodos para producir una proteína oduladora de transcripción con un aminoácido no natural (y proteínas producidas mediante tales métodos) . Son también una característica de la invención composiciones que incluyen proteínas que incluyen un aminoácido natural. También son una característica de la invención los equipos para producir una proteína o polipéptido con un - - aminoácido no natural . AMINOACIL-ARNt SINTETASAS ORTOGONALES (O-RS) A fin de incorporar específicamente un aminoácido no natural en una proteína o polipéptido de interés en una célula eucariótica, se altera la especificidad de substrato de la sintetasa de modo que solo se carga en el ARNt el aminoácido no natural deseado, pero ninguno de los veinte aminoácidos comunes. Si la sintetasa ortogonal es promiscua, dará como resultado proteínas mutantes con una mezcla de aminoácidos naturales y no naturales en la posición objetivo. La invención proporciona composiciones y métodos para producir aminoacil-ARNt sintetasas ortogonales que tienen especificidad de substrato modificada para un aminoácido no natural específico. Una célula eucariótica que incluye una aminoacil- ARNt sintetasa ortogonal (O-RS) es una característica de la invención. La O-RS preferentemente aminoacila un ARNt ortogonal (0-ARNt) con un aminoácido no natural en la célula eucariótica. En ciertas modalidades la O-RS utiliza más de un aminoácido no natural, e.g., dos o más, tres o más, etc. De este modo, una O-RS de la invención puede tener la capacidad para aminoacilar preferentemente un O-ARNt con aminoácidos no naturales diferentes. Esto permite un nivel adicional de control seleccionando cuál aminoácido no natural o combinación de aminoácidos no naturales se coloca con la - - célula y/o seleccionando las diferentes cantidades de aminoácidos no naturales que se colocan con la célula para su incorporación. Una 0-RS de la invención tiene opcionalmente una o más propiedades enzimáticas mejoradas o aumentadas para el aminoácido no natural en comparación con un aminoácido natural. Estas propiedades incluyen, e.g. , un Km más alto, un Km más bajo, un kcat más alto, un kcat más bajo, un kcat/km más bajo, un kcat/km más alto, etc., para el aminoácido no natural en comparación con un aminoácido de origen natural, e.g., uno de los 20 aminoácidos comunes conocidos . Opcionalmente, la O-RS puede proporcionarse a la célula eucariótica mediante un polipéptido que incluye una O-RS o mediante un polipéptido que codifica para una 0-RS o una porción de la misma. Por ejemplo, una 0-RS o una porción de la misma, se codifica por una secuencia de polinucleótido como se describe en cualquiera de las SEQ ID NO: 3-35 (e.g., 3-19, 20-35 o cualquier subconjunto de las secuencias 3-35) , o por una secuencia complementaria de polinucleótido de las mismas. En otro ejemplo, una O-RS comprende una secuencia de aminoácidos como se describe en cualquiera de las SEQ ID NO: 36-63 (e.g., 36-47, 48-63, o cualquier otro subconjunto de 36-63), y/o 86, o una variación conservadora de las mismas. Ver, e.g., Tablas 5, 6 y 8 y el Ejemplo 5 en la presente para - 4 - secuencias de moléculas O-RS ejemplares. Una O-RS también puede comprender una secuencia de aminoácidos que es e.g., al menos 90%, al menos 95%, al menos 98%, al menos 99% o incluso al menos 99.5%, idéntica a la de una tirosil aminoacil-ARNt sintetasa (TyrRS) de origen natural (e.g., como se describe en la SEQ ID NO: 2) y comprende dos o más aminoácidos de los grupos A-E. El grupo A incluye valina, isoleucina, glicina, serina, alanina, o treonina en una posición correspondiente a Tyr37 de una TyrRS de E. coli; el grupo B incluye aspartato en una posición correspondiente a Asnl26 de una TyrRS de E. coli; el grupo C incluye treonina, serina, arginina, asparagina, o glicina en una posición correspondiente a Aspl82 de una TyrRS de E. coli; el grupo D incluye metionina, alanina, valina o tirosina en una posición correspondiente a Phel83 de una TyrRS de E. coli; y el grupo E incluye serina, metionina, valina, cisteina, treonina o alanina en una posición correspondiente a Leul86 de una TyrRS de E. coli. Cualquier subconjunto de combinaciones de estos grupos es una característica de la invención. Por ejemplo, en una modalidad, la O-RS tiene dos o más aminoácidos seleccionados de presentaciones de valina, isoleucina, leucina o treonina en una posición correspondiente a Tyr37 de la TyrRS de E. coli; treonina, serina, arginina, o glicina en una posición correspondiente a Aspl82 de una TyrRS de E. coli; metionina, o tirosina en una posición correspondiente a Phel83 de una Tyr S de E. coli; y serina, o alanina en una posición correspondiente a Leul86 de una TyrRS de E. coli. En otra modalidad, la O-RS incluye dos o más aminoácidos seleccionados de glicina, serina o alanina en una posición correspondiente a Tyr37 de la TyrRS de E. coli; aspartato en una posición correspondiente a Asnl26 de una TyrRS de E. coli; asparagina en una posición correspondiente a Aspl82 de una TyrRS de E. coli; alanina o valina en una posición correspondiente a Phel83 de una TyrRS de E. coli; y/o metionina, valina, cisteína o treonina en una posición correspondiente a Leul86 de una TyrRS de E. coli. Ver también e.g., Tabla 4, Tabla 6 y Tabla 8 en la presente. Además de la O-RS, la célula eucariótica de la invención puede incluir componentes adicionales, e.g. , un aminoácido (s) no natural (es) . La célula eucariótica incluye también un ARNt ortogonal (O-ARNt) (e.g. , derivado de un organismo no eucariótico, tal como Escherichia coli, Bacillus stearothermophilus, y/o lo similar) , en donde el O-ARNt reconoce un codón selector y preferentemente se aminoacila con el aminoácido no natural por la O-RS. También puede encontrarse presente en la célula un ácido nucleico que comprende un polinucleotido que codifica para un polipéptido de interés, en donde el polinucleotido comprende un codón selector reconocido por el O-ARNt, o una combinación de dos o más de éstos. En un aspecto, el O-ARNt media la incorporación del aminoácido no natural en una proteína, e.g., con al menos al menos 45%, al menos 50%, al menos 60%, al menos 75%, al menos 80%, al menos 90%, al menos 95% o 99%, o la eficiencia de un ARNt que comprende o se procesa de una secuencia de polinucleótidos como se describe en la SEQ ID NO: 65. En otro aspecto, el O-ARNt comprende la secuencia SEQ ID NO: 65, y la O-RS comprende una secuencia de polipéptidos como se describe en cualquiera de las SEQ ID NO: 36-63 (e.g., 36-47, 48-63 o cualquier otro subconjunto de la 36-63) , y/o 86, y/o una variación conservadora de las mismas. Ver también, e.g., Tabla 5 y Ejemplo 6 en la presente para secuencias de moléculas ejemplares de O-Rs y O-ARNt. En un ejemplo, una célula eucariótica comprende una aminoacil-ARNt sintetasa ortogonal (O-RS) , un ARNt ortogonal (O-ARNt) , un aminoácido no natural y un ácido nucleico que comprende un polinucleótido que codifica para un polipéptido de interés cuyo polinucleótido comprende un codón selector reconocido por el O-ARNt. La O-RS preferentemente aminoacila el ARNt ortogonal (O-ARNt) con el aminoácido no natural en la célula eucariótica, y la célula produce el polipéptido de interés en ausencia del aminoácido no natural, con un rendimiento que es, e.g., menor que 30%, menor que 20%, menor que 15%, menor que 10%, menor que 5%, menor que 2.5%, etc., - - del rendimiento del polipéptido en presencia del aminoácido no natural . Los métodos para producir una O-RS, que son una característica de la invención, incluyen opcionalmente generar un depósito de sintetasas mutantes provenientes de la estructura de una sintetasa de tipo silvestre, y después seleccionar RSs mutadas en base a su especificidad para un aminoácido no natural relativo a los veinte aminoácidos comunes. Para aislar tal sintetasa, los métodos de selección son: (i) sensitivos, dado que la actividad de las sintetasas deseadas provenientes de la ronda inicial puede ser baja y la población pequeña; (ii) "modulables" , dado que es deseable variar la rigidez de selección a diferentes rondas de selección; y (iii) generales, de modo que los métodos pueden utilizarse para diferentes aminoácidos no naturales. Los métodos para producir una aminoacil-AR t sintetasa ortogonal (O-RS) que preferentemente aminoacila un ARWt ortogonal con un aminoácido no natural en una célula eucariótica incluyen típicamente aplicar una combinación de una selección positiva seguida por una selección negativa. En la selección positiva, la supresión del codón selector introducido en posición (es) no esencial (es) de un marcador positivo permite que las células eucarióticas sobrevivan bajo la presión de la selección positiva. En presencia de aminoácidos no naturales, las sobrevivientes codifican por tanto para sintetasas activas que cargan el ARNt ortogonal de supresión con un aminoácido no natural . En la selección negativa, la supresión de un codón selector introducido en posición(es) no esencial (es) de un marcador negativo retira las sintetasas con especificidad de aminoácido natural . Las sobrevivientes a la selección negativa y positiva codifican para sintetasas que aminoacilan (cargan) el ARNt ortogonal de supresión solamente (o al menos preferentemente) con aminoácidos no naturales . Por ejemplo, el método incluye: (a) someter a selección positiva, en presencia de un aminoácido no natural, una población de células eucarioticas de una primera especie, en donde las células eucarioticas comprenden cada una: i) un miembro de una biblioteca de aminoacil-ARNt sintetasas (RSs) , ii) un ARNt ortogonal (O-ARNt) , iii) un polinucleótido que codifica para un marcador de selección positiva, y iv) un polinucleótido que codifica para un marcador de selección negativa; en donde las células que sobreviven la selección positiva comprenden una RS activa que aminoacila el ARNt ortogonal (O-ARNt) en presencia de un aminoácido no natural; y (b) someter las células que sobreviven la selección positiva a selección negativa en ausencia del aminoácido no natural para eliminar las RSs activas que aminoacilan el O-ARNt con un aminoácido natural, con lo cual se proporciona la 0-RS que preferentemente aminoacila el 0-ARNt con el aminoácido no natural . El marcador de selección positiva puede ser cualquiera de una variedad de moléculas. En una modalidad, el marcador de selección positiva es un producto que proporciona un suplemento nutritivo para el crecimiento y la selección se lleva a cabo en un medio carente del suplemento nutritivo. Ejemplos de polinucleótidos que codifican para marcadores de selección positiva incluyen, pero no se limitan a, e.g., un gen informante basado en complementar la auxotrofia del aminoácido de una célula, un gen his3 (e.g., cuando el gen his3 codifica para una imidazolo glicerol fosfato dehidratasa, detectada proporcionando 3-aminotriazolo (3-AT)) un gen ura3 , un gen leu2, un gen lys2 , un gen lacZ, un gen adh, etc. Ver, e.g., G. M. Kishore & D. M. Shan, (1988) , Amino acid biosynthesis inhibitors as herbicides, Annual Review of Biochemistry, 57:637-663. En una modalidad, se detecta la producción de lacZ mediante hidrólisis de otro-nitrofenil-b-D-galactopiranosida (ONPG) . Ver e.g., I. G. Serebriiskii & E. A. Golemis, (2000), Uses of lacZ to study gene function: evaluation of jbeta-galactosidasa assays employed in the yeast two hybrid system, Analitical Biochemistry, 285:1-15. Marcadores de selección positiva adicionales incluyen, e.g., luciferasa, proteína verde fluorescente (GPF) , YFP, EGFP, RFP, el producto de un gen resistente al antibiótico (e.g., cloranfenicol acetiltransferasa (CAT) ) , una proteína moduladora de transcripción (e.g., GAL4) , etc. Opcionalmente, un polinucleótido que codifica para el marcador de selección positiva comprende un codón selector. Un polinucleótido que codifica para el marcador de selección positiva puede encontrarse operablemente enlazado a un elemento de respuesta. También puede encontrarse presente polinucleótido adicional que codifica para una proteina moduladora de transcripción que modula la transcripción a partir del elemento de respuesta, y comprende al menos un codón selector. La incorporación del aminoácido no natural en la proteína moduladora de transcripción mediante el 0-ARNt aminoacilado con el aminoácido no natural da como resultado la transcripción del polinucleótido (e.g., el gen informante) que codifica para el marcador de selección positiva. Por ejemplo, ver Figura 1A. Opcionalmente, el codón selector se localiza en o sustancialmente cercano a una porción del polinucleótido que codifica para un dominio de enlace de ADN de la proteína moduladora de transcripción. Un polinucleótido que codifica para el marcador de selección negativa también puede encontrarse operablemente enlazado a un elemento de respuesta a partir del cual se media la transcripción mediante la proteína moduladora de transcripción. Ver e.g., A. J. DeMaggio, et al., (2000), The yeast split hybrid system, Method Enzymol . 328:128-137; H. M.
- - Shih et al., (1996), A positive genetic selection for disrupting protein-protein interactions: id.entifica.tion of CREB mutations that prevent association with the coactivator CBP, Proc. Nati. Acad. Sci . EUA, 93:13896-13901; M. Vidal et al., (1996), Genetic characterization of a mammalian protein-protein interaction domain by using a yeast reverse two hybrid system [comment] , Proc . Nati . Acad . Sci . EUA 93:10321-10326; y M. Vidal et al., (1996), Reverse two hybrid and one hybrid systems to detect dissociation of protein-protein and DNA-protein interactions [comment], Proc. Nati. Acad. Sci. EUA, 93:10315-10320. La incorporación de un aminoácido natural en la proteína moduladora de transcripción mediante el O-ARNt aminoacilado con una aminoácido natural da como resultado la transcripción del marcador de selección negativa. Opcionalmente, el marcador de selección negativa comprende un codón selector. En una modalidad, el marcador de selección positiva y/o el marcador de selección negativa de la invención puede comprender al menos dos codones selectores, que pueden comprender cada uno o ambos al menos dos diferentes codones selectores de al menos dos de los mismos codones selectores. La proteína moduladora de transcripción es una molécula que se enlaza (directa o indirectamente) a una secuencia de ácido nucleico (e.g., un elemento de respuesta) y modula la transcripción de una secuencia que se encuentra - - operablemente enlazada a un elemento de respuesta. Un proteína moduladora de transcripción puede ser una proteína activadora de transcripción (e.g., GAL4, receptores de hormona nuclear, API, CREB, miembros de la familia LEF/tcf, SMADs, VP16, SPI, etc.), una proteína represora de transcripción (e.g., receptores de hormona nuclear, familia Groucho/tle, familia Engrailed, etc.), o una proteína que puede tener ambas actividades dependiendo del ambiente (e.g., LEF/tcf, proteínas homobox, etc.). Un elemento de respuesta es típicamente una secuencia de ácido nucleico reconocida por la proteína moduladora de transcripción o un agente adicional que actúa en concierto con la proteína moduladora de transcripción . Otro ejemplo de una proteína moduladora de transcripción es la proteína activadora de transcripción GAL4 (ver, e.g., Figura 1A) . Ver e.g., A. Laughon et al., (1984), Identification of two proteins encoded by the Saccharomyces cerevisiae GAL4 gene, Molecular & Cellular Biology, 4:268-275; A. Laughon & R. F. Gesteland, (1984), Primary structure of the Saccharomyces cerevisiae GAL4 gene, Molecular & Cellular Biology, 4:260-267; L. Keegan et al., (1986), Separation of DNA binding from the transcription activating function of a eukariotic regulatory protein, Science, 231:699-704; y M. Ptashne (1988), How eukariotic transcriptional activators work, Nature , 335:683-689. Los - - aminoácidos de terminación M de esta proteína de 881 aminoácidos forman un dominio de enlace de ADN (DBD) que enlaza la secuencia de ADN específicamente. Ver, e.g., M. Carey et al., (1989), An amino-terminal fragment of GAL4 binds DNA as a di er, J. Mol. Biol . 209:423-432; y E. Giniger et al., (1985), Specific DNA hinding of GAL4, a positive regulatory protein of yeast, Cell, 40:757-774. El DBD se enlaza, por medio de una secuencia de proteina que interviene, a un dominio de activación de 113 aminoácidos de terminación C (AD) que puede activar la transcripción cuando se enlaza al ADN. Ver, e.g., J. Ma, & M. Ptashne (1987), Deletion analysis of GAL4 defines two transcriptional activating segments, Cell , 48:847-853; y J. Ma, & M. Ptashne (1987) , The carboxy- terminal 30 amino acids of GAL4 are recognized by GAL80, Cell, 50:137-142. Colocando codones ámbar hacia, e.g., el DBD de terminación N de un único polipéptido que contiene tanto el DBD de terminación N de GAL4 como su AD de terminación C, puede enlazarse la supresión ámbar por medio del par 0-ARWt/O-RS a la activación de transcripción por medio de GAL4 (Figura 1, Panel A) . Los genes informantes GAL4 activados pueden utilizarse para llevar a cabo las selecciones tanto positiva como negativa con el gen (Figura 1, Panel B) . El medio utilizado para la selección negativa puede comprender un agente de selección o filtración que se - - convierte en una sustancia detectable mediante el marcador de selección negativa. En un aspecto de la invención, la sustancia detectable es una sustancia tóxica. Un polinucleótido que codifica para un marcador de selección negativa puede ser, e.g., un gen ura3. Por ejemplo, el informante URA3 puede colocarse bajo el control de un promotor que contiene sitios de enlace GAL4 ADN. Cuando se produce el marcador de selección negativa, e.g., mediante la traducción de un polinucleótido que codifica para GAL4 con codones selectores, GAL4 activa la transcripción de URA3. La selección negativa se logra en un medio que comprende ácido 5-fluoroorótico (5-FOA) , que se convierte en una sustancia detectable (e.g., una sustancia tóxica que destruye la célula) por medio del producto del gen del gen ura3. Ver, e.g., J. D . Boeke et al., (1984), A positive selectíon for Mutantes lacking orotidine-5' -phosphate decarboxilase activity in yeast: 5-fluoroorotic acid resistance, Molecular & General Genetics, 197:345-346); M. Vidal et al., (1996), Genetic characterization of a mammalian protein-protein interaction doinain by using a yeast reverse two hybrid system [comment] , Proc . Nati. Acad. Sci. EUA 93:10321-10325; y . Vidal et al., (1996), .Reverse two hybrid and one hybrid systems to detect dissociation of protein-protein and DNA-protein interactions [comment], Proc. Nati. Acad. Sci. EUA, 93:10315-10320. Ver también Figura 8C.
- - Como con el marcador de selección positiva, el marcador de selección negativa también puede ser cualquiera de una diversidad de moléculas. En una modalidad, el marcador de selección positiva y/o el marcador de selección negativa es un polipeptido que hace fluorescente o cataliza una reacción luminiscente en presencia de un reactivo adecuado. Por ejemplo, los marcadores de selección negativa incluyen, pero no se limitan a, e.g., luciferasa, proteína verde fluorescente (GPF) , YFP, EGFP, RFP, el producto de un gen resistente al antibiótico (e.g., cloranfenicol acetiltransferasa (CAT) ) , el producto de un gen lacZ, una proteína moduladora de transcripción etc. En un aspecto de la invención, el marcador de selección positiva y/o el marcador de selección negativa se detecta mediante selección celular activada por fluorescencia (FACS) , o mediante luminiscencia. En otro ejemplo, el marcador de selección positiva y/o el marcador de selección negativa comprende un marcador de selección basado en la afinidad. El mismo polinucleótido puede codificar tanto para el marcador de selección positiva como para el marcador de selección negativa . También pueden utilizarse niveles adicionales de rigidez de selección/filtración en los métodos de la invención. La rigidez de selección o filtración puede variar en una o ambas etapas del método para producir una 0-RS.
- - Esto puede incluir, e.g., variar la cantidad de elementos de respuesta en un polinucleótido que codifica para el marcador de selección positiva y/o negativa, agregar una cantidad variable de una sintetasa inactiva a una o ambas etapas, variar la cantidad del agente de seleccíón/filtración que se utiliza, etc. También pueden llevarse a cabo rondas adicionales de selecciones positiva y/o negativa. La selección o filtración también puede comprender una o más selecciones o filtraciones positivas o negativas que incluyen, e.g., un cambio en la permeabilidad del aminoácido, un cambio en la eficiencia de traducción, un cambio en la fidelidad de traducción, etc. Típicamente, el uno o más cambios se basan en una mutación en uno o más polinucleótidos que comprenden o codifican para componentes de un par de AR t ortogonal/A Mt sintetasa que se utiliza para producir la proteina. También pueden utilizarse estudios de enriquecimiento del modelo para seleccionar rápidamente una sintetasa activa a partir de un exceso de sintetasas inactivas. Pueden efectuarse estudios de selección positiva y/o negativa del modelo. Por ejemplo, las células eucarióticas que comprenden aminoacil-ARNt sintetasas potenciales activas se mezclan con un exceso en grados variables de aminoacil-ARNt sintetasas inactivas. Se realiza una comparación promedio entre las células crecidas en un - - medio no selectivo y se analizan, por ejemplo, por recubrimiento X-GAL, y aquellas crecidas y capaces de sobrevivir en un medio selectivo, (e.g., en ausencia de histidina y/o uracilo) se analizan e.g., por un análisis X-GAL. Para la selección de un modelo negativo, se mezclan aminoacil-ARNt sintet sas potenciales activas con un exceso en grados variables de aminoacil-ARNt sintetasas inactivas y se lleva a cabo la selección con una sustancia de selección negativa, e.g., 5-FOA. Típicamente, la biblioteca de RSs (e.g., una biblioteca de RSs mutantes) comprende RSs derivadas de al menos una aminoacil-ARNt sintetasa (RS) , e.g., proveniente de un organismo no eucariótico. En una modalidad, la biblioteca de RSs se deriva de una RS inactiva, e.g., en donde la Rs inactiva se genera imitando una Rs activa, e.g., en el sitio activo en la sintetasa, en el sitio de mecanismo de edición en la sintetasa, en diferentes sitios combinando diferentes dominios de sintetasas, o lo similar. Por ejemplo, los residuos en el sitio activo de la RS se mutan a, e.g., residuos de alanina. El polinucleótido que codifica para la RS mutada con alanina se utiliza como patrón para mutagenizar los residuos de alanina para todos los 20 aminoácidos. La biblioteca de las RSs mutantes se selecciona/filtra para producir la O-RS. En otra modalidad, la RS inactiva comprende una bolsa de enlace de aminoácidos y uno o más - - aminoácidos que comprenden la bolsa de enlace se sustituyen con uno o más diferentes aminoácidos. En un ejemplo., los aminoácidos sustituidos se sustituyen con alaninas . Opcionalmente, el polinucleótido que codifica la RS mutada con alanina se utiliza como patrón para mutagenizar los residuos alanina para todos los 20 aminoácidos y se filtra/selecciona. El método para producir una 0-RS puede incluir además producir la biblioteca de RSs utilizando diversas técnicas de mutagénesis conocidas en la técnica. Por ejemplo, las RSs mutantes pueden generarse mediante mutaciones específicas del sitio, mutaciones de punto aleatorias, recombinación homologa, arrastre de ADN u otros métodos recursivos de mutagénesis, construcción quimérica o cualquier combinación de las mismas. Por ejemplo, una biblioteca de RSs mutantes puede producirse a partir de dos o más wsub-bibliotecas" diferentes, e.g., más pequeñas, menos diversas . Una vez que las sintetasas se someten a la estrategia de selección/filtración positiva y negativa, estas sintetasas pueden entonces someterse a mutagénesis adicional. Por ejemplo, puede aislarse un ácido nucleico que codifica la O-RS; puede generarse un conjunto de polinucleótidos que codifican para las 0-RSs mutadas (e.g., mediante mutagénesis aleatoria, mutagénesis especifica del sitio, recombinación o cualquier combinación de las mismas) a partir del ácido - - nucleico; y estas etapas individuales o una combinación de estas etapas puede repetirse hasta obtener una O-RS mutada que preferentemente aminoacila el O-ARNt con el aminoácido no natural. En un aspecto de la invención, las etapas se llevan a cabo al menos dos veces . Pueden encontrarse detalles adicionales para producir una O-RS en la WO 2002/086075 titulada "Methods and compositions for the production of orthogonal tRNA-aminoacyltRNA sintetasa pairs" . Ver también Hamano-Takaku et al., (2000) A utant Escherichia coli Tyrosyl-tRNA Sintetasa Utilizes the Unnatural Amino Acid Azatyrosine More Efficiently tizan Tyrosine. Journal of Biological Chemistry, 275 (51) :40324-40328; Kiga et al., (2002), An engineered Escherichia coli tyrosil-tRNA synthetasa for site-specific incorporation of an unnatural amino acid into proteins in eukariotic translation and its application in a wiieat germ cell-free system, PNAS, 99 (15) : 9715-9723 ; y Francklyn et al., (2002), Aminoacyl-tRNA synthetasas : Versatile players en the changing theater of translation; RNA, 8:1363-1372. ARNts ORTOGONALES Se proporcionan por la invención células eucarióticas que incluyen un ARNt ortogonal (O-ARNt) . El ARNt ortogonal media la incorporación de un aminoácido no natural en una proteina codificada por un polinucleotido que comprende un codón selector reconocido por el O-ARNt in vivo.
- - En ciertas modalidades, un 0-ARNt de la invención media la incorporación de un aminoácido no natural en una proteina con, e.g., al menos 40%, al menos 45%, al menos 50%, al menos 60%, al menos 75%, al menos 80% o incluso 90% o más, tan eficientemente como una 0-ARNt que comprende o se procesa en una célula proveniente de una secuencia de polinucleótidos como se describe en la SEQ ID NO: 65. Ver Tabla 5 en la presente . Un ejemplo de un O-ARNt de la invención es la SEQ ID NO: 65. (Ver Ejemplo 6 y Tabla 5, en la presente) . La SEQ ID NO: 65 es una transcripción de pre-unión/procesamiento que se procesa opcionalmente en la célula, e.g., utilizando la unión endógena de la célula y la maquinaria de procesamiento, y se modifica para formar un O-ARNt activo. Típicamente, la población de tales transcripciones de pre-unión forma una población de ARNts activos en la célula (los ARNts activos pueden encontrarse en una o más formas activas) . La invención incluye también variaciones conservadoras del O-ARNt y sus productos celulares procesados. Por ejemplo, las variaciones conservadoras de 0-ARNt incluyen aquellas moléculas que funcionan como el 0-ARNt de la SEQ ID NO: 65 y mantienen la estructura configurada L del ARNt, e.g. , en forma procesada, pero no tienen la misma secuencia (y son diferentes a las moléculas de ARNt de tipo silvestre) . Típicamente, un 0-ARNt de la invención es un 0-ARNt - - reciclable, debido a que el O-ARNt puede reaminoacilarse in vivo para mediar de nuevo la incorporación del aminoácido no natural en una proteína codificada por un polinucleótido en respuesta a un codón selector. La transcripción del ARNt en eucariotos, pero no en procariotos, se lleva a cabo mediante RNA Polymerasa II, que establece restricciones en la secuencia primaria de los genes estructurales del ARNt que pueden transcribirse en células eucarióticas . Adicionalmente, en las células eucarióticas , los ARNts necesitan exportarse del núcleo, en donde se transcriben, al citoplasma para funcionar en la traducción. Los ácidos nucleicos que codifican un O-ARNt de la invención o un polinucleótido complementario del mismo, también son una característica de la invención. En un aspecto de la invención, un ácido nucleico que codifica un O-ARNt de la invención incluye una secuencia promotora interna, e.g., una casilla A (e.g., TRGCNNAGY) y una casilla B (e.g., GGTTCGANTCC, SEQ ID NO: 88) . El O-ARNt de la invención también puede modificarse de manera post-transcipcional. Por ejemplo, la modificación de post-transcripción de los genes de ARNt en eucariotos incluye el retiro de las secuencias laterales 5'- y 3'- mediante Rnase P y de una 3'-endonucleasa, respectivamente. La adición de una secuencia 3'-CCA también es una modificación de post-transcripción de un gen de ARNt en eucariotos.
- - En una modalidad, se obtiene un O-ARNt sometiendo a selección negativa a una población de células eucarióticas de una primera especie, en donde las células eucarióticas comprenden un miembro de una biblioteca de ARNts . La selección negativa elimina las células que comprenden un miembro de la biblioteca de AR ts que se aminoacila mediante una aminoacil-ARNt sintetasa (RS) endógena a las células eucarióticas. Esto proporciona un depósito de ARNts ortogonales a la célula eucariótica de la primera especie. Alternativamente, o en combinación con otros métodos anteriormente descritos para incorporar un aminoácido no natural en un polipéptido, puede utilizarse un sistema trans-traducción. Este sistema implica una molécula llamada ARNm presente en Escherichia coli. Esta molécula de ARN se relaciona estructuralmente con un ARNt alanil y se aminoacila por la alanil sintetasa. La diferencia entre el ARNtm y el ARNt es que la curva de anticodón se reemplaza con una secuencia grande especial . Esta secuencia permite que el ribosoma resuma la traducción en las secuencias que se han establecido utilizando un marco de lectura abierto dentro del ARNtm como patrón. En la invención, puede generarse un ARNtm que preferentemente se aminoacila con una sintetasa ortogonal y se carga con un aminoácido no natural . Al transcribir un gen mediante el sistema, el ribosoma se establece en un sitio específico; el aminoácido no natural se introduce en ese - - sitio, y la traducción se resume utilizando la secuencia codificada dentro del ARNtm ortogonal . Pueden encontrarse métodos adicionales para producir ARNts ortogonales recombinantes, e.g., in las solicitudes internacionales de patente O 2002/086075, titulada "Methods and compositions for the production of orthogonal tRNA-aminoacyltRNA sintetasa pairs" . Ver también, Forster et al., (2003) Programming peptidomimetic sintetasas hy translating genetic codes designed de novo PNAS 100 (11) :6353-6357; y Feng et al., (2003), Expanding tRNA recognition of a tRNA synthetasa hy a single amino acid change PNAS 100 (10) :567S-5681. PARES DE ARNt ORTOGONAL Y AMINOACIL-ARNt SINTETASA ORTOGONAL Un par ortogonal se compone de un O-ARNt, e.g., un ARNt de supresión, un ARNt de deslizamiento de marco, o lo similar, y una 0-RS . El O-ARNt no se acila mediante sintetasas endógenas y es capaz de mediar la incorporación de un aminoácido no natural en una proteina codificada por un polinucleótido que comprende un codón selector reconocido por el O-ARNt in vivo. La O-RS reconoce el O-ARNt y preferentemente aminoacila el O-ARNt con un aminoácido no natural en una célula eucariótica. Se incluyen en la invención métodos para producir pares ortogonales así como los pares ortogonales producidos por tales métodos y las composiciones de pares ortogonales para uso en células - - eucarióticas . El desarrollo de múltiples pares de AMt ortogonal/sintetasa puede permitir la incorporación simultánea dde múltiples aminoácidos no naturales utilizando diferentes codones en una célula eucariotica. Un par de O-AR t ortogonal/O-RS en una célula eucariotica puede producirse importando un par, e.g., un par de supresión sin sentido, de un organismo diferente con ineficiente aminoacilación de la especie cruzada. El O-ARNt y la O-RS se expresan eficientemente y se procesan en la célula eucariotica y el O-ARNt se exporta eficientemente desde el núcleo hasta el citoplasma. Por ejemplo, un par tal es el par de tirosil-ARNt sintetasa/ARNtCuA de E. coli (ver, e.g., H. M. Goodman et al., (1968), Nature 217:1019-24; y D. G. Barker et al., (1982), FEBS Letters 150:419-23). La tirosil-ARNt sintetasa de E. coli aminoacila eficientemente a su cognado AR tcuA de E. coli, cuando ambos se expresan en el citoplasma de S. cerevisiae, pero no aminoacila los AKNts de S. cerevisiae. Ver, e.g., H. Edwards & P. Schimmel, (1990), Molecular & Cellular Biology 10:1633-41; y H. Edwards et al., (1991), PNAS United States of America 88:1153-6. Adicionalmente, la tirosil ARNtCuA de E. coli es un substrato pobre para las aminoacil-ARNt sintetasas de S. cerevisiae (ver, e.g., V. Trezeguet et al., (1991), Molecular & Cellular Biology 11:2744-51), pero funciona eficientemente en la traducción de proteínas en S. cerevisiae. Ver, e.g., H.
- - Edwards & P. Schimmel, (1990) Molecular & Cellular Biology 11:2744-51. Además, la TyrRS de E. coli no tiene un mecanismo de edición para la lectura de comprobación de un aminoácido no natural ligado al ARNt. El 0-AR t y la 0-RS pueden presentarse naturalmente o pueden derivarse mediante mutación de un ARNt y/o RS de origen natural, que genera bibliotecas de ARNTs y/o bibliotecas de RSs a partir de una diversidad de organismos. Ver la sección titulada "Fuentes y Huéspedes" en la presente. En varias modalidades, el O-ARNt y la 0-RS se derivan de al menos un organismo. En otra modalidad, el O-ARNt se deriva de un ARNt de origen natural o mutado naturalmente a partir de un primer organismo y la O-RS se deriva de una RS de origen natural o mutada naturalmente a partir de un segundo organismo.- En una modalidad, los primero y segundo organismos no eucarióticos son el mismo. Alternativamente, los primero y segundo organismos no eucarióticos pueden ser diferentes . Ver en la presente las secciones tituladas "Aminoacil-ARNt sintetasas ortogonales" y wO-ARNt" para métodos para producir O-RSs y O-ARNts. Ver también, la solicitud de patente internacional WO 2002/086075, titulada "Methods and compositions for the production of orthogonal tRNA-aminoacyltRNA sintetasa pairs" . FIDELIDAD, EFICIENCIA Y RENDIMIENTO Fidelidad se refiere a la precisión con la cual una molécula deseada, e.g., un aminoácido no natural o un aminoácido, se incorpora en un polipéptido creciente en una posición deseada. Los componentes de traducción de la invención incorpora aminoácidos no naturales, con alta fidelidad en proteínas en respuesta a un codón selector. Por ejemplo, utilizando los componentes de la invención, la eficiencia de incorporación de un aminoácido no natural en una cadena de polipéptido creciente en una posición deseada (e.g., en respuesta a un codón selector) es e.g., mayor que 75% mayor que 85%, mayor que 95% o incluso mayor que 99% o más eficiente en comparación con la incorporación no deseada de un aminoácido natural especifico que se incorpora en la cadena de polipéptido creciente en la posición deseada. La eficiencia también puede referirse al grado con el cual la 0-RS aminoacila el 0-ARNt con el aminoácido no natural en comparación con un control relevante . Las O-RSs de la invención pueden definirse por su eficacia. En ciertas modalidades de la invención, una O-RS se compara con otra O-RS. Por ejemplo, una 0-RS de la invención aminoacila un O-ARNt con un aminoácido no natural, e.g., al menos 40%, al menos 45%, al menos 50%, al menos 60%, al menos 75%, al menos 80%, al menos 90%, al menos 95% o incluso 99% o más, tan eficientemente como una 0-RS que tiene una secuencia de aminoácidos, e.g., como se describe en la SEQ ID NO: 86 o 45 (u otra RS específica en la Tabla 5) aminoacila un O-ARNt. En otra modalidad, una O-RS de la invención aminoacila el 0-ARNt con el aminoácido no natural al menos 10 veces, al menos 20 veces, al menos 30 veces, etc., más eficientemente que la O-RS aminoacila el O-ARNt con un aminoácido natural . Utilizando los componentes de traducción de la invención, el rendimiento del polipéptido de interés que comprende el aminoácido no natural es e.g. , al menos 5%, al menos 10%, al menos 20%, al menos 30%, al menos 40%, 50% o más, el obtenido para el polipéptido de origen natural de interés de una célula en la cual el polinucleotido carece del codón selector. En otro aspecto, la célula produce el polipéptido de interés en ausencia del aminoácido no natural, con un rendimiento que es, e.g., menor que 30, menor que 20%, menor que 15%, menor que 10%, menor que 5%, menor que 2.5%, etc., del rendimiento del polipéptido en presencia del aminoácido no natural . ORGANISMOS FUENTE Y HUÉSPED Los componentes de traducción ortogonales de la invención se derivan típicamente de organismos no eucarióticos para uso en células eucarióticas o sistemas de traducción. Por ejemplo, el O-ARNt ortogonal puede derivarse de un organismo no eucariótico, e.g., una eubacteria tal como Escherichia coli, Thexwus Thermophilus, Bacillus stearothermophilus, o lo similar, o una archaebacteria tal - - como Methanococcus jannaschii, Methanobacterium thermoautotrophicum, Halobacterium tal como Haloferax volcanii y especies Halobacterium NRC-1, Archaeglobus fulgidus, Pyrococcua furiosus, Pyrococcus horikoshii, Aeuropyrum pernix, o lo similar, mientras que una O-RS ortogonal puede derivarse de un organismo no eucariótico e.g., una eubacteria tal como Escherichia coli, Thermus Thermophilus, Bacillus stearothermophilus, o lo similar, o una archaebacteria tal como Methanococcus jannaschii , Methanobacterium thermoautotrophicum, Halobacterium tal como Haloferax volcanii y especies Halobacterium NRC-1, Archaeglobus fulgidus, Pyrococcua furiosus, Pyrococcus horikoshii, Aeuropyrum pernix, o lo similar.
Alternativamente, las fuentes eucarióticas también pueden utilizarse, e. g. , plantas, algas, protists, hongos, levadura, animales (e.g., mamíferos, insectos, artrópodos, etc.) o lo similar, e.g., en donde los componentes son ortogonales a una célula o sistema de traducción de interés, o en donde se modifican (e.g., mutan) para ser ortogonales a la célula o sistema de traducción. Los componentes individuales de un par de O-ARNt/O-RS pueden derivarse del mismo organismo o de diferentes organismos. En una modalidad, el par de O-AR t/O-RS es del mismo organismo. Por ejemplo, el par de O-ARNt/O-RS puede derivarse de un par de tirosil-ARNt sintetasa/AR tcuA de E. coli. Alternativamente, el O-ARNt y la O-RS del par de 0-ARNt/O-RS son opcionalmente de diferentes organismos. El O-ARNt ortogonal, la O-RS o el par de 0-ARNt/O-RS puede seleccionarse o filtrarse y/o utilizarse en una célula eucariotica para producir un polipéptido con un aminoácido no natural . Una célula eucariotica puede provenir de una diversidad de fuentes, e.g., una planta (e.g., planta compleja tal como monocotiledóneas o dicotiledóneas) , un alga, un protist, un hongo, una levadura (e.g., Saccharomyces cerevisiae) , un animal (e.g., un mamífero, un insecto, un artrópodo, etc.) o lo similar. Las composiciones de células eucarióticas con componentes de traducción de la invención también son una característica de la invención. La invención también proporciona la selección eficiente en una especie para uso opcional en esas especies y/o en una segunda especie (opcionalraente sin selección/filtración adicional). Por ejemplo los componentes de O-ARNt/O-RS se seleccionan o se filtran en una especie, e.g., una especie fácilmente manipulada (tal como una célula de levadura, etc.) y se introducen en una segunda especie eucariotica, e.g., una planta (e.g., planta compleja tal como monocotiledóneas o dicotiledóneas) , un alga, un protist, un hongo, una levadura, un animal (e.g., un mamífero, un insecto, un artrópodo, etc.) o lo similar para uso en la incorporación in vivo de un aminoácido no natural en la segunda especie . Por ejemplo, puede seleccionarse Saccharomyces cerevisiae (S. cerevisiae) como la primera especie eucariótica, dado que es unicelular, tiene un tiempo rápido de generación, y genética relativamente bien caracterizada. Ver, e .g . , D . Burke et al . , (2000) Met ods in Yeast Genetics Cold Spring Harbor Laboratory Press, Cold Spring Harbor, Y. Además dado que la maquinaria de traducción de los eucariotos es altamente conservada (ver, e.g., (1996) Translational Control Cold Spring Harbor Laboratory, Cold Spring Harbor NY; Y. Kwok & J. T. Wong, (1980), Evolutionary relationship between Halobacterium cutirubrum and eukariotes determined by use of aminoacyl-tRNA sintetasas as philogenetic probes, Canadian Journal of Biochemistry 58:213-218; y (2001) The ibosome Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY) , los genes aa Ss para la incorporación de un aminoácido no natural descubiertos en S cerevisiae pueden introducirse en organismos eucarióticos mayores y utilizarse, en sociedad con los ARNts cognado (ver, e.g., K. Sakamoto et al., (2002) Site specific incorporation of an unnatural amino acid into proteins in mammalian cells, Nucleic Acids Res. 30:4692-4699; y C. Kohrer et al., (2001), Import of amber and ochre suppressor tRNAs into mammalian cells: a general approach to site specific insertion of amino acid analogues into proteins, Proc. Nati. Acad. Sci. EUA, 98:14310-14315) - - para incorporar aminoácidos no naturales . En un ejemplo, el método para producir 0-ARNt/O-RS en una primera especie como se describe en la presente, incluye además introducir un ácido nucleico que codifica para el O-ARNt y un ácido nucleico que codifica para la O-RS en una célula eucariótica de una segunda especie (e.g., un mamífero, un insecto, un hongo, un alga, una planta y lo similar) . En otro ejemplo, el método para producir una aminoacil-ARNt sintetasa ortogonal (O-RS) que preferentemente aminoacila un AR t ortogonal con un aminoácido no natural en una célula eucariótica incluye: (a) someter a selección positiva, en presencia de un aminoácido no natural, una población de células eucarióticas de una primera especie (e.g., levadura y lo similar). Cada una de las células eucarióticas comprende: i) un miembro de una biblioteca de aminoacil-ARNt sintetasas (RSs) , ii) un ARNt ortogonal (O-ARNt) , iii) un polinucleótido que codifica para un' marcador de selección positiva, y iv) un polinucleótido que codifica para un marcador de selección negativa. Las células que sobreviven la selección positiva comprenden una RS activa que aminoacila el ARNt ortogonal (O-ARNt) en presencia de un aminoácido no natural . Las células que sobreviven la selección positiva se someten a selección negativa en ausencia del aminoácido no natural para eliminar las RSs activas que aminoacilan el O-ARNt con un aminoácido natural.
Esto proporciona la O-RS que preferentemente aminoacila el 0-ARNt con el aminoácido no natural . Un ácido nucleico que codifica para un O-ARNt y un ácido nucleico que codifica para la O-RS (o los componentes de O-AR t y/o O-RS) se introducen en una célula eucariótica de una segunda especie e.g., un mamífero, un insecto, un alga, una planta y/o lo similar. Típicamente, el O-ARNt se obtiene sometiendo a selección negativa una población de células eucarióticas de una primera especie, en donde las células eucarióticas comprenden un miembro de una biblioteca de ARNts. La selección negativa elimina las células que comprenden un miembro de la biblioteca de ARNts que se aminoacila mediante una aminoacil-ARNt sintetasa (RS) endógena para las células eucarióticas, lo cual proporciona un depósito de ARNts ortogonales para la célula eucariótica de la primera especie y la segunda especie . COPONES SELECTORES Los codones selectores de la invención expanden la estructura genética de codón de la maquinaria biosintética de la proteína. Por ejemplo, un codón selector incluye, e.g., un codón único de tres bases, un codón sin sentido, tal como un codón de detención, e.g., un codón ámbar (UAG) , un codón ópalo (UGA) un codón no natural , al menos un codón de cuatro bases, un codón raro o lo similar. Puede introducirse un número de codones selectores en un gen deseado, e.g., uno o - - más, dos o más, más de tres, etc., una vez que el gen puede incluir múltiples copias de un codón selector dado o puede incluir múltiples codones selectores diferentes, o cualquier combinación de los mismos . En una modalidad, los métodos implican el uso de un codón selector que es un codón de detención para la incorporación de aminoácidos no naturales in vivo en una célula eucariótica. Por ejemplo, se produce un O-ARNt que reconoce el codón de detención, e.g., UAG, y se aminoacila mediante una 0-RS con un aminoácido no natural deseado. Este O-ARNt no es reconocido por las aminoacil-AR t sintetasas del huésped de origen natural. Puede utilizarse mutagénesis convencional dirigida al sitio para introducir el codón de detención, e.g., TAG, en el sitio de interés en un polipéptido de interés. Ver, e.g., Sayers, J. R. et al., (1988), 5', 3' Exonuclease in phosphorotioate-based oligonucleotide-directed mutagénesis, Nucleic Acids Res. 791-802. Cuando la O-RS, el O-ARNt y el ácido nucleico que codifica para el polipéptido de interés se combinan in vivo, el aminoácido no natural se incorpora en respuesta al codón UAG para dar un polipéptido que contiene el aminoácido no natural en la posición especificada. La incorporación de aminoácidos no naturales in vivo puede realizarse sin perturbación significativa de la célula huésped eucariótica. Por ejemplo, debido a que la - - eficiencia de supresión para el codón UAG depende de la competencia entre el O-ARNt, e.g., el ARNt de supresión ámbar, y de un factor de liberación eucariótico (e.g., eRF) (que se enlaza a un codón de detención e inicia la liberación del polipéptido creciente del ribosoma) , la eficiencia de supresión puede modularse, e.g., mediante el aumento del nivel de expresión del O-ARNt, e.g., el ARNt de supresión. Los codones selectores también comprenden codones extendidos, e.g., codones de cuatro bases o más, tales como codones de cuatro, cinco, seis o más bases. Ejemplos de codones de cuatro bases incluyen, e.g., AGGA, CUAG, UAGA, CCCU y lo similar. Ejemplos de codones de cinco bases incluyen, e.g., AGGAC, CCCCU, CCCUC, CUAGA, CUACU, UAGGC y lo similar. Una característica de la invención incluye el uso de codones extendidos basados en la supresión de deslizamiento de marco. Los codones de cuatro o más bases pueden insertar, e.g., uno o múltiples aminoácidos no naturales en la misma proteína. Por ejemplo, en presencia de O-ARNts mutadas, e.g., ARNts de supresión de deslizamiento de marco especial, con curvas anti codón, e.g., con al menos 8-10 nt curvas anti codón, el codón de cuatro o más bases se lee como un aminoácido único. En otras modalidades, las curvas anti codón pueden decodificar, e.g., al menos un codón de cuatro bases, al menos un codón de cinco bases, o al menos un codón de seis bases o más. Dado que existen 256 codones - - de cuatro bases posibles, pueden codificarse múltiples aminoácidos no naturales en la misma célula utilizando un codón de cuatro o más bases. Ver, Anderson et al., (2002) Exploring the limits of codon and anticodon size, Chemistry and Biology, 9:237-244; Maglieri (2001) Expanding the genetic code: Selection of efficient suppressors of four base codons and identification of "shifty" four base codons with a library approach in Escherichia coli, J. Mol. Biol . 307:755-769. Por ejemplo, se han utilizado codones de cuatro bases para incorporar aminoácidos no naturales utilizando métodos biosintéticos in vitro. Ver, e.g., Ma et al., (1993) Biochemistry 32:7939; y Hohsaka et al., (1999) J. Am. Chem. Soc. 121:34. Se utilizaron CGGG y AGGU para incorporar simultáneamente 2-naftilalanina y derivado NBD de lisina en estreptavidina in vitro con dos ARNts de supresión de deslizamiento de marco químicamente acilados . Ver, e.g., Hohsaka et al., (1999) J. Am. Chem. Soc. 121:12194. En un estudio in vivo, Moore et al., examinó la capacidad de los derivados AR tLeu con anticodones NCUA para suprimir codones UAGN (N puede ser U, A, G o C) , y se encontró que el cuarteto UAGA puede decodificarse mediante un ARNtLeu con un anti codón UCUA con una eficiencia de 13 a 26% con poca decodificación en el marco 0 o -1. Ver, Moore et al., (2000) J. Mol. Biol. 298:195. En una modalidad, pueden utilizarse - - en la invención los codones extendidos en base a codones raros o codones sin sentido, que puedan reducir el la lectura sin sentido y la supresión de deslizamiento de marco en otros sitios no deseados. Para un sistema dado, un codón selector puede incluir también uno de los codones de tres bases naturales, en donde el sistema endógeno no utiliza (o rara vez utiliza) el codón de base natural. Por ejemplo, este incluye un sistema que carece de un ARNt que reconozca el codón de tres bases natural y/o un sistema en donde el codón de tres bases sea un codón raro. Los codones selectores incluyen opcxonalmente pares base no naturales . Estos pares base no naturales expanden el alfabeto genético existente. Un par base extra aumenta el número de codones triples de 64 a 125. Las propiedades de los pares de tercera base incluyen emparejamiento de base estable y selectivo, incorporación enzimática eficiente en el ADW con alta fidelidad mediante una polimerasa, y la eficiente continua extensión inicial después de la síntesis del par base no natural naciente. Las descripciones de pares base no naturales que pueden adaptarse para los métodos y composiciones incluyen, e.g., Hirao et al., (2002) An unnatural base pair for incorporating amino acid analogues into protein, Nature Biotechnology 20:177-182. Otras publicaciones relevantes se enlistan abajo.
- - Para uso in vivo, el nucleósido no natural es de membrana permeable y se encuentra fosforilado para formar el trifosfato correspondiente. Adicionalmente, la información genética aumentada es estable y no se destruye por las enzimas celulares . Los esfuerzos previos de Benner y otros tomaron ventaja de los patrones de enlace de hidrógeno que son diferentes a los de pares Watson-Crick canónicos, cuyo más notable ejemplo es el par iso-C:iso-G. Ver, e.g., Switzer et al., (1989) J. Am. Chem. Soc ¦ 111:8322; y Piccirilli et al., (1990) Mature 343:33; Kool (2000) Curr. Opin. Chem. Biol . 4:602. Estas bases en general no hacen pares en algún grado con las bases naturales y no pueden repetirse de manera enzimática. Koll y colaboradores demostraron que las interacciones de empaque hidrófobo entre las bases pueden reemplazar el enlace de hidrógeno para conducir la formación de un par base. Ver, Kool (2000) Curr. Opin. Chem. Biol. 4:602; y Guckian y Kool (1998) Angew. Chem. Int. Ed. Engl. 36, 2825. En un esfuerzo por desarrollar un par base que satisfaga todos los requerimientos anteriores, Schultz, Romesberg y colaboradores han sintetizado y estudiado sistemáticamente una serie de bases hidrófobas no naturales. Se encontró que un auto-par PICS:PICS es más estable que los pares base naturales, y puede incorporarse eficientemente en el ADN mediante un fragmento Klenow de ADN polimerasa 1 de Escherichia coli (KF) . Ver, e.g., McMinn et al., (1999) J. Am. Chem. Soc . 121:11586; y Ogawa et al., (2000) J. Am. Chem. Soc. 122:3274. Un auto-par 3MN: 3MN puede sintetizarse mediante KF eficiente y selectivamente suficiente para la función biológica. Ver, e.g., Ogawa et al., (2000) ) J. Am. Chem. Soc. 122:8803. Sin embargo, ambas bases actúan como un exterminador de cadena para la repetición adicional. Se ha desarrollado recientemente una ADN polimerasa mutante que puede utilizarse para repetir el auto-par PICS. Adicionalmente, puede repetirse un auto-par 7AI. Ver e.g., Tae et al., (2001) ) J. Am. Chem. Soc. 123:7439. También se ha desarrollado un nuevo par de metalobase, Dipic:Py, que forma un par estable al enlazar Cu(II) . Ver, Meggers et al., (2000) ) J. Am. Chem. Soc. 122:10714. Debido a que los codones extendidos y los codones no naturales son intrínsecamente ortogonales a los codones naturales, los métodos de la invención pueden tomar ventaja de esta propiedad para generar ARJXTts ortogonales para ellos. También puede utilizarse un sistema de paso de traducción para incorporar un aminoácido no natural en un polipéptido deseado. En un sistema de paso de traducción, se inserta una secuencia grande en un gen pero no se traslada en la proteína. La secuencia contiene una estructura que sirve como clave para inducir que el ribosoma pase sobre la secuencia y resuma la traducción en la corriente descendente de la inserción.
AMINOÁCIDOS NO NATURALES Como se utiliza en la presente, un aminoácido no natural se refiere a cualquier aminoácido, aminoácido modificado, o análogo de aminoácido diferente de selenocisteina y/o pirrolisina y los siguientes veinte aminoácidos alfa genéticamente codificados; alanina, arginina, asparagina, ácido aspártico, cisteina, glutamina, ácido glutámico, glicina, histidina, isoleucina, leucina, lisina, metionina, fenilalanina, prolina, serina, treonina, triptofan, tirosina, valina. La estructura genérica de un aminoácido alfa se ilustra mediante la Fórmula I : I Un aminoácido no natural es típicamente cualquier estructura que tiene la Fórmula I en donde el grupo R es cualquier sustituyente diferente del utilizado en los veinte aminoácidos naturales. Ver, e.g., Biochemistry por L. Stryer, 3a ed., 1988, Freeman and Company, New York, para estructuras de los veinte aminoácidos naturales. Nótese que, los aminoácidos no naturales de la invención pueden ser compuestos de origen natural diferentes a los veinte aminoácidos alfa anteriores.
Debido a que los aminoácidos no naturales de la invención típicamente difieren de los aminoácidos naturales en la cadena lateral, los aminoácidos no naturales forman enlaces amida con otros aminoácidos, e.g., naturales o no naturales, de la misma manera en la cual se forman en proteínas de origen natural. Sin embargo, los aminoácidos no naturales tienen grupos de cadena lateral que los distinguen de los aminoácidos naturales. Por ejemplo, en la Fórmula I comprende opcionalmente, alquil-, aril-, ceto-, azido-, hidroxil-, hidrazina-, ciano-, halo-, hidrazida, alquenilo, alquinilo, éter, tiol, seleno-, sulfonil-, borato, boronato, fosfo, fosfono, fosfina, heterocíclico, enona, imina, aldehido, éster, tioácido, hidroxilamina, amina, y lo similar, o cualquier combinación de los mismos. Otros aminoácidos no naturales de interés incluyen, pero no se limitan a, aminoácidos que comprenden un reticulador fotoactivable, aminoácidos marcados por giro; aminoácidos fluorescentes; aminoácidos de enlace metálico; aminoácidos que contienen metal; aminoácidos radiactivos; aminoácidos con nuevos grupos funcionales; aminoácidos que interactúan de manera covalente o no covalente con otras moléculas; aminoácidos foto encasillados y/o fotoisomerizables; aminoácidos que contienen biotina o análogo de biotina; aminoácidos que contienen ceto; aminoácidos que comprenden polietilen glicol o poliéter; aminoácidos sustituidos con un átomo pesado; aminoácidos químicamente divisibles o fotodivisibles; aminoácidos con una cadena lateral alargada en comparación con los aminoácidos naturales (e.g., poliéteres o hidrocarburos de cadena larga, e.g., mayores que aproximadamente 5, mayores que aproximadamente 10 carbonos, etc,); aminoácidos que contienen azúcar enlazado a carbono; aminoácidos activos redox; aminoácidos que contienen amino tio ácidos; y aminoácidos que contienen uno o más residuos tóxicos. En algunas modalidades, los aminoácidos no naturales tienen un reticulador fotoactivable que se utiliza, e.g., para enlazar una proteína a un soporte sólido. En una modalidad, los aminoácidos no naturales tienen un residuo sacárido unido a la cadena lateral de aminoácido (e.g., aminoácidos glicosilados) y/o otra modificación carbohidrato. Adicionalmente a los aminoácidos no naturales que contienen nuevas cadenas laterales, los aminoácidos no naturales también comprenden opcionalmente estructuras modificadas, e.g., como se ilustra mediante las estructuras de las Fórmulas II y III: ? - - en donde Z comprende típicamente, OH, H2, SH, NH-R' , o S-R' ; X y, Y, que pueden ser el mismo o diferente, comprenden típicamente S u 0, y R y R' , que son opcionalmente el mismo o diferente, se seleccionan típicamente de la misma lista de constituyentes para el grupo R descrito anteriormente para los aminoácidos no naturales que tienen la Fórmula I así como hidrógeno. Por ejemplo, los aminoácidos no naturales de la invención comprenden opcionalmente sustituciones en el grupo amino o carboxilo como se ilustra por las Fórmulas II y III. Los aminoácidos no naturales de este tipo incluyen, pero no se limitan a, ácidos a-hidroxi, a-tioácidos, a-aminotiocarboxilatosa, e-g./ con cadenas laterales correspondientes a los veinte aminoácidos naturales comunes o cadenas laterales no naturales. Adicionalmente, las sustituciones en el a-carbono incluyen opcionalmente aminoácidos L, D, o a-a-disustituidos tales como D-glutamato, D-alanina, D-metil-O-tirosina, ácido aminobutírico y lo similar. Otras alternativas estructurales incluyen aminoácidos cíclicos, tales como análo'gos de prolina así como análogos de prolina de anillo de 3, 4, 6, 7, 8, y 9 miembros, aminoácidos ß y, ? tales como /3-alanina y ácido ?-amino - - butírico . Por ejemplo, muchos aminoácidos no naturales se basan en aminoácidos naturales tales como tirosina, glutamina, fenilalanina y lo similar. Los análogos de tirosina incluyen tirosinas para-sustituidas, tirosinas orto-sustituidas, y tirosinas meta sustituidas, en donde la tirosina sustituida comprende, e.g., un grupo ceto (e.g., un grupo acetilo) , un grupo benzoilo, un grupo amino, una hidrazina, una hidroxilamina, un grupo tiol, un grupo carboxi, un grupo isopropilo, un grupo metoxi, un hidrocarburo C6-C2o de cadena recta o ramificada, un grupo nitro, un grupo alquinilo o lo similar. Adicionalmente, también se contemplan anillos arilo sustituidos múltiples. Los análogos de glutamina de la invención incluyen, pero no se limitan a derivados a-hidroxi, derivados 7- sustituidos, derivados cíclicos, y derivados de glutamina amida sustituidos. Ejemplos de análogos de fenilalanina incluyen, pero no se limitan a fenilalaninas para-sustituidas, fenilalaninas orto-sustituidas y fenilalaninas meta sustituidas, en donde el sustituyente comprende e.g., un grupo hidroxi, un grupo metoxi, un grupo metilo, un grupo alilo, un aldehido, un azido, un yodo, un bromo, un grupo ceto (e.g., un grupo acetilo), un benzoilo, un grupo alquinilo o lo similar. Ejemplos específicos de aminoácidos no naturales incluyen. , pero no se limitan a, un p-acetil-L- - - fenilalanina, un p-propargiloxifenilalanina, un O-metil-L-tirosina, un L-3- (2-naftil) alanina, un 3-metil-fenilalanina, un 0-4-alil-L-tirosina, un 4-propil-L-tirosina, un tri-0-acetil-GlcNAcjS-serina, un L-Dopa, una fenilalanina fluorinada, un isopropil-L-fenilalanina, un p-azido-L-fenilalanina, un p-acil-L-fenilalanina, un p-benzoil-L-fenilalanina, un L-fosfoserina, un fosfonoserina, un fosfonotirosina, un p-yodo-L-fenilalanina, un p-bromofenilalanina, un p-amino-L-fenilalanina, y un isopropil-L-fenilalanina, y lo similar. Ejemplos de estructuras de aminoácidos no naturales se ilustran en la Figura 7, Panel B y Figura 11. Estructuras adicionales de una variedad de aminoácidos no naturales se proporcionan, por ejemplo, en las Figuras 16, 17, 18, 19, 26, y 29 de la WO 2002/085923 titulada "In vivo incorporation of unnatural amino acids" . Ver, también la figura 1 estructuras 2-5 de Kiick et al., (2002) Incorporation of azides into recombinant proteins for chemoselective modification by the Staudinger ligation, PNAS 99:19-24, para análogos de metionina adicionales. En una modalidad, se proporcionan composiciones que incluyen un aminoácido no natural (tal como p- (propargiloxi) -fenilalanina) . También se proporcionan varias composiciones que comprenden p- (propargiloxi) -fenilalanina y e.g., proteínas y/o células. En un aspecto, una composición que incluye el aminoácido no natural p- (propargiloxi) - - - fenilalanina incluye además un ARNt ortogonal . El aminoácido no natural puede enlazarse (e.g., de manera covalente) al ARNt ortogonal , e.g., enlazado de manera covalente al ARNt ortogonal a través de un enlace amino-acilo, enlazado de manera covalente a un 3' OH o a un 2'OH de un azúcar de terminación ribosa del ARNt ortogonal, etc. Los residuos químicos a través de aminoácidos no naturales que pueden incorporarse en proteínas ofrecen una diversidad de ventajas y manipulaciones de la proteína. Por ejemplo, la reactividad única de un grupo ceto funcional permite la modificación selectiva de proteínas con cualquier número de reactivos que contienen hidrazina o hidroxilamina in vitro e in vivo. Por ejemplo, un aminoácido no natural de átomo pesado puede ser útil para mostrar datos de estructura en rayos x. La introducción específica en el sitio de átomos pesados utilizando aminoácidos no naturales, proporciona también selectividad y flexibilidad para seleccionar posiciones para los átomos pesados. Los aminoácidos no naturales fotorreactivos (e.g., aminoácidos con cadenas laterales benzofenona y arilazidas (e.g. , fenilazida) , por ejemplo, permiten la foto reticulación eficiente in vivo e in vitro de proteínas. Ejemplos de aminoácidos no naturales fotorreactivos incluyen, pero no se limitan a, e.g., p-azido-fenilalanina y p-benzoil-fenilalanina . La proteína con los aminoácidos no naturales fotorreactivos puede entonces - - reticularse a voluntad mediante la excitación del grupo fotorreactivo proporcionando control temporal (y/o espacial) . En un ejemplo, el grupo metilo de un aminoácido no natural puede sustituirse con uno marcado isotópicamente e.g., un grupo metilo, como sonda de la estructura y dinámica local e.g., con el uso de resonancia magnética nuclear y espectroscopia de vibración. Los grupos funcionales alquinilo o azido por ejemplo, permiten la modificación selectiva de proteínas con moléculas a través de una reacción de cicloadición [3+2] . Síntesis Química de Aminoácidos no Naturales Muchos de los aminoácidos no naturales proporcionados anteriormente se encuentran disponibles comercialmente, e.g., de Sigma (EUA) o Aldrich (Milwaukee, WI, EUA) . Aquellos que no se encuentran disponibles comercialmente se sintetizan opcionalmente como se provee en la presente o como se provee en diversas publicaciones o utilizando métodos estándar conocidos por los expertos en la técnica. Por ejemplo, técnicas de síntesis orgánica, ver, e.g., Organic Chemistry por Fessendon y Fessendon, (1982, Segunda edición, Willard Grant Press, Boston, Mass) ; Advanced Organic Chemistry por March (Tercera edición, 1985 Wiley & Sons New York) ; y Advanced Organic Chemistry por Carey y Sundberg (Tercera edición, Partes A y B, 1990, Plenum Press, New York) . Publicaciones adicionales que describen la - - síntesis de aminoácidos no naturales incluyen, e.g., WO 2002/085923 titulada "In vivo incorporation of unnatural amino acids"; Matsoukas et al., (1995), J. Med. Chem. 38, 4660-4669; King F.E. & idd D. A. A. (1949) A new synthesis of glutamine and of y-dipeptides of glutamic acid from phthylated intermediates, J. Chem Soc. 3315-3319; Friedman, O. M. & Chatterrji, (1959) Sinthesis of derivatives of glutamine as model substrates for anti-tumor agents J. Am. Chem. Soc. 81-3750-3752; Craig J. C. et al., (1988), Absolute configuration of the enantiomers of 7-chloro.4 [ [4- (dietilamino) -1-metilbutil]amino]quinoline (Chloroquine) , J. Org. Chem. 53:1167-1170; Azoulay, M. Vilmont, M. & Frappier, F. (1991) Glutamine analogues as potential Antimalarials, Eur. J. Med. Chem. 26 201-5; oskinen, A. M. P. & Rapoport, H. (1989) Sinthesis of 4-substituted prolines as confor ationally constrained amino acid analogues J. Org . Chem. 54, 1859-1866; Christie, B. D. Y Rapoport H. (1985) Synthesis of optically puré pipecolates from L-asparagine. Aplication to the total synthesis of (+) -apovincamine through amino acid decarbonilation and iminium ion cyclization J. Org. Chem. 1989:1859-1866; Barton et al., (1987) Synthesis of novel a-amino acids and derivatives using radical chemistry: Synthesis of L- and D-a-amino adipic acids L-a-aminopimelic acid and appropriate unsaturated derivatives, Tetrahedron Lett . 43:4297-4308; y Subasinghe et al., (1992) Quisqualic - - acid analoguGS : synthesis of beta-heterocyclic. 2-aminopropanoic acid derivatives and their activíty at a novel quisgualate-sensitized site, J. Med. Chem. 35:4602-7. Ver, también, solicitud de patente titulada "Protein Arrays" , número de minuta de abogado PlOOlUSOO presentada en Diciembre 22, 2002. En un aspecto de la invención, se proporciona un método para sintetizar un compuesto de p- (propargiloxi) -fenilalanina . El método comprende, e.g., (a) suspender N-ter-butoxicarbonil-tirosina y K2C03 en DMF anhidro; (b) agregar bromuro de propargilo a la mezcla de reacción de (a) y alquilatar el grupo hidroxilo y carboxilo, dando como resultado un compuesto intermedio protegido que tiene la estructura : y (c) mezclar el compuesto intermedio protegido con HC1 anhidro en MeOH y desproteger el residuo amina, con lo cual se sintetiza el compuesto de p- (propargiloxi) -fenilalanina . En una modalidad. El método comprende además (d) disolver el HCl p- (propargiloxi) -fenilalanina en NaOH acuoso y MeOH y agitar a temperatura ambiente; (e) ajustar el pH a un pH de 7; y (f) precipitar el compuesto de p- (propargiloxi) - - - fen.ilalaniña . Ver e.g., la síntesis de propargiloxifenilalanina en el Ejemplo 4 en la presente. Absorción celular de aminoácidos no naturales La absorción de aminoácido no natural mediante una célula eucariótica es una cuestión típicamente considerada al diseñar y seleccionar aminoácidos no naturales, e.g., para incorporación en una proteína. Por ejemplo, la alta densidad de carga de los a-aminoácidos sugiere que es improbable que estos compuestos sean de célula permeable. Los aminoácidos naturales se absorben en la célula eucariótica a través de una colección de sistemas de transporte en base a proteínas. Puede efectuarse una exploración rápida que establece cuáles aminoácidos no naturales, si existen, se absorben por las células. Ver, e.g., los análisis de toxicidad e.g., en la solicitud titulada "Protein Arrays" , número de minuta de abogado P1001USOO presentada en Diciembre 22, 2002; y Liu, D. R. & Schultz, P. G. (1999) Progress toward the evolution of an organista with an expanded genetic code PNAS United States 96:4780-4785. Aunque la absorción se analiza fácilmente con diversos análisis, una alternativa para diseñar aminoácidos no naturales que son dóciles a las trayectorias de absorción celular es proporcionar trayectorias biosintéticas para crear aminoácidos in vivo. Biosíntesis de Aminoácidos no naturales Existen ya muchas trayectorias biosintéticas en - - células para la producción de aminoácidos y otros compuestos. Aunque puede no existir en la naturaleza un método biosintético para un aminoácido no natural particular, e.g., en una célula eucariótica, la invención proporciona tales métodos. Por ejemplo, las trayectorias biosintéticas para aminoácidos no naturales se generan opcionalmente en una célula huésped agregando nuevas enzimas o modificando las trayectorias de la célula huésped existentes. Las nuevas enzimas adicionales son opcionalmente enzimas de origen natural o enzimas desarrolladas artificialmente. Por ejemplo la biosintesis de p-aminofenilala iña (presentada en un ejemplo en la WO 2002/085923 titulada ttIn vivo incorporation of unnatural amino acids") se basa en la adición de una combinación de enzimas conocidas provenientes de otros organismos . Los genes para estas enzimas pueden introducirse en una célula eucariótica transformando la célula con un plásmido que comprende los genes. Los genes, al expresarse en la célula, proporcionan una trayectoria enzimática para sintetizar el compuesto deseado. Ejemplos de los tipos de enzimas que se agregan opcionalmente, se proporcionan en los ejemplos abajo. Las secuencias de enzimas adicionales se encuentran e.g., en el Genbank. Las enzimas desarrolladas artificialmente también se agregan en una célula de la misma manera. De este modo, la maquinaria celular y los recursos de una célula se manipulan para producir aminoácidos no - - naturales . Se encuentran disponibles diversos métodos para producir nuevas enzimas para uso en trayectorias biosintéticas o para la evolución de trayectorias existentes. Por ejemplo la recombinación recursiva, e.g., como se desarrolló por Maxygen, Inc. (disponible en la red mundial en www.maxygen.com), se utiliza opcionalmente para desarrollar nuevas enzimas y trayectorias. Ver, e.g., Stemmer (1994), Rapíd evolution of a protein in vitro by DNA shuffling, Mature 370 (4)_389-391; y Stemmer (1994), DNA shuffling by random fragmentation and reassembly: In vitro recombination for molecular evolution Proc . Nati. Acad. Sci . EUA 91:10747-10751. De manera similar, el DesignPath™ desarrollado por Genencor (disponible en la red mundial en genencor.com) se utiliza opcionalmente para la fabricación de trayectoria metabólica e.g., para fabricar una trayectoria para crear 0-metil-L-tirosina en una célula. Esta tecnología reconstruye trayectorias existentes en organismos huésped utilizando una combinación de nuevos genes, e.g., identificados a través de genómica funcional, y diseño y evolución molecular. Diversa Corporation (disponible en la red mundial en diversa.com) proporciona también tecnología para la selección rápida en bibliotecas de genes y trayectorias de gen, e.g., para crear nuevas trayectorias . Típicamente, el aminoácido no natural producido con - - una trayectoria biosintética fabricada de la invención se produce en una concentración suficiente para la eficiente biosintesis de proteínas, e.g., una cantidad celular natural, pero no a grado tal que afecte la concentración de los otros aminoácidos o agote los recursos celulares . Las concentraciones típicas producidas in vivo de esta manera son de aproximadamente 10 mM hasta aproximadamente 0.05 mM. Una vez que la célula se transforma con un plásmido que comprende los genes utilizados para producir las enzimas deseadas para una trayectoria específica, y se genera un aminoácido no natural, se utilizan opcionalmente las selecciones in vivo para optimizar adicionalmente la producción del aminoácido no natural tanto para la síntesis de proteína ribosomal como para el crecimiento celular. POLIPÉPTIDOS CON AMINOÁCIDOS NO NATURALES Las proteínas o polipéptidos de interés con al menos un aminoácido no natural son una característica de la invención. La invención incluye también polipéptidos o proteínas con al menos un aminoácido no natural producido utilizando las composiciones y métodos de la invención. También puede encontrarse presente un excipiente (e.g., un excipiente farmacéuticamente aceptable) con la proteína. Al producir proteínas o polipéptidos de interés con al menos un aminoácido no natural en células eucarióticas, las proteínas o polipéptidos incluirán típicamente - - modificaciones eucarióticas de post-traducción. En ciertas modalidades, una proteína incluye al menos un aminoácido no natural y se efectúa al menos una modificación posttraducción in vivo mediante una célula eucariótica, en donde la modificación post-traducción no se efectúa mediante una célula procariótica. Por ejemplo, la modificación post-traducción incluye, e.g., acetilación, acilación, modificación de lípidos, palmitoilación, adición de palmitato, fosforilación, modificación de enlace de glicolípidos, glicosilación y lo similar. En un aspecto, la modificación post-traducción incluye la unión de un oligosacárido (e.g., (GlcNAc-Man) 2-Man-GlcNAc-GlcNAc) ) a una asparagina mediante un enlace de GlcNAc-asparagina. Ver también Tabla 7, que lista algunos ejemplos de oligosacáridos N-enlazados de proteínas eucarióticas (también pueden encontrarse presentes residuos adicionales que no se muestran) . En otro aspecto, la modificación post-traducción incluye la unión de un oligosacárido (e.g., Gal-GalNAc, Gal-GlcNAc, etc.) a una serina o treonina mediante un enlace GalNAc-serina, o GalNAc-treonina, o un enlace GlcNAc-serina o GlcNAc-treonin .
- - TABLA 7: EJEMPLOS DE OLIGOSACÁRIDOS A TRAVÉS DE ENLACE GlcNAc Aún en otro aspecto, la modificación post- traducción incluye procesamiento proteolítico de precursores (e.g., precursor de calcitonina, precursor del péptido relacionado con el gen de calcitonina, hormona preproparatiroidea, preproinsulina, proinsulina, prepro- opiomelanocirtina, pro-opiomelanocortina y lo similar) , ensamblado en una proteina de multisubunidad o ensamblado macromolecular, traducción a otro sitio en la célula (e.g., a organelos, tales como retículo endoplásmico, el aparato golgi, el núcleo, liposomas, peroxisomas, mitocondrio, cloroplastos, vacuolas, etc., a través de la trayectoria - - secretoria) . En ciertas modalidades, la proteína comprende una secuencia de secreción o localización, una marca de epítope, una marga FLAG, una marca de polihistidina, una fusión GST, o lo similar. Una ventaja de un aminoácido no natural es que presenta residuos químicos adicionales que pueden utilizarse para agregar moléculas adicionales . Estas modificaciones pueden efectuarse in vivo en una célula eucariótica o in vitro. De este modo, en ciertas modalidades, la modificación post-traducción es -a través del aminoácido no natural. Por ejemplo, la modificación post-traducción puede ser a través de una reacción nucleofílica-electrofílica. La mayoría de las reacciones actualmente utilizadas para la modificación selectiva de proteínas implican la formación de un enlace covalente entre socios de reacción nucleofílicos o electrofílicos, e.g., la reacción de a-halocetonas con las cadenas laterales histidina o cisteína. La selectividad en estos casos se determina por el número y accesibilidad de los residuos nucleofílicos en la proteína. En las proteínas de la invención, pueden utilizarse otras reacciones más selectivas tales como la reacción de un aminoácido ceto no natural con hidrazidas o compuestos aminooxi, in vitro e in vivo. Ver, e.g., Cornish et al., (1996) Am. Chem. Soc . 118:8150-8151; Mahal et al., (1997) Science 276:1125-1128; Wang et al., (2001) Science 292:498-500; Chin et al., (2002) - - Am Chem. Soc . 124:9026-9027; Chin et al . , (2002) Proc. Matl . Acad. Sci. 99:11020-11024; Wang et al . , (2003) Proc . Natl . Acad Sci. 100:56-61; Zhang- et al . , (2003) Biochemistry 42:6735-6746; y Chin et al., (2003) Science en impresión. Esto permite el marcado selectivo de virtualmente cualquier proteína con un huésped de reactivos incluyendo fluoróforos, agentes de reticulación, derivados sacárido, y moléculas citotóxicas. Ver también, e.g., solicitud de patente USSN 10/686,944 titulada wGlycoprotein synthesis" presentada en Octubre 15, 2003. Las modificaciones de post-traducción, e.g., a través de un aminoácido azido, también pueden efectuarse a través de ligación Staudinger (e.g., con reactivos de triarilfosfina) . Ver, e.g., Kiick et al., (2002) Incorporation of azides into recombinant proteins for chemosel ctive modification by the Staudinger ligation PNAS 99:19-24. Esta invención proporciona otro método altamente eficiente para la modificación selectiva de proteínas, que implica la incorporación genética de aminoácidos no naturales e.g., conteniendo un residuo azida o alquinilo (ver, e.g., 2 y 1 de la Figura 11) en proteínas en respuesta a un codón selector. Estas cadenas laterales de aminoácido pueden modificarse, e.g., por reacción Huisgen de cicloadición [3+2] (ver, e.g., Padwa, A. en Comprehensive Organic Synthesis, Vol. 4 (1991) Ed. Trost, B. M. Pergamon, Oxford, p. 1069- - 17 - 1109; y Huisgen . en 1,3-Dipolar Cycloaddition Chemistry (1984) Ed. Padwa, A. Wiley, New York, p. 1-176) con e.g., derivados de alquinilo o azida, respectivamente. Ver, e.g., Figura 16. Debido a que este método implica la cicloadición en lugar de una sustitución nucleofílica, las proteínas pueden modificarse con una selectividad extremadamente alta. Esta reacción puede llevarse a cabo a temperatura ambiente en condiciones acuosas con excelente regioselectividad (1,4>1,5) mediante la adición de cantidades catalíticas de sales de Cu(I) a la mezcla de reacción. Ver, e.g., Tornoe et al., (2002) Org. Chem. 67:3057-3064; y Rostovtsev et al., (2002) Angew. Chem. Int. Ed. 41:2596-2599. Otro método que puede utilizarse es el intercambio de ligante en un compuesto biarsénico con un motivo tetracisteína, ver, e.g., Griffin et al., (1998) Science 281 : 269-272. Una molécula que puede agregarse a una proteína de la invención a través de una cicloadición [3+2] incluye virtualmente cualquier molécula con un derivado azido o alquinilo. Ver, e.g., Ejemplo 3 y 5 en la presente. Tales moléculas incluyen, pero no se limitan a, colorantes, fluoróforos, agentes de reticulación, derivados sacárido, polímeros (e.g., derivados de polietilen glicol) , foto reticuladores, compuestos citotóxicos, marcas de afinidad, derivados de biotina, resinas, perlas, una segunda proteína o polipéptido (o más), polinucleótido (s) (e.g., ADN, ARN, - - etc.), queladores metálicos, cofactores, ácidos grasos, carbohidratos, y lo similar. Ver, e.g., Figuras 13A y Ejemplo 3 y 5 en la presente. Estas moléculas pueden agregarse a un aminoácido no natural con un grupo alquinilo, e.g., p-propargiloxifenilalanina, o un grupo azido, e.g., p-azido-fenilalanina, respectivamente-. Por ejemplo, ver Figura 13B y Figura 17A. En otro aspecto, la invención proporciona composiciones que incluyen tales moléculas y métodos para producir estas moléculas, e.g., colorantes azido (tales como los mostrados en la estructura química 4 y en la estructura química 6), un alquinil polietilen glicol (e.g., como se muestra en la estructura química 7) , en donde n es un entero entre, e.g., 50 y 10,000,. 75 y 5,000, 100 y 2,000, 100 y 1,000, etc. en una modalidad de la invención, el alquinil polietilen glicol tiene un peso molecular de e.g., aproximadamente 5,000 hasta aproximadamente 100,000 Da, aproximadamente 20,000 hasta aproximadamente 50,000 Da, aproximadamente 20,000 hasta aproximadamente 10,000 Da (e.g., 20, 000 Da) , etc. 4 - - También se proporcionan diversas composiciones que comprenden estos compuestos e.g., con proteínas y células. En un aspecto de la invención, una proteína que comprende un colorante azido (e.g., de la estructura química 4 o de la estructura química 6) incluye además al menos un aminoácido no natural (e.g., un aminoácido alquinilo), en donde el colorante azido se une al aminoácido no natural a través de una cicloadición [3+2] . En una modalidad, una proteína comprende el alquinilo polietilen glicol de la estructura química 7. En otra modalidad, la composición incluye además al menos un aminoácido no natural (e.g., un aminoácido azido) en donde el alquinilo polietilen glicol se une a un aminoácido no natural a través de una cicloadición [3+2] . También se proporcionan métodos para sintetizar colorantes azido. Por ejemplo, un método tal comprende: (a) proporcionar un compuesto colorante que comprende un residuo sulfonil haluro; (b) calentar el compuesto colorante a temperatura ambiente en presencia de 3-azidopropilamina y trietilamina y acoplar un residuo amina de la 3-azidopropilamina en la posición haluro del compuesto colorante, con lo cual se sintetiza el colorante azido. En una modalidad ejemplar, el compuesto colorante comprende dansil cloruro, y el colorante azido comprende la composición de la estructura química 4. En un aspecto, el método comprende además purificar el colorante azido de la mezcla de reacción. Ver, e.g., Ejemplo 5 en la presente. En otro ejemplo, el método para sintetizar un colorante azido comprende (a) proporcionar un compuesto colorante que contiene amina; (b) combinar el compuesto colorante que contiene amina con una carbodiimida y ácido 4- (3-azidopropilcarbamoil) -butírico en un solvente adecuado, y acoplar un grupo carbonilo del ácido al residuo amina del compuesto colorante, con lo cual se sintetiza el colorante azido. En una modalidad, la carbodiimina comprende hidrocloruro de l-etil-3- (3-dimetilaminopropil) carbodiimida (EDCI) . En un aspecto, el colorante que contiene amina comprende fluoresceinamina, y el solvente adecuado comprende piridina. Por ejemplo, el colorante que' contiene amina comprende opcionalmente fluoresceinamina y el colorante azido comprende la composición de la estructura química 6. En una - - modalidad, el método comprende además (c) precipitar el colorante azido; (d) lavar el precipitado con HCl; (e) disolver el precipitado lavado en EtOAc; y (f) precipitar el colorante azido en hexanos . Ver, e.g., Ejemplo 5 en la presente. También se proporcionan métodos para sintetizar un propargil amida polietilen glicol . Por ejemplo, el método comprende hacer reaccionar propargilamina con polietilen glicol (PEG) -éster de hidroxisuccinimida en un solvente orgánico (e.g., CH2C12) a temperatura ambiente, dando como resultado el propargil amida polietilen glicol de la estructura química 7. En una modalidad, el método comprende además precipitar el propargilamida polietilen glicol utilizando etil acetato. En un aspecto, el método incluye además recristalizar el propargilamida polietilen glicol en metanol; y secar el producto bajo un vacío. Ver, e.g. , Ejemplo 5 en la presente. La célula eucariótica de la invención proporciona la capacidad para sintetizar proteínas que comprenden aminoácidos no naturales en grandes cantidades útiles. En un aspecto, la composición incluye opcionalmente e.g., al menos 10 micro gramos, al menos 50 micro gramos, al menos 75 micro gramos, al menos 100 micro gramos, al menos 200 micro gramos, al menos 250 micro gramos, al menos 500 micro gramos, al menos 1 miligramo, al menos 10 miligramos o más de la - - proteína que comprende un aminoácido no natural, o una cantidad que puede lograrse con métodos de producción de proteínas in vivo (se proporcionan en la presente detalles de la producción y purificación de proteina recombinante) . En otro aspecto, la proteína opcionalmente se encuentra presente en la composición en una concentración de e.g., al menos 10 micro gramos de proteína por litro, al menos 50 micro gramos de proteína por litro, al menos 75 micro gramos de proteína por litro, al menos 100 micro gramos de proteína por litro, al menos 200 micro gramos de proteína por litro, al menos 250 micro gramos de proteína por litro, al menos 500 micro gramos de proteína por litro, al menos 1 miligramo de proteína por litro o al menos 10 miligramos de proteína por litro o más, e.g., en un lisato celular, un amortiguador, un amortiguador farmacéutico, u otra suspensión líquida (e.g., en un volumen de e.g., cualquiera de aproximadamente 1 ni hasta aproximadamente 100 L) . Una característica de la invención es la producción de grandes cantidades (e.g., mayores que las típicamente posibles con otros métodos, e.g., traducción in vitro) de una proteína en una célula eucariótica incluyendo al menos un aminoácido no natural . La incorporación de un aminoácido no natural puede efectuarse, e.g., para diseñar cambios en una estructura de proteína y/o funcionar, e.g., para cambiar el tamaño, la acidez, nucleofilicidad, enlace de hidrógeno, hidrofobicidad, - - accesibilidad de sitios objetivó de proteasa, la dirección hacia un residuo (e.g. , para una disposición de proteína) , etc. Las proteínas que incluyen un aminoácido no natural pueden tener propiedades catalíticas o físicas aumentadas o incluso completamente nuevas. Por ejemplo, las siguientes propiedades se modifican opcionalmente mediante la inclusión de un aminoácido no natural en una proteína: toxicidad, biodistribución, propiedades estructurales, propiedades espectroscópicas, propiedades químicas y/o fotoquímicas, capacidad catalítica, vida media (e.g., vida media en suero), capacidad para reaccionar con otras moléculas, e.g., de manera covalente o no covalente, y lo similar. Las composiciones que incluyen proteínas que incluyen al menos un aminoácido no natural son útiles, e.g., para nuevos (as) terapéuticos, diagnósticos, enzimas catalíticas, enzimas industriales, proteínas de enlace (e.g., anticuerpos), y e.g., para el estudio de la estructura y función de proteínas. Ver, e.g., Dougherty, (2000) Unatural amino acids as probes of protein structure and function, Current Opinión in Chemical Biology, 4:645-652. En un aspecto de la invención, la composición incluye al menos una proteína con al menos uno, al menos dos, al menos tres, al menos cuatro, al menos cinco, al menos seis, al menos siete, al menos ocho, al menos nueve, o al menos diez o más aminoácidos no naturales. Los aminoácidos - - no naturales pueden ser el mismo o diferentes, e.g., puede haber 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 o más sitios diferentes en la proteína que comprenden, 1, 2, 3, 4, 5, 6, 7, 8, 9, 19 o más aminoácidos no naturales diferentes. En otro aspecto, la composición incluye una proteína con al menos uno pero menos que todos, de un aminoácido particular presente en la protelna se sustituye con el aminoácido no natural . Para una proteína dada con más de uno de los aminoácidos no naturales, los aminoácidos no naturales pueden ser idénticos o diferentes (e.g., la proteína puede incluir dos o más tipos diferentes de aminoácidos no naturales, o puede incluir dos del mismo aminoácido no natural) . Para una proteína dada con más de uno de los aminoácidos no naturales, los aminoácidos no naturales pueden ser el mismo, diferente o una combinación de múltiples aminoácidos no naturales del mismo tipo con al menos un aminoácido no natural diferente. Esencialmente, cualquier proteína (o una porción de la misma) que incluye un aminoácido no natural (y cualquier ácido nucleico de codificación correspondiente, e.g., que incluye uno o más codones selectores) puede producirse utilizando las composiciones y métodos en la presente. No se hace ningún intento por identificar los cientos de miles de proteínas conocidas, de las cuales cualquiera puede modificarse para incluir uno o más aminoácidos no naturales, e.g., adaptando cualquier método de mutación disponible para - - incluir uno o más codones selectores apropiados en un sistema de traducción relevante. Los depositarios de secuencias comunes para proteínas conocidas incluyen GenBank, EMBL, DDBJ y el NCBI . Otros depositarios pueden identificarse fácilmente mediante búsqueda en la internet . Típicamente, las proteínas son e.g., al menos 60%, al menos 70%, al menos 75%, al menos 80%, al menos 90%, al menos 95% o al menos 99% o más idénticas a cualquier proteína disponible (e.g., una proteína terapéutica, una proteína diagnóstica, una enzima industrial, o porción de la misma y lo similar), y comprenden uno o más aminoácidos no naturales. Ejemplos de proteínas terapéuticas, diagnósticas y otras que pueden modificarse para comprender uno o más aminoácidos no naturales, incluyen, pero no se limitan a, e.g., antitripsina Alpha-1, angiostatina, factor antihemolítico, anticuerpos (se encuentran abajo detalles adicionales de anticuerpos) , apolipoproteína, apoproteína, factor atrial natriurético, polipéptido atrial natriurético, péptidos atriales, quimiosinas C-X-X, (e.g., T39765, NAP-2, ENA-78, Gro-a, Gro-b, Gro-c, IP-10, GCP-2, NAP-4, SDF-1, PF , MIG) , calcitonina, quimiosinas CC (e.g., proteína-1 quimioatrayente de monocito, proteína-2 quimioatrayente de monocito, proteína-3 quimioatrayente de monocito, proteína-1 alfa inflamatoria de monocito, proteína-1 beta inflamatoria de monocito, RA TES, 1309, R83915, R91733, HCC1, T58847, D31065, T64262) , ligante - - CD40, ligante c-kit, colágeno, factor de estimulación de colonia (CSF) , factor 5a de complemento, inhibidor de complemento, receptor 1 de complemento, citosinas, (e.g., péptido-78 epitelial de activación de neutrófilo, Groa/MGSA, GRO/?, GRO7, MIP-la, ???-?d, MCP-1) , factor de crecimiento epidérmico (EGF) , eritropoyetina ("EPO" que representa un objetivo preferido para la modificación mediante la incorporación de uno o más aminoácidos no naturales) , toxinas exfoliantes A y B, factor IX, factor VII, factor VIII, factor X, factor de crecimiento de fibroblasto (FGF) , fibrinógeno, fibronectina, G-CSF, GM-CSF, glucocerebrosidasa, gonadotropina, factores de crecimiento, proteínas Hedgehog, (e.g., Sonic, Indian, Desert) , hemoglobina, factor de crecimiento de hepatocito (HGF) , hirudina, albúmina de suero humana, insulina, factor de crecimiento similar a insulina (IGF), interferones, (e.g., IFN-a, IFW-/3, IFN-?) , interleucina, (e.g., IL-1, IL-2, IL-3, IL-4, IL-5, IL-6, IL-7 IL-8, IL-9, IL-10, IL-11, IL-12 etc.), factor de crecimiento de queratinocito (KGF) , lactoferrina, factor inhibidor de leucemia, luciferasa, neurturina, factor inhibidor de neutrófilo (NIF) , oncostatina M, proteína osteogénica, hormona paratiroidea, PD-EDSF, PDGF, hormonas péptido, (e.g., hormona de crecimiento humana) , pleyotropina, proteína A, proteína G, exotoxinas pirogénicas A, B o C, relaxina, renina, SCF, receptor I de complemento soluble, I-CAM 1 - - soluble, receptores de interleucina solubles (IL-1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15), receptor TNF soluble, somatomedina, somatostatina, somatotropina, estreptocinasa, superantígenos i.e., enterotoxinas de estafilococo, (SEA, SEB, SEC1, SEC2, SEC3 , SED, SEE) , superóxido dismutasa (SOD) , toxina de síndrome de choque tóxico (TSST-1) , timosina alfa 1, activador de tejido plasminógeno, factor beta de necrosis tumoral (TNF beta) , receptor del factor de necrosis tumoral (TMFR) , factor alfa de necrosis tumoral (TNF alfa) , factor de crecimiento endotelial vascular (VEGEF) , urocinasa, y muchas otras . Una clase de proteínas que puede prepararse utilizando las composiciones y métodos para la incorporación in vivo de aminoácidos no naturales descrita en la presente, incluye moduladores de transcripción o porciones de los mismos. Ejemplos de moduladores de transcripción incluyen genes y proteínas moduladoras de transcripción que modulan el crecimiento celular, la diferenciación, la regulación o lo similar. Los moduladores de transcripción se encuentran en procariotos, virus, y eucariotos, incluyendo hongos, plantas, levaduras, insectos, y animales, incluyendo mamíferos, que proporcionan un amplio rango de objetivos terapéuticos. Se apreciará que la expresión de los activadores de transcripción regula la transcripción mediante muchos mecanismos, e.g., mediante el enlace a receptores, - - estimulando una cascada de transducción de señal, regulando la expresión de los factores de transcripción, enlazando a promotores y aumentadores, enlazando a proteínas que se enlazan a promotores y aumentadores, desenrollando el ADN, dividiendo el pre-ARNm, poliadenilando el AR , y degradando ARN. Por ejemplo, las composiciones de proteina GAL4 o porciones de las mismas en una célula eucariótica también son una característica de la invención. Típicamente, la proteína GAL4 o porciones de la misma comprende al menos un aminoácido no natural. Ver también la sección en la presente titulada ¦"Aminoacil-ARNt sintetasas ortogonales" . Una clase de proteínas de la invención (e.g., proteínas con uno o más aminoácidos no naturales) incluye activadores de expresión tales como citosinas, moléculas inflamatorias, factores de crecimiento, sus receptores, y productos de oncógeno, e.g., interleucinas (e.g., IL-1, IL-2, IL-8, etc.), interferones, FGF, IGF-I, IGF-II, FGF, PDGF, TNF, TGF-a, TGF-b, EGF, KGF, SCF/c- it, CD40L/CD40, VLA-4/VCAM-I, ICAM-l/LFA-1 y hialurin/CD4 ; moléculas de transducción de señal y productos de oncógeno correspondientes, e.g., Mos, Ras, Raf y Met; y activadores y supresores de transcripción, e.g., p53, Tat, Fos, Myc, Jun, Myb, Reí y receptores de hormona esteroide tales como aquellos para estrógeno, progesterona, testosterona, aldoesterona, el ligante de receptor LDL y cortxcosterona.
- - También se proporcionan por la invención enzimas, (e.g., enzimas industriales), o porciones de las mismas con al menos un aminoácido no natural. Ejemplos de enzimas incluyen, pero no se limitan a, e.g., amidasas, racemasas de aminoácido, acilasas, dehalogenasas, dioxigenasas, diarylpropano peroxidasas, epimerasas, epoxi hidrolasas, esterasas, isomerasas, quinasas, glucosa isomerasas, glicosidasas , glicosil transferasas, haloperoxidasas, monooxigenasas (e.g., p450s) , lipasas, lignina peroxidasas, nitrilo hidratasas, nitrilasas, proteasas, fosfatasas, subtilisinas , transaminasa y nucleasas . Muchas de estas proteínas se encuentran disponibles comercialmente (ver, e.g., catálogo y lista de precios de Sigma BioSciences 2002) , y las secuencias y genes de proteínas correspondientes y, típicamente muchas variaciones de los mismos, son muy conocidos (ver, e.g., Genbank) . Cualquiera de ellas puede modificarse mediante la inserción de uno o más aminoácidos no naturales de acuerdo con la invención, e.g., para alterar la proteína con respecto a una o más propiedades terapéuticas, diagnósticas o enzimáticas de interés. Ejemplos de propiedades terapéuticamente relevantes incluyen, la vida media en suero, la vida media en almacén, estabilidad, inmunogenicidad, actividad terapéutica, detectabilidad (e.g., mediante la inclusión de grupos informantes (e.g., marcas o sitios de enlace de marca) en los aminoácidos no naturales) , reducción del LDS0 u otros efectos secundarios, capacidad para entrar al cuerpo a través del tracto gástrico (e.g., disponibilidad oral), o lo similar. Ejemplos de propiedades diagnósticas incluyen vida media en almacén, estabilidad, actividad diagnóstica, detectabilidad, o lo similar. Ejemplos de propiedades enzimáticas relevantes incluyen vida media en almacén, estabilidad, actividad enzimática, capacidad de producción o lo similar. También puede modificarse una variedad de otras proteínas para incluir uno o más aminoácidos no naturales de la invención. Por ejemplo, la invención puede incluir sustituir uno o más aminoácidos naturales en una o más proteínas vacunas con un aminoácido no natural e.g., en proteínas de hongos infecciosos, e.g., Aspergillus, especies Candida; bacterias, particularmente E. coli, que sirve como modelo de bacterias patógenas, así como bacterial médicamente importantes tales como Staphylococci (e.g., aureus) , o Streptococci (e.g., pneumoniae) ; protozoarios tales como sporozoo (e.g., Plasmodia) , rizópodos (e.g., Entamoeba) y flagelados (Trypanosoma, Leishmania, Trichomonas, Giardia, etc.); virus tales como virus ARN (+) (los ejemplos incluyen virus de viruela e.g., vaccinia; Picornavirus , e.g., polio; Togavirus e.g., rubella; Flavivirus e.g., HCV; y Coronavirus) , virus ARN (-) (e.g., Rhabdovirus e.g., VSV; Paramyxovimses e.g., RSV; Orthomyxovimses e.g., influenza; - - Bunyavirus; y Arenavirus) , virus ADNds (Reovirus, por ejemplo), virus ARN a ADN, i.e., Retrovirus, e.g., VIH y HTLV, y ciertos virus de ADN a ARN tales como Hepatitis B. Las proteínas relacionadas con la agricultura tales como proteínas resistentes a insectos (e.g., proteínas Cry) , enzimas de producción de almidones y llpidos, toxinas vegetales y de insectos, proteínas resistentes a toxinas, proteínas de destoxificación de mycotoxinas, enzimas de crecimiento vegetal, (e.g., Ribulosa 1, 5-bifosfato carboxilasa/oxigenasa, "RUBISCO")/ lipoxigenasa (LOX) , y fosafoenolpiruvato (PEP) carboxilasa, son también objetivos adecuados para la modificación del aminoácido no natural. La invención proporciona también métodos para producir en una célula eucariótica al menos una proteína que comprende al menos un aminoácidos no natural (y proteínas producidas mediante tales métodos) . Por ejemplo, un método incluye: hacer crecer, en un medio apropiado, una célula eucariótica que comprende un ácido nucleico que comprende al menos un codón selector y codifica para la proteína. La célula eucariótica comprende también: un ARNt ortogonal (O-ARNt) que funciona en la célula y reconoce el codón selector; y una aminoacil ARNt sintetasa ortogonal (0-RS) que preferentemente aminoacila el 0-ARNt con el aminoácido no natural , y el medio comprende un aminoácido no natural . En una modalidad el método incluye además - - incorporar en la proteína el aminoácido no natural, en donde el aminoácido no natural comprende un primer grupo reactivo; y poner en contacto la proteína con una molécula (e.g., un colorante, un polímero, e.g., un 'derivado de polietilen glicol, un foto reticulador, un compuesto citotóxico, una marca de afinidad, un derivado de biotina, una resina, una segunda proteína o polipéptido, un quelador metálico, un cofactor, un ácido graso, un carbohidrato, un polinucleótido (e.g., ADN, ARN, etc. y lo similar), que comprende un segundo grupo reactivo. El primer grupo reactivo reacciona con el segundo grupo reactivo para unir la molécula al aminoácido no natural por medio de una cicloadición [3+2] . En una modalidad, el primer grupo reactivo es un residuo alquinilo o azido, y el segundo grupo reactivo es un residuo azido o alquinilo. Por ejemplo, el primer grupo reactivo es el residuo alquinilo (e.g., en el aminoácido natural p-propargiloxifenilalanina) y el segundo grupo reactivo es el residuo azido. En otro ejemplo, el primer grupo reactivo es el residuo azido (e.g., en el aminoácido no natural p-azido-L-fenilalanina) y el segundo grupo reactivo es el residuo alquinilo . En una modalidad, la 0-RS aminoacila el 0-AR t con el aminoácido no natural al menos 50% tan eficientemente como la 0-RS que tiene una secuencia de aminoácidos e.g., como se describe en la SEQ ID NO: 86 o 45. En otra modalidad, el 0- - - ARNt comprende, se procesa a partir de, o se codifica por la SEQ ID NO: 65 o 64, o una secuencia de polinucleótidos complementaria de las mismas . Aún en otra modalidad, la O-RS comprende una secuencia de aminoácidos como se describe en cualquiera de las SEQ ID NO: 36-63 (e.g., 36-47, 48-63, o cualquier otro subconjunto de 36-63), y/o 86. * La proteína codificada puede comprender, e.g., una proteína terapéutica, una proteína diagnóstica, una enzima industrial o una porción de las mismas. Opcionalmente, la proteína que se produce mediante el método se modifica adicionalmente a través del aminoácido no natural. Por ejemplo, la proteína producida mediante el método se modifica opcionalmente mediante al menos una modificación posttraducción in vivo. Los métodos para producir una proteína moduladora de transcripción de filtración o selección también se proporcionan (y proteínas moduladores de transcripción de filtración o selección producidas por tales métodos) . Por ejemplo, un método incluye: seleccionar una primera secuencia de polinucleótidos, en donde la secuencia de polinucleótidos codifica para un dominio de enlace de ácido nucleico; y mutar la primera secuencia de polinucleótidos para incluir al menos un codón selector. Esto proporciona una secuencia de polinucleótidos de filtración o selección. El método incluye también: seleccionar una segunda secuencia de - - polinucleótidos, en donde la segunda secuencia de polinucleótidos codifica para un dominio de activación de transcripción; proporcionando una estructura que comprende la secuencia de polinucleótido de filtración o selección operablemente enlazada a la segunda secuencia de polinucleótidos; e introducir la estructura, un aminoácido no natural, una ARNt sintetasa ortogonal (O-RS) y un ARNt ortogonal (O-ARNt) , en una célula. Con estos componentes, la O-RS preferentemente aminoacila el O-ARNt con el aminoácido no natural y el O-ARNt reconoce el codón selector e incorpora el aminoácido no natural en el dominio de enlace de ácido nucleico, en respuesta al codón selector en la secuencia de polinucleótido de filtración o selección, con lo cual se proporciona la proteina moduladora de transcripción de filtración o selección. En ciertas modalidades, la proteína o polipéptido de interés (o una porción del mismo) en los métodos y/o composiciones de la invención se codifica por un ácido nucleico. Típicamente, el ácido nucleico comprende al menos un codón selector, al menos dos codones selectores, al menos tres codones selectores, al menos cuatro codones selectores, al menos cinco codones selectores, al menos seis codones selectores, al menos siete codones selectores, al menos ocho codones selectores, al menos nueve codones selectores, diez o más codones selectores.
- - Los genes que codifican para las proteínas o polipéptidos de interés pueden mutagenizarse utilizando métodos muy conocidos por el experto en la técnica y descritos en la presente bajo "Mutagenesis and other Molecular Biology Techniques" para incluir, e.g., uno o más codones selectores para la incorporación de un aminoácido no natural. Por ejemplo, un ácido nucleico para una proteína de interés se mutageniza para incluir uno o más codones selectores, proporcionando la inserción de uno o más aminoácidos no naturales. La invención incluye cualquier variante tal como e.g., mutante, versiones de cualquier proteína, e.g., que incluyen al menos un aminoácido no natural. De manera similar, la invención incluye también ácidos nucleicos correspondientes, i.e., cualquier ácido nucleico con uno o más codones selectores que codifican para uno o más aminoácidos no naturales . En una modalidad ejemplar, la invención proporciona composiciones (y composiciones producidas mediante los métodos de la invención) que incluyen un T r44, ArgllO TAG mutante de GAL4, en donde la proteína GAL4 incluye al menos un aminoácido no natural. En otra modalidad, la invención proporciona composiciones que incluyen un Trp33 TAG mutante de superóxido dismutasa humana (hSOD) , en donde la proteína hSOD incluye al menos un aminoácido no natural . Purificación de proteínas recombinantes que - - comprenden aminoácidos no naturales Las proteínas de la invención, e.g., proteínas que comprenden aminoácidos no naturales, anticuerpos para proteínas que comprenden aminoácidos no naturales, etc., pueden purificarse ya sea parcial o sustancialmente hasta homogenidad, de acuerdo con procedimientos estándar conocidos y utilizados por los expertos en la técnica. de acuerdo con esto, los polipéptidos de la invención pueden recuperarse y purificarse mediante cualquier número de métodos muy conocidos en la técnica, incluyendo, e.g., precipitación de sulfato de amonio o etanol, extracción ácida o de base, cromatografía de columna, cromatografía de columna de afinidad, cromatografía de intercambio de anión o catión, cromatografía de fosfocelulosa, cromatografía de interacción hidrófoba, cromatografía de hidroxilapatita, cromatografía de lectina, electroforesis de gel y lo similar. Pueden utilizarse etapas de re-duplicación de proteína, si se desea, para preparar proteínas maduras correctamente duplicadas. Puede emplearse cromatografía líquida de alto desempeño (HPLC) , cromatografía de afinidad u otros métodos adecuados en etapas finales de purificación si se desea una alta pureza. En una modalidad, los anticuerpos preparados contra aminoácidos no naturales (o proteínas que contienen aminoácidos no naturales) se utilizan como reactivos de purificación, e.g., para purificación en base a afinidad de - - proteínas que comprenden uno o más aminoácidos no naturales. Una vez purificados parcialmente o hasta homogenicidad, según se desee, los polipéptidos se utilizan opcionalmente e.g., como componentes de análisis, reactivos terapéuticos o como inmunógenos para la producción de anticuerpos . En adición a otras referencias anotadas en la presente, son muy conocidos en la técnica una diversidad de métodos de purificación/duplicación de proteína, incluyendo, e.g., aquellos descritos en R. Scopes, Protein Purification, Springer-Verlag N.Y. , (1982); Deutscher, Methods in Enzymology Vol . 182: Guide to Protein Purification, Academic Press, Inc., N.Y. , (1990); Sandana (1997) Bioseparation of Proteins, Academic Press, Inc.; Bollag et al., (1996) Protein Methods 2a edición, Wiley-Liss, Y; Walker (1996) The Protein Protocols Handbook Humana Press, NJ, Harris y Angal (1990) Protein Purification Applications: A Practica! Approach IRL Press en Oxford, Oxford Inglaterra; Harris y Angal Protein Purification Methods : A Practical Approach IRL Press en Oxford, Oxford Inglaterra; Scopes (1993) Protein Purification: Principies and Practice 3a Edición Springer-Verlag, NY; Janson y Ryden (1998) Protein Purification: Principies, High Resolution Methods and Applications, Segunda Edición Wiley-VCH, NY; y Walker (1998) Protein Protocols on CD-ROM Humana Press, NJ; y las referencias citadas en la presente .
- - Otra ventaja de la producción de una proteína o polipéptido de interés con un aminoácido no natural en una célula eucariótica es que típicamente las proteínas o polipéptidos se duplicarán en sus configuraciones naturales. Sin embargo, en ciertas modalidades de la invención, los expertos en la técnica reconocerán quem después de la síntesis, expresión y/o purificación, las proteínas pueden poseer una configuración diferente a las conformaciones deseadas de los polipéptidos relevantes. En un aspecto de la invención, la proteína expresada se desnaturaliza opcionalmente y después se renaturaliza. Esto se logra, e.g., agregando una chaperonina a la proteína o polipéptido de interés, y/o solubilizando las proteínas en un agente caotropico tal como guanidina HCl, etc. En general, ocasionalmente es deseable desnaturalizar y reducir los polipéptidos expresados y después ocasionar que los polipéptidos se re-dupliquen en la conformación preferida. Por ejemplo, puede agregarse guanidina, urea, DTT, DTE y/o una chaperonina a un producto de traducción de interés. Los métodos para reducir, desnaturalizar y renaturalizar proteínas son muy conocidos por los expertos en la técnica (ver, las referencias anteriores, y Debinski et al., (1993) J. Biol . Chem. 268:14065-14070; Kreitman y Pastan (1993) Bioconjug. Chem. 4:581-585; y Buchner et al., (1992) Anal. Biochem. 205:263- - 39 - 270). Debinski et al., por ejemplo, describe la desnaturalización y reducción de proteínas de cuerpo de inclusión en guanidina-DTE . Las proteínas pueden reduplicarse en un amortiguador redox conteniendo, e.g., glutationa oxidada y L-arginina. Los agentes de reduplicación pueden fluir o de otra manera moverse para entrar en contacto con el uno o más polipéptidos u otro producto de expresión, o viceversa. ANTICUERPOS En un aspecto, la invención proporciona anticuerpos para las moléculas de la invención, e.g., sintetasas, ARNt, y proteínas que comprenden aminoácidos no naturales . Los anticuerpos para las moléculas de la invención son útiles como reactivos de purificación, e.g., para purificar las moléculas de la invención. Adicionalmente, los anticuerpos pueden utilizarse como reactivos indicadores para indicar la presencia de una sintetasa, ARNt, o protexna que comprende un aminoácido no natural, e.g., para rastrear la presencia o localización (e.g., in vivo o in situ) de la molécula. Un anticuerpo de la invención puede ser una proteína que comprende uno o más polipéptidos sustancial o parcialmente codificados por genes de inmunoglobulina o fragmentos de genes de inmunoglobulina. Los genes de inmunoglobulina reconocidos incluyen los genes de región constante kappa, lambda, alfa, gamma, delta, epsilon, y mu, - - así como los genes de región variable de inmunoglobulina myriad. Las cadenas ligeras se clasifican ya sea como kappa o lambda. Las cadenas pesadas se clasifican como gamma, mu, alfa, delta o epsilon, que a su vez definen las clases de inmunoglobulina, IgG, IgM, IgA, IgD e IgE, respectivamente. Una unidad estructural típica de inmunoglobulina (e.g., anticuerpo) comprende un tetrámero. Cada tetrámero se compone de dos pares idénticos de cadenas de polipéptido, teniendo cada par una cadena "ligera" (aproximadamente 25 kD) y una "pesada" (aproximadamente 50-70 kD) . La terminación N de cada cadena define una región variable de aproximadamen e 100 a 110 o más aminoácidos principalmente responsables del reconocimiento de antígeno. Los términos cadena ligera variable (VL) y cadena pesada variable (VH) se refieren a estas cadenas ligera y pesada, respectivamente. Los anticuerpo existen como inmunoglobulinas intactas o como un número de fragmentos bien caracterizados producidos mediante la digestión de diversas peptidasas. De este modo, por ejemplo, la pepsina digiere un anticuerpo por debajo de los enlaces disulfuro en la región de articulación para producir F(ab')2, un dímero de Fab que en sí es una cadena ligera unida a VH-CH1 mediante un enlace disulfuro. El F(ab')2 puede reducirse bajo condiciones suaves para romper el enlace disulfuro en la región de articulación convirtiendo así el dímero F8ab' (2 en monómero Fab' . El - 41 - monómero Fab' es esencialmente un Fab con parte de la región de articulación (ver. Fundamental Immunology 4a edición, W. E. Paul, ed. , Raven Press, N.Y. (1999), para una descripción más detallada de otros fragmentos de anticuerpo) . Aunque diversos fragmentos de anticuerpo se definen en términos de la digestión de un anticuerpo intacto, el experto apreciará que tales fragmentos Fab', etc., pueden sintetizarse de novo ya sea químicamente o utilizando metodología de ADN recombinante . De este modo, el término anticuerpo, como se utiliza en la presente, incluye también opcionalmente fragmentos de anticuerpo ya sea producidos mediante la modificación de anticuerpos completos o sintetizados de novo utilizando metodologías de ADN recombinante. Los anticuerpos incluyen anticuerpos s monocatenarios, incluyendo Fv monocatenario (sFv o scFv) anticuerpos en los cuales una cadena pesada variable y una ligera variable se encuentran unidas entre sí ( directamente o a través de un enlazador péptido) para formar un polipéptido continuo. Los anticuerpos de la invención pueden ser, e.g., policlonales, monoclonales , quiméricos, humanizados, monocatenarios, fragmentos Fab, fragmentos producidos por una biblioteca de expresión Fab, o lo similar. En general, los anticuerpos de la invención son valiosos, tanto como reactivos generales como reactivos terapéuticos en una diversidad de procesos moleculares biológicos o farmacéuticos . Los métodos para producir anticuerpos monoclonales se encuentran disponibles, y pueden aplicarse para preparar los anticuerpos de la invención. Un número de textos básicos describen procesos estándar de producción de anticuerpos, incluyendo, e.g., Borrebaeck (ed) (1995) Antibody Engineering 2 a edición Freeman and Company, NY (Borreback) ; McCafferty et al., (1996) Antibody Engineering, A Practical Approach IRL, en Oxford Press, Oxford Inglaterra (McCafferty) , y Paul (1995) Antibody Engineering Protocols Humana Press, Towata, NJ (Paul) ; Paul (ed. ) (1999) Fundamental Immunology, Quinta edición Raven Press, N.Y.; Coligan (1991) Current Protocols in Immunology Wiley/Greene , NY; Harlow y Lañe (1989) Antibodies: A Laboratory Manual Cold Spring Harbor Press, NY; Stites et al., (eds.) Basic and Clinical Immunology (4a ed.) Lange Medical Publications , Los Altos, CA, y las referencias citadas en las mismas; Goding (1986) Monoclonal Antibodies: Principies and Practice (2a ed) Academic Press, New York, NY; y Kohler y Milstein (1975) Nature 256:495-497. Una diversidad de técnicas recombinantes para la preparación de anticuerpos que no se basan e.g., en la inyección de un antígeno en un animal, se han desarrollado y pueden utilizarse en el contexto de la presente invención. Por ejemplo, es posible generar y seleccionar bibliotecas de anticuerpos recombinantes en vectores fago o similares. Ver, e.g., Winter et al., (1994) Masking Antibodies by Phage Display Technology Annu . Rev. Immunol . 12:433-55 y las referencias citadas en las mismas para una revisión. Ver también, Griffiths y Duncan (1998) Strategies for selection of antibodies by phage display Curr Opin. Biotechnol 9:102-8; Hoogenboom et al., (1998) Antibody phage display technology and its applications Immunotechnology 4:1-20; Gram et al., (1992) In vitro selection and affinity maturation of antibodies from a native combinatorial immunoglobulin library PNAS 89:3756-3580; Huse et al., (1989) Science 246:1275-1281; y ard et al., (1989) Nature 341:544-546. En una modalidad, las bibliotecas de anticuerpo pueden incluir repertorios de genes V (e.g., cosechados de poblaciones de linfocitos o ensamblados in vitro) que se clonan para el despliegue de dominios variables asociados de cadena pesada y ligera en la superficie de bacteriófagos filamentosos . Los fago se seleccionan enlazando a un antígeno. Los anticuerpo solubles se expresan de bacterias fago infectadas y el anticuerpo puede mejorarse, e.g., a través de mutagénesis. Ver, e.g., Balint y Larrick (1993) Antibody Engineering by Parsimonious Mutagénesis Gene 137:109-118; Stemmer et al., (1993) Selection of an active single chain Fv antibody from a protein linker library prepared by enzymatic inverse PCR Biotechniques 14 (2) :256-65; Crameri et al., (1996) Construction and evolution of antibody phage librarles by DNA shuffling Nature Medicine 2:100-103; y Crameri y Stemmer (1995) Combinatorial múltiple mutagenesis creates all the permutations of mutant and wildtype cassettes BioTechniques 18:194-195. También se conocen y se encuentran disponibles equipos para la clonación y expresión de sistemas fago de anticuerpos recombinantes , e.g., el "sistema fago de anticuerpo recombinante, módulo de ScFv de ratón", de Amersham Pharmacia Biotechnology (Uppsala, Suecia) . También se han producido bibliotecas de anticuerpo bacteriófago para producir anticuerpos humanos de alta afinidad mediante arrastre de cadena (Ver, e.g., arks et -al., (1992) By-Passing Immunization: Building High Affinity Human Antibodies by Chain Shuffling Biotechniques 10:779-782. También se reconocerá que los anticuerpos pueden prepararse por cualquier número de servicios comerciales (e.g., Bethyl Laboratories (Montgomery, TX) , Anawa (Suiza) , Eurogentec (Bélgica y en los EU en Filadelfia, PA. Etc.) y muchos otros. En ciertas modalidades, es útil "humanizar" los anticuerpos de la invención, e.g., cuando los anticuerpos van a administrarse terapéuticamente. El uso de anticuerpos humanizados tiende a reducir la incidencia de respuestas inmune no deseadas contra los anticuerpos terapéuticos (e.g., cuando el paciente es humano) . Las referencias anteriores a anticuerpos describen estrategias de humanización.
- - Adicionalmente a los anticuerpos humanizados, también son una característica de la invención los anticuerpos humanos . Los anticuerpos humanos consisten de secuencias de inmunoglobulina característicamente humanas. Los anticuerpos humanos pueden producirse para utilizar una amplia variedad de métodos (ver, e.g., Larrick et al., Pat . de EU No. 5,001,065, para una revisión). Un procedimiento general para producir anticuerpos humanos mediante tecnología de trioma se describe por Ostberg et al., (1983), Hybridoma 2: 361-367, Ostberg, Pat. de E.U. No. 4,634,664 y Engelman et al., Pat. de E.U. No. 4,634,666. Se conoce una variedad de métodos para utilizar anticuerpos en la purificación y detección de proteínas y pueden aplicarse para detectar y purificar proteínas que comprenden aminoácidos no naturales como se anota en la presente. En general, los anticuerpos son reactivos útiles para ELISA, inmunoanálisis estern, inmunoquímica, métodos de cromatografía de afinidad, SPR, y muchos otros métodos. Las referencias anotadas anteriormente proporcionan detalles de cómo llevar a cabo análisis ELISA, inmunoanálisis western, resonancia de superficie de plasmon (SPR) y lo similar. En un aspecto de la invención, los anticuerpos de la invención en si mismos incluyen aminoácidos no naturales, que proporcionan los anticuerpos con propiedades de interés (e.g., vida media, estabilidad, toxicidad mejoradas y lo - - similar) . Ver también la sección en la presente titulada "Polipéptidos con aminoácidos no naturales" . Los anticuerpos cuentan para casi el 50% de todos los compuestos actualmente en pruebas clínicas (Wittrup, (1999) Phage on display Tibtech 17:423-424 y los anticuerpos se utilizan de manera ubicua como reactivos de diagnóstico. De acuerdo con esto, la capacidad para modificar anticuerpos con aminoácidos no naturales proporciona una importante herramienta para modificar estos valiosos reactivos . Por ejemplo, existen muchas aplicaciones de Mabs en el campo del diagnóstico. Los análisis varían desde simples pruebas de spot hasta métodos más involucrados tales como el NR-LU-10 Mab radio-marcado de DuPont Merck, Co., utilizado para visualización de tumores (Rusch et al., (1993) NR-LU-10 monoclonal antibody scanning. A helpful new adjunct to computed tomography in evaluating non small cell lung cáncer J. Thorac Cardiovasc. Surg. 106:200-4). Como se anotó, Mabs son reactivos centrales para ELISA, inmunoanálisis western, inmunoquímica, métodos de cromatografía de afinidad, y lo similar. Cualquiera de tales anticuerpos de diagnóstico puede modificarse para incluir uno o más aminoácidos no naturales, alterando, e.g., la especificidad o avidez del Ab a un objetivo, o alterando una o más propiedades detectables, e.g., incluyendo una marca detectable (e.g., espectrográfica, fluorescente, luminiscente, etc.) en el aminoácido no - - natural . Una clase de valiosos reactivos de anticuerpo son los Abs terapéuticos. Por ejemplo, los anticuerpos pueden ser aAbs específicos para el tumor que disminuyen el crecimiento del tumor dirigiéndose a células tumorales para su destrucción por medio de citotoxicidad dependiente del anticuerpo mediada por la célula (ADCC) o lisis mediada por complemento (CML) (estos tipos generales de Abs se refieren algunas veces como "balas mágicas") . Un ejemplo es Rituxan, un Mab anti-CD20 para el tratamiento de linfoma no de Hodgkins (Scott (1998) Rituximah: a new therapeutic monoclonal antibody for non-Hodgkin's lymphoma Cáncer Pract . 5:195-7). Un segundo ejemplo se refiere a anticuerpos que interfieren con un componente critico del crecimiento tumoral. Herceptin es un anticuerpo monoclonal anti-HER-2 para el tratamiento de cáncer de mama metastásico, y proporciona un ejemplo de un anticuerpo con este mecanismo de acción (Baselga et al., (1998) Recombinant humanized anti-GER2 antibody (Herceptin) enhances the anti tumor activity of paclitaxel and doxorubicin against HER2/nue overexpressing human breast cáncer xenografts [las erratas publicadas aparecen en Cáncer Res. (1999) 59(8):2020], Cáncer Res . 58:2825-31). Un tercer ejemplo se refiere a anticuerpos para suministro de compuestos citotóxicos (toxinas, radionúclidos, etc.) directamente a un tumor u otro sitio de interés. Por ejemplo, una aplicación de Mab es CYT-356, un anticuerpo enlazado a 90Y que dirige la radiación directamente a células de tumor prostático (Deb et al., (1996) Treatment of hormone refractory prostate cáncer with 90Y-CYT-356 monoclonal antlbody Clin. Cáncer Res. 2:1289-97. Una cuarta aplicación es la terapia de enzima prodroga dirigida al anticuerpo, en donde una enzima co-localizada a un tumor activa una prodroga sistémicamenté administrada en la cercanía del tumor. Por ejemplo, se ha desarrollado un anticuerpo anti-Ep-CAMI enlazado a carboxipeptidasa A para el tratamiento de cáncer colorrectal (Wolfe et al., (1999) Antobody directed enzime prodrug therapy with the T268G mutant of human carboxipeptidase Al: in vi tro and in vivo studies with prodrugs of methotrexate and the thymidylate synthase inhibitors GW1031 and GW1843 Bioconj . Chem. 10:38-48). Otros Abs (e.g., antagonistas) se diseñan para inhibir específicamente las funciones celulares normales para beneficio terapéutico. Un ejemplo es Orthoclone OKT3 , un Mab anti-CD3 ofrecido por Johnson and Johnson para reducir el rechazo agudo de transplante de órganos (Strate et al., (1990) Orthoclone 0KT3 as first-line therapy in acute renal allograft rejection Transplant Proc . 22:219-20. Otra clase de productos de anticuerpo son los agonistas. Estos Mabs se diseñan para aumentar específicamente las funciones celulares normales para beneficio terapéutico. Por ejemplo, los agonistas a base de Mab de receptores acetilcolina para neuroterapia se encuentran en desarrollo (Xie et al., (1997) Direct demonstration of MuSK involvement in acetilcholine receptor clustering through identification of agonist ScFv Nat . Biotechnol . 15:768-71. Cualquiera de estos anticuerpos puede modificarse para incluir uno o más aminoácidos no naturales para aumentar una o más propiedades terapéuticas (especificidad, avidez, vida media en suero, etc.) . Otra clase de productos de anticuerpo proporciona nuevas funciones . Los anticuerpo principales en este grupo son los anticuerpos catalíticos tales como las secuencias Ig que se han fabricado para imitar las capacidades catalíticas de enzimas (Wentworth y Janda (1998) Catalitic antibodies Curr. Opin. Chem. Biol . 2:138-44. Por ejemplo, una interesante aplicación implica el uso del anticuerpo catalítico mAb-15A10 para hidrolizar cocaína in vivo para terapia de adición (Mets et al., (1998) A catalytic antibody against cocaine prevente cocaine's reinforcing and toxic effects in rats Proc. Nati. Acad. Sci. EUA 95:10176-81). Los anticuerpos catalíticos también pueden modificarse para incluir uno o más aminoácidos no naturales para mejorar una o más propiedades de interés . Definición de Polipéptidos mediante Inmunorreactividad Debido a que los polipéptidos de la invención proporcionan una diversidad de nuevas secuencias de polipéptidos (e.g., que comprenden aminoácidos no naturales en el caso de proteínas sintetizadas en los sistemas de traducción en la presente, o, e.g., en el caso de las nuevas sintetasas en la presente, nuevas secuencias de aminoácidos estándar) , los polipéptidos proporcionan también nuevas características estructurales que pueden reconocerse e.g., en análisis inmunológicos . La generación de anticuerpos o anticuerpos que se enlazan específicamente a los polipéptidos de la invención, así como los polipéptidos enlazados por tales anticuerpos o antisuero, son una característica de la invención. Por ejemplo, la invención incluye proteínas de sintetasa que se enlazan específicamente o que son específicamente inmunorreactivas con anticuerpos o antisuero generados contra un inmunogeno que comprende una secuencia de aminoácidos seleccionada de una o más de las SEQ ID NO: 36-63 (e.g., 36-47, 48-63 o cualquier otro subconjunto de 36-63) y/o 86. Para eliminar la reactividad cruzada con otros homólogos el anticuerpo o antisuero se sustrae con homólogos de control de sintetasa disponibles, tales como la tirosil sintetasa del tipo silvestre de E. coli (TyrsRS) (e.g., SEQ ID NO: 2) . En un formato típico, el inmunoanálisis utiliza antisuero policlonal que se cultivó contra uno o más polipéptidos comprendiendo una o más de las secuencias correspondientes a una o más de las SEQ ID NO: 36-63 (e.g., 36-47, 48-63 o cualquier otro subconjunto de 36-63) y/o 86 o una subsecuencia sustancial de las mismas (i.e., al menos aproximadamente 30% de la secuencia de longitud total proporcionada) . El conjunto de inmunógenos de polipéptidos potenciales derivados de la SEQ ID NO: 36-63 y 86 se refieren colectivamente abajo como "los polipéptidos inmunogénicos" . El antisuero resultante se selecciona opcionalmente para tener una reactividad cruzada contra los homólogos de control de sintetasa y cualquier reactividad cruzada tal se retira e.g., mediante inmunoabsorción con uno o más homólogos de control de sintetasa, previo al uso del antisuero policlonal en el inmunoanálisis . A fin de producir antisuero para su uso en un inmunoanálisis, se produce y se purifica uno o más de los polipéptidos inmunogénicos como se describe en la presente. Por ejemplo, la proteína recombinante puede producirse en una célula recombinante. Se inmuniza una especie criada de ratones (utilizados en este análisis dado que los resultados son más reproducibles debido a la identidad genética virtual de los ratones) con la(s) proteina(s) inmunogénica (s) en combinación con un adyuvante estándar, tal como el adyuvante de Freund, y un protocolo estándar de inmunización de ratón (ver, e.g., Harlow y La e (1988) Antibodies, A Laboratory Manual Cold Spring Harbor Publications, New York, para una descripción estándar de la generación de anticuerpos, formatos de inmunoanálisis y condiciones que pueden utilizarse para determinar la inmunorreactividad específica. También se encuentran en la presente referencias adicionales y discusión de anticuerpos y pueden aplicarse en la presente para preparar anticuerpos que definen/detectan polipéptidos mediante inmunorreactividad) . Alternativamente, uno o más polipéptidos sintéticos o recombinantes derivados de las secuencias descritas en la presente, se conjugan a una proteína portadora y se utilizan como inmunógeno. Se recolecta suero polxclonal y se titula contra el polipéptido inmunogénico en un inmunoanálisis, por ejemplo, un inmunoanálisis en fase sólida con una o más de las proteínas inmunógenas inmovilizadas en un soporte sólido. Se selecciona el suero polxclonal con una titulación de 10s o mayor, se deposita y se sustrae con los polipéptidos de sintetasa de control para producir antisuero polxclonal sustraído depositado titulado. El antisuero polxclonal sustraído depositado titulado se prueba por reactividad cruzada contra los homólogos de control en un inmunoanálisis comparativo. En este inmunoanálisis comparativo se determinan las condiciones discriminatorias de enlace para el antisuero polxclonal sustraído depositado titulado que dan como resultado al menos una proporción de señal a ruido 5-10 veces más alta para el enlace del antisuero policlonal titulado para la sintetasa inmunógena en comparación al enlace a un homólogo de sintetasa de control. Es decir, la rigidez de la(s) reacción (es) de enlace/lavado se ajusta (n) mediante la adición de competidores no específicos tales como albúmina o leche seca sin grasa, y/o ajustando las condiciones de sal, temperatura, y/o lo similar. Estas condiciones de enlace/lavado se utilizan en análisis subsecuentes para determinar si un polipéptido de prueba (un polipéptido que se compara con los polipéptidos inmunógenos y/o los polipéptidos de control) se encuentra específicamente enlazado mediante el antisuero policlonal depositado sustraído. En particular, los polipéptidos de prueba, que muestran al menos una proporción de señal a ruido 2-5 veces más alta que el homólogo de sintetasa de control bajo condiciones discriminatorias de enlace y al menos aproximadamente una proporción de señal a ruido de ½ en comparación con el (los) polipéptido (s) inmunógenos, comparten una similitud estructural sustancial con el polipéptido inmunógeno en comparación con sintetasas conocidas, y en consecuencia, es un polipéptido de la invención. En otro ejemplo, los inmunoanálisis en el formato de enlace competitivo se utilizan para la detección de un polipéptido de prueba. Por ejemplo, como se anotó, los anticuerpos de reacción cruzada se retiran de la mezcla de antisuero depositada mediante inmunoabsorción con los polipéptidos de control. El (los) polipéptido (s) inmunógenos se inmovilizan entonces en un soporte sólido que se encuentra expuesto al antisuero depositado sustraído. Se agregan las proteínas de prueba al análisis para competir por el enlace al antisuero sustraído depositado. La capacidad de la(s) proteína (s) de prueba para competir por el enlace al antisuero sustraído depositado en comparación con la(s) proteína (s) inmovilizada (s) se compara con la capacidad de el (los) polipéptido (s) inmunógeno (s) agregados al análisis, para competir por el enlace (los polipéptidos inmunógenos compiten efectivamente con los polipéptidos inmunógenos inmovilizados por el enlace al antisuero depositado) . La reactividad cruzada porcentual para las proteínas de prueba se calcula utilizando cálculos estándar. En un análisis paralelo, se determina opcionalmente la capacidad de las proteínas de control para competir por el enlace al antisuero sustraído depositado en comparación con la capacidad de el (los) polipéptido (s) inmunógeno (s) para competir por el enlace al antisuero. De nuevo, se calcula la reactividad cruzada porcentual para los polipéptidos de control utilizando cálculos estándar. Cuando la reactividad cruzada porcentual es al menos 5-10x tan alta para los polipéptidos de prueba en comparación con los polipéptidos de control, y cuando el enlace de los polipéptidos de control se encuentra aproximadamente en el rango del enlace de los polipéptidos inmunógenos, se dice que los polipéptidos de prueba se enlazan específicamente al antisuero sustraído depositado . En general, el antisuero inmunoabsorbido y depositado puede utilizarse en un inmunoanálisis de enlace competitivo como se describe en la presente para comparar cualquier polipéptido de prueba con el (los) polipéptido (s) inmunógeno (s) y/o de control. A fin de hacer esta comparación, los polipéptidos inmunógeno, de prueba y de control se analizan cada uno en un amplio rango de concentraciones y se determina la cantidad de cada polipéptido requerida para inhibir el 50% del enlace del antisuero sustraído a, e.g., una proteína inmovilizada de control, de prueba o inmunogena utilizando técnicas estándar. Si la cantidad del polipéptido de prueba requerida para el enlace en el análisis competitivo es menor que dos veces la cantidad del polipéptido inmunógeno requerida, entonces se dice que el polipéptido de prueba se enlaza específicamente a un anticuerpo generado para la proteína inmunogena, siempre que la cantidad sea al menos aproximadamente 5-10x tan alta como para el polipéptido de control . Como una determinación adicional de especificidad, el antisuero depositado opcionalmente se inmunoabsorbe completamente con el (los) polipéptido (s) inmunógeno (s) (en lugar de los polipéptidos de control) hasta que se detecta poco o ningún enlace del antisuero depositado sustraído del polipéptido inmunógeno resultante a el (los) polipéptido (s) inmunógeno (s) utilizado (s) en la inmunoabsorción. Este antisuero completamente inmunoabsorbido se prueba entonces por reactividad con el polipéptido de prueba. Si se observa poca o ninguna reactividad (i.e, no más de 2x la proporción de señal a ruido observada para el enlace del antisuero completamente inmunoabsorbido al polipéptido inmunógeno) , entonces el polipéptido de prueba se enlaza específicamente mediante el antisuero emitido por la protelna inmunogena. COMPOSICIONES FARMACÉUTICAS Los polipéptidos o proteínas de la invención (e.g., sintetasas, proteínas que comprenden uno o más aminoácidos no naturales, etc.) se emplean opcionalmente para usos terapéuticos, e.g., en combinación con un vehículo farmacéutico adecuado. Tales composiciones, e.g., comprenden una cantidad terapéuticamente efectiva del compuesto, y un vehículo o excipiente farmacéuticamente aceptable. Tal vehículo o excipiente incluye, pero no se limita a, salina, salina amortiguada, dextrosa, agua, glicerol, etanol, y/o combinaciones de los mismos. La formulación se prepara para adecuarse al modo de administración. En general, los métodos para administrar proteínas se conocen bien en la técnica y pueden aplicarse para la administración de los polipéptidos de la invención. Las composiciones terapéuticas que comprenden uno o más polipéptidos de la invención se prueban opcionalmente en uno o más modelos animales apropiados de la enfermedad in vitro y/o in vivo, para confirmar eficacia, metabolismo en el tejido, y para estimar las dosis de acuerdo con métodos muy conocidos en la técnica. en particular, las dosis pueden determinarse inicialmente mediante la actividad, estabilidad u otras medidas adecuadas de homólogos de aminoácidos no naturales en la presente hasta naturales (e.g., comparación de un EPO modificado para incluir uno o más aminoácidos no naturales hasta un EPO de aminoácido natural), i.e., en un análisis relevante. La administración es mediante cualquiera de las rutas normalmente utilizadas para introducir una molécula en contacto final con células sanguíneas o de tejido. Los polipéptidos de aminoácido no natural de la invención se administran de cualquier manera adecuada, opcionalmente con uno o más vehículos farmacéuticamente aceptables. Los métodos adecuados para administrar tales polipéptidos en el contexto de la presente invención a un paciente, se encuentran disponibles y aunque puede utilizarse más de una vía para administrar una composición particular, una via particular puede proporcionar frecuentemente una acción o reacción más inmediata y más efectiva que otra vía. Los vehículos farmacéuticamente aceptables se determinan en parte por la composición particular que se administra, así como por el método particular utilizado para administrar la composición. De acuerdo con esto, existe una amplia variedad de formulaciones adecuadas de las composiciones farmacéuticas de la presente invención. Las composiciones de polipéptido pueden administrarse mediante una cantidad de vías que incluyen pero no se limitan a: medios oral, intravenoso, intraperitoneal, intramuscular, transdérmico, subcutáneo, tópico, sublingual, o rectal . Las composiciones de polipéptido de aminoácido no natural también pueden administrarse a través de liposomas. Tales vías de administración y formulaciones apropiadas se conocen generalmente por los expertos en la técnica. El polipéptido de aminoácido no natural, solo o en combinación con otros componentes adecuados , puede prepararse en formulaciones en aerosol (i.e., pueden "nebulizarse" ) para administrarse a través de inhalación. Las formulaciones en aerosol pueden colocarse en propelentes presurizados aceptables, tales como diclorodifluorometano, propano, nitrógeno, y lo similar. Las formulaciones adecuadas para administración parenteral, tales como, por ejemplo, mediante vía intraarticular (en las articulaciones) , intravenosa, intramuscular, intradérmica, intraperitoneal , y subcutánea, incluyen soluciones para inyección estériles isotónicas acuosas y no acuosas, que pueden contener antioxidantes, amortiguadores, bacterióstatos y soluciones que hacen la formulación isotónica con la sangre del receptor pretendido, y suspensiones estériles acuosas y no acuosas que pueden incluir agentes de suspensión, solubilizadores, agentes espesantes, estabilizadores y preservativos. Las formulaciones de ácido nucleico empacado pueden presentarse en contenedores sellados de dosis unitarias o de dosis múltiples, tales como ampolletas y viales. La administración parenteral y la administración intravenosa son métodos preferidos de administración. En particular, la vías de administración ya en uso para terapéuticos de homólogos de aminoácidos naturales (e.g., aquellos que se utilizan típicamente para EPO, GCSF, GMCSF, IFNs, interleucinas, anticuerpos y/o cualquier otra proteína suministrada farmacéuticamente) , conjuntamente con las formulaciones en uso actual, proporcionan las vías preferidas de administración y la formulación para las proteínas que incluyen aminoácidos no naturales de la invención (e.g., variantes pegiladas de proteínas terapéuticas actuales, etc . ) . La dosis administrada a un paciente, en el contexto de la presente invención, es suficiente para efectuar una respuesta terapéutica benéfica en el paciente al paso del tiempo, o, e.g., para inhibir la infección por medio una actividad patógena u otra apropiada, dependiendo de la aplicación. La dosis se determina mediante la eficacia de una composición/formulación particular, y la actividad, estabilidad de la vida media en suero del polipéptido de aminoácido no natural empleado y la condición del paciente, así como el peso corporal o el área de superficie del paciente que se va a tratar. El tamaño y la dosis también se determina por la existencia, naturaleza, y extensión de cualquier efecto adverso secundario que acompañe la administración de una composición/formulación particular, o lo similar en un paciente en particular. Para determinar la cantidad efectiva de la composición/formulación que va a administrarse en el tratamiento o profilaxis de la enfermedad (e.g., cánceres, enfermedades hereditarias, diabetes, SIDA, o lo similar) , el médico evalúa los niveles de plasma circulantes, las toxicidades de la formulación, el progreso de la enfermedad y/o cuando es relevante, la producción de anticuerpos anti-polipéptidos de aminoácidos no naturales La dosis administrada, e.g., a un paciente de 70 kilogramos, se encuentra típicamente en el rango equivalente a la dosis de proteínas terapéuticas utilizadas actualmente, ajustada para la actividad alterada de la vida media en suero - - de la composición relevante. Las composiciones/formulaciones de esta invención pueden suministrar condiciones de tratamiento mediante cualquier terapia convencionales conocida, incluyendo la administración de anticuerpos, la administración de vacunas, la administración de agentes citotóxicos, polipéptidos de aminoácido natural, ácidos nucleicos, análogos de nucleótidos, modificadores de respuesta biológica, y lo similar. Para su administración, las formulaciones de la presente invención se administran a una proporción determinada por el LD-50 de la formulación relevante, y/o por la observación de cualquier efecto secundario de los aminoácidos no naturales en diversas concentraciones, e.g., aplicados a la masa y a la salud general del paciente. La administración puede lograrse a través de dosis únicas o divididas . Si un paciente que experimenta la infusión de una formulación desarrolla fiebre, escalofríos o dolores musculares, recibe la dosis apropiadas de aspirina, ibuprofeno, acetaminofén u otra droga para el control del dolor/fiebre. Los paciente que experimentan reacciones a la infusión tales como fiebre, dolor muscular, y escalofríos se pre-medican 30 minutos previo a futuras infusiones ya sea con aspirina, acetaminofén, o e.g., difenil idramina. Se utiliza meperidina para escalofríos y dolores musculares más severos - - que no responden rápidamente a antipiréticos y antihistaminas . El tratamiento se retrasa o se discontinua dependiendo de la severidad de la reacción. SECUENCIAS Y VARIANTES DE ÁCIDO NUCLEICO y POLIPEPTIDO Como se describe anteriormente y abajo, la invención proporciona secuencias de polinucleótido de ácido nucleico y secuencias de aminoácido de polipéptidos , e.g., 0-ARNts y O-RSs, y, e.g., composiciones y métodos que comprenden dichas secuencias. Se describen en la presente ejemplos de dichas secuencias, e.g., de 0-ARNts y O-RSs (ver, Tabla 5, e.g., SEQ ID NO. 3-65, 86, y otras diferentes a las SEQ ID NO: 1 y 2) . Sin embargo, el experto en la técnica apreciará que la invención no se limita a aquellas secuencias descritas en la presente, e.g., los Ejemplos y la Tabla 5. El experto apreciará que la invención proporciona también muchas secuencias relacionadas e incluso no relacionadas con las funciones descritas en la presente, e.g., que codifican para un O-ARNt o una O-RS. La invención proporciona también polipéptidos (O-RSs) y polinucleótidos, e.g., O-ARNt, polinucleótidos que codifican las O-RSs o porciones de las mismas (e.g., el sitio activo de sintetasa) , los oligonucleótidos utilizados para construir imitantes de aminoacil-ARNt sintetasa, etc. Por ejemplo, una polipéptido de la invención incluye un polipéptido que comprende una secuencia de aminoácidos como - - se muestra en cualquiera de las SEQ ID NO: 36-63 (e.g., 36-47, 48-63 o cualquier otro subconjunto de 36-63) , y/o 86, un polipéptido que comprende una secuencia de aminoácidos codificado por una secuencia de polinucleótidos como se describe en cualquiera de las SEQ ID NO: 3-35 (e.g., 3-19, 20-35, o cualquier otro subconjunto de las secuencias 3-35), y un polipéptido que es específicamente inmunorreactivo con un anticuerpo específico para un polipéptido que comprende una secuencia de aminoácidos como se describe en cualquiera de SEQ ID NO: 36-63 (e.g., 36-47, 48-63, o cualquier otro subconjunto de 36-63) , y/o 86 o un polipéptido que comprende una secuencia de aminoácidos codificada por una secuencia de polinucleótidos como se describe en cualquiera de las SEQ ID NO: 3-35 (e.g., 3-19, 20-35 o cualquier otro subconjunto de las secuencias 3-35) . También se incluyen entre los polipéptidos de la invención los polipéptidos que comprende una secuencia de aminoácidos que es al menos 90% idéntica a la de una tirosil aminoacil-ARNt sintetasa de origen natural (TyrRS) (e.g., SEQ ID NO: 2) y comprende dos o más aminoácidos de los grupos A-E. Por ejemplo, el grupo A incluye valina, isoleucina, glicina, serina, alanina, o treonina en una posición correspondiente a Tyr37 de una TyrRS de E. coli; el grupo B incluye aspartato en una posición correspondiente a Asnl26 de una TyrRS de E. coli; el grupo C incluye treonina, serina, - - arginina, asparagina, o glicina en una posición correspondiente a Aspl82 de una TyrRS de E. coli; el grupo D incluye metionina, alanina, valina o tirosina en una posición correspondiente a Phel83 de una TyrRS de E. coli; y el grupo E incluye serina, metionina, valina, cisteína, treonina o alanina en una posición correspondiente a Leul86 de una TyrRS de E. coli. Cualquier subconjunto de combinaciones de estos grupos es una característica de la invención. Por ejemplo, en una modalidad, la O-RS tiene dos o más aminoácidos seleccionados de presentaciones de valina, isoleucina, leucina o treonina en una posición correspondiente a Tyr37 de la TyrRS de E. coli; treonina, serina, arginina, o glicina en una posición correspondiente a Aspl82 de una TyrRS de E. coli; metionina, o tirosina en una posición correspondiente a Phel83 de una TyrRS de E. coli; y serina, o alanina en una posición correspondiente a Leul86 de una TyrRS de E. coli. En otra modalidad, la O-RS incluye dos o más aminoácidos seleccionados de glicina, serina o alanina en una posición correspondiente a Tyr37 de la TyrRS de E. coli; aspartato en una posición correspondiente a Asnl26 de una TyrRS de E. coli; asparagina en una posición correspondiente a Aspl82 de una TyrRS de E. coli; alanina o valina en una posición correspondiente a Phel83 de una TyrRS de E. coli; y/o metionina, valina, cisterna o treonina en una posición correspondiente a Leul86 de una TyrRS de E. coli. De manera - - similar, los polipéptidos de la invención también incluyen un polipéptido que comprende al menos 20 aminoácidos contiguos de la SEQ ID NO: 36-63 (e.g., 36-47, 48-63, o cualquier otros subconjunto de 36-63) , y/o 86, y dos o más sustituciones de aminoácido como se indica anteriormente en los grupos A-E. Ver, también, Tabla 4, Tabla 6, y/o Tabla 8, en la presente. Una secuencia de aminoácidos que comprende una variación conservadora de cualquiera de los polipéptidos anteriores también se incluye como un polipéptido de la invención. En una modalidad, la composición incluye un polipéptido de la invención y un excipiente (e.g., amortiguador, agua, excipiente farmacéuticamente aceptable, etc.) . La invención también proporciona un anticuerpo o un antisuero específicamente inmunorreactivo con un polipéptido de la invención. También se proporcionan en la invención polinucleótidos . Los polinucleótidos de la invención incluyen aquellos que codifican para las proteínas o polipéptidos de interés de la invención o que incluyen uno o más codones selectores, o ambos. Por ejemplo, los polinucleótidos de la invención incluyen e.g., un polinucleótido que comprende una secuencia de nucleótidos como se describe en cualquiera de las SEQ ID NO: 3-35 (e.g., 3-19, 20-35 o cualquier otro subconjunto de las secuencias 3-35), 64-85; un polinucleótido complementario a o que codifica - - para una secuencia de polinucleótidos del mismo; y/o un polinucleótido que codifica un polipeptido que comprende una secuencia de aminoácidos como se describe en cualquiera de las SEQ ID NO: 36-63, y/o 86, o una variación conservadora de las mismas. Un polinucleótido de la invención incluye también un polinucleótido que codifica para un polipéptido de la invención. De manera similar, un ácido nucleico que híbrida a un polinucleótido anteriormente indicado bajo condiciones altamente rigurosas sustancialmente sobre la longitud total del ácido nucleico es un polinucleótido de la invención. Un polinucleótido de la invención también incluye un polinucleótido que codifica para un polipéptido que comprende una secuencia de aminoácido que es al menos 90% idéntica a la de una tirosil aminoacil-AR t (TyrRS) de origen natural (e.g., SEQ ID NO: 2) y comprende dos o más mutaciones como se indica anteriormente en los grupos A-E (anteriormente) . Un polinucleótido que es al menos 70% (o al menos 75%, al menos 80%, al menos 85%, al menos 90%, al menos 95%, al menos 98% o al menos 99% o más) idéntica a un polinucleótido indicado anteriormente y/o un polinucleótido que comprende una variación conservadora de cualquiera de los polinucleótidos indicados anteriormente también se incluye entre los polinucleótidos de la invención. Ver, e.g., Tabla 4, Tabla 6 y/o Tabla 8 en la presente.
- - En ciertas modalidades, un vector (e.g., un plásmido, un cósmido, un fago, un virus, etc.), comprende un polinucleótido de la invención. En una modalidad, el vector es un vector de expresión. En otra modalidad, el vector de expresión incluye un promotor operablemente enlazado a uno o más de los polinucleótidos de la invención. En otra modalidad, una célula comprende un vector que incluye un polinucleótido de la invención. El experto apreciará también que muchas variantes de las secuencias descritas se incluyen en la invención. Por ejemplo, las variaciones conservadoras de las secuencias descritas que producen una secuencia funcionalmente idéntica se incluyen en la invención. Las variantes de las secuencias de polinucleótido de ácido nucleico en donde las variantes se hibridan a al menos una secuencia descrita, se consideran incluidas en la invención. Las subsecuencias únicas de las secuencias descritas en la presente, como se determinan por, e.g., técnicas de comparación estándar, también se incluyen en la invención. Variaciones conservadoras Debido a la degeneración del código genético, las "sustituciones silenciosas" (i.e., sustituiciones en una secuencia de ácido nucleico que no dan como resultado la alteración en un polipéptido codificado) son una característica implícita de cada secuencia de ácido nucleico - - que codifica para un aminoácido. De manera similar, las "sustituciones de aminoácido conservadoras" en uno o pocos aminoácidos en una secuencia de aminoácidos se sustituyen con diferentes aminoácidos con propiedades altamente similares, también se identifican fácilmente como altamente similares a una estructura descrita. Tales variaciones conservadoras de cada secuencia descrita son una característica de la presente invenció . "Variaciones conservadoras" de una secuencia de ácido nucleico particular, se refiere a aquellos ácidos nucleicos que codifican para secuencias de aminoácido idénticas o esencialmente idénticas, o, cuando el ácido nucleico no codifica para una secuencia de aminoácidos, a secuencias esencialmente idénticas . El experto reconocerá que las sustituciones individuales, supresiones o adiciones que alteran, agregan o suprimen un solo aminoácido o un pequeño porcentaje de aminoácidos (típicamente menos que 5%, más típicamente menos que 4%, 2%, o 1%) en una secuencia codificada son "variaciones modificadas conservadoramente" en donde las alteraciones dan como resultado la supresión de un aminoácido, adición de aminoácido, o sustitución de un aminoácido con un aminoácido químicamente similar. De este modo, las "variaciones conservadoras" de una secuencia de polipéptido listada de la presente invención incluyen sustituciones de un pequeño porcentaje, típicamente menos que - - 5%, más típicamente menos que 2% o 1% de los aminoácidos de la secuencia de polipéptidos , con un aminoácido seleccionado conservadoramente del mismo grupo de sustitución conservadora. Finalmente, la adición de secuencias que no alteran la actividad codificada de una molécula de ácido nucleico, tal como la adición de una secuencia no funcional, es una variación conservadora del ácido nucleico básico. Las tablas de sustitución conservadora proporcionando aminoácidos funcionalmente similar son muy conocidas en la técnica. La siguiente describe, por ejemplo, grupos que contienen aminoácidos naturales que incluyen "sustituciones conservadoras" para ambos.
Grupos de Sustitución conservadora Hibridación de Ácido Nucleico Puede utilizarse la hibridación comparativa para identificar ácidos nucleicos de la invención, incluyendo - - variaciones conservadoras de los ácidos nucleicos de la invención, y este método de hibridación comparativa es un métodos para distinguir los ácidos nucleicos de la invención. Adicionalmente, los ácidos nucleicos objetivo que se hibridan a los ácidos nucleicos representados por la SEQ ID NO: 3.35 (e.g., 3-19, 20-35 o cualquier otro subconjunto de las secuencias 3-35) , 64-85 bajo condiciones de rigidez altas, ultra altas y ultra-ultra altas son una característica de la invención. Ejemplos de tales ácidos nucleicos incluyen aquellos con una o pocas sustituciones de ácido nucleico silenciosas o conservadoras en comparación con una secuencia de ácido nucleico dada. Se dice que un ácido nucleico de prueba se híbrida específicamente a un ácido nucleico de sonda cuando híbrida al menos % tanto a la sonda como al objetivo complementario perfectamente igualado, i.e., con una proporción de señal a ruido al menos ½ tan alta como la observada para la hibridación a cualquiera de los ácidos nucleicos objetivo no igualados . Los ácidos nucleico se "hibridan" cuando se asocian típicamente en solución. Los ácidos nucleicos se hibridan debido a una diversidad de fuerzas fisico-químicas bien caracterizadas, tales como el enlace de hidrógeno, exclusión de solvente, atascamiento de base y lo similar. Se encuentra una extensa guía para la hibridación de ácidos nucleicos en - - Tijssen (1993) Laboratory Techniques in Biochemistry and Molecular Blology-Hlbridization wlth Nucleic Acido Probes parte I capítulo 2, "Overvxew of principies of hybridization and the strategy of nucleic acid probé assays" , (Elsevier, New York) , asi como en Ausubel, supra. Hames y Higgins (1995) genes Probes I , 1 L Press at Oxford University Press, Oxford, Inglaterra, (Hames y Higgins I) y Hames y Higgins (1995) Gene Probes 2 IRL Press at Oxford University Press, Oxford, Inglaterra (Hames y Higgins 2) proporcionan detalles en la síntesis, marcado, detección y cuantificación de AHN y ARN incluyendo oligonucleótidos . Un ejemplos de condiciones rigurosas de hibridación para la hibridación de ácidos nucleico complementarios que tienen más de 100 residuos complementarios en un filtro en un inmunoanálisis Southern es 50% formalina con 1 mg de heparina a 42 °C, llevando a cabo la hibridación durante la noche. Un ejemplo de condiciones rigurosas de lavado es un lavado 0.2x SSC a 65 °C durante 15 minutos (ver, Sambrook, supra para una descripción del amortiguador SSC) . Frecuentemente el lavado es precedido por un lavado de baja rigidez para retirar la señal de sonda de fondo. Un ejemplo de lavado de baja rigidez es 2x SSC a 40 °C durante 15 minutos. En general, una proporción de señal a ruido de 5x (o mayor) que la observada para una sonda no relacionada en el análisis de hibridación particular indica la detección de una hibridación específica.
- - "Condiciones rigurosas de lavado e hibridación" en el contexto de los experimentos de hibridación de ácido nucleico tales como las hibridaciones Southern y northern son dependientes de la secuencia, y son diferentes bajo diferentes parámetros ambientales . Se encuentra una extensa guía para la hibridación de ácidos nucleicos en Tijssen (1993), supra, y en Hames y Higgins, 1 y 2. Las condiciones rigurosas de lavado e hibridación pueden determinarse fácilmente empíricamente para cualquier ácido nucleico de prueba. Por ejemplo, para determinar condiciones de hibridación y lavado altamente rígidas, las condiciones de hibridación y lavado se aumentan gradualmente (e.g., aumentando la temperatura, disminuyendo la concentración de sal, aumentando la concentración de detergente y/o aumentando la concentración de solventes orgánicos tales como formalina en la hibridación o lavado) , hasta cumplir un conjunto seleccionado de criterios. Por ejemplo, las condiciones de hibridación y lavado aumentan gradualmente hasta que una sonda se enlaza a un objetivo complementario perfectamente igualado con una proporción de señal a ruido que es al menos 5x tan alta como la observada para la hibridación de la sonda a un objetivo no igualado. Las condiciones "muy rígidas" se seleccionan para ser iguales al punto de fusión térmico (Tm) para una sonda particular. La Tm es la temperatura (bajo una resistencia - - iónica y pH definidos) a la cual 50% de la secuencia de prueba se hibrida a una sonda perfectamente igualada. Para los propósitos de la presente invención, generalmente, las condiciones de hibridación y lavado "altamente rígidas" se seleccionan para ser aproximadamente 5°C menores que la Tm para la secuencia especifica a una resistencia iónica y pH definidos . Las condiciones de hibridación y lavado de "ultra alta rigidez" son aquellas en las cuales la rigidez de las condiciones de hibridación y lavado aumentan hasta que la proporción de señal a ruido para el enlace de la sonda del ácido nucleico objetivo complementario perfectamente igualado es al menos lOx tan alta como la observada para la hibridación a cualquiera de los ácidos nucleicos objetivo no igualados. Se dice que un ácido nucleico objetivo que se hibrida a una sonda bajo tales condiciones, con una proporción de señal a ruido de al menos ½ la del ácido nucleico objetivo complementario perfectamente igualado, se enlaza a la sonda bajo condiciones de ultra alta rigidez. De manera similar, niveles incluso mayores de rigidez pueden determinarse aumentando gradualmente las condiciones de hibridación y/o lavado del análisis de hibridación relevante. Por ejemplo, aquellos en los cuales la rigidez de las condiciones de hibridación y lavado aumentan hasta que la proporción de señal a ruido para - - enlazar la sonda al ácido nucleico objetivo complementario perfectamente igualado es al menos ???, 20X, 50X, 100X, o 500X o más tan alta como la observada para la hibridación a cualquiera de los ácidos nucleicos objetivo no igualados. Se dice que un ácido nucleico objetivo que se hibrida a una sonda bajo tales condiciones, con una proporción de señal a ruido al menos ½ de la del ácido nucleico objetivo complementario perfectamente igualado, se enlaza a la sonda bajo condiciones de ultra-ultra alta rigidez. Los ácidos nucleicos que no se hibridan entre s£ bajo condiciones rigurosas son aún sustancialmente idénticos so los polipéptidos para los que codifican son sustancialmente idénticos. Esto ocurre, e.g., cuando se crea una copia de un ácido nucleico utilizando la máxima degeneración del codón permitida por el código genético. Subsecuencias únicas En un aspecto, la invención proporciona un ácido nucleico que comprende una subsecuencia única en un ácido nucleico seleccionado de las secuencias de O-ARNts y O-RSs descritas en la presente. La subsecuencia única es única comparada con un ácido nucleico correspondiente a cualquier secuencia de ácido nucleico de O-ARNt o O-RS . La alineación puede llevarse a cabo utilizando, e.g., BLAST establecido a parámetros de falla. Cualquier subsecuencia única es útil, e.g., como una sonda para identificar los ácidos nucleicos de - - la invención. De manera similar, la invención incluye un polipéptido que comprende una subsecuencia única en un polipéptido seleccionado de las secuencias de O-RSs descritas en la presente. Aguí, la subsecuencia única es única comparada con un polipéptido correspondiente a cualquier secuencia de polipéptidos conocida. La invención proporciona también ácidos nucleicos objetivo que se hibridan bajo condiciones rigurosas en un polipéptido seleccionado de las secuencias de O-RSs en donde la subsecuencia única es única comparada con un polipéptido correspondiente a cualquiera de los polipéptidos de control (e.g., secuencias de origen a partir de las cuales se derivaron las sintetasas de la invención, e.g., mediante mutación) . Las secuencias únicas se determinan como se anotó anteriormente . Comparación, identidad y homología de secuencia Los términos "idéntica" o porcentaje de "identidad" en el contexto de dos o más secuencias de ácido nucleico o polipéptidos, se refieren a dos o más secuencias o subsecuencias que son la misma o tienen un porcentaje específico de residuos de aminoácido o nucleótidos que son el mismo, al compararse y alinearse para máxima correspondencia, medidos utilizando uno de los algoritmos de comparación de secuencia descritos abajo (u otros algoritmos disponibles - - para los expertos) o mediante inspección visual. La frase "sustancialmente ' idéntico" en el contexto de dos ácidos nucleicos o polipéptidos (e.g., ADNs que codifican para un O-ARNt o una O- S, o la secuencia de aminoácidos de una O-RS) se refiere a dos o más secuencias o subsecuencias que tienen al menos aproximadamente 60%, preferentemente 80%, de mayor preferencia 90-95% de identidad de nucleótido o residuo de aminoácido, al compararse y alinearse para máxima correspondenci , medidos utilizando un algoritmo de comparación de secuencia o mediante inspección visual. Tales secuencias "sustancialmente idénticas" se consideran típicamente "homologas" , sin referencia al origen real. Preferentemente, existe la "identidad sustancial" sobre una región de las secuencias que es de al menos aproximadamente 50 residuos de longitud, más preferentemente sobre una región de al menos aproximadamente 100 residuos, y de mayor preferencia, las secuencias son sustancialmente idénticas sobre al menos 150 residuos, o sobre la longitud total de las dos secuencias que se comparan. Para la comparación de secuencia y la determinación de homología, típicamente una secuencia actúa como secuencia de referencia con la cual se comparan las secuencias de prueba. Al utilizar un algoritmo de comparación de secuencia, las secuencias de prueba y de referencia se introducen a una computadora, se diseñan coordenadas de - - secuencia, si es necesario, y se diseñan los parámetros del programa de algoritmo de secuencia. El algoritmo de comparación de secuencia calcula entonces la identidad de secuencia porcentual para la(s) secuencia (s) de prueba relativas a la secuencia de referencia, en base a los parámetros de programa diseñados . La alineación óptima de secuencias para comparación puede conducirse, e.g., mediante el algoritmo de homología local de Smith & Waterman Ad . Appl . ath. 2:482 (1981), mediante el algoritmo de alineación de homología de Needleman & Wunsch, J. Mol. Biol . 48:443 (1970), mediante el método de búsqueda de similitud de Pearson & Lipman Proc. Nati. Acad. Sci . EUA 85:2444 (1988), mediante la implementación computarizada de estos algoritmos (GAP, BESTFIT, FASTA Y TFASTA en el Wisconsin Genetics Software Package, Genetics Computer Group, 575 Science Dr. Madison, WI) , o mediante inspección visual (ver generalmente, Ausubel et al., infra) . Un ejemplo de un algoritmo adecuado para determinar la identidad de secuencia porcentual y la similitud de secuencia es el algoritmo BLAST, que se describe en Altschul et al., J. Mol. Biol. 2125:403-410 (1990). El software para llevar a cabo el análisis BLAST se encuentra públicamente disponible a través del National Center for Biotechnology Information (www.ncbi.nlm.nih.gov/) . Este algoritmo implica primero identificar pares de secuencia de alta puntuación - - (HSPs) identificando palabras cortas de longitud W en la secuencia de solicitud, que ya sea igualan o satisfacen algún marcador de umbral de valor positivo T al alinearse con una palabra de la misma longitud en una secuencia de la base de datos . T se refiere como el umbral de marcador de la palabra vecina (Altschul et al . , supra) . Estos golpes de palabra vecina inicial actúan como semilla para iniciar las búsquedas para encontrar HSPs más largos que los contienen. Los golpes de palabra se extienden entonces en ambas direcciones a lo largo de cada secuencia durante tanto como pueda aumentar el marcador de alineación acumulativo. Los marcadores acumulativos se calculan utilizando, para secuencias de nucleótidos, los parámetros M (marcador de recompensa para un par de residuos iguales; siempre >0) , y N (marcador de castigo para residuos que no se igualan; siempre <0) . Para secuencias de aminoácidos, se utiliza una matriz de marcación para calcular el marcador acumulativo. La extensión de los golpes de palabra en cada dirección se detienen cuando: el marcador de alineación acumulativa cae por la cantidad X desde su máximo valor obtenido; el marcador acumulativo va a cero o más abajo, debido a la acumulación de una o más alineaciones de residuo de marcador negativo; o se alcanza el final de cualquiera de las secuencias. Los parámetros del algoritmo BLAST W, T, y X determinan la sensibilidad y velocidad de la alineación. El programa BLASTN (para - - secuencias de nucleótido) utiliza como fallas una longitud de palabra (W) de 11, una expectativa (?) de 10, un corte de 100, M=5, N=4 y una comparación de ambas cadenas. Para secuencias de aminoácido, el programa BLASTP utiliza como fallas una longitud de palabra (W) de 3 , una expectativa (E) de 10 y la matriz de marcador BLOSUM62 (ver Henikoff & Henikoff (1989) Proc. Nati. Acad. Sci. EUA 89:10915). Adicionalmente al cálculo de la identidad de secuencia porcentual, el algoritmo BLAST también efectúa un análisis estadístico de la similitud entre dos secuencias (ver, e.g., Karlin & Altschul, Proc. Nati . Acad. Sci. EUA 90:5873-5787 (1993)). Una medición de similitud proporcionada por el algoritmo BLAST es la probabilidad de la suma menor (P (N) ) , que proporciona una indicación de la probabilidad mediante la cual se presenta una igualdad entre dos secuencias de nucleótidos o de aminoácidos. Por ejemplo, un ácido nucleico se considera similar a una secuencia de referencia si la probabilidad de la suma menor en una comparación del ácido nucleico de prueba con el ácido nucleico de referencia es menor que aproximadamente 0.1, más preferentemente menor que aproximadamente 0.01, y de mayor preferencia menor que aproximadamente 0.001. Mutagénesis y Otras Técnicas de Biología Molecular Los textos generales que describen técnicas biológicas moleculares incluyen Berger y Kimmel, Guide to - - Molecular Cloning Techniques, Methods in Enzymology volumen 152 Academic Press Inc., San Diego, CA (Berger) ; Sambrook et al . , Molecular Cloning - A Laboratory Manual (2a Ed.) Vol . 1-3^ Cold Spring Harbor Laboratory, Cold Spring Harbor, New York, 1989 ("Sambrook") y Current Protocola in Molecular Biology, F. M. Ausubel et al., eds. Current Protocols, a joint venture between Greene Publishing Associates, Inc., y John Wiley & Sons Inc., (suplementado a través de 1999) ("Ausubel")). Los textos describen mutagenesis, el uso de vectores, promotores y muchos otros tópicos relevantes relacionados, e.g., con la generación de genes que incluyen codones selectores para la producción de proteínas que incluyen aminoácidos no naturales, ARNts ortogonales, sintetasas ortogonales y pares de los mismos. En la invención se utilizan diversos tipos de mutagénesis, e.g., para producir bibliotecas de ARNts, para producir bibliotecas de sintetasas, para insertar codones selectores que codifican para aminoácidos naturales en una proteína o polipeptido de interés. Éstos incluyen, pero no se limitan a, dirigida al sitio, mutagénesis de punto aleatorio, recombinación homologa, arrastre de ADN u otros métodos de mutagénesis recursivos, construcción quimérica, mutagénesis utilizando patrones, mutagénesis dirigida a oligonucleótidos, mutagénesis de ADN modificada por fosforotioato, mutagénesis utilizando ADN de doble ranura o - - lo similar, o cualquier combinación de las mismas. Los métodos adicionales adecuados incluyen reparación de no igualdad de punto, mutagénesis utilizando especies huésped deficientes en reparación, selección de restricción y purificación de restricción, mutagénesis de supresión, mutagénesis mediante síntesis total de gen, reparación de rompimiento de cadena doble, y lo similar. La mutagénesis, e.g., que implica estructuras quiméricas, también se incluye en la presente invención. En una modalidad, la mutagénesis puede guiarse mediante la información conocida de la molécula de origen natural o de la molécula alterada o mutada de origen natural, e.g., secuencia, comparaciones de secuencia, propiedades físicas, estructura cristalina o lo similar. Los textos y ejemplos anteriores encontrados en la presente describen estos procedimientos . Se encuentra información adicional en las siguientes publicaciones y referencias citadas en: Ling et al., Approach.es to DMA. mutagénesis: an overview, Anal Biochem. 254 (2) : 157-178 (1997); Dale et al., Oligonucleotide-directed random mutagénesis using the phosphorothioate method, Methods Mol . Biol . 57:369-374 (1996); Smith, In vitro mutagénesis Ann. Rev. Genet. 19:423-462 (1985); Botstein & Shortle, Strategies and applications of in vitro mutagénesis, Science 229:1193-1201 (1985) ; Cárter, Site-directed mutagénesis, Biochem. J. 237:1-7 (1986); Kunkel, The efficiency of oligonucleotide - - directed mutagenesis, en Nucleic Acids & Molecular Biology (Eckstein F. y Lilley D. M. J. eds, Springer Verlag, Berlín)) (1987) ; Kunkel, Rapid and efficient site-specific mutagenesis _without phenotipic select on Proc. Matl. Acad. Sci . EUA 82:488-492 (1985); Kunkel et al . , Rapid and efficient site- specific mutagenesis without phenotypic selection, Methods in Enzymol 154, 367-382 (1987); Bass et al . , Mutant Trp repressors with new DNA-binding specificities, Science 242:240-245 (1988); Methods in Enzymol 100:468-500 (1983); Methods in Enzymol 154:329-350 (1987); Zoller & Smith, Oligonucleotide directed mutagenesis using M13-derived vectors : an efficient and general procedure for the production of point mutations in any DNA fragment, Nucleic Acids Res. 10:6487-6500 (1982); Zoller & Smith, Oligonucleotide directed mutagenesis of DNA fragménts cloned into M13 vectors, Methods in Enzymol . 100:468-500 (1983); Zoller & Smith, Oligonucleotide directed mutagenesis: a simple method usinf two oligonucleotide primers and a single stranded DNA témplate, Methods in Enzymol . 154:329-350 (1987); Taylor et al., The use of phosphorothioate modxfied DNA in restriction enzyme reactions to prepare nicked DNA Nucí . Acids Res . 13:8749-8764 (1985); Taylor et al., The rapid generation of oligonucleotide directed mutagenesis al high frequency using phosphorothioate modxfied DNA Nucí . Acids Res. 13:8765-8787 (1985); Nakamaye & Eckstein, - - Inhibition of restriction endonuclease Nci I cleavage by phosphorothioate groups and its application to oligonucleotide directed mutagenesis Nucl . Acids Res . 14:9679-9698 (1986); Sayers et al., Y-T Exonucleases in phosphorothioate based oligonucleotide drected mutagenesis Nucí. Acids Res. 16:791-802 (1988); Sayers et al., Strand specific cleavage of phosphorothioate containing DNA by reaction with restriction endonucleases in the presence of ethidium bromide, (1988) Nucí . Acids Res . 16:803-814; Kramer et al., The gapped dúplex DNA approach to oligonucleotide directed mutation construction Nucl. Acids Res. 12:9441-9456 (1984) ; Kramer & Fritz, Oligonucleotide directed constructions of mutation via gapped dúplex DNA, Methods in Enzymol. 154:350-367 (1987); Kramer et al., Improved enzymatic in vitro reactions in the gapped dúplex DNA approach to oligonucleotide directed construction of mutations, Nucleic Acids Res . 16:7207 (1988); Fritz et al., Oligonucleotide directed construction of mutations: a gapped dúplex DNA procedure without enzymatic reactions in vitro, Nucl . Acids Res . 16:6987-6999 (1988); Kramer et al., Point mismatch repair, Cell, 38:879-887 (1984); Cárter et al., Improved oligonucleotide site directed mutagenesis using M13 vectors Nucl. Acids Res 13:4431-4443 (1985) ;_Carter, Improved oligonucleotide directed mutagenesis usinf M13 vectors, Methods in Enzymmol 154:382-403 (1987); Eghtedarzadela & - - Heinkoff, Use of oligonucleotid.es to genérate large deletions, Nucí. Acids Res. 14:5115 (1986); Wells et al., Importance of Hydrogen bond formation in stabilizing t e transition state of subtilisin, Phil Trans. . Soc. Lond A 317:415-423 (1986=; Nambar et al., Total synthesis and cloning of a gene coding for the ribonuclease S protein, Science 223-1299-1301 (1984) ; Sakamar y horana, Total synthesis and expression of a gene for the a-subunit of bpvine rod outer segment guanine nucleotide binding protein (transducin) , Nucí. Acids Res. 14:6361-6372 (1988); Wells et al . , Cassette mutagenesis : an efficient method for generation of múltiple mutations at defined sites, Gene 34:315-323 (1985); Grundstróm et al., Oligonucleotide directed mutagenesis by microscale ¾shot-gun' gene synthesis, Nucí . Acids Res . 13:3305-3316 (1985); Mandecki , Oligonucleotide directed doble strand break repair in plasmids of Escherichia coli: a method for site specific mutagenesis, Proc . Nati . Acad. Sci. EUA 83:7177-7181 (1986); Arnold, Protein engineering for unusual evironments, Current opinión in biotechnology 4:450-455 (1993); Sieber et al., Nature Biotechnology, 19:456-460 (2001), W. P. C. Stemmer Nature 370, 389-91 (1994); y I. A. Lorimer, I. Pastan, Nucleic Acids Res . 23, 3067-8 (1995) . Pueden encontrarse detalles adicionales en muchos de los métodos anteriores en Methods in Enzymology Volumen 154, que describe también controles útiles - - para problemas con diversos métodos de mutagénesis. La invención también se refiere a células huésped eucarióticas y organismos para la incorporación in vivo de un aminoácido no natural a través de pares de ARNt/O-RS ortogonales. Las células huésped se fabrican genéticamente (e.g., transformadas, transducidas o transfectadas) con los polinucleótidos de la invención o estructuras que incluyen un polinucleótido de la invención, e.g., un vector de la invención, que puede ser, por ejemplo, un vector de clonación o un vector de expresión. El vector puede encontrarse, por ejemplo, en forma ded un plásmido, una bacteria, un virus, un polinucleótido desnudo, o un polinucleótido conjugado. Los vectores se introducen en células y/o microorganismos mediante métodos estándar incluyendo electroporacion (From et al., Proc. Nati. Acad. Sci . EUA 82, 5824 (1985), infección por vectores virales, penetración balística a alta velocidad mediante pequeñas partículas con el ácido nucleico ya sea dentro de la matriz de pequeñas perlas de partículas, o en la superficie (Klein et al., Nature 327, 70-73 (1987)). Las células huésped fabricadas se cultivan en un medio nutritivo convencional modificado según sea apropiado para actividades tales como, por ejemplo, etapas de selección, activación de promotores o selección de transformadores . Estas células pueden cultivarse opcionalmente en organismos transgénicos . Otras referencias - 1 6 - útiles, e.g., para aislamiento y cultivo de células (e.g., para aislamiento subsecuente del ácido nucleico) incluyen Freshney (1994) Culture of animal cells, a manual of basic technique, tercera edición, Wiley-Liss, New York y las referencias citadas en la misma: Payne et al., (1992), Plant Cell and Tissue Culture in Liquid Systems John Wiley & Sons, Inc., New York; Gamborg y Phillips (eds) (1995) Plant Cell Tissue and Organ Culture: Fundamental Methods Springer Lab Manual, Springer-Veriag (Berlin Heidelberg New York) y Atlas y Parks (eds) The Handbook of Microbiological Media (1993) CRC Press, Boca Ratón, FL. Se encuentran disponibles diversos métodos muy conocidos para introducir ácidos nucleicos objetivo en células, de los cuales cualquiera puede utilizarse en la invención. Estos incluyen: fusión de las células receptoras con protoplastos bacteriales conteniendo el ADN, electroporación, bombardeo de proyectiles, e infección con vectores virales (tratada anteriormente, abajo), etc. Las células bacteriales pueden utilizarse para amplificar el número de plásmidos que contienen estructuras de ADN de esta invención. Las bacterias crecen hasta la fase log y los plásmidos dentro de las bacterias pueden aislarse mediante una diversidad de métodos conocidos en la técnica (ver, e.g., Sambrook) . Adicionalmente, una multitud de equipos se encuentran comercialmente disponibles para la purificación de plásmidos de bacterias (ver, e.g., EasyPrep TM, FlexiPrep TM, ambos de Pharmacia Biotech; StrataClean TM, de Stratagene; y QIAprep TM de Qiagen) . Los plásmidos aislados y purificados se manipulan entonces adicionalmente para producir otros plásmidos, utilizados para transfectar células o incorporarse en vectores relacionados para infectar organismos . Los vectores típicos que contienen secuencias de terminaciones de transcripción y traducción y de iniciación de transcripción y traducción, y los promotores útiles para la regulación de la expresión del ácido nucleico objetivo particular. Los vectores comprenden opcionalmente casetes de expresión genérica que contienen al menos una secuencia de terminación independiente, secuencias que permiten la replicación del cásete en eucariotos, o procariotos, o ambos (e.g., vectores shuttle) y marcadores de selección para sistemas tanto procarióticos como eucarióticos . Los vectores son adecuados para la replicación e integración en procariotos, eucariotos o preferen emente ambos. Ver, Giliman & Smith, Gene 8:81 (1979); Roberts et al., Nature, 328-731 (187); Schneider B. et al., Protein Expr. Purif. 6435:10 (1995); Ausubel, Sambrook, Berger (todos supra) . Se proporciona un catálogo de Bacterias y Bacteriófagos útiles para la clonación, e.g., por el ATCC; e.g., The ATCC Catalogue of Bacteria and Bacteriophage (1992) Gherna et al., (eds) publicado por el ATCC. También se encuentran otros aspectos de biología - - molecular y que subrayan las consideraciones teóricas en Watson et al., (1992) Recombinant DNA Second Edition Scientific American Books, NY. Adicionalmente, esencialmente cualquier ácido nucleico (y virtualmente cualquier ácido nucleico marcado, ya sea estándar o no estándar) puede ordenarse adaptado o estándar de una diversidad de fuentes comerciales, tal como la Midland Certified Reagent Company (Midland TX mcrc.com), The Great American Gene Company (Ramona, CA disponible en la red mundial en genco.com) , ExpressGen Inc., (Chicago, IL disponible en la red mundial en expressgen.com), Operon Technologies Inc., (Alameda, CA) y muchas otras . EQUI OS También los equipos son una característica de la invención. Por ejemplo, se proporciona un equipo para producir una proteina que comprende al menos un aminoácido no natural en una célula, en donde el equipo incluye un contenedor que contiene una secuencia de polinucleótidos que codifica para un O-ARNt y/o un O-ARNt, y/o una secuencia de polinucleotido que codifica para una O-RS y/o una 0-RS. En una modalidad, el equipo incluye además al menos un aminoácido no natural. En otra modalidad, el equipo comprende además materiales instructivos para producir la proteína . EJEMPLOS - - Los siguientes ejemplos se ofrecen para ilustrar, pero no para limitar, la invención reivindicada. El experto reconocerá una diversidad de parámetros no críticos que pueden alterarse sin apartarse del alcance de la invención rei indicada . EJEMPLO 1: METODOS PARA PRODUCIR COMPOSICIONES DE AMINOACIL-ARNt SINTETASAS QUE INCORPORAN AMINOÁCIDOS NO NATURALES EN CÉLULAS EUCARIOTICAS La expansión del código genético eucariótico para incluir aminoácidos no naturales con nuevas propiedades físicas, químicas o biológicas proporciona poderosas herramientas para analizar y controlar la función de las proteínas en estas células. Hacia esta meta, se describe un procedimiento general para aislar aminoacil-ARNt sintetasas que incorporan aminoácidos no naturales con alta fidelidad en proteínas en respuesta a un codón ámbar en Saccharomyces cerevisiae (S. cerevisiae) . El método se basa en la activación de los genes informantes que responden a GAL4, HIS3, URA3 o LacZ, mediante la supresión de los codones ámbar entre el dominio de enlace de ADN y el dominio de activación de transcripción de GAL4. Se describe la optimización del informante GAL4 para la selección positiva de variantes de tirosil-ARNt sintetasa de Escherichia coli (EcTyrRS) . También se ha desarrollado una selección negativa de las variantes de EcTyrRS con el informante URA3 mediante el uso - 90 - de una molécula pequeña (ácido 5-fluroótico (5-FOA) agregado al medio de crecimiento como un ? alelo tóxico' . De manera importante, las selecciones tanto positiva como negativa pueden llevarse a cabo en una sola célula y con un rango de rigidez. Esto puede facilitar el aislamiento de un rango de actividades de la aminoacil-ARNt sintetasa (aaRS) proveniente de grandes bibliotecas de sintetasas mutantes. El poder del método para aislar los fenotipos aaRS deseados se demuestra mediante selecciones modelo. La reciente adición de aminoácidos no naturales al código genético de Escherichia coli (E. coli) proporciona un poderoso nuevo procedimiento para analizar y manipular la estructura de la protexna y funcionar tanto in vitro como in vivo. Los aminoácidos con marcas de fotoafinidad, átomos pesados, grupos ceto y olefínicos y cromóforos se han incorporado en proteínas en E. coli con una eficiencia y fidelidad que rivaliza con la de los veinte aminoácidos comunes. Ver, e.g., Chin et al., Addition of a Photocrosslinker to the Genetic Code of Escherichia coli Proc. Nati. Acad. Sci . EUA 99:11020-11024; Chin y Schultz (2002) In vivo photocrosslinking with unnatural amino acid mutagénesis Chem. BioChem. 11:1135-1137; Chin et al., (2002) Addition of p-azido-L-phenílalanine to the genetic code of Escherichia coli J. Am. Chem. Soc. 124:9026-9027; Zhang et al., (2002), The selective incorporation of alkenes into - - proteins in Escherichia coli Angewandte Chemie International Ed. In English 41:2840-2842; y Wang y Schultz (2002), Expanding the genetic code, Chem. Comm. 1-10. Los aminoácidos no naturales se han introducido previamente en el receptor de acetilcolina nicotínico en oocitos xenopus (e.g., M. . Nowak, et al., (1998), In vivo incorporation of unnatural aminoacids into ion channels in xenopus oocyte expression system, Method Enzymol 293:504-529) mediante microinyección de AR t de tetrahymena thermophila mal acilado (e.g., M. E. Sanks et al., (1996), An engineered tetrahymena tARNGln for in vivo incorporation of unnatural amino acids into proteins by nonsense suppression, J~ . Biol. Chem. 271:23169-23175 y el ARNm relevante. Esto ha permitido estudio biofísicos del receptor en oocitos mediante la introducción de aminoácidos que contienen cadenas laterales con propiedades físicas o químicas únicas. Ver, e.g., D. A. Dougherty (2000) , Unnatural amino acids as probes of protein structure and function, Curr. Opin. Chem. Biol. 4:465-652. Desafortunadamente, esta metodología se limita a proteínas en células que pueden microinyectarse, y debido a que el ARNt se aminoacila químicamente in vitro, y no puede re-acilarse, los rendimientos de proteína son muy bajos. Este a su vez necesita técnicas sensibles para analizar la función de proteínas . Existe interés en la incorporación genética de - - aminoácidos no naturales en proteínas en células eucarióticas en respuesta a un codón ámbar. Ver también H. J. Drabkin et al., (1996), Amber suppression in mammalian cells dependent upon expression of an Escherichia coli aminoacyl-tRNA sintetasa gene, Molecular & Cellular Biology 16:907-913; A. K. Kowal et al., (2001), Twenty first aminoacyl-tRENA sintetasa suppressor tRNA pairs for possible use in site specific incorporation of amino acid analogues into proteins in eukaryotes and in eubacteria [comment] , Proc. Nati. Acad. Sci . EUA 98:2268-2273; y K. Sakamoto et al., (2002), Site specific incorporation of an unnatural amino acid into proteins in mammalian cells, Nucleic Acids Res. 30:4692-4699. Esto tendría significativas ventajas técnicas y prácticas dado que los ARNts se re-acilarían mediante sus sintetasas cognado conduciendo a grandes cantidades de proteína mutante. Además, las aminoacil-ARNt sintetasas y los ARNts genéticamente codificados, son en principio heredables, permitiendo que el aminoácido no natural se incorpore en proteínas a través de muchas divisiones celulares sin dilución exponencial. Las etapas necesarias para agregar nuevos aminoácidos al código genético de E. coli se han descrito (ver, e.g., D. R. Liu & P. G. Schultz (1999), Progress toward the evolution of an organism with an expanded genetic code, Proc. Nati. Acad. Sci. EUA 96:4780-4785; y pueden utilizarse - - principios similares para extender el código genético de eucariotos . En la primera etapa, se identifica el par de aminoacil-ARNt sintetasa ortogonal (aaRS) /ARNtcua. Este par necesita funcionar con la maquinaria de traducción de las células huésoped, pero laa aaRS no debe cargar ningún ARNt endógeno con un aminoácido y el ARNtCuA no debe aminoacilarse mediante sintetasas endógenas. Ver, e.g., D. R. Liu et al., Engineering a tRNA and aminoacyl-tRNA synthetasa for the site specific incorporation of unnatural amino acids into proteins in vivo, Proc. Nati, Acad. Sci . EUA 94:10092-10097. En una segunda etapa, los pares de aaRs/ARNt que son capaces de utilizar solo el aminoácido no natural se seleccionan de una biblioteca de aaRSs mutantes . En E. coli, la selección de los aminoácidos no naturales que utilizan variantes de MjTyrRS se llevó a cabo utilizando selecciones de 'corte doble' en dos etapas. Ver, e.g., D. R. Liu & P. G. Schultz (1999) , Progress toward the evolution of an organism with an expanded genetic code Proc. Nati, Acad. Sci. EUA 96:4780-4785. Se utiliza un método de selección modificado en células eucarióticas . Se seleccionó Saccharomyces cerevisiae (S. cerevisiae) como el organismo eucariótico huésped, dado que es unicelular, tiene un tiempo rápido de generación, así como genética relativamente bien caracterizada. Ver. E.g., D. Burke et al., (2000) Methods in Yeast Genetics Cold Spring - - Harbor Laboratory Press, Cold Spring Harbor, N.Y. Además, dado que la maquinaria de traducción de eucariotos se encuentra altamente conservada (ver, e.g., (1996) Translational Control Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y; Y. K ok & J. T. Wong, (1980) , Evolutionary relationships between Halobacterium cutirubrum and eukaryotes determxned by use of aminoacyl-tRNA sintetasas as phylogenetic probes, Canadian Journal of Biochemistry 58:213-218; y (2001) The Ribosome Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y) , es probable que los genes de aaRSs para la incorporación de aminoácidos no naturales descubiertos en S. cerevisiae puedan 'cortarse y pegarse' en organismos eucarióticos mayores y utilizarse en sociedad con los ARNts cognado (ver, e.g. , K. Sakamoto, et al., (2002) Site specific xncorporation of an unnatural amino acid into proteins in mammalian cells, Nucleic Acids Res. 30:4692-4599; y C. Kohrer et al., (2001), Import of amber and ochre suppressor tRNAs into mammalian cells : a general approach to site specific insertion of amino acid analogues into proteins, Proc . Nati, Acad. Sci. EUA 98:14310-14315) para incorporar aminoácidos no naturales . La expansión del código genético de S. cerevisiae es en consecuencia una puerta hacia la expansión del código genético de complejos organismos eucarióticos multicelulares. Ver, e.g., M. Buvoli et al., (2000), Suppression of nonsense mutations in cell - - culture and mice by multimerized suppressor tRNA genes, Molecular & Cellular Biology 20:3116-3124. El par tirosil derivado de TyrRS de Methanococcus jannaschii (Mj yrRS) /ARNt (ver, e.g., L. Wang & P. G. Schultz, (2002), Expanding the genetic code, Chem. Comm. 1-10) que se utilizó previamente para expandir el código genético de E. coli no es otrogonal en organismos eucarióticos (e.g., P. Fechter et al., (2001), Major tyrosine identity determinants in Methanococcus jannaschii and Saccharomyces cerevisiae tR A (Tyr) are conserved but expressed differently, Eur. J. Biochem. 268:761-767) y un nuevo par ortogonal se requiere para expandir el código genético eucariótico. Schimmel y colaboradores han mostrado que el par tirosil-ARNt sintetasa de E. Coli (EcTyrRS) / RNtcuA suprime los codones ámbar en S. cerevisiae, y que el ARNtam de E. coli no se encuentra cargado por aminoacil-ARNt sintetasas endógenas en el citosol de levadura (Figura 2) . Ver, también e.g., H. Edwards et al., (1991), An Escherichia coli tyrosine transfer RNA is a leucine-specific transfer RNA in the yeast Saccharomyces cerevisiae, Proc . Nati, Acad. Sci . EUA 88:1153-1156; y H. Edwards & P. Schimmel (1990), A bacterial amber suppressor in Saccharomyces cerevisiae is selectively recognized by a bacterial aminoacyl-tRNA synthetasa, Molecular & Cellular Biology 10:1633-1641. Adicionalmente, la EcTyrRS ha mostrado no cargar ARNt de levadura in vivo. Ver, e.g., ?. Kwok & J.
- - T. Wong (1980), Evolutionary relationships between Halobacterium cutirubrum and eukaryotes determined by use of aminoacyl-tRNA sintetasas as phylogenetic probes, Canadian Joural of Biochemistry 58:213-218; B. P. Doctor et al . , (1996), Studies on the species specificity of yeast and E. coli tyrosine tRNAs, Cold Spring Harbor Symp . Quant . Biol . 31:543-548; y K. akasugi et al . , (1998), Genetic code in evolution: switc ing species specific aminoacylation with a peptide transplant, E BO Journal 17:297-305. De este modo, el par EcTyrRS/ARNtCTA es un candidato para un par ortogonal en S. cerevisiae, así como en eucariotos mayores (e.g., A. K. Kowal et al., (2001), T enty first aminoacyl-tRMA sintetasa suppressor tR A pairs for possible use in site specific incorporation of amino acid analogues into proteins in eukaryotes and in eubacteria [comment] , Proc. Nati, Acad. Sci. EUA 98 (2001) 2268-2273) . Para ampliar la especificidad del substrato de EcTyrRS en E. coli, Nishimura y colaboradores seleccionaron una biblioteca generada de PCR propensa a error de mutantes de ExTyrRS y descubrieron un mutante con una capacidad mejorada para incorporar 3-azatirosina. Ver, e.g., F. Hamano-Takaku et al., (2000), A mutant Escherichia coli tyrosyltRMA sintetasa utilizes the unnatural amino acid azatyrosine more efficiently than tyrosine, J. Biol. Chem. 275:40324-40328. Sin embargo, este aminoácido se incorpora - - en todo el proteoma de E. coli y la enzima desarrollada aún prefiere tirosina como substrato. Yokoyama y colaboradores seleccionaron una pequeña colección de variantes diseñadas activas en el sitio de EcTyrRS en un sistema de traducción en germen de trigo y descubrieron una variante de ExTyrRS que utiliza 3 -yodotirosina más eficientemente que tirosina. Ver D. Kiga et al., (2002), An engineered Escherichia coli tyrosyltRA sintetasa for site specific incorporation of an unnatural amino acid into proteins in eukaryotic translation and its application in a wheat germ cellfree system Proc . Nati, Acad. Sci. EUA 99:9715-9720. En contraste con las enzimas hemos desarrollado en E. coli (e.g., J. W. Chin et al., (2002), Addition of a Photocrosslinker to the Genetic Code of Escherichia coli Proc. Nati, Acad. Sci. EUA 99:11020-11024; J. W. Chin et al., (2002), Addition of p-azido-L-phenilalanine to the genetic code of Escherichia coli, J. Am. Chem. Soc. 124:9026-9027; L. Wang et al., (2001), Expanding the genetic code of Escherichia coli, Science 292:498-500; y L. Wang et al., (2002), Adding L-3 - (2-naphtyl) alanine to the genetic code of E coli, J. Am. Chem. Soc. 124:1836-1837), esta enzima aún se incorpora a tirosina en ausencia del aminoácido no natural. Ver e.g., D. Kiga et al., (2002), An engineered Escherichia coli tyrosyl-tRNA sintetasa for site specific incorporation of an unnatural amino acid into proteins in eukaryotic translation and its application in a - - wheat germ cellfree system Proc. Nati, Acad. Sci. EUA 99:9715-9720. Recientemente, Yokoyama y colaboradores han demostrado también que este mutante de EcTyrRS funciona con un ARNtcuA de Bacillus stearothermophilus para suprimir los codones ámbar in células de mamífero. Ver, e.g., Sakamoto et al., (2002), Site specific incorporation of an unnatural amino acid into proteins in mammalian cells, Nucleic Acids Res. 30:4692-4699. Un requerimiento es que el aminoácido agregado al código genético eucariótico se incorpore con una fidelidad similar a la de los veinte aminoácidos comunes. Para lograr esta meta, se ha utilizado un método de selección in vivo general para descubrir variantes de EcTyrRS/ARNtcuA cnie uncionan en S . cerevisiae para incorporar aminoácidos no naturales, pero ninguno de los amonoácidos comunes en respuesta al codón ámbar TAG. Una ventaja principal de una selección es que las enzimas que incorporan selectivamente aminoácidos no naturales pueden seleccionarse rápidamente y enriquecerse de bibliotecas de variantes 108 del sitio activo de EcTyrRS, 6-7 órdenes de magnitud más diversos que los seleccionados in vivo. Ver, e.g., D. iga et al., (2002), An engineered Escherichia coli tyrosyl-tRNA sintetasa for site specific incorporation of an unnatural amino acid into proteins in eukaryotic translation and its application in a wheat germ cellfree system Proc. Nati, Acad. Sci. EUA - - 99:9715-9720. Este aumento en la diversidad aumenta vastamente la probabilidad de aislar las variantes de ExTyrRS para la incorporación de un diverso rango de funcionalidad útil con muy alta fidelidad. Ver, e.g., L. ang & P. G. Schultz (2002), Expanding the genetic code, Chem. Comm. 1-10. Para extender el procedimiento de selección a S . cerevisiae, se utilizó la proteína activadora de transcripción, GAL4 (ver Figura 1) . Ver, e.g., A. Laughon et al-, (1984), Identification of two proteins encoded Joy the Saccharomyces cerevisiae GAL4 gene, Molecular & Cellular Biology, 4:268-275; A. Laughon & R. F. Gesteland, (1984), Primary structure of the Saccharomyces cerevisiae GAL4 gene, Molecular & Cellular Biology, 4:260-267; L. Keegan et al., (1986) , Separation of DNA hinding from the transcription activating function of a eukariotic regulatory protein, Science, 231:699-704; y M. Ptashne (1988), How eukariotic transcriptional activators work, Nature, 335:683-689. Los 147 aminoácidos de terminación M de esta proteína de 881 aminoácidos forman un dominio de enlace de ADN (DBD) que enlaza la secuencia de ADN específicamente. Ver, e.g., M. Carey et al., (1989), An amino- erminal fragment of GAL4 binds DNA as a dimer, J. Mol. Biol . 209:423-432; y E. Giniger et al., (1985), Specific DNA binding of GALA, a positive regulatory protein of yeast, Cell, 40:767-774. El DBD se enlaza, por medio de una secuencia de proteína que - - interviene, a un dominio de activación de 113 aminoácidos de terminación C (AD) que puede activar la transcripción cuando se enlaza al ADN. Ver, e.g., J. Ma, & . Ptashne (1987), Deletion analysis of GAL4 defines two transcriptional activating segmente, Cell, 48:847-853; y J. Ma, & M. Ptashne (1987) , The carboxy-terminal 30 amino acids of GAL4 are recognized by GAL80, Cell, 50:137-142. Nos dimos cuenta que colocando codones ámbar hacia el DBD de terminación N de GAL4 y su AD de terminación C, puede enlazarse la supresión ámbar por medio del par ExTyrRS/AENtCua a la activación de transcripción por medio de 6AL4 (Figura 1, Panel A) . Mediante la selección de los genes informantes GAL4 activados adecuados pueden llevarse a cabo las selecciones tanto positiva como negativa con el gen (Figura 1, Panel B) . Aunque pueden utilizarse muchos genes informantes en base a complementar la auxotrofia de una célula para las selecciones positivas (e.g., URA3 , LEU2 , HIS3, LYS2) , el gen HIS3 es un atractivo gen informante, dado que la actividad de la proteína para la que codifica (imidazolo glicerol fosfato dehidratasa) puede modularse en una dosis dependiente de la manera mediante adición de 3 -aminotriazolo (3-AT) . Ver, e.g., G. M. Kishore & D. M. Shah, (1988), Amino acid biosynthesis inhibitors as herbicides, Annual Review of Biochemistry, 57:637-663. En S. cerevisiae se han utilizado menos genes para las selecciones negativas. Una de varias - - estrategias de selección negativa (ver, e.g., A. J. DeMaggio, et al., (2000), The yeast split hybrid system, Method Enzymol . 328:128-137; H. M. Shi et al., (1996), A positive genetic selection for disrupting protein-protein interactions: identifícation of CREB mutations that prevent association with the coactivator CBP, Proc. Nati. Acad. Sci. EUA, 93:13896-13901; M. Vidal et al., (1996), Genetic characte ization of a mammalian protein-protein interaction domain by using a yeast reverse two hybrid system [comment] , Proc. Nati. Acad. Sci. EUA 93:10321-10326; y M. Vidal et al., (1996) , Reverse two hybrid and one hybrid systems to d tect dissociation of protein-protein and DNA-protein interactions [comment], Proc. Nati. Acad. Sci. EUA, 93:10315-10320) que se ha utilizado con éxito es el sistema de selección negativa con ácido URA3/5-fluroorótico (5-FOA) (e.g., J. D. Boeke et al., (1984), A positive selection for Mutantes lacking orotidine-5' -phosphate decarboxilase activity in yeast: 5-fluoroorotic acid resistance, Molecular & General Genetics, 197:345-346) descrito en el sistema de 'reversa de dos híbridos' desarrollado por Vidal y colaboradores. Ver, M. Vidal et al., (1996), Genetic characterization of a mammalian protein-protein interaction domain by using a yeast reverse two hybrid system [comment] , Proc. Nati. Acad. Sci. EUA 93:10321-10326; y M. Vidal et al., (1996), Reverse two hybrid and one hybrid systems to detect dissociation of protein- - - protein and DNA-protein interactions [co ment] , Proc. Natl. Acad. Sci. EUA, 93:10315-10320. En el sistema de reversa de dos híbridos, se coloca un informante URA3 genómicamente integrado bajo un promotor estrechamente controlado que contiene sitios de enlace de GAL4 ADN. Cuando se producen dos proteínas que interactúan como fusiones del GAL4 DBD y GLA4 AD, reconsituyen la actividad de GAL4 y activan la transacripción de URA3. En presencia de 5-FOA, el producto del gen URA3 convierte el 5-FOA en un producto toxico destruyendo la célula. Ver, J. D. Boeke et al., supra. Esta selección se ha utilizado para proteínas que rompen una interacción de proteína-proteína y para mutaciones que rompen la interacción de proteína-proteína. Se ha descrito una variante para seleccionar inhibidores de molécula pequeña de interacción de proteína-proteína. Ver, e.g., J. Huang & S. L. Schreiber (1997) , A yeast genetic system for selecting small molecule inhibitors of protein-protein interactions in nanodroplets Proc. Nati. Acad. Sci. EUA 94:13395-13401. La selección apropiada de los codones ámbar en GAL4 de longitud total permite selecciones posaitivas eficientes para variantes de EcTyrRS activa utilizando ya sea HIS3 o los informantes activados URA3 GAL4 para complementar la auxotrofia de histidina o uracilo en células de levadura.
Además, el informante URA3 puede utilizarse en selecciones negativas para variantes de ExTyrRS inactiva en presencia de - - 5-FOA. Adicionalmente, pueden utilizarse análisis colorimétricos utilizando lacZ para leer la actividad de aminoacil-AR t sintetasa en células de levadura. RESULTADOS Y DISCUSIÓN El gen de EcTyrRS se expresó bajo el control del promotor ADH1 constitutivo y el gen ARNtCuA se expresó a partir de la misma copia alta del plásmido (pEcTyrRSARNtCuA/ Figura 1, Panel C) . al co-transformar el pEcTyrRSARNtCuA y una copia baj a del reportero que contiene una sola mutación ámbar entre el dominio de enlace de ADN y el dominio de activación de una estructura quimérica de GAL4 en MaV203, las células crecieron en el medio selectivo careciendo de histidina y conteniendo 10-20 mM de 3-AT (Figura 2) . Cuando las células MaV203 se transformaron con la misma estructura GAL4 y ya sea un mutante de sintetasa inactiva (A5) o una estructura que carece del gen EcARNt, no se observó ningún crecimiento e 10 mM 3-AT (Figura 2) . Estos experimentos establecen que la EcTyrRS puede expresarse constitutivamente en una forma funcional proveniente del promotor ADH1, que existe una mínima supresión endógena ámbar en MaV203, y que existe poca carga de EcARNtom por sintetasas de levadura en este sistema. Ver, e.g., H. Edwards et al., (1991), An Escherichia coli tyrosine transfer RNA is a leucine-specific transfer RNA in the yeast Saccharorayces cerevisiae, Proc . Nati, Acad. Sci. EUA 88:1153-1156; y H. Edwards & P. Schimmel - - (1990) , A bacterial amber suppressor in Saccharomyces cerevisiae is selectively recognized by a bacterial aminoacyl-tR A synthetasa, Molecular & Cellular Biology 10:1633-1641. Debido a que la EcTyrRS no carga ARNt de S. cerevisiae (e.g., Y. wok & J. T. Wong (1980), Evolutionary relationships between Halobacterium cutirubrum and eukaryotes determined by use of aminoacyl-tRNA sintetasas as phylogenetic probes, Canadian Joural of Biochemistry 58:213- 218; B . P. Doctor et al., (1996), Studies on the species specificity of yeast and E. coli tyrosine tRNAs, Cold Spring Harbor Sym . Quant . Biol . 31:543-548; y K. akasugi et al., (1998) , Genetic code in evolution: switching species specific aminoacylation with a peptide transplant, ???? Journal 17:297-305), estos experimentos confirman que EcTyrRS/EcARNtcuA son un par ortogonal en S. cerevisiae. Mientras que la primera generación de quimera GAL4 fue capaz de activar la transcripción del débil informante HIS3, fue incapaz de activar la transcripción del informante URA3 en MaV203 suficientemente para permitir un crecimiento significativo en concentraciones de 3-AT mayores que 20 mM o en placas -URA (Figura 2) . Para los propósitos de selección de variantes de EcTyrRS, se efectuó una segunda generación de estructura GAL4. Este informante GAL4 se diseñó para ser más activo, para tener un rango de dinámica mayor, y para evitar la acumulación de revertientes. Para aumentar la actividad - - de los informantes GAL4, se utilizó GAL4 de longitud total (que tiene una actividad de activación de transcripción de dos veces la de una fusión DBD-AD) (ver, e.g., J. Ma, & M. Ptashne (1987) , Deletion analysis of GAL4 defines two transcriptional activating seg ents, Cell, 48:847-853) bajo el control de un fuerte promotor ADHl, y se utilizó una copia alta de 2 mm del plásmido (con un número de copia de 10-30 veces el del plásmido centromérico de la quimera inicial GAL4) . Un incremento tanto en el número de copia del plásmido como en la actividad de la proteína para la cual codifica debe extender el rango de dinámica de los informantes. Las mutaciones ámbar se dirigieron a la región del gen GAL4 que codifica para los residuos de aminoácido 2 y 147 (Figura 3) . Esta región es suficiente para el enlace de ADN especifico de secuencia (ver, e.g., . Carey et al., (1989) , An amino-terminal fragment of GAL4 binds DNA as a dimer, J. Mol. Biol . 209:423-432; y E. Giniger et al., (1985) , Specific DNA binding of GAL4, a positive regulatory protein of yeast, Cell, 40:767-774, y reside en el lado 5' del primer dominio críptico de activación en el gen GAL4 (ver, e.g., J. Ma, & M. Ptashne (1987), Deletion analysis of GAL4 defines two transcriptional activating segments, Cell, 48:847-853), de modo que los productos truncados producidos en ausencia de la supresión ámbar no se anticipan pasra activar la transcripción. La selección de los codones de - - aminoácido que. van a mutarse se guió mediante previas selecciones de mutagénesis de saturación en GAL4 (ver, e.g., M. Johnston & J. Dover (1988) , Mutational analysis of the GAL4 encoded transcriptional activator protein of Saccharomyces cerevisiae, Genetics 120:63-74), así como estructuras de rayos X del dominio de enlace de ADM de terminación N de GAL4 (ver, e.g., R. Marmorstein et al., (1992), DNA recognition by GAL4 : structure of a protein DNA complex [comment], Nature , 356:408-414; y J. D. Baleja et al., (1992), Solution structure of the DNA binding domain of Cd2-GAAL4 from S. cerevisiae [comment], Nature 356:450-453) y la estructura N R de su región de dimerización. Ver, e.g., P. Hidalgo et al., (2001), Recruitment of the transcripcional machinery through GAL11P: structure and interactions of the GAL4 dimerization domain, Genes & Development 15:1007-1020. El GAL4 de longitud total se clonó en un pequeño vector basado en pUC para permitir la rápida construcción de 10 mutantes ámbar únicos (en los codones para los aminoácidos L3, 113, T44, F68, RUO, V114, T121, 1127, S131, T145) mediante mutagénesis dirigida al sitio. GAL4 y los mutantes ámbar resultantes se subclonaron entonces en un vector de levadura de 2 mm bajo el control del promotor ADH1 de longitud totaal para crear pGADGAL4 y una serie de mutantes ámbar denotaron pGADGAL4 (xxTAG) (Figura 1, Panel C) , en donde xx denota el codón de aminoácido en el gen GAL4 que fue - - mutado por el codón ámbar. Cada mutante GAL4 se co-transformó ya sea con ExTyrRS/ARNtCuA o A5/AR tCuA en células MaV203, convirtiendo los transformadores en protrofía de leucina y triptofano. pGADGAL4 en sí transformado con muy baja eficiencia (<10-3 veces la de los mutantes ámbar GAL4) y es presumiblemente dañino para las células MaV203 a tan alta copia; no se observó tal efecto con los mutantes ámbar de GAL4. Los fenotipos de informantes GAL4, en presencia de una sintetasa activa o muerta, se analizaron en placas de -TIRA, y placas de 5-FOA al 0.1% (Figura 3, Panel A) . Cinco mutantes GAL4 (L3TAG, I13TAG, T44 AG, F68TAG, S131TAG) crecieron en placas de -URA y no crecieron en 5-FOA al 0.1% en presencia de EcTyrRS ya sea de tipo silvestre o inactivo. En estos mutantes ámbar, la supresión endógena es aparentemente suficiente para impulsar la supresión mediada por EcTyrRS/A NtcuA m s allá del rango de dinámica del informante URA3 en MaV203. Cinco mutantes ámbar GAL4 únicos (R110TAG, V114TAG, T121TAG, I127TAGM T145TAG) crecieron en ausencia de uracil y en presencia de EcTyrRS/ARNtCuA (pero no de A5/ARNtCuA.) y mostraron el fenotipo de reversa en 5-FOA. Estos mutantes muestran fenotipos dependientes de ExTyrRS que caen dentro del rango de dinámica del informante URA3 en MaV203. El fenotipo dependiente de EcTyrRS más limpio tanto en -URA como en 5-FOA al 0.1% se observó con el mutante - - R110TAG de GAL4. Sin embargo, este mutante mostró algo de color azul en análisis de X-GAL al co-transformarse con A5. Para mejorar adicionalmente el rango de dinámica, se preparó una serie de seis imitantes ámbar dobles de GAL4 conteniendo R110TAG (Figura 3, Panel B) , (L3TAG, R110TAG, I13TAG, R110TAG, T44TAG, R110TAG, R110TAG, T121TAG, R110TAG, I127TAG, R110TAG, T145TAG) . Cuatro de estos mutantes dobles (I13TAG, R110TAG, R110TAG, T121TAG, R110TAG, I127TAG y T145TAG, R110TAG) , fueron inacapaces de crecer en ausencia de uracil y crecieron en 5-FOA al 0.1%. Estos mutantes dobles tienen actividades fuera (por debajo) del rango de dinámica de los análisis de placa. Dos de los mutantes dobles (L3TAG, R110TAG Y T44TAG) crecvieron en presencia del tipo silvestre de EcTyrRS/ARNtcuA pero no con A5/ARNtCuA en placas -URA estos mutanters también mostraron los fenotipos recíprocos esperados en 5-FOA. PGADGAL4 (T44TAG, R110TAG) , el más activo de estos dos mutantes GAL4 , se seleccionó para una caracterización más detallada (Figura 4) . MaV203 conteniendo pGADGAL4 (T44TAG, RUO AG/pEcTyrRS/ARNtCOA fueron azules en X-GAL pero la especie correspondiente conteniendo pA5/ARNTCuA no. De manera similar, el MaV203 conteniendo pGADGAL4 (T44TAG, RUOTAG/pEcTyrRS/ARNtCÜA creción rovustamente en placas con concentraciones de 3-AT de hasta 75 mM y en placas -URA, pero la especie correspondiente conteniendo pA5/ARNtCuA no creció en 10 mM de 3AT o en ausencia de uracilo. Tomados - - juntos los fenotipos dependientes de EcTyrRS de pGADGAL4 (T44TAG, R110TAG) pueden extender el rango de dinámica de los informantes URA3 , HIS3 y lacZ en MaV203. Fue de interés determinar la actividad de imitantes GAL4 en los cuales T44 o RUO se sustituyeron con aminoácidos diferentes a tirosina, dado que es posible que la capacidad de sustituir aminoácidos variados son alterar la actividad de GAL4 sea útil para la selección de aminoacil-AR t sintetasas mutantes que pueden incorporar aminoácidosno naturales en proteínas. Ver, e.g., M. Pasternak, et al., (2000), A new orthogonal suppressor tRNA aminoacyl-tRNA synthetasa pair for evolving an organism with an expanded genetic code, Helvética Chemica Acta 83-2277. Una serie de cinco mutantes del residuo T44 en GAL4, (T44Y, T44W, T44F, T44D, T44 ) se construyó en pGADGAL4 (R110TAG) , dado que pGADGAL4 en sí es tóxico. Se construyó una serie similar de mutantes en la posición RUO en GAL4 , (R110Y, R110W, R110F, R110K) en pGADGAL4 (T44TAG) . Estos mutantes se inclinan hacia las grandes cadenas laterales hidrófobas de aminoácido en las que nos interesamos para incorporar en proteínas, pero también contienen residuo cargado positiva y negativamente como prueba rígida de permisividad. Cada mutante se co-transformó con pEcTyrRS/ARNtcuA en células MaV203 y leu+ y trp+ aislados se analizaron para la producción de lacZ mediante hidrólisis de orto-nitrofenil-b-D-galactopiranosida (ONPG) (Figura 5) .
- - La variación en la actividad entre las células que contienen GAL4 con diferentes aminoácidos sustituidos por T44 o RUO fue menor que 3 veces en todos los casos . Esta mínima variación demuestra la permisividad de estos sitios para una sustitución de aminoácido sin alterar la actividad de transcripción de GAL . Como se esperaba de la actividad de los mutantes ámbar únicos analizados en placas de selección, los mutantes de T44 preparados en la estructura GAL4 (R110TAG) conducen a una hidrólisis más lenta de ONPG que los mutantes de RUO preparados en la estructura GAL4 (T44TAG) . Se llevaron a cabo estudios de enriquecimiento modelo para examinar la capacidad del sistema para seleccionar una sintetasa activa de un gran exceso de sintetasas inactivas (Tabla 1, Tabla 2, Figura 6). Esta selección modela la capacidad para seleccionar sintetasas activas de una biblioteca de variantes en presencia de un aminoácido no natural. Las células MaV203 que contienen el GAL4 (T44, RUO) y Ec yrRS/ARNtCuA juzgar tanto por ODseo como por la fracción de colonias que se volvió azul al colocarse en placas en medio -leu, -trp no selectivo y analizadas por X-GAL se reposan. Aquellas células capaces de sobrevivir en 3-AT o -URA que fueron azules en el análisis X-GAL con las que fueron blancas, al compararse a la misma proporción en ausencia de selección, demuestran claramente que las selecciones positivas pueden enriquecer las - - sintetasas activas de las sintetasas muertas mediante un factor > 105 (Tabla 1) . La medición de enriquecimientos precisos para proporciones iniciales mayores que 1:105 fue generalmente no posible, debido a que no pueden colocarse en placas más de 105 células convenientemente sin un cruce significativo entre las células conduciendo a fenotipos no confiables . TABLA 1. SELECCIONES POSITIVAS MODELO PARA EcTyrRS FUNCIONALES Tasa de ln¡c¡o,EcYRS:A5a 1:10 1:10 1:103 1:104 1:10a Dilusión Celular 103 10* 103 10 103 1 103 -Leu.Trp (#blue) 1360(81) 1262 (0) >103(1) 1774(0) >10 (-) 1092(0) >104(-) 1472(0) -lira (#blueb) 152(152) 9(9) 8(8) 0(-) 5 (5) 0 (-) 16(14) 0(-) -His + 50 mM3AT (#blueb) 135 (135) 7(7) 0 (-) 0 (-) 3 (3) 0 (-) 10(10) 0(-) Factor de enriquecimiento >10 >10 >103 >104 >10° a) Determinado por b) Sobre X-GAL TABLA 2. SELECCIONES NEGATIVAS MODELO PARA EcTyrRS (A5) NO FUNCIONALES Tasa de lnicio,A5:EcY Sa 1:10 1:102 1:10a 1:104 Dilusión Celular 103 10* 102 10" 10 -Leu.Trp (#whiteb) 353 (22) 1401 (31) 1336 (2) 1375(0) >104 • 0.1 % 5-FOA (#w iteb) 16(16) 41 (41) 4(4) 0 (-) 2 (2) Factor de enriquecimiento >10 >45 >600 > 0.67x104 a) Determinado por OD560 b) En X-GAL - - Después de una selección positiva en presencia de un aminoácido no natural, las células seleccionadas contendrán sintetasas capaces de utilizar aminoácidos naturales y aquellas capaces de utilizar un aminoácido no natural agregado. Para aislar aquellas sintetasas capaces de utilizar solo el aminoácido no natural, las células que codifican para sintetasas que utilizan aminoácidos naturales deben suprimirse de los clones seleccionados . Esto puede lograrse con una selección negativa en la cual el aminoácido no natural se mantiene y las sintetasas que funcionan con un aminoácido natural se retiran. Una selección negativa modelo se llevó a cabo de manera análoga a la selección positiva modelo. Se mezcló EcTyr S/ARNtCUA con 10 a 105 veces un exceso de A5/AR tCuA Y la selección se llevó a cabo en 5-FOA al 0.1%. La comparación de la proporción de células que sobrevivieron en 5-FOA al 1% que fueron blancas en el análisis X-GAL con las que fueron azules, con la misma proporción bajo condiciones no selectivas (ver Tabla 2) hace claro que las selecciones negativas pueden enriquecer las sintetasas muertas a partir de sintetasas activas mediante un factor de al menos 0.6 x 104. La medición de enriquecimientos precisos para proporciones iniciales mayor que 1:104 fue generalmente no posible, debido a que no pueden colocarse en placas más de 105 células convenientemente sin un cruce significativo entre las células conduciendo a - - fenotipos no confiables . Se desarrolló un procedimiento general que permite tanto la selección positiva de aaRS que reconoce aminoácidos no naturales como la selección negativa de aaRS que reconoce aminoácidos naturales . Al variar las rigideces de la selección, puede aislarse una diversidad de actividades de sintetasa. La aplicación de este método a una selección modelo utilizando variantes de EcTyrRS mostró enriquecimientos mayores que 10s en una sola ronda tanto de selección positiva como mayores que 0.6 x 104 en una sola ronda de selección negativa. Estas observaciones sugieren que este método puede proporcionar un rápido acceso a aminoacil-AR t sintetasas ortogonales que funcionan para la incorporación específica en el sitio de aminoácidos no naturales con una diversidad de cadenas laterales en proteínas en S. cerevisiae. Además, las enzimas desarrolladas en S. cerevisiae pueden utilizarse en eucariotos más altos . Materiales y Métodos Construcción de vectores El gen ARNtcuA se amplificó mediante PCR utilizando los iniciadores ARNt5' : GGGGGGACCGGTGGGGGGACCGGTAAGCTTCCCGATAAGGGAGCAGGCCAGTAAAAACATT ACCCCGTGGTGGGTTCCCGA (SEQ ID NO: 89), y AR t3 ' : GGCGGCGCTAGCAAGCTTCCCGATAAGGGAGCAGGCCAGTAAAAAGGGAAGTTCAGGGACT - - TTTGAAAAAAATGGTGGTGGGGGAAGGAT (SEQ ID NO: 90) de pESCSU3URA. Esta y otras reacciones PCR se llevaron a cabo utilizando el equipo Expand PCR de Roche, de acuerdo con las instrucciones del fabricante. Después de la digestión de restricción de endonucleasa con Nhel y Agel este gen ARNt se insertó entre los mismos sitios en el vector de 2 mra pESCTrp (Strategene) para producir pARNtCuA- El promotor ADH1 de longitud total se amplifocó mediante PCR de pDBLeu (Invitrogen) con los iniciadores PADHf: IGGGGGGACCGGTIGGGGGGACCGGTCGGGATCGAAGAAAAATGATGGTAAAATGAAATAG GAAAATCAAGG (SEQ ID NO: 91) y pADHR: GGGGGGGAATTCAGTTGATTGTATGCTTGGTATAGCTTGAAATATTGTGCAGAAAAAGAAA AC (SEQ ID NO: 92), digerido con Agel y EcoRI . EdTyrRS se amplificó con los iniciadores pESCTrpl: TCATAACGAGAATTCCGGGATCGAAGAAAATGAATGGTAAAATGAAATAGGAAATCTCATA ACGAGAATTCATGGCAAGCAGTAACTTG (SEQ ID NO: 93) y pESCTrp2 : TTACTACGTGCGGCCGCATGGCAAGCAGTAACTTGTTACTACGTGCGGCCGCTTATTTCCA GCAAATCAGAC (SEQ ID NO : 94) . El producto de PCR de ExTyrRS se digirió con EcoRI y Not . 1. Se digirió entonces pARNtCuA con Age I y Not I. Una ligación triple de estos tres ADNs produjo pEcTyrRS-ARNtcuA- El plásmidopA5-ARNtCuA en el cual los residuos de aminoácido (37, 126, 182, 183 y 186 en el sitio activo se mutan a alanina) , se creó mediante plegamiento PCR utilizando los oligonucleótidos F37Afwd: CCGATCGCGCTCGCTTGCGGCTTCGATC (SEQ ID NO: 95), N126Afwd: - - ATCGCGGCGAACGCCTATGACTGGTTC (SEQ ID NO: 96), 182, 183, 186a, GTTGCAGGGTTATGCCGCCGCCTGTGCGAACAAACAGTAAC (SEQ ID no 97) y sus complementos de reversa, así como los oligonucleótidos laterales, 4783: GCCGCTTTGCTATCAAGTATAAATAG (SEQ ID NO: 98), 3256: CAAGCCGACAACCTTGATTGG (SEQ ID NO : 99) y pEcTyrRS-ARNtCUA como patrón. El producto de PCR se digirió con EcoRI y Not I y se ligó en el fragmento grande de pRcTyrRS-ARNtCuA liberado al digerirse con las mismas enzimas. Para construir la Ia generación de informantes DB-AD, el dominio de enlace GAL4 ADN se amplificó mediante PCR de pGADT7 (Clontech) utilizando el iniciador delantero paADfwd: GGGGACAAGTTTGTACAAAAAAGCAGGCTACGCCAATTTTAATCAAAGTGGGAATATTGC (SEQ ID NO: 100) o pADfwd (TAG) GGGGACAAGTTTGTACAAAAAAGCAGGCTAGGCCAATTTTAATCAAAGTGGGAATATTGC (SEQ ID NO: 101) y Drev: GGGGACCACTTTGTACAAGAAAGCTGGGTTACTCTTTTTTTGGGTTTGGTGGGGTATC (SEQ ID NO: 102) . Los productos de PCR se clonaron en el vector pDEST3-2 (invitrogen) utilizando el procedimiento Clonase, de acuerdo con las instrucciones del fabricante, produciendo pDB-AD y pDB- (TAG) -AD . Para la construcción PGADGAL4 y variantes, el gen GAL4 se amplificó de pCLl (Clontech) mediante PCR utilizando los iniciadores ADH1428-1429 AAGCTATACCAAGCATACAATC (SEQ ID NO: 103) y GAL4C: ACAAGGCCTTGCTAGCTTACTCTTTTTTTGGGTTTGGTGGGGTATCTTC (SEQ ID NO: 104). Este fragmento se clonó en el vector pCR2.1 TOPO - - (Invitrogen) de acuerdo con las instrucciones del fabricante, un clon conteniendo el gen GAL4 (pCR2.1 T0P0GAL4) se digirió con Hind III y el fragmento de 2.7 kb GAL4 se purificó en gel y se ligó al fragmento grande de pGADT7 que se había digerido con Hind III, se trató con fosfatasa intestinal de ganado y se purificó en gel . Las variantes del gen GAL4 se crearon mediante reacciones Quickchange (Stratagene) llevadas a cabo de acuerdo con las instrucciones del fabricante, en pCR2.1 utilizando los iniciadores listados en la información de suplemento. utantes GAL4 se clonaron en pGADT7 de la misma manera que el gen GAL4 de tipo silvestre. Todas las estructuras finales se confirmaron por secuencia de ADN. Medio de levadura y manipulaciones La cepa de S. cerevisiae MaV203, (Invitrogen), es MATa; leu2-3,112; trpl 109; his3D200; ade2-101; cyhlR; cyhlR; GAL4D; GAL1; lacZ; HIS3UASGAL1; HIS3aLYS2; SPAL10UASGAL1; URA3. El medio de levadura se adquirió de Clontech, 5-FOA y X-GAL fueron de Invitrogen y 3-AT fue de BIO 101. YPER (Reactivo de Extracción de Protelna de Levadura) y ONPG se adquirieron de Pierce Chemicals. Las transformaciones de plásmido se llevaron a cabo mediante el método PEG/acetato de litio (ver, e.g., D. Burke et al., (2000) Methods in Yeast Genetics Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY) y los trans ormadores se seleccionaron en el medio sintético de goteo completo apropiado. Para probar los - - fenotipos conferidos mediante varias combinaciones de plásmido en MaV203, se resuspendieron colonias de levadura de placas sintéticas de goteo completo de cada transformación en 15 mi de agua estéril y se vaciaron en el medio selectivo de interés . Cada fenotipo se confirmó con al menos cinco colonias independientes, se llevaron a cabo análisis X-GAL mediante el método de depósito de agarosa. Ver, I. G. Serevriiskii & E. A. Golemis (2000) Uses of lacZ to study gene function: evaluation of beta-galactosidase assays employed in the yeast two hybrid system, Analytical Biochemistry 285:1-15. Brevemente, se lisaron colonias o parches celulares mediante varias adiciones de cloroformo puro. dEspués de la evaporación del cloroformo se aplicó agarosa al 1% conteniendo 0.25 g/1 de XGAL y amortiguado con 0.1 M de Na2P04 a la superficie de placa. Una vez que se consolidó la agarosa, las placas se incubaron a 37 °C durante 12 horas. Se llevaron a cabo análisis de ONPG mediante inoculación de 1 mi de SD-leu-trp en un bloque de 96 pozos con una sola colonia y se incubó a 30 °C con agitación. Las células OD6S0 de 100 mi de células, y varias diluciones de células se registraron en paralelo en una placa de microtitulación de 96 pozos. Las células (100 mi) se mezclaron con 100 mi de YPE :ONPG (IX PBS, 50% v/v YPER, 20 mM ded MgCl2; 0.25 % v/v b-mercaptoetanol , y 3 mM de ONPG) y se incubó con agitación a 37°C. Al revelar el color, las - - células se granularon mediante centrifugación, el sobrenadante transferido a una placa de micrititulación de 96 pozos limpia (Nunclon, cat# 167008) y se registró el A420. Todos los datos mostrados son la media de pruebas de al menos 4 clones independientes y las barras de error mostradas representan la desviación estándar. Se calculó la hidrólisis de ONPG utilizando la ecuación: beta-galactosidasa unidades=1000. A420 (V.t.OD6so)/ en donde V es el volumen de células en mililitros, t es el tiempo de incubación en minutos. Ver, e.g., I. G. Serebriiskii & E. A. Golemis, (2000) , Uses of lacZ to study gene function: evaluation of beta-galactosidasa assays employed in the yeast two hybrid system, Analitical Biochemistry, 285:1-15. Una unidad beta-galactosidasa corresponde a la hidrólisis de 1 mmol de ONPG por minuto por célula. Ver, Serebriiskii y Golemis, supra. Las lecturas espectrofotométricas se efectuaron en un lector de placa SPECTRAmax 190. Selecciones de modelo Selecciones positivas : Dos cultivos durante la noche se hicieron crecer en SD-Leu, -Trp. Uno contenia MaV203 conetniendo pEcTyrRS-ARNtcuA/pGADGAL (T44, RllOTAG) y el otro pA5-ARNtSU3/pGADGAL4 (T44 , RllOTAG). Estas células se cosecharon mediante centrifugación y se resuspendieron en NaCl al 0.9% mediante vórtex. Las dos soluciones celulares se diluyeron entonces a OD660s idénticos. El MaV203 - - conteniendo pEcTyrRS-ARNtCtm/pGADGAL4 (T44 , R110TAG) se diluyó serialmente sobre 7 órdenes de magnitud y cada dilución se mezcló entonces 1_1 vol :vol con MaV203 no diluido conteniendo pA5-ARNtCÜA/pGADGAL4 (T44, R110TAG) para producir proporciones definidas de células que contienen tirosil-ARNt sintetasa activa e inactiva. Para cada proporción se llevó a cabo una segunda dilución serial en la cual el número de células disminuyó pero la proporción de células conteniendo pEcTyrRS-ARNtCUA/pGADGAL4 (T44, R110TAG) y pA5-ARWtCUa/pGADGAL4 (T44 , R110TAG) se mantuvo. Estas diluciones se colocaron en placas en SD-Leu, -trp, SD-Leu, -Trp, -URA y SD-Leu, -Trp, -His + 50 mM de 3-AT. Después de 60 horas el número de colonias en cada placa se contó, utilizando una cámara Eagle Eye CCD (Stratagene) y el fenotipo de los supervivientes se confirmó con un análisis beta-galactosidasa X-GAL. Las células de varias colonias individuales azules o blancas se aislaron y se hicieron crecer hasta saturación en SD-leu, -trp y el ADN plásmido se aisló mediante métodos estándar. La identidad de la variante EcTyrRS se confirmó mediante secuencia de ADM. Selección negativa La selección negativa modelo se llevó a cabo de una manera análoga a la selección positiva excepto que el MaV203 conteniendo pA5-AR tCUA/ GADGAL4 ( 44 , R110TAG) se diluyó esencialmente y se mezcló con una densidad fija de aV203 conteniendo pEcTyrRS-ARNt, pGADGAL4 (T44, R110TAG) . Las - - células se colocaron en placas en SD-leu, -trp +0.1% 5-FOA, el número de colonias se contó después de 48 horas y las placas se procesaron como se describió anteriormente. Los siguientes oligonucleótidos (Tabla 3) se utilizaron en combinación con sus complementos de reversa para construir mutantes dirigidos al sitio mediante mutagénesis Quickchange. La posición de la mutación se denota mediante el texto en negrita.
TABLA 3. OLIGONUCLEÓTIDOS UTILIZADOS PARA CONSTRUIR MUTANETS DIRIGIDOS AL SITIO Ámbar Secuencia de Mutantes Oligo L3TAG 5 ' -ATGAAGTAGCTGTCTTCTATCGAACAAGCATGCG-3 ' (SEQ ID NO: 66) I13TAG 5 ' -CGAACAAGCATGCGATTAGTGCCGACTTAAAAAG-3 ' (SEQ ID NO : 67) T44TAG 5 ' -CGCTACTCTCCCAAATAGAAAAGGTCTCCGCTG-3 ' (SEQ ID NO: 68) F68TAG 5 ' -CTGGAACAGCTATAGCTACTGATTTTTCCTCG-3 ' (SEQ ID NO: 69) R110TAG 5 ' -GCCGTCACAGATTAGTTGGCTTCAGTGGAGACTG-3 ' (SEQ ID NO:70) V114TAG 5 ' -GATTGGCTTCATAGGAGACTGATATGCTCTAAC-3 ' (SEQ ID NO: 71) T121TAG 5 ' -GCCTCTATAGTTGAGACAGCATAGAATAATGCG-3 ' (SEQ ID NO: 72) I127TAG 5 ' -GAGACAGCATAGATAGAGTGCGACATCATCATCGG-3 ' (SEQ ID NO: 73) S131TAG 5 ' -GAATAAGTGCGACATAGTCATCGGAAGAGAGTAGTAG-3 ' (SEQ ID NO: 74) T145TAG 5 ' -GGTCAAAGACAGTTGTAGGTATCGATTGACTCGGC-3 ' (SEQ ID NO: 75) Permisivo Secuencia de Mutantes Oligo en el Sitio T44F 5 ' -CGCTACTCTCCCCAAATTTAAAAGGTCTCCGCTG-3 ' (SEQ ID NO: 76) ?44? 5' -CGCTACTCTCCCCAAATATAAAAGGTCTCCGCTG-3' (SEQ ID NO: 77) T44W 5 ' -CGCTACTCTCCCCAAATGGAAAAGGTCTCCGCTG-3 ' (SEQ ID NO: 78) T44D 5' -CGCTACTCTCCCCAAAGATAAAAGGTCTCCGCTG-3' (SEQ ID NO: 79) - - T44 5' -CGCTACTCTCCCCAAAAAAAAAAGGTCTCCGCTG-3' (SEQ ID NO: 80) R110F 5' -GCCGTCACAGATTTTTTGGCTTCAGTGGAGACTG-3 ' (SEQ ID NO: 81) R110Y 5 ' -GCCGTCACAGATTATTTGGCTTCAGTGGAGACTG-3 ' (SEQ ID NO: 82) R110W 5 ' -GCCGTCACAGATTGGTTGGCTTCAGTGGAGACTG-3 ' (SEQ ID NO: 83) R110D 5' -GCCGTCACAGATGATTTGGCT CAGTGGAGACTG-3, (SEQ ID NO: 84) R110K 5 ' -GCCGTCACAGATAAATTGGCTTCAGTGGAGACTG-3 ' (SEQ ID NO: 85) EJEMPLO 2: UN CÓDIGO GENÉTICO EUCARIOTICO EXPANDIDO Se describe una vía general y rápida para la adición de aminoácidos no naturales al código genético de Saccharomyces cerevisiae. Cinco aminoácidos se han incorporado en proteínas eficientemente, con alta fidelidad, en respuesta al codón sin sentido TAG. Las cadenas laterales de estos aminoácidos contienen un grupo ceto, que puede modificarse de manera única in vivo con un amplio rango de sondas químicas y reactivos; un aminoácido conteniendo un átomo pesado para estudios estructurales; y fotorreticuladores para estudios celulares de interacciones de proteína. Esta metodología no solo retira las restricciones impuestas por el código genético en nuestra capacidad para manipular la estructura y función de la proteína en levadura, propociona una puerta para la expansión sistemática ded los códigos genéticos de eucariotos multicelulares . Aunque los químicos han desarrollado una poderosa disposición de métodos y estrategias para sintetizar y manipular las estructuras de moléculas pequeñas (ver e.g., E. J. Corey & X. M. Cheng The Logic of Chemical Synthesis (Wiley - - Interscience, New York, 1995) ) , la capacidad para controlar racionalmente la estructura y función de la proteína se encuentra aún en su infancia. Los métodos de mutagénesis se encuentran limitados a los bloques de construcción de 20 aminoácidos, aunque en un número de casos ha sido posible incorporar competitivamente análogos estructurales cercanos ded aminoácidos comunes en todo el proteoma. Ver, e.g., K. Kirshenbaum et al., (2002), ChemBioChem 3:235-7; y V. Doring et al., (2001), Science 292:501-4. La síntesis total (ver e.g., ver, e.g., B. Merrifield (1986), Science 232:341-7 (1986)) y las metodologías semi-sintéticas (ver, e.g., D. Y. Jackson et al., (1994), Science 266:243-7; y P. E. Dawson & S. B. Kent (2000), Annual . Review of Biochemistry 69:923-60), han hecho posible sintetizar péptidos y proteínas pequeñas, pero tienen utilidad limitada con proteínas sobre los 10 kilo Daltons (kDa) . Los métodos biosintéticos que implican ARNts ortogonales químicamente acilados (ver, e.g., D. Mendel et al., (1995), Annual Review of Biophysics and Biomolecular Structure 24:435-462; y V. W. Cornish et al., (Marzo 31, 1995) , Angewandte Chemie-International Edition in English 34:621-633) han permitido que los aminoácidos no naturales se incorporen en proteínas más grandes, tanto in vitro (ver, e.g., J. A. Ellman et al., (1992), Science 255:197-200) como en células microinyectadas (ver e.g., D. A. Dougherty (2000), Current Opinión in Chemical Biology 4:645-52). Sin embargo, - - la naturaleza estequiométrica de la acilación química limita severamente la cantidad de proteína que puede generarse. De este modo, a pesar de los considerables esfuerzos, las propiedades de las proteínas y posiblemente de organismos completos, se han limitado a lo largo de toda la evolución por los veinte aminoácidos genéticamente codificados (con las raras excepciones de pirrolisina y selenocisteína (ver, e.g., A. Bock et al., (1991), Molecular Microbiology 5:515-20; y G. Srinivasan et al., (2002) Science 296:1459-62)). Para superar esta limitación, se agregaron nuevos componentes a la maquinaria biosintética de proteínas del procarioto Escherichia coli (E. coli) (e.g., L. Wang et al., (2001) Science 292:498-500) que hacen posible codificar genéticamente los aminoácidos no naturales in vivo, un número de nuevos aminoácidos con muevas propiedades químicas, físicas o biológicas, se han incorporado eficiente y selectivamente en proteínas en respuesta al codón ámbar, TAG. Ver, e.g., J. W. Chin et al., (2002), Journal of the American Chemical Society 124:9026-9027; J. W. Chin & P. G. Schultz (2002), ChemBioChem 11:1135-1137; J. W. Chin et al., (2002), PNAS United States of America 99:11020-11024; y L. Wang & P. G. Schultz, (2002), Chem. Comm. 1-10. Sin embargo, debido a que la maquinaria de traducción no se encuentra altamente conservada entre procariotos y eucariotos, los componentes de la maquinaria biosintética agregados a E. Coli, no pueden - - utilizarse generalmente para incorporar específicamente en el sitio aminoácidos no naturales en proteínas para estudiar o manipular los procesos celulares en células eucarióticas . Por tanto, se crearon componentes de traducción que expanden el número de aminoácidos genéticamente codificados en células eucarióticas. Se seleccionó Saccharomyces cerevisiae como el organismo huésped eucariótico, debido a que es un eucarioto modelo útil, las manipulaciones genéticas son fáciles (ver e.g., D. Burke et al., (2000) ethods in Yeast Genetics (Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY) y su maquinaria de traducción es altamente homologa a la de eucariotos más altos (ver, e.., T. R. Hughes (2002) Funct. Integr, Genomics 2:199-211). La adición de nuevos bloques de construcción al código genético de S . cerevisiae requiere un codón único, ARNt, una aminoacil-ARNt sintetasa ('aaRS') que no tenga reacción cruzada con ningún componente de la maquinaria de traducción de levadura (ver, e.g., Noren et al., (1989) Science 244:182; Furter (1998) Protein Sci . 7:419; y Liu et al., (1999) PNAS EUA 96:4780). Un par ortogonal candidato es el par ámbar de supresión de tirosil-AR t sintetasa/ARNtCUA de E. coli (ver, e.g., H. M. Goodman et al., (1968), Nature 217:1019-24; y D. G. Barker et al., (1982), FEBS Letters 150:419-23). La tirosil-ARNt sintetasa de E. coli (tyrRS) aminoacila eficientemente el tcuA de E. coli, cuando ambos se encuentran genéticamente - - codificados en S. cerevisiae, pero no aminoacila los ARNts citoplásmicos de S. cerevisiae. Ver, e.g., H. Edwards & P. Schimmel, (1990), Molecular & Cellular Biology 10:1633-41; y H. Edwards et al., (1991), PNAS United States of America 88:1153-6. Adicionalmente, la tirosil ARNtom de E. coli es un substrato pobre para las aminoacil-ARNt sintetasas de S. cerevisiae (ver, e.g., V. Trezeguet et al., (1991), Molecular & Cellular Biology 11:2744-51), pero se procesa y se exporta desde el núcleo hasta el citoplasma (ver, e.g., S. L. olin, & A. G. Matera (1999) Genes & Development 13:1-10) y funciona eficientemente en la traducción de proteínas en S. cerevisiae. Ver, e.g., H. Edwards & P. Schimmel, (1990) Molecular & Cellular Biology 10:1633-41; H. Edwards et al., (1991) PNAS United States of America 88:1153-6; y V. Trezeguet et al., (1991), Molecular & Cellular Biology 11:2744-51. Además, la TyrRS de E. coli no tiene un mecanismo de edición y en consecuencia no debe dar una lectura de comprobación de un aminoácido no natural ligado al ARNt . Para alterar la especificidad de aminoácido de la TyrRS ortogonal de modo que aminoacile el ARNtCuA con un aminoácido no natural deseado y ninguno de los aminoácidos endógenos, se generó una gran biblioteca de mutantes TyrRS y se sometió a selección genética. En base a la estructura crisalina de la TyrRS homologa de Bacillus stearothermophilus - - (ver, e.g., Brick et al., (1989), Journal of Molecular Biology 208:83) se mutaron cinco residuos (B. stearothermophilus , Figura 7 Panel A)) en el sitio activo de la TyrRS de E. coli que se encuentra dentro de 6.5 A de la para posición del anillo arilo de la tirosina enlazada. Por ejemplo, para crear la biblioteca EcTyrRS de mutantes las cinco posiciones objetivo para mutación se convirtieron primero en codones alanina para producir un gen A5RS . Éste se dividió entre dos plásmidos en un sitio único Pst I en el gen. La biblioteca se creó esencialmente como se describe mediante las técnicas conocidas en la técnica (ver e.g., Stemmer et al., (1993) Biotechniques 14:256-265). Un plásmido contiene la mitad 5' del gen A5RS, el otro plásmido contiene la mitad 3' del gen A5RS. La mutagénesis se llevó a cabo en cada fragmento mediante PCR con iniciadores oligonucleótido para la amplificación del plásmido completo. Los iniciadores se encuentran dopados, conteniendo N K (N=A +G +T +C y = G + T) y sitios de reconocimiento de endonucleasa de restricción Bsa I . la digestión con Bsa I y la ligación produjeron dos plásmidos circulares, conteniendo cada uno copias mutantes de una mitad del gen EcTyrRS . Los dos plásmidos se digirieron entonces con Pst I y se ensamblaron en un solo plásmido mediante ligación, conduciedo al ensamblado de los genes mutantes de longitud total . Los genes mutantes EcTyrRS se extrajeron de este plásmido y se - - ligaron en pA5RS/ARNtCuA entre sitios EcoR I y Not I. la biblioteca se transformó en MaV303 de S cerevisiae: pGADGAL4 (3TAG) utilizando el método con PEG-actetato de litio produciendo -108 transformadores independientes. Se transformó una cepa de selección de S . cerevisiae [MaV203: pGADGAL4 (2TAG) (ver, e.g., M. Vidal et al., (1996), PNAS. United States of America 93:10315-201; y Chin et al., (2003) Chem Biol . 10:511)] con la biblioteca para producir 108 transformadores independientes y crecer en presencia de 1 mM aminoácido no natural (Figura 8, Panel C) . la supresión dde dos codones ámbar permisivos en el activador de transcripción GAL4 conduce a la producción de GAL4 de longitud total y a la activación de transcripción del HIS3 que responde a GAL4, URA3, y genes informantes lacZ (Figura 8, Panel A) . Por ejemplo, los codones permisivos son para T44 y RUO de Gal4. La expresión de HIS3 y URA3 en el medio que carece de uracilo (-ura) , o que contienen 20 mM de 3-aminotriazolo (ver e.g., D. M. Shah (1988), Annual Review of Biochemistry 57, 627-63) (3-?? un inhibidor competitivo de la proteína Hís3) y que carecen de histidina (-his) permite que los clones expresen pares activos de aaRS-AR tCuA se seleccionen positivamente. Si una TyrRS mutante carga el ARNtcuA con un aminoácido, entonces la célula biosintetiza histidina y uracilo y sobrevive. Las células supervivientes se amplificaron en ausencia de 3-AT y aminoácido no natural - - para retirar el GAL4 de longitud total de las células que incorporan selectivamente el aminoácido no natural . Para retirar clones que incorporan aminoácidos endógenos en respuesta al codón ámbar, las células crecieron en medio conteniendo ácido 5-fluroótico al 0.1% (5-FOA) pero careciendo del aminoácido no natural . Las células que expresan URA3 como resultado de la supresión de las mutaciones ámbar GAL4 con aminoácidos naturales, convierten 5-FOA en un producto tóxico, matando la célula. Ver e.g., J. D. Boeke et al., (1984) , Molecular & General Genetics, 197:345-6). Los clones supervivientes se amplificaron en presencia del aminoácido no natural y se reaplicarón a la selección positiva. El informante lacZ permite que los pares inactivos de sintetasa-AR t se discriminen colorimétricamente (Figura 8, Panel B) . Con el uso de este procedimiento, se agregaron independientemente cinco nuevos aminoácidos con distintas propiedades estéricas y electrónicas (Figura 7, Panel B) al código genético de S. cerevisiae. Estos aminoácidos incluyen p-acetil-L-fenilalanina (1), p-benzoil-L-fenilalanina (2), p-azido-L-fenilalanina (3) , O-metil-L-tirosina (4) , y p-yodo-L-fenilalanina (5) , (indicados por los números en la Figura 7, Panel B) . La reactividad única del grupo ceto funcional de p-acetil-L-fenilalanina permite la modificación selectiva de proteínas con un ordenamiento de reactivos que contienen - - hidrazina- o hidroxilamina in vitro e in vivo (Ver, e.g., Cornish et al., (Agosto 28 de 1996) Journal of the American Chemical Society. 118:8150-8151; y Zhang, Smith, Wang, Brock, Schultz en preparación) . El átomo pesado de p-yodo-L-fenilalaniña puede probar su utilidad para mostrar datos de estructura de rayos X (con el uso de difracción anómala de múltiples longitudes de onda) . Las cadenas laterales benzofenona y fenilazida de p-benzoil-L-fenilalanina y p-azido-l-fenilalanina permiten la eficiente fotorreticulación in vivo e in vitro de proteínas (ver, e.g., Chin et al., (2002) J. Am. Chem. Soc. 124:9026; Chin y Schultz (2002) Chem. Bio. Chem. 11:1135; y Chin et al., (2002) PNAS, EUA 99:11020). El grupo metilo de O-metil-L-tirosina puede sustituirse fácilmente con un grupo metilo marcado isotópicamente como sonda de la estructura local y la dinámica con el uso de resonancia magnética nuclear y espectroscopia de vibración. Después de tres rondas de selección (positiva-negativa-positiva) , se aislaron varias colonias cuya supervivencia en -ura o en medio 20 mM 3-AT -his dependió estrictamente de la adición del aminoácido no natural seleccionado. Ver Figura 8, Panel D. Los mismos clones fueron azules en x gal solo en presencia de lmM del aminoácido no natural . Estos experimentos demuestran que los fenotipos observados resultan de la combinación de los pares desarrollados de aminoacil-ARNt sintetasa/ARNtom Y sus - - aminoácidos cognado (ver Tabla 4) . Por ejemplo, para seleccionar sintetasas mutantes se hicieron crecer células (-109) durante 4 horas en SD -leu, -trp, + 1 M aminoácido liquido. Las células se- cosecharon entonces mediante centrifugación, se resuspendieron en NaCl al 0.9%, y se colocaron en placas en SD -leu, -trp, + 20 mM 3-??, + 1 mM de aminoácido no natural o SD -leu, -trp, + 1 mM de aminoácido no natural. Después de 48 a 60 horas a 30 °C las células se retiraron de las placas en SD -leu, -trp, líquido y crecieron durante 15 horas a 30°C. Las células se cosecharon por centrifugación, se resuspendieron en NaCl al 0.9% y se colocaron en placas en SD -leu, -trp, + 5-FOA al 0.1%. Después de 48 horas a 30 °C las células se retiraron en SD -leu, -trp, + 1 mM de aminoácido no natural y crecieron durante 15 horas. Las células se cosecharon entonces mediante centrifugación, se resuspendieron en NaCl al 0.9%, y se colocaron en placas en SD -leu, -trp, + 20 mM 3-AT, + 1 mM de aminoácido no natural o SD -leu, -trp, + 1 mM de aminoácido no natural . Para seleccionar fenotipos de las células seleccionadas, se transfirieron colonias (192) de cada selección en pozos de bloques de 96 pozos conteniendo 0.5 mi de SD -leu, -trp y crecieron a 30°C durante 24 horas. Se agregó glicerol (50% v/v 0.5 mi) a cada pozo, y las células réplica se colocaron en placas sobre agar (SD -leu, -trp; SD -leu, -trp, -his + 20 mM 3-AT; SD -leu, -trp, -ura) - - en presencia o ausencia de 1 mM de aminoácido no natural . Se efectuaron análisis X-Gal en placas SD -leu, -trp utilizando el método de depósito de agarosa . Para demostrar adicionalmente que los fenotipos observados se deben a la incorporación especifica en el sitio de aminoácidos no naturales mediante los pares TyrRS/ARNt mutantes ortogonales, se generaron y caracterizaron mutantes de superóxido dismutasa humana I (hSOD) (ver, e.g., H. E. Parge et al., (1992), PMAS United States of America 86:6109-13) conteniendo cada aminoácido no natural. Por ejemplo, la adición de ADN que codifica para una tag hexahistidina de terminación C, se llevó a cabo una mutación del codón para Trp 33 a un codón ámbar en el gen de superóxido dismutasa humana mediante plegamiento PCR utilizando PS356 (ATCC) como patrón. HSOD (Trp 33 TAG) HIS se clonó entre el promotor GALI y la terminación CYCI de pYES2.1 (Invitrogen, Carlsbad, CA EUA) . Los genes de sintetasa y ARNt mutante en plásmidos derivados de pECTyrRS- RNtC0A se co-transformaron con pYES2.1 hSOD (Trp 33 TAG) HIS en la especie InvSc (Invitrogen) . Para la expresión de proteínas, las células crecieron en SD -trp, -ura + rafinosa y la expresión indujo un ODse0 mediante la adición de galactosa. Mutantes HSOD se purificaron mediante cromatografía Ni-NTA (Qiagen, Valencia, CA, EUA) . La producción de hSOD marcado con hexa histidina de - - un gen conteniendo un codón ámbar en la posición 33 dependió estrictamente de p-acetilPheRS-l-ARNtCuft y 1 mM p-acetil-L-fenilalanina (<0.1% mediante densitometrla en ausencia ded cualquier componente) (Ver, Figura 9) . Se purificó p-acetil-L-fenilalanina conteniendo hSOD de longitud total (e.g., mediante cromatografía de afinidad Ni-NTA) con un rendimiento de 50 ng/ml, comparable al purificado de células conteniendo TyrRSARNtcoA de E. coli . Para comparación, podrían purificarse hSODHIS de tipo silvestre con un rendimiento de 250 ng/ml bajo idénticas condiciones. La Figura 9 ilustra la expresión de proteína de hSOD (33TAG) HIS en S. cerevisiae que codifica genéticamente para aminoácidos no naturales (como se ilustra en la Figura 7, Panel B y se indica en la Figura 9 mediante su numeración en la Figura 7, Panel B) . La porción superior de la Figura 9 ilustra electroporesis de gel SDS-poliacrilamida de hSOD purificado a partir de levadura en presencia (+) y ausencia (-) del aminoácido no natural indicado por el número, que corresponde al aminoáacido no natural ilustrado en la Figura 7, Panel B coloreado con Coomassie Cells contiene el par de sintetasa mutante-ARNt seleccionado para el aminoácido indicado. La porción central de la Figura 9 ilustra un inmunoanálisis western probado con anticuerpo contra hSOD. La porción inferior de la Figura 9 ilustra un inmunoanálisis western probado con un anticuerpo contra tag His6 de - - terminación C. La identidad del aminoácido incorporado se determinó sometiendo una digestión triptica de la proteina imitante a cromatografía líquida y espectrometría de masa en serie. Por ejemplo, se visualizaron bandas de proteína de la espectrometría de masa mediante colorante coloidal Coomassie. Las bandas de gel correspondientes a SOD de tipo silvestre y mutante se extrajeron de los geles de poliacrilamida, se cortaron en cubos de 1.5 mm, se redujeron y se alquilaron, después se sometieron a hidrólisis de tripsina esencialmente como se describió. Ver, e.g., A. Shevchenko et al., (1996) Analytical Chemistry 68:850-858. Los péptidos trípticos conteniendo el aminoácido no natural se analizaron mediante HPLC en fase de reversa de nano flu o/uESl/MS con un espectrómetro de masa de trampa de ión LCQ. Se efectuó el análisis de espectrometría de masa en serie de cromatografía líquida (LC-MS/MS) en un espectrómetro de masa de trampa de ion Finnigan LCQ Deca (Thermo Finnigan) adaptado con un Nanospray HPLC (Agilent 1100 series). Ver, e.g., Figura 10, Paneles A-H. Los iones precursores correspondientes a los iones cargados única y doblemente del péptido Val-Y*-Gly-Ser~He-Lys (SEQ ID NO: 87) conteniendo los aminoácidos no naturales (denotados Y*) se separaron y se fragmentaron con un espetrómetro de masa de trampa de ion. Las masas de - - fragmento de ion pueden asignarse de manera no ambigua, confrmando la incorporación especifica en el sitio de p-acetil-L-fenilalanina (ver, Figura 10, Panel A) . No se observó ninguna indicación de tirosina u otros aminoácidos en el lugar de p-acetil-L-fenilalanina, y se obtuvo un mínimo de 99.8% de pureza de incorporación de la proporción de señal a ruido del espectro del péptido. Se observó una fidelidad y eficiencia similar en la expresión de proteína cuando se utilizó p-benzoilPheRS-1, p-azidoPheRS-1 , O-meTyrRS-1 o p-yodoPheRS-1 para incorporar p-benzoil-L-fenilalanina, p-azido-L-fenilalanina, O-metil-L-tirosina, y p-yodo-L-tirosina En hSOD (Ver Figura 9 y Figura 10, Paneles A-H) . en los experimentos, p-azido-L-fenilalanina se reduce a p-amino-L-fenilalanina en la preparación de muestra, y el último se observa en el espectro de masa. La reducción no ocurre in vivo mediante derivación química de SOD purificado conteniendo p-azido-L-fenilalanina . En experimentos de control, se preparó hSOD marcado con hexa-histidi a conteniendo triptofan, tirosina y leucina en la posición 33 y se sometió a espectrometría de masa (Ver Figura 10, Paneles F, G, y H) . los iones conteniendo el aminoácido 33 fueron claramente visubles en el espectro de masa de estas muestras . La adición independiente de cinco aminoácidos no naturales al código genético de S. cerevisiae demuestra la generalidad de nuestro método y sugiere que puede ser - - aplicable a otros aminoácidos no naturales incluyendo aminoácidos marcados por giro, de enlace metálico, o fotoisomerizables . Esta metodología puede permitir la generación de proteínas con nuevas o aumentadas propiedades así como facilitar el control de la función de la proteína en levadura. Además, en células de mamífero, la tirosil-ARNt sintetasa de E. coli forma un par ortogonal con el A tCü de B. stearothermophilus . Ver. e.g., Sakamoto et al., (2002) Nucleic Acids Res. 30:4692. En consecuencia pueden utilizarse aminoacil-ARNt sintetasas que se han desarrollado en levadura para agregar aminoácidos no naturales a los códigos genéticos de eucariotos más altos. TABLA 4. SECUENCIAS DE AMINOACIL-ARNT SINTETASAS SELECCIONADAS Residuo # 37 126 182 183 186 _ # Ec TyrRS Tyr Asn Asp Phe Leu p-IodoPheRS--1 Val Asn Ser Tyr Leu 1/8 p-IodoPheRS' -2 lie Asn Ser Met Leu 1/8 p-IodoPheRS -3 Val Asn Ser Met Ala 6/8 p--OMePheRS- 1 Val Asn Ser Met Leu 5/13 P -OMePheRS- 2 Thr Asn Thr Met Leu 1/13 p--OMePheRS-•3 Thr Asn Thr Tyr Leu 1/13 p--OMePheRS-¦4 Leu Asn Ser Met Ser 1/13 p--OMePheRS-•5 Leu Asn Ser Met Ala 1/13 P -OMePheRS-•6 Thr Asn Arg Met Leu 4/13 - - p-acetilPheRS- lie Asn Gly Met Ala 10/10 Ia p-benzoilPheRS- Gly Asn Gly Phe Al 1/2 1 p-benzoilPheRS- Gly Asn Gly Tyr Met 1/2 2 p-azidoPheRS-1 Leu Asn Ser Met Ala 1/6 -azidoPheRS- Val Asn Ser Ala Ala 1/6 2 p-azidoPheRS- Leu Asn Ser Ala Ala 3 1/6 p-azidoPheRS- Val Asn Ser Ala Val 4 1/6 p-azidoP eRS- lie Asp Asn Phe Val 1/6 5 p-azidoPheRS- Thr Asn Ser Ala Leu 6 1/6 aEstos clones también contienen una mutación Asp 165Gly EJEMPLO 3 : AGREGANDO EL AMINOÁCIDO CON NUEVA REACTIVIDAD AL CÓDIGO GENÉTICO DE EUCARIOTOS SE demuestra un método específico del sitio, rápido, confiable e irreversible de biocon ugación para proteínas en base a la cicloadición [3+2] . Existe una necesidad considerable de reacciones químicas que modifican proteínas bajo condiciones fisiológicas de una manera altamente selectiva. Ver, e.g., Lemineux & Bertozzi (1996) TIBTECH, 16:506-513. La mayoría de las reacciones acualmente utilizadas para la modificación selectiva de proteínas - - implican la formación de enlace covalente entre socios de reacción nucleófilos y electrofílicos, e.g., la reacción de a-halocetonas con cadenas laterales histidina o cisteína. La selectividad en estos casos se determina por el número de accesibilidad de los residuos nucleofílicos en la proteína. En el caso de proteínas sintéticas o semi sintéticas, pueden utilizarse otras reacciones más selectivas tales como la reacción del ceto-aminoácido no natural con hdrazidas o compuestos aminooxi . Ver, e.g., Cornish et al., (1996) Am. Chem. Soc . 118:8150-8151; y Mahal et al., (1997) Science 276:1125-1128. Recientemente, ha sido posible codificar genéticamente aminoácidos no naturales (ver, e.g., Wang et al., (2001) Science 292:498-500; Chin et al., (2002) Am Chem. Soc. 124:9026-9027; y Chin et al., (2002) Proc . Nati. Acad. Sci . 99:11020-11024), incluyendo aminoácidos que contien cetona (ver, e.g., Wang et al., (2003) Proc . Nati . Acad Sci . 100:56-61; Zhang et al., (2003) Biochemistry 42:6735-6746; y Chin et al., (2003) Science en impresión), en bacterias y levadura utilizando pares de ARNt-sintetasa ortogonal con especificidades de aminoácido alteradas. Esta metodología ha hecho posible el marcado selectivo de virtualmente cualquier proteína con un huésped de reactivos incluyendo fluoróforos, agentes de reticulación, y moléculas citotóxicas. Se describe un método altamente eficiente para la modificación selectiva de proteínas que implica la - - incorporación genética de aminoácidos no naturales conteniendo azido o acetileno en proteínas en respuesta, e.g., al codón ámbar sin sentido, TAG. Estas cadenas de aminoácido pueden modificarse entonces mediante una reacción de cicloadición Huisgen [3+2] (ver e.g., Padwa, A. en Comprehensive Organic Synthesis, Vol . 4 (1991) Ed. Trost, B. M. Pergamon, Oxford, p. 1069-1109; y Huisgen R. en 1,3-Dipolar Cycloaddition Chemistry (1984) Ed. Padwa, A. Wiley, New York, p. 1-176) con derivados de alquinilo (acetileno) o azida, respectivamente. Debido a que este método implica la cicloadición en lugar de una sustitución nucleofílica, las proteínas pueden modificarse con una selectividad extremadamente alta (otro método que puede utilizarse es el intercambio de ligante en un compuesato bisarsénico con un motivo tetracisteína, ver, e.g., Griffin et al., (1998) Science 281:269-272). Esta reacción puede llevarse a cabo a temperatura ambiente en condiciones acuosas con excelente regioselectividad (1,4>1,5) mediante la adición de cantidades catalíticas de sales de Cu(I) a la mezcla de reacción. Ver, e.g., Tornoe et al., (2002) Org. Chem. 67:3057-3064; y Rostovtsev et al., (2002) Angew. Chem. Int. Ed. 41:2596-2599. Efectivamente, Finn y colaboradores han mostrado que esta cicloadición [3+2] de azido-alquino puede conducirse en la superficie de un virus mosaico de viruela intacto. Ver, e.g., Wang et al., (2003) J. Am. Chem. Soc . 125:3192-3193.
- - Para otro ejemplo, reciente de la introducción electrofílica de un grupo azido en una proteína y una subsecuente cicloadición [3+2], ver, e.g., Speers et al., (2003) J. Am C em Soc. 125:4686-4687. A fin de introducir selectivamente ya sea el grupo funcional alquinilo (acetileno) o azida en proteínas eucarióticas en sitios únicos, se generaron pares Tyr S/ARNtcuA desarrollados en levadura que codifican genéticamente los aminoácidos acetileno y azido, Figura 11, 1 y 2, respectivamente. Las proteínas resultantes pueden marcarse eficiente y selectivamente con fluoróforos en una reacción subsecuente de cicloadición bajo condiciones fisiológicas . Previamente, se demostró que un par de tirosil-ARNt-ARNt sintetasa de E. coli es ortogonal en levadura, i.e., ni el ARNt ni la sintetasa reaccionan de manera cruzada con los ARNt o sintetasas endógenas de levadura. Ver, e.g., Chin et al., (2003) Chem Biol . 10:511-519. Este par de ARNt-sintetasa ortogonal se ha utilizado para incorporar selectiva y eficientemente un número de aminoácidos no naturales en levadura en respuesta al codón TAG (e.g., Chin et al., (2003) Science en impresión) . A fin de alterar la especificidad del aminoácido de tirosil-AR t sintetasa de E. coli para aceptar el aminoácido 1 o 2 de la Figura 11, se generó una biblioteca de -107 mutantes aleatorizando los codones para Tyr37, Asn12S, - - Asp , Phe y Leu . Estos cinco residuos se seleccionaron en base a la estructura cristalina de la sintetasa homologa de B. stearothermophilus . Para obtener una sintetasa para la cual sirve el aminoácido particular como substrato, se utilizó un esquema de selección en el cual los codones para Thr44 y Arg110 del gen para el activador de transcripción GAL4 se conviertieron en codones ámbar sin sentido (TAG) . Ver e.g., Chin et al., (2003) Chem Biol . 10:511-519. La supresión de estos codones ámbar en la especie de levadura MaV203 ;pGADGAL4 (2TAG) conduce a la producción de GAL4 de longitud total (ver, e.g., eegan et al., (1986) Science 231:699-704; y Ptashne (1988) Nature 335:683-689) que a su vez conduce la expresión de los genes informantes HIS3 y ORA3. Los últimos productos del gen complementan la auxotrofia dehistidina y uracilo permitiendo que los clones alberguen rautantes de sintetasa activos para seleccionarse en presencia del 1 o 2 de la Figura 11. Las sintetasas que cargan aminoácidos endógenos se retiran mediante el crecimiento en un medio que carece del 1 o 2 de la Figura 11 pero que contiene ácido 5-flroótico, que se convierte en un producto tóxico mediante URA3. Al pasar la biblioteca a través de res rondas de selección, (positiva, negativa, positiva) , identificamos sintetasas selectivas para 1 de la Figura 22 (pPR-EcRSl-5) y para 2 de la Figura 11 (pAZ-EcRSl- 6) como se muestra en la Tabla 8.
- - Todas las sintetasas muestran una fuerte similitud de secuencia, incluyendo un Asn126 conservado sugiriendo un papel funcional importante para este residuo. Sorprendentemente, las sintetasas pPR-EcRSl-5 y 11 pAZ-EcRSl-6 desarrolladas para enlazar 1 y 2 de la Figura 11, respectivamente, convergen a la misma secuencia (Tyr37-Thr37, Asn126-Asn126, Asp182-Ser182, y Phe183-Ala183, Leu186-Leu186) . Ambos enlaces de hidrógeno entre el grupo fenólico hidroxi del enlace tirosm > a y para Tyr 7, y Asp182, se rompen medi·ane mutaciones a Thr y Ser, respectivamente. Phe183 se convierte en Ala proporcionando posiblemente más espacio para acomodar el aminoácido no natural . Para confirmar la caacidad de esta sintetasa (y las otras sintetasas) para aceptar cualquier aminoácido sustrato, se hicieron crecer especies de selección que albergan los plásmidos de sintetasa en un medio que carece de uracilo (se obtuvieron los mismos resultados de un medio carente de histidina) pero suplementado con cualquiera de 1 o 2 de la Figura 11. Los resultados del crecimiento revelaron que cuatro de las cinco sintetasas alquino fueron capaces de cargar ambos aminoácidos no naturales en su ARNt. Las sintetasas azido parecen ser más selectivas, dado que solo pAZ-EcRS-6 (que es idéntico a pPR-EcRS.2) fue capaz de aminoacilar su ARNt con ambos 1 y 2 de la Figura 11. El hecho de que no se detectó ningún crecimiento en ausencia de 1 o 2 de la Figura 11 sugiere que las sintetasas no aceptan - - ninguno de los 20 aminoácidos comunes como sustrato. Ver Figura 14. Para todos los experimentos posteriores se utilizó pPR-EcRS-2 (pAZ-EcRS-S) , permitiendo controlar cuál aminoácido no natural se incorpora simplemente agregando ya ea 1 o 2 de la Figura 11 al medio conteniendo la especie de exresión. Para la producción de proteínas el codón para el residuo permisivo Trp33 de superóxido dismutasa humana 1 (SOD) fusionado a una marca 6xHis de terminación C se mutó a TAG. Por ejemplo, la superóxido dismutasa humana (trp33 TAG) HIS se clonó entre el pronmotor GAL1 y la terminación CYC1 de pYES2.1 (Invitrogen, Carlsbad, CA, EUA) . Los genes de sintetasa y AR t mutante en plásmidos derivados de pECTyrRS-ARNtcuA se co-transformaron con pYES2.1 SOD (Trp 33 TAG) HIS en la especie InvSc (Invitrogen) . Para la expresión de proteínas, las células crecieron en SD -trp, -ura + rafinosa y la expresión se indujo a un ODeso de 0.5 mediante la adición de galactosa. La protexna se expresó en presencia o ausencia de 1 mM de 1 o 2 de la Figura 11 y se purificó mediante cromatografía Ni-NTA (Qiagen, Valencia, CA, EUA) . El análisis mediante SDS-PAGE e inmunoanálisis Western reveló la expresión de proteína dependiente del aminoácido no natural con una fidelidad de > 99% a juzgar por las compaciones de densitometría para la expresión de proteína en ausencia de 1 o 2 de la Figura 11. Ver Figura - - 12. Para confirmar adicionalmente la identidad del aminoácido incorporado, se sometió una digestión trípitica a cromatografía líquida y a espetrometrxa de masa en serie. Por ejemplo, el mutante hSOD de tipo silvestre se purificó utilizando columna de afinidad de níquel y se visualizaron bandas de proteína mediante colorante coloidal Coomassie. Las bandas de gel correspondientes a SOD de tipo silvestre y mutante se extrajeron de los geles de poliacrilamida, se cortaron en cubos de 1.5 mm, se redujeron y se alquilaron, después se sometieron a hidrólisis de tripsina esencialmente como se describió. Ver, e.g., A. Shevchenko et al., (199S) Analytical Chemistry 68:850-858. Los péptidos trípticos conteniendo el aminoácido no natural se analizaron mediante HPLC en fase de reversa de nano flujo/uESl/MS con un espectrómetro de masa de trampa de ión LCQ. er Figura 15, Panel a y B. Se efectuó el análisis de espectrometría de masa en serie de cromatografía líquida (LC-MS/MS) en un espectrómetro de masa de trampa de ion Finnigan LCQ Deca (Thermo Finnigan) adaptado con un Manospray HPLC (Agilent 1100 series) . Los iones precursores correspondientes a los iones cargados única y doblemente del péptido VY*-GSI (SEQ ID NO: 87) conteniendo los aminoácidos no naturales (denotados Y*) se separaron y se fragmentaron con un espetrometro de masa de trampa de ion. Las masas de fragmento de ion pueden - - asignarse de manera no ambigua, confrmando la incorporación específica en el sitio de cada aminoácido no natural . La LC MS/MS no indicó incorporación de nungún aminoácidos natural en esta posición. La proporción de señal a ruido del péptido para todos los mutantes fue > 1000 sugiriendo una fidelidad de incorporación mejor que 99.8%. Ver Figura 15, Panel A y B. Para demostrar que las peqieñas moléculas orgánicas pueden conjugarse a proteínas mediante una reacción de cicloadición azido-alquilo [3+2] , los colorantes 3-6 indicados en la Figura 13, Panel A, que contienen ya sea un grupo acetileno o azido y contienen danosol o fluoróforo de fluorescencia, se sintetizaron (ver Ejemplo 5 en la presente) . La cicloadición se llevó a vabo con 0.01 M de proteína en amrtiguador de fosfato (PB) , pH 8, en presencia de 2 mM 3-6 indicado en la Figura 13, Panel A, 1 mM de CuS04 y -1 mg Cu-cable durante 4 horas a 37°C (ver Figura 13, Panel B. Por ejemplo, a 45 mi de proteína en amortiguador PB (pH = 8) se agregó 1 mi ded CuS0 (50 mM en H20) , 2 mi de colorante (50 mM en EtOH) , 2 mi de tris (1-bencil-lH- [1 , 2 , 3] triazol-4-metil) amina (50 mM en DMSO) , y cable de Cu. Después de 4 horas a temperatura ambiente o 37 °C o durante la noche a 4°C, se agregaron 450 mi de H20 y la mezcla se giró a través de una membrana de diálisis (19 kDa corte) . Después - - de lavar el sobrenadante con 2x500 mi mediante centrifugación la solución se llevó a un volumen de 50 mi. Una muestra de 20 mi se analizó mediante SDS-PAGE. Ocasionalmente el colorante restante pudo retirarse del gel mediante ambosrcion en H20/MeOH/AcOH (5:5:1) durante la noche. El uso de tris (carboxietil) fosfina como agente de reducción condujo gennéticamente a la marca menos eficiente. En contraste con observaciones más prematuras (e.g., Wang W et al., (2003) J. Am. Chem. Soc . 125:3192-3192) la presencia o ausencia de ligante tris (triazolil) amina no tuvo una influencia sustancial en el desarrollo de la reacción. Después de la diálisis, las proteínas marcadas se analizaron entonces por SDS-PAGE y se visualizaron en gel utilizaando un densitómero en el caso de colorantes de dansil 3-4 indicados en la Figura 13, Panel A (?ß? = 337 nm, Xem = 506 nm) o un forovisualizador en el caso de colorantes de fluorescencia 5-6 indicados en la Figura 13, Panel A (Xex = 483 nm,Xera = 516 nm) . Ver e.g., Blake (2001) Curr Opin. Pharmacol. 1:533-539; Wouters et al., 2001) Trends in Cell Biology 11:203-211; y Zacharias et al., (2000) Curr. Opin. Neurobiol 10:416-421. Las proteínas marcadas se caracterizaron mediante análisis LC MS/MS de las digestiones trípticas mostrando la unión específica en el sitio de los fluoróforos y la conversión fue 75% en promedio (e.g., como se determinó por comparación de los valores A28o/A495 para SOD - - marcado con 5 o 6 indicado en la Figura 13 , Panel A) . La selectividad de esta bioconjugacion se verifica por el hecho de que no hubo una reacción observable entre 3 indicado en la Figura 13, Panel A y la proteína alquino o 4 indicado en la Figura 13, Panel A y la proteína azido. TABLA 8. SINTETASAS DESARROLLADAS pPR-EcRS seleccionado para 1 y pAZ-EcRS seleccionado para 2 (como se indica en la Figura 11) sintetasa 37 126 182 183 186 tipo silvestre Tyr Asn Asp Phe Leu pPR-EcRS-1 Gly Asn Ser Met Leu pPR-EcRS-2 Thr Asn Ser Ala Leu pPR-EcRS-3 Ser Asn Thr Met Val pPR-EcRS-4 Ala Asn Ser Tyr Leu pPR-EcRS-5 Ala Asn Thr Met Cys pAZ-EcRS-1 Leu Asn Ser Met Ala pAZ-EcRS-2 Val Asn Ser Ala Ala pAZ-EcRS-3 Leu Asn Ser Ala Ala pAZ-EcRS-4 Val Asn Ser Ala Val pAZ-EcRS-5 lie Asp Asn Phe Val pAZ-EcRS-6 Thr Asn Ser Ala Leu EJEMPLO 4: SÍNTESIS DE UN AMINOÁCIDO ALQUINO En un aspecto de la invención, la invención proporciona aminoácidos alquinilo. Un ejemplo de una estructura del aminoácido alquinilo se ilustra por la Fórmula IV: - - IV aminoácido alquino es txpicamenet cualqu estructura que tiene la Fórmula IV, en donde Ra es un sustituyente utilizado en uno de' los veinte aminoácidos naturales y R2 es un sustituyente alquinilo. Por ejemplo, 1 en la Figura 11 ilustra la estructura de para-propargiloxifenilalanina . p-propargiloxifenilalanina puede sintetizarse, e.g., como se señala abajo. En esta modalidad, la síntesis e p-propargiloxifenilalanina puede completarse en tres etapas partiendo desde la B-Boc-tirosina comercialmente disponible. Por ejemplo, N-ter-butoxicarbonil-tirosina (2 g 7 mmol, 1 equiv) y K2C03 (3 g, 21 mmol, 3 equiv) se suspendieron en DMF anhidro (15 mi) . Se agregó lentamente Propargil bromuro (2.1 mi, 21 mmol, 3 equiv, solución al 80% en tolueno) y la mezcla de reacción se agitó durante 18 horas a temperatura ambiente. Se agregó agua (75 mi) y Et20 (50 mi), las capas se separaron y la fase acuosa se extrajo con Et20 (2 x 50 mi) . Las capas orgánicas combinadas se secaron (MgS0) y el solvente se retiró bajo presión reducida. El producto se obtuvo con un aceite amarillo (2.3 g. 91%) y se utilizó en la siguiente etapa sin purificación adicional. El - - producto protegido por Boc se ilustra abajo como la estructura química 8 : 8 Propargil éster de ácido 2-ter-butoxicarbonilamino-3- [4- (prop-2-iniloxi) fenil] propionico Se agregó acetil cloruro (7 mi) cuidadosamente a metanol (60 mi) a 0°C para dar una solución 5 M de HCl anhidro en MeOH. El producto de la etapa previa (2 g, 5.6 mmol) se agregó y la reacción se agitó durante 4 horas mientras se dejó calentar a temperatura ambiente. Después de retirar los volátiles bajo presión reducida, se obtuvo un sólido amarillento (1.6 g, 98%) (ver estructura química 9) que se utilizó directamente en la siguiente etapa.
Propargil éster de ácido 2-amino-3- [4- (prop-2-iniloxi) fenil] propionico El propargil éster (1.6 g; 5.5 mmol) de la etapa previa se disolvió en una mezcla de NaOH acuoso 2 N (14 mi) y - - MeOH (10 mi) . Después de agitar durante 1.5 horas a temperatura ambienet, el pH se ajustó a 7 agregando HCl concentrado. Se agregó agua (20 mi) y la mezcla se mantuvo a 4°C durante la noche. El precipitado se filtró, se lavó con H20 helada y se secó bajo vacio produciendo 1.23 g (90%) de 1 en la Figura 11 (ácido 2-amino-3-fenilpropiónico (1) ) (también conocido como p-propargiloxifenilalanina) como un sólido blanco. ¾ M R (400 MHz, D20) (como la sal de potasio en D20) d 7.20 (d, J= 8.8 Hz, 2H) , 6.99 (d, J = 8.8 Hz, 2H) , 4.75 (s, 2H) , 3.50 (dd, J = 5.6 7.2 Hz) , 2.95 (dd, J = 5.S 13.6 Hz, 1 H) , 2.82 (dd, J = 7.2 13.6 Hz, 1H) ; 13C NMR (100 MHz, D20) d 181.3, 164.9, 155.6, 131.4, 130.7, 115.3, 57.3, 56.1, 39.3; HRMS (Cl) m/z 220.0969 [Ci2Hi3N03 (M+l) requiere 220.0968] . EJEMPLO 5: ADICIÓN DE MOLÉCULAS A PROTEÍNAS CON UN AMINOÁCIDO NO NATURAL A TRAVÉS DE UNA CICLOADICION [3+2] En un aspecto, la invención proporciona métodos y composiciones relacionadas de proteínas que comprenden aminoácidos no naturales acoplados a moléculas sustituyentes adicionales. Por ejemplo, pueden agregarse sustituyentes adicionales a un aminoácido no natural a través de una cicloadición [3+2]. Ver, e.g., Figura 16. Por ejemplo, la cicloadición [3+2] de una molécula deseada (e.g., que incluye un segundo grupo reactivo, tal como un triple enlace alquino o grupo azido) a una proteína con un aminoácido no natural - - (e.g., que tiene un primer grupo reactivo tal como un grupo azido o enlace triple) puede hacerse siguiendo las siguientes condiciones publicadas para la reacción de cicloadición [3+2] . Por ejemplo, una proteína que comprende una aminoácido no natural en amortiguador PB (pH = 8) se agrega a CuS04, la molécula deseada y cable de Cu. Después de incubar la mezcla (e.g., aproximaadamente 4 horas a temperatura ambiente o 37 CC, o durante la noche a 4°C) se agrega ¾0 y la mezcla se filtra a través de una membrana de diálisis . La muestra puede analizarse para la adición, e.g., mediante análisis de gel . Ejemplos de tales moléculas incluyen, pero no se limitan a, e.g., una molécula que tiene un enlace triple o grupo azido, tales como las moléculas que tienen la estructura de la Fórmula 3, 4, 5, y 6 de la Figura 13, Panel A y lo similar. Además, los enlaces triples o grupos azido pueden incorporarse en las estructuras de otras moléculas de interés, tales como polímeros (e.g., polietilen glicol) , y derivados) , agentes de reticulación, colorantes adicionales, fotoreticuladores, compuestos citotóxicos, marcas de afinidad, biotina, sacáridos, resinas, perlas, segunda proteína o polipéptido, queladores metálicos, cofactores, ácidos grasos, carbohidratos, polinucleótidos, (e.g., ADN, ARN, etc) y lo similar, que pueden entonces utilizarse en la cicloadición [3+2] .
- - En un aspecto de la invención, las moléculas qye tienen la fórmula 3, 4, 5 o 6 de la Figura 13, Panel A pueden sintetizarse como se describe abajo. Por ej emplo un colorante alquino como se muestra en 3 en la Figura 13 , panel A y en la estructura química 3 abajo, se sintetizó agregarndo propargilalanina (250 mi, 3.71 mmol, 3 equiv.) a una solución de dansil cloruro (500 mg, 1.85 mmol, 1 equiv.) y trietilamina (258 mi, 1.85 mmol, 1 equiv.) en CH2Cl2 (10 mi) a 0°C. Después de agitar durante 1 hora, la mezcla de reacción se calentó a temperatura ambiente y se agitó durante una hora adicional . Los volátiles se retiraron in vacuo y el producto crudo se purificó mediane cromatografía en gel de sílice (Et20/hexanos = 1:1) produciendo 3 de la Figura 13, Panel A (418 mg, 78%) como un sólido amarillo. Los datos analíticos son idénticos a los reportados en la literatura. Ver, e.g., Bolletta F. et al., (1996) Organometallics 15:2415-17. Un ejemplo de una etructura de un colorante alquino que puede utilizarse en la invención se muestra en la estructura química 3 : 3 3 - - Un colorante azido como se muestra en 4 Figura 13 , Panel A, y en la estructura química 4 abajo, se sintetizó agregando 3 -azidopropilamina (e.g., como se describe por Carboni B. et al., (1993) J. Org. Chem. 58:3736-3741) (371 mg, 3.71 mmol, 3 equiv.) a una solución de dansil cloruro (500 mg, 1.85 mmol, 1 equiv.) y trietilamina (258 mi, 1.85 mmol, 1 equiv.) en CH2C12 (10 mi) a 0°C. Después de agitar durante 1 hora, la mezcla de reacción se calentó a temperatura ambiente y se agitó durante una hora adicional . Los volátiles se retiraron in vacuo y el producto crudo se purificó mediante cromatografía en gel de sílice (Et20/hexanos = 1:1) produciendo 4 de la Figura 13, Panel A (548 mg, 89%) como un sólido amarillo. ¾ NMR (400 MHz, CDC13) d 8.55 (d, J= 8.4 Hz, 1H) , 8.29 (d, J = 8.8 Hz, 1H) , 8.23 (dd, J = 1.2 7.2 Hz 1H) , 7.56-7.49 (comp. 2 H) , 7.18 (d, J = 7.6 Hz, 1H) , 5.24 (br s, 1H) , 3.21 (t J = 6.4 Hz 2H) , 2.95 (dt, J = 6.4 Hz, 2H) , 2.89 (s, 6H) , 1.62 (quin, J = 6.4 2H) ; 13C NMR ( 100 MHz, CDC13) d 134.3, 130.4, 129.7, 129.4, 128.4, 123.3, 118.8, 115.3, 48.6, 45.4, 40.6, 28.7 (no todas las señales de átomos de carbono cuaternario son visibles en el espectro 13C NMR); HRMS (Cl) m/z 334.1336 [C15H2oN502S (M+l) requiere 334.1332]. Un ejemplo de una estructura de un colorante azido se muestra en la estructura química 4 - - Un colorante alquino como se muestra en 5 de la Figura 13, Panel A y en la estructura química 5 abajo, se sintetizó agregando EDCI (l-etil-3- (3-dimetilaminopropil) carbodiimida hidrocloruro) (83 mg, 0.43 mmol, 1 equiv) a una solución de fluoresceinamina (150 mg, 0.43 mmol, 1 equiv) y ácido 10-undecinoico (79 mg, 0.43, 1 equiv) en piridina (2 mi) a temperatura ambiente. La suspensión se agitó durante la noche y la mezcla de reacción se vació en H20 (15 mi) . La solución se acidificó (pH < 2) agregando HCl concentrado. Después de agitar durante 1 hora, el precipitado se filtró, se lavó con H20 (5 mi) y se disolvió en una pequeña cantidad de EtOAc. La adición de hexanos condujo a la precipitación de 5 de la Figura 13, Panel A como cristales naranja, que se recolectaron entonces y se secaron bajo vacio (138 mg, 63%) . Los datos analíticos son idénticos a los reportados en la literatura. Ver, e.g., Crisp G. T. & Gore J. (1997) Tetrahedron 53:1505-1522. Un ejemplo de una estructura de un colorante alquino se muestra en la estructura química 5 : - - Un colorante azido como se muestra en 6 de la Figura 13, Panel A y en la estructura química 6 abajo, se sintetizó agregando EDCI (83 mg, 0.43 mmol, 1 equiv) a una solución de fluoresceinamina (150 mg, 0.43 mmol, 1 equiv) y ácido 4- (3-azidopropilcarbamoil) -butírico (e.g., sintetizado reactivando 3-azidopropilamina con ácido glutárico anhídrido) (92 mg, 0.43, 1 equiv) en piridina (2 mi) a temperatura ambiente. La suspensión se agitó durante la noche y la mezcla de reacción se vació en H20 (15 mi) . La solución se acidificó (pH < 2) agregando HCl concentrado. Después de agitar durante 1 hora, el precipitado se filtró, se lavó con 1 M HCl (3 x3 mi) y se disolvió en una pequeña cantidad de EtOAc . La adición de hexanos condujo a la precipitación de 6 de la Figura 13, Panel A como cristales naranja, que se recolectaron y se secaron bajo vacío (200 mg, 86%) . ¾ M (400 MHz, CD3OD) d 8.65 (s, 1H) , 8.15 (d, J = 8.4 1H) , 7.61-7.51 (Comp. 2H) , 7.40 (d, J = 8.4 Hz, 1H) , 7.35 (br s, 2H) , 7.22-7.14 (comp. 2H) , 6.85-6.56 (comp. 3H) , 3.40-3.24 (comp. 4H) , 2.54 (t, J = 7.2 Hz, 2H) , 2.39-2.30 (comp. 2H) , 2.10- - - 1.99 (comp. 2H) , 1.82-1.72 (comp. 2H) ; 13C NMR (100 MHz, CD20D) d 175.7, 174.4, 172.4, 167.9, 160.8, 143.0, 134.3, 132.9, 131.8, 129.6, 124.4, 123.3, 121.1, 118.5, 103.5, 50.2, 38.0, 37.2, 36.2, 29.8, 22.9 8no tadas las señales de los átomos de carbono cuaternario son visibles en el espectro 13C NMR); HRMS (CI) m/z 544.1835 [C28H2s 507 (M+l) requiere 544.1827] . Un ejemplo de una mezcla de un colorante azido se muestra en la estructura química 6 : 6 En una modalidad, también puede agregarse una molécula PEG a una proteína con un aminoácido no natural, e.g., un aminoácido azido o un aminoácido propargilo. Por ejemplo, un PEG propargil amida (e.g., ilustrado en la Figura 17, Panel A) puede agregarse a una protelna con un aminoácido azido a través decicloadición [3+2] . Ver, e.g., Figura 17, Panel A, Figura 17 Panel B que ilustra un análisis de gel de una proteína con un sustituyente PEG agregado. En un aspecto de la invención un PEG propargil amida (e.g., ilustrado en la Figura 17, Panel A) puede - - sintetizarse como se déscribió abajo. Por ejemplo, una solución de propargilamina (30 mi) en CH2C12 (1 mi) se agregó a 20 kDa PEG-hidrox succinimida áster (120 mg, adquirido de Nektar) . La reacción se agitó durante 4 horas a temperatura ambiente. Desués se agregó ET20 (10 mi), el precipitado se filtró, y se recristalizó dos veces de MeOH (1 mi) mediante la adición de Et20 (10 mi) . El producto se secó bajo vacío conformando un sólido blanco (105 mg, 88% rendimiento) . Ver, e.g., Figura 17, Panel C. EJEMPLO 6: O-RSs ? O-ARNts EJEMPLARES Un O-ARNt ejemplar comprende la SEQ ID NO: 65 (ver, Tabla 5) . Las O-RSs ejemplares incluyen las SEQ ID Nos: 36-63, 86 (Ver Tabla 5). Ejemplos de polinucleótidos que codifican para las O-RSs o porciones ded las mismas, (e.g., el sitio activo) incluyen las SEQ ID Nos: 3-35. Adicionalmente, los cambios de aminoácido ejemplares de O-RSs se indican en la Tabla 6. Tabla 6: Variantes Desarrolladas de EcTyrRS Residuo # 37 126 182 183 186 Representación Ec TyrRS Tyr Asn Asp Phe Leu p-iodoPheRS-1 Val Asn Ser Tyr Leu 1/8 p-iodoPheRS-2 lie Asn Ser Met Leu 1/8 p-iodoPheRS-3 Val Asn Ser Met Ala 6/8 OMeTyrRS-1 Val Asn Ser Met Leu 5/13 OMeTyrRS-2 Thr Asn Thr Met Leu 1/13 OMeTyrRS-3 Thr Asn Thr Tyr Leu 1/13 OMeTyrRS-4 Leu Asn Ser Met Ser 1/13 OMeTyrRS-5 Leu Asn Ser Met Ala 1/13 - - OMeTyrRS-6 Thr Asn Arg et Leu 4/13 p-acetilPheRS-1 lle Asn Gly Met Ala 4/4 p-acet¡IPheRS-1a lle Asn Gly Met Ala 10/10 p-benzoilPheRS-1 Gly Asn Gly Phe Ala 1 12 p-benzoilPheRS-2 Gly Asn Gly Tyr Met 1/ 2 p-azidoPheRS-1 Leu Asn Ser Met Ala 1/6 p-azidoPheRS-2 Val Asn Ser Ala Ala 1/6 p-azidoPheRS-3 Leu Asn Ser Ala Ala 1/6 p-azidoPheRS-4 Val Asn Ser Ala Val 1/6 p-azidoPheRS-5 lle Asp Asn Phe Val 1/6 p-azidoP eRS-6 Thr Asn Ser Ala Leu 1/6 p-PR-EcRS-1 Gly Asn Ser Met Leu 1/10 p-PR-EcRS-2 Thr Asn Ser Ala Leu 1/10 p-PR-EcRS-3 Ser Asn Thr Met Val 1/10 p-PR-EcRS-4 Ala Asn Ser Tyr Leu 1/10 p-PR-EcRS-5 Ala Asn Thr Met Cys 1/10 p-PR-EcRS-6 Thr Asn Thr Phe Met 1/10 p-PR-EcRS-7 Thr Asn Ser Val Leu 1/10 p-PR-EcRS-8 Val Asn Ser Met Thr 1/10 p-PR-EcRS-9 Ser Asn Ser Phe Leu 1/10 p-PR-EcRS-10 Thr Asn Thr Phe Thr 1/10 aEstos clones también contienen una mutación de Aspl65Gly Se entiende que los ejemplos y modalidades descritas en la presente son solo para propósitos ilustrativos y que varias modificaciones o cambios a la luz de los mismos se sugerirán a las personas expertas en la técnica y se incluirán dentro del espíritu y provisión de esta solicitud y el alcance de las reivindicaciones anexas. Aunque la invención anterior se ha descrito en algún detalle para propósitos de claridad y comprensión, será claro para el experto en la técnica a partir de una lectura de esta descripción, que pueden hacerse varios cambios en forma y detalle sin apartarse del verdadero alcance de la - - invención. Por ejemplo, todas las técnicas y aparatos descritos en la presente pueden variar en diversas combinaciones. Todas las publicaciones, patentes, solicitudes de patente, y/u otros documentos citados en esta solicitud se incorporan por referencia en su totalidad para todo propósito en la misma medida que si cada publicación individual, patente, solicitud de patente, y/u otro documento se indicara individualmente como incorporado por la referencia para todo propósito.
- - TABLA 5 SEQ ID Marca SECUENCIA NO.: SEQ ID Polinucleotido ATGGCAAGCAGTAACTTGATTAAACAATTGCAAGAGCGGGGGCTGGTAGCC NO.: 1 TyrRS Tipo CAGGTGACGGACGAGGAAGCGTTAGCAGAGCGACTGGCGCAAGGCCCGATC silvestre de E. GCGCTCTATTGCGGCTTCGATCCTACCGCTGACAGCTTGCATTTGGGGCAT colí (sintetasa) CTTGTTCCATTGTTATGCCTGAAACGCTTCCAGCAGGCGGGCCACAAGCCG GTTGCGCTGGTAGGCGGCGCGACGGGTCTGATTGGCGACCCGAGCTTCAAA GCTGCCGAGCGTAAGCTGAACACCGAAGAAACTGTTCAGGAGTGGGTGGAC AAAATCCGTAAGCAGGTTGCCCCGTTCCTCGATTTCGACTGTGGAGAAAAC TCTGCTATCGCGGCGAACAACTATGACTGGTTCGGCAATATGAATGTGCTG ACCTTCCTGCGCGATATTGGCAAACACTTCTCCGTTAACCAGATGATCAAC AAAGAAGCGGTTAAGCAGCGTCTCAACCGTGAAGATCAGGGGATTTCGTTC ACTGAGTTTTCCTACAACCTGTTGCAGGGTTATGACTTCGCCTGTCTGAAC AAACAGTACGGTGTGGTGCTGCAAATTGGTGGTTCTGACCAGTGGGGTAAC ATCACTTCTGGTATCGACCTGACCCGTCGTCTGCATCAGAATCAGGTGTTT GGCCTGACCGTTCCGCTGATCACTAAAGCAGATGGCACCAAATTTGGTAAA ACTGAAGGCGGCGCAGTCTGGTTGGATCCGAAGAAAACCAGCCCGTACAAA TTCTACCAGTTCTGGATCAACACTGCGGATGCCGACGTTTACCGCTTCCTG AAGTTCTTCACCTTTATGAGCATTGAAGAGATCAACGCCCTGGAAGAAGAA GATAAAAACAGCGGTAAAGCACCGCGCGCCCAGTATGTACTGGCGGAGCAG GTGACTCGTCTGGTTCACGGTGAAGAAGGTTTACAGGCGGCAAAACGTATT ACCGAATGCCTGTTCAGCGGTTCTTTGAGTGCGCTGAGTGAAGCGGACTTC GAACAGCTGGCGCAGGACGGCGTACCGATGGTTGAGATGGAAAAGGGCGCA GACCTGATGCAGGCACTGGTCGATTCTGAACTGCAACCTTCCCGTGGTCAG GCACGTAAAACTATCGCCTCCAATGCCATCACCATTAACGGTGAAAAACAG TCCGATCCTGAATACTTCTTTAAAGAAGAAGATCGTCTGTTTGGTCGTTIT ACCTTACTGCGTCGCGGTAAAAAGAATTACTGTCTGATTTGCTGGAAATAA SEQ ID Aminoácido MASSl^IKQLQERGLVAQVTDEEALAERLAQGPIALyCGFDPTADSLHLGH NO.: 2 (aa) TyrRS tipo LVPLLCL ^QQAGHKPVALVGGATGLIGDPSFKAAERKLNTEE VQEWv silvestre de E. KIR QVA FL·DFDCGENS IA tmD FG ffiIVL FL·RDIGKHFS NQMI coli (sintetasa) EAVKQRLNREDQGISFTEFSYNLLQGYXiFACLN QYGWLQIGGSDQWGN ITSGIDLTRRLHQNQVFGLTVPLIT ADGT FG TEGGA LDP KTSPYK FyQFWINTADADVYRFLKFFTF SIEEINALEEEDB-SSG APPAQY^/IAEQ VTRLVHGEEGLQAAKRITECLFSGSLSALSEADFEQLAQDGVPMVE EKGA DLMQALVDSELQPSRGQAR TIASNAITINGEKQSDPEYFF EEDRLFGRF TLLRRG YCLICWK SEQ ID Polimicleótido ATGGCAAGCAGTAACTTGATTAAACAATTGCAAGAGCGGGGGCTGGTAGCC NO.: 3 pOMe-1 CAGGTGACGGACGAGGAAGCGTTAGCAGAGCGACTGGCGCAAGGCCCGATC Sintetasa GCACTCGTGTGTGGCTTCGATCCTACCGCTGACAGCTTGCATTTGGGGCAT C TGTTCCATTGTTATGCCTGAAACGCTTCCAGCAGGCGGGCCACAAGCCG GTTGCGCTGGTAGGCGGCGCGACGGGTCTGATTGGCGACCCGAGCTTCAAA GCTGCCGAGCGTAAGCTGAACACCGAAGAAACTGTTCAGGAGTGGGTGGAC AAAATCCGTAAGCAGGTTGCCCCGTTCCTCGATTTCGACTGTGGAGAAAAC TCTGCTATCGCGGCCAATAATTATGACTGGTTCGGCAATATGAATGTGCTG ACCTTCCTGCGCGATATTGGCAAACACTTCTCCGTTAACCAGATGATCAAC AAAGAAGCGGTTAAGCAGCGTCTCAACCGTGAAGATCAGGGGATTTCGTTC ACTGAGTTTTCCTACAACCTGCTGCAGGGTTATAGTATGGCCTGTTTGAAC AAACAGTACGGTGTGGTGCTGCAAATTGGTGGTTCTGACCAGTGGGGTAAC ATCACTTCTGGTATCGACCTGACCCGTCGTCTGCATCAGAATCAGGTGTTT GGCCTGACCGTTCCGCTGATCACTAAAGCAGATGGCACCAAATTTGGTAAA ACTGAAGGCGGCGCAGTCTGGTTGGATCCGAAGAAAACCAGCCCGTACAAA TTCTACCAGTTCTGGATCAACACTGCGGATGCCGACGTTTACCGCTTCCTG - - AAGTTCTTCACCTTTATGAGCATTGAAGAGATCAACGCCCTGGAAGAAGAA GATAAAAACAGCGGTAAAGCACCGCGCGCCCAGTATGTACTGGCGGAGCAG GTGACTCGTCTGGTTCACGGTGAAGAAGGTTTACAGGCGGCAAAACGTATT ACCGAATGCCTGTTCAGCGGTTCTTTGAGTGCGCTGAGTGAAGCGGACTTC GAACAGCTGGCGCAGGACGGCGTACCGATGGTTGAGATGGAAAAGGGCGCA GACCTGATGCAGGCACTGGTCGATTCTGAACTGCAACCTTCCcGTGGTCAG GCACGTAAAACTATCGCCTCCAATGCCATCACCATTAACGGTGAAAAACAG TCCGATCCTGAATACTTCTTTAAAGAAGAAGATCGTCTGTTTGGTCGTTTT ACCTTACTGCGTCGCGGTAAAAAGAATTACTGTCTGATTTGCTGGAAATAA SEQ ID Polinucleótido ATGGCAAGCAGTAACTTGATTAAACAATTGCAAGAGCGGGGGCTGGTAgCC NO.: 4 pOMe-2 CAGGTGACGGACGAGGAAGCGTTAGCAGAGCGACTGGCGCAAGGCCCGATC Sintetasa GCACTCACTTGTGGCTTCGATCCTACCGCTGACAGCTTGCATTTGGGGCAT CTTGTTCCATTGTTATGCCTGAAACGCTTCCAGCAGGCGGGCCACAAGCCG GTTGCGCTGGTAGGCGGCGCGACGGGTCTGATTGGCGACCCGAGCTTCAAA GCTGCCGAGCGTAAGCTGAACACCGAAGAAACTGTTCAGGAGTGGGTGGAC AAAATCCGTAAGCAGGTTGCCCCGTTCCTCGATTTCGACTGTGGAGAAAAC TCTGCTATCGCGGCCAATAATTATGACTGGTTCAGCAATATGAATGTGCTG ACCTTCCTGCGCGATATTGGCAAACACTTCTCCGTTAACCAGATGATCAAC AAAGAAGCGGTTAAGCAGCGTCTCAACCGTGAAGATCAGGGGATTTCGTTC ACTGAGTTTTCCTACAACCTGCTGCAGGGTTATACGTATGCCTGTCTGAAC AAACAGTACGGTGTGGTGCTGCAAATTGGTGGTTCTGACCAGTGGGGTAAC ATCACTTCTGGTATCGACCTGACCCGTCGTCTGCATCAGAATCAGGTGTTT GGCCTGACCGTTCCGCTGATCACTAAAGCAGATGGCACCAAATTTGGTAAA ACTGAAGGCGGCGCAGTCTGGTTGGATCCGAAGAAAACCAGCCCGTACAAA TTCTACCAGTTCTGGATCAACACTGCGGATGCCGACGTTTACCGCTTCCTG AAGTTCTTCACCTTTATGAGCATTGAAGAGATCAACGCCCTGGAAGAAGAA GATAAAAACAGCGGTAAAGCACCGCGCGCCCAGTATGTACTGGCGGAGCAG GTGACTCGTCTGGTTCACGGTGAAGAAGGTTTACAGGCGGCAAAACGTATT ACCGAATGCCTGTTCAGCGGTTCTTTGAGTGCGCTGAGTGAAGCGGACTTC GAACAGCTGGCGCAGGACGGCGTACCGATGGTTGAGATGGAAAAGGGCGCA GACCTGATGCAGGCACTGGTCGATTCTGAACTGCAACCTTCCCGTGGTCAG GCACGTAAAACTATCGCCTCCAATGCCATCACCATTAACGGTGAAAAACAG TCCGATCCTGAATACTTCTTTAAAGAAGAAGATCGTCTGTTTGGTCGTTTT ACCTTACTGCGTCGCGGTAAAAAGAATTACTGTCTGATTTGCTGGAAATAA SEQ ID Polinucleótido ATGGCAAGCAGTAACTTGATTAAACAATTGCAAGAGCGGGGGCTGGTAGCC NO.: 5 pOMe-3 CAGGTGACGGACGAGGAAGCGTTAGCAGAGCGACTGGCGCAAGGCCCGATC Sintetasa GCACTCGTGTGTGGCTTCGATCCTACCGCTGACAGCTTGCATTTGGGGCAT CTTGTTCCATTGTTATGCCTGAAACGCTTCCAGCAGGCGGGCCACAAGCCG GTTGCGCTGGTAGGCGGCGCGACGGGTCTGATTGGCGACCCGAGCTTCAAA GCTGCCGAGCGTAAGCTGAACACCGAAGAAACTGTTCAGGAGTGGGTGGAC AAAATCCGTAAGCAGGTTGCCCCGTTCCTCGATTTCGACTGTGGAGAAAAC TCTGCTATCGCGGCCAATAATTATGACTGGTTCGGCAATATGAATGTGCTG ACCTTCCTGCGCGATATTGGCAAACACTTCTCCGTTAACCAGATGATCAAC AAAGAAGCGGTTAAGCAGCGTCTCAACCGTGAAGATCAGGGGATTTCGTTC ACTGAGTTTTCCTACAACCTGCTGCAGGGTTATAGTATGGCCTGTTTGAAC AAACAGTACGGTGTGGTGCTGCAAATTGGTGGTTCTGACCAGTGGGGTAAC ATCACTTCTGGTATCGACCTGACCCGTCGTCTGCATCAGAATCAGGTGTTT GGCCTGACCGTTCCGCTGATCACTAAAGCAGATGGCACCAAATTTGGTAAA ACTGAAGGCGGCGCAGTCTGGTTGGATCCGAAGAAAACCAGCCCGTACAAA TTCTACCAGTTCTGGATCAACACTGCGGATGCCGACGTTTACCGCTTCCTG AAGTTCTTCACCTTTATGAGCATTGAAGAGATCAACGCCCTGGAAGAAGAA GATAAAAACAGCGGTAAAGCACCGCGCGCCCAGTATGTACTGGCGGAGCAG GTGACTCGTCTGGTTCACGGTGAAGAAGGTTTACAGGCGGCAAAACGTATT ACCGAATGCCTGTTCAGCGGTTCTTTGAGTGCGCTGAGTGAAGCGGACTTC - - GAACAGCTGGCGCAGGACGGCGTACCGATGGTTGAGATGGAAAAGGGCGCA GACCTGATGCAGGCACTGGTCGATTCTGAACTGCAACCTTCCCGTGGTCAG GCACGTAAAACTATCGCCTCCAATGCCATCACCATTAACGGTGAAAAACAG TCCGATCCTGAATACTTCTTTAAAGAAGAAGATCGTCTGTTTGGTCGTTTT ACCTTACTGCGTCGCGGTAAAAAGAATTACTGTCTGATTTGCTGGAAATAA SEQ ID Polinucleótido ATGGCAAGCAGTAACTTGATTAAACAATTGCAAGAgCGGGGGCTGGTAGCC NO.: 6 pOMe-4 CAGGTGACGGACGAGGAAGCGTTAGCAGAGCGACTGGCGCAAGGCCCGATC Sintetasa GCACTCGTGTGTGGCTTCGATCCTACCGCTGACAGCTTGCATTTGGGGCAT CTTGTTCCATTGTTATGCCTGAAACGCTTCCAGCAGGCGGGCCACAAGCCG GTTGCGCXGGTAGGCGGCGCGACGGGTCTGATTGGCGACCCGAGCTTCAAA GCTGCCGAGCGTAAGCTGAACACCGAAGAAACTGTTCAGGAGTGGGTGGAC AAAATCCGTAAGCAGGTTGCCCCGTTCCTCGATTTCGACTGTGGAGAAAAC TCTGCTATCGCGGCCAATAATTATGACTGGTTCGGCAATATGAATGTGCTG ACCTTCCTGCGCGATATTGGCAAACACTTCTCCGTTAACCAGATGATCAAC AAAGAAGCGGTTAAGCAGCGTCTCAACCGTGAAGATCAGGGGATTTCGTTC ACTGAGTTTTCCTACAACCTGCTGCAGGGTTATAGTATGGCCTGTTTGAAC AAACAGTACGGTGTGGTGCTGCAAATTGGTGGTTCTGACCAGTGGGGTAAC ATCACTTCTGGTATCGACCTGACCCGTCGTCTGCATCAGAATCAGGTGTTT GGCCTGACCGTTCCGCTGATCACTAAAGCAGATGGCACCAAATTTGGTAAA ACTGAAGGCGGCGCAGTCTGGTTGGATCCGAAGAAAACCAGCCCGTACAAA TTCTACCAGTTCTGGATCAACAGTGCGGATGCCGACGTTTACCGCTTCCTG AAGTTCTTCAGCTTTATGAGCATTGAAGAGATCAACGCCCTGGAAGAAGAA GATAAAAACAGCGGTAAAGCACCGCGCGCCCAGTATGTACTGGCGGAGCAG GTGACTCGTCTGGTTCACGGTGAAGAAGGTTTACAGGCGGCAAAACGTATT ACCGAATGCCTGTTCAGCGGTTCTTTGAGTGCGCTGAGTGAAgCGGACTTC GAACAGCTGGCGCAGGACGGCGTACCGATGGTTGAGATGGAAAAGGGCGCA GACCTGATGCAGGCACTGGTCGATTCTGAACTGCAACCTTCCCGTGGTCAG GCACGTAAAACTATCGCCTCCAATGCCATCACCATTAACGGTGAAAAACAG TCCGATCCTGAATACTTCTTTAAAGAAGAAGATCGTCTGTTTGGTCGTTTT ACCTTACTGCGTCGCGGTAAAAAGAATTACTGTCTGATTTGCTGGAAATAA SEQ ED Polinucleótido ATGGCAAGCAGTAACTTGATTAAACAATTGCAAGAGCGGGGGCTGGTAgCC NO.: 7 pOMe-5 CAGGTGACGGACGAGGAAGCGTTAGCAGAGCGACTGGCGCAAGGCCCGATC Sintetasa GCACTCACGTGTGGCTTCGATCCTACCGCTGACAGCTTGCATTTGGGGCAT CTTGTTCCATTGTTATGCCTGAAACGCTTCCAGCAGGCGGGCCACAAGCCG GTTGCGCTGGTAGGCGGCGCGACGGGTCTGATTGGCGACCCGAGCTTCAAA. GCTGCCGAGCGTAAGCTGAACACCGAAGAAACTGTTCAGGAGTGGGTGGAC AAAATCCGTAAGCAGGTTGCGCCGTTCCTCGATTTCGACTGTGGAGAAAAC TCTGCTATCGCGGCCAATAATTATGACTGGTTCGGCAATATGAATGTGCTG ACCTTCCTGCGCGATATTGGCAAACACTTCTCCGTTAACCAGATGATCAAC AAAGAAGCGGTTAAGCAGCGTCTCAACCGTGAAGATCAGGGGATTTCGTTC ACTGAGTTTTCCTACAGCCTGCTGCAGGGTTATACGATGGCCTGTCTGAAC AAACAGTACGGTGTGGTGCTGCAAATTGGTGGTTCTGACCAGTGGGGTAAC ATCACTTCTGGTATCGACCTGACCCGTCGTCTGCATCAGAATCAGGTGTTT GGCCTGACCGTTCCGCTGATCACTAAAGCAGATGGCACCAAATTTGGTAAA ACTGAAGGCGGCGCAGTCTGGTTGGATCCGAAGAAAACCAGCCCGTACAAA TTCTACCAGTTCTGGATCAACACTGCGGATGCCGACGTTTACCGCTTCCTG AAGTTCTTCACCTTTATGAGCATTGAAGAGATCAACGCCCTGGAAGAAGAA GATAAAAACAGCGGTAAAGCACCGCGCGCCCAGTATGTACTGGCGGAGCAG GTGACTCGTCTGGTTCACGGTGAAGAAGGTTTACAGGCGGCAAAACGTATT ACCGAATGCCTGTTCAGCGGTTCTTTGAGTGCGCTGAGTGAAGCGGACTTC GAACAGCTGGCGCAGGACGGCGTACCGATGGTTGAGATGGAAAAGGGCGCA GACCTGATGCAGGCACTGGTCGATTCTGAACTGCAACCTTCCCGTGGTCAG GCACGTAAAACTATCGCCTCCAATGCCATCACCATTAACGGTGAAAAACAG - - TCCGATCCTGAATACTTCTTTAAAGAAGAAGATCGTCTGTTTGGTCGTTTT ACCTTACTGCGTCGCGGTAAAAAGAATTACTGTCTGATTTGCTGGAAATAA SEQ ID Polinucleótido CGGGGGCTGGTAGCCCAGGTGACGGACGAGGAAGCGTTAGCAGAGCGACTG NO.: 8 pOMe-6 (sitio GCGCAAGGCCCGATCGCACTCACTTGTGGCTTCGATCCTACCGCTGACAGC activo) TTGCATTTGGGGCATCTTGTTCCATTGTTATGCCTGAAACGCTTCCAGCAG Sintetasa GCGGGCCACAAGCCGGTTGCGCTGGTAGGCGGCGCGACGGGTCTGATTGGC GACCCGAGCTTCAAAGCTGCCGAGCGTAAGCTGAACACCGAAGAAACTGTT CAGGAGTGGGTGGACAAAATCCGTAAGCAGGTTGCCCCGTTCCTCGATTTC GACTGTGGAGAAAACTCTGCTATCGCGGCCAATAATTATGACTGGTTCAGC AATATGAATGTGCTGACCTTCCTGCGCGATATTGGCAAACACTTCTCCGTT AACCAGATGATCAACAAAGAAGCGGTTAAGCAGCGTCTCAACCGTGAAGAT CAGGGGATTTCGTTCACTGAGTTTTCCTACAACCTGCTGCAGGGTTATACG TATGCCTGTCTGAACAAACAGTACGGTGTG SEQ ID Polinucleótido CGGGGGCTGGTACCCCAGGTGACGGACGAGGAAGCGTTAGCAGAGCGACTG NO.: 9 pOMe-7 (sitio GCGCAAGGCCCGATCGCACTCACTTGTGGCTTCGATCCTACCGCTGACAGC activo) TTGCATTTGGGGCATCTTGTTCCATTGTTATGCCTGAAACGCTTCCAGCAG Sintetasa GCGGGCCACAAGCCGGTTGCGCTGGTAGGCGGCGCGACGGGTCTGATTGGC GACCCGAGCTTCAAAGCTGCCGAGCGTAAGCTGAACACCGAAGAAACTGTT CAGGAGTGGGTGGACAAAATCCGTAAGCAGGTTGCCCCGTTCCTCGATTTC GACTGTGGAGAAAACTCTGCTATCGCGGCCAATAATTATGACTGGTTCAGC AATATGAATGTGCTGACCTTCCTGCGCGATATTGGCAAACACTTCTCCGTT AACCAGATGATCAACAAAGAAGCGGTTAAGCAGCGTCTCAACCGTGAAGAT CAGGGGATTTCGTTCACTGAGTTTTCCTACAACCTGCTGCAGGGTTATACG TATGCCTGTCTGAACAAACAGTACGGTGTG SEQ ID polinucleótido CGGGGGCTGGTAGCCCAGGTGACGGACGAGGAAGCGTTAGCAGAGCGACTG NO.: 10 pOMe-8 (sitio GCGCAAGGCCCGATCGCACTCACTTGTGGCTTCGATCCTACCGCTGACAGC activo) TTGCATTTGGGGCATCTTGTTCCATTGTTATGCCTGAAACGCTTCCAGCAG Sintetasa GCGGGCCACAAGCCGGTTGCGCTGGTAGGCGGCGCGACGGGTCTGATTGGC GACCCGAGCTTCAAAGCTGCCGAGCGTAAGCTGAACACCGAAGAAACTGTT CAGGAGTGGGTGGACAAAATCCGTAAGCAGGTTGCCCCGTTCCTCGATTTC GACTGTGGAGAAAACTCTGCTATCGCGGCCAATAATTATGACTGGTTCAGC AATATGAATGTGCTGACCTTCCTGCGCGATATTGGCAAACACTTCTCCGTT AACCAGATGATCAACAAAGAAGCGGTTAAGCAGCGTCTCAACCGTGAAGAT CAGGGGATTTCGTTCACTGAGTTTTCCTACAACCTGCTGCAGGGTTATACG TATGCCTGTCTGAACAAACAGTACGGTGTG SEQ ID polinucleótido CGGGGGCTGGTAGCCCAGGTGACGGACGAGGAAGCGTTAGCAGAGCGACTG NO.: 11 pOMe-9 (sitio GCGCAAGGCCCGATCGCACTCACTTGTGGCTTCGATCCTACCGCTGACAGC activo) TTGCATTTGGGGCATCTTGTTCCATTGTTATGCCTGAAACGCTTCCAGCAG Sintetasa GCGGGCCACAAGCCGGTTGCGCTGGTAGGCGGCGCGACGGGTCTGATTGGC GACCCGAGCTTCAAAGCTGCCGAGCGTAAGCTGAACACCGAAGAAACTGTT CAGGAGTGGGTGGACAAAATCCGTAAGCAGGTTGCCCCGTTCCTCGATTTC GACTGTGGAGAAAACTCTGCTATCGCGGCCAATAATTATGACTGGTTCGGC AATATGAATGTGCTGACCTTCCTGCGCGATATTGGCAAACACTTCTCCGTT AACCAGATGATCAACAAAGAAGCGGTTAAGCAGCGTCTCAACCGTGAAGAT CAGGGGATTTCGTTCACTGAGTTTTCCTACAACCTGCTGCAGGGTTATTCG TATGCCTGTGCGAACAAACAGTACGGTGTG SEQ ID polinucleótido CGGGGGCTGGTAGCCCAGGTGACGGACGAGGAAGCGTTAGCAGAGCGACTG NO.: 12 pOMe-10 (sitio GCGCAAGGCCCGATCGCACTCACTTGTGGCTTCGATCCTACCGCTGACAGC activo) TTGCATTTGGGGCATCTTGTTCCATTGTTATGCCTGAAACGCTTCCAGCAG Sintetasa GCGGGCCACAAGCCGGTTGCGCTGGTAGGCGGCGCGACGGGTCTGATTGGC GACCCGAGCTTCAAAGCTGCCGAGCGTAAGCTGAACACCGAAGAAACTGTT CAGGAGTGGGTGGACAAAATCCGTAAGCAGGTTGCCCCGTTCCTCGATTTC GACTGTGGAGAAAACTCTGCTATCGCGGCCAATAATTATGACTGGTTCAGC -. - AATATGAATGTGCTGACCTTCCTGCGCGATATTGGCAAACACTTCTCCGTT AACCAGATGATCAACAAAGAAGCGGTTAAGCAGCGTCTCAACCGTGAAGAT CAGGGGATTTCGTTCACTGAGTTTTCCTACAACCTGCTGCAGGGTTATACG TATGCCTGTCTGAACAAACAGTACGGTGTG SEQ ID Polinucleótído CGGGGGCTGGTACCcCAGGTGACGGACGAGGAAGCGTTAGCAGAGCGACTG NO.: 13 pOMe-11 (sitio GCGCAAGGCCCGATCGCACTCCTTTGTGGCTTCGATCCTACCGCTGACAGC activo) TTGCATTTGGGGCATCTTGTTCCATTGTTATGCCTGAAACGCTTCCAGCAG Sintetasa GCGGGCCACAAGCCGGTTGCGCTGGTAGGCGGCGCGACGGGTCTGATTGGC GACCCGAGCTTCAAAGCTGCCGAGCGTAAGCTGAACACCGAAGAAACTGTT CAGGAGTGGGTGGACAAAATCCGTAAGCAGGTTGCCCCGTTCCTCGATTTC GACTGTGGAGAAAACTCTGCTATCGCGGCCAATAATTATGACTGGTTCGGC AATATGAATGTGCTGACCTTCCTGCGCGATATTGGCAAACACTTCTCCGTT AACCAGATGATCAACAAAGAAGCGGTTAAGCAGCGTCTCAACCGTGAAGAT CAGGGGATTTCGTTCACTGAGTTTTCCTACAACCTGCTGCAGGGTTATTCT ATTGCCTGTTCGAACAAACAGTACGGTGTG SEQ ID Polinucleótído CGGGGGCTGGTAGCCCAGGTGACGGACGAGGAAGCGTTAGCAGAGCGACTG NO.: 14 pOMe-12 (sitio GCGCAAGGCCCGATCGCACTCGTGTGTGGCTTCGATCCTACCGCTGACAGC activo) TTGCATTTGGGGCATCTTGTTCCATTGTTATGCCTGAAACGCTTCCAGCAG Sintetasa GCGGGCCACAAGCCGGTTGCGCTGGTAGGCGGCGCGACGGGTCTGATTGGC GACCCGAGCTTCAAAGCTGCCGAGCGTAAGCTGAACACCGAAGAAACXGTT CAGGAGTGGGTGGACAAAATCCGTAAGCAGGTTGCCCCGTTCCTCGATTTC GACTGTGGAGAAAACTCTGCTATCGCGGCCAATAATTATGACTGGTTCGGC AATATGAATGTGCTGACCTTCCTGCGCGATATTGGCAAACACTTCTCCGTT AACCAGATGATCAACAAAOAAGCGGTTAAGCAGCGTCTCAACCGTGAAGAT CAGGGGATTTCGTTCACTGAGTTTTCCTACAACCTGCTGCAGGGTTATAGT ATTGCCTGTTTGAACAAACAGTACGGTGTG SEQ ID Polinucleótído CGGGGGCTGGTACCCCAGGTGACGGACGAGGAAGCGTTAGCAGAGCGACTG NO.: 15 pOMe-13 (sitio GCGCAAGGCCCGATCGCACTCGTGTGTGGCTTCGATCCTACCGCTGACAGC activo) TTGCATTTGGGGCATCTTGTTCCATTGTTATGCCTGAAACGCTTCCAGCAG Sintetasa GCGGGCCACAAGCCGGTTGCGCTGGTAGGCGGCGCGACGGGTCTGATTGGC GACCCGAGCTTCAAAGCTGCCGAGCGTAAGCTGAACACCGAAGAAACTGTT CAGGAGTGGGTGGACAAAATCCGTAAGCAGGTTGCCCCGTTCCTCGATTTC GACTGTGGAGAAAACTCTGCTATCGCGGCCAATAATTATGACTGGTTCGGC AATATGAATGTGCTGACCTTCCTGCGCGATATTGGCAAACACTTCTCCGTT AACCAGATGATCAACAAAGAAGCGGTTAAGCAGCGTCTCAACCGTGAAGAT CAGGGGATTTCGTTCACTGAGTTTTCCTACAACCTGCTGCAGGGTTATAGT ATTGCCTGTTTGAACAAACAGTACGGTGTG SEQ ID Polinucleótído CGGGGGCTGGTAGCCCAGGTGACGGACGAGGAAGCGTTAGCAGAGCGACTG NO.: 16 pOMe-14 (sitio GCGCAAGGCCCGATCGCACTCTGGTGTGGCTTCGATCCTACCGCTGACAGC activo) TTGCATTTGGGGCATCTTGTTCCATTGTTATGCCTGAAACGCTTCCAGCAG Sintetasa GCGGGCCACAAGCCGGTTGCGCTGGTAGGCGGCGCGACGGGTCTGATTGGC GACCCGAGCTTCAAGGCTGCCGAGCGTAAGCTGAACACCGAAGAAACTGTT CAGGAGTGGGTGGACAAAATCCGTAAGCAGGTTGCCCCGTTCCTCGATTTC GACTGTGGAGAAAACTCTGCTATCGCGGCCAATTGTTATGACTGGTTCGGC AATATGAATGTGCTGACCTTCCTGCGCGATATTGGCAAACACTTCTCCGTT AACCAGATGATCAACAAAGAAGCGGTTAAGCAGCGTCTCAACCGTGAAGAT CAGGGGATTTCGTTCACTGAGTTTTCCTACAACCTGCTGCAGGGTTATATG CGTGCCTGTGAGAACAAACAGTACGGTGTG SEQ ID Polinucleótído CGGGGGCTGGTAGCCCAGGTGACGGACGAGGAAGCGTTAGCAGAGCGACTG NO.: 17 p-acetilPhe-1 GCGCAAGGCCCGATCGCACTCATTTGTGGCTTCGATCCTACCGCTGACAGC (sitio activo) TTGCATTTGGGGCATCTTGTTCCATTGTTATGCCTGAAACGCTTCCAGCAG Sintetasa GCGGGCCACAAGCCGGTTGCGCTGGTAGGCGGCGCGACGGGTCTGATTGGC GACCCGAGCTTCAAAGCTGCCGAGCGTAAGCTGAACACCGAAGAAACTGTT CAGGAGTGGGTGGACAAAATCCGTAAGCAGGTTGCCCCGTTCCTCGATTTC - - GACTGTGGAGAAAACTCTGCTATCGCGGCCAATAATTATGACTGGTTCGGC AATATGAATGTGCTGACCTTCCTGCGCGATATTGGCAAACACTTCTCCGTT AACCAGATGATCAACAAAGAAGCGGTTAAGCAGCGTCTCAACCGTGAAGGT CAGGGGATTTCGTTCACTGAGTTTTCCTACAACCTGCTGCAGGGTTATGGT ATGGCCTGTGCTAACAAACAGTACGGTGTGGTGCTGCAAATTGGTGGTTCT GACCAATGGGGTAACATCACTTCTGGTATCGACCTGACCCGTCGTCTGCAT CAGAATCAGGTG SEQ ID Polinucleótido CAGGTGACGGACGAGGAAGCGTTAGCAGAGCGACTGGCGCAAGGCCCGATC NO.: 18 pBenzofenona-1 GCACTCGGTTGTGGCTTCGATCCTACCGCTGACAGCTTGCATTTGGGGCAT (sitio activo) CTTGTTCCATTGTTATGCCTGAAACGCTTCCAGCAGGCGGGCCACAAGCCG Sintetasa GTTGCGCTGGTAGGCGGCGCGACGGGTCTGATTGGCGACCCGAGCTTCAAA GCTGCCGAGCGTAAGCTGAACACCGAAGAAACTGTTCAGGAGTGGGTGGAC AAAATCCGTAAGCAGGTTGCCCCGTTCCTCGATTTCGACTGTGGAGAAAAC TCTGCTATCGCGGCCAATAATTATGACTGGTTCGGCAATATGAATGTGCTG ACCTTCCTGCGCGATATTGGCAAACACTTCTCCGTTAACCAGATGATCAAC AAAGAAGCGGTTAAGCAGCGTCTCAACCGTGAAGATCAGGGGATTTCGTTC ACTGAGTTTTCCTACAACCTGCTGCAGGGTTATGGTTTTGCCTGTTTGAAC AAACAGTACGGTGTGGTGCTGCAAATTGGTGGTTCTGACCAGTGGGGTAAC ATCACTTCTGGTATCGACCTGACCCGTCGTCTGCATCAGAATCAGGTG SEQ ID Polinucleótido GCGTTAGCAGAGCGACTGGCGCAAGGCCCGATCGCACTCGGGTGTGGCTTC NO.: 19 pBenzofenona-2 GATCCTACCGCTGACAGCTTGCATTTGGGGCATCTTGTTCCATTGTTATGC (sitio activo) CTGAAACGCTTCCAGCAGGCGGGCCACAAGCCGGTTGCGCTGGTAGGCGGC Sintetasa GCGACGGGTCTGATTGGCGACCCGAGCTTCAAAGCTGCCGAGCGTAAGCTG AACACCGAAGAAACTGTTCAGGAGTGGGTGGACAAAATCCGTAAGCAGGTT GCCCCGTTCCTCGATTTCGACTGTGGAGAAAACTCTGCTATCGCGGCCAAT AATTATGACTGGTTCGGCAATATGAATGTGCTGACCTTCCTGCGCGATATT GGCAAACACTTCTCCGTTAACCAGATGATCAACAAAGAAGCGGTTAAGCAG CGTCTCAACCGTGAAGATCAGGGGATTTCGTTCACTGAGTTTTCCTACAAC CTGCTGCAGGGTTATGGTTATGCCTGTATGAACAAACAGTACGGTGTGGTG CTGCAAATTGGTGGTTCTGACCAGTGGGGTAACATCACTTCTGGTATCGAC CTGACCCGTCGTCTGCATCAGAATCAGGTG SEQ ID Polinucleótido GGGCTGGTAGCCCAGGTGACGGACGNAGAAGCGTTAGCAGAGCGACTGGCG NO.: 20 pAzidoPhe-1 CAAGGCCCGATCGCACTCCTTTGTGGCTTCGATCCTACCGCTGACAGCTTG (sitio activo) CATTTGGGGCATCTTGTTCCATTGTTATGCCTGAAACGCTTCCAGCAGGCG Sintetasa GGCCACAAGCCGGTTGCGCTGGTAGGCGGCGCGACGGGTCTGATTGGCGAC CCGAGCTTCAAAGCTGCCGAGCGTAAGCTGAACACCGAAGAAACTGTTCAG GAGTGGGTGGACAAAATCCGTAAGCAGGTTGCCCCGTTCCTCGATTTCGAC TGTGGAGAAAACTCTGCTATCGCGGCCAATAATTATGACTGGTTCGGCAAT ATGAATGTGCTGACCTTCCTGCGCGATATTGGCAAACACTTCTCCGTTAAC CAGATGATCAACAAAGAAGCGGTTAAGCAGCGTCTCAACCGTGAAGATCAG GGGATTTCGTTCACTGAGTTTTCCTACAACCTGCTGCAGGGTTATTCTATG GCCTGTGCGAACAAACAGTACGGTGTGGTGCTGCAAATTGGTGGTTCTGAC CAGTGGGGTAACATCACTTCTGGTATCGACCTGACCCGTCGTCTGCATCAN AATCA GTG SEQ ID Polinucleótido TTAGCAGAGCGACTGGCGCAAGGCCCGATCGCACTCGTTTGTGGCTTCGAT NO.: 21 pAzidoPhe-2 CGTACCGCTGACAGCTTGCATTTGGGGCATCTTGTTCCATTGTTATGCCTG (sitio activo) AAACGCTTCCAGCAGGCGGGCCACAAGCCGGTTGCGCTGGTAGGCGGCGCG Sintetasa ACGGGTCTGATTGGCGACCCGAGCTTCAAAGCTGCCGAGCGTAAGCTGAAC ACCGAAGAAACTGTTCAGGAGTGGGTGGACAAAATCCGTAAGCAGGTTGCC CCGTTCCTCGATTTCGACTGTGGAGAAAACTCTGCTATCGCGGCCAATAAT TATGACTGGTTCGGCAATATGAATGTGCTGACCTTCCTGCGCGATATTGGC AAACACTTCTCCGTTAACCAGATGATCAACAAAGAAGCGGTTAAGCAGCGT CTCAACCGTGAAGATCAGGGGATTTCGTTCACTGAGTTTTCCTACAACCTG - - CTGCAGGGTTATTCTGCGGCCTGTGCGAACAAACAGTACGGTGTGGTGCTG CAAATTGGTGGTTCTGACCAGTGGGGTAACATCACTTCTGGTATCGACCTG ACCCGTCGTCTGCATCAGAATCAGGTG SEQ ID Polinucleótido GACGAGGAAGCGTTAGCAGAGCGACTGGCGCAAGGCCCGATCGCACTCCTG NO.: 22 pAzidoPhe-3 TGTGGCTTCGATCCTACCGCTGACAGCTTGCATTTGGGGCATCTTGTTCCA (sitio activo) TTGTTATGCCTGAAACGCTTCCAGCAGGCGGGCCACAAGCCGGTTGCGCTG Sintetasa GTAGGCGGCGCGACGGGTCTGATTGGCGACCCGAGCTTCAAAGCTGCCGAG CGTAAGCTGAACACCGAAGAAACTGTTCAGGAGTGGGTGGACAAAATCCGT AAGCAGGTTGCCCCGTTCCTCGATTTCGACTGTGGAGAAAACTCTGCTATC GCGGCCAATAATTATGACTGGTTCGGCAATATGAATGTGCTGACCTTCCTG CGCGATATTGGCAAACACTTCTCCGTTAACCAGATGATCAACAAANAAGCG GTTAAGCAGCGTCTCAACCGTGAAGATCAGGGGATTTCGTTCACTGAGTTT TCCTACAACCTGCTGCAGGGTTATTCGGCTGCCTGTGCGAACAAACAGTAC GGNGNGGNGCTGCAAATTGGNGGTTCTGACCAGGGGGGTAACATCACTTCT GGTATCGACCTGACCCGTCGTCTGCATCAAAATCAGGTG SEQ ID Polinucleótido GCGTTAGCAGAGCGACTGGCGCAAGGCCCGATCGCACTCGTTTGTGGCTTC NO.: 23 pAzidoPhe-4 GATCCTACCGCTGACAGCTTGCATTTGGGGCATCTTGTTCCATTGTTGTGC (sitio activo) CTGAAACGCTTCCAGCAGGCGGGCCACAAGCCGGTTGCGCTGGTAGGCGGC Sintetasa GCGACGGGTCTGATTGGCGACCCGAGCTTCAAAGCTGCCGAGCGTAAGCTG AACACCGAAGAAACTGTTCAGGAGTGGGTGGACAAAATCCGTAAGCAGGTT GCCCCGTTCCTCGATTTCGACTGTGGAGAAAACTCTGCTATCGCGGCCAAT AATTATGACTGGTTCGGCAATATGAATGTGCTGACCTTCCTGCGCGATATT GGCAAACACTTCTCCGTTAACCAGATGATCAACAAAGAAGCGGTTAAGCAG CGTCTCAACCGTGAAGATCAGGGGATTTCGTTCACTGAGTTTTCCTACAAC CTGCTGCAGGGTTATAGTGCGGCCTGTGTTAACAAACAGTACGGTGTGGTG CTGCAAATTGGTGGTTCTGACCAGTGGGGTAACATCACTTCTGGTATCGAC CTGACCCGTCGTCTGCATCAGAATCA GTG SEQ ID Polinucleótido GACGAGGAAGCGTTAGCAGAGCGACTGGCGCAAGGCCCGATCGCACTCATT NO.: 24 pAzidoPhe-5 TGTGGCTTCGATCCTACCGCTGACAGCTTGCATTTGGGGCATCTTGTTCCA (sitio activo) TTGTTATGCCTGAAACGCTTCCAGCAGGCGGGCCACAAGCCGGTTGCGCTG Sintetasa GTAGGCGGCGCGACGGGTCTGATTGGCGACCCGAGCTTCAAAGCTGCCGAG CGTAAGCTGAACACCGAAGAAACTGTTCAGGAGTGGGTGGACAAAATCCGT AAGCAGGTTGCCGCGTTCCTCGATTTCGACTGTGGAGAAAACTCTGCTATC GCGGCCAATGATTATGACTGGTTCGGCAATATGAATGTGCTGACCTTCCTG CGCGATATTGGCAAACACTTCTCCGTTAACCAGATGATCAACAAAGAAGCG GTTAAGCAGCGTCTCAACCGTGAAGATCAGGGGATTTCGTTCACTGAGTTT TCCTACAACCTGCTGCAGGGTTATAATTTTGCCTGTGTGAACAAACAGTAC GGTGTGGTGCTGCAAATTGGTGGTTCTGACCAGTGGGGTAACATCACTTCT GGTATCGACCTGACCCGTCGTCTGCATCAGAATCAGGTG SEQ ID Polinucleótido CGACTGGCGCAAGGCCCGATCGCACTCACGTGTGGCTTCGATCCTACCGCT NO.: 25 pAzidoPhe-6 GACAGCTTGCATTTGGGGCATCTTGTTCCATTGTTATGCCTGAAACGCTTC (sitio activo) CAGCAGGCGGGCCACAAGCCGGTTGCGCTGGTAGGCGGCGCGACGGGTCTG Sintetasa ATTGGCGACCCGAGCTTCAAAGCTGCCGAGCGTAAGCTGAACACCGAAGAA ACTGTTCAGGAGTGGGTGGACAAAATCCGTAAGCAGGTTGCCCCGTTCCTC GATTTCGACTGTGGAGAAAACTCTGCTATCGCGGCCAATAATTATGACTGG TTCGGCAATATGAATGTGCTGACCTTCCTGCGCGATATTGGCAAACACTTC TCCGTTAACCAGATGATCAACAAAGAAGCGGTTAAGCAGCGTCTCAACCGT GAAGATCAGGGGATTTCGTTCACTGAGTTTTCCTACAATCTGCTGCAGGGT TATTCGGCTGCCTGTCTTAACAAACAGTACGGTGTGGTGCTGCAAATTGGT GGTTCTGACCAGTGGGGTAACATCACTTCTGGTATCGACCTGACCCGTCGT CTGCATCAGAATCAGGTG SEQ ID Polinucleótido CGGGGGCTGGTANCCCAGGTGACGGACGAGGAAGCGTTAGCAGAGCGACTG NO.: 26 pPR-EcRS-1 GCGCAAGGCCCGATCGCACTCGGGTGTGGCTTCGATCCTACCGCTGACAGC (propargiloxifen TTGCATTTGGGGCATCTTGTTCCATTGTTATGCCTGAAACGCTTCCAGCAG - - ilalanina GCGGGCCACAAGCCGGTTGCGCTGGTAGGCGGCGCGACGGGTCTGATTGGC sintetasa) (sitio GACCCGAGCTTCAAAGCTGCCGAGCGTAAGCTGAACACCGAAGAAACTGTT activo) CAGGAGTGGGTGGACAAAATCCGTAAGCAGGTTGCCCCGTTCCTCGATTTC Sintetasa GACTGTGGAGAAAACTCTGCTATCGCGGCCAATAATTATGACTGGTTCGGC AATATGAATGTGCTGACCTTCCTGCGCGATATTGGCAAACACTTCTCCGTT AACCAGATGATCAACAAAGAAGCGGTTAAGCAGCGTCTCAACCGTGAAGAT CAGGGGATTTCGTTCACTGAGTTTTCCTACAACCTGCTGCAGGGTTATTCT ATGGCCTGTTTGAACAAACAGTACGGTGTGGTGCTGCAAATTGGTGGTTCT GACCAGTGGGGTAACATCACTTCTGGTATCGACCTGA CCGTCGTCTGCAT CAGAATCAGGTG SEQ ID Polinucleótido CGGGGGCTGGTAGCCCAGGTGACGGACGAGGAAGCGTTAGCAGAGCGACTG NO.: 27 pPR-EcRS -2 GCGCAAGGCCCGATCGCACTCACGTGTGGCTTCGATCCTACCGCTGACAGC (sitio activo) TTGCATTTGGGGCATCTTGTTCCATTGTTATGCCTGAAACGCTTCCAGCAG Sintetasa GCGGGCCACAAGCCGGTTGCGCTGGTAGGCGGCGCGACGGGTCTGATTGGC GACCCGAGCTTCAAAGCTGCCGAGCGTAAGCTGAACACCGAAGAAACTGTT CAGGAGTGGGTGGACAAAATCCGTAAGCAGGTTGCCCCGTTCCTCGATTTC GACTGTGGAGAAAACTCTGCTATCGCGGCCAATAATTATGACTGGTTCGGC AATATGAATGTGCTGACCTTCCTGCGCGATATTGGCAAACACTTCTCCGTT AACCAGATGATCAACAAAGAAGCGGTTAAGCAGCGTCTCAACCGTGAAGAT CAGGGGATTTCGTTCACTGAGTTTTCCTACAATCTGCTGCAGGGTTATTCG GCTGCCTGTCTTAACAAACAGTACGGTGTGGTGCTGCAAATTGGTGGTTCT GACCAGTGGGGTAACATCACTTCTGGTATCGAACCTGA CCGTCGTCTGCA TCAAAATCAAGTG SEQ ID Polinucleótido CGGGGGCTGGTACCCCAAGTGACGGACGAGGAAACGTTAGCAGAGCGACTG NO.: 28 pPR-EcRS -3 GCGCAAGGCCCGATCGCACTCTCTTGTGGCTTCGATCCTACCGCTGACAGC (sitio activo) TTGCATTTGGGGCATCTTGTTCCATTGTTATGCCTGAAACGCTTCCAGCAG Sintetasa GCAGGCCACAAGCCGGTTGCGCTGGTAGGCGGCGCGACGGGTCTGATTGGC GACCCGAGCTTCAAAGCTGCCGAGCGTAAGCTGAACACCGAAGAAACTGTT CAGGAGTGGGTGGACAAAATCCGTAAGCAGGTTGCCCCGTTCCTCGATTTC GACTGTGGAGAAAACTCTGCTATCGCGGCCAATAATTATGACTGGTTCGGC AATATGAATGTGCTGACCTTCCTGCGCGATATTGGCAAACACTTCTCCGTT AACCAGATGATCAACAAAGAAGCGGTTAAGCAGCGTCTCAACCGTGAAGAT CAGGGGATTTCGTTCACTGAGTTTTCCTACAACCTGCTGCAGGGTTATACG ATGGCCTGTGTGAACAAACAGTACGGTGTGGTGCTGCAAATTGGTGGTTCT GACCAGTGGGGTAACATCACTTCTGGTATCGACCTGACCCGTCGTCTGCAT CAGAATCAGGTG SEQ ID Polinucleótido CGGGGGCTGGTAGCCCAGGTGACGGACGAGGAAGCGTTAGCAGAGCGACTG NO.: 29 pPR-EcRS -4 GCGCAAGGCCCGATCGCACTCGCGTGCGGCTTCGATCCTACCGCTGACAGC (sitio activo) TTGCATTTGGGGCATCTTGTTCCATTGTTATGCCTGAAACGCTTCCAGCAG Sintetasa GCGGGCCACAAGCCGGTTGCGCTGGTAGGCGGCGCGACGGGTCTGATTGGC GACCCGAGCTTCAAGGCTGCCGAGCGTAAGCTGAACACCGAAGAAACTGTT CAGGAGTGGGTGGACAAAATCCGTAAGCAGGTTGCCCCGTTCCTCGATTTC GACTGTGGAGAAAACTCTGCTATCGCGGCCAATAATTATGACTGGTTCGGC AATATGAATGTGCTGACCTTCCTGCGCGATATTGGCAAACACTTCTCCGTT AACCAGATGATCAACAAAGAAGCGGTTAAGCAGCGTCTCAACCGTGAAGAT CAGGGGATTTCGTTCACTGAGTTTTCCTACAACCTGCTGCAGGGTTATTCT TATGCCTGTCTTAACAAACAGTACGGTGTGGTGCTGCAAATTGGTGGTTCT GACCAGTGGGGTAACATCACTTCTGGTATCGACCTGACCCGTCGTCTGCAT CAGAATCAGGTG SEQ ID Polinucleótido CGGGGGCTGGTAGCCCAGGTGACGGACGAGGAAGCGTTAGCAGAGCGACTG NO.: 30 pPR-EcRS-5 GCGCAAGGCCCGATCGCACTCGCGTGTGGCTTCGATCCTACCGCTGACAGC (sitio activo) TTGCATTTGGGGCATCTTGTTCCATTGTTATGCCTGAAACGCTTCCAGCAG Sintetasa GCGGGCCACAAGCCGGTTGCGCTGGTAGGCGGCGCGACGGGTCTGATTGGC GACCCGAGCTTCAAAGCTGCCGAGCGTAAGCTGAACACCGAAGAAACTGTT - - CAGGAGTGGGTGGACAAAATCCGTAAGCAGGTTGCCCCGTTCCTCGATTTC GACTGTGGAGAAAACTCTGCTATCGCGGCCAATAATTATGACTGGTTCGGC AATATGAATGTGCTGACCTTCCTGCGCGATATTGGCAAACACTTCTCCGTT AACCAGATGATCAACAAAGAAGCGGTTAAGCAGCGTCTCAACCGTGAAGAT CAGGGGATTTCGTTCACTGAGTTTTCCTACAACCTGCTGCAGGGTTATACG ATGGCCTGTTGTAACAAACAGTACGGTGTGGTGCTGCAAATTGGTGGTTCT GACCAGTGGGGTAACATCACTTCTGGTATCGACCTGACCCGTCGTCTGCAT CAGAATCAGGTG SEQ ID Polinucleótido CGGGGGCTGGTACCCCAAGTGACGGACGAGGAAGCGTTAGCAGAGCGACTG NO.: 31 pPR-EcRS-6 GCGCAAGGCCCGATCGCACTCACGTGTGGCTTCGATCCTACCGCTGACAGC (sitio activo) TTGCATTTGGGGCATCTTGTTCCATTGTTATGCCTGAAACGCTTCCAGCAG Sinteíasa GCGGGCCACAAGCCGGTTGCGCTGGTAGGCGGCGCGACGGGTCTGATTGGC GACCCGAGCTTCAAAGCTGCCGAGCGTAAGCTGAACACCGAAGAAACTGTT CAGGAGTGGGTGGACAAAATCCGTAAGCAGGTTGCCCCGTTCCTCGATTTC GACTGTGGAGAAAACTCTGCTATCGCGGCCAATAATTATGACTGGTTCGGC AATATGAATGTGCTGACCTTCCTGCGCGATATTGGCAAACACTTCTCCGTT AACCAGATGATCAACAAAGAAGCGGTTAAGCAGCGTCTCAACCGTGAAGAT CAGGGGATTTCGTTCGCTGAGTTTTCCTACAACCTGCTGCAGGGTTATACG TTTGCCTGTATGAACAAACAGTACGGTGTGGTGCTGCAAATTGGTGGTTCT GACCAGTGGGGTAACATCACTTCTGGTATCGACCTGACCCGTCGTCTGCAT CAGAATCAGGTG SEQ ID Polinucleótido GTGACGGACGAGGAAGCGTTAGCAGAGCGACTGGCGCAAGGCCCGATCGCA NO.:32 pPR-EcRS-7 CTCACGTGTGGCTTCGATCCTACCGCTGACAGCTTGCATTTGGGGCATCTT (sitio activo) GTTCCATTGTTATGCCTGAAACGCTTCCAGCAGGCGGGCCACAAGCCGGTT Sintetasa GCGCTGGTAGGCGGCGCGACGGGTCTGATTGGCGACCCGAGCTTCAAAGCT GCCGAGCGTAAGCTGAACACCGAAGAAACTGTTCAGGAGTGGGTGGACAAA ATCCGTAAGCAGGTTGCCCCGTTCCTCGATTTCGACTGTGGAGAAAACTCT GCTATCGCGGCCAATAATTATGACTGGTTCGGCAATATGAATGTGCTGACC TTCCTGCGCGATATTGGCAAACACTTCTCCGTTAACCAGATGATCAACAAA GAAGCGGTTAAGCAGCGTCTCAACCGTGAAGATCAGGGGATTTCGTTCACT GAGTTTTCCTACAATCTGCTGCAGGGTTATTCGGCTGCCTGTCTTAACAAA CAGTACGGTGTGGTGCTGCAAATTGGTGGTTCTGACCAGTGGGGTAACATC ACTTCTGGTATCGACCTGACCCGTCGTCTGCATCAGAATCAGGTG SEQ ID Polinucleótido CGGGGGCTGGTAGCCCAGGTGACGGACGAGGAAGCGTTAGCAGAGCGACTG NO.: 33 pPR-EcRS-8 GCGCAAGGCCCGATCGCACTCGTTTGTGGCTTCGATCCTACCGCTGACAGC (sitio activo) TTGCATTTGGGGCATCTTGTTCCATTGTTATGCCTGAAACGCTTCCAGCAG Sintetasa GCGGGCCACAAGCCGGTTGCGCTGGTAGGCGGCGCGACGGGTCTGATTGGC GACCCGAGCTTCAAAGCTGCCGAGCGTAAGCTGAACACCGAAGAAACTGTT CAGGAGTGGGTGGACAAAATCCGTAAGCAGGTTGCCCCGTTCCTCGATTTC GACTGTGGAGAAAACTCTGCTATCGCGGCCAATAATTATGACTGGTTCGGC AATATGAATGTGCTGACCTTCCTGCGCGATATTGGCAAACACTTCTCCGTT AACCAGATGATCAACAAAGAAGCGGTTAAGCAGCGTCTCAACCGTGAAGAT CAGGGGATTTCGTTCACTGAGTTTTCCTACAACCTGCTGCAGGGTTATTCG ATGGCCTGTACGAACAAACAGTACGGTGTGGTGCTGCAAATTGGTGGTTCT GACCAGTGGGGTAACATCACTTCTGGTATCGACCTGACCCGTCGTCTGCAT CAGAATCAGGTG SEQ ID Polimicleótido CGGGGGCTGGTAHCCCAAGTGACGGACGGGGAAGCGTTAGCAGAGCGACTG NO.: 34 pPR-EcRS-9 GCGCAAGGCCCGATCGCACTCAGTTGTGGCTTCGATCCTACCGCTGACAGC (sitio activo) TTGCATTTGGGGCATCTTGTTCCATTGTTATGCCTGAAACGCTTCCAGCAG Sintetasa GCGGGCCACAAGCCGGTTGCGCTGGTAGGCGGCGCGACGGGTCTGATTGGC GACCCGAGCTTCAAAGCTGCCGAGCGTAAGCTGAACACCGAAGAAACTGTT CAGGAGTGGGTGGACAAAATCCGTAAGCAGGTTGCCCCGTTCCTCGATCTC GACTGTGGAGAAAACTCTGCTATCGCGGCCAATAATTATGACTGGTTCGGC AATATGAATGTGCTGACCTTCCTGCGCGATATTGGCAAACACTTCTCCGTT - - AACCAGATGATCAACAAAGAAGCGGTTAAGCAGCGTCTCAACCGTGAAGAT CAGGGGATTTCGTTCACTGAGTTTTCCTACAACCTGCTGCAGGGTTATAGT TTTGCCTGTGTGAACAAACAGTACGGTGTGGTGCTGCAAATTGGTGGTTCT GACCAGTGGGGTAACATCACTTCTGGTATCGACCTGACCCGTCGTCTGCAT CAGAATCAGGTG SEQ ID Polinucleótido CGGGGGCTGGTAGCCCAGGTGACGGACGAGGAAGCGTTAGCAGAGCGACTG NO.: 35 pPR-EcRS-10 GCGCAAGGCCCGATCGCACTCACGTGTGGCTTCGATCCTACCGCTGACAGC (sitio activo) TTGCATTTGGGGCATCTTGTTCCATTGTTATGCCTGAAACGCTTCCAGCAG Sintetasa GCGGGCCACAAGCCGGTTGCGCTGGTAGGCGGCGCGACGGGTCTGATTGGC GACCCGAGCTTCAAAGCTGCCGAGCGTAAGCTGAACACCGAAGAAACTGTT CAGGAGTGGGTGGACAAAATCCGTAAGCAGGTTGCCCCGTTCCTCGATTTC GACTGTGGAGAAAACTCTGCTATCGCGGCCAATAATTATGACTGGTTCGGC AATATGAATGTGCTGACCTTCCTGCGCGATATTGGCAAACACTTCTCCGTT AACCAGATGATCAACAAAGAAGCGGTTAAGCAGCGTCTCAACCGTGAAGAT CAGGGGATTTCGTTCACTGAGTTTTCCTACAACCTGCTGCAGGGTTATACG TTTGCCTGTACTAACAAACAGTACGGTGTGGTGCTGCAAATTGGTGGTTCT GACCAGTGGGGTAACATCACTTCTGGTATCGACCTGACCCGTCGTCTGCAT CAGAATCAGGTG SEQ ID Aminoácido MASS LI QLQERGLVAQVTDEEALAERLAQGPIALVCGFDPTADSLHLGH NO.: 36 (aa) p-iodo LVPLLCLKRFQQAGH PVALVGGATGLIGDPSF AAERKLNTEETVQE VD PheRS-1 KIRKQVAPFLDFDCGENSAIAAKTCrroWFG ]^ Sintetasa KEAV QRL REDQGISFTEFSY LLQGySYACLN QYGWLQIGGSDQ GN ITSGIDLTPJiLHQKrQVFGLTVPLITKADGT FG TEGGAVWLDPKKTSPY FYQFWINTADADVYRFL FFTFMSIEEIWALEEEDKNSG APRAQYVLAEQ VTRLVHGEEGLQAAKRITECLFSGSLSALSEADFEQLAQDGVPMVEMEKGA DL QALVDSELQPSRGQARKTIASNAITINGEKQSDPEYFFKEEDRLFGRF TLLRRGKK YCLICWK SEQ ID Aminoácido MASSNLIKQLQERGLVAQVTDEEALAERLAQGPIALICGFDPTADSLHLGH NO.: 37 (aa) p-iodo LVPLLCLKRFQQAGH VALVGGATGLIGDPSFKAAERKLNTEETVQE VD PheRS-2 KIR QVAPFLDFDCGENSAIAAimDWFG Ml^TFLRDIGKHFSVNQMIN Sintetasa KEAVKQRL REDQGISFTEFSY LLQGYSMACLNKQYGWLQIGGSDQ GN ITSGIDLTRRLHQNQVFGLTVPLITKADGTKFGKTEGGAVWLDP TSPYK FYQFWINTADADWRFL FFTF SIEEINALEEEDK SG APRAQYVI-AEQ VTRLVHGEEGLQAARITECLFSGSLSALSEADFEQLAQDGVPMVE EKGA DLMQALVDSELQPSRGQARKTIASNAITINGEKGSDPEYFFKEEDRLFGRF TLLRRGKKYCLICWK SEQ ID Aminoácido MASSK iKQLQERGLVAQVTDEEALAERLAQGPIALVCGFDPTADSLHLGH NO.: 38 (aa) p-iodo LVPLLCLKRFQQAGHKPVALVGGATGLIGDPSFKAAERKLNTEETVQEWVD PheRS-3 KIRKQVAPFLDFDCGENSAIAANim»WFGín-VLTFLRDIG HFSVNQMIN Sintetasa KEAV QRLNREDQGISFTEFSYNLLQGYSMACANKQYG LQ1GGSDQWGMÍ ITSGIDLTRRLHQMQVFGLTVPLITKADGTKFGKTEGGAV LDPKKTSPYK FYQFWINTADADVYRFLKFFTFMSIEEIWALEEEDIOSrSGia^RAQYVLAEQ VTRLVHGEEGLQAAKRITECLFSGSLSALSEADFEQLAQDGVP VEMEKGA DLMQALVDSELQPSRGQARKTIASNAITINGEKQSDPEYFFKEEDRLFGRF TLLRRGKKNYCLICWK SEQ ID Aminoácido MASSNLIKQLQERGLVAQVTDEEALAERLAQGPIALVCGFDPTADSLHLGH NO.: 39 (aa) LVPLLCLKRFQQAGHKPVALVGGATGLlGDPSFKAAERIOuNTEETVQE VD OMeT rRS-1 KIRKQVAPFLDFDCGEWSAIAAimYDWFG MNVLTFLRDIG HFSVNQMIlJ Sintetasa KEAVKQRLNREDQGISFTEFSYNLLQGYSMACLNKQYGWLQIGGSDQWGN ITSGIDLTRRLHQNQVFGLTVPLITKADGTKFGKTEGGAVWLDPKKTSPY FYQFWINTADADVYRFLKFFTFMSIEEINALEEEDKNSGKAPRAQYVLAEQ VTRLVHGEEGLQAAKRITECLFSGSLSALSEADFEQLAQDGVPMVEMEKGA DLMQALVDSELQPSRGQARKTIASNAITINGEKQSDPEYFFKEEDRLFGRF TLLRRGKKNYCLICWK - - SEQ ID Aminoácido IVLASSl^IKQLQERGLVAQVTDEEALAERIiAQGPIALTCGFDPTADSLHLGH NO.: 40 (aa) LVPLLCLKRFQQAGHKPVALVGGATGLIGDPSFKAAER L TEETVQEWVD OMeTyrRS-2 KIRKQVAPFLDFDCGENSAIAAlOTYDWFGNMSrVLTFLR^ Sintetasa EAV QRL REDQGISFTEFSYNLLQGYTMACL QYGVVLQIGGSDQWGN ITSGIDLTRRLHQNQVFGLTVPLITKADGTKFGKTEGGA LDPKKTSPYK FYQFWINTADADVYRFLKFFTFMSIEEINALEEEDKMSG APRAQYVLAEQ VTRLVHGEEGLQAAKRITECLFSGSLSALSEADFEQLAQDGVPMVEMEKGA DLMQALVDSELQPSRGQARKTIASNAITINGEKQSDPEYFFKEEDRLFGRF TLLRRGKKNYCLICWK SEQ ID Aminoácido MASSNLI QBQERGLVAQVTDEEALAERLAQGPIALTCGFDPTADSLHLGH NO.: 41 (aa) LVPLLCLKRFQQAGHKPVALVGGATGLIGDPSFKAAER LNTEETVQEWYD OMeT rRS-3 IR QVAPFLDFDCGENSAIAAOTSTYDWFGMNVLTFLRDIG HFSWQMIN Sintetasa EAVKQRLNREDQGISFTEFSYNLLQGYTYACLNKQYGWLQIGGSDQ GN ITSGIDLTPJLHQNQVFGLTVPLIT ADGTKFGKTEGGAVWLDP TSPYK FYQFWINTADADVYRFL FFTFMSIEEINALEEED SG APPAQYVLAEQ VTRIiVHGEEGLQAAKRITECLFSGSLSALSEADFEQLAQDGVPMVEMEKGA DLMQALVDSELQPSRGQARKTIASNAITINGEKQSDPEYFFKEEDRLFGRF TLLRRGKKNYCLICWK SEQ ID Aminoácido MASSNLI QLQERGLVAQVTDEEALAERLAQGPIALLCGFDPTADSLHLGH NO.: 42 (aa) LVPLLCL RFQQAGH PVALVGGATGLIGDPSF AAERKLNTEETVQE VD OMeTyrRS-4 KIR QVAPFLDFDCGENSAIAAOTm) FGNMNVLTFLRDIG HFSVNQ IN Sintetasa EAVKQRLNREDQGISFTEFSYNLLQGYSMACSNKQYGWLQIGGSDQWGN ITSGIDLTRRLHQNQVFGLTVPLIT ADGT FGKTEGGA LÜP KTSPYK FYQFWINTADADVYRFLKFFTFMSIEEINALEEEDKNSGKAPRAQYVLAEQ VTRLVHGEEGLQAAKRITECLFSGSLSALSEADFEQLAQDGVPMVEMEKGA DLMQALVDSELQPSRGQARKTIASNAITINGEKQSDPEYFFKEEDRLFGRF TLLRRGKKNYCLICWK SEQ ID Aminoácido ASSHLIKQLQERGLVAQVTDEEALAERLAQGPIALLCGFDPTADSLHLGH NO.: 43 (aa) LVPLLCLKRFQQAGHKPVALVGGATGLIGDPSFIO^RKLNTEE VQEWVD OMeTyrRS-5 KIRKQVAPFLDFDCGENSAIAAinraíWFGlMtmiTFLRDIGIHFSV^ Sintetasa KEAVKQRLNREDQGISFTEFSYNLLQGYSMACANKQYGWLQIGGSDQWGN ITSGIDLTRRLHQNQVFGLTVPLITKADGTKFGKTEGGAVWLDPKKTSPYK FYQFWINTADADVYRFLKFFTFMSIEEINALEEEDKNSG APRAQYVLAEQ VTRLVHGEEGLQAA RITECLFSGSLSALSEADFEQLAQDGVPMVE EKGA DLMQALVDSELQPSRGQARKTIASNAITINGEKQSDPEYFFKEEDRLFGRF TLLRRGKKNYCLICWK SEQ ID Aminoácido MASSNLIKQLQERGLVAQVTDEEALAERLAQGPIALTCGFDPTADSLHLGH NO.: 44 (aa) LVPLLCLKRFQQAGHKPVALVGGATGLIGDPSFKAAERKLNTEETVQEWVD OMeTyrRS-6 KIRKQVAPFLDFDCGENSAIAANl^lWFGNMNVLTFLRDIGKHFSVlíQMIN Sintetasa KEAVKQRLNREDQGISFTEFSYNLLQGYR ACLNKQYGWLQIGGSDQWGN ITSGIDLTRRLHQNQVFGLTVPLITKADGTKFGKTEGGAVWLDPKKTSPYK FYQFWINTADADVYRFLKFFTFMSIEEINALEEED-OTSGKAPRAQYVLAEQ VTRLVHGEEGLQAAKRITECLFSGSLSALSEADFEQLAQDGVPMVE EKGA DL QALVDSELQPSRGQARKTIASNAITINGEKQSDPEYFFKEEDRLFGRF TLLRRGKKNYCLICWK SEQ ID Aminoácido MASSNLIKQLQERGLVAQVTDEEALAERLAQGPIALICGFDPTADSLHLGH NO.: 45 (aa) p- LVPLLCLKRFQQAGHKPVALVGGATGLIGDPSFKAAERKLNTEETVQEWVB acetüPheRS-1 KIRKQVAPFLDFDCGENSAIAANNYDWFGNMNVLTFLRDIGKHFSWQMIN Sintetasa KEAVKQRLNREDQGISFTEFSYNLLQGYGMACANKQYGWLQIGGSDQWGN ITSGIDLTRRLHQNQVFGLTVPLITKADGTKFGKTEGGAVWLDPKKTSPYK FYQFWINTADADVYRFLKFFTFMSIEEINALEEEDKNSGKAPRAQYVLAEQ VTRLVHGEEGLQAAKRITECLFSGSLSALSEADFEQLAQDGVPMVEMEKGA DLMQALVDSELQPSRGQARKTIASNAITINGEKQSDPEYFFKEEDRLFGRF TLLRRGKKNYCLICWK - - SEQ ID Aminoácido WASS^I QLQERGLVAQVTDEEALAERLAQGPIALGCGFDPTADSLHLGH NO.: 46 (aa) p-benzoil LVPLLCLKRFQQAGHKPVALVGGATGLIGDPSF AAERKLNTEETVQEWVD PheRS-1 KIRKQVAPFLDFDCGENSAIAANNYOWFGlsMNVLTFLRDIGK^ Sintetasa KEAVKQRL REDQGISFTEFSYNLLQGYGFACAN QYGWLQIGGSDQWGN ITSGIDLTRRLHQNQVFGLWPLITKADGTKFGKTEGGA LDPKKTSPYK FYQFWINTADADVYRFLKFFTFMSIEEINALEEEDKNSGKAPRAQYVLAEQ VTRLVHGEEGLQAAKRITECLFSGSLSALSEADFEQLAQDGVPMVEMEKGA DLMQALVDSELQPSRGQARKTIASNAITINGEKQSDPEYFFKEEDRLFGRF TLLRRGKKNYCLICWK SEQ ID Aminoácido MASSWLIKQLQERGLVAQVTDEEALAERLAQGPIALGCGFDPTADSLHLGH NO.: 47 (aa) p-benzoil LVPLLCLKRFQQAGHKPVALVGGATGLIGDPSFKAAERKLNTEETVQEWVD Pb.eRS-2 IRKQVAPFLDFDCGENSAIAAHim3WFGlMSrVLTFLRDIGKHFSVNQMIN Sintetasa KEAVKQRLNREDQGISFTEFSYNLLQGYGYACM KQYGWLQIGGSDQ GN ITSGIDLTRRLHQNQVFGLTVPLIT ADGTKFG TEGGAV LDP ECTSPYK PYQFWINTADADVYRFLKFFTFMSIEEIlíALEEED NSG APRAQYVLAEQ VTRLVHGEEGLQAA RITECLFSGSLSALSEADFEQIiAQDGVPMVE EKGA DLMQALVDSELQPSRGQARKTIASNAITINGEKQSDPEYFFKEEDRLFGRF TLLRRG KNYCLIC K SEQ ID Aminoácido MASS LI QLQERGLVAQVTDEEALAERLAQGPIALLCGFDPTADSLHLGH NO.: 48 (aa) p-azido LVPLLCL RFQQAGH PVALVGGATGLIGDPSF AAER l-JJTEE VQEWVD PheRS-1 KIRKQVAPFLDFDCGENSAIAAN]ra)WFGNMNVLTFLRDIGKHFSVlTQMIN Sintetasa KEAVKQRLNREDQGISFTEFSYNLLQGYSMAOUtfKQYGVVLQIGGSDQWGN ITSGIDLTRRLHQNQVFGLTVPLIT ADGT FGKTEGGAVWLDPKKTSPY FYQFWINTADADVYRFLKFFTF SIEEINALEEED NSGKAPRAQYVLAEQ VTRLVHGEEGLQAAKRITECLFSGSLSALSEADFEQIAQDGVPMVEMEKGA DLMQALVDSELQPSRGQARKTIASNAITINGEKQSDPEYFFKEEDRLFGRF TLLRRGKKNYCLICWK SEQ ID Aminoácido MASSNLIKQLQERGLVAQVTDEEALAERLAQGPIALVCGFDPTADSLHLGH NO.: 49 (aa) p-azido LVPLLCLKRFQQAGHKPVALVGGATGLIGDPSFKAAERKLNTEEWQEWVD PheRS-2 KIRKQVAPFLDFDCGENSAIAAN YDWFGNMNVLTFLRDIGKHFS Sintetasa KEAVKQRLNREDQGISFTEFSYNLLQGYSAACANKQYGWLQIGGSDQWGN ITSGIDLTRRLHQNQVFGLTVPLITKADGTKFGKTEGGAVWLDPKKTSPYK FYQF INTADADVYRFLKFFTF SIEEINALEEEDK SGKAPRAQYVLAEQ VTRLVHGEEGLQAAKRITECLFSGSLSALSEADFEQLAQDGVPMVEMEKGA DLMQALVDSELQPSRGQARKTIASNAITINGEKQSDPEYFFKEEDRLFGRF TLLRRGKKNYCLICWK SEQ ID Aminoácido MASSNLIKQLQERGLVAQVTDEEALAERLAQGPIALLCGFDPTADSLHLGH NO.: 50 (aa) p-azido LVPLLCLKRFQQAGHKPVALVGGATGLIGDPSFIAAERKLNTEETVQEWVD PheRS-3 KIRKQVAPFLDFDCGENSAIAANNYDWFGNMNVLTFLRDIGKHFSVNQMIN Sintetasa KEAVKQRLNREDQGISFTEFSYNLLQGYSAACANKQYGVVLQIGGSDQWGN ITSGIDLTRRLHQNQVFGLTVPLITKADGT FGKTEGGAVWLDPKKTSPYK FYQFWINTADADVYRFLKFFTFMSIEEINALEEEDKNSGKAPRAQYVLAEQ VTRLVHGEEGLQAAKRITECLFSGSLSALSEADFEQLAQDGVPMVEMEKGA DLMQALVDSELQPSRGQARKTIASNAITINGEKQSDPEYFFKEEDRLFGRF TLLRRGKKNYCLICWK SEQ ID Aminoácido MASSNLIKQLQERGLVAQVTDEEALAERLAQGPIALVCGFDPTADSLHLGH NO.: 51 (aa) p-azido LVPLLCLíRFQQAGHKPVALVGGATGLIGDPSFKAAERKLNTEETVQE VI) PheRS-4 KIRKQVAPFLDFDCGENSAIAANNYDWFGNMNVLTFLRDIGKHFSVNQMIN Sintetasa KEAVKQRLNREDQGISFTEFSYNLLQGYSAACVNKQYGWLQIGGSDQWGN ITSGIDLTRRLHQNQVFGLTVPLITKADGTKFGKTEGGAVWLDPKKTSPYK FYQFWIlSrTADADVYRFLKFFTF SIEEINALEEEDKNSGKAPRAQYVLAEQ VTRLVHGEEGLQAAKRITECLFSGSLSALSEADFEQLAQDGVP VEMEKGA DLMQALVDSELQPSRGQARKTIASNAITINGEKQSDPEYFFKEEDRLFGRF TLLRRGKKNYCLICWK - - SEQ ID Aminoácido !LA.SS]^IKQLQERGLVAQV DEEALAERLAQGPIALIC6FDPTADSLHLGH NO.: 52 (aa) p-azido LVPLLCL RPQQAGHKPVALVGGATGLIGDPSF AAER LHTEETVQE VI) PheRS-5 KIR QVAPFLDFDCGENSAIAA DYDWFG MNVLTFLRDIGKHFSA71ÍQ IN Sintetasa EAVKQRLNREDQGISFTEFSYNLLQGYNFACWKQYGVVLQIGGSDQWGN ITSGIDLTRRLHQNQVFGLTVPLIT ADGT FGKTEGGA LDP KTSPYK FYQFWINTADADVYRFLKFFTFMSIEEINALEEED .JSGKAPRAQYVLAEQ VTRLVHGEEGLQAAKRITECLFSGSLSALSEADFEQLAQDGVPMVEMEKGA DL QALVDSELQPSRGQARKTIASNAITINGEKQSDPEYFFKEEDRLFGRF TLLRRGKKNYCLICWK SEQ ID Aminoácido MA.SSNIJIKQLQERGLVAQVTDEEAIJAERLAQGPIALTCGFDPTADSLHLGH NO.: 53 (aa) p-azido LVPLLCLKRFQQAGHKPVALVGGATGLIGDPSFKAAER LNTEETVQEWVD PheRS-6 KIRKQVAPFLDFDCGENSAIAANNYOWFGNMNVLTFLRDIGimFSWQMIN Sintetasa EAV QRLNREDQGISFTEFSYNLLQGYSAACLNKQYGWLQIGGSDQWGN ITSGIDLTRRLHQNQVFGLTVPLITKADGTKFGKTEGGAWLDPKKTSPYK FYQFWINTADADVYRFLKFFTFMSIEEI ALEEEDKNSGKAPRAQYVLAEQ VTRLVHGEEGLQAAKRITECLFSGSLSALSEADFEQLAQDGVP VEME GA DLMQALVDSELQPSRGQARKTIASNAITINGEKQSDPEYFFKEEDRLFGRF TLLRRGKKNYCLICWK SEQ ID Aminoácido ASS LIKQLQERGLVAQVTDEEALAERLAQGPIALGCGFDPTADSLHLGH NO.: 54 (aa) pPR-EcRS- LVPLLCLKRFQQAGHKPVALVGGATGLIGDPSFKAAERKLNTEETVQE VD 1 Sintetasa KIH.KQVAPFLDFDCGENSAIAAKIsTYDWFGNMNVLTFLRDIGKHFSVNQMIN p-propargil KEAVKQRLNREDQGISFTEFSYNLLQGYSMACLNKQYGWLQIGGSDQWGN oxifenilalanina ITSGIDLTRRLHQNQVFGLTVPLITKADGTKFGKTEGGAVWLDPKKTSPYK sintetasa FYQFWINTADADVYRFLKFFTFMSIEEINALEEEDKNSGKAPRAQYVLAEQ VTRLVHGEEGLQAAKRITECLFSGSLSALSEADFEQLAQDGVPMVEMEKGA DLMQALVDSELQPSRGQARKTIASNAITINGEKQSDPEYFFKEEDRLFGRF TLLRRGKKNYCLICWK SEQ ID Aminoácido ASSNLIKQLQERGLVAQVTDEEALAERLAQGPIALTCGFDPTADSLHLGH NO.: 55 (aa) pPR-EcRS- LVPLLCLKRFQQAGHKPVALVGGATGLIGDPSFKAAERKLNTEETVQEWVD 2 Sintetasa KIRKQVAPFLDFDCGENSAIAAl^YDWFGl n i VLTFLPJDIGKHFSVlTQMIN KEAVKQRLNREDQGISFTEFSYNLLQGYSAACLNKQYGWLQIGGSDQWGN ITSGIDLTRRLHQNQVFGLTVPLITKADGTKFGKTEGGAVWLDPKKTSPYK FYQFWINTADADVYRFLKFFTFMSIEEINALEEEDKNSGKAPRAQYVLAEQ VTRLVHGEEGLQAAKRITECLFSGSLSALSEADFEQLAQDGVP VE EKGA DLMQALVDSELQPSRGQARKTIASNAITINGEKQSDPEYFFKEEDRLFGRF TLLRRGKKNYCLICWK SEQ ID Aminoácido MASSNLIKQLQERGLVAQVTDEEALAERLAQGPIALSCGFDPTADSLHLGH NO.: 56 (aa) pPR-EcRS- LVPLLCLKRFQQAGHKPVALVGGATGLIGDPSFKAAERKL TEETVQEWVD 3 Sintetasa KIRKQVAPFLDFDCGENSAIAMTNTO EAVKQRLimEDQGISFTEFSYWLLQGYTMACVNKQYGVVLQIGGSDQWGlJ ITSGIDLTRRLHQNQVFGLTVPLITKADGTKFGKTEGGAVWLDPKKTSPYK FYQFWINTADADVYRFLKFFTF SIESINALEEEDKNSGKAPPJ^QYVLAEQ VTRLVHGEEGLQAAKRITECLFSGSLSALSEADFEQLAQDGVPMVEMEKGA DL QALVDSELQPSRGQARKTIASNAITINGEKQSDPEYFFKEEDRLFGRF TLLRRGKKNYCLICWK SEQ ID Aminoácido MASSNLIKQLQERGLVAQVTDEEALAERLAQGPIALACGFDPTADSLHLGH NO.: 57 (aa) pPR-EcRS- LVPLLCLKRFQQAGHKPVALVGGATGLIGDPSFKAAERKLNTEETVQEWVD 4 Sintetasa KIRKQVAPFLDFDCGEWSAIAATSn DWFGlWnSTVLTFLRDIGKHFSVNQMIN KEAVKQRLNREDQGISFTEFSYNLLQGYSYACLNKQYGWLQIGGSDQWGII ITSGIDLTRRLHQNQVFGLTVPLITKADGTKFGKTEGGAVWLDPKKTSPYK FYQFWINTADADVYRFLKFFTFMSIEEINALEEEDKNSGjEAPRAQYVLAEQ VTRLVHGEEGLQAAKRITECLFSGSLSALSEADFEQLAQDGVPMVE EKGA DLMQALVDSELQPSRGQARKTIASNAITINGEKQSDPEYFFKEEDRLFGRF TLLRRGKKNYCLICWK - - SEQ ID Aminoácido MASSNLIKQLQERGLVAQVTDEBALAERLAQGPIALACGFDPTADSLHLGH NO.: 58 (aa) pPR-EcRS- LVPLLCLKRFQQAGH PVALVGGATGLIGDPSF AAERKLNTEETVQE VD 5 Sintetasa KIR QVAPFLDFDCGENSAIAANNYDWFGIOTNVLTFLRDIG HFSVITQ IN EAVKQRLNREDQGISFTEFSYWLLQGYTMACCNKQYGWLQIGGSDQ GN ITSGIDLTRRLHQKQVFGLTVPLITKADGT FGKTEGGAVWLDP KTSPYK FYQF INTADADVYRFL FFTFMSIEEIWALEEEDKNSGKAPRAQYVIiAEQ VTRLVHGEEGLQAARITECLFSGSLSALSEADFEQLAQDGVPMVE E GA DLMQALVDSELQPSRGQARKTIASNAITINGEKQSDPEYFFKEEDRLFGRF TLLRRGKKNYCLICWK SEQ ID Aminoácido ASSNLIKQLQERGLVAQVTDEEALAERLAQGPIALTCGFDPTADSLHLGH NO.: 59 (aa) pPR-EcRS- LVPLLCLKRFQQAGHKPVALVGGATGLIGDPSFKAAERKLNTEEWQEWVD 6 Sintetasa KIRKQVAPFLDFDCGENSAIAANYDWFGIMMVLTFLRDIG HFSVNQMIN KEAVKQRL REDQGISFTEFSY LLQGYTFACMNKQYGWLQIGGSDQWGN ITSGIDLTRRLHQKTQVFGLTVPLITKADGT FG TEGGAV LDP TSPY FYQFWINTADADVYRFLKFFTFMSIEEI ALEEED MSGKAPRAQYVLAEQ VTRLVHGEEGLQAAKRITECLFSGSLSALSEADFEQIJAQDGVP VEME GA DLMQALVDSELQPSRGQARKTIASNAITINGEKQSDPEYFFKEEDRLFGRF TLLRRGKKNYCLICWK SEQ ID Aminoácido MASSNLIKQLQERGLVAQVTDEEALAERLAQGPIALTCGFDPTADSLHLGH NO.: 60 (aa) pPR-EcRS- LVPLLCLKKFQQAGHKPVALVGGATGLIGDPSFKAAERKIJ TEETVQEWVD 7 Sintetasa KIRKQVAPFLDFDCGENSAIAANNYDWFGItfMNVLTFLRDIGKH^ KEAVKQRLNREDQGISFTEFSYNLLQGYSVACLNKQYGWLQIGGSDQWGN ITSGIDLTRRLHQNQVFGLTVPLITKADGTKFGKTEGGAVWLDPKKTSPYK FYQFWINTADADVYRFLKFFTFMSIEEINALEEEDKNSGKAPRAQYVLAEQ VTRLVHGEEGLQAAKRITECLFSGSLSALSEADFEQLAQDGVPMVEMEKGA DLMQALVDSELQPSRGQARKTIASNAITINGEKQSDPEYFFKEEDRLFGRF TLLRRGKKNYCLICWK SEQ ID Aminoácido MASSNLIKQLQERGLVAQVTDEEALAERLAQGPIALVCGFDPTADSLHLGH NO.: 61 (aa) pPR-EcRS- LVPLLCLKRFQQAGHKPVALVGGATGLIGDPSFIAAERKLNTEETVQE VI) 8 Sintetasa KIRKQVAPFLDFDCGEWSAIAAl¾ra3WFGNi DmjTFLRDIGKHFSVNQ IN KEAVKQRLNREDQGISFTEFSYNLLQGYSMACTNKQYGWLQIGGSDQWGN ITSGIDLTRRLHQNQVFGLTVPLITKADGTKFGKTEGGAV LDPKKTSPYK FYQFWINTADADVYRFLKFFTFMSIEEINALEEEDKNSGKAPRAQYVLAEQ VTRLVHGEEGLQAAKRITECLFSGSLSALSEADFEQLAQDGVP VEMEKGA DLMQALVDSELQPSRGQARKTIASNAITINGEKQSDPEYFFKEEDRLFGRF TLLRRGKKNYCLICWK SEQ ID Aminoácido I^SSNLIKQLQERGLVAQVTDEEALAERLAQGPIALSCGFDPTADSLHLGH NO.: 62 (aa) pPR-EcRS- LVPLLCLKRFQQAGHKPVALVGGATGLIGDPSFKAAERKLNTEETVQEWVD 9 Sintetasa KIRKQVAPFLDFDCGENSAIAANim) FGN NVLTFLRDIGKHFSVNQMIN J3AVKQRLNREDQGISFTEFSYNLLQGYSFACLNKQYGVVLQIGGSDQ GN ITSGIDLTRRLHQNQVFGLTVPLITKADGTKFGKTEGGAVWLDPKKTSPYK FYQFWINTADADVYRFL FFTFMSIEEINALEEED NSGKAPRAQYVLAEQ VTRLVHGEEGLQAAKRITECLFSGSLSALSEADFEQLAQDGVPMVEMEKGA DLMQALVDSELQPSRGQARKTIASNAITINGEKQSDPEYFFKtítíJJRLFGRF TLLRRGKKNYCLICWK SEQ ID Aminoácido MASSNLIKQLQERGLVAQVTDEEALAERLAQGPIALTCGFDPTADSLHLGH NO.: 63 (aa) pPR-EcRS- LVPLLCLKRFQQAGHKPVALVGGATGLIGDPSFKAAERKLNTEETVQEWVD 10 Sintetasa KIRKQVAPFLDFDCGENSAIAANNYDWFGí^ffinnTFLRDIGKHFSVNQMIN KEAVKQRLNREDQGISFTEFSYNLLQGYTFACTNKQYGWLQIGGSDQWGN ITSGIDLTRRLHQNQVFGLTVPLITKADGTKFGKTEGGAVWLDPKKTSPYK FYQFWINTADADVYRFLKFFTFMSIEEINALEEEDKNSGKAPRAQYVLAEQ VTRLVHGEEGLQAAKRITECLFSGSLSALSEADFEQLAQDGVP VEMEKGA DLMQALVDSELQPSRGQARKTIASNAITINGEKQSDPEYFFKEEDRLFGRF TLLRRGKKNYCLICWK - - SEQ ID Polinucleótído NO.: 64 de ARNl/Tyr AGCTTCCCGATAAGGGAGCAGGCCAGTAAAAAGCATTACCCCGTGGTGGGG TTCCCGAGCGGCCAAAGGGAGCAGACTCTAAATCTGCCGTCATCGACCTCG AAGGTTCGAATCCTTCCCCCACCACCA SEQ ID ARN1/Tyr NO.: 65 AGCUUCCCGAUAAGGGAGCAGGCCAGUAAAAAGCAUUACCCCGUGGÜGGGG UUCCCGAGCGGCCAAAGGGAGCAGACUCUAAAUCÜGCCGUCAUCGACCUCG AAGGUUCGAAUCCUUCCCCCACCACCA SEQ ID 5 ' -ATGAAGTAGCTGTCTTCTATCGAACAAGCATGCG-3 ' NO.: 66 Mutantes ámbar L3TAG SEQ ID Mutantes ámbar 5 ' -CGAACAAGCATGCGATTAGTGCCGACTTAAAAAG-3 ' NO.: 67 I13TAG SEQ ID Mutantes ámbar 5 ' -CGCTACTCTCCCAAATAGAAAAGGTCTCCGCTG-3 ' NO.: 68 T44TAG SEQ ID Mutantes ámbar 5 ' -CTGGAACAGCTATAGCTACTGATTTTTCCTCG-3 ' NO.: 69 F68TAG SEQ ID Mutantes ámbar 5 ' -GCCGTCACAGATTAGTTGGCTTCAGTGGAGACTG-3 ' NO.: 70 R110TAG SEQ ID Mutantes ámbar 5 ' - GATTGGCTTCATAGGAGACTGATATGCTCTAAC - 3 ' NO.: 71 V114TAG SEQ ID Mutantes ámbar 5 ' - GCCTCTATAGTTGAGACAGCATAGAATAATGCG - 3 ' NO.:72 T121TAG SEQ ID Mutantes ámbar 5 ' -GAGACAGCATAGATAGAGTGCGACATCATCATCGG-3 ' NO.: 73 I127TAG SEQ ID Mutantes ámbar 5 ' -GAATAAGTGCGACATAGTCATCGGAAGAGAGTAGTAG-3 ' NO.: 74 S131TAG SEQ ID Mutantes ámbar 5 ' -GGTCAAAGACAGTTGTAGGTATCGATTGACTCGGC-3 ' NO.: 75 T145TAG SEQ ID Sitio Permisivo 5 ' -CGCTACTCTCCCCAAATTTAAAAGGTCTCCGCTG-3 ' NO.: 76 Mutantes T44F SEQ ID Sitio Permisivo 5 ' -CGCTACTCTCCCCAAATATAAAAGGTCTCCGCTG-3 ' NO.: 77 Mutantes T44Y SEQ ID Sitio Permisivo 5 ' -CGCTACTCTCCCCAAATGGAAAAGGTCTCCGCTG-3 ' NO.: 78 Mutantes T44 SEQ ID Sitio Permisivo 5 ' - CGCTACTCTCCCCAAAGATAAAAGGTCTCCGCTG - 3 ' NO.:79 Mutantes T44D SEQ ID Sitio Permisivo 5 ' -CGCTACTCTCCCCAAAAAAAAAAGGTCTCCGCTG-3 ' NO.:80 Mutantes T44K SEQ ID Sitio Permisivo 5 ' -GCCGTCACAGATTTTTTGGCTTCAGTGGAGACTG-3 ' NO.: 81 Mutantes R110F SEQ ID Sitio Permisivo 5 ' -GCCGTCACAGATTATTTGGCTTCAGTGGAGACTG-3 ' NO.: 82 Mutantes R110Y SEQ ID Sitio Permisivo 5 ' -GCCGTCACAGATTGGTTGGCTTCAGTGGAGACTG-3 ' NO.: 83 Mutantes R110W SEQ ID Sitio Permisivo 5 ' -GCCGTCACAGATGATTTGGCTTCAGTGGAGACTG-3 ' NO.: 84 Mutantes R110D . SEQ ID Sitio Permisivo 5 ' -GCCGTCACAGATAAATTGGCTTCAGTGGAGACTG-3 ' - - NO.: 85 Mutantes R110K SEQID Aminoácido MASSNLIKQLQERGLVAQVTDEEALAERLAQGPIALICGFDPTADSLHLGH NO.: 86 (aa) p- LVPLLCL RFQQAGH PVALVGGATGLIGDPSFKAAERKLNTEETVQEWVD acetilPheRS-1 KIRKQVAPFLDFDCGENSAIAAlWiTD FGNM VLTFLRDIGKBFSVWQMIN Sintetasa 3 EAVKQRLNREGQGISFTEFSYNLLQGYGMACANKQYGWLQIGGSDQ GN ITSGIDLTRRLHQNQVFGLTVPLIT ADGT FGKTEGGAV LDP ECTSPYK FYQF INTADADVYRFL FFTFMSIEEINALEEEDKNSGKAPRAQYVLAEQ V RLVHGEEGLQAAKRITECLFSGSLSALSEADFEQIJAQDGVPMVEMEKGA DL QALVDSELQPSRGQARKTIASNAITINGEKQSDPEYFF EEDRLFGRF TLLRRG KNYCLICWK

Claims (1)

  1. REIVINDICACIONES 1. Una composición que comprende una proteína, en donde la proteína comprende al menos un aminoácido no natural y al menos una modificación de post-traducción, en donde la al menos una modificación post-traducción comprende la unión de una molécula que comprende un segundo grupo reactivo mediante una cicloadición [3+2] a el al menos un aminoácido no natural que comprende un primer grupo reactivo. 2. La composición de la reivindicación 1, en donde la molécula es un colorante, un polímero, un derivado de polietilen glicol, un foto reticulador, un compuesto citotóxico, una marca de afinidad, un derivado de biotina, una resina, una segunda proteína o polipéptido, un quelador metálico, un cofactor, un ácido graso, un carbohidrato, o un polinucleótido . 3. La composición de la reivindicación 1, en donde el primer grupo reactivo es un residuo alquinilo o azido y el segundo grupo reactivo es un residuo azido o alquinilo . 4. La composición de la reivindicación 3, en donde el primer grupo reactivo es el residuo alquinilo y el segundo grupo reactivo es el residuo azido. 5. La composición de la reivindicación 4, en donde el aminoácido no natural comprende una p-propargiloxifenilalanina . 6. La composición de la reivindicación 3, en donde el primer grupo reactivo es el residuo azido y el segundo grupo reactivo es el residuo alquinilo. 7. La composición de la reivindicación 6, en donde el aminoácido no natural comprende una p-azido-L-fenilalanina . 8. La composición de la reivindicación 6, en donde la al menos una modificación post-traducción se hace in vivo en una célula eucariótica. 9. Una composición que comprende un aminoácido no natural que tiene la estructura química: 10. La composición de la reivindicación 9, que comprende además un AKNt ortogonal . 11. La composición de la reivindicación 10 , en donde el aminoácido no natural se encuentra enlazado de manera covalente al AR t ortogonal . 12. La composición de la reivindicación 10, en donde el aminoácido no natural se encuentra enlazado de manera covalente al 7AR t ortogonal a través de un enlace amino-acilo . 13. La composición de la reivindicación 10, en donde el aminoácido no natural se encuentra enlazado de manera covalente a un 3 ?? o un 2 'OH de un azúcar de terminal ribosa del ARNt ortogonal . 1 . Una proteína que comprende el aminoácido no natural de la reivindicación 9. 15. Una célula que comprende el aminoácido no natural de la reivindicación 9. 16. Una composición que comprende un colorante azido que tiene la estructura: 4 17. Una composición que comprende un colorante azido que tiene la estructura: 18. Una proteina que comprende el colorante azido de la reivindicación 16 o la reivindicación 17. 19. La proteína de la reivindicación 18 que comprende además al menos un aminoácido no natural, en donde el colorante azido se encuentra unido al aminoácido no natural a través de una cicloadición [3+2] . 20. La proteína de la reivindicación 19 en donde el aminoácido no natural comprende un aminoácido alquinilo. 21. Una composición que comprende un alquinil polietilen glicol que tiene la estructura: en donde n es un entero entre 100 y 2,000. 22. La composición de la reivindicación 21, en donde el alquinil polietilen glicol tiene un peso molecular de aproximadamente 5,000 hasta aproximadamente 100,000 Da. 23. Una proteína que comprende el alquinil polietilen glicol de la reivindicación 21. 24. La proteína de la reivindicación 23 que comprende además al menos un aminoácido no natural, en donde el alquinil polietilen glicol se encuentra unido al aminoácido no natural a través de una cicloadición [3+2] . 25. La proteína de la reivindicación 24 en donde el aminoácido no natural comprende un aminoácido azido . 26. Un método para sintetizar un compuesto p-( ropargiloxi) fenilalanina, comprendiendo el método: suspender una N-ter-butoxicarbonil-tirosina y K2CO3 en DMF anhidro; agregar bromuro de propargilo a la mezcla de reacción de (a) y alquilatar el grupo hidroxilo y carboxilo, dando como resultado un compuesto intermediario protegido que tiene la estructura: mezclar el compuesto intermediario protegido con HCl anhidro en MeOH y desproteger el residuo amina, con lo cual se sintetiza el compuesto p- (propargiloxi) -fenilalanin . 27. El método de la reivindicación 26, que comprende además : disolver el HCl p- (propargiloxi) -fenilalanina en NaOH acuoso y MeOH y agitar a temperatura ambiente; ajustar el pH a un pH 7; y, precipitar el compuesto p- (propargiloxi) fenilalanina. 28. Un método para sintetizar un colorante azido, comprendiendo el método: proporcionar un compuesto colorante que comprende un residuo sulfonil haluro; calentar el compuesto colorante a temperatura ambiente en presencia de 3-azidopropilamina y trietilamina; y acoplar un residuo amina de la 3-azidopropilamina en la posición haluro del compuesto colorante, con lo cual se sintetiza el colorante azido. 29. El método de la reivindicación 28, en donde el compuesto colorante comprende dansil cloruro, y en donde el colorante azido comprende la composición de la reivindicación 16. 30. El método de la reivindicación 28, que comprende además : purificar el colorante azido de la mezcla de reacción. 31. Un método para sintetizar un colorante azido, comprendiendo el método : proporcionar un compuesto colorante que contiene amina; combinar el compuesto colorante que contiene amina con una carbodiimida y ácido 4- (3-azidopropilcarbamoil) -butírico en un solvente adecuado, y acoplar un grupo carbonilo del ácido al residuo amina del compuesto colorante, con lo cual se sintetiza el colorante azido. 32. El método de la reivindicación 31, en donde la carbodiimina comprende hidrocloruro de l-etil-3-(3-dimetilaminopropil) carbodiimida (EDCI) . 33. El método de la reivindicación 31, en donde el colorante que contiene amina comprende fluoresceinamina, y el solvente adecuado comprende piridina . 34. El método de la reivindicación 31, en donde el colorante que contiene amina comprende fluoresceinamina y el colorante azido comprende la composición de la reivindicación 17. 35. El método de la reivindicación 31, que comprende además : precipitar el colorante azido; lavar el precipitado con HCl; disolver el precipitado lavado en EtOAc; y precipitar el colorante azido en hexanos . 36. Un método para sintetizar un propargil amida polietilen glicol, comprendiendo el método: hacer reaccionar propargilamina con polietilen glicol (PEG) -éster de hidroxisuccinimida en un solvente orgánico a temperatura ambiente, dando como resultado el propargil amida polietilen glicol de la reivindicación 21. 37. El método de la reivindicación 36, en donde el solvente orgánico comprende CH2C12. 38. El método de la reivindicación 36, que comprende además : precipitar el propargilamida polietilen glicol utilizando etil acetato. 39. El método de la reivindicación 38, que comprende además recristalizar el propargilamida polietilen glicol en metanol; y secar el producto bajo un vacío. 40. Una célula eucariótica que comprende una aminoacil-AR t sintetasa ortogonal (O-RS) , en donde la O-RS preferentemente aminoacila un ARNt ortogonal (0-AR t) con al menos un aminoácido no natural en la célula eucariótica, en donde : (a) la O-RS o una porción de la misma se codifica por una secuencia de polinucleótidos como se expone en cualquiera de SEQ ID NO: 20-25, una secuencia de polinucleótidos complementaria de las mismas o una variante conservadora de las mismas; (b) la O-RS comprende una secuencia de aminoácidos como se expone en cualquiera de las SEQ ID NO: 48-63 o una variante conservadora de las mismas; (c) la O-RS comprende una secuencia de aminoácidos que es al menos 90% idéntica a la de una tirosil aminoacil-ARNt sintetasa (TyrRS) de origen natural y comprende dos o más aminoácidos seleccionados de los grupos que consisten de: glicina, serina, o alanina, en una posición correspondiente a Tyr37 de una TyrRS de E. coli; aspartato en una posición correspondiente a Asnl26 de una TyrRS de E. coli; asparagina, en una posición correspondiente a Aspl82 de una TyrRS de E. coli; alanina, o valina en una posición correspondiente a Phel83 de una TyrRS de E. coli; y metionina, valina, cistelna, o treonina en una posición correspondiente a Leul86 de una TyrRS de E. coli; o (d) la O-RS aminoacila el O-AR t con el al menos un aminoácido no natural al menos 50% tan eficientemente como lo hace una O-RS que tiene una secuencia de aminoácidos como se expone en la SEQ ID NO: 45. 41. La célula de la reivindicación 40, que comprende además un ARNt ortogonal (O-ARNt) , en donde el O-ARNt reconoce un codón selector y preferentemente se aminoacila con el al menos un aminoácido no natural por la O-RS, en donde el O-ARNt se produce en una célula mediante el procesamiento celular de un ácido nucleico correspondiente a la SEQ ID NO: 65, y la O-RS comprende una secuencia de polipéptidos seleccionada del grupo que consiste de las SEQ ID NO: 48-63 y una variación conservadora de las mismas. 42. Un polipéptido seleccionado del grupo que consiste de: (a) un polipéptido que comprende una secuencia de aminoácidos como se muestra en cualquiera de las SEQ ID NO: 48-63; (b) un polipéptido que comprende una secuencia de aminoácidos codificada por una secuencia de polinucleótidos como se muestra en cualquiera de las SEQ ID NO: 20-35; (c) un polipéptido que es específicamente inmunorreactivo con un anticuerpo específico para un polipéptido de (a) o (b) ; (d) un polipéptido que comprende una secuencia de aminoácidos que es al menos 90% idéntica a la de una tirosil aminoacil-ARNt sintetasa de origen natural (TyrRS) y comprende dos o más aminoácidos seleccionados del grupo que consiste de: glicina, serina, o alanina, en una posición correspondiente a Tyr37 de una TyrRS de E. coli; aspartato en una posición correspondiente a Asnl26 de una TyrRS de E. coli; asparagina, en una posición correspondiente a Aspl82 de una TyrRS de E. coli; alanina, o valina en una posición correspondiente a Phel83 de una TyrRS de E. coli; y metionina, valina, cisteína, o treonina en una posición correspondiente a Leul86 de una TyrRS de E. coli; (e) un polipéptido que comprende al menos 20 aminoácidos contiguos de las SEQ ID NO: 36-48 o 86, y dos o más sustituciones de aminoácido seleccionadas del grupo que consiste de: glicina, serina, o alanina, en una posición correspondiente a Tyr37 de una TyrRS de E. coli; aspartato en una posición correspondiente a Asnl26 de una TyrRS de E. coli; asparagina, en una posición correspondiente a Aspl82 de una TyrRS de E. coli; alanina, o valina en una posición correspondiente a Phel83 de una TyrRS de E. coli; y metionina, valina, cisteina, o treonina en una posición correspondiente a Leul86 de una TyrRS de E. coli; y (f) una secuencia de aminoácidos que comprende una variación conservadora de (a) , (b) , (c) , (d) , o (e) . 43. Una composición que comprende el polipéptido de la reivindicación 42 y un excipiente. 44. Un anticuerpo o antisuero específicamente inmunorreactivo con el polipéptido de la reivindicación 42. 45. Una composición que comprende el polipéptido de la reivindicación 42 y un excipiente. 46. Un anticuerpo o antisuero específicamente inmunorreactivo con el polipéptido de la reivindicación 42. 47. Un polinucleótido seleccionado del grupo que consiste de: (a) un polinucleótido que comprende una secuencia de nucleótidos como se expone en cualquiera de las SEQ ID NO: 20-35; (b) un polinucleótido que es complementario o que codifica para una secuencia de polinucleotidos de (a) ; (c) un polinucleótido que codifica para un polipéptido que comprende una secuencia de aminoácidos como se expone en cualquiera de las SEQ ID NO: 48-63, o una variación conservadora de las mismas; (d) un polinucleótido que codifica para un polipéptido de la reivindicación 42; (e) un ácido nucleico que se híbrida a un polinucleótido de (a) , (b) , (c) o (d) bajo condiciones altamente rigurosas sobre sustancialmente la longitud total del ácido nucleico; (f) un polinucleótido que codifica para un polipéptido que comprende una secuencia de aminoácidos que es al menos 90% idéntica a la de una tirosil aminoacil-ARNt sintetasa de origen natural (TyrRS) y comprende dos o más mutaciones seleccionadas del grupo que consiste de: glicina, serina, o alanina, en una posición correspondiente a Tyr37 de una TyrRS de E. coli; aspartato en una posición correspondiente a Asnl26 de una TyrRS de E. coli; asparagina, en una posición correspondiente a Aspl82 de una TyrRS de E. coli; alanina, o valina en una posición correspondiente a Phel83 de una TyrRS de E. coli; y metionina, valina, cisteína, o treonina en una posición correspondiente a Leul86 de una TyrRS de E. coli; (g) un polinucleótido que es al menos 98% idéntico a un polinucleótido de (a) , (b) , (c) , (d) , (e) , o (f) ; y (h) un polinucleótido que comprende una variación conservadora de (a) , (b) , (c) , (d) , (e) , (f) o (g) . 48. Un vector que comprende un polinucleótido de la reivindicación 47. 49. El vector de la reivindicación 48, en donde el vector comprende un plásmido, un cósmido, un fago o un virus. 50. El vector de la reivindicación 48, en donde el vector es un vector de expresión. 51. Una célula que comprende el vector de la reivindicación 48. 52. Un método para producir en una célula eucariótica al menos una proteína que comprende al menos un aminoácido no natural, comprendiendo el método: desarrollar en un medio apropiado, una célula eucariótica que comprende un ácido nucleico que comprende al menos un codón selector y codifica para la proteina; en donde el medio comprende un aminoácido no natural y la célula eucariótica comprende: un ARNt ortogonal (O-ARNt) que funciona en la célula y reconoce el codón selector; y una aminoacil-ANt sintetasa ortogonal (0-RS) que preferentemente aminoacila el O-ARNt con el aminoácido no natural, en donde la 0-RS comprende una secuencia de aminoácidos que corresponde a las SEQ ID NO: 48-53. 53. Un método para producir en una célula eucariótica al menos una proteína que comprende al menos un aminoácido no natural, comprendiendo el método: desarrollar en un medio apropiado, una célula eucariótica que comprende un ácido nucleico que comprende al menos un codón selector y codifica para la proteína; en donde el medio comprende un aminoácido no natural y la célula eucariótica comprende un ARNt ortogonal (O-ARNt) que funciona en la célula y reconoce el codón selector y una aminoacil-AR t sintetasa ortogonal (O-RS) que preferentemente aminoacila el O-ARNt con el aminoácido no natural; incorporar en la proteína el aminoácido no natural en la célula eucariótica, en donde el aminoácido no natural comprende un primer grupo reactivo; y poner en contacto la proteína con una molécula que comprende un segundo grupo reactivo; en donde el primer grupo reactivo reacciona con el segundo grupo reactivo para unir la molécula al aminoácido no natural a través de una cicloadición [3+2] . 54. El método de la reivindicación 53, en donde la molécula es un colorante, un polímero, un derivado de polietilen glicol, un foto reticulador, un compuesto citotóxico, una marca de afinidad, un derivado de biotina, una resina, una segunda proteína o polipéptido, un quelador metálico, un cofactor, un ácido graso, un carbohidrato, o un polinucleótido . 55. El método de la reivindicación 53, en donde el primer grupo reactivo es un residuo alguinilo o azido y el segundo grupo reactivo es un residuo azido o alquinilo. 56. El método de la reivindicación 55, en donde el primer grupo reactivo es el residuo alquinilo y el segundo grupo reactivo es el residuo azido. 57. El método de la reivindicación 56, en donde el aminoácido no natural comprende una p-propargiloxifenilalanina. 58. El método de la reivindicación 55, en donde el primer grupo reactivo es el residuo azido y el segundo grupo reactivo es el residuo alquinilo. 59. El método de la reivindicación 58, en donde el aminoácido no natural comprende una p-azido-L-fenilalanin . 60. Una proteína producida mediante el método de la reivindicación 53. 61. La proteína de la reivindicación 60, en donde la proteína se modifica por al menos una modificación posttraducción in vivo y en donde la modificación post-traducción se selecciona del grupo que consiste de: N-glicosilación, O-glicosilación, acetilación, acilación, modificación de lípidos, palmitoilación, adición de palmitato, fosforilación, y modificación de enlace de glicolípidos .
MXPA05013833A 2003-06-18 2004-04-16 Adiciones al codigo genetico de aminoacidos reactivos no naturales. MXPA05013833A (es)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US47993103P 2003-06-18 2003-06-18
US49301403P 2003-08-05 2003-08-05
US49654803P 2003-08-19 2003-08-19
PCT/US2004/011833 WO2005003294A2 (en) 2003-06-18 2004-04-16 Unnatural reactive amino acid genetic code additions

Publications (1)

Publication Number Publication Date
MXPA05013833A true MXPA05013833A (es) 2006-05-17

Family

ID=33568596

Family Applications (1)

Application Number Title Priority Date Filing Date
MXPA05013833A MXPA05013833A (es) 2003-06-18 2004-04-16 Adiciones al codigo genetico de aminoacidos reactivos no naturales.

Country Status (10)

Country Link
US (5) US7993872B2 (es)
EP (5) EP1636340A4 (es)
JP (4) JP5275566B2 (es)
CN (1) CN102618605B (es)
BR (1) BRPI0411475A (es)
CA (1) CA2527877A1 (es)
ES (1) ES2773664T3 (es)
HK (1) HK1197602A1 (es)
MX (1) MXPA05013833A (es)
WO (1) WO2005003294A2 (es)

Families Citing this family (88)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070166741A1 (en) 1998-12-14 2007-07-19 Somalogic, Incorporated Multiplexed analyses of test samples
JP2005502322A (ja) * 2001-04-19 2005-01-27 ザ スクリップス リサーチ インスティテュート 非天然アミノ酸のインビボ組込み
KR20050073559A (ko) 2002-10-16 2005-07-14 더 스크립스 리서치 인스티튜트 당단백질 합성
US7618775B2 (en) * 2003-04-17 2009-11-17 The Scripps Research Institute Expanding the eukaryotic genetic code
EP1636340A4 (en) 2003-06-18 2009-02-11 Scripps Research Inst COMPLEMENTS TO THE GENETIC CODE OF UNNATURATIVE REACTIVE AMINO ACIDS
EP1658366A4 (en) 2003-07-07 2006-08-09 Scripps Research Inst COMPOSITIONS OF ORTHOGONAL GLUTAMYL-TRNA AND AMINOACYL-TRNA-SYNTHETASEPAARES AND THEIR USES
PT1914314E (pt) 2003-07-07 2010-09-08 Scripps Research Inst Composições de pares ortogonais de lisil-arnt e aminoacil-arnt-sintetase e suas utilizações
JP5657850B2 (ja) 2003-10-14 2015-01-21 ザ スクリプス リサーチ インスティテュート 酸化還元機能性アミノ酸のタンパク質への部位特異的組み入れ
MXPA06008496A (es) 2004-02-02 2007-01-30 Ambrx Inc Polipeptidos de interferon humano modificados y sus usos.
BRPI0511482A (pt) * 2004-05-25 2007-12-26 Scripps Research Inst incorporação sìtio-especìfica de aminoácidos artificiais contendo átomos pesados em proteìnas para determinação de estrutura cristalina
MXPA06014684A (es) * 2004-06-18 2007-02-12 Ambrx Inc Novedosos polipeptidos de enlace antigeno y sus usos.
US7718410B2 (en) * 2004-09-21 2010-05-18 The Scripps Research Institute In vivo incorporation of alkynyl amino acids into proteins in eubacteria
WO2006036779A2 (en) * 2004-09-22 2006-04-06 The Scripps Research Institute Site-specific labeling of proteins for nmr studies
BRPI0517381A (pt) 2004-10-27 2008-10-07 Scripps Research Inst componentes ortogonais de tradução para a incorporação in vivo de aminoácidos não naturais
BRPI0518661A2 (pt) * 2004-12-22 2008-12-02 Ambrx Inc mÉtodos para expressço e purificaÇço do hormânio do crescimento humano recombinante
GB0428012D0 (en) * 2004-12-22 2005-01-26 Hammersmith Imanet Ltd Radiolabelling methods
KR101224781B1 (ko) 2004-12-22 2013-01-21 암브룩스, 인코포레이티드 비천연적으로 코딩된 아미노산을 포함하는 인간 성장호르몬의 조제물
MX2007007580A (es) * 2004-12-22 2007-12-11 Ambrx Inc Hormona del crecimiento humana modificada.
GB0507123D0 (en) * 2005-04-08 2005-05-11 Isis Innovation Method
KR20080069993A (ko) * 2005-10-12 2008-07-29 더 스크립스 리서치 인스티튜트 파지-디스플레이된 폴리펩티드의 선별적인 번역후 변형
US20100247433A1 (en) * 2005-10-14 2010-09-30 California Institute Of Technology Use of non-canonical amino acids as metabolic markers for rapidly-dividing cells
HUE025489T2 (en) * 2006-01-17 2016-04-28 Somalogic Inc Multiplexed analysis of test samples
KR20080108416A (ko) * 2006-01-19 2008-12-15 암브룩스, 인코포레이티드 조절된 면역원성을 갖는 비천연 아미노산 폴리펩티드
US7776535B2 (en) * 2006-02-06 2010-08-17 Franklin And Marshall College Site-specific incorporation of fluorinated amino acids into proteins
JP5589186B2 (ja) * 2006-03-09 2014-09-17 ザ スクリプス リサーチ インスティテュート 真正細菌宿主細胞における直交翻訳成分の発現システム
US8217145B2 (en) 2006-03-16 2012-07-10 The Scrips Research Institute Genetically programmed expression of proteins containing the unnatural amino acid phenylselenocysteine
US7632492B2 (en) * 2006-05-02 2009-12-15 Allozyne, Inc. Modified human interferon-β polypeptides
US20080096819A1 (en) * 2006-05-02 2008-04-24 Allozyne, Inc. Amino acid substituted molecules
WO2007139870A1 (en) * 2006-05-23 2007-12-06 The Scripps Research Institute Genetically encoded fluorescent coumarin amino acids
JP2009541286A (ja) * 2006-06-21 2009-11-26 ハマースミス・イメイネット・リミテッド 化学的方法及び装置
US8420792B2 (en) * 2006-09-08 2013-04-16 Ambrx, Inc. Suppressor tRNA transcription in vertebrate cells
AU2012203737B2 (en) * 2006-09-08 2014-06-19 Ambrx, Inc. Modified human plasma polypeptide or Fc scaffolds and their uses
CN101511866A (zh) * 2006-09-08 2009-08-19 Ambrx公司 经修饰的人类血浆多肽或Fc骨架和其用途
AU2013202770B2 (en) * 2006-09-08 2015-08-20 Ambrx, Inc. Modified human plasma polypeptide or Fc scaffolds and their uses
CN106008699A (zh) * 2006-09-08 2016-10-12 Ambrx公司 经修饰的人类血浆多肽或Fc骨架和其用途
KR20090057072A (ko) * 2006-09-08 2009-06-03 암브룩스, 인코포레이티드 척추동물 세포에 의한 비천연 아미노산의 부위 특이적 도입
CA2662753C (en) * 2006-09-08 2016-02-23 Ambrx, Inc. Hybrid suppressor trna for vertebrate cells
MX2009002987A (es) * 2006-09-21 2009-04-28 Scripps Research Inst Expresion geneticamente programada de proteinas selectivamente sulfatadas en eubacterias.
JP2010506591A (ja) * 2006-10-18 2010-03-04 ザ スクリップス リサーチ インスティテュート 哺乳動物細胞中の蛋白質への非天然アミノ酸の遺伝的組込み
CA2683960A1 (en) * 2007-04-13 2008-10-23 The Salk Institute For Biological Studies Methods of genetically encoding unnatural amino acids in eukaryotic cells using orthogonal trna/synthetase pairs
CA2707840A1 (en) * 2007-08-20 2009-02-26 Allozyne, Inc. Amino acid substituted molecules
AU2008316796A1 (en) 2007-10-25 2009-04-30 Massachusetts Institute Of Technology Genetic incorporation of 3-aminotyrosine into reductases
US20090148887A1 (en) * 2007-11-02 2009-06-11 The Scripps Research Institute Genetically encoded boronate amino acid
AU2008325239A1 (en) 2007-11-02 2009-05-14 The Scripps Research Institute Directed evolution using proteins comprising unnatural amino acids
WO2009075788A1 (en) * 2007-12-05 2009-06-18 Semprus Biociences Corporation Synthetic non-fouling amino acids
AU2008335778B2 (en) * 2007-12-11 2014-04-10 The Scripps Research Institute In vivo unnatural amino acid expression in the methylotrophic yeast Pichia pastoris
CA2712080A1 (en) * 2008-02-08 2009-08-13 The Scripps Research Institute Breaking immunological tolerance with a genetically encoded unnatural amino acid
US20090286968A1 (en) 2008-04-25 2009-11-19 Auburn University 2-Quinoxalinol Salen Compounds and Uses Thereof
ES2477543T3 (es) * 2008-10-24 2014-07-17 Irm Llc Pirrolina-carboxi-lisina generada biosintéticamente y modificaciones de proteínas específicas de sitio mediante derivatización química de restos de pirrolina-carboxi-lisina y pirrolisina
US20090197339A1 (en) * 2008-12-10 2009-08-06 The Scripps Research Institute In vivo unnatural amino acid expression in the methylotrophic yeast pichia pastoris
CN102307905B (zh) * 2008-12-10 2015-11-25 斯克利普斯研究院 利用化学反应性非天然氨基酸产生载体-肽偶联物
WO2010096394A2 (en) 2009-02-17 2010-08-26 Redwood Biosciences, Inc. Aldehyde-tagged protein-based drug carriers and methods of use
US20120077224A1 (en) * 2009-06-05 2012-03-29 The Salk Institute For Biological Studies unnatural amino acid incorporation in eukaryotic cells
CN103108650A (zh) 2010-08-25 2013-05-15 Atyr医药公司 与酪氨酰-tRNA合成酶的蛋白片段相关的治疗、诊断和抗体组合物的创新发现
JP6162606B2 (ja) 2011-01-14 2017-07-12 レッドウッド バイオサイエンス, インコーポレイテッド アルデヒド−タグ付き免疫グロブリンポリペプチド及びその使用方法
US9714419B2 (en) 2011-08-09 2017-07-25 Atyr Pharma, Inc. PEGylated tyrosyl-tRNA synthetase polypeptides
GB201201100D0 (en) * 2012-01-20 2012-03-07 Medical Res Council Polypeptides and methods
CN103379163B (zh) * 2012-04-25 2016-04-06 阿里巴巴集团控股有限公司 一种业务对象的确定方法以及确定装置
IN2014DN09922A (es) 2012-05-18 2015-08-14 Medical Res Council
MX2014015205A (es) * 2012-06-14 2015-08-14 Ambrx Inc Anticuerpos anti-psma conjugados a polipeptidos de ligando de receptor nuclear.
SI3584255T1 (sl) 2012-08-31 2022-05-31 Sutro Biopharma, Inc Modificirane aminokisline, ki vsebujejo azido skupino
CA2936092A1 (en) 2013-01-23 2014-07-31 The Board Of Trustees Of The Leland Stanford Junior University Stabilized hepatitis b core polypeptide
EA201591465A1 (ru) 2013-02-08 2015-12-30 АйАрЭм ЭлЭлСи Специфичные участки для модификации антител для получения иммуноконъюгатов
WO2014146575A1 (en) 2013-03-19 2014-09-25 Beijing Shenogen Pharma Group Ltd. Antibodies and methods for treating estrogen receptor-associated diseases
CN110559435B (zh) 2013-09-11 2023-10-20 伊戈尔生物药品股份有限公司 包含离子性液体的液体蛋白质制剂
US9834775B2 (en) 2013-09-27 2017-12-05 President And Fellows Of Harvard College Recombinant cells and organisms having persistent nonstandard amino acid dependence and methods of making them
CN104592364B (zh) * 2013-10-30 2018-05-01 北京大学 定点突变和定点修饰的腺相关病毒、其制备方法及应用
GB2528227A (en) 2014-03-14 2016-01-20 Medical Res Council Cyclopropene amino acids and methods
US20150297680A1 (en) * 2014-04-02 2015-10-22 University Of Virginia Patent Foundation Compositions and methods for increasing protein half-life
AU2016349786B2 (en) * 2015-11-03 2023-11-16 Ambrx, Inc. Anti-CD3-folate conjugates and their uses
WO2017189432A1 (en) 2016-04-26 2017-11-02 R.P. Scherer Technologies, Llc Antibody conjugates and methods of making and using the same
CN107179305A (zh) * 2017-05-22 2017-09-19 合肥师范学院 基于内嵌染料和dna相互作用的石房蛤毒素的检测方法
EP3630977B1 (en) 2017-06-02 2024-02-21 Ambrx, Inc. Methods and compositions for promoting non-natural amino acid-containing protein production
EP4069842A1 (en) 2019-12-02 2022-10-12 Shape Therapeutics Inc. Therapeutic editing
CN116925237A (zh) 2019-12-31 2023-10-24 北京质肽生物医药科技有限公司 Glp-1和gdf15的融合蛋白以及其缀合物
WO2021139744A1 (en) 2020-01-11 2021-07-15 Beijing Ql Biopharmaceutical Co., Ltd. Conjugates of fusion proteins of glp-1 and fgf21
WO2021216478A1 (en) 2020-04-22 2021-10-28 Merck Sharp & Dohme Corp. HUMAN INTERLEUKIN-2 CONJUGATES BIASED FOR THE INTERLEUKIN-2 RECEPTOR BETA GAMMAc DIMER AND CONJUGATED TO A NONPEPTIDIC, WATER-SOLUBLE POLYMER
CA3193453A1 (en) 2020-09-30 2022-04-07 Beijing Ql Biopharmaceutical Co., Ltd. Polypeptide conjugates and methods of uses
CN113388654A (zh) * 2021-06-04 2021-09-14 清华大学 一种基于线形模板无细胞体系非天然氨基酸嵌入方法
KR102655597B1 (ko) * 2021-06-14 2024-04-08 전남대학교 산학협력단 티로실-tRNA 합성효소 돌연변이체 및 이를 이용한 4-아지도-L-페닐알라닌의 결합능이 향상된 단백질 생산방법
US20230201365A1 (en) 2021-07-09 2023-06-29 Bright Peak Therapeutics Ag Modified cd20 antibodies and uses thereof
EP4366778A1 (en) 2021-07-09 2024-05-15 Bright Peak Therapeutics AG Antibody conjugates and manufacture thereof
US20230250181A1 (en) 2021-07-09 2023-08-10 Bright Peak Therapeutics Ag Modified checkpoint inhibitors and uses thereof
US20230183331A1 (en) 2021-07-09 2023-06-15 Bright Peak Therapeutics Ag Modified tnf-alpha antibodies and uses thereof
CA3222359A1 (en) 2021-07-09 2023-01-12 Bright Peak Therapeutics Ag Conjugates of checkpoint inhibitors with il-2, and uses thereof
EP4370680A2 (en) 2021-07-16 2024-05-22 Aptah Bio, Inc. Polynucleotide compositions and methods for gene expression regulation
WO2023161854A1 (en) 2022-02-23 2023-08-31 Bright Peak Therapeutics Ag Immune antigen specific il-18 immunocytokines and uses thereof
US20240132563A1 (en) 2022-02-23 2024-04-25 Bright Peak Therapeutics Ag Bifunctional cytokine compositions

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CH652145A5 (de) 1982-01-22 1985-10-31 Sandoz Ag Verfahren zur in vitro-herstellung von hybridomen welche humane monoklonale antikoerper erzeugen.
US4634666A (en) 1984-01-06 1987-01-06 The Board Of Trustees Of The Leland Stanford Junior University Human-murine hybridoma fusion partner
US5001065A (en) 1987-05-27 1991-03-19 Cetus Corporation Human cell line and triomas, antibodies, and transformants derived therefrom
GB9608001D0 (en) * 1996-04-18 1996-06-19 Smithkline Beecham Plc Novel compounds
WO1999061654A1 (en) 1998-05-27 1999-12-02 The Scripps Research Institute Methods and systems for predicting protein function
JP2005502322A (ja) 2001-04-19 2005-01-27 ザ スクリップス リサーチ インスティテュート 非天然アミノ酸のインビボ組込み
US7074201B2 (en) 2001-06-18 2006-07-11 Amei Technologies, Inc. Measurement device for fitting a bracing device
WO2003014354A1 (en) 2001-08-01 2003-02-20 Japan Science And Technology Agency Tyrosyl-trna synthase variants
CN1379094A (zh) 2002-02-01 2002-11-13 杭州华大基因研发中心 耐高温酪氨酰tRNA合成酶基因及其编码的多肽和制备方法
KR20050073559A (ko) 2002-10-16 2005-07-14 더 스크립스 리서치 인스티튜트 당단백질 합성
DE60327369D1 (de) * 2002-10-16 2009-06-04 Scripps Research Inst Stellenspezifischer einbau von ketoaminosäuren in proteine
WO2004058946A2 (en) 2002-12-22 2004-07-15 The Scripps Research Institute Protein arrays
US7618775B2 (en) * 2003-04-17 2009-11-17 The Scripps Research Institute Expanding the eukaryotic genetic code
EP1636340A4 (en) * 2003-06-18 2009-02-11 Scripps Research Inst COMPLEMENTS TO THE GENETIC CODE OF UNNATURATIVE REACTIVE AMINO ACIDS
WO2005000829A1 (ja) * 2003-06-26 2005-01-06 Takeda Pharmaceutical Company Limited カンナビノイド受容体調節剤
EP1704242A4 (en) * 2003-07-07 2008-06-18 Scripps Research Inst COMPOSITIONS WITH PAIRS OF ORTHOGONAL LEUCYL-TRNA AND AMINOACYL-TRNA-SYNTHETASE AND USES THEREOF
PT1914314E (pt) 2003-07-07 2010-09-08 Scripps Research Inst Composições de pares ortogonais de lisil-arnt e aminoacil-arnt-sintetase e suas utilizações
EP1658366A4 (en) * 2003-07-07 2006-08-09 Scripps Research Inst COMPOSITIONS OF ORTHOGONAL GLUTAMYL-TRNA AND AMINOACYL-TRNA-SYNTHETASEPAARES AND THEIR USES
JP5657850B2 (ja) 2003-10-14 2015-01-21 ザ スクリプス リサーチ インスティテュート 酸化還元機能性アミノ酸のタンパク質への部位特異的組み入れ
AU2004321117B2 (en) * 2003-12-18 2010-09-02 The Scripps Research Institute Selective incorporation of 5-hydroxytryptophan into proteins in mammalian cells

Also Published As

Publication number Publication date
EP2378288A1 (en) 2011-10-19
EP1636340A4 (en) 2009-02-11
JP2007536899A (ja) 2007-12-20
JP5837526B2 (ja) 2015-12-24
CN102618605A (zh) 2012-08-01
EP2793027B1 (en) 2019-11-13
CA2527877A1 (en) 2005-01-13
US8815542B2 (en) 2014-08-26
BRPI0411475A (pt) 2006-07-25
WO2005003294A2 (en) 2005-01-13
US20150018523A1 (en) 2015-01-15
CN102618605B (zh) 2015-09-02
EP2392923B1 (en) 2014-05-21
HK1197602A1 (en) 2015-03-13
EP2392923A1 (en) 2011-12-07
US20120004183A1 (en) 2012-01-05
JP2018048203A (ja) 2018-03-29
JP2015232018A (ja) 2015-12-24
AU2004253857A1 (en) 2005-01-13
EP2793027A1 (en) 2014-10-22
US20060246509A1 (en) 2006-11-02
US7888063B2 (en) 2011-02-15
EP1636340A2 (en) 2006-03-22
US7993872B2 (en) 2011-08-09
US20040265952A1 (en) 2004-12-30
EP2410331B1 (en) 2015-09-23
ES2773664T3 (es) 2020-07-14
JP5275566B2 (ja) 2013-08-28
WO2005003294A3 (en) 2007-11-29
US8445446B2 (en) 2013-05-21
JP2013129666A (ja) 2013-07-04
JP6306545B2 (ja) 2018-04-04
EP2378288B1 (en) 2015-09-09
US20130245230A1 (en) 2013-09-19
US9797908B2 (en) 2017-10-24
EP2410331A1 (en) 2012-01-25

Similar Documents

Publication Publication Date Title
US9580721B2 (en) Expanding the eukaryotic genetic code
US9797908B2 (en) Unnatural reactive amino acid genetic code additions
AU2004253857B2 (en) Unnatural reactive amino acid genetic code additions
AU2013201487A1 (en) Expanding the eukaryotic genetic code

Legal Events

Date Code Title Description
FG Grant or registration