MXPA05011127A - Expansion del codigo genetico eucariontico. - Google Patents

Expansion del codigo genetico eucariontico.

Info

Publication number
MXPA05011127A
MXPA05011127A MXPA05011127A MXPA05011127A MXPA05011127A MX PA05011127 A MXPA05011127 A MX PA05011127A MX PA05011127 A MXPA05011127 A MX PA05011127A MX PA05011127 A MXPA05011127 A MX PA05011127A MX PA05011127 A MXPA05011127 A MX PA05011127A
Authority
MX
Mexico
Prior art keywords
amino acid
trna
protein
cell
polypeptide
Prior art date
Application number
MXPA05011127A
Other languages
English (en)
Inventor
Christopher J Anderson
Original Assignee
Scripps Research Inst
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Scripps Research Inst filed Critical Scripps Research Inst
Publication of MXPA05011127A publication Critical patent/MXPA05011127A/es

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • A61K38/16Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • A61K38/17Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • A61K38/1703Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • A61K38/1709Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P43/00Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/67General methods for enhancing the expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/93Ligases (6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y601/00Ligases forming carbon-oxygen bonds (6.1)
    • C12Y601/01Ligases forming aminoacyl-tRNA and related compounds (6.1.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y601/00Ligases forming carbon-oxygen bonds (6.1)
    • C12Y601/01Ligases forming aminoacyl-tRNA and related compounds (6.1.1)
    • C12Y601/01001Tyrosine-tRNA ligase (6.1.1.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y601/00Ligases forming carbon-oxygen bonds (6.1)
    • C12Y601/01Ligases forming aminoacyl-tRNA and related compounds (6.1.1)
    • C12Y601/0102Phenylalanine-tRNA ligase (6.1.1.20)
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S435/00Chemistry: molecular biology and microbiology
    • Y10S435/81Packaged device or kit
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S435/00Chemistry: molecular biology and microbiology
    • Y10S435/975Kit

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Veterinary Medicine (AREA)
  • Public Health (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Mycology (AREA)
  • Immunology (AREA)
  • Epidemiology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Marine Sciences & Fisheries (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Saccharide Compounds (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Abstract

Esta invencion proporciona composiciones y metodos para producir componentes de traduccion que expanden el numero de aminoacidos codificados geneticamente en celulas eucarionticas. Los componentes incluyen tARN ortogonales, aminoacil-tARN ortogonales, pares ortogonales de tARN/sintetasas y aminoacidos no naturales. Tambien se proporcionan proteinas y metodos para producir proteinas con aminoacidos no naturales en celulas aucarionticas.

Description

EXPANSIÓN DEL CÓDIGO GENÉTICO EUCARIÓNTICO CAMPO DE LA INVENCIÓN La invención es concerniente con el campo de bioquímica de traducción en células eucariónticas. La invención es concerniente con métodos para producir y composiciones de tARN sintetasas ortogonales y pares de los mismos en células eucariónticas. La invención también es concerniente con composiciones de aminoácidos no naturales, proteínas y métodos para producir proteínas en células eucariónticas que incluyen aminoácidos no naturales.
ANTECEDENTES DE LA INVENCIÓN El código genético de cada organismo conocido, desde bacterias, a humanos, codifica los mismos 20 aminoácidos comunes. Diferentes combinaciones de los mismos 20 aminoácidos naturales forman proteínas que llevan a cabo virtualmente todos los procesos complejos de la vida, desde fotosíntesis a transducción de señales y la respuesta inmune. Con el fin de estudiar y modificar la estructura y función de la proteína, los científicos han intentado manipular tanto el código genético como la secuencia de aminoácidos de las proteínas. Sin embargo, ha sido difícil eliminar las restricciones impuestas por el código genético que limitan las proteínas a 20 bloques de construcción estándar codificados genéticamente (con la rara excepción de selenocisteina (véase, por ejemplo A. Bock et al., (1991), Molecular Microbiology 5:515-20) y pirrolisina (véase por ejemplo, G. Srinivasan, et al., (2002), Science 296:1459-62). Se ha realizado algún avance para eliminar estas restricciones, aunque este avance ha estado limitado y la capacidad para controlar racionalmente la estructura y función de la proteina esté todavía en su infancia. Por ejemplo, los químicos han desarrollado métodos y estrategias para sintetizar y manipular las estructuras de moléculas pequeñas (véase por ejemplo, E. J. Corey, & X.-M. Cheng, The Logic of Chemical Synthesis (Wiley-Interscience, New York, 1995) ) . Las metodologías de síntesis total (véase por ejemplo, B. Merrifield, (1986), Science 232:341-7 (1986)), y metodologías semi-sintéticas (véase por ejemplo, D. Y. Jackson et al., (1994) Science 266:243-7; y, P. E. Dawson, & S. B. Kent, (2000), Annual Review of Biochemistry 69:923-60), han hecho posible sintetizar péptidos y proteínas pequeñas, pero estas metodologías tienen utilidad limitada con proteínas de más de 10 kilo Daltons (kDa) . Los métodos de mutagénesis, aunque son poderosos, están restringidos a un número limitado de cambios estructurales. En un número de casos, ha sido posible incorporar competitivamente análogos estructurales estrechos de aminoácidos comunes en todas las proteínas. Véase, por ejemplo, R. Furter, (1998), Protein Science 7; 419-26; K. Kirshenbaum, et al., (2002), ChemBioChem 3:235-7; y, V. Doring et al., (2001), Science 292:501-4. En un intento por expandir la capacidad para manipular la estructura y función de la proteina, se desarrollaron métodos in vitro utilizando tARN ortogonales acilados químicamente que permitieron que aminoácidos no naturales sean incorporados selectivamente en respuesta a un codón sin sentido, in vitro (véase, por ejemplo, J. A. Ellman, et al., (1992)m, Science 255:197-200). Aminoácidos con novedosas estructuras y propiedades físicas fueron incorporados selectivamente a proteínas para estudiar el plegado de la proteína y estabilidad y reconocimiento biomolecular y catálisis. Véase, por ejemplo D. Mendel, et al., (1995), Annual Review of Biophysics and Biomolecular Structure 24:435-462; y V. W. Cornish, et al (Mar. 31, 1995) , Angewandte Chemie-International Edition in English 34 : 621-623. Sin embargo, la naturaleza estequiométrica de este proceso limitó severamente la cantidad de proteína que podría ser generada. Aminoácidos no naturales han sido microinyectados a células. Por ejemplo, aminoácidos no naturales fueron introducidos al receptor de acetilcolina nicotínico en oocitos de Xenopus (por ejemplo, . Estar, Nowak, et al. (1995), In vivo incorporation of unnatural amino acids into ion channels in Xenopus oocyte expzession system, Method Enzymol . 293:504-529) mediante microinyección de un tARN termófilo de tetrahimena misacilado químicamente (por ejemplo, M. E. Saks, et al. (1996), An engineered Tetrahymena tRNAGln for in vivo incorporation of unnatural amino acids into proteins by nonsense suppression, J. Biol. Chem. 271:23169-23175), y el mRNA relevante. Esto ha permitido estudios biofísicos detallados del receptor en oocitos mediante la introducción de aminoácidos que contienen cadenas laterales con propiedades físicas o químicas únicas. Véase, por ejemplo D. A. Dougherty (2000) , Unnatural amino acids as probes of protein structure and function, Curr. Opin. Chem. Biol . 4: 645-652. Desafortunadamente, esta metodología está limitada a proteínas en células que pueden ser microinyectadas y debido a que el tARN relevante es químicamente acilado in vitro y no puede ser re-acilado, los rendimientos de proteína son muy bajos. Para superar estas limitaciones, envase componentes fueron agregados a la maquinaria biosintética de proteína del procarionte Escherichia coli (E. coli) (por ejemplo, L. Wang, et al., (2001), Science 292:498-500). Que permitió la codificación genética de aminoácidos no naturales in vivo. Un número de envase aminoácidos con nuevas propiedades químicas, físicas o biológicas, en los que se incluyen etiquetas de fotoafinidad y aminoácidos fotoisomerizables , cetoaminoácidos y aminoácidos glicosilados han sido incorporados eficientemente y con alta fidelidad a proteínas en E. coli en respuesta al codón ámbar, TAG, utilizando esta metodología. Véase, por ejemplo J. W. Chin et al.r (2002), Journal of the American Chemical Society 124:9026-9027; J. W. Chin, P. G. Schultz, (2002), ChemBioChem 11:1135-1137; J. W. Chin, et al., (2002), PNAS United States of América 99:11020-11024: y, L. Wang, & P. G. Schultz, (2002), Chem. Comm. 1-10. Sin embargo, la maquinaria de traducción de procariontes y eucariontes no son altamente conservadas; así, componentes de la maquinaria biosintética agregados a E. coli no puede frecuentemente ser usados para incorporar específicamente en el sitio aminoácidos no naturales a proteínas en células eucariónticas . Por ejemplo, el par tirosil-tARN sintetasa/tARN Methanococcus jannaschii que fue usado en E. coli no es ortogonal en células eucariónticas. Además, la transcripción de tARN en eucariontes, pero no en procariontes, se lleva a cabo mediante AR1S1 polimerasa III y esto coloca restricciones en la secuencia primaria de los genes estructurales de tARN que pueden ser transcritos en células eucariónticas. Además, en contraste con las células procariónticas, los tARN en células eucariónticas necesitan ser exportados de núcleo, en donde son transcritos, al citoplasma, para funcionar en la traducción. Finalmente, el ribosoma 80S eucarióntico es distinto del ribosoma procarióntico 70S. Así, hay necesidad de desarrollar componentes mejorados de la maquinaria biosintética para expandir el código genético eucarióntico . Esta invención satisface estas y otras necesidades, como será evidente a partir de la revisión de la siguiente revelación.
BREVE DESCRIPCIÓN DE LA INVENCIÓN La invención proporciona células eucariónticas con componentes de traducción, por ejemplo pares de aminoacil-tARN sintetasas ortogonales (O-RS) y tARN ortogonales (0-tARN) y componentes individuales de los mismos que son usados en la maquinaria biosintética de proteina eucarióntica para incorporar un aminoácido no natural en una cadena de polipéptido creciente, en una célula eucarióntica. Las composiciones de la invención incluyen una célula eucarióntica (por ejemplo, una célula de levadura (tal como una célula Saccharomyces cerevisiae) , una célula de mamífero, una célula de planta, una célula de alga, una célula fungal, una célula de insecto, etc.) que comprende una aminoacil-tARN sintetasa ortogonal (O-RS) (por ejemplo, derivada de un organismo no eucarióntico tal como Escherichia coli, Bacillus stearothermophilus, etc.), en donde la O-RS aminoacila preferencialmente un tARN ortogonal (0-tARN) con por lo menos un aminoácido no natural en la célula eucarióntica. Opcionalmente, dos o más 0-tARN pueden ser aminoacilados en una célula eucarióntica dada. Opcionalmente, dos o más OtRNA pueden ser aminoacilados en una célula eucarióntica dada. En un aspecto, una O-RS aminoacila un 0-tARN con el aminoácido no natural, por ejemplo, por lo menos 40%, por lo menos 45%, por lo menos 50%, por lo menos 60%, por lo menos 75%, por lo menos 80% o aún 90% o más tan eficientemente como una O-RS que tiene una secuencia de aminoácidos, por ejemplo, como se resume en SEQ ID NO: 86 ó 45. En una modalidad, una O-RS de la invención aminoacila el O-tARN con el aminoácido no natural, por ejemplo, por lo menos 10 veces, por lo menos 20 veces, por lo menos 30 veces, etc., más eficientemente que la O-RS aminoacila el O-tARN con un aminoácido natural. En una modalidad, la O-RS o una porción de la misma es codificada mediante una secuencia de polinucleótidos como se resume en cualquiera de las SEQ ID NO: 3-35 (por ejemplo 3-19, 20-35, o cualquier otro sub-conjunto de secuencias 3-35) , o una secuencia de polinucleótidos complementaria de la misma. En otra modalidad, la O-RS comprende una secuencia de aminoácidos como se resume en cualquiera de las SEQ ID NO: 36-63 (por ejemplo 36-47, 48-63 o cualquier otro sub-conjunto de 36-63), y/u 86, o una variación conservadora de la misma. En todavía otra modalidad, la O-RS comprende una secuencia de aminoácidos que es por ejemplo, por lo menos 90%, por lo menos 95%, por lo menos 98%, por lo menos 99% o por lo menos 99.5% o más, idéntica a aquella de una tirosil aminoacil-tARN sintetasa (TyrRS) que se presenta de manera estable en la naturaleza y comprende dos o más aminoácidos de los grupos A-E. El grupo ? incluye valina, isoleucina, leucina, glicina, serina, alanina o treonina en una posición correspondiente a Tyr37 de un TyrRS de E. coli. El grupo B incluye aspartato en una posición correspondiente a Asnl26 de un TyrRS de E. coli. El grupo C incluye treonina, serina, arginina, asparagina o glicina en una posición correspondiente a Aspl82 de un TyrRS de E. coli. El grupo D incluye metionina, alanina, valina o tirosina en una posición correspondiente a Phel83 de un TyrRS de E. coli; y el grupo E incluye serina, metionina, valina, cisteina, treonina o alanina en una posición correspondiente a Leul86 de un TyrRS de E. coli. Cualquier sub-conjunto de combinaciones de estos grupos son un aspecto de la invención. Por ejemplo, en una modalidad, la O-RS tiene dos o más aminoácidos seleccionados de valina, isoleucina, leucina o treonina ocurre en una posición correspondiente a Tyr37 de TyrRS de E. coli; treonina, serina, arginina o glicina en una posición correspondiente a Aspl82 de TyrRS de E. Coli; metionina o tirosina en una posición correspondiente a Phel83 de TyrRS de E. coli; y serina o alanina en una posición correspondiente a Leul86 de TyrRS de E. coli. En otra modalidad, la O-RS incluye dos o más aminoácidos seleccionados de glicina, serina o alanina en una posición correspondiente a Tyr37 de TyrRS de E. coli, aspartato en una posición correspondiente a Asnl26 de TyrRS de E. coli, asparagina en una posición correspondiente a Aspl82 de TyrRS de E. coli, alanina o valina en una posición correspondiente a Phel83 de TyrRS de E. coli y/o metionina, valina, cisteina o treonina en una posición correspondiente a Leul86 de TyrRS de E. coli. En otra modalidad, la O-RS tiene una o más propiedades enzimáticas mejoradas o realzadas para el aminoácido no natural en comparación con el aminoácido natural. Por ejemplo, las propiedades mejoradas o realzadas para el aminoácido no natural, en comparación con un aminoácido natural incluyen cualquiera de: por ejemplo una Km superior, una Km inferior, una kcat superior, una kcat inferior, una kcat/km inferior, una kcat/km superior, etc. La célula eucarióntica también incluye opcionalmente un(os) aminoácido (s) no natural(es). Las célula eucarióntica incluye opcionalmente un tARN ortogonal (O-tARN) (por ejemplo, derivado de un organismo no eucarióntico, tal como Escherichia coli, Bacillus steaxothermophilus, y/o los semejantes) en donde el O-tARN reconoce un codón selector y es preferiblemente aminoacilado con el aminoácido no natural mediante la O-RS. En un aspecto, el O-tARN modera la incorporación del aminoácido no natural a una proteina, con por ejemplo, por lo menos 45%, por lo menos 50%, por lo menos 60%, por lo menos 75%, por lo menos 80%, por lo menos 90%, por lo menos 95% o 99% de la eficiencia de un tARN que comprende o es procesado en una célula a partir de una secuencia de polinucleótidos como se resume en la SEQ ID NO: 65. En otro aspecto, el 0-tARN comprende la secuencia de SEQ ID NO: 65 y la O-RS comprende una secuencia de polipéptidos seleccionada de una secuencia de aminoácidos resumida en cualquiera de las SEQ ID NO: 36-63 (por ejemplo, 36-47, 48-63 o cualquier otro sub-conjunto de 36-63) y/u 86, y/o una variación conservadora de la misma. En otra modalidad, la célula eucarióntica comprende un ácido nucleico que comprende un polinucleótido que codifica un polipéptido de interés, en donde el polinucleótido comprende un codón selector que es reconocido por el O-tARN. En un aspecto, el rendimiento del polipéptido de interés que comprende el aminoácido no natural es, por ejemplo, por lo menos 2.5%, por lo menos 5%, por lo menos 10%, por lo menos 25%, por lo menos 30%, por lo menos 40%, 50% o más, de aquel obtenido para el polipéptido que se presenta de manera estable en la naturaleza de interés, de una célula en la cual el polinucleótido carece del codón selector. En otro aspecto, la célula produce el polipéptido de interés en ausencia de aminoácido no natural, con un rendimiento que es, por ejemplo, menor del 35%, menor del 30%, menor del 20%, menor del 15%, menor del 10%, menor del 5%, menor del 2.5%, etc., del rendimiento del polipéptido en presencia del aminoácido no natural.
La invención también proporciona una célula eucarióntica que comprende una aminoacil-tARN sintetasa ortogonal (O-RS), un tARN ortogonal (O-tARN) , un aminoácido no natural y un ácido nucleico que comprende un polinucleótido que codifica un polipéptido de interés. El polinucleótido comprende un codón selector que es reconocido por el O-tARN. Además, la O-RS amxnoacila preferiblemente el tARN ortogonal (O-tARN) con el aminoácido no natural en la célula eucarióntica y la célula produce el polipéptido de interés en ausencia del aminoácido no natural, con un rendimiento que es, por ejemplo, menor del 30%, menor del 20%, menor del 15%, menor del 10%, menor del 5%, menor del 2.5%, etc., del rendimiento del polipéptido en presencia del aminoácido no natural. Composiciones que incluyen una célula eucarióntica que comprende un tARN ortogonal (O-tARN) son también un aspecto de la invención. Comúnmente, el O-tARN modera la incorporación de un aminoácido no natural a una proteina que es codificada por un polinucleótido que comprende un codón de selección que es reconocido por el O-tARN in vivo. En una modalidad, el O-tARN modera la incorporación del aminoácido no natural a la proteina, con, por ejemplo, por lo menos 45%, por lo menos 50%, por lo menos 60%, por lo menos 75%, por lo menos 80%, por lo menos 90%, por lo menos 95% o aún 99% o más la eficiencia de un tARN que comprende o es procesado en una célula a partir de una secuencia de polinucleótidos como se resume en la SEQ ID NO: 65. En otra modalidad, el O-tARN comprende o es procesado a partir de una secuencia de polinucleótidos como se resume en la SEQ ID NO: 65, o una variación conservadora de la misma. En todavía otra modalidad, el O-tARN comprende un O-tARN reciclable. En un aspecto de la invención, el O-tARN es modificado post-transcripcionalmente . La invención también proporciona un ácido nucleico que codifica un O-tARN en una célula eucarióntica o un polinucleótido complementario de la misma. En una modalidad, el ácido nucleico comprende un bloque A y un bloque B. La invención también comprende métodos para producir componentes de traducción, por ejemplo 0-RS o pares de 0-tARN/O-RS (y componentes de traducción producidos mediante estos métodos) . Por ejemplo, la invención proporciona métodos para producir una aminoacil-tARN sintetasa ortogonal (O-RS) que preferiblemente aminoacila un tARN ortogonal con un aminoácido no natural en una célula eucarióntica. El método incluye, por ejemplo, por ejemplo (a) someter a selección positiva, en presencia de un aminoácido no natural, una población de células eucariónticas de una primera especie, en donde cada una de las células eucariónticas comprende: (i) un miembro de una biblioteca de aminoacil-tARN sintetasas (RS) , (ii) un tARN ortogonal (O-tARN) , (íii) un polinucleótido que codifica un marcador de selección positivo, y (iv) un polinucleótido que codifica un marcador de selección negativo; en donde las células que sobreviven la selección positiva comprenden una RS activa que aminoacila el tARN ortogonal (O-tARN) en presencia de un aminoácido no natural . Las células que sobreviven la selección positiva son sometidas a selección negativa en ausencia del aminoácido no natural para eliminar las RS activas que aminoacilan el O-tARN con un aminoácido natural. Esto proporciona la O-RS que preferiblemente aminoacila el O-tARN con el aminoácido no natural. En ciertas modalidades, el polinucleótido que codifica el marcador de selección positivo está enlazado operativo a un elemento de respuesta y las células comprenden además un polinucleótido que: (a) codifica una proteina moduladora transcripcional (por ejemplo, una proteina moduladora transcripcional eucarióntica, etc.) que modula la transcripción del elemento de respuesta y (b) comprende por lo menos un codón selector. La incorporación del aminoácido no natural a la proteina moduladora transcripcional mediante el O-tARN aminoacilado con el aminoácido no natural da como resultado la transcripción del marcador de selección positivo. En una modalidad, la proteina moduladora transcripcional es una proteina activadora transcripcional (por ejemplo GAL , etc.) y el codón selector es un codón de retención ámbar, por ejemplo, en donde el codón de retención ámbar está ubicado en o sustancialmente cerca de una porción del polinucleótido que codifica un dominio de enlace de ADN de la proteina activadora transcripcional . El marcador de selección positivo puede ser cualquiera de una variedad de moléculas. En una modalidad, el marcador de selección positivo comprende un complemento nutricional para el crecimiento y la selección se lleva a cabo sobre un medio que carece del complemento nutricional. En otra modalidad, el polinucleótido que codifica el marcador de selección positivo es, por ejemplo, un gen ura3, leu2, lys2, lacZ, his3 (por ejemplo, en donde el gen his3 codifica una imidazol glicerol fosfato deshidratasa, detectada al proporcionar 3-aminotriazol (3-AT)), y/o los semejantes. En todavía otra modalidad, el polinucleótido que codifica el marcador de selección positivo comprende un codón selector. Como con el marcador de selección positivo, el marcador de selección negativo puede también ser cualquiera de una variedad de moléculas. En ciertas modalidades, el polinucleótido que codifica el marcador de selección negativo es enlazado operativamente a un elemento de respuesta del cual la transcripción es moderada por la proteína moduladora transcripcional. La incorporación de un aminoácido natural a la proteína moduladora transcripcional mediante el O-tARN aminoacilado con un aminoácido natural da como resultado la transcripción del marcador de selección negativo. En una modalidad, el polinucleótido que codifica el marcador de selección negativo es, por ejemplo, un gen ura3 y la selección negativa se lleva a cabo sobre un medio que comprende ácido 5-fluoroorótico (5-FOA) . En otra modalidad, el medio usado para la selección negativa comprende un agente de selección o filtración que es convertido a una sustancia detectable mediante el marcador de selección negativo. En un aspecto de la invención, la sustancia detectable es una sustancia tóxica. En una modalidad, el polinucleótido que codifica el marcador de selección negativo comprende un codón selector . En ciertas modalidades, el marcador de selección positivo y/o el marcador de selección negativo comprende un polipéptido que fluorece o cataliza una reacción luminiscente en presencia de un reactivo apropiado. En un aspecto de la invención, el marcador de selección positivo y/o el marcador de selección negativo es detectado mediante clasificación de células activada por fluorescencia (FACS) o mediante luminiscencia. En ciertas modalidades, el marcador de selección positivo y/o marcador de selección negativo comprende un marcador de selección o filtración a base de afinidad o una proteina moduladora transcripcional . En una modalidad, el mismos polinucleótido codifica tanto el marcador de selección positivo como el marcador de selección negativo . En una modalidad, el polinucleótido que codifica el marcador de selección positivo y/o marcador de selección negativo de la invención puede comprender por lo menos dos codones selectores, cada uno o ambos pueden comprender por lo menos dos codones selectores diferentes o por lo menos dos de los mismos codones selectores. Niveles adicionales de severidad de selección/filtración pueden también ser usados en los métodos de la invención. En una modalidad, los métodos pueden comprender por ejemplo, proporcionar una cantidad variable de una sintetasa inactiva en la etapa (a) , (b) o tanto (a) como (b) , en donde la cantidad variable de la sintetasa inactiva proporciona un nivel adicional de selección o severidad de filtración. En una modalidad, la etapa (a), (b) o ambas etapas (a) ó (b) del método para producir una O-RS incluye hacer variar la severidad de selección o filtración, por ejemplo del marcador de selección positivo ylo negativo. El método incluye opcionalmente someter la O-RS que preferiblemente aminoacila el O-tARN con el aminoácido no natural a una ronda de selección adicional, por ejemplo un (as) ronda (s) de selección positiva adicional, una(s) ronda (s) de selección negativa adicional o combinaciones tanto de rondas de selección tanto positivas como negativas adicionales.
En una modalidad, la selección/filtración comprende una o más selección/filtración positiva o negativa escogida de por ejemplo, un cambio en permeabilidad de aminoácido, un cambio en eficiencia de traducción, un cambio en fidelidad de traducción, etc. El uno o más cambios están basados en una mutación en uno o más polinucleótidos que codifican un componente del par de tARN ortogonal-tARN sintetasa es usado para producir proteina. Comúnmente, la biblioteca de RS (por ejemplo, una biblioteca de RS imitantes) comprende RS derivadas de por lo menos una aminoacil-tARN sintetasa (RS) , por ejemplo a partir de un organismo no eucarióntico . En una modalidad, la biblioteca de RS es derivada de una RS inactiva, por ejemplo en donde la RS inactiva es generada mediante la mutación de una RS activa. En otra modalidad, la RS inactiva comprende una cavidad de enlace de aminoácido y uno o más aminoácidos que comprenden la cavidad de enlace son sustituidos con uno o más aminoácidos diferentes, por ejemplo los aminoácidos sustituidos son sustituidos con alaninas . En ciertas modalidades, el método para producir una O-RS incluye además llevar a cabo la mutación aleatoria, mutación especifica del sitio, recombinación, construcción quimérica o cualquier combinación de los mismos, en un ácido nucleico que codifica una RS, produciendo mediante esto la biblioteca de O-RS mutantes. En ciertas modalidades, el método incluye además, por ejemplo (c) aislar un ácido nucleico que codifica la O-RS (d) generar a partir del ácido nucleico un conjunto de polinucleótidos que codifican las 0-RS mutadas (por ejemplo, mediante mutagénesis aleatoria, mutagénesis especifica del sitio, construcción quimérica, recombinación o cualquier combinación de las mismas) y (e) repetir las etapas (a) y/o (b) hasta que se obtiene una O-RS mutada que preferiblemente aminoacila el O-tARN con el aminoácido no natural. En un aspecto de la invención, las etapas (c)-(e) se llevan a cabo por lo menos dos veces. Métodos para producir pares de 0-tARN/0-RS son también un aspecto de la invención. En una modalidad, la O-RS es obtenida como se describe anteriormente y el O-tARN es obtiene al someter a selección negativa una población de células eucariónticas de una primera especie, en donde las células eucariónticas comprenden un número de una biblioteca de tARN para eliminar células que comprenden un miembro de la biblioteca de t-ARN que está aminoacilado mediante una aminoacil-tARN sintetasa (RS) que es endógena a las células eucariónticas. Esto proporciona un cúmulo de tARN que son ortogonales a la célula eucarióntica de la primera especie. En un aspecto de la invención, la biblioteca de tARN comprende tARN derivados de por lo menos un tARN, por ejemplo a partir de un organismo no eucarióntico . En otro aspecto de la invención, la biblioteca de aminoacil-tARN sintetasas (RS) comprende RS derivadas de por lo menos una aminoacil-tARN sintetasa (RS) , por ejemplo a partir de un organismo no eucarióntico . En todavía otro aspecto de la invención, la biblioteca de tARN comprende tARN derivados de por lo menos un tARN a partir de un primer organismo no eucarióntico. La biblioteca de aminoacil-tARN sintetasas (RS) comprende opcionalmente RS derivadas de por lo menos una aminoacil-tARN sintetasa (RS) a partir de un segundo organismo no eucarióntico. En una modalidad, los primeros y segundos organismos no eucariónticos son los mismos. Alternativamente, los primeros y segundos organismos no eucariónticos pueden ser diferentes. Pares de 0-tARN/O-RS específicos producidos mediante los métodos de la invención son también un aspecto de la invención. Otro aspecto de la invención es un método para producir componentes de traducción en una especie e introducir los' componentes de traducción seleccionados/filtrados a una segunda especie. Por ejemplo, el método para producir un par de O-tARN/O-RS en una primera especie (por ejemplo una especie eucarióntica, tal como levadura y los semejantes), incluye además introducir un ácido nucleico que codifica el O-tARN y un ácido nucleico que codifica la 0-RS a una célula eucarióntica de una segunda especie (por ejemplo, un mamífero, un insecto, un hongo, una alga, una planta y los semejantes) . La segunda especie puede usar los componentes de traducción introducidos para incorporar un aminoácido no natural a una cadena de polipéptido creciente in vivo, por ejemplo durante la traducción . En otro ejemplo, un método para producir una aminoacil-tARN sintetasa ortogonal (0-RS) que preferiblemente aminoacila un tARN ortogonal con un aminoácido no natural en una célula eucarióntica incluye: (a) someter a selección positiva, en presencia de un aminoácido no natural, una población de células eucariónticas de una primera especie (por ejemplo, una especie eucarióntica, tal como levadura o los semejantes). Cada una de las células eucariónticas de la primera especie comprende: (i) un miembro de una biblioteca de aminoacil-tARN sintetasas (RS), (ii) un tARN ortogonal (O-tARN) , (iii) un polinucleótido que codifica un arcador de selección positivo, y (iv) un polinucleótido que codifica un marcador de selección negativo. Las células que sobreviven la selección positiva comprenden una RS activa que aminoacila el tARN ortogonal (O-tARN) en presencia de un aminoácido no natural. Las células que sobreviven la selección positiva son sometidas a selección negativa en ausencia del aminoácido no natural para eliminar las RS activas que aminoacilan el O-tARN con un aminoácido natural, proporcionando mediante esto una O-RS que preferiblemente aminoacila el O-tARN con el aminoácido no natural, ün ácido nucleico que codifica el 0-tARN y un ácido nucleico que codifica la O-RS son introducidos a una célula eucarióntica de una segunda especie (por ejemplo mamífero, un insecto, un hongo, una. alga, una planta y/o los semejantes) . Estos componentes, cuando son introducidos en la segunda especie, pueden ser usados para incorporar aminoácidos no naturales a una proteína o polipéptido de interés en la segunda especie. En una modalidad, el O-tARN y/o los O-RS son introducidos a una célula eucarióntica de una segunda especie. En ciertas modalidades, el O-tARN es obtenido al someter a selección negativa una población de células eucariónticas de una primera especie, en donde las células eucariónticas comprenden un miembro de una biblioteca de tARN, para eliminar células que comprenden un miembro de la biblioteca de tARN que es amínoacílado mediante una aminoacil-tARN sintetasa (RS) que es endógena a las células eucariónticas. Esto proporciona un cúmulo de tARN que son ortogonales a la célula eucarióntica de la primera especie y la segunda especie. En un aspecto, la invención comprende una composición que comprende una proteína, en donde la proteína comprende por lo menos un aminoácido no natural y por lo menos una modificación post-traducción, en donde la por lo menos una modificación post-traducción comprende la anexión de una molécula que comprende un segundo grupo reactivo mediante una [3+2] cicloadición al por lo menos un aminoácido no natural que comprende un primer grupo reactivo. Asi, proteínas (o polipéptidos de interés) con por lo menos un aminoácido no natural son también un aspecto de la invención. En ciertas modalidades de la invención, una proteína con por lo menos un aminoácido no natural incluye por lo menos una modificación post-traducción . En una modalidad, la por lo menos una modificación post-traducción comprende la anexión de una molécula (por ejemplo, un 'tinte, un polímero, por ejemplo un derivado de polietilenglicol, un fotoreticulador, un compuesto citotóxico, una etiqueta de afinidad, un derivado de biotina, una resina, una segunda proteína o polipéptido, un quelante de metal, un co-factor, un ácido graso, un carbohidrato, un polinucleótido (por ejemplo ADN, ARN, etc.), etc.) que comprende un segundo grupo reactivo mediante una [3+2] cicloadición al por lo menos un aminoácido no natural que comprende un primer grupo reactivo. Por ejemplo, el primer grupo reactivo es una porción de alquinilo (por ejemplo, en el aminoácido no natural p-propargiloxifenilalanina) (este grupo es también algunas veces denominado como porción de acetileno) y el segundo grupo reactivo es una porción azido. En otro ejemplo, el primer grupo reactivo es la porción azido (por ejemplo, en el aminoácido no natural p-azido-L-fenilalanina) y el segundo grupo reactivo es la porción alquinilo. En ciertas modalidades, una proteina de la invención incluye por lo menos un aminoácido no natural (por ejemplo, un aminoácido no natural ceto) que comprende por lo menos una modificación post-traducción, en donde la por lo menos una modificación post-traducción comprende una porción de sacárido. En ciertas modalidades, la modificación post-traducción se hace in vivo en una célula eucarióntica . En ciertas modalidades, la proteina incluye por lo menos una modificación post-traducción que se hace in vivo mediante una célula eucarióntica, en donde la modificación post-traducción no se hace mediante una célula procarióntica . Ejemplos de modificaciones post-traducción incluyen, pero no están limitadas a, acetilación, acilación, modificación por lipido, palmitoilación, adición de palmitato, fosforilación, modificación de enlace de glicolípido y los semejantes. En una modalidad, la modificación post-traducción comprende la anexión de un oligosacárico a una asparagina mediante un enlace de GlcNAc-asparagina (por ejemplo, en donde el oligosacárido comprende (GlcNAc-Man) 2-Man-GlcNAc-GlcNAc, y los semejantes) . En otra modalidad, la modificación posttraducción comprende la anexión de un oligosacárico (por ejemplo Gal-GalNAc, Gal-GlcNAc, etc.) a una serina o treonina mediante un enlace de GalNAc-serina, un enlace de GalNAc-treonina, un enlace de GlcNAc-serina o un enlace GlcNAc-treonina. En ciertas modalidades, una proteina o polipéptido de la invención puede comprender una secuencia de secreción o localización, por ejemplo una etiqueta de epitopo, una etiqueta FLAG, una etiqueta de polihistidina, una fusión GST y/o los semejantes. Comúnmente, las proteínas son, por ejemplo, por lo menos 60%, por lo menos 70%, por lo menos 75%, por lo menos 80%, por lo menos 90%, por lo menos 95% o aún por lo menos 99% o más idénticas a cualquier proteina disponible (por ejemplo, una proteina terapéutica, una proteina de diagnóstico, una enzima industrial o porción de las mismas y/o los semejantes) y comprenden uno o más aminoácidos no naturales. En una modalidad, una composición de la invención incluye una proteina o polipéptido de interés y un excipiente (por ejemplo, una solución reguladora del pH, un excipiente aceptable farmacéuticamente, etc.). La proteina o polipéptido de interés puede comprender por lo menos uno, por lo menos dos, por lo menos tres, por lo menos cuatro, por lo menos cinco, por lo menos seis, por lo menos siete, por lo menos ocho, por lo menos nueve o diez o más aminoácidos no naturales. Los aminoácidos no naturales pueden ser los mismos o diferentes, por ejemplo pueden ser 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 o más sitios diferentes en la proteina que comprenden 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 o más aminoácidos no naturales diferentes. En ciertas modalidades, por lo menos uno pero menos de todos, de un aminoácido particular presente en una versión que se presenta de manera estable en la naturaleza de la protexna es sustituido con un aminoácido no natural . Ejemplos de una proteina (o polipéptido de interés) incluyen, pero no están limitados a, por ejemplo, una citocina, un factor de crecimiento, un receptor del factor de crecimiento, un interferón, una interleucina, una molécula inflamatoria, un producto de oncógeno, una hormona de péptido, una molécula de transducción de señal, un receptor de hormona de esferoide, eritropoyetina (EPO) , insulina, hormona de crecimiento humana, una alfa-1 antitripsina, una angioestatina, un factor anti-hemolitico, un anticuerpo, una apolipoproteina, una apoproteina, un factor natriurético atrial, un polipéptido natriurético atrial, un péptido atrial, una C-X-C quimiocina, T39765, NAP-2, ???-78, un Gro-a, un Gro-b, un Gro-c, un IP-10, un GCP-2, un NAP-4, un SDF-1, un PF4, un MIG; una calcitonina, un ligando c-kit, una citocina, una CC quimiocina, una proteina-1 quimioatrayente de monocito, una proteina-2 quimioatrayente de monocito, una proteina-3 quimioatrayente de monocito, una proteina-1 alfa inflamatoria de monocito, una proteina-1 beta inflamatoria de monocito, RANTES, 1309, R83915, R91733, HCCl, T58847, D31065, T64262, un CD40, un ligando CD40, un ligando C-kit, un colágeno, un factor estimulador de colonia (CSF) , un factor de complemento 5a, un inhibidor de complemento, un receptor 1 de complemento, una citocina, DHFR, un péptido-78 activador de neutrófilo epitelial, un GROa/MGSA, un GRC-ß, un GROy un IP-la, un ???-?d, un MCP-1, un factor de crecimiento epidérmico (EGF) , un péptido activador de neutrófilo epitelial, una eritropoyetina (EPO) , un toxina exfoliadora, un factor IX, un factor VII, un factor VIII, un factor X, un factor de crecimiento de fibroblasto (FGF) , un fibrinógeno, una fibronectina, un G-CSF, un GM-CSF, una glucocerebrosidasa, una gonadotropina, un factor de crecimiento, un receptor del factor de crecimiento, una proteina de Hedgehog, una hemoglobina, un factor de crecimiento de hepatocito (HGF) , una hirudina, una albúmina de suero humano, un ICAM-1, un receptor de ICAM-1, un LFA-1, un receptor de LFA-1, una insulina, un factor de crecimiento semejante a insulina (IGF) , un IGF-I, un IGF-II, un interferón, un IFN-OÍ, un IFN-ß, un IFN-?, una interleucina, una IL-1, una IL-2, una IL-3, una IL-4, una IL-5, una IL-6, una IL-7, una IL-8, una IL-9, una IL-10, una IL-11, una IL-12, un factor de crecimiento de queratinocito ( GF) , una lactoferrina, un factor inhibidor de leucemia, una luciferasa, una neurturina, un factor inhibidor de neutrófilo (NIF) , una M oncostatina, una proteína osteogénica, un producto oncogénico, una hormona paratiroides, un PD-ECSF, un PDGF, una hormona de péptido, una hormona de crecimiento humano, una Pleiotoprina, una Proteina A, una Proteína G, exotoxina Pirogénicas A, B o Cf una Relaxina, una Renina, un SCF, un Receptor I de complemento soluble, un I-CAM soluble, Receptores de interleucina solubles, un Receptor de TNF soluble, una Somatomedina, una Ssomatoestatina, una Somatotropina, una Estrectoquinasa, súper antigenos, Enterotoxinas estafilococales, un SEA, un SEB, un SEC1, un SEC2, un SEC3, un SED, un SEE, un receptor de hormona de esteroide, un Superóxido de dismutasa (SOD), una toxina de síndrome de choque tóxico, una alfa 1 Timosina, un activador de plasminógeno de tejido, un factor de crecimiento de tumor (TGF) , un TGF-a, un TGF-ß, un Factor de Necrosis de Tumor, un Factor Alfa de Necrosis de Tumor, un Factor Beta de Necrosis de Tumor, un receptor del factor de necrosis de tumor (TNFR) , una VLA-4 proteína, una VCAM-1 proteína, un Factor de Crecimiento Endotelial Vascular (VEGEF) , una Uroquinasa, un Mos, un Ras, un Raf, un Met, un ap53, un Tat, un Fos, un Myc, un Jun, un Myb, un Reí, un receptor de estrógeno, un receptor de progesterona, un receptor de testosterona, un receptor de aldosterona, un receptor de LDL, un SCF/c-Kit, CD40L/CD40, un VLA-4/VCAM-1, un ICAM-l/LFA-1, una hialurina/CD44, una corticosterona, una proteína presente en banco genético u otras bases de datos disponibles y los semejantes y/o una porción de los mismos. En una modalidad, el polipéptido de interés incluye una proteína moduladora transcripcional (por ejemplo una proteína activadora transcripcional (tal como GAL4) o una proteina reprensora transcripcional, etcétera) o una porción de las mismas. Composiciones de una proteina GAL4 o una porción de la misma en una célula eucarióticas son también un aspecto de la invención. Comúnmente, la proteina GAL4 o porción de la misma comprende por menos un aminoácido no natural. Una célula eucarióntica de la invención proporciona la capacidad de sintetizar proteínas que comprenden aminoácidos no naturales en grandes cantidades útiles. Por ejemplo, proteínas que comprenden un aminoácido no natural pueden ser producidas a una concentración de por ejemplo, por lo menos 10 microgramos/litro, por lo menos 50 microgramos /litro , por lo menos 75 microgramos/litro, por lo menos 100 microgramos/litro, por lo menos 200 microgramos/litro, por lo menos 250 microgramos/litro o por lo menos 500 microgramos/litro o más de proteína en un extracto de célula, una solución reguladora del Ph, un excipiente aceptable farmacéuticamente y/o los semejantes. En ciertas modalidades, una composición de la invención incluye, por ejemplo, por lo menos 10 microgramos, por lo menos 50 microgramos, por lo menos 75 microgramos, por lo menos 100 microgramos, por lo menos 200 microgramos, por lo menos 250 microgramos o por lo menos 500 microgramos o más de proteína que comprende un aminoácido no natural. En ciertas modalidades, la proteína o polipéptido de interés (o porción del mismo) es codificado mediante un ácido nucleico. Comúnmente, el ácido nucleico comprende por lo menos un codón selector, por lo menos dos codones selectores, por lo menos tres codones selectores, por lo menos cuatro codones selectores, por lo menos cinco codones selectores, por lo menos seis codones selectores, por lo menos siete codones selectores, por lo menos ocho codones selectores, por lo menos nueve codones selectores o aun diez o más codones selectores. La invención también proporciona métodos para producir, en una célula eucarióntica, por lo menos una proteina que comprende por lo menos un aminoácido no natural (también como proteínas producidas mediante tales métodos) . Los métodos incluyen, por ejemplo, cultivar, en un medio apropiado, una célula eucarióntica que comprende un ácido nucleico que comprende por lo menos un codón selector y codifica la proteína. La célula eucarióntica también comprende un tARN ortogonal (O-tARN) que funciona en la célula y reconoce el codón selector y una aminoacil tARN sintetasa ortogonal (0-RS) que preferiblemente aminoacila el O-tARN con el aminoácido no natural y el medio comprende un aminoácido no natural. En una modalidad, la 0-RS aminoacila el O-tARN con el aminoácido no natural, por ejemplo, por lo menos 45%, por lo menos 50%, por lo menos 60%, por lo menos 75%, por lo menos 80&, por lo menos 90%, por lo menos 95% o aun 99% o más tan eficien emente como una O-RS que tiene una secuencia de aminoácidos, por ejemplo como se resume en la SEQ ID NO.: 86 o 45. En otra modalidad, el 0-tARN comprende, es procesado de o es codificado mediante la SEQ ID NO. : 64 o 65 o una secuencia de polinucleótidos complementaria de la misma. En todavía otra modalidad, la O-RS comprende una secuencia de aminoácidos como se resume en cualquiera de las SEQ ID NO. : 36-63 (por ejemplo 36-47, 48-63 o cualquier otro subconjunto de 36-63) y/u 86. En una modalidad, el método incluye además incorporar a la proteína el aminoácido no natural, en donde el aminoácido no natural comprende un primer grupo reactivo y poner en contacto la proteína con una molécula (por ejemplo un tinte, un polímero, por ejemplo un derivado de polietilenglicol, un fotorreticulador, un compuesto sitotóxico, una etiqueta de afinidad, un derivado de biotina, una resina, una segunda proteína o polipéptido, un quelante de metal, un co-factor, un ácido graso, un carbohidrato, un polinucleótido (por ejemplo, ADN, ARN, etc.) que comprende un segundo grupo reactivo. El primer grupo reactivo reacciona con el segundo grupo reactivo para anexar la molécula al aminoácido no natural por medio de una [3+2] cicloadición . En una modalidad, el primer grupo reactivo es una porción alquinilo o azido y el segundo grupo reactivo es una porción azido o alquinilo. Por ejemplo, el primer grupo reactivo es la porción alquinilo (por ejemplo, un aminoácido no natural p-propargiloxifenilalanina) y el segundo grupo reactivo es la porción azido. En otro ejemplo, el primer grupo reactivo es la porción azido (por ejemplo, en el aminoácido no natural p-azido-L-fenilalanina) y el segundo grupo reactivo es la porción alquinilo. En ciertas modalidades, la proteina codificada comprende una proteina terapéutica, una proteina de diagnóstico, una enzima industrial o porción de las mismas. En una modalidad, la proteina que es producida mediante el método es modificada adicionalmente por medio del aminoácido no natural. Por ejemplo, el aminoácido no natural es modificado por medio de, por ejemplo una reacción nucleofilica-electrofílica, por medio de una [3+2] cicloadición, etc. En otra modalidad, la proteina producida mediante el método es modificada mediante por menos una modificación pos-traducción (por ejemplo, N-glicosilación, O-glicosilación, acetilación, asilación, modificación por lipido, palmitoilación, adición de palmitato, fosforilación, modificación de enlace de glicolipido y los semejantes) in vivo. También se proporcionan métodos para producir una proteina de modulador transcripcional de filtración o selección (como son proteínas moduladoras transcripcionales de filtración o selección producidas mediante tales métodos).
Los métodos incluyen, por ejemplo, seleccionar una primera secuencia de polinucleótidos, donde la secuencia de polinucleótidos codifica un dominio de enlace de ácido nucleico y someter a mutación la primera secuencia de polinucleótidos para incluir por lo menos un codón selector. Esto proporciona una secuencia de polinucleótidos de filtración o selección. Los métodos también incluyen, por ejemplo, seleccionar una segunda secuencia de polinucleótidos, en donde la segunda secuencia de polinucleótidos codifica un dominio de activación transcripcional; proporcionar un constructo que comprende la secuencia de polinucleótidos de filtración o de selección enlazada operativamente a la segunda secuencia de polinucleótidos e introducir el constructo, un aminoácido no natural, una tARN sintetasa octagonal (0-RS) y un tARN octagonal (O-tARN) a una célula. Con estos componentes, la 0-RS preferiblemente aminoacila el 0-tARN con el aminoácido no natural y el 0-tARN reconoce el codón selector e incorpora el aminoácido no natural al dominio de enlace de ácido nucleico, en respuesta al codón selector en la secuencia de polinucleótido de filtración o selección. Esto proporciona la proteina moduladora transcripcional de filtración o selección . En ciertas modalidades, las composiciones y los métodos de la invención incluyen células eucariónticas . Una célula eucarióntica de la invención incluye cualquiera de, por ejemplo, una célula mamífera, una célula de levadura, una célula de hongo, una célula de planta, una célula de insecto, etc. Los componentes de traducción de la invención pueden ser derivados de una variedad de organismos, por ejemplo, organismos no eucariónticos, tal como un organismo procarióntico (por ejemplo, E. coli, Bacillus stearothermophilus o los semejantes) o un arcabacterio o por ejemplo un organismo eucarióntico . Un codón selector de la invención expande la estructura de codón genético de la maquinaria biosintética de proteína eucarióntica. Cualquiera de una variedad de codones selectores pueden ser usados en la invención en los que se incluyen codones de retención (por ejemplo, un codón ámbar, un codón ocre o un codón de retención ópalo) , codones sin sentido, codones raros, codones de cuatro bases (o más) y/o los semejantes. Ejemplos de aminoácidos no naturales que pueden ser usados en las composiciones y métodos descritos en la presente e incluyen (pero no están limitados a) : una p-acetil-L-fenilalanina, una p-yodo-L-fenilalanina, una O-metil-L-tirosina, una p-propargiloxilfenilalanina, una p-propargil-fenilalina, una L-3- (2-naftil) alalina, una 3-metil-fenilalina, una ?-4-alil-L-tirosina, una 4-propil-L-tirosina, una tri-O-actil-GlcNAcP-serina, una L-Dopa, una fenilalanina fluorada, una isopropil~L-fenilalanina, una p-ácido-L-fenilalanina, una p-acil-L-fenilalanina, una p-benzoil-L-fenilalanina, una L-fosfoserina, una fosfonoserina, una fosfonotirosina, una p-broraofenilalanina, p-amino-L-fenilalanina, una isipropil-L-fenilalanina, un análogo no natural de un aminoácido de tirosina; un análogo no natural de un aminoácido de glutamina; un análogo no natural de un aminoácido de fenilalanina; un análogo no natural de un aminoácido de serina; un análogo no natural de aminoácido de trionina; un alquilo, arilo, acilo, azido, ciano halo, hidrazina, hidrazida, hidroxilo, alquenilo, alquinilo, éter, tiol, sulfonilo, seleno, éster, tioácido, borato, boronato, fosfo, fosfono, fosfina, heterociclo, enona, imina, aldehido, hidroxilamina, ceto o aminoácido amino sustituido o cualquier combinación de los mismos; un aminoácido con un reticulador fotoactivable; un aminoácido espin-marcado; un aminoácido fluorescente; un aminoácido de enlace de metal; un aminoácido que contiene metal; un aminoácido radioactivo; un aminoácido fotoenjaulado y/o fotoisomerizable; un aminoácido que contiene biotina o análogo de biotina; un aminoácido que contiene ceto; un aminoácido que comprende polietilenglicol o poliéter; un aminoácido sustituido por átomo pesado; un aminoácido escindible químicamente o fotoescindible; un aminoácido con una cadena lateral alargada; un aminoácido que contiene un grupo toxico; un aminoácido sustituido por azúcar; un aminoácido que contiene azúcar en lazada a carbono: un aminoácido redox-reactivo; un ácido que contiene cc-hidroxi; un amino tioácido; un aminoácido a,a disustituido; un ß-aminoácido; un aminoácido cíclico diferente a prolina o histidina; un aminoácido aromático diferente a fenilalanina, tirosina o triptófano y/o los semejantes. La invención también proporciona polipéptidos (0-RS) y polinucleótidos, por ejemplo, O-tARN, polinucleótidos que codifican O-RS o porciones de las mismas (por ejemplo, el sitio activo de la sintetasa) , olinucleótidos usados para construir imitantes de aminoacil-tARN sintetasa, polinucleótidos que codifican una proteína o polipéptido de interés que comprenden uno o más codones selectores, etc. Por ejemplo, un polipéptido de la invención incluye un polipéptido que comprende una secuencia de aminoácidos como se resume en cualquiera de las SEQ ID NO. : 36-63 (por ejemplo, 36-47, 48-63, o cualquier otro subconjunto de 36-63) y/u 86, un polipéptido que comprende una secuencia de aminoácidos codificada por una secuencia de polinucleótidos como se resume en cualquiera de las SEQ ID NO. : 3-35 (por ejemplo, 3-19, 20-35 o cualquier otro subconjunto de 3-35) y un polipéptido que es específicamente inmunorreactivo con un anticuerpo específico para un polipéptido que comprende una secuencia de aminoácidos como se muestra en cualquiera de las SEQ ID NO.: 36-63 (por ejemplo, 36-47, 48-63 o cualquier otro subconjunto de 36-63) y/u 86 o un polipéptido que comprende una secuencia de aminoácidos codificada por una secuencia de polinucleótidos como se muestra en cualquiera de las SEQ ID NO. : 3-35 (por ejemplo, 3-19, 20-35 o en cualquier otro subconjunto de 3-35) . También incluido de entre los polipéptidos de la invención se encuentra un polipéptido que comprende una secuencia de aminoácidos que es por lo menos 90% idéntica a aquella de una tirosilaminoacil-tARN sintetasa que se presenta de manera estable en la naturaleza (TyrRS) (por ejemplo SEQ ID NO.: 2) y comprende dos o más aminoácidos de los grupos A-E (indicados anteriormente) . Similarmente, los polipéptidos de la invención también incluyen opcionalmente un polipéptido que comprende por lo menos 20 aminoácidos contiguos de cualquiera de SEQ ID NO.: 36-63 (por ejemplo, 36-47, 48-63 o cualquier otro subconjunto de 36-63) y/u 86 y dos o más sustituciones de aminoácido como se indica anteriormente en los grupos A-E. Una secuencia de aminoácido que comprende una variación conservadora de cualquiera de los polipéptidos anteriores está también incluida como polipéptido de la invención. En una modalidad, una composición incluye un polipéptido de la invención y un excipiente (por ejemplo, solución reguladora del Ph, agua, excipiente aceptable farmacéuticamente, etc) . La invención también proporciona un anticuerpo o antisuero específicamente inmunorreactivo con un polipéptido de la invención. También se proporcionan polinucleótidos en la invención. Los polinucleótidos de la invención incluyen aquellos que codifican proteínas o polipéptidos de interés en la invención con uno o más codones selectores. Además, los polinucleótidos de la invención incluyen por ejemplo, un polínucleótido que comprende una secuencia de nucleótidos como se resume en cualquiera de las SEQ ID NO. : 3-35 (por ejemplo, 3-19, 20-35 o cualquier otro subconjunto de secuencias 3-35) 64-85; un polínucleótido que es complementario a, o que codifica una secuencia de polínucleótido del mismo y/o un polínucleótido que codifica, un polipéptido que comprende una secuencia de aminoácidos como se resume en cualquiera de las SEQ ID NO. : 36-63 (por ejemplo, 36-47, 48-63 o cualquier otro subconjunto de 36-63) y/u 86 o una variación conservadora de la misma. Un polínucleótido de la invención también incluye un polínucleótido que codifica un polipéptido de la invención. Similarmente un ácido nucleico que hibridiza a un polínucleótido indicado anteriormente bajo condiciones altamente astringentes en sustancialmente toda la longitud del ácido nucleico es un polínucleótido de la invención. Un polínucleótido de la invención también incluye un polínucleótido que codifica un polipéptido que comprende una secuencia de aminoácidos que es por lo menos 90% idéntica a una tirosil aminoacil-tARN sintetasa que se presenta de manera estable en la naturaleza (TyrRS) (por ejemplo, SEQ ID NO. : 2) y comprende dos o más mutaciones como se indica anteriormente en los grupos A-E (indicados anteriormente) . Un polinucleotido que es por lo menos 70% (o por lo menos 75%, por lo menos 80%, por lo menos 85%, por lo menos 90%, por lo menos 95%, por lo menos 98% o por lo menos 99% o más) idéntico a un polinucleotido indicado anteriormente y/o un polinucleotido que comprende una variación conservadora de cualquiera de los polinucleótidos indicados anteriormente están también incluido entre los polinucleótidos de la invención . En ciertas modalidades, un lector (por ejemplo, un plásmido, un cósmido, un fago, un virus, etc.) comprende un polinucleotido de la invención. En una modalidad, el vector es un vector de expresión. En otra modalidad, el vector de expresión incluye un promotor en enlazado operativamente a uno o más de los polinucleótidos de la invención. En otra modalidad, una célula comprende un vector que incluye un polinucleotido de la invención. En otro aspecto, la invención proporciona composiciones de compuestos y métodos para producir tales compuestos. Por ejemplo, los compuestos incluyen por ejemplo, un aminoácido no natural (tal como p- (propargiloxi ) -fenilalanina (por ejemplo, 1 en la Figura 11) tintes azido (tales como se muestran en la estructura química 4 y estructura química 6) un alquinil polietilenglicol (por ejemplo, como se muestra en la estructura química 7), donde n es numero entero de entre, por ejemplo 50 y 10,000, 75 y 5000, 100 y 2,000, 100 y 1,000 etc. y los semejantes. En una modalidad de la invención, el alquinil polietilenglicol tiene un peso molecular de, por ejemplo, aproximadamente 5,000 a aproximadamente 10,000 Da, aproximadamente 20,000 a aproximadamente 50,000 Da, aproximadamente 20,000 a aproximadamente 10,000 Da (por ejemplo, 20,000 Da). 4 Varias composiciones que comprenden estos compuestos, por ejemplo proteínas y células, también son provistas. En un aspecto, la composición que incluye el aminoácido no natural de p- (propargiloxi) -fenialanina, incluye además un tARN ortogonal. El aminoácido no natural puede ser enlazado (por ejemplo, covalentemente) al tARN ortogonal, por ejemplo, enlazado covalentemente al tARN ortogonal por medio de un enlace amino-acilo, enlazado covalentemente a un 3?? o un 2 'OH de un azúcar de ribosa terminal del tARN ortogonal, etc. En un aspecto de la invención, una proteína que comprende un tinte azido (por ejemplo, de estructura química 4 o estructura química 6) , incluye además por lo menos un aminoácido no natural (por ejemplo, un alquinxl aminoácido), donde el tinte azido es anexado al aminoácido no natural por medio de una [3+2] cicloadición . En una modalidad, una proteína comprende el alquinil polietilenglicol de estructura química 7. En otra modalidad, la composición incluye además por lo menos un aminoácido no natural (por ejemplo, un azido aminoácido), en donde el alquinil polietilenglicol está anexado a un aminoácido no natural por medio de una [3+2] cicloadición. Métodos para sintetizar varios compuestos están incluidos en la invención. Por ejemplo, un método para sintetizar un compuesto de p- (propargiloxi) fenialanina es provisto. Por ejemplo, el método comprende (a) suspender N-tert-butoxicarbonil-tirosina y K2CO3 en DMF anhidra; (b) agregar bromuro de propargilo a la mezcla de reacción de (a) y alquilar el grupo hidroxilo y el grupo carboxilo, dando como resultado un compuesto intermediario protegido que tiene la estructura: (c) mezclar el compuesto intermediario protegido con HC1 anhidro en MeOH y desproteger la porción de amina, sintetizando mediante esto el compuesto de p- (propargiloxi) fenialanina . En una modalidad, el método comprende además (d) disolver la p- (propargiloxi ) fenilalanina HC1 en NaOH acuoso y MeOH y agitarla a temperatura ambiente; (e) ajustar el pH al pH 7; y (f) precipitar el compuesto de p- (propargiloxi) fenilalanina. También se proporcionan métodos para sintetizar tintes azido. Por ejemplo, un método comprende: (a) proporcionar un compuesto de tinte que comprende una porción de haluro de sulfonilo; (b) calentar el compuesto de tinte a temperatura ambiente en presencia de 3-azidopropilamina y trietilamina y acoplar una porción de amina de la 3-azidopropilamina a la posición haluro del compuesto de tinte, sintetizando mediante esto el tinte azido. En una modalidad, el compuesto de tinte comprende cloruro de dansilo y el tinte azido comprende la composición de estructura química 4. En un aspecto, el método comprende además purificar el tinte azido de la mezcla de reacción.
En otro ejemplo, un método para sintetizar un tinte azido comprende (a) proporcionar un compuesto de tinte que contiene amina; (b) combinar el compuesto de tinte que contiene amina con una carbodiimida y ácido 4- (3-azidopropilcarbamoil) -butírico en un solvente apropiado y acoplar un grupo carbonilo del ácido a la porción amina del compuesto de tinte, sintetizando mediante esto el tinte azido. En una modalidad, la carbodiimina comprende clorhidrato de l-etil-3- (3-dimetilaminopropil) carbodiimida (EDCI) . En un aspecto, e tinte contiene amina comprende fluoresceinamina y el solvente apropiado comprende piridina. Por ejemplo, el tinte que contiene amina comprende fluoresceinamina y el tinte azido comprende la composición de estructura química 6. En una modalidad, el método comprende además (c) precipitar el tinte azido; (d) lavar el precipitado con HC1; (e) disolver el precipitado lavado en EtOAc; y (f) precipitar el tinte azido en hexanos . También se proporcionan métodos para sintetizar una propargilamida de polietilenglicol . Por ejemplo, el método comprende hacer reaccionar propargilamina con polietilenglicol (PEG)-éster de hidroxisuccinimida en un solvente orgánico (por ejemplo, CH2C12) a temperatura ambiente, dando como resultado la propargilamida de polietilenglicol de estructura química 7. En una modalidad, el método comprende además precipitar la propargilamida de polietilenglicol utilizando acetato de etilo. En un aspecto, el método incluye además xecristalizar la propargilamida de polietilenglicol en metanol; y secar el producto bajo vacio. Los equipos también son un aspecto de la invención. Por ejemplo, una equipo para producir una proteina que comprende por lo menos un aminoácido no natural en una célula es provisto, donde el equipo incluye un recipiente que contiene una secuencia de polinucleóüidos que codifica un 0-tARN o un O-tARN y una secuencia de polinucleótidos que codifica una O-RS o una O-RS . En una modalidad, el equipo incluye además por lo menos un aminoácido no natural. En otra modalidad, el equipo comprende además materiales de instrucciones para producir la proteina.
DEFINICIONES Antes de describir la presente invención, en detalle, se comprenderá que esta invención no está limitada a dispositivos o sistemas biológicos particulares, los cuales pueden por supuesto variar. También se comprenderá que la terminología utilizada en la presente es por el propósito de describir modalidades particulares solamente y no se propone ser limitantes. Como se usan en esta especificación y las reivindicaciones adjuntas, las formas singulares "uno", "en" y "el" incluyen referencias plurales a no ser que el contenido lo determine claramente de otra manera. Así, por ejemplo la referencia "una célula" incluye una combinación de dos o más células, la referencia a "bacteria" incluye mezclas de bacterias y los semejantes. A no ser que se defina de otra manera la presente o posteriormente en la presente en el resto de la especificación, todos los términos técnicos y científicos utilizados en la presente tiene el mismo significado como se comprende comúnmente por aquellos de habilidad ordinaria en la técnica a la cual la invención pertenece. Homologo : Proteínas y/o secuencias de proteínas son "homólogos" cuando son derivados, natural o artificialmente, a partir de una proteína o secuencia de proteínas ancestral común. Similarmente, ácidos nucleicos y/o secuencias de ácido nucleico son homólogos cuando son derivados, natural o artificialmente, a partir de un ácido nucleico o secuencia de ácido nucleico ancestral común. Por ejemplo, cualquier ácido nucleico que se presenta de manera estable en la naturaleza puede ser modificado mediante cualquier método de mutagénesis disponible para incluir uno o más codones selectores. Cuando es expresado, esta ácido nucleico mutagenizado codifica un polipéptido que comprende uno o más aminoácido no naturales. El proceso de mutación puede por supuesto alterar adicionalmente uno o más codones estándar, cambiando mediante esto uno o más aminoácidos estándar en la proteína imitante resultante también. La homología es inferida en general a partir de similaridad de secuencia entre dos o más ácidos nucleicos o proteínas (o secuencias de los mismos) . El porcentaje preciso de similaridad entre secuencias que es útil para establecer homología varía con el ácido nucleico y proteína en cuestión, pero tan poco como 25% de similaridad de secuencia es usado sistemáticamente para establecer homología. Niveles más altos de similaridad de secuencia, por ejemplo, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95% o 99% o más, puede también ser usado para establecer homología. Métodos para determinar porcentajes de similaridad de secuencia (por ejemplo, BLASTP y BLASTN que usan parámetros predeterminados) son descritos en la presente y están en general disponibles. Ortogonal : Como se usa en la presente, el término "ortogonal" se refiere a una molécula (por ejemplo, un tARN ortogonal (0-tARN) y/o una aminoacil tARN sxntetasa ortogonal (O-RS)) que funciona con componentes endógenos de una células con eficiencia reducida en comparación con una molécula correspondiente endógena a la células o sistema de traducción, que falla para funcionar con componentes endógenos de la célula. En el contexto de tARN y aminoacil-tARN sintetasas, ortogonal se refiere a la incapacidad o eficiencia reducida, por ejemplo, menor de 20% eficiente, menor de 10% eficiente, menor de 5% eficiente o menor de 1% eficiente, de un tARN ortogonal para funcionar con una tARN sxntetasa endógena en comparación con un tARN endógeno para funcionar con la tARN sintetasa endógena o de una aminoacil-tARN sintetasa ortogonal para funcionar con un tARN endógeno en comparación con una tARN sintetasa endógena para funcionar con el tARN endógeno. La molécula ortogonal carece de una molécula complementaria endógena funcional en la célula. Por ejemplo, un tARN ortogonal en una célula es aminoacilado mediante cualquier RS endógena de la célula con eficiencia reducida o aún cero, cuando se compara con la aminoacilación de un tARN endógeno mediante la RS endógena. En otro ejemplo, una RS ortogonal aminoacila cualquier tARN endógeno en una células de interés con eficiencia reducida o aún cero en comparación con la aminoacilación del tARN endógeno mediante una RS endógena. Una segunda molécula ortogonal puede ser introducida a la célula que funciona con la primera molécula ortogonal. Por ejemplo, un par tARN ortogonal/RS incluye componentes complementarios introducidos que funcionan conjuntamente en la células con una eficiencia (por ejemplo, 50% de eficiencia, 60% de eficiencia, 70% de eficiencia, 75% de eficiencia, 80% de eficiencia, 90% de eficiencia, 95% de eficiencia o 99% o más de eficiencia) a aquella de un par endógeno tARN/RS correspondiente. Complementario : El término "complementario" se refiere a componentes de un par ortogonal, 0-tARN y O-RS que pueden funcionar conjuntamente, por ejemplo, donde la O-RS aminoacila el O-tARN .
Preferiblemente aminoacila : El término "preferiblemente aminoacila" se refiere a una eficiencia, por ejemplo, 70% eficiente, 75% eficiente, 85% eficiente, 90% eficiente, 95% eficiente o 99% o más eficiente, a la cual una O-RS aminoacila un O-tARN con un aminoácido no natural en comparación con la O-RS que aminoacila un tARN que se presenta de manera estable en la naturaleza o un material departir usado para generar el O-tARN. El aminoácido no natural es incorporado a una cadena de polipéptido creciente con alta fidelidad, por ejemplo, a más de 75% de eficiencia para un codón selector dado, a una eficiencia mayor de aproximadamente 80% para un codón selector dado, a más de aproximadamente 90% de eficiencia para un codón selector dado, a más de aproximadamente 95% de eficiencia para un codón selector dado o a más de aproximadamente 99% o más de eficiencia para un codón selector dado. Codón selector: El término "codón selector" se refiere a condones reconocidos por el O-tARN en el proceso de traducción y no reconocidos por un tARN endógeno. El bucle de anticodón de O-tARN reconoce el codón selector en el mRNA e incorpora su aminoácido, por ejemplo, un aminoácido no natural, en este sitio en el polipéptido. Codones selectores pueden incluir, por ejemplo, codones sin sentido, tales como codones de retención, por ejemplo, codones ámbar, ocre y ópalo; codones de cuatro o más bases; codones raros; codones derivados a partir de pares base naturales o no naturales y/o los semejantes. tARN supresor: Un tARN supresor es un tARN que altera la lectura de un ARN mensajero (mRNA) en un sistema de traducción dado, por ejemplo, al proporcionar un mecanismo para incorporar un aminoácido a una cadena de polipéptidos en respuesta a un codón selector. Por ejemplo, un tARN supresor puede leer a través de, por ejemplo, un codón de retención, un codón de cuatro bases, un codón raro y/o los semejantes. tARN reciclable: El término "tARN reciclable" se refiere a un tARN que es aminoacilado y puede ser reaminoacilado repetidamente con un aminoácido (por ejemplo, un aminoácido no natural) para la incorporación del aminoácido (por ejemplo, el aminoácido no natural) a una o más cadenas de polipéptido durante la traducción. Sistema de traducción: El término "sistema de traducción" se refiere al conjunto colectivo de componentes que incorporan un aminoácido que se presenta de manera estable en la naturaleza a una cadena de polipéptidos (proteina) creciente. Componentes de un sistema de traducción pueden incluir, por ejemplo, ribosomas, tARN, sintetasas, mRNA, aminoácidos y los semejantes. Los componentes de la invención (por ejemplo, ORS, OtRNA, aminoácidos no naturales, etc.) pueden ser agregados a un sistema de traducción in vitro o in vivo, por ejemplo, una célula eucarióntica, por ejemplo, una célula de levadura, una célula de mamífero, una célula de planta, una célula de alga, una célula de hongo, una célula de insecto y/o los semejantes. Aminoácido no natural: Como se usa en la presente, el término "aminoácido no natural" se refiere a cualquier aminoácido, aminoácido modificado y/o análogo de aminoácido que no es uno de los 20 aminoácidos que se presentan de manera estable en la naturaleza, seleno, cisteína o pirrolisina . Derivado de: Como se usa en la presente, el término "derivado de" se refiere a un componente que es aislado de o fabricado utilizando información de una molécula u organismo especificado . RS inactiva: Como se usa en la presente, el término "RS inactiva" se refiere a una sintetasa, que ha sido mutada de tal manera que ya no puede aminoacilar su tARN congnato natural con un aminoácido. Marcador de selección o filtración positivo : Como se usa en la presente, el término "marcador de selección o filtración positivo" se refiere a un marcador cuando está presente, por ejemplo, expresado, activado o los semejantes, da como resultado la identificación de una célula con el marcador de selección positivo de aquellos sin el marcador de selección positivo. Marcador de selección o filtración negativo: Como se usa en la presente, el término "marcador de selección o filtración negativo" se refiere a un marcador que cuanto está presente, por ejemplo, expresado, activado los semejantes, permite al identificación de una célula que no posee la propiedad deseada (por ejemplo, en comparación con una célula que posee la propiedad deseada) . Reportero : Como se usa en la presente, el término "reportero" se refiere a un componente que puede ser usado para seleccionar componentes objetivo de un sistema de interés. Por ejemplo, un reportero puede incluir un marcador de filtración fluorescente (por ejemplo, proteina fluorescente verde) , un marcador luminiscente (por ejemplo, una proteina de luciferaza de luciérnaga) , un marcador de filtración a base de afinidad o genes marcadores seleccionables tales como his3, ura3, leu2, lys2, lacZ, ß-gal/lacZ (ß-galactosidasa) , Adh (alcohol dehidrogenasa) o los semej antes . Eucarionte : Como se usa en la presente, el término "eucarionte" se refiere a organismos pertenecientes al dominio filogenético Eucarya tales como animales (por ejemplo, mamíferos, insectos, reptiles, aves, etc.), ciliados, plantas (por ejemplo, monocotiledóneas, dicotiledóneas, algas, etc.), hongos, levaduras, flagelados, microsporidia, protistas, etc. No eucarionte: Como se usa en la presente, el término "no eucarionte" se refiere a organismos no eucariónticos . Por ejemplo, un organismo no eucarióntico puede pertenecer al dominio filogenético de Eubacteria (por ejemplo, Escherichia coli, Thermus thennophilus, Bacillus stearothermophilus, etc.) o el dominio filogenético de Archaea (por ejemplo, Methanococcus jannaschii, Methanobacterium thermoautotrophicum, Halobacterlum tal como especie Haloferax volcanii y Halobacterlum NRC-1, Archaeoglobus fulgldus, Pyrococcus furiosusr Pyrococcus horikoshíí, Aeuropyrum pemix, etc.). Anticuerpo : El término "anticuerpo, como se usa en la presente, incluye, pero no está limitado a, un polipéptido codificado sustancialmente por el gen de inmunoglobulina o genes de inmunoglobulina o fragmentos de los mismos, los cuales se enlazan específicamente y reconocen un analito (antígeno) . Ejemplos incluyen anticuerpos policlonales , monoclonales, quiméricos y de una sola cadena y los semejantes. Fragmentos de inmunoglobulinas , en los que se incluyen fragmentos Fab y fragmentos producidos mediante una biblioteca de expresión, en los que se incluyen exhibición de fago, también están incluidos en el término "anticuerpo" como se usa en la presente. Véase, por ejemplo, Paul, Fundamental iTOiaunology, 4- Edición, 1999, Raven Press, Nueva York, para la estructura y terminología de anticuerpos. Variante conservadora: El término "variante conservadora" se refiere a un componente de traducción, por ejemplo, un O-tARN variante conservador o una O-RS variante conservadora que funciona de manera funcional como el componente del cual la variante conservadora está basada, por ejemplo, un O-tARN o O-RS, pero tiene variaciones en la secuencia. Por ejemplo, una O-RS aminoacilará un O-tARN complementario o un O-tARN variante conservador con un aminoácido no natural, aunque el O-tARN y el O-tARN variante conservador no tienen la misma secuencia. La variante conservadora puede tener, por ejemplo, una variación, dos variaciones, tres variaciones, cuatro variaciones o cinco o más variaciones en secuencia, en tanto que la variante conservadora sea complementaria con el O-tARN o O-RS correspondientes . Agente de selección o filtración: Como se usa en la presente, el término "agente de selección o filtración" se refiere a un agente que, cuando está presente, permite la selección/filtración de ciertos componentes de una población. Por ejemplo, un agente de selección o filtración incluye, pero no está limitado a, por ejemplo, un nutriente, un antibiótico, una longitud de onda de luz, un anticuerpo, un polinucleótidos expresado (por ejemplo, una proteina moduladora transcripcional) o los semejantes. El agente de selección se puede hacer variar, por ejemplo, por concentración, intensidad, etc.
Sustancia detectable: El término "sustancia detectable", como se usa en la presente, se refiere a un agente que, cuando activado, alterado, expresado o los semejantes, permite la selección/filtración de ciertos de componentes de una población. Por ejemplo, la sustancia detectable puede ser un agente químico, por ejemplo, ácido 5-fluroorótico (5-FOA), el cual bajo ciertas condiciones, por ejemplo, expresión de un reportero URA3, se vuelve detectable, por ejemplo, un producto tóxico que extermina células que expresan el reportero URA3.
BREVE DESCRIPCION DE LAS FIGURAS La Figura 1, Paneles A, B y C ilustran esquemáticamente un esquema de selección positivo y negativo general para expandir el código genético de una célula eucarióntica, por ejemplo, S. cerevísiae. El Panel A ilustra esquemáticamente la transcripción activada de genes reporteros, los cuales son impulsados- mediante supresión ámbar de codones TAG en GAL . El dominio de enlace de ADN es indicado por el bloque rayado y los dominios de activación mayores y crípticos son indicados en el bloque cruzado. El Panel B ilustra ejemplos de genes reporteros, por ejemplo, HIS3, LacZ, URA3 en MaV203. El Panel C ilustra esquemáticamente plásmidos que pueden ser usados en el esquema de selección, por ejemplo, pEcTyrRS/tRNAcaA y pGADGAL4xxTAG. La Figura 2 ilustra los fenotipos EcTyrRS y tRNAC0A dependientes de reporteros de GAL4 1- generación sobre medios selectivos. DB-AD es una fusión entre el dominio de enlace GAL4 ADN y el domino de activación. DB-TAG-AD tiene un codón de TAG que reemplaza un codón de tirosina en el enlazador sintético entre DB y AD. ?5 es una versión inactiva de EcTyrRS en el cual 5 residuos en el sitio activo han sido mutados a alanina. La Figura 3, Panel A y B ilustran fenotipos EcTyrRS y tRN coA dependientes de reporteros GAL4 de 2- generación sobre medios selectivos. El dominio de enlaces de ADN es indicado por el bloque rayado y los dominios de activación mayores crípticos con indicados en bloque cruzado. El Panel A ilustra construcciones o constructos cada uno con una sola mutación de aminoácido en GAL4. El Panel B ilustra constructos cada uno con dos mutaciones de aminoácido en GAL4. La Figura 4 Paneles A, B y C ilustran pGADGAL4 (T44TAG, R110TAG) con o sin EcTyrRS y varios reporteros en MaV203. El Panel A muestra los resultados en presencia de X-gal, -Ura o -Leu, -Trp. El Panel B muestra los resultados en presencia de concentraciones variables de 3-AT. El Panel C muestra los resultados en presencia de porcentajes variables de 5-FOA. La Figura 5 Paneles A y B ilustran la hidrólisis de ONPG con varios mutantes de GAL4, por ejemplo, donde los residuos T44 (A) y RUO (B) son sitios permisivos. El Panel A ilustra la medición de hidrólisis de ONPG con varios tipos de mutaciones en el sitio T44. El Panel B ilustra la medición de hidrólisis de ONPG con varios tipos de mutaciones en el sitio RUO. "GAL4" es MaV203 transformado con pCLl y consistía de unidades de hidrólisis fuera de escala ~600 ONPG. 'None' es MaV203 transformado con plásmidos que codifican el GAL4 DB y GAL4 AD separadamente. La Figura 6 muestra la selección de clones EcTyrRS activos. MaV203 contiene una mezcla 1:10 de pEcTyrRS-tRNACoa: pA5-tRNAXCDA fueron depositados a una dilución de 103 sobre placas (-Leu, -Trp) (izquierda) o placas (-Leu, -Trp, -His + 50 mM 3-??) (derecha) y procesadas utilizando un depósito superficial de XGAL. La Figura 7, Paneles A y B. El Panel A ilustra una estereovisión del sitio activo de tirosil-tARN sintetasa de B. Stearothermophilus con tirosina enlazada. Los residuos mutados son mostrados y corresponden a residuos de tirosil-tARN sintetasa Tyr37 (residuo de B. Stearothermophilus TyrRS Tyr34) , Asn12S (Asn123) , Asp182 (Asp176) , Phe183 (Phe177) y Leu185 (Leu180) . El Panel B ilustra las fórmulas estructurales de ejemplos de aminoácidos no naturales (de izquierda a derecha) p-acetil-L-fenilalanina (1), p-benzoil-L-fenilalanina (2), p-azido-L-fenilalanina (3), O-metil-L-tirosina (4) y p-yodo-L-tirosina (5) . La Figura 8, Paneles A, B, C y D. El Panel A ilustra vectores y constructos de reportero que pueden ser usados en la selección/filtración para tARN ortogonales, aminoacil sintetasas ortogonales o pares de tARN ortogonales /RS en células eucariónticas . El Panel B ilustra fenotipos de levadura que contienen reporteros GAL4 HIS3, URA3 lacZ sensibles a GAL4 en respuesta a aminoacil-tARN sintetasas activas (TyrRS) o inactivas (A5RS) sobre medios selectivos. El Panel C ilustra un ejemplo de un esquema de selección usado para seleccionar sintetasas imitantes que codifican aminoácidos adicionales en una célula eucarióntica, por ejemplo, S. cezevisiae, donde UAA es un aminoácido no natural. El Panel D ilustra fenotipos de levadura aislados de una selección con p-acetil-L-fenilalanina . La Figura 9 ilustra la expresión de proteina de dismutasa de superóxido humana (hSOD) (33TAG)HIS en S. cerevisiae codifica genéticamente aminoácidos no naturales como se indica en lá Figura 7, Panel B. La Figura 10, Paneles A-H ilustran el espectro de masas en tándem del péptido tríptico VY*GSIK (SEQ ID NO: 87) que contiene los aminoácidos no naturales (denotados como Y*) como se indica en la Figura 7, Panel B. El Panel A ilustra el espectro de masa en tándem del péptido tríptico con el aminoácido no natural p-acetil-L-fenilalanina (1) . El Panel B ilustra el espectro de masas en tándem del péptido tríptico con el aminoácido no natural p-benzoil-L-fenilalanina (2) . El Panel C ilustra el espectro de masas en tándem del péptido tríptico con el aminoácido no natural p-azido-L-fenilalanina (3) . El Panel D ilustra el espectro de masas en tándem del péptido tríptico con el aminoácido no natural O-metil-L-tirosina (4) . El Panel E ilustra el espectro de masas en tándem del péptido tríptico con el aminoácido no natural p-yodo-L-tirosina (5) . El Panel F ilustra el espectro de masas en tándem del péptido tríptico con el aminoácido triptófano (W) en la posición Y*. El Panel G ilustra el espectro de masas en tándem del péptido tríptico con el aminoácido tirosina (Y) en la posición Y* . El Panel H ilustra el espectro de masas en tándem del péptido tríptico con el aminoácido leucina (L) en la posición Y*. La Figura 11 ilustra ejemplos de dos aminoácidos no naturales (1) para- propargiloxiofenilalanina y (2) para-azidofenilalanina . La Figura 12, Paneles A, B y C ilustran la expresión de SOD en presencia o ausencia de aminoácidos no naturales 1 y 2 indicados en la Figura 11. El Panel A ilustra el experimento de teñido Gelcode Blue . El Panel B ilustra bandas de proteína con un anticuerpo anti-SOD. El Panel C ilustra bandas de proteina con anticuerpo anti-6xHis. La Figura 13, Paneles A, B y C ilustran el marcado de proteínas mediante [3+2] cicloadición. El Panel A ilustra etiquetas de tinte sintetizadas 3-6. El Panel B ilustra la reacción entre el SOD y el tinte. El Panel C ilustra el barrido de fluorescencia en gel y teñido Gelcode Blue. La Figura 14 ilustra el crecimiento de células eucariónticas, por ejemplo, células S. cerevisiae, transformadas con mutantes de sintetasa en ausencia o presencia de 1 o 2 como se indica en la Figura 11 sobre medios SD que carecen de uracilo. La Figura 15, Paneles A y B, ilustran el espectro de masas en tándem péptido tríptico VY*GSIK (SEQ ID NO: 87) que contiene los aminoácidos no naturales de azida (Az) (Panel A) o alquino (Al) (Panel B) en posición Y* son mostrados con sus masas iónicas de fragmento esperadas. La flecha indica la serie de iones b (azul) e y (rojo) observados para cada péptido. La Figura 16 ilustra esquemáticamente la incorporación in vivo de un aminoácido no natural, por ejemplo, para-propargiloxiofenilalanina, a una cadena de polipéptido creciente y la bioconjugación con moléculas orgánicas pequeñas mediante una reacción de [3+2] -cicloadición por medio de este aminoácido no natural. La Figura 17, Paneles A, B y C ilustran la PEGilación de una proteína que comprende un aminoácido no natural utilizando una [3+2] cicloadición. El Panel A ilustra la reacción de una propargil amida PEG con una proteína que comprende un aminoácido de azido (por ejemplo, N3-SOD) en presencia de Cu(I) y solución reguladora del pH (PB) . El Panel B ilustra la PEGilación de la proteína mediante análisis de gel. El Panel C ilustra la síntesis de una propargil amida PEG.
DESCRIPCION DETALLADA La capacidad de modificar genéticamente las estructuras de proteína directamente en células eucariónticas, más allá de las restricciones químicas impuestas por el código genético, proporcionaría una herramienta molecular poderosa tanto para probar y manipular procesos celulares. La invención proporcionar componentes de traducción que expanden el número de aminoácidos codificados genéticamente en células eucariónticas. Estos incluyen tARN (por ejemplo, tARN ortogonales (0-tARN) ) , aminoacil-tARN sintetasas (por ejemplo, sintetasa ortogonal (O-RS)), pares de O-tARN/O-RSs y aminoácidos no naturales . Comúnmente, los 0-tARN de la invención son expresados y procesados eficientemente y funcionan en la traducción en una célula eucarióntica, pero no son aminoacilados significativamente por las aminoacil-tARN sintetasas huéspedes. En respuesta a un codón selector, un 0-tARN de la invención proporciona un aminoácido no natural, el cual no codifica ninguno de los veinte aminoácidos comunes, a una cadena de polipéptido creciente durante la traducción de mRNA. Una 0-RS de la invención aminoacila preferiblemente un O-tARN de la invención con un aminoácido no natural en una célula eucarióntica, pero no aminoacila ninguno de los tARN del huésped citoplásmicos . Además, la especificidad de una aminoacil-tARN sintetasa de la invención proporciona aceptación de un aminoácido no natural en tanto que excluye cualesquier aminoácidos endógenos. Los polipéptidos que incluyen secuencias de aminoácido de 0-RSs ejemplares o porciones de la misma, son también un aspecto de la invención. Además, polinucleótidos que codifican componentes de traducción, O-tARN, 0-RSs y porciones délos mismos, son aspectos de la invención. La invención también proporciona métodos para producir los componentes de traducción deseados, por ejemplo, O-RS y/o un par ortogonal (tARN ortogonal y aminoacil-tARN sintetasa ortogonal) , que utiliza un aminoácido no natural para uso en una célula eucarióntica (y componentes de traducción producidos mediante tales métodos) . Por ejemplo, un par de tirosil-tARN sintetasa/tRNACuA de E. coli es un para de 0-tARN/O-RS de la invención. Además, la invención también comprende métodos para seleccionar/filtrar componentes de traducción en una célula eucarióntica y una vez seleccionado/filtrado utilizar aquellos componentes en una célula eucarióntica diferente (una célula eucarióntica que no fue usada para selección/filtración) . Por ejemplo, los. métodos de selección/filtración para producir los componentes de traducción para células eucariónticas se puede hacer en levadura, por ejemplo, Saccharomyces cerevisiae y luego aquellos componentes seleccionados pueden ser usados en otra célula eucarióntica, por ejemplo otra célula de levadura, una célula de mamífero, una célula de insecto, una célula de planta, una célula de hongo, etc. La invención proporciona además métodos para producir una proteína en una célula eucarióntica, en donde la proteína comprende un aminoácido no natural. La proteína es producida utilizando los componentes de traducción de la invención. La invención también proporciona proteínas (y proteínas producida mediante los métodos de la invención) , las cuales incluyen aminoácidos no naturales . La proteína o polipéptido de interés puede también incluir una modificación post-traducción, por ejemplo, que es agregada por medios de una [3+2] cicloadición o una reacción nuclefílica-electrofílica, que no se hacen mediante una célula célula procarióntica, etc. En ciertas modalidades, también se incluyen métodos para producir una proteína moduladora transcripcional con un aminoácido no natural (y proteínas producidas mediante tales métodos) en la invención. Las composiciones, las cuales incluyen proteínas que incluyen un aminoácido no natural son también un aspecto de la invención. Equipos para producir una proteína o polipéptido con un aminoácido no natural también son un aspecto de la invención .
AMINOACIL-rRNA SINTETASAS ORTOGONALES (O-RS) Con el fin de incorporar específicamente un aminoácido no natural a una proteína o polipéptido de interés en una célula eucarióntica, la especificidad del substrato de la sintetasa es alterada de tal manera que solamente el aminoácido no natural deseado, pero ninguno de los veinte aminoácidos comunes son cargados al tARN. Si la sintetasa ortogonal es promiscua, dará como resultado proteínas imitantes con una mezcla de aminoácidos naturales y no naturales en la posición objetivo. La invención proporciona composiciones de y métodos para producir aminoacil-tARN sintetasas ortogonales que tienen especificidades de substrato modificada para un aminoácido no natural específico. Una célula eucarióntica que incluye una aminoacil-tARN sintetasa ortogonal (O-RS) es un aspecto de la invención. La O-RS aminoacila preferiblemente un tARN ortogonal (O-tARN) con un aminoácido no natural en la célula eucarióntica . En ciertas modalidades, la O-RS utiliza más de un aminoácido no natural, por ejemplo, dos o más, tres o más, etc. Asi, una O-RS de la invención puede tener la capacidad de aminoacilar preferiblemente un O-tARN con diferentes aminoácidos no naturales . Esto permite un nivel adicional de control al seleccionar cual aminoácido no natural o combinación de aminoácidos no naturales son puestos con la célula y/o seleccionar las diferentes cantidades de aminoácidos no naturales que son puestos con la célula par.a su incorporación. Una O-RS de la invención tiene opcionalmente una o más propiedades enzimáticas mejoradas o realzadas para el aminoácido no natural en comparación con un aminoácido natural. Estas propiedades incluyen, por ejemplo, una Km más alta, una Km más baja, una kcat más alta, una kcat más baja, una kcat/km más baja, una kcat/km más alta,, etc., para el aminoácido no natural, en comparación con un aminoácido que se presenta de manera estable en la naturaleza, por ejemplo, uno de los 20 aminoácidos comunes conocidos. Opcionalmente, la O-RS puede ser provista a la célula eucarióntica mediante un polipéptido que incluye una O-RS y/o mediante un polinucleótido que codifica una O-RS o una porción de la misma. Por ejemplo, una O-RS o una porción de la misma, es codificada por una secuencia de polinucleótidos como se resume en cualquiera de las SEQ ID NO. : 3-35 (por ejemplo, 3-19, 20-35 o cualquier otro subconjunto de secuencias 3-35), o una secuencia de polinucleótidos complementaria de la misma. En otro ejemplo, una O-RS comprende una secuencia de aminoácidos como se resume en cualquiera de SEQ ID NO. : 36-63 (por ejemplo, 36-47, 48-63 o cualquier otro subconjunto de 36-63) y/o 86 o una variación conservadora de la misma. Véase, por ejemplo, Tablas 5, 6 y 8 y Ejemplo 6 en la presente para secuencias de moléculas de O-RS ejemplares. Una O-RS puede también comprender una secuencia de aminoácidos que es, por ejemplo, por lo menos 90%, por lo menos 95%, por lo menos 98%, por lo menos 99% o aún por lo menos 99.5% idéntica a aquella de una tirosil aminoacil-tARN sintetasa (TyrRS) que se presenta de manera estable en la naturaleza (por ejemplo, como se resume en la SEQ ID NO.: 2) y comprende dos o más aminoácidos del grupo A-E. El A incluye va-lina, isoleucina, leucina, glicina, serina, alanina o treonina en una posición correspondiente a Tyr37 de tris de E. coli; el grupo B incluye aspartato en una posición correspondiente a Asnl26 de TyrRS de E. coli; el grupo C incluye treonina, serina, arginina, asparagina o glicina en una posición correspondiente a Asp de TyrRS de E. coli; el grupo D incluye metionina, alanina, valina o tirosina en una posición correspondiente a Phel83 de TyrRS de E. coli; y el grupo E incluye serina, metionina, valina, cisteinar treonina o alanina en una posición correspondiente a Leul86 de TyrRS de E. coli. Cualquier subconjunto de combinaciones de estos grupos son un aspecto de la invención. Por ejemplo, una modalidad, la O-RS tiene dos o más aminoácidos seleccionados de valina, isoleucina, leucina o treonina ocurre en una posición correspondiente a Tyr37 de TyrRS de E. coli; treonina, serina, arginina o glicina en una posición correspondiente a Aspl82 de TyrRS de E. coli; metionina o tirosina en una posición correspondiente a Phel83 de TyrRS de E. coli; y, serina o alanina en una posición correspondiente a Leul86 de TyrRS de E. coli. En otra modalidad, la O-RS incluya dos o más aminoácidos seleccionados de glicina, serina o alanina en una posición correspondiente a Tyr37 de TyrRS de E. coli, aspartato en una posición correspondiente a Asnl26 de TyrRS de E. coli, asparagina en una posición correspondiente a Aspl82 de TyrRS de E. coli, alanina o valina, en una posición correspondiente a Phel83 de TyrRS de E. coli, y/o metionina, valina, cisterna o treonina, en una posición correspondiente a Leul86 de TyrRS de E. coli. Véase también, por ejemplo, Tabla 4, Tabla 6 y Tabla 8, en la presente . Además de la O-RS, una célula eucarióntica de la invención puede incluir componentes adicionales, por ejemplo, un(os) aminoácido (s) no natural(es). La célula eucarióntica también incluye un tARN ortogonal (O-tARN) (por ejemplo, derivado de un organismo no eucariótico, tal como Escherichia coli, Bacillus stearothermophilus y/o los semejantes), donde el O-tARN reconoce un codón selector y es preferiblemente aminoacilado con el aminoácido no natural mediante la O-RS. ün ácido nucleico que comprende un polinucleótido que codifica un polipéptido de interés, en donde el polinucleótido comprende un codón selector que es reconocido por el O-tARN o una combinación de uno o más de estos, puede también estar presente en la célula. En un aspecto, el O-tARN modera la incorporación del aminoácido no natural en una proteina con, por ejemplo, por lo menos 45%, por lo menos 50%, por lo menos 60%, por lo menos 75%, por lo menos 80%, por lo menos 90%, por lo menos 95% o 99% de la eficiencia de un tARN que comprende o es procesado de una secuencia de polinucleótidos como se resume en SEQ ID NO.: 65. En otro aspecto, el O-tARN comprende SEQ ID NO. : 65 y la O-RS comprende una secuencia de polipéptidos resumida en cualquiera de SEQ ID NO. : 36-63 (por ejemplo, 36-47, 48-63 o cualquier otro subconjunto de 36-63), y/o 86 y/o una variación conservadora de la misma. Véase también, por ejemplo, Tabla 5 y Ejemplo 6, en la presente, para secuencias de moléculas de O-RS y O-tARN ejemplares. En un ejemplo, una célula eucarióntica comprende una aminoacil-tARN sintetasa ortogonal (O-RS) , un tARN ortogonal (O-tARN) , un aminoácido no natural y un ácido nucleico que comprende un polinucleótido gue codifica un polipéptido de interés, tal polinucleótido comprende un codón selector que es reconocido por el O-tARN. La O-RS aminoacila preferiblemente el tARN ortogonal (O-tARN) con el aminoácido no natural en la célula eucarióntica y la células produce el polipéptido de interés en ausencia del aminoácido no natural con un rendimiento que es, por ejemplo, menor que 30%, menor que 20%, menor que 15%, menor que 10%, menor que 5%, menor que 2.5%, etc., del rendimiento del polipéptido en presencia del aminoácido no natural . Métodos para producir una O-RS, que son un aspecto de la invención, incluyen opcionalmente generar un cúmulo de sintetasas mutantes a partir de la estructura de una sintetasa libre o silvestre y luego seleccionar RSs mutadas en base a su especificidad para un aminoácido no natural en relación con los veinte aminoácidos comunes. Para aislar tal sintetasa, los métodos de selección son: (i) sensible, ya que la actividad de sintetasas deseadas de las rondas iniciales pueden ser bajas y la población pequeña; (ii) "ajustable", puesto que es deseable hacer variar la astringencia de selección en diferentes rondas de selección y (iii) general, de tal manera que los métodos pueden ser usados para diferentes aminoácidos no naturales. Los métodos para producir una aminoacil-tARN sintetasa ortogonal (O-RS) que preferiblemente aminoacila un tARN ortogonal con un aminoácido no natural en una célula eucarióntica incluyen comúnmente aplicar una combinación de una selección positiva seguida por una selección negativa. En la selección positiva, la supresión del codón selector introducido en posición (es) no esencial (es) de un marcador positivo permite que las células eucariónticas sobrevivan bajo presión de selección positiva. En presencia de aminoácidos no naturales, los sobrevivientes codifican asi las sintetasas activas cargando el tARN supresor ortogonal con un aminoácido no natural. En la selección negativa la presión de un codón selector inducido en posición (es) no esencial (es) de un marcador negativo elimina las sintetasas con especificidades de aminoácido natural. Los sobrevivientes de la selección negativa y positiva codifican sintetasas que aminoacilan (cargan) el tARN supresor Ortogonal tARN supresor ortogonal con aminoácidos no naturales solamente (o por lo menos preferiblemente) . Por ejemplo, el método incluye: (a) someter a selección positiva, en presencia de un aminoácido no natural, una población de células eucariónticas de una primera especies, donde cada una de las células eucariónticas comprenden: i) un miembro de una biblioteca de aminoacil-tARN sintetasas (RSs) , ii) un tARN ortogonal (O-tARN) , iii) un polinucleótido que codifica un marcador de selección positivo y iv) un polinucleótido que codifica un marcador de selección negativo; en donde las células que sobreviven la selección positiva comprenden una RS activa que aminoacila el tARN ortogonal (O-tARN) en presencia de un aminoácido no natural; y (b) someter a las células que sobreviven la selección positiva a selección negativa en ausencia del aminoácido no natural para eliminar RSs activas que aminoacilan el O-tARN con un aminoácido natural, proporcionando mediante esto la 0-RS que preferiblemente aminoacila el O-tARN con el aminoácido no natural. El marcador de selección positivo puede ser cualquiera de una variedad de moléculas. En una modalidad, el marcador de selección positivo es un producto que proporciona un complemento nutricional para el crecimiento y la selección se lleva a cabo sobre un medio que carece de complemento nutricional. Ejemplos de polinucleótidos que codifican marcadores de selección positivos incluyen, pero no están limitados a, por ejemplo, un gen reportero basado en complementar la auxotrofia de aminoácido de una célula, un gen is3 (por ejemplo, donde el gen his3 codifica una imidazol glicerol fosfato deshidratasa, detectada al proporcionar 3-aminotriazol (3-??) ) , gen ura3, gen leu2, gen lys2, gen lacZ, gen adh, etc. Véase, por ejemplo, G. M. Kishore, & D. M. Shah, (1988), Amino acid biosynthesis inhlbitors as herblcides, Annual Review of Biochemistry 57:627-663. En una modalidad, la producción de lacZ es detectada mediante hidrólisis de orto-nitrofenil-p-D-galactopiranosuro (ONPG) . Véase, por ejemplo, I. G. Serebriiskii, & E. A. Golemis, (2000), Uses of lacZ to study gene function: evaluatlon of beta-galactosldase assays employed in the yeast two-hybrid system, Analytical Biochemistry 285:1-15. Marcadores de selección positivos adicionales incluyen, por ejemplo, luciferasa, proteina fluorescente verde (GFP) , YFP, EGFP, RFP, el producto de un gen resistente a antibióticos (por ejemplo, cloramfenicol acetiltransferasa (CAT) ) , una proteina moduladora transcripcional (por ejemplo, GAL4), etc. Opcionalmente, un polinucleótido que codifica un marcador de selección positivo comprende un codón selector. Un polinucleótido que codifica el marcador de selección positivo puede ser enlazado operativamente a un elemento de respuesta. Un polinucleótido adicional que codifica una proteina moduladora transcripcional que modula la transcripción del elemento de respuesta y comprende por lo menos un codón selector, puede también estar presente. La incorporación del aminoácido no natural a la proteina moduladora transcripcional mediante el O-tARN aminoacilado con el aminoácido no natural da como resultado la transcripción del polinucleótido (por ejemplo, gen reportero) que codifica el marcador de selección positivo. Por ejemplo, véase la Figura 1A. Opcionalmente, el codón selector está localizado en o sustancialmente cerca de una porción del polinucleótido que codifica un dominio de enlace de ADN de la proteina moduladora transcripcional. Un polinucleótido que codifica el marcador de selección negativo puede también estar enlazado operativamente a un elemento de respuesta del cual la transcripción es moderada mediante la proteina moduladora transcripcional. Véase, por ejemplo, A. J. DeMaggio y colaboradores, (2000) , The yeast split-hybrid system, ethod Enzymol. 328:128-137; H. M. Shih y colaboradores, (1996), A positive genetic selection for disrupting protein-protein interactions: Identification of CREE mutations that prevent association with the coactivator CBP, Proc. Nati. Acad. Sci. E. U. A. 93:13896-13901; M. Vidal y colaboradores, (1996), Genetic characterization of un mamíferoian proteína-proteína interaction domain by using una levadura reverse two-laybrid system. [comment] , Proc. Nati. Acad. Sci. E. ü. A. 93:10321-10326; y M. Vidal y colaboradores, (1996), .Reverse two-hybrid and One-hybrid systems to detect dissociation of protein-protein and ADN-protein interactions . [comment] , Proc. Nati. Acad. Sci. E. ü. A. 93:10315-10320. La incorporación de un aminoácido natural a la proteina moduladora transcripcional mediante el O-tARN aminoacilado con un aminoácido natural da como resultado la transcripción del marcador de selección negativo. Opcionalmente, el marcador de selección negativo comprende un codón selector. En una modalidad, el marcador de selección positivo y/o marcador de selección negativo de la invención puede comprender por lo menos dos codones selectores, cada uno o ambos pueden comprende por lo menos dos codones selectores diferentes o por lo menos dos de los mismos codones selectores. La proteina moduladora transcripcional es una molécula que se enlaza (directa o indirectamente) a una secuencia de ácido nucleico (por ejemplo, un elemento de respuesta) y modula la transcripción de una secuencia está enlazada operativamente al elemento de respuesta. Una proteina moduladora transcripcional puede ser una proteina activadora transcripcional (por ejemplo, GAL4, receptores de hormona nuclear, API, CREB, LEF/tcf miembros de familia, SMADs, VP16, SPl, etc.), una proteina represora transcripcional (por ejemplo, receptores de hormona nucleares, la familiar Groucho/tle, familia Engrailed, etc) , o una proteina que puede tener ambas actividades dependiendo del ambiente (por ejemplo, LEF/tcf, proteínas de caja homiótica, etc.). Un elemento de respuesta es comúnmente una secuencia de ácido nucleico que es reconocida por la proteína moduladora transcripcional o un agente adicional que actúa en concierto con la proteína moduladora transcripcional. Otro ejemplos de otra proteína moduladora transcripcional es la proteína activadora transcripcional, GAL4 {véase por ejemplo, Figura 1A) . Véase, por ejemplo, A. Laughon y colaboradores, (1984), Identification of two proteins encoded by the Saccharomyces cerevisiae GAL4 gene, Molecular & Cellular Biology 4:268-275; A. Laughon, & R. F. Gesteland, (1984) , Primary structure of the Saccharomyces cerevisiae GA 4 gene, Molecular & Cellular Biology 4:260-267; L. Keegan y colaboradores, (1986), Separation of ADN binding fro the transcription-activating function of a eukaryotic regulatory protein, Science 231:699-704; y M. Ptashne, (1988), How eukaryotic transcriptional activators work, Nature 335:683-689. Los 147 aminoácidos N-terminales de esta proteína de 881 aminoácidos forman un dominio de enlace de ADN (DBD) que enlaza la secuencia de ADN específicamente. Véase, por ejemplo, M. Carey y colaboradores, (1989), An amino-terminal fragment of GAL4 binds ADN as a dimer, J. Mol. Biol . 209:423-432; y E. Giniger y colaboradores, (1985), Specific ADN binding of GAL , a positive regulatory protein of yeast, Cell 40:767-774. El DBD es enlazado, mediante una secuencia de proteína intermedia, a un dominio de activación de 113 aminoácidos C-terminal (AD) que puede activar la transcripción cuando es enlazado al ADN. Véase, por ejemplo, J. Ma, & M. Ptashne, (1987), Deletion analysis of GA 4 defines two transcriptional activating segments, Cell 48:847-853: y J. Ma, & M. Ptashne, (1987), The carboxy-terminal 30 amino acids of GAL4 are recognized by GAL80, Cell 50:137-142. El colocar codones ámbar hacia, por ejemplo, el DBD N-terminal de un solo polipéptido que contiene el DBD N-terminal de GAL4 y su Ad C-terminal, la supresión ámbar mediante el par O-tARN/O-RS de ser enlazada a la activación transcripcional mediante GAL4 (Figura 1, Panel A) . Genes reporteros activados por GAL4 pueden ser usados para llevar a cabo tanto selecciones positivas como negativas con el gen (Figura 1, Panel B) . El medio usado para la selección negativa puede comprender un agente de selección o filtración que es convertido a una sustancia detectable por el marcador de selección negativo. En un aspecto de la invención, la sustancia detectable es una sustancia tóxica. Un polinucleótido que codifica un marcador de selección negativo puede ser, por ejemplo, un gen ura3. Por ejemplo, el reportero URA3 puede ser colocado bajo el control de un promotor que contiene sitios de enlace de ADN GAL4. Cuando el marcador de selección negativo es producido, por ejemplo, mediante traducción de un polinucleótido que codifica el GAL4 con codones selectores, el GAL4 activa la transcripción de URA3. La selección negativa se lleva a cabo sobre un medio que comprende ácido 5-fluoroorótico (5-FOA) , el cual es convertido a una sustancia detectable (por ejemplo, una sustancia tóxica que extermina la célula) mediante el producto de gen del gen ura3. Véase, por ejemplo, J. D. Boeke y colaboradores, (1984) , A positive selection for mutants lacking orotidine-5r -phosphate decarboxylase activlty in yeast: 5~fluoroorotic acid reslstance, Molecular & General Genetics 197:345-346); M. Vidal y colaboradores, (1996), Genetic characterization of a mammmalian protein-protein interaction domain by using a yeast reverse two-hybrid system. [comment] , Proc. Nati. Acad. Sci. E. U. A. 93:10321-10326; y M. Vidal y colaboradores, (1996) , Reverse two-hybrid and one-hybrid systems to detect dissociation of protein-protein and ADN-proteira interactions. [comment] , Proc. Nati. Acad. Sci. E. D. A. 93:10315-10320. Véase también, Figura 8C. Como con el marcador de selección positivo, el marcador de selección negativo también puede ser cualquiera de una variedad de moléculas. En una modalidad, el marcador de selección positivo y/o el marcador de selección negativo es un polipéptido que fluoresce o cataliza una reacción luminiscente en presencia de un reactivo apropiado. Por ejemplo, marcadores de selección negativos incluyen, pero no están limitados a, por ejemplo, luciferasa, proteina fluorescente verde (GFP) , YFP, EGFP, RFP, el producto de un gen resistente a un antibiótico (por ejemplo, cloramfenicol acetiltransferasa (CAT) ) , el producto de un gen lacZ, proteina moduladora transcripcional, etc. En un aspecto de la invención, el marcador de selección positivo y/o el marcador de selección negativo es detectado mediante clasificación de células activada por fluorescencia (FACS) o mediante luminiscencia. En otro ejemplo, el marcador de selección positivo y/o marcador de selección negativo comprenden un marcador de selección a base de afinidad. El mismo polinucleótido puede codificar tanto el marcador de selección positivo como el marcador de selección negativo. Los niveles adicionales severidad de selección/clasificación pueden ser usados en los métodos de la invención. La severidad de selección o filtración se puede hacer variar en una o ambas etapas del método para producir una O-RS. Esto podría incluir, por ejemplo, hacer variar la cantidad de elemento de respuesta en un polinucleótido que codifica el marcador de selección positivo y/o negativo, agregar una cantidad variable de una sintetasa inactiva a una o ambas de las etapas, hacer variar la cantidad de agente de selección/filtración que es utilizado, etc. También se pueden llevar a cabo rondas adicionales de selecciones positiva y/o negativas . La selección o filtración puede también comprender una o más selecciones o filtraciones positivas o negativas que incluyen, por ejemplo, un cambio en permeabilidad de aminoácido, un cambio en eficiencia de traducción, un cambio en fidelidad de traducción, etc. Comúnmente, el uno o más cambios está basado en una mutación en uno o más polinucleótidos que comprende o codifican componentes de un par de tARN ortogonal-sintetasa tARN que son usados para producir proteina. Estudios de enriquecimiento modelo pueden también ser usados para seleccionar rápidamente una sintetasa activa de un exceso de sintetasas inactivas. Se pueden hacer estudios de selección de modelo positivo y/o negativo. Por ejemplo, células eucariónticas que comprenden aminoacil-tARN sintetasas activas potenciales son mezcladas con un exceso de múltiples veces variable de aminoaciyl-tARN sintetasas inactivas. Se hace comparación entre células cultivas en medios no selectivos y son analizadas mediante, por ejemplo deposición superficial X-GAL, y aquellas cultivadas y actas sobrevivir en medios selectivos (por ejemplo, en ausencia de histidina y/o uracilo) y analizadas por ejemplo mediante un análisis de X-GAL. Para selección de modelo negativo, aminoacil-tARN sintetasas activas potenciales son mezcladas con un exceso variable varias veces de aminoacil-tARN sintetasas inactivas y se lleva a cabo la selección con una sustancia de selección negativa, por ejemplo, 5-FOA. Comúnmente, la biblioteca de RSs (por ejemplo, una • biblioteca de RSs imitantes) comprende RSs derivadas de por lo menos una aminoacil-tARN sintetasa (RS), por ejemplo, de un organismo no eucariótico. En una modalidad, la biblioteca de RSs es derivada de una RS inactiva, por ejemplo, donde la RS inactiva es generada mediante mutación de RS activa, por ejemplo, en el sitio activo en la sintetasa, en el sitio de mecanismo de edición en la sintetasa, en diferentes sitios al combinar diferentes dominios de sintetasas o los semejantes. Por ejemplo, residuos en el sitio activo de la RS son mutados a, por ejemplo, residuos de alanina. El polinucleótido que codifica la RS mutada a alanina es usado como plantilla para mutagenizar los residuos de alanina a todos los 20 aminoácidos. La biblioteca de RSs muíante seleccionada/filtrada para producir la O-RS . En otra modalidad, la RS inactiva comprende una cavidad de enlace de aminoácido y uno o más aminoácidos que comprenden la cavidad de enlace son sustituidos con uno o más aminoácidos diferentes. En un ejemplo, los aminoácidos sustituidos son sustituidos con alaninas. Opcionalmente, el polinucleótido que codifica la RS mutada a alanina es usado como plantilla para mutagenizar los residuos de alanina a todos los 20 aminoácidos y filtrados/seleccionados. El método para producir una O-RS puede incluir además producir la biblioteca de RSs al usar varias técnicas de mutagénesis conocidas en la técnica. Por ejemplo, la RSs mutante puede ser generada mediante mutaciones específicas del sitio, mutaciones de punto aleatorio, recombinación homologa, mezcla de ADN u otros métodos de mutagénesis recursivos, construcción quimérica o cualquier combinación de los mismos. Por ejemplo, una biblioteca de RSs mutantes puede ser producir a partir de dos o más otras, por ejemplo, "sub-bibliotecas" más pequeñas menos diversas. Ona vez que las sintetasas son sometidas a la estrategia de selección/filtración positiva y negativa, estas sintetasas luego pueden ser sometidas a mutagénesis adicional. Por ejemplo, un ácido nucleico que codifica la O-RS puede ser aislado; un conjunto de polinucleótidos que codifican O-RS mutadas (por ejemplo, mediante mutagénesis aleatoria, mutagénesis especifica del sitio, recombinación o cualquier combinación de las mismas) puede ser generado a partir del ácido nucleico; y estas etapas individuales o una combinación de estas etapas pueden ser repetidas hasta que se obtiene una -RS mutada que preferiblemente aminoacila el O-tARN con el aminoácido no natural. En un aspecto de la invención, las etapas se llevan a cabo por lo menos dos veces. Detalles adicionales para producir O-RS se pueden encontrar en O 2002/086075 intitulado " ethods and compositions for the production of ortogonal tARN-aminoacyltRNA synthetase pairs". Véase también, Hamano-Takaku y colaboradores, (2000) A mutant Escherichia coli Tyrosyl-tARN Synthetase ütilizes the ünnatural Amino Acid Azatyrosine More Efficiently than Tyrosine, Journal of Biological Chemistry, 275 (51) : 40324-40328; Kiga y colaboradores, (2002), An engineered Escherichia coli tyrosyl-tARN synthetase for site-specific incorporatlon of an unnatural amíno acid into proteins in eukaryotic translatlon and its application in a wheat gezm cell-f ee system, PNAS 99 (15) : 9715-9723; y Francklyn y colaboradores, (2002), Amlnoacyl-tARN synthetases : Versatile players in the changing theater of translatlon; RN, 8:1363-1372. tARN ORTOGONALES Células eucariónticas que incluyen un tARN ortogonal (O-tARN) son provistas por la invención. El tARN ortogonal modera la incorporación de un aminoácido no natural a una proteína que es codificada por un polinucleótido que comprende un codón selector que es reconocido por el O-tARN, in vivo. En ciertas modalidades, un O-tARN de la invención modera la incorporación de un aminoácido no natural a una proteína con, por ejemplo, por lo menos 40%, por lo menos 45%, por lo menos 50%, por lo menos 60%, por lo menos 75%, por lo menos 80% o aún 90% o más tan eficientemente como tARN que comprende o es procesado en una células a partir de una secuencia de polinucleótidos como se resume en SEQ ID NO.: 65. Véase, Tabla 5, en la presente. Un ejemplo de un O-tARN de la invención es SEQ ID NO.: 65. (Véase Ejemplo 6 y Tabla 5, en la presente). La SEQ ID NO. : 65 es un transcrito de pre-pegado/procesamiento que es proceso opcionalmente en la células, por ejemplo, utilizando la maquinaria de pegado y procesamiento endógeno de la célula y modificado para formar un O-tARN activo. Comúnmente, una población de tales transcritos pre-pegados forman una población de tARN activos en la células (los tARN activos pueden estar en una o más formas activas) . La invención también incluye variaciones conservadoras del 0-tARN y sus productos celulares procesados. Por ejemplo, variaciones conservadoras de O-tARN incluyen aquellas moléculas que funcionan como el O-tARN de SEQ ID NO. : 65 y mantienen la estructura en forma tARN L, por ejemplo, en forma procesada, pero no tienen la misma secuencia (y son diferentes que las moléculas tARN de tipo libre o silvestre) . Comúnmente, un O-tARN de la invención es un O-tARN reciclable, debido a que el O-tARN puede ser reaminoacilado para moderar otra vez la incorporación del aminoácido no natural a una proteina que es codifica mediante un polinucleótido en respuesta a un codón selector. La transcripción del tARN en eucariotes, pero no en procariontes, se lleva a cabo mediante la ARN Polimerasa III, que coloca restricciones en la secuencia primaria de los genes estructurales del tARN que pueden ser transcritos en células eucariónticas . Además, en células eucariónticas, los tARN necesitan ser exportados del núcleo, donde son transcritos al citoplasma, para funcionar en la traducción. Los ácidos nucleicos que codifican un O-tARN de la invención o un polinucleótido complementario del mismo también son un aspecto de la invención. En un aspecto de la invención, ácido nucleico que codifica un O-tARN de la invención incluye una secuencia de promotor interno, por ejemplo, un bloque A (por ejemplo, TRGCNNAGY) y un bloque B (por ejemplo, GGTTCGANTCC, SEQ ID NO: 88) . El O-tARN de la invención puede también ser modificado post-transcripcionalmente . Por ejemplo, la modificación post-transcripcional de genes de tARN en eucariontes incluye la remoción de las secuencias de flanqueo 5' - y *3' mediante Rnasa P y una 3' -endonucleasa, respectivamente. La adición de una secuencia 3'-CCA es también una modificación post-transcripcional de un gen tARN en eucariontes . En una modalidad, un O-tARN es obtenido al someter a selección negativa una población de células eucariónticas de una primera especie, donde las células eucariónticas comprende un miembro de una biblioteca de tARN. La selección negativa elimina células que comprenden un miembro de la biblioteca de tARN que es aminoacilado mediante una aminoacil-tARN sintetasa (RS) que es endógena a las células eucariónticas . Esto proporciona un cúmulo de tARN que son ortogonales a la célula eucarióntica de la primera especie. Alternativamente, o en combinación con otros métodos descritos anteriormente para incorporar un aminoácido no natural a un polipéptido, se puede usar un sistema de trans-traducción . Este sistema involucra una molécula llamada tmRNA presente en Escherichia col!. Esta molécula de ARN está relacionada estructuralmente con un alanil tARN y es aminoacilada mediante la alanil sintetasa. La diferencia entre tmRNA y tARN es que el'nucle anti-codón es reemplazado con una secuencia grande especial. Esta secuencia permite que el ribosoma reanude la traducción en secuencias que han sido detenidas utilizando un marco de lectura abierto codificado dentro del tmRNA como plantilla. En la invención, un tmRNA ortogonal puede ser generado que es preferiblemente aminoacilado con una sintetasa ortogonal y cargado con un aminoácido no natural. Al transcribir un gen mediante el sistema, el ribosoma se detiene en un sitio especifico; el aminoácido no natural es introducido en aquel sitio y, la traducción reanuda utilizando la secuencia codificada dentro del tmRNA ortogonal . Métodos adicionales para producir tARN ortogonales recombinantes se pueden encontrar, por ejemplo, en las solicitudes de patente internacional WO 2002/086075, intitulada "Methods and compositions for the production of orthogonal tARN-aminoacyltRNA synthetase pairs." Véase también, Forster y colaboradores, (2003) Programming peptidomimetic synthetases by translating genetic codes designed de novo PNAS 100 ( 11 ): 6353-6357 ; y Feng y colaboradores, (2003), Expanding tARN recognition of a tARN synthetase by a single amino acid change, PNAS 100 (10) : 5676-5681.
PARES DE tARN Y AMINOACIL-tARN SINTETASA ORTOGONAL Un par ortogonal está compuesto de O-tARN, por ejemplo, un tARN supresor, un tARN de desplazamiento de cuadro o los simejantes y una O-RS . El O-tARN no es acilado por las sintetasas endógenas y es capaz de moderar la incorporación de un aminoácido no natural a una proteina que es codificada por un polinucleótido que comprende un codón selector que es reconocido por el O-tARN in vivo. La O-RS recose el O-tARN y preferiblemente aminoacila el O-tARN con un aminoácido no natural en una célula eucarióntica . Métodos para producir pares ortogonales junto con pares ortogonal producidos mediante tales métodos y composiciones de pares ortogonales para uso en células eucariónticas están incluidos en la invención. El desarrollo de múltiples pares de tARN ortogonal/sintetasa puede permitir la incorporación simultánea de múltiples aminoácidos no naturales utilizando diferentes codones en una célula eucarióntica. Un par de O-tARN ortogonal/O-RS en una célula eucarióntica puede ser producido al importar un par, por ejemplo, un par supresor sin sentido, a partir de un organismo diferente con aminoacilación de especies cruzadas ineficiente. El O-tARN y O-RS son expresados y procesados eficientemente en la célula eucarióntica y el O-tARN es exportado eficien emente del núcleo al citoplasma. Por ejemplo, uno de tales pares es el par tirosil-tARN sintetasa/tRNACTA de E. coli {véase, por ejemplo, H. M. Goodman y colaboradores, (1968), Nature 217:1019-24; y D. G. Barker y colaboradores, (1982), FEBS Letters 150:419-23). La tirosil-tARN sintetasa de E. coli aminoacila eficientemente su cognato tRNACuA de E. coli cuando ambos son expresados en el citoplasma de S. cerevisiae, pero no aminoacila tARN de S. cerevisiae. Véase, por ejemplo, H. Edwards, & P. Schimmel, (1990) , Molecular & Cellular Biology 10:1633-41; y H. Edwards y colaboradores, (1991), PNAS United States of America 88:1153-6. Además, el tirosil tRNACÜA de E. coli es un substrato deficiente para aminoacil-tARN sintetasas de S. cerevisiae {véase, por ejemplo, V. Trezeguet y colaboradores, (1991) , Molecular & Cellular Biology 11:2744-51), pero funciona eficientemente en la traducción de proteina en S. cerevisiae. Véase, por ejemplo, H. Edwards, & P. Schimmel, (1990) Molecular & Cellular Biology 10:1633-41; H. Edwards y colaboradores, (1991), PNAS United States of America 88:1153-6; y V. Trezeguet y colaboradores, (1991), Molecular & Cellular Biology 11:2744-51. Además, el TyrRS de E. coli no tiene un mecanismo de edición para una lectura de prueba de un aminoácido no natural ligado al tARN. El O-tARN y O-RS pueden estar de manera estables en la naturaleza o pueden ser derivados mediante mutación de un tARN y/o una RS, que se presentan de manera estable en la naturaleza los cuales generan bibliotecas de tARN y/o bibliotecas de RSs, a partir de una variedad de organismos. Véase la sección intitulada "Fuentes y Huéspedes" en la presente. En varias modalidades , el O-tARN y O-RS son derivados de por lo menos un organismo. En otra modalidad, el O-tARN es derivado de un tARN que se presenta de manera estable en la naturaleza o un tARN que se presentan de manera estable en la naturaleza, mutado, de un primer organismo y la O-RS es derivada de una RS que se presenta de manera estable en la naturaleza o una RS que se presenta de manera estable en la naturaleza, mutada de un segundo organismo. En una modalidad, los primeros y segundos organismos no eucarióntico son los mismos. Alternativamente, los primeros y segundos organismos no eucarióntico pueden ser diferentes. Véanse las secciones en la presente intituladas "aminoacyl-tARN sintetasas ortogonales" y "O-tARN" para métodos para producir O-RS y O-tARN. Véase también, la solicitud de patente internacional WO 2002/086075, intitulada " ethods and compositions for the production of orthogonal tARN-aminoacyltRNA" .
FIDELIDAD, EFICIENCIA Y RENDIMIENTO La fidelidad se refiere a la exactitud con la cual una molécula deseada, por ejemplo, un aminoácido no natural o aminoácido, es incorporado a un polipéptido creciente en una posición deseada. Los componentes de traducción de la invención incorporan aminoácidos no naturales, con alta fidelidad, a proteínas en respuesta a un codón selector. Por ejemplo, usando los componentes de la invención, la eficiencia de incorporación de un aminoácido no natural deseado a una cadena de polipéptido creciente en una posición deseada (por ejemplo, en respuesta a un codón selector) es, por ejemplo, mayor de 75%, mayor de 85%, mayor de 95% o aún mayor de 99% o más tan eficiente en comparación con la incorporación no deseada de un aminoácido natural especifico que es incorporado a la cadena polipéptido creciente en la posición deseada. La eficiencia también se puede referir al grado con el cual la O-RS aminoacila el O-tARN con el aminoácido no natural en comparación con un control relevante. Las O-RS de la invención pueden ser definidas por su eficiencia. En ciertas modalidades de la invención, una O-RS es comparada con otra O-RS. Por ejemplo, una O-RS de la invención aminoacila un O-tARN con un aminoácido no natural, por ejemplo, por lo menos 40%, por lo menos 50%, por lo menos 60%, por lo menos 75%, por lo menos 80%, por lo menos 90%, por lo menos 95% o aún 99% o más tan eficientemente como un O-RS que tiene una secuencia de aminoácido, por ejemplo, como se resume en la SEQ ID NO. : 86 o 45) u otra RS específica en la Tabla 5) aminoacila un O-tARN. En otra modalidad, una O-RS de la invención aminoacila el O-tARN con el aminoácido no natural por lo menos 10 veces, por lo menos 20 veces, por lo menos 30 veces, etc., más eficientemente que la O-RS aminoacila el O-tARN con un aminoácido natural. Utilizando los componentes de traducción de la invención, el rendimiento del polipéptido de interés que comprende el aminoácido no natural es, por ejemplo, por lo menos 5%, por lo menos 10%, por lo menos 20%, por lo menos 30%, por lo menos 40%, 50% o más, de aquel obtenido para el polipéptido de interés que se presenta de manera estable en la naturaleza a partir de una célula en la cual el polinucleótido carece del codón selector. En otro aspecto, la célula produce el polipéptido de interés en ausencia del aminoácido no natural con un rendimiento que es, por ejemplo, menor del 30%, menor del 20%, menor del 15%, menor del 10%, menor del 5%, menor del 2.5%, etc., del rendimiento del polipéptido en presencia del aminoácido no natural.
ORGANISMO FUENTE Y HUESPED Los componentes de traducción ortogonales de la invención son derivados comúnmente a partir de organismos no eucarióntico para uso en células eucariónticas o sistemas de traducción. Por ejemplo, el O-tARN ortogonal puede ser derivado a partir de un organismo no eucarióntico, por ejemplo, un eubacterium, tal como Escherichia coli, Thermus thermophilus, Bacxllus stearothermphilus, o los semejantes, o un archaebacterium, tal como Methanococcus jannaschii, Methanobacterlum thennoautotrophicum, Halobacterium tal comoo Haloferax volcanii y Halobacterium de especies NRC-1, Archaeoglobus f lgidus, Pyrococcus furíosusr Pyrococcus horikoshii, Aeuropyrum pernix o los semejantes, en tanto que la O-RS ortogonal puede ser derivada de un organismo no eucarióntico, por ejemplo, un eubacterium, tal como Escherichia coli, Thermus thermophilus, Bacxllus stearothermiphilus o los semejantes, o un archaebacterium, tal como Methanococcus jannaschii, Methanobacterlum thermoautotrophicum, Halobacterium tal como Haloferax volcanii y Halobacterium especies de NRC-1, Archaeoglobus fulgidus, Pyrococcus furiosus, Pyrococcus horikoshii, Aeuropyrum pernix o los semejantes. Alternativamente, las fuentes eucariónticas pueden también ser usadas, plantas, algas, hongos, levadura, animales (por ejemplo, mamíferos, insectos, artrópodos, etc.) o los semejantes, por ejemplo, donde los componentes son ortogonales a una célula o sistema de traducción de interés o en donde están modificados (por ejemplo, mutado) para estar ortogonales a la célula o sistema de traducción. Los componentes individuales de un par O-tARN/O-RS pueden ser derivados del mismo organismo o diferentes organismos. En una modalidad, el par 0-tARN/O-RS es del mismo organismo. Por ejemplo, el par O-tARN/0-RS puede ser derivado de un par tirosil-tARN sintetasa/tRNACoA de E. coli. Alternativamente, el O-tARN y la O-RS del par 0-tARN/O-RS son opcionalmente de organismos diferentes. El O-tARN ortogonal, O-RS o par 0-tARN/O-RS pueden ser seleccionados o filtrados y/o usados en una célula eucarióntica para producir un polipéptido con un aminoácido no natural. Una célula eucarióntica puede ser de una variedad de fuentes, por ejemplo, una planta (por ejemplo, planta compleja, tales como monocotiledóneas o dicotiledóneas) , una alga, ununa protistaa, un hongo, una levadura (por ejemplo, Saecharo yees cerevisiae) , un animal (por ejemplo, un mamífero, un insecto, un artrópodo, etc.) o los semejantes. Composiciones de células eucariónticas con componentes de traducción de la invención son también un aspecto de la invención . La invención también proporciona la selección eficiente en una especie para el uso opcional en aquella especie y/o una segunda especie (opcionalmente, sin selección/filtración adicional) . Por ejemplo, los componentes del par O-tARN/O-RS son seleccionados o filtrados en una especie, por ejemplo, una especie manipulada fácilmente (tal como una levadura, célula etc.) e introducidos a una segunda especie eucarióntica, por ejemplo, una planta (por ejemplo, planta compleja tal como monocotiledóneas o dicotiledóneas), una alga, una protista, un hongo, una levadura, un animal (por ejemplo, un mamífero, un insecto, un artrópodo, etc.) o los semejantes, para uso en la incorporación in vivo de un aminoácido no natural en la segunda especie. Por ejemplo, Saccharomyces cerevisiae [S. cerevislae) puede ser escogido como la primera especie eucarióntica que es unicelular, tiene un tiempo de generación rápido y genética relativamente bien caracterizada. Véase, por ejemplo, D. Burke y colaboradores, (2000) Methods in Yeast Genetics . Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY. Además, puesto que la maquinaria de traducción de los eucariontes es altamente conservada {véase, por ejemplo, (1996) Translational Control. Cold Spring Harbor Laboratory, Cold Spring Harbor, NY; Y. Kwok, & J. T. Wong, (1980) , Evolutionary relationship between Halobacterium cutirubrum and eukaryotes determined by use of aminoacyl-tARN synthetases as phylogenetic probes, Canadian Journal of Biochemistry 58:213-218; y (2001) The Ribosome. Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY) , genes aaRS para incorporación de aminoácidos no naturales descubiertos en S. cerevisiae pueden ser introducidos a organismos eucariónticos superiores y utilizados, en sociedad con tARN connatos (véase, por ejemplo, K. Sakamoto y colaboradores, (2002) Site-specific incorporation of an unnatural amino into proteins in mammalian cells, Nucleic Acids Res. 30:4692-4699; y C. Kohrer y colaboradores, (2001), Import of amber and ochre suppressor tARN into mammalian cells: a general approach to site-specific insertion of amino acid analogues into proteins, Proc. Nati. Acad. Sci . E. U. A. 98:14310-14315) para incorporar aminoácidos no naturales. En un ejemplo, el método para producir pares de O-tARN/O-RS en una primera especie como se describe en la presente incluye además un ácido nucleico que codifica el O-tARN y un ácido nucleico que codifica la O-RS a una célula eucarióntica de una segunda especie (por ejemplo, un mamífero, un insecto, un hongo, una alga, una planta y los semejantes) . En otro ejemplo, un método para producir una aminoacil-tARN sintetasa ortogonal (O-RS) que aminoacila preferiblemente un tARN ortogonal con un aminoácido no natural en una célula eucarióntica incluye: (a) someter a selección positiva en presencia de un aminoácido no natural, una población de células eucariónticas de una primera especie (por ejemplo, levadura y los seme antes) .Cada una de las células eucariónticas comprende: i) un miembro de una biblioteca de aminoacil-tARN sintetasas (RS) , ii) un tARN ortogonal (0-tARN) , iii) un polinucleótido que codifica un marcador de selección positivo, y iv) un polinucleótido que codifica un marcador de selección negativo. Las células que sobreviven la selección positiva comprenden una RS activa que aminoacila el tARN ortogonal (O-tARN) en presencia de un aminoácido no natural. Las células que sobreviven la selección positiva son sometidas a selección negativa en ausencia del aminoácido no natural para eliminar RS activas que aminoacilan el O-tARN con un aminoácido natural . Esto proporciona una O-RS que aminoacila preferiblemente el O-tARN con el aminoácido no natural. Un ácido nucleico que codifica el O-tARN y un ácido nucleico que codifica la O-RS (o los componentes O-tARN y/o O-RS) son introducidos en una célula eucarióntica de una segunda especie por ejemplo, un mamífero, un insecto, un hongo, una alga, una planta y/o los semejantes. Comúnmente, el O-tARN es obtenido al someter a selección negativa una población de células eucariónticas de una primera especie, donde las células eucariónticas comprenden un miembro de una biblioteca de tARN. La selección negativa elimina células que comprenden un miembro de la biblioteca de tARN que es aminoacilado mediante una aminoacil-tARN sintetasa (RS) que es endógena a las células eucariónticas, que proporciona un cúmulo de tARN que son ortogonales a la célula eucarióntica de la primera especie y la segunda especie.
CODONES SELECTORES Los codones selectores de la invención expanden la estructura de codón genético de la maquinaria biosintética de proteina. Por ejemplo, un codón selector incluye, por ejemplo, un codón de tres bases único, un codón sin sentido, tal como un codón de retención, por ejemplo, un codón ámbar (UAG) , un codón ópalo (UGA) , un codón no natural, por lo menos un codón de cuatro bases, un codón raro o los semejantes. Un número de codones selectores pueden ser introducidos a un gen deseado, por ejemplo, uno o más, dos o más, más de tres, etc. Un gen puede incluir múltiples copias de un codón selector dado o puede incluir múltiples codones selectores diferentes o cualquier combinación de los mismos. En una modalidad, los métodos involucran el uso de un codón selector que es un codón de retención para la incorporación de aminoácidos no naturales in vivo en una célula eucarióntica . Por ejemplo, un O-tARN es producido que reconoce el codón de retención, por ejemplo, UAG, y es aminoacilado mediante una O-RS con un aminoácido no natural deseado. Este O-tARN no es reconocido por la aminoacil-tARN sintetasas del huésped que se presenta de manera estable en la naturaleza. Mutagénesis dirigidas al sitio convencionales puede ser usada para introducir el codón de retención, por ejemplo, TAG, en el sitio de interés en un polipéptido de interés. Véase, por ejemplo, Sayers, J. R. y colaboradores, (1988), 5r ,3r Exonuclease in phosphorothioate-based oligonucleotide-directed mutagénesis . Nucleic Acids Res 791-802. Cuando la 0-RS, O-tARN y el ácido nucleico que codifica el polipéptido de interés son combinados in vivo, el aminoácido no natural es incorporado en respuesta al codón de UAG para dar un polipéptido que contiene el aminoácido no natural en la posición especificada. La incorporación de aminoácidos no naturales in vivo se puede hacer sin alteración significativa de la célula eucarióntica huésped. Por ejemplo, debido a que la eficiencia de superación para el codón ÜAG depende de la competencia entre el O-tARN, por ejemplo, el tARN supresor ámbar y un factor de liberación eucarióntico (por ejemplo, eRF) (el cual se enlaza a un codón de retención e inicia la liberación del péptido de crecimiento del ribosoma) , la eficiencia de supresión puede ser modulada por ejemplo, al incrementar el nivel de expresión de O-tARN, por ejemplo, el tARN supresor. Los codones selectores también comprenden codones extendidos, por ejemplo, codones de cuatro o más bases, tales como codones de cuatro, cinco, seis o más bases. Ejemplos de codones de cuatro bases incluyen, por ejemplo, AGGA, CÜAG, UAGA, CCCU y los semejantes. Ejemplos de codones de cinco bases incluyen, por ejemplo, AGGAC, CCCCU, CCCÜC, CUAGA, CUACU, UAGGC y los semejantes. Un aspecto de la invención incluye utilizar codones extendidos en base a la supresión de desplazamiento de cuadro. Codones de cuatro o más bases pueden insertar, por ejemplo, uno o múltiples aminoácidos no naturales a la misma protelna. Por ejemplo, en presencia de O-tARN mutados, por ejemplo, un tARN supresor de desplazamiento de cuadro especial, con bucles anti-codón, por ejemplo, con por lo menos bucles de anti-codón de 8-10, el codón de cuatro o más bases es leído como un solo aminoácido. En otras modalidades, los bucles de anti-codón pueden descodificar, por ejemplo, por lo menos un codón de cuatro bases, por lo menos un codón de cinco bases o por lo menos un codón de seis bases o más. Puesto que hay 256 codones de cuatro bases posibles, múltiples aminoácidos no naturales pueden ser codificados en la misma célula utilizando un codón de cuatro o más bases. Véase, Anderson y colaboradores, (2002) Exploring the imits of Codora and Anticodon Size, Chemistry and Biology, 9:237-244; Magliery, (2001) Expanding the Genetic Code: Selection of Efficient Suppressors of Four-base Codons and Identification of Shifty" Four-base Codons with a Library Approach ín Escherichia coli, J. Mol. Biol. 307 :755-769. Por ejemplo, codones de cuatro bases han sido usados para incorporar aminoácidos no naturales a proteínas utilizando métodos biosintéticos in vitro. Véase, por ejemplo, Ma y colaboradores, (1993) Biochemistry, 32:7939; y Hohsaka y colaboradores, (1999) J. Am. Chem. Soc, 121:34. CGGG y AGGü fueron usados para incorporar simultáneamente 2-naftilalanina y un derivado NBD de lisina a estreptavidina in vitro con dos tARN supresores de desplazamiento de cuadro acilados químicamente. Véase, por ejemplo, Hohsaka y colaboradores, (1999) J. Am. Chem. Soc, 121:12194. En un estudio in vivo, Moore y colaboradores, examinaron la capacidad de derivados de tRNALeu con anti-codones NCUA para suprimir condones UAGN (N puede ser U, A, G o C) y encontraron que el cuadrupleta UAGA puede ser descodificado mediante una tRNALeu con un anti-codón ÜCUA con una eficiencia de 13 a 26% con poca descodificación en el cuadro 0 o -1. Véase, Moore y colaboradores, (2000) J. Mol. Biol., 298:195. En una modalidad, codones extendidos basados en condones raros o codones sin sentido pueden ser usados enla invención, el cual puede reducir la lectura sin sentido y supresión de desplamiento de cuadro en otros sitios indeseables. Para un sistema dado, un codón selector puede también incluir uno de los codones de tres bases naturales, donde el sistema endógeno no usa (o usa raramente) el codón base natural. Por ejemplo, este incluye un sistema que es carente en tARN que reconoce el codón de tres bases natural y/o un sistema donde el codón de tres bases es un codón raro. Codones selectores incluyen opcionalmente pares base no naturales. Estos pares base no naturales expanden además el alfabeto genético existente. Un par base extra incrementa el número de condones triplete de 64 a 125. Las propiedades de los terceros pares base incluyen un apareamiento base estable y selectivo, incorporación enzimática eficiente a ADN con alta fidelidad mediante una polimerasa y la extensión de cebador continua eficiente después de la síntesis del par base no natural naciente. ¦Descripciones de pares base no naturales los cuales pueden ser adaptados para los métodos y composiciones incluyen, por ejemplo, Hirao y colaboradores, (2002) An unnatural base pair for incorporating amino acid analogues into protein, Nature Biotechnology, 20:177-182. Otras publicaciones relevantes son enlistadas a continuación. Para el uso in vivo, el nucleósido no natural es permeable a la membrana y es fosforilado para formar el trifosfato correspondiente. Además, la información genética incrementada es estable y no es destruida por las enzimas celulares. Expresos previos de Benner y otros toman ventaja de los patrones de enlace de hidrógeno que son diferentes de aquellos en los pares de Watson-Crick carónicos, el ejemplo más notable de los cuales es el par iso-C: iso-G. Véase, por ejemplo, Switzer y colaboradores, (1989) J. Am. Chem. Soc, 111:8322; y Piccirilli y colaboradores, (1990) Nature, 343:33; Kool, (2000) Curr . Opin. Chem. Biol., 4:602. Estas bases en general se desaparean algún grado con las bases naturales y no pueden replicadas enzimáticamente . Kool y colaboradores, demostraron que las interacciones de empaque y defódicas entre bases pueden reemplazar el enlace de hidrógeno para impulsar la formación del par base. Véase, Kool, (2000) Curr. Opin. Chem. Biol., 4:602; y Guckian y Kool, (1998) Ange . Chem. Int. Ed. Engl . , 36, 2825. En un esfuerzo por desarrollar un par base no natural que satisfaga todos los requerimientos anteriores, Schultz, Romesberg y colaboradores, han sintetizado sistemáticamente y estudiado una serie de bases hidrofóbicas no naturales. Un autopar PICS : PICS se encuentra más estable que los pares base naturales y puede ser incorporado eficientemente al ADN mediante el fragmento de Klenow de ADN polxmerasa I ADN (KF) de Escherichia coli. Véase, por ejemplo, Mc inn y colaboradores, (1999) J. Am. Chem. Soc, 121:11586; y Ogawa y colaboradores, (2000) J. Am. Chem. Soc, 122:3274. Un autopar 3M : 3 N puede ser sintetizado mediante KF con eficiencia y selectividad suficientes para función biológica. Véase, por ejemplo, Ogawa y colaboradores, (2000) J. Am. Chem. Soc, 122:8803. Sin embargo, ambas bases actúan como un terminador de cadena para le replicación adicional . Una polimerasa de ADN mutante ha sido evolucionada recientemente que puede ser usada para replicar el autopar de PICS. Además, un autopar 7AI puede ser replicado. Véase, por ejemplo, Tae y colaboradores, (2001) J. Am. Chem. Soc, 123:7439. Un nuevo par de metalobase, Dipic:Py, también ha sido desarrollado, en el cual forma un par estable en el enlace de Cu (II). Véase, Meggers y colaboradores, (2000) J. Am. Chem. Soc, 122:10714. Debido a que los codones extendidos y los codones no naturales son intrínsecamente ortogonal a los codones naturales, los métodos de la invención pueden tomar ventaja de esta propiedad para generar tARN ortogonales para ellos. Un sistema de desviación de traducción puede también ser usado para incorporar un aminoácido no natural en un polipéptido deseado. En un sistema de desviación de traducción, una secuencia grande es insertada a un gen pero no es traducida en proteína. La secuencia contiene una estructura que sirve como indicación para inducir el ribosoma a saltar sobre la secuencia y reanudar la traducción corriente abajo de la inserción.
AMINOACIDOS NO NATURALES Como se usa en la presente, un aminoácido no natural se refiere a cualquier aminoácido, aminoácido modificado o análogo de aminoácido diferente a selenocisteína y/o pirrolisina y los siguientes veinte alfa-aminoácidos codificados genéticamente: alanina, arginina, asparagina, ácido aspártico, cisteína, glutamina, ácido glutámico, glicina, histidina, isoleucina, leucina, lisina, metionina, fenilalanina, prolina, serina, treonina, triptófano, tirosina, valina. La estructura genérica de un alfa-aminoácido es ilustrada por la Fórmula I : I R H2 *^ ,'C¾H Un aminoácido no natural es comúnmente cualquier estructura que tiene la Fórmula I en donde el grupo R es cualquier sustituyente diferente al utilizado en los veinte aminoácidos naturales. Véase, por ejemplo, Biochemxstry by L. Stryer, 3- edición 1988, Freeman and Company, Nueva York, para las estructuras de los veinte aminoácidos naturales. Nótese que, los aminoácidos no naturales de la invención pueden ser compuestos que se presentan de manera estable en la naturaleza diferentes a los veinte aminoácidos alfa anteriores. Debido a que los aminoácidos no naturales de la invención difieren comúnmente de los aminoácidos naturales en cadena natural, los aminoácidos no naturales forman enlaces de amida con otros aminoácidos, por ejemplo, naturales o no naturales, de la misma manera en la cual son formados en las proteínas que se presentan de manera estable en la naturaleza. Sin embargo, los aminoácidos no- naturales tienen grupos de cadena lateral que los distinguen de los aminoácidos naturales. Por ejemplo, R en Fórmula I comprende opcionalmente alquil-, aril-, acil-, ceto-, azido-, hidroxil-, hidrazina, ciano-, halo-, hidrazida, alquenilo, alquinilo, éter, tiol, seleno-, sulfonil-, borato, boronato, fosfo, fósfono, fosfina, heteroclclico, enona, imina, aldehido, éster, tioácido, hidroxilamina, amina y los semejantes o cualquier combinación de los mismo. Otros aminoácidos no naturales de interés incluyen, pero no están limitados a, aminoácidos que comprenden un agente de reticulación fotoactivable, aminoácidos de epin-marcado, aminoácidos fluorescentes, aminoácidos de enlace de metal, aminoácidos que contienen metal, aminoácidos radioactivos, aminoácidos con nuevos grupos funcionales, aminoácidos que interactúan covalente o no covalentemente con otras moléculas, aminoácidos fotoenj aulados y/o fotoisomerizables, aminoácidos que contienen biotina o aminoácidos que contienen análogo de biotina, aminoácidos que contiene ceto, aminoácidos que comprende polietilenglicol o poliéter, aminoácidos sustituidos por átomo pesado, aminoácidos escindibles químicamente o fotoescindibles, aminoácidos con una cadena lateral alargada en comparación con los aminoácidos naturales (por ejemplo, poliéteres o hidrocarburos de cadena larga, por ejemplo, mayor de aproximadamente 5, mayor de aproximadamente 10 átomos de carbono, etc.) , aminoácidos que contiene azúcar enlazada a carbono, aminoácidos redox-activos, aminoácidos que contiene tioácido amino y aminoácidos que contiene una o más porciones tóxicas. En algunas modalidades, los aminoácidos no naturales tienen un agente de reticulación fotoactivable que es usado, por ejemplo, para enlazar una proteina a un soporte sólido. En una modalidad, los aminoácidos no naturales tienen una porción de sacárido anexada a la cadena lateral del aminoácido (por ejemplo, aminoácidos glicosilados ) y/u otra modificación de carbohidrato . Además de los aminoácidos no naturales que contienen nuevas cadenas laterales, los aminoácidos no naturales también comprenden opcionalmente estructuras de cadena fundamental modificada, por ejemplo, como se ilustra en las estructuras de Fórmula II y III: ? en donde Z comprende comúnmente OH, NH2, SH, NH-R' , ó S-R' ; X e Y, los cuales pueden ser los mismos o diferentes, comprenden comúnmente S u O y R y R' , los cuales son opcionalmente los mismos o diferentes, son seleccionados comúnmente de la misma lista de constituyentes para el grupo R descrito anteriormente para los aminoácidos no naturales que tienen la Fórmula I también como hidrógeno. Por ejemplo, los aminoácidos no naturales de la invención comprenden opcionalmente sustituciones en el grupo amino o carboxilo como se ilustra por las Fórmulas II y III. Los aminoácidos no naturales de este tipo incluyen, pero no están limitados a, a-hidroxiácidos, oí-tioácidos , cx-aminotiocarboxilatos , por ejemplo con cadenas laterales correspondientes a los veinte aminoácidos naturales comunes o cadenas laterales no naturales. Además, las sustituciones en el carbono alfa incluyen opcionalmente aminoácidos L, D o a-a-disustituidos tales como D-glutamato, D-alanina, D-metil-O-tirosina, ácido aminobutirico y los semejantes. Otras alternativa estructurales incluyen aminoácidos cíclicos, tales como análogos de prolina, también como análogos de prolina de anillo de 3, 4, 6, 7, 8 y 9 miembros, ß y ? aminoácidos tales como ß-alanina sustituida y ácido y-aminobutirico . Por ejemplo, muchos aminoácidos no naturales están basados en aminoácidos naturales, tales como tirosina, glutamina, fenilalanina y los semejantes. Los análogos de tirosina incluyen tirosinas para-sustituidas, tirosinas orto-sustituidas y tirosinas meta-sustituidas, en donde la tirosina sustituida comprende, por ejemplo, un grupo ceto (por ejemplo, un grupo acetilo) , un grupo benzoilo, un grupo amino, una hidrazina, una hidroxiamina, un grupo tiol, un grupo carboxi, un grupo isopropilo, un grupo metilo, un hidrocarburo de cadena recta o ramificada de C6-C20/ un hidrocarburo saturado o insaturado, un grupo metilo, un grupo poliéter, un grupo nitro, un grupo alquinilo o los semejantes. Además, también se contemplan anillos de arilo múltiplemente sustituidos. Los análogos de glutamina de la invención incluyen, pero no están limitados a, derivados a-hidroxi, derivados ?-sustituidos, derivados cíclicos y derivados de glutamina amida sustituidos . Los análogos de fenilalanina ejemplares incluyen, pero no están limitados a, fenilalaninas para-sustituidas, fenilalaninas orto-sustituidas y fenilalaninas meta-sustituidas, en donde el sustituyente comprende, por ejemplo un grupo hidroxi, un grupo metoxi, un grupo metilo, un grupo alilo, un aldehido, un azido, un yodo, un bromo, un grupo ceto (por ejemplo, un grupo acetilo) , un benzoilo, un grupo alquinilo o los semejantes. Ejemplos específicos de aminoácidos no naturales incluyen, pero no están limitados a, p-acetil-L-fenilalanina, una p-propargiloxifenilalanina, O-metil-L-tirosina, una L-3- (2-naftil) alanina, una 3-metil-fenilalanina, una ?-4-alil-L-tirosina, una 4-propil-L-tirosina, una tri-O-acetil-GlcNA^-serina, una L-dopa, una fenilalanina fluorada, una isopropil-L~fenilalanina, una p-azido-L-fenilalanina, una p-acil-L-fenilalanina, una p-benzoil-L-fenilalanina, una L-fosfoserina, una fosfonoserina, una fosfonotirosina, una p-yodo-fenilalanina, una p-bromofenilalanina, una p-amino-L-fenilalanina y una isopropil-L-fenilalanina y los semejantes. Ejemplos de estructuras de aminoácidos no naturales son ilustrados en la Figura 7, Panel B y Figura 11. Estructuras adicionales de una variedad de aminoácidos no naturales son provistas por ejemplo en las Figuras 16, 18, 19, 26 y 29 de WO 2002/085923 intitulada "In vivo incorporation of unnatural amino acids". Véase también, figura 1, estructuras 2-5 de Kiick et al., (2002) Incorporation of azides into recombinant proteins for chemoselective modification by the Staudinger ligtation, PMAS 99:19-24, para análogos de metionina adicionales. En una modalidad, se proporcionan composiciones que incluyen un aminoácido no natural (tal como p- (propargiloxi ) -fenilalanina) . También se proporciona varias composiciones que comprenden p- (propargiloxi) fenilalanina y por ejemplo, proteínas y/o células. En un aspecto, una composición que incluye el aminoácido no natural de p- (propargiloxi) -fenilalanina incluye además un tARN ortogonal . El aminoácido no natural puede ser enlazado (por ejemplo, covalentemente) al tARN ortogonal, por ejemplo enlazado covalentemente al tARN ortogonal por medio de un enlace amino-acilo, enlazado covalentemente a un 3?? o un 2?? de un azúcar de ribosa terminal del tARN ortogonal, etc. Las porciones químicas vía aminoácidos no naturales que puede ser incorporadas a proteínas ofrecen una variedad de ventajas y manipulaciones de la proteína. Por ejemplo, la reactividad única de un grupo funcional ceto permite modificaciones selectivas de proteínas con cualquiera de un número de reactivos que contienen hidrazina o hidroxilamina in vitro e in vivo. Un aminoácido no natural de átomo pesado, por ejemplo, puede ser útil para fases de datos de estructura de rayos X. la introducción específica del sitio de átomos pesados utilizando aminoácidos no naturales también proporciona selectividad y flexibilidad en escoger posiciones para los átomos pesados. Los aminoácidos no naturales fotoreactivos (por ejemplo, aminoácidos con benzofenona y cadenas laterales de arilazidas (por ejemplo fenilazida) , por ejemplo, permiten la fotoreticulación eficiente in vivo e in vitro de proteínas. Ejemplos de aminoácidos no naturales fotoreactivos incluyen, pero no están limitados a, por ejemplo p-azido-fenilalanina y p-benzoil-fenilalanina . La proteína con los aminoácidos no naturales fotoreactivos puede luego ser reticulada a voluntad mediante excitación del grupo fotoreactivo que proporciona control temporal (y/o espacial) . En un ejemplo, el grupo metilo de un aminoácido no natural puede ser sustituido con un grupo metilo, por ejemplo marcado isotópicamente, como una sonda de estructura local y dinámica, por ejemplo, con el uso de resonancia magnética nuclear y espectroscopia vibracional . Grupos funcionales alquinilo o azido, por ejemplo, permiten la modificación selectiva de proteínas con moléculas por medio de una reacción de [3+2] cicloadición .
Síntesis Química de Aminoácidos No Naturales Muchos de los aminoácidos no naturales provistos anteriormente están disponibles comercialmente, por ejemplo de Sigma (Estados Unidos de América) o Aldrich (Milwaukee, WI, EÜA) . Aquellos que no están disponibles comercialmente son sintetizados opcionalmente como se estipula en la presente o como se estipula en varias publicaciones o utilizando métodos estándar conocidos para aquellos de habilidad en la técnica. Para técnicas de síntesis orgánicas, véase, por ejemplo Organic Chemistry por Fessendon y Fessendon, (1982, Segunda Edición, Willard Grant presiones, Boston Mass.); Advanced Organic Chemistry por March (Third Edition, 1985, Wiley and Sons, New York) ; y Advanced Organic Chemistry por Carey y Sundberg (Tercera Edición, Partes A y B, 1990, Plenum presiones, New York) . Publicaciones adicionales que describen la síntesis de aminoácidos no naturales incluyen, por ejemplo WO 2002/085923 intitulado "In vivo incorporation of Unnatural Amino Acids"; Matsoukas et al., (1995) J. Med. Chem. , 38, 4660-4669; King, F.E. & Kidd, D.A.A. (1949) A New Synthesis of Glutamine and of ?-Dipeptides of Glutamic Acid from Phthylated Intermediates . Chem. Soc. 3315-3319; Friedman, O.M. & Chatterrji, R., (1959) Synthesis of Derivatives of Glutamine as Model Substrates for Anti-Tumor Agents . J. Am. Chem. Soc. 81, 3750-3752; Craig, J.C. et al. (1988) Ahsolute Configuration of the Enantiomers of 7-Chloro-4 [ [4- (diethylamino) -1-methylbutyl] amino] quinoUne (Chloroquine) . J. Org. Chem. 53, 1167-1170; Azoulay, ., Vilmont, M. & Frappier, F. (1991) Glutamine analogues as Potential Antimalarials . , Eur. J. Med. Chem. 26, 201-5; Koskinen, A.M.P. & Rapoport, H. (1989) Synthesis of 4-Substituted Prolines as Conformationally Constrained Amino Acid Analogues. J. Org. Chem. 54, 1859-1866; Christie, B.D. & Rapoport, H. (1985) Synthesis of Optically Puré Pipecolates from L-Asparagine . Application to the Total Synthesis of (+)-Apovincamine through Amino Acid Decarbonylation and Iminium Ion Cyclization. J. Org. Chem. 1989:1859-1866; Barton et al., (1987) Synthesis of Novel a-Amino-Acids and Derivatives üsing Radial Chemistry: Synthesis of L- and D- -Amino-Adipic Acids r L-a-aminopimelic acid and Appropriate ünsaturated Derivatives. Tetrahedron Lett. 43:4297-4308; y, Subasinghe et al., (1992) Quisqualic acid analogues: synthesis of beta-heterocyclic 2-aminopropanoic acid derivatives and their actlvity at a novel qulsqualate-sensitized site. J. Med. Chem. 35:4602-7. Véase también solicitud de patente intitulada "Protein Arrays", número de expediente del abogado PlOOlUSOO presentada el 22 de Diciembre de 2002. En un aspecto de la invención, se proporciona un método para sintetizar un compuesto de p- (propargiloxi ) fenilalanina . Un método comprende, por ejemplo (a) suspender N-ter-butoxicarbonil-tirosina en 2CO3 en DMF anhidra; (b) agregar bromuro de propargilo a la mezcla de reacción de (a) y alquilar el hidroxilo y el grupo carboxilo, dando como resultado un compuesto intermediario protegido que tiene la estructura: y (c) mezclar el compuesto intermediario protegido con HC1 anhidro en MeOH y desproteger la porción amina, sintetizando mediante esto el compuesto p- (propargiloxi) fenilalanina . En una modalidad, el método comprende además (d) disolver el p- (propargiloxi ) fenilalanina HC1 en NaOH acuoso y MeOH y agitarla a temperatura ambiente; (e) ajustar el pH a pH 7 y (f) precipitar el compuesto de p- (propargiloxi) fenilalanina. Véase, por ejemplo, síntesis de propargiloxifenilalanina en el Ejemplo 4, en la presente.
Absorción celular de aminoácidos no naturales La absorción del aminoácido no natural por una célula eucarióntica es una cuestión que es considerada comúnmente cuando se diseña y seleccionan aminoácidos no naturales, por ejemplo para incorporación a una proteina. Por ejemplo, la alta densidad de carga de a-aminoácidos sugiere que es improbable que estos compuestos sean permeables a la célula. Los aminoácidos naturales son absorbidos a la célula eucarióntica via una colección de sistemas de transporte a base de proteina. Se puede realizar una selección rápida que determina cuales aminoácidos no naturales, si los hay, son absorbidos por las células. Véase, por ejemplo, los análisis de toxicidad por ejemplo en la solicitud intitulada "Protein Arrays", número de expediente del abogado P1001US00 presentada el 22 de Diciembre de 2002; y Liu, D.R. & Schultz, P.G. (1999) Progress toward the evolution of an organism with an expanded genetic code. PNAS United States 96:4780-4785. Aunque la absorción es analizada fácilmente con varios análisis, una alternativa para diseñar aminoácidos no naturales que son propensos a rutas de absorción celular es proporcionar rutas biosintéticas para crear aminoácidos in vivo .
Biosíntesis de Aminoácidos No Naturales Ya existen muchas rutas biosintéticas en células para la producción de aminoácidos y otros compuestos. En tanto que un método biosintético para un aminoácido no natural particular puede no existir en la naturaleza, por ejemplo, en una célula eucrióntica, la invención proporciona tales métodos. Por ejemplo, rutas biosintéticas para aminoácidos no naturales son generadas opcionalmente en célula huésped al agregar nuevas enzimas o modificar rutas de célula huésped existentes. Las nuevas enzimas adicionales son enzimas opcionalmente que se presentan de manera estable en la naturaleza o enzimas evolucionadas artificial. Por ejemplo, la biosintesis de p-aminofenilalanina (tal como se presenta en un ejemplo en WO 2002/085923 intitulada "In vivo incorporation of unnatural amino acids") depende de la adición de una combinación de enzimas conocidas de otros organismos. Los genes para estas enzimas pueden ser introducidos a una célula eucarióntica al transformar la célula con un plásmido que comprende los genes. Los genes, cuando son expresados en la célula, proporcionan una ruta enzimática para sintetizar el compuesto deseado. Ejemplos de los tipos de enzimas que son agregados opcionalmente son provistos en los ejemplos a continuación. Secuencias de enzimas adicionales se encuentran, por ejemplo, en Genbank. Enzimas evolucionadas artificialmente también son agregadas opcionalmente a una célula de la misma manera. De esta manera, la maquinaria celular y recursos de una célula son manipulados para producir aminoácidos no naturales. Una variedad de métodos están disponibles para producir nuevas enzimas para uso en rutas biosintéticas o para evolución de rutas existentes. Por ejemplo, recombinación recursiva, por ejemplo, tal como es desarrollado por Maxygen, Inc. (disponible en el sitio de red en www.maxygen.com), es usado opcionalmente para desarrollar nuevas enzimas y rutas. Véase, por ejemplo, Stemmer (1994); Rapid evolution of a protein in vitro by ADN shuffling, Nature 370 (4) : 389-391; y Stemmer, (1994), ADN shuffling by random fragmenta tion and reassembly: In vitro recombination for molecular evolution, Proc. Nati. Acad. Sci. USA., 91:10747-10751. Similarmente, DesignPath™ desarrollado por Genencor (disponible en el sitio de red genencor.com) es usado opcionalmente para diseño de rutas metabólicas, por ejemplo, para diseñar una ruta para crear 0-metil-L-tirosina en una célula. Esta tecnología reconstruye rutas existentes en organismos huésped utilizando una combinación de nuevos genes, por ejemplo identificados por medio de genómicos funcionales y evolución y diseño molecular. Diversa Corporation (disponible en el sitio de red diversa.com) también proporciona tecnología para filtrar rápidamente bibliotecas de genes y rutas de gen, por ejemplo para crear nuevas rutas . Comúnmente, el aminoácido no natural producido con una ruta biosintética diseñado de la invención es producido en una concentración suficiente para la biosintesis de proteina eficiente, por ejemplo una cantidad celular natural pero no a tal grado para afectar la concentración de los otros aminoácidos o agotar recursos celulares. Concentraciones típicas producidas in vivo de esta manera son aproximadamente 10 mM a aproximadamente 0.05 mM. Una vez que una célula es transformada con un plásmido que comprende los genes usados para producir enzimas deseadas para una ruta especifica y un aminoácido no natural es generado, se usan opcionalmente selecciones in vivo para optimizar adicionalmente la producción del aminoácido no natural tanto para la síntesis de proteína ribosomal como el crecimiento celular .
POLIPÉPTIDOS CON AMINOÁCIDOS NO NATURALES Proteínas y polipéptidos de interés con por lo menos un aminoácido no natural son un aspecto de la invención. La invención también incluye polipéptidos o proteínas con por lo menos un aminoácido no natural producido usando las composiciones y métodos de la invención. Un excipiente (por ejemplo, un excipiente aceptable farmacéuticamente) puede también estar presente en la proteína . Al producir proteínas o polipéptidos de interés con por lo menos un aminoácido no natural en células eucariónticas , las proteínas o polipéptidos incluirán comúnmente modificaciones post-traducción eucariónticas. En ciertas modalidades, una proteína incluye por lo menos un aminoácido no natural y por lo menos una modificación posttraducción que se hace in vivo mediante una célula eucarióntica, en donde la modificación post-traducción no se hace mediante una célula procarióntica . Por ejemplo, la modificación de post-traducción incluye, por ejemplo, acetilación, acilación, modificación de lípido, palmitoilación, adición de palmitato, fosforilación, modificación de enlace de glicolípido, glicosilación y los semejantes. En una aspecto, la modificación post-traducción incluye anexión de un oligosacárido (por ejemplo (GlcNAc-Man) 2-Man-GlcNAc-GlcNAc) ) a una asparagina mediante un enlace de GlcNAc-asparagina . Véase también Tabla 7 que enlista algunos ejemplos de oligosacáridos N-enlazados de proteínas eucariónticas (residuos adicionales pueden también estar presentes, los cuales no son mostrados) . En otro aspecto, la modificación post-traducción incluye anexión de un oligosacárido (por ejemplo, Gal-GalNAc, Gal-GlcNAc, etc.) a una serina o treonina mediante un enlace GalNAc-serina o GalNAc-treonina o un enlace GlcNAc-serina o un enlace GlcNAc-treonina .
TABLA 7 : EJEMPLOS DE OLIGOSACÁRIDOS POR MEDIO DE GlcNAc-ENLACE · En todavía otro aspecto, la modificación posttraducción incluye el procesamiento proteolítico de precursores (por ejemplo, precursor de calcitonina, precursor de polipéptido relacionado con gen de calcitonina, hormona preproparatiroide, preproinsulina, proinsulina, prepro-opiomelanocortina, pro-opiomelanocortina y los semejantes), ensamble a una proteína de multi-subunidades o conjunto macromolecular, traducción a otro sito en la célula (por ejemplo, a organelos, tales como el retículo endoplásmico, el aparato de golgi, el núcleo, lisosomas, peroxisomas, mitocondrias, cloroplastos, vacuolas, etc., o a través de la ruta secretoria) . En ciertas modalidades, la proteina comprende una secuencia de secreción o localización, una etiqueta de ep topo, una etiqueta FLAG, una etiqueta de polihistidina, una fusión GST o los semejantes. Una ventaja de un aminoácido no natural es que presenta porciones químicas adicionales que pueden ser usadas para agregar moléculas adicionales . Estas modificaciones pueden ser efectuadas in vivo en una célula eucarióntica o in vitro. Así, en ciertas modalidades, la modificación posttraducción es por medio del aminoácido no natural. Por ejemplo, la modificación post-traducción puede ser a través de una reacción nucleofílica-electrofílica . La mayoría de las reacciones usadas actualmente para la modificación selectiva de proteínas involucran formación de enlaces covalentes entre los socios de reacción nucleofílicos y electrofílicos, por ejemplo la reacción de a-halocetonas con cadenas laterales de histidina o cisterna. La selectividad en estos casos es determinada por el número y accesabilidad de los residuos nucleofílicos en la proteína. En proteínas de la invención, se pueden usar otras reacciones más selectivas, tal como la reacción de un ceto-aminoácido no natural con hidrazidas o compuestos aminoxi, in vitro e in vivo. Véase, por ejemplo Cornish, et al (1996) Am. Chem. Soc, 118:8150-8151; ahal et al., (1997) Science, 276:1125-1128; Wang, et al. (2001) Science 292:498-500; Chin et al., (2001) Am. Chem. Soc. 124:9026-9027; Chin, et al., (2002) Proc. Nati. Acad. Sci., 99:11020-11024; Wang, et al., (2003) Proc. Nati. Acad. Sci., 100:56-61; Zhang, et al., (2003) Biochemistry, 42:6735-6746; y, Chin, et al., (2003) Science, en prensa. Esto permite el mercado selectivo de virtualmente cualquier proteina con un huésped de reactivos que incluyen fluoróforos, agentes de reticulación, derivados de sacárido y moléculas citotóxicas . Véase también solicitud de patente USSN 10/686,944 intitulada "Glycoprotein Synthesis" presentada de 15 de Octubre de 2003. Modificaciones post-traducción, por ejemplo, por medio de un aminoácido azido también se pueden efectuar por medio de la ligación de Staudinger (por ejemplo, con reactivos de triarilfosfina) . Véase, por ejemplo, iick, et al., (2002) Incorporation of azides into recombinant proteins for chemoseletive modification by the Staudinger ligtation, PNAS 99:19-24. Esta invención proporciona otro método altamente eficiente para la modificación selectiva de proteina, que involucra la incorporación genética de aminoácidos no naturales, por ejemplo que contienen una porción azida o alquinilo (véase, por ejemplo 2 y 1 de la Figura 11) , a proteínas en respuesta a un codón selector. Estas cadenas laterales de aminoácido pueden luego ser modificadas, por ejemplo mediante una reacción de [3+2] cicloadición de Huisgen (véase, por ejemplo, Pad a, A. in Comprehensive Organic Synthesis, Vol. 4, (1991) Ed. Trost, B.M., Pergamon, Oxford, p. 1069-1109; y, Huisge, R. in 1, 3-Dipolar Cycloaddition Chemistry, (1984) Ed. Padwa, A., Wiley, New York, p. 1-176) con por ejemplo, derivados alquinilo o azida, respectivamente. Véase, por ejemplo, Figura 16. Debido a que este método involucra una cicloadición en lugar de una sustitución nucleofilica , las proteínas pueden ser modificadas con selectividad extremadamente alta. Esta reacción se puede llevar a cabo a temperatura ambiente en condiciones acuosas con excelente regioselectividad (1,4>1,5) mediante la adición de cantidades catalíticas de sales de Cu(I) a la mezcla de reacción. Véase, por ejemplo, tornoe, et al., (2002) Org. Chem., 67:3057-3064; y, Rostovtsev, et al., (2002) Angew. Chem. Int. Ed. 41:2596-2599. Otro método que puede ser usado es el intercambio de ligandos sobre un compuesto bisaxsénico con una porción de tetracisteina, véase, por ejemplo, Griffin, et al., (1998) Science 281:269-272. Una molécula que puede ser agregada a una proteína de la invención por medio de una [3+2] cicloadición incluye virtualmente cualquier molécula con un derivado azido o alquinilo. Véase, por ejemplo el Ejemplo 3 y 5, en la presente. Tales moléculas incluyen, pero no están limitadas a, tintes, fluoróforos, agentes de reticulación, derivados de sacárido, polímeros (por ejemplo, derivados de polietilenglicol) , agentes de fotoreticulación, compuestos citotóxicos, etiquetas de afinidad, derivados de biotina, resinas, perlas, una segunda proteina o polipéptido (o más), polinucleótido (s) (por ejemplo, ADN, ARN, etc.) quelatores de metal, co-factores, ácidos grasos, carbohidratos y los semejantes. Véase, por ejemplo, Figuras 13A, y Ejemplo 3 y 5, en la presente. Estas moléculas pueden ser agregadas a un aminoácido no natural con un grupo alquinilo, por ejemplo p-propargiloxifenilalanina o grupo azido, por ejemplo, p-azido-fenilalanina, respectivamente. Por ejemplo, véase Figura 13B y Figura 17A. En otro aspecto, la invención proporciona composiciones que incluyen tales moléculas y métodos para producir estas moléculas, por ejemplo tintes azido (tal como se muestra en la estructura química 4 y estructura química 6) , un alquinil polietilenglicol (por ejemplo, como se muestra en la estructura química 7) , en donde n es un número entero entre, por ejemplo 50 y 100,000, 75 y 5, 000, 100 y 2,000, 100 y 1,000, etc. En una modalidad de la invención, el alquinil polietilenglicol tiene un peso molecular de, por ejemplo aproximadamente 5,000 a aproximadamente 100,000 Da, aproximadamente 20,000 a aproximadamente 50,000 Da, aproximadamente 20,000 a aproximadamente 10,000 Da (por ejemplo, 20,000 Da), etc.
Varias composiciones que comprenden estos compuestos, por ejemplo, con proteínas y células, también son provistas. En un aspecto de la invención, una proteína que comprende un tinte azido (por ejemplo de estructura química 4 o estructura química 6) incluye además por lo menos un aminoácido no natural (por ejemplo, un alquinil aminoácido), en donde el tinte azido está anexado al aminoácido no natural por medio de una [3+2] cicloadición . En una modalidad, una proteína comprende el alquinil polietilenglicol de estructura química 7. En otra modalidad, la composición incluye además por lo menos un aminoácido no natural (por ejemplo, un aminoácido azido) , en donde el alquinil polietilenglicol está anexado a un aminoácido no natural por medio de una [3+2] cicloadición . También se proporcionan métodos para sintetizar tintes azido. Por ejemplo, uno de tales métodos comprende: (a) proporcionar un compuesto de tinte que comprende una porción de haluro de sulfonilo; (b) calentar el compuesto de tinte a temperatura ambiente en presencia de 3-azidopropilamina y trietilamina y acoplar una porción amina de la 3-azidopropilamina a la posición haluro del compuesto de tinte, sintetizando mediante esto el tinte azido. En una modalidad ejemplar, el compuesto de tinte comprende cloruro de dansilo y el tinte de azido comprende la composición de estructura química 4. En un aspecto, el método comprende además purificar el tinte azido de la mezcla de reacción. Véase por ejemplo el Ejemplo 5 en la presente. En otro ejemplo, un método para sintetizar un tinte azido comprende (a) proporcionar un compuesto de tinte que contiene amina; (b) combinar el compuesto de tinte que contiene amina con una carbodiimida y ácido 4- (3-azidopropilcarbamoil) -butírico en un solvente apropiado y acoplar un grupo carbonilo del ácido a la porción amina del compuesto de tinte, sintetizando mediante esto el tinte de azido. En una modalidad, la carbodiimina comprende clorhidrato de l-etil-3- (3-dimetilainopropil) carbodiimida (EDCI) . En un aspecto, el tinte que contiene amina comprende fluorsceinamina y el solvente apropiado comprende piridina. Por ejemplo, el tinte que contiene amina comprende opcionalmente fluorosceinamina y el tinte azido comprende opcionalmente la composición de estructura química 6. En una modalidad, el método comprende además (c) precipitar el tinte azido; (d) lavar el precipitado con HC1; (e) disolver el precipitado lavado en EtOAc; y (f) precipitar el tinte de azido en hexanos. Véase, por ejemplo el Ejemplo 5 en la presente . También se proporcionan métodos para sintetizar un propargil amida de polietilenglicol. Por ejemplo, el método comprende hacer reaccionar propargilamina con polietilenglicol (PEG)-éster de hidroxisuccinimida en un solvente orgánico (por ejemplo, CH2C12) a temperatura ambiente, dando como resultado la propargilamida de polietilenglicol de estructura química 7. En una modalidad, el método comprende además precipitar la propargilamida de polietilenglicol utilizando acetato de etilo. En un aspecto, el método incluye además, recristalizar la propargilamida polietilenglicol en metanol y secar el producto bajo vacio. Véase por ejemplo el Ejemplo 5 en la presente. Una célula eucarióntica de la invención proporciona la capacidad de sintetizar proteínas que comprenden aminoácidos no naturales en grandes cantidades útiles, en un aspecto, la composición incluye opcionalmente, por ejemplo por lo menos 10 microgramos, por lo menos 50 microgramos, por lo menos 75 microgramos, por lo menos 100 microgramos, por lo menos 200 microgramos, por lo menos 250 microgramos, por lo menos 500 microgramos, por lo menos 1 miligramo, por lo menos 10 miligramos o más de la proteína que comprende un aminoácido no natural o una cantidad que puede ser obtenida con métodos de producción de proteína in vivo (detalles en cuanto a la producción y purificación de proteínas recombinantes son proporcionados en la presente) . En otro aspecto, la proteína está opcionalmente presente en la composición a una concentración de, por ejemplo, por lo menos 10 microgramos de proteína por litro, por lo menos 50 microgramos de proteína por litro, por lo menos 75 microgramos de proteína por litro, por lo menos 100 microgramos de proteína por litro, por lo menos 200 microgramos de proteína por litro, por lo menos 250 microgramos de proteína por litro, por lo menos 500 microgramos de proteína por litro, por lo menos 1 miligramo de proteina por litro o por lo menos 10 miligramos de proteina por litro o más, en por ejemplo un lisado celular, una solución reguladora del pH, una solución reguladora del pH farmacéutica u otra suspensión líquida (por ejemplo, en un volumen de por ejemplo, de aproximadamente 1 nanolitro a aproximadamente 100 Litros) . La producción de grandes cantidades (por ejemplo, mayor de aquella comúnmente posible con otros métodos, por ejemplo' traducción in vitro) de una proteína en una célula eucarióntica incluye por lo menos un aminoácido natural es un aspecto de la invención. La incorporación de un aminoácido no natural se puede hacer, por ejemplo para adaptar cambios en la estructura y/o función de proteína, por ejemplo para cambiar el tamaño, acidez, nucleofilicidad, enlace de hidrógeno, hidrofobicidad, accesibilidad de sitios objetivo de proteasa, objetivo a una porción (por ejemplo, para un arreglo de proteínas), etc. Proteínas que incluyen un aminoácido no natural pueden tener propiedades catalíticas o físicas mejoradas o aún completamente nuevas. Por ejemplo, las siguientes propiedades son modificadas opcionalmente mediante inclusión de un aminoácido no natural a una proteína: toxicidad, biodistribución, propiedades estructurales, propiedades espectroscópicas, propiedades químicas y/o fotoquímicas, capacidad catalítica, vida media (por ejemplo vida media en el suero) , capacidad para reaccionar con otras moléculas, por ejemplo covalente o no covalentemente y los semejantes. Las composiciones incluyen proteínas que incluyen por lo menos un aminoácido no naturales son útiles para, por ejemplo nuevos terapéuticos, diagnósticos, enzimas catalíticas, enzimas industriales, proteínas de enlace, (por ejemplo, anticuerpos) y por ejemplo, el estudio de estructura y función de proteínas. Véase, por ejemplo, Dougherty, (2000) , Unnatural Amino Acids as Probes of Pzotein Structure and Function , Current Opinión in Chemical Biology, 4:645-652. En un aspecto de la invención, una composición incluye por lo menos una proteína con por lo menos uno, por lo menos dos, por lo menos tres, por lo menos cuatro, por lo menos cinco, por lo menos seis, por lo menos siete, por o menos ocho, por lo menos nueve o por lo menos diez o más aminoácidos no naturales. Los aminoácidos no naturales pueden ser los mismos o diferentes, por ejemplo pueden haber 1, 2, 3, 4, 5, 6, 7, 8, 9 ó 10 o más sitios diferentes en la proteína que comprenden 1, 2, 3, 4, 5, 6, 7, 8, 9 ó 10 o más aminoácidos no naturales diferentes. En otro aspecto, una composición incluye una proteína con por lo menos uno, pero menos de todos, de un aminoácido particular presente en la proteína está sustituido con el aminoácido no natural. Para una proteína dada con más de un aminoácido no natural, los aminoácidos no naturales pueden ser idénticos o diferentes (por ejemplo, la proteína puede incluir dos o más tipos diferentes de aminoácidos no naturales o puede incluir dos de los mismos aminoácidos no naturales) . Para una proteína dada con más de dos aminoácido no naturales, los aminoácidos no naturales pueden ser los mismos, diferentes o una combinación de un aminoácido no natural múltiple de la misma clase con por lo menos un aminoácido no natural diferente. Esencialmente cualquier proteína (o porción de la misma) que incluye un aminoácido no natural (y cualquier ácido nucleico de codificación correspondiente, por ejemplo, que incluye uno o más codones selectores) puede ser producida usando las composiciones y métodos de la presente. No se hace intento de identificar los cientos de miles de proteínas conocidas, cualquiera de los cuales puede ser modificada para incluir uno o más aminoácidos no naturales, por ejemplo al adaptar cualesquier métodos de mutación disponibles para incluir uno o más codones selectores apropiados en un sistema de traducción relevante. Depósitos de secuencias comunes para proteínas conocidas incluyen GenBank EMBL, DDBJ y los NCBI. Otros depósitos pueden ser fácilmente identificados al buscar en Internet. Comúnmente, las proteínas son, por ejemplo por lo menos 60% , por lo menos 70% , por lo menos 75% , por lo menos 80% , por lo menos 90% , por lo menos 95% o por lo menos 99% o más idénticas a cualquier proteína disponible (por ejemplo, una proteína terapéutica, una proteína de diagnóstico, una enzima industrial o porción de la misma y los semejantes) y comprenden uno o más aminoácidos no naturales. Ejemplos de proteínas terapéuticas, de diagnóstico y otras proteínas que pueden ser modificadas para comprender uno o más aminoácidos no naturales incluyen, pero no están limitadas a, por ejemplo Alfa-1 antitripsina, Angiostatina, factor Anti-hemolítico, anticuerpos (detalles adicionales en cuando a anticuerpos se encuentran a continuación) , Apolipoproteina, apoproteína, factor natriurético atrial, polipéptido natriurético atrial, péptidos atriales, C-X-C quimiocinas (por ejemplo T39765, NAP-2, ENA-78, Gro-a, Gro-b, Gro-c, IP-10, GCP-2, NAP-4, SDF-1, PF4, MIG) , Calcitonina, CC quimiocinas (por ejemplo, proteína-1 quimioatrayente de monocito, proteína-2 quimioatrayente de monocito, proteína-2 quimioatrayente de monocito, proteína-1 alfa inflamatoria de monocito, proteína-1 beta inflamatoria de monocito, RANTES, 1309, R91733, HCC1, T58847, D31065, T64262) , ligando CD40, ligando C-kit, colágeno, factor estimulador de colonia (CSF) , factor de complemento 5a, inhibidor de complemento, receptor 1 de complemento, citocinas (por ejemplo, péptido 78- activador de neutrófilo epitelial, GROOÍ/MGSA, GRG-ß, GROy, ???-lce, ???-?d, MCP-1) , factor de crecimiento epidérmico (EGF) , eritropoyetina ("EPO", que representa un objetivo preferido para modificación mediante la incorporación de uno o más aminoácidos no naturales) , toxinas exfoliadores A y B, factor IX, factor VII, factor VIII, factor X, factor de crecimiento de fibroblasto (FGF) , fibrinógeno, fibronectina, G-CSF, G -CSF, glucocerebrosidasa, gonadotropina, factores de crecimiento, proteínas de Hedgehog (por ejemplo, Sonic, Indian, Desert) , hemoglobina, factor de crecimiento de hepatocito (HGF) , hirudina, albúmina de suero humano, insulina, factor de crecimiento semejante a insulina (IGF), interferones (por ejemplo, IFN- , lFN-ß, IFN-?) , interleucinas (por ejemplo, IL-1, 1L-2, IL-3, IL-4, IL-5, IL-6, IL-7, 1L-8, IL-9, IL-10, IL-11, IL-12, etc.), factor de crecimiento de queratinocito (KFG) , lactoferrina, factor inhibidor de leucemia, luciferasa, neurturina, factor inhibidor de neutrófilo (NIF) , oncostatina M, proteína osteogénica, hormona paratiroide, PUEDE-ECSF, PDGF, hormonas de péptido (por ejemplo, hormona de crecimiento humano) , pleiotropina, proteína A, proteína G, exotoxinas pirogénicas A, B y C, relaxina, reni a, receptor I de complemento soluble, I-CAM 1 soluble, receptores de interleucina solubles (IL-1, 2, 3, 4, 5, 6, 7, 9, 10, 11, 13, 13, 14, 15), receptor de TNF soluble, sometomedina, somatostatina, somatotropina, estreptoquinasa, superantígenos, esto es, enterotoxinas Staphylococcales (SEA, SEB, SEC1, SEC2, SEC3, SED, SEE) , superóxido bismutasa (SOD) , toxina de síndrome de choque tóxico (TSST-1) , timosina alfa 1, activador de plasminógeno de tejido, factor beta de necrosis de tumor (TNF beta), receptor del factor de necrosis de tumor (TNFR) , factor alfa de necrosis de tumor (TNF alfa) , factor de crecimiento endotelial vascular (VEGEF) , uroquinasa y muchas otras. Una clase de proteínas que pueden ser elaborados usando las composiciones y métodos para la incorporación in vivo de aminoácidos no naturales descritos en la presente incluyen moduladores de transcripción o porciones de los mismos. Moduladores transcripcionales ejemplares incluyen genes y proteínas moduladoras transcripcionales que modulan el crecimiento de la célula, diferenciación, regulación o los semejantes. Moduladores transcripcionales se encuentran en procariontes , virus y eucariontes, en los que se incluyen hongos, plantas, levaduras, insectos y animales en los que se incluyen mamíferos, proporcionan un amplio intervalo de objetivos terapéuticos. Se apreciará que los activadores de expresión y transcripcionales regulan la transcripción mediante muchos mecanismos, por ejemplo mediante enlace a receptores, estimulación de una cascada de transducción de señal, expresión de regulación de factores de transcripción, enlace a promotores y mej oradores, enlace a proteínas que se enlazan a promotores y mej oradores, desenvolvimiento de ADN, pegado de pre-mRNA, poliadenilación de ARN y degradación de ARN. Por ejemplo, composiciones de proteína de GAL4 o porciones de las mismas en una célula eucarióntica son también un aspecto de la invención, comúnmente, la proteina GAL4 o porción de la misma comprende por lo menos un aminoácido no natural. Véase también la sección en la presente intitulada "Aminoacil-tARN sxntetasas ortogonales". Una clase de proteínas de la invención (por ejemplo, proteínas con uno o más aminoácidos no naturales) incluyen activadores de expresión tales como citocinas, moléculas inflamatorias, factores de crecimiento, sus receptores y productos oncógenos, por ejemplo interleucinas (por ejemplo IL-1, IL-2, IL-8, etc.), interferones , FGF, IGF-I, IGF-II, FGF, PDGF, TNF, TGF-a, TGF-ß, EGF, KGF, SCF/c-Kit, CD40L/CD40, VLA-4 /VCAM-1 , ICAM-l/LFA-1 , e hialurina/CD4 ; moléculas de transducción de señal y productos oncógenos correspondientes, por ejemplo Mos, Ras, Raf y Met; y activadores y supresores transcripcionales, por ejemplo p53, Tat, Fos, Myc, Jun, Myb, Reí, y receptores de hormona esteroide tales como aquellos para estrógeno, progesterona, testosterona, aldosterona, el ligando receptor de LDL y corticosterona . Enzimas (por ejemplo, enzimas industriales) o porciones de las mismas con por lo menos una aminoácido no natural son también provistas por la invención, ejemplos de enzimas incluyen, pero no están limitadas a, por ejemplo, amidasas, racemasas de aminoácido, acilasas, deshalogenasas, dioxigenasas , diarilpropan peroxidasas, epimerasas, epóxido hidrolasas, estearasas, isomerasas, quinasas, glucosa isomerasa, glicosidasas, glicosil transferasas, haloperoxidasas, monooxigenasas (por ejemplo, p450s), lipasas, lignina peroxxdasas, nitrilo hidratasas, nitrilasas, proteasas, fosfatasas, subtilisinas, transaminasa y nucleasas . Muchas de estas proteínas están disponibles comercial (Véase por ejemplo, el catálogo de Sigma BioSciences 2002 y lista de precios) y las secuencias de proteínas correspondientes y genes y comúnmente muchos variantes de los mismos, son bien conocidos (véase, por ejemplo, Genbank) . Cualquiera de ellas puede ser modificada mediante la inserción de uno o más aminoácidos no naturales de acuerdo con la invención, por ejemplo para alterar la proteína con respecto a una o más propiedades terapéuticas, de diagnóstico o enzimáticas de interés. Ejemplos de propiedades terapéuticamente relevantes incluyen vida media en el suero, vida media en almacenamiento, estabilidad, inmunogenicidad, actividad terapéutica, detectabilidad (por ejemplo mediante la inclusión de grupos reportero (por ejemplo etiquetas o sitios de enlace de etiqueta) en los aminoácidos no naturales) , reducción de LD50 u otros efectos secundarios, capacidad para entrar el cuerpo a través del sistema gástrico (por ejemplo, disponibilidad oral) o los semejantes. Ejemplos de propiedades de diagnóstico incluyen vida media en almacenamiento, estabilidad, actividad de diagnóstico, detectabilidad o los semejantes. Ejemplos de propiedades enzimáticas relevantes incluyen vida media en almacenamiento, estabilidad, actividad enzimática, capacidad de producción o los semejantes. Una variedad de otras proteínas pueden también ser modificadas para incluir uno o más aminoácidos no naturales de la invención, por ejemplo, la invención puede incluir sustituir uno o más aminoácidos naturales en una o más proteínas de vacuna con un aminoácido no natural, por ejemplo en proteínas de hongos infecciosos, por ejemplo especies Aspergillus r Candida; bacterias, particular E. coli, que sirve como modelo para bacterias patógenas, también como bacterias médicamente importantes tales como Staphylococci (por ejemplo aureous) , o Streptococci (por ejemplo, pneumoniae) protozoarios tales como esporozoa (por ejemplo, Plasmodia) , rizopodos (por ejemplo, Entamoeba) y flagelados (Trypanosoma, Leishmania, Trichomonas, Giardia, etc.); virus tales como virus (+)ARN (ejemplos incluyen poxivirus, por ejemplo, vaccinia; Picornavirus, por ejemplo, polio; Togavirus, por ejemplo, rubella; Favivirus, por ejemplo, HCV; y Coronavirus) , virus (-)ARN (por ejemplo, rabdovirus, por ejemplo, VSV; paramixovimses, por ejemplo, RSV; Ortomixo imses, por ejemplo, influenza; Bunyavirus; y Adenarivus), dsDNA virus (reovirus, por ejemplo), virus de ARN a ADN, esto es, retrovirus, por ejemplo HIV y HTLV y ciertos virus de ADN a ARN tales como hepatitis B. Proteínas relacionadas agrícolamente tales como proteínas resistentes a insectos (por ejemplo las proteínas Cry) , almidón y enzimas de producción de lapido, toxinas de plantas e insectos, proteínas resistentes a toxinas, proteínas de destoxificación de micotoxina, enzimas de crecimiento de plantas (por ejemplo, Ribulosa 1 , 5-bisfosfato carboxílasa/oxigenasa, "RUBISCO"), lipoxigenasa (LOX) , y fosfoenolpiruvato (PEP) carboxilasa son también objetivos apropiados para la modificación por aminoácido no natural. La invención también proporciona métodos para producir en una célula eucarióntica, por lo menos una proteína que comprende por lo menos un aminoácido no natural (y proteínas producidas mediante tales métodos) . Por ejemplo, un método incluye: cultivar, en un medio apropiado, una célula eucarióntica que comprende un ácido nucleico que comprende por lo menos un codón selector y codifica la proteína. La célula eucarióntica también comprende: un tARN ortogonal (O-tARN) que funciona en la célula y reconoce el codón selector y una aminoacil tARN sintetasa ortogonal (O-RS) que amnoacila preferiblemente el O-tARN con el aminoácido no natural y el medio comprende un aminoácido no natural. En una modalidad, el método incluyen además incorporar a la proteína el aminoácido no natural, en donde el aminoácido no naturales comprende un primer grupo reactivo y poner en contacto la proteina con una molécula (por ejemplo, un tinte, un polímero, por ejemplo, un derivado de polietilenglicol, un fotoreticulador, un compuesto citotóxico, una etiqueta de afinidad, un derivado de biotina, una resina, una segunda proteína o polipéptido, un quelador de metal, un co-factor, un ácido graso, un carbohidrato, un polinucleótido (por ejemplo, ADN, ARN, etc.) y los semejantes) que comprende un segundo grupo reactivo. El primer grupo reactivo reacciona con el segundo grupo reactivo para anexar la molécula al aminoácido no naturales por medio de una [3+2] cicloadición. En una modalidad, el primer grupo reactivo es una porción alquinilo o azido y el segundo grupo reactivo es una porción azido o alquinilo. Por ejemplo, el primer grupo reactivo es la porción alquinilo (por ejemplo, un aminoácido no natural p-propargiloxifenilalanina) y el segundo grupo reactivo es la porción azido. En otro ejemplo, el primer grupo reactivo es la porción azido (por ejemplo, en el aminoácido no natural p-azido-L-fenilalanina) y el segundo grupo reactivo es la porción alquinilo. En una modalidad, la O-RS aminoacila el O-tARN con el aminoácido no natural por lo menos 50% tan eficientemente como una O-RS que tiene una secuencia de aminoácidos, por ejemplo como se resume en SEQ ID NO: 86 ó 45. En otra modalidad, el O-tARN comprende, es procesado de o es codificado por la SEQ ID NO: 65 ó 64, o una secuencia de polinucleótidos complementaria de la misma. En todavía otra modalidad, la O-RS comprende un aminoácido resumido en cualquiera de las SEQ ID NO: 36-63 (por ejemplo, 36-47, 48-63 o cualquier otro subconjunto de 36-63) y/u 86. La proteina codificada puede comprender, por ejemplo, una proteína terapéutica, una proteína de diagnóstico, una enzima industrial o porción de las mismas. Opcionalmente, la proteína que es producida mediante el método es modificada adicionalmente por medio del aminoácido no natural. Por ejemplo, la proteína producida mediante el método es modificada opcionalmente mediante por lo menos una modificación post-traducción in vivo. También se proporcionan métodos para producir una proteína moduladora transcripcional de filtración o selección (y proteínas moduladores transcripcionales de filtración o selección producidas mediante tales métodos) . Por ejemplo, un método incluye: seleccionar una primera secuencia de polinucleótidos, en donde la secuencia de polinucleótidos codifica un dominio de enlace de ácido nucleico y mutar la primera secuencia de polinucleótidos para incluir por lo menos un codón selector. Esto proporciona una secuencia de polinucleótidos de filtración o selección. El método también incluye: seleccionar una segunda secuencia de polinucleótidos, en donde la segunda secuencia de polinucleótidos codifica un dominio de activación transcripcional; proporcionar un constructo que comprende la secuencia de polinucleótidos de filtración o selección enlazada operativamente a la segunda secuencia de polinucleótidos e introducir al constructo, un aminoácido no natural, una tARN ortogonal (O-RS) y un tARN ortogonal (0-tARN) a una célula, con estos componentes, la 0-RS aminoacila preferiblemente el 0-tARN con- el aminoácido no natural y el 0-tARN reconoce el codón selector e incorpora el aminoácido no natural al dominio de enlace de ácido nucleico, en respuesta al codón selector en la secuencia de polinucleótidos de filtración o selección, proporcionando mediante esto la proteina moduladora transcripcional de filtración o selección. En ciertas modalidades, la proteina o polipéptido de interés (o porción del mismo) en los métodos y/o composiciones de la invención es codificado mediante un ácido nucleico. Comúnmente, el ácido nucleico comprende por lo menos un codón selector, por lo menos dos codones selectores, por lo menos tres codones selectores, por lo menos cuatro codones selectores, por lo menos cinco codones selectores, por lo menos seis codones selectores, por lo menos siete codones selectores, por lo menos ocho codones selectores, por lo menos nueve codones selectores, diez o más codones selectores.
La codificación de genes para proteínas o polipéptidos de interés puede ser mutagenizada utilizando métodos bien conocidos para el experimentado en la técnica y son descritos en la presente bajo "mutagénesis y otras técnicas de biología molecular" para incluir, por ejemplo uno o más codones selectores para la incorporal de un aminoácido no natural. Por ejemplo, un ácido nucleico para una proteína de interés es mutagenizado para incluir uno o más codones selectores, proporcionando la inserción del uno o más aminoácidos no naturales. La invención incluye cualquiera de tales variantes, por ejemplo mutante, versiones de cualquier proteína, por ejemplo que incluyen por lo menos un aminoácido no natural. Similarmente, la invención también incluye ácidos nucleicos correspondientes, esto es, cualquier ácido nucleico con uno o más codones selectores que codifica uno o más aminoácidos no naturales. En una modalidad ejemplar, la invención proporciona composiciones (y composiciones producidas mediante los métodos de la invención) que incluyen un mutante de Thr44, ArgllO TAG de GAL4, en donde la proteína GAL4 incluye por lo menos un aminoácido no natural. En otra modalidad, la invención proporciona composiciones que incluyen un mutante de Trp33 TAG de superóxido dismutasa humano (hSOD) , en donde la proteína hSOD incluye por lo menos un aminoácido no natural.
Purificación de proteínas recombinantes que comprenden aminoácidos no naturales. Proteínas de la invención, por ejemplo proteínas que comprenden aminoácidos no naturales, anticuerpos a proteínas que comprenden aminoácidos no naturales, etc. Pueden ser purificados, ya sea parcial o sustancialmente a la homogeneidad, de acuerdo con procedimientos estándares conocidos para y usados por aquellos de habilidad en la técnica, así, los polipéptidos de la invención pueden ser recuperados y purificados mediante cualquiera de una diversidad de métodos bien conocidos en la técnica, en los que se incluye, por ejemplo precipitación con sulfato de amonio o etanol, extracción por ácido o base, cromatografía en columna, cromatografía en columna de afinidad, cromatografía de intercambio aniónico o catiónico, cromatografía de fosfocelulosa, cromatografía de interacción idrofóbica, cromatografía de hidroxilapatita, cromatografía por lectina, electroforesis de gel y los semejantes. Se pueden usar tapas de redoblado de proteína, como se desee, en la elaboración de proteínas maduras correctamente dobladas. Cromatografía líquida de alto desempeño (HPLC) , cromatografía de afinidad u otros métodos apropiados pueden ser empleados en las etapas de purificación final en donde se desee alta pureza. En una modalidad, los anticuerpos elaborados contra aminoácidos no naturales (o proteínas que comprenden aminoácidos no naturales) son usados como reactivos de purificación, por ejemplo para purificación a base de afinidad de proteínas que comprenden uno o más aminoácido (s) no natural (es). Una vez purificados, parcialmente o a homogeneidad, como se desee, los polipéptidos son usados opcionalmente, por ejemplo como componentes de análisis, reactivos terapéuticos o como inmunógenos para la producción de anticuerpos. Además de otras referencias indicadas en la presente, una variedad de métodos de plegado de proteínas/purificación son bien conocidos en la técnica en los que se incluyen, por ejemplo aquellos resumidos en R. Scopes, Protein Purification, Springer-Verlag, N.Y. (1982); Deutscher, Methods in Enzymology Vol . 182: Guide to Protein Purification, Academic presiones, Inc. N.Y. (1990); Sandana (1997) Bioseparation of Proteins, Academic presiones, Inc.; Bollag et al. (1996) Protein Methods, 2a Edición Wiley-Liss, NY; Walker (1996) The Protein Protocols Handbook Human Press, NJ, Harris y Angal (1990) Protein Purification Applications; A Practical Approach IRL presiones en Oxford, Oxford, Inglaterra; Harris y Angal Protein Purification Methods : A Practical Approach IRL Press en Oxford, Oxford, Inglaterra; Scopes (1993) Protein Purification: Principies and Practice 3rd Edition Springer Verlag, NY; Janson y Ryden (1998) Protein Purification : Principies, High Resolution Methods and Applications, Second Edition Wiley-VCH, NY; y Walker (1998) Protein Protocols on CD-ROM Humana Press, NJ; y las referencias citadas en las mismas. Una ventaja de producir una proteina o polipéptido de interés con un aminoácido no natural en una célula eucarióntica es que comúnmente las proteínas o polipéptidos serán doblados en sus confirmaciones naturales. Sin embargo, en ciertas modalidades de la invención, aquellos de habilidad en la técnica reconocerán que, después de la síntesis, expresión y/o purificación, las proteínas pueden poseer una conformación diferente de las formaciones deseadas de los polipéptidos relevantes. En un aspecto de la invención, la proteína expresada es opcionalmente desnaturalizada y luego renaturalizada . Esto se lleva a cabo, por ejemplo mediante la adición de una chaperonina a la proteína o polipéptido de interés y/o al solubilizar las proteínas en un agente caotrópico, tal como guanidina HC1, etc. En general, es ocasionalmente deseable desnaturalizar y reducir los polipéptidos expresados y luego provocar que los polipéptidos se re-doblen a la conformación preferida. Por ejemplo, guanidina, urea, DTT, DTE y/o una chaperonina pueden ser agregados a un producto de traducción de interés. Métodos para reducir, desnaturalizar y renaturalizar proteínas son bien conocidos para aquellos de habilidad en la técnica (véanse, las referencias anteriores y Debinski, et al. (1993) J. Biol. Chem. 268:14065-14070; reitman y Pastan (1993) Biconjug. Chem., 4:581-585; y Buchner, et al (1992) Anal. Biochem. , 205:263-270) . Debinski, et al., por ejemplo, describen la desnaturalización y reducción de proteínas de cuerpo de inclusión en guanidina-DTE. Las proteínas pueden ser redobladas en una solución reguladora del pH redox que contiene por ejemplo glutationa oxidada y L-arginina . Los reactivos de re-doblado se pueden hacer fluir o hacerse mover de otra manera en contacto con el uno o más polipéptidos u otro producto de expresión y viceversa.
ANTICUERPOS En un aspecto, la invención proporciona anticuerpos a moléculas de la invención, por ejemplo sintetasas, tARN y proteínas que comprenden aminoácidos no naturales . Los anticuerpos a moléculas de la invención son útiles como reactivos de purificación, por ejemplo para purificar las moléculas de la invención, además, los anticuerpos pueden ser usados como reactivos indicadores para indicar la presencia de una sintetasa, un tARN o proteína que comprende un aminoácido no natural, por ejemplo para dar seguimiento a la presencia o ubicación (por ejemplo, in vivo o in situ) de la molécula . Un anticuerpo de la invención puede ser una proteína que comprende uno o más polipéptidos sustancial o parcialmente codificados por genes de inmunoglobulina o fragmentos de genes de inmunoglobulina. Los genes de inmunoglobulina reconocidos incluyen los genes de región kappa, lambda, alfa, gamma, delta, epsilón y mu constante, también como una miríada de genes de región variable de inmunoglobulina. Las cadenas ligeras con clasificadas ya sea como kappa o lambda. Las cadenas pesadas son clasificadas como gamma, mu, alfa, delta o epsilón, las cuales a su vez definen las clases de inmunoglobulina, IgG, IgM, IgA, IgD e IgE, respectivamente. Una unidad estructural de inmunoglobulina típica (por ejemplo anticuerpo) comprende un tetrámero. Cada tetrámero está compuesto de dos pares idénticos de cadenas de polipéptidos, cada par tiene una cadena "ligera" (aproximadamente 25 kD) y una cadena "pesada" (aproximadamente 50-70 kD) . El término N de cada cadena define una región variable de aproximadamente 100 a 110 o más aminoácidos principalmente responsables para el reconocimiento de antígeno. Los términos cadena ligera variable (VL) y cadena pesada variable (VH) se refieren a estas cadenas ligeras y pesadas, respectivamente. Existen anticuerpos como inmunoglobulinas intactas o como un número de fragmentos bien caracterizados producidos mediante digestión con varias peptidasas. Así, por ejemplo, los digestos de pepsina y anticuerpo por debajo de los enlaces de disulfuro en la región de engozne para producir F(ab')2, un dímero de Fab el cual en si mismo es una cadena ligera unido a VH-CH1 mediante un enlace de disulfuro. El F(ab')2 puede ser reducido bajo condiciones moderadas para romper el enlace de disulfuro en la región de engozne, convirtiendo mediante esto el dimero F(ab')2 a un monómero Fab'. El monómero Fab' es esencialmente un Fab con parte de la región de engozne (véase, Fundamental Immunology, 4th addition, W.E. Paul, ed., Raven Press, N.Y. (1999), para una descripción más detallada de otros fragmentos de anticuerpos) . En tanto que varios fragmentos de anticuerpos son definidos en términos de la digestión de un anticuerpo intacto, aquel de habilidad en la técnica apreciará que tales fragmentos Fab', etc. pueden ser sintetizados de novo ya sea químicamente o al utilizar metodología de ADN recombinante . Así, el término anticuerpo como se usa en la presente, también incluye opcxonalmente fragmentos de anticuerpo ya sea producidos mediante la modificación de anticuerpos enteros o sintetizados de novo utilizando metodologías de ADN recombinante . Los anticuerpos incluyen anticuerpos de una sola cadena, en los que se incluyen anticuerpos Fv de una sola cadena (sFv ó scFv) en los cuales una cadena pesada variable y una cadena ligera variable son unidas conjuntamente (directamente o por medio de un enlazador de péptido) para formar un polipéptido continuo. Los anticuerpos de la invención pueden ser, por ejemplo, policlonales, monoclonales, quiméricos, humanizados, de una sola cadena, fragmentos Fab, fragmentos producidos mediante una biblioteca de expresión Fab o los semejantes. En general, los anticuerpos de la invención son valiosos, tanto como reactivos generales y como reactivos terapéuticos en una variedad de procesos biológicos o moleculares o farmacéuticos. Métodos para producir anticuerpos policlonales y monoclonales están disponibles y pueden ser aplicados a la elaboración de los anticuerpos de la invención. Una diversidad de textos básicos describen procesos de producción de anticuerpos estándares, en los que se incluyen, por ejemplo, Borrebaeck (ed) (1995) Antibody Engineering, 2nd Edition Freeman and Company, NY (Borrebaeck); McCafferty et al. (1996) Antibody Engineering, A Practical Approach IRL en Oxford Press, Oxford, Inglaterra (McCafferty) , y Paul (1995) Antibody Engineering Protocols, Humana Press, Towata, NJ (Paul); Paul (ed.), (1999) Fundamental Immunology, Fifth Edition Raven Press, N.Y.; Coligan (1991) Antibodies: A Laboratory Manual Cold Spring Harbor Press, NY; Stites et al. (eds.) Basic and Clinical Immunology (4th ed.) Lange Medical Publications, Los Altos, CA, y referencias citadas en la presente; Goding (1986) Monoclonal Antibodies: Principies and Practice (2d ed.) Academic Press, New York; y Kohler y Milstein (1975) Nature 256:495-497. Una variedad de técnicas recoiabinantes para la preparación de anticuerpos que no dependen de, por ejemplo, inyección de un antigeno a un animal han sido desarrollados y pueden ser usados en el contexto de la presente invención. Por ejemplo, es posible generar y seleccionar bibliotecas de anticuerpos recombinantes en vectores fago o vectores similares. Véase, por ejemplo, Winter et al. (1994) Making Antibodies by Phage Display Technology Annu . Re . Immunol. 12:433-55 y las referencias citadas en la misma para una revisión. Véase también, Griffiths y Duncan (1998) Strategies fox selection of antibodies by phage display Curr Opin Biotechnol 9:102-8; Hoogenboom et al (1998) Antibody phage display technology and its applications Immunotechnology 4: 1-20; Gram et al. (1992) in vitro selection and affinity maturation of antibodies from a naive combinatorial immunoglobulin libzary PNAS 89:3576-3580; Huse et al. (1989) Science 246:1275-1281; y Ward, et al. (1989) Nature 341:544-546. En una modalidad, las bibliotecas de anticuerpo pueden incluir repertorios de genes V (por ejemplo cosechados de poblaciones de linfocitos o ensamblados in vitro) los cuales son clonados para la exhibición de dominios variables de cadena pesada y ligera asociados sobre la superficie del bacteriófago filamentoso. Los fagos son seleccionados mediante enlace a un antigeno. Anticuerpos solubles son expresados a partir de bacterias infectadas por fago y el anticuerpo puede ser mejorado, por ejemplo, vía mutagénesis. véase por ejemplo, Balint y Larrick (1993) Antibody Engineering by Parsimonious Mutagénesis Gene 137:109-118; Stemmer et al. (1993) Selection of an Active Single Chain Fv Antibody From a Protein Linker Library Prepared by Enzymatic Inverse PCR Biotechniques 14 (2 ) : 256-65 ; Crameri et al (1996) Construction and evolution of antibody-phage librarles by ADN shuffling Nature Medicine 2:100-103; y Cremeri y Stemmer (1995) Combinatorial múltiple cassette mutagénesis creates all the permutations of mutant and wildtype cassettes BioTechniques 18:194-195. Equipos para clonación y expresión de sistemas de fagos de anticuerpos recombinantes son también conocidos y están disponibles, por ejemplo el "recombinant phage antibody system, mouse ScFv module", de Amersham-Pharmacia Biotechnology (Uppsala, Suecia) . Bibliotecas de anticuerpo de bacteriófago también se han producido para elaborar anticuerpos humanos de alta afinidad mediante entremezcla de cadena (véase, por ejemplo Marks et al. (1992) By-Passing Immunization: Building High Affinity Human Antibodies by Chain Shuffling Biotechniques 10:779-782. También se reconocerá que se pueden preparar anticuerpos mediante cualquiera de un número de servicios comerciales (por ejemplo Bethyl Laboratories (Montgomery, X) , Anawa (Suiza), Eurogentec (Bélgica y en Estados Unidos de América en Filadelfia, PA, etc.) y muchos otros. En ciertas modalidades, es útil "humanizar" anticuerpos de la invención, por ejemplo en donde los anticuerpos van a ser administrados terapéuticamente, el uso de anticuerpos humanizados tiende a reducir la incidencia de respuestas inmune indeseables contra los anticuerpos terapéuticos (por ejemplo, cuando el paciente es humano) . Las referencias de anticuerpos anteriores describen estrategias de humanización, además de los anticuerpos humanizados, los anticuerpos humanos son también un aspecto de la invención, los anticuerpos humanos consisten de secuencias de inmunoglobulina característicamente humanas. anticuerpos humanos pueden ser producidos al utilizar una amplia variedad de métodos (véase por ejemplo Patente estadounidense No. 5,001,065, expedida a Larrick et al, para una revisión). Un procedimiento general para producir anticuerpos humanos mediante tecnología de trioma es descrito por Ostberg y colaboradores, (1983), Hybridoma 2:361-367, patente norteamericana No. 4,634,664 expedida a Ostberg y patente norteamericana No. 4,634,666 expedida a Engelman y colaboradores . üna variedad de métodos de uso de anticuerpos en la purificación y detección de proteínas son conocidos y pueden ser aplicados para detectar y purificar proteínas que comprenden aminoácidos no naturales como se indica en la presente. En general, los anticuerpos son reactivos útiles para ELISA, western blotting, inmunoquímica, métodos de cromatografía de afinidad, SPR y muchos otros métodos. Las referencias indicadas anteriormente proporcionan detalles en cuanto a como llevar a cabo análisis de ELISA, western blots, resonancia de plasmón superficial (SPR) y los semejantes. En un aspecto de la invención, los anticuerpos de la invención incluyen por sí mismos aminoácidos no naturales, proporcionando a los anticuerpos con propiedades de interés (por ejemplo, vida media mejorada, estabilidad, toxicidad o los semejantes) . Véase también, la sección en la presente intitulada "Polipéptidos con aminoácidos no naturales". Los anticuerpos cuentan casi el 50% de todos los compuestos actualmente en pruebas químicas ( ittrup, (1999) Phage on display Tibtech 17:423-424 y los anticuerpos son usados ubicuamente como reactivos de diagnóstico. Así, la capacidad de modificar anticuerpos con aminoácidos no naturales proporciona una herramienta importante para modificar estos reactivos valiosos . Por ejemplo, hay muchas aplicaciones de Abs al campo de diagnóstico. Los análisis fluctúan desde simples pruebas de puntos a métodos más involucrados tales como el NR-LU-10 MAb radio-marcado de DuPont Merck Co. Utilizado para formación de imagen de tumor (Rusch y colaboradores, (1993) NR-LU-10 monoclonal antxbody scannlng. A helpful new adjunct to computed tomography in evaluating non-small-cell lung cáncer. J Thorac Cardiovasc Surg 106:200-4) . Como se indica, los MAbs son reactivos centrales para ELISA, western blotting, inmunoquímica, métodos de cromatografía de afinidad y los semejantes. Cualquiera de tales anticuerpos de diagnóstico pueden ser modificados para incluir uno o más aminoácidos no naturales, alterar, por ejemplo, la especificidad o avidez del Ab por un objetivo o alterar una o más propiedades detectables, por ejemplo, al incluir una etiqueta detectable (por ejemplo, espectrográfica, fluorescente, luminiscente, etc.) en el aminoácido no natural . Una clase de reactivos de anticuerpo valioso son los Abs terapéuticos. Por ejemplo, los anticuerpos pueden ser MAbs específicos del tumor que detiene el crecimiento del tumor al apuntar células de tumor para destrucción mediante citotoxicidad moderada por la célula dependiente de anticuerpo (ADCC) o lisis moderada por complemento (CML) (estos tipos generales de Abs son denominados algunas veces como "balas mágicas") . Un ejemplo es Rituxan, un anti-CD20 MAb pata el tratamiento de linfoma no de Hodgkins (Scott (1998) Rituximab: a new therapeutic monoclonal antxbody for non-Hodgkin' s lymphom Cáncer Pract 6:195-7) . Un segundo ejemplo es concerniente con anticuerpos que interfieren con un componente critico del crecimiento del tumor. La herceptina es un anticuerpo monoclonal anti-HER-2 para el tratamiento de cáncer de pecho metastático y proporciona un ejemplo de un anticuerpo con este mecanismo de acción (Baselga y colaboradores, (1998) Recombinant humanlzed anti-HER2 antibody (Herceptin) enhances the antitumor activity of paclitaxel and doxorubicin agaínst HER2/neu overexpressing human breast cáncer xenografts [published erratum appears in Cáncer Res (1999) 59(8) :2020], Cáncer Res 58:2825-31). Un tercer ejemplo es concerniente con anticuerpos para administración de compuestos citotóxicos (toxinas, radionuclidos, etc.) directamente a un tumor u otro sitio de interés. Por ejemplo, un Mab de aplicación es CYT-356, un anticuerpo 90Y-enlazado que dirige la radiación directamente a células de tumor de próstata (Deb y colaboradores, (1996) Treafcment of hormone-ref actory prostate cáncer with 90Y CYT-356 monoclonal antibody Clin Cáncer Res 2:1289-97. Una cuarta aplicación es terapia de profármaco de enzima dirigida al anticuerpo, donde una enzima co-localizada a un tumor activa un profármaco administrado sistémicamente en la vecindad de tumor. Por ejemplo, un anticuerpo anti-Ep-CAMl enlazado a carboxipeptidasa A es desarrollado para tratamiento de cáncer colorectal (Wolfe y colaboradores, (1999) Antibody-directed enzyme prodrug therapy with the T268G mutant of human carboxypeptidase Al: in vitro and in vivo studies with prodrugs of methotrexate and the thymidylate synthase inhibitors GW1031 and GW1843 Bioconjug Chem 10:38-48) . Otros Abs (por ejemplo, antagonistas) están diseñados para inhibir especifreamente las funciones celulares normales para un beneficio terapéutico. Un ejemplo es Ortoclon 0KT3, un anti-CD3 MAb ofrecido por Johnson and Johnson para reducir el rechazo de transplante de órganos agudo (Strate y colaboradores, (1990) Ortlaoclone OKT3 as first-line therapy in ac te renal allograft rejection Transplant Proc 22:219-20. Otra clase de productos o anticuerpos son los agonistas. Estos Mabs están diseñados para mejorar específicamente funciones celulares normales para un beneficio terapéutico. Por ejemplo, los agonistas a base de Mab de receptores de acetilcolina para neuroterapía están en desarrollo (Xie y colaboradores, (1997) Direct demonstration of MuSK involvement in acetylcholine receptor clustering through identification of agonist ScFv Nat. Biotechnol. 15:768-71. Cualquiera de estos anticuerpos pueden ser modificados para incluir uno o más aminoácidos no naturales para mejorar una o más propiedades terapéuticas (especificidad, avidez, vida media en el suero, etc.) . Otra clase de productos de anticuerpo proporcionan funciones novedosas. Los anticuerpos principales en este grupo son anticuerpos catalíticos tales como secuencias Ig que han sido diseñadas para imitar las capacidades catalíticas de enzimas (Wentworth y Janda (1998) Catalytlc antibodies Curr Opin Chem Biol 2:138-44. Por ejemplo, una aplicación interesante involucra usar el anticuerpo catalítico mAb-15A10 para hidrolizar cocaína in vivo para terapia de adicción (Mets y colaboradores, (1998) A catalytlc antlbody against cocaine prevenís cocaine' s reinforcing and toxic effects in rats Proc Nati Acad Sci E ü A 95:10176-81) . Los anticuerpos catalíticos pueden también ser modificados para incluir uno o más aminoácidos no naturales para mejorar una o más propiedades de interés .
Definición de Polipéptidos mediante Inmunorreactividad Debido a que los polipéptidos de la invención proporcionan una variedad de nuevas secuencias de polipéptidos (por ejemplo, que comprenden aminoácidos no naturales en el caso de proteínas sintetizadas en los sistemas de traducción en la presente o, por ejemplo, en el caso de nuevas sintetasas en la presente, nuevas secuencias de aminoácidos estándar) , los polipéptidos también proporcionan nuevos aspectos estructurales cuales pueden ser reconocidos , por ejemplo, en análisis inmunológicos . La generación de anticuerpos o anticuerpos que enlazan específicamente los polipéptidos de la invención, también como los polipéptidos que son enlazados mediante tales anticuerpos o antisuero, son un aspecto de la invención. Por ejemplo, la invención incluye proteínas de sintetasa que enlazan específicamente a o que son específicamente inmunorreactivas con un anticuerpo o antisueros generados contra un inmunógeno que comprende una secuencia de aminoácidos seleccionada de una o más de (SEQ ID NO: 36-63 (por ejemplo, 36-47, 48-63 o cualquier otro subconjunto de 36-63) y/u 86) . Par eliminar la reactividad cruzada con otros homólogos, el anticuerpo o antisuero es sustraído con homólogos de sintetasa de control disponibles, tales como la tirosil sintetasa (TyrRS) de E. coli tipo silvestre (por ejemplo, SEQ ID NO.: 2) . En un formato típico, el inmunoanálisis utiliza un antisuero policlonal el cual fue criado contra uno o más polipéptidos que comprenden una o más de las secuencias correspondientes a uno o más de SEQ ID NO: 36-63 (por ejemplo, 36-47, 48-63 o cualquier otro subconjunto de 36-63), y/u 86 o una secuencia sustancial de la misma (esto es, por lo menos aproximadamente 30% de toda la secuencia de longitud provista) . El conjunto de inmunógenos de polipéptidos potenciales derivados de' SEQ ID NO: 36-63 y 86 son denominados colectivamente a continuación como "los polipéptidos inmunógenos". Los antisueros resultantes son seleccionados opcionalmente para tener baja reactividad cruzada contra los homólogos de sintetasa de control y cualquiera de tal reactividad cruzada es eliminada, por ejemplo, mediante inmunoabsorción, con uno o más homólogos de sintetasa de control, antes del uso del antisuero policlonal en el inmunoanálisis . Con el fin de producir antisueros para uso en un inmunoanálisis, uno o más de los polipéptidos inmunógenos es producido y purificado como se describe en la presente. Por ejemplo, la proteina recombinante puede ser producida en una célula recombinante. Una cepa inbred de ratón (utilizada en este análisis debido a que los resultados son más reproducibles debido a la identidad genética virtual del ratón) es inmunizada con la(s) proteina (s) inmonogénica en combinación con un adyuvante estándar, tal como adyuvante de Freund y un protocolo de inmunización de ratón estándar (véase, por ejemplo, Harlo y Lañe (1988) Antibodies, A Laboratory Manual, Cold Spring Harbor Publications, Nueva York, para una descripción de generación de anticuerpos, formatos de inmunoanálsis y condiciones que pueden ser usadas para determinar la inmunorreactividad especifica. Referencias y discusión adicionales de anticuerpos también se encuentran en la presente y pueden ser aplicadas en los mismos para hacer a los anticuerpos para definir/detectar polipéptidos mediante inmunorreactividad) . Alternativamente, uno o más polipéptidos sintéticos o recombinantes derivados de las secuencias derivadas en la presente es conjugado a una proteina portadora y utilizado como inmunógeno. Los sueros policlonales son recolectados y titulados contra el polipéptido inmunogénico en un inmunoanálisis , por ejemplo un inmunoanálisis de fase sólida con una o más de las proteínas inmunogénicas inmovilizadas sobre un soporte sólido. Antisueros policlonales con un titulo de 106 o mayor son seleccionados, acumulados y substraídos con los polipéptidos de sxntetasa de control para producir antisueros policlonales titulados acumulados substraxdos . Los antisueros policlonales titulados acumulados substraxdos son probados en cuanto reactividad cruzada contra los homólogos de control en un inmunoanálisis comparativo. En este análisis comparativo, condiciones de enlace discriminatorias son determinadas para los antisueros policlonales titulados substraídos los cuales dan como resultado una proporción de señal a ruido aproximadamente 5-10 veces más alta' para el enlace de los antisueros policlonales titulados a la sxntetasa inmunogénica en comparación al enlace a un homólogo de sxntetasa de control. Esto es, la astringencia, de la(s) reacción(es) de enlace/lavado es/son ajustada (s) mediante la adición de competidores no específicos tales como albúmina o leche seca sin grasa y/o al ajusfar las condiciones de sal, temperatura y/o los semejantes. Estas condiciones de enlace/lavado son usadas en análisis subsecuentes para determinar si un polipéptido de prueba (un polipéptido que es compara con los polipéptidos inmunogénicos y/o los polipéptidos de control) es enlazado específicamente a los antisueros policlonales substraídos acumulados. En particular, los polipéptidos de prueba que muestran por lo menos una proporción de señal a ruido 2-5x más alta que el homólogo de sintetasa de control bajo conexiones de enlace descriminatorias y por lo menos aproximadamente una proporción de señal a ruido ½ en comparación con el (los) polipéptido (s) inmunogénico (s) , coparte similaridad estructural sustancial con el polipéptido inmunogénico en comparación con las sxntetasas conocidas y es por consiguiente un polipéptido de la invención. En otro ejemplo, inmunoanálisis en el formato de enlace competitivo son usados para detección de un polipéptido de prueba. Por ejemplo, como se indica, anticuerpos de reacción cruzada son eliminados de la mezcla de antisuero acumulado mediante inmunoabsorción con los polipéptidos de control. Luego el (los) polipéptido (s) inmunogénico (s) son inmovilizados a un soporte sólido el cual es expuesto a los antisueros acumulados substraídos. Proteínas de prueba son agregadas al análisis para competir para el enlace a los antisueros substraídos acumulados. La capacidad de la(s) proteína (s) de prueba para competir por el enlace a los antisueros substraídos acumulados en comparación con la(s) proteína (s) inmobilizada ( s ) es comparada con la habilidad del (los) polipéptido (s) inmunogénico (s) agregada (s) al análisis para competir por el enlace (los polipéptidos inmunogénicos compiten efectivamente con los polipéptidos inmunogénicos inmovilizados para el enlace a los antisueros acumulados) . El por ciento de actividad cruzada para las proteínas de prueba es calculado, utilizando cálculos estándar. En un análisis paralelo, la capacidad de las proteínas de control para competir con el enlace a los antisueros substraídos acumulados es determinada opcionalmente en comparación con la capacidad del (los) polipéptido ( s) inmunogénico (s) para competir con el enlace a los antisueros. Otra vez, el por ciento de reactividad cruzada para los polipéptidos de control es calculado, utilizando cálculos estándar. Donde el por ciento de reactividad cruzada es por lo menos 5-10x tan alta para los polipéptidos de prueba en comparación con los polipéptidos de control y/o donde el enlace de los polipéptidos de prueba está aproximadamente en el intervalo de enlace de los polipéptidos inmunogénicos se dice que los polipéptidos de prueba se enlacen específicamente de los antisueros substraídos acumulados. En general, los antisueros inmunoabsorbidos y acumulados pueden ser usados en inmunoanálisis de enlace competitivo como se describe en la presente para comparar cualquier polipéptido de prueba al (los) polipéptido ( s ) inmunogénico y/o de control. Con el fin de hacer esta comparación, los polipéptidos inmunogénicos, de prueba y control son cada uno analizados a un amplio intervalo de concentraciones y la cantidad de cada polipéptido requerido para inhibir el 50% del enlace de los antisueros substraídos, a por ejemplo una proteína de control, prueba o inmunogénica inmovilizada es determinado utilizando técnicas estándar. Si la cantidad del polipéptido de prueba requerida para enlace competitivo es menor que dos veces la cantidad del polipéptido inmunogénico que es requerido entonces se dice que el polipéptido de prueba se enlaza específicamente a un anticuerpo generado a la proteína inmunogénica, a condición de que la cantidad sea por lo menos aproximadamente 5-10x tan alta como para el polipéptido de control. Como determinación adicional de especificidad, los antisueros acumulados son opcionalmente inmunosorbidos plenamente con el (los) polipéptido (s ) inmunogénico (s) (en lugar de los polipéptidos de control) hasta que poco o ningún enlace de los antisueros acumulados substraídos del polipéptido inmunogénico resultante al (los) polipéptido ( s ) inmunogénico (s) utilizado (s) en la inmunosorbción es detectable. Luego estos antisueros plenamente inmunoabsorbidos son probados en cuanto reactividad con el polipéptido de prueba. Si se observa poca o ninguna reactividad (esto es, no más de 2x la proporción de señal a ruido observada para el enlace de los antisueros plenamente inmunoabsorbidos al polipéptido inmunogénico) , entonces el polipéptido de prueba es enlazado específicamente por los antisueros producidos por la proteína inmunogénica.
COMPOSICIONES FARMACEUTICAS Los polipéptidos o proteínas de la invención (por ejemplo, sintetasas, proteínas que comprenden uno o más aminoácidos no naturales, etc.) son usados opcionalmente para usos terapéuticos, por ejemplo, en combinación con un portador farmacéutico apropiado. Tales composiciones, por ejemplo, comprenden una cantidad terapéuticamente efectiva del compuesto y un portador o excipiente aceptable farmacéuticamente. Tal portador o excipiente incluye, pero no está limitado a, solución salina, solución salina de pH regulado, dextrosa, agua, glicerol, etanol y/o combinaciones de los mismos. La formulación se hace apropiada al modo de administración. En general, los métodos para administrar proteínas son bien conocidos en la técnica y pueden ser aplicados a la administración de los polipéptidos de la invención . Composiciones terapéuticas que comprende uno o más polipéptidos de la invención son probadas opcionalmente en uno o más modelos de animales in vitro y/o in vivo apropiados de enfermedad, para confirmar la eficacia, metabolismo del tejido y para estimar dosificaciones de acuerdo con métodos bien conocidos en la técnica. En particular, las dosificaciones pueden ser determinadas inicialmente mediante actividad, estabilidad u otras medidas apropiadas de aminoácidos no naturales en la presente a homólogos de aminoácidos naturales (por ejemplo, comparación de un EPO modificado para incluir uno o más aminoácidos no naturales a un EPO de aminoácido natural) , esto es, en un análisis relevante . La administración es mediante cualquiera de las rutas usadas normalmente para introducir una molécula en contacto final con la sangre o células de tejido. Los polipéptidos de aminoácido no natural de la invención son administrados de cualquier manera apropiada, opcionalmente con uno o más portadores aceptables farmacéuticamente. Métodos apropiados para administrar tales polipéptidos en el contexto de la presente invención aún paciente están disponibles y aunque más de una ruta puede ser usada para administrar una composición particular, una ruta particular puede frecuentemente proporcionar una acción o reacción más inmediata y más efectiva que otra ruta. Portadores aceptables farmacéuticamente son determinados en parte por la composición particular que es administrada, también como por el método particular usado para administración la composición. Asi, hay una amplia variedad de formulaciones apropiadas de composiciones farmacéuticas de la presente invención. Las composiciones de polipéptido pueden ser administradas por una diversidad de rutas en las que se incluye, pero no limitadas a: oral, intravenosa, intraperitoneal, intramuscular, transdérmica, subcutánea, tópica, sublingual o medios rectales. Composiciones de polipéptidos de aminoácidos no naturales pueden ser también administradas vía liposomas. Tales rutas de administración y formulaciones apropiadas son en general conocidas para aquellos de habilidad en la técnica. El polipéptido de aminoácidos no natural, solo o en combinación con otros componentes apropiados, también puede ser elaborado en formulaciones de aerosol (esto es, puede ser "nebulizado") para ser administrado vía inhalación. Formulaciones de aerosol pueden ser colocadas en propelentes acetables presurizados, tales como diclorodifluorometano, propano, nitrógeno y los semejantes. Formulaciones apropiadas para administración parenteral, tales como, por ejemplo, mediante intraarticular (en las articulaciones), rutas intravenosas, intramusculares, intradérmicas , intraperitoneales y subcutáneas, incluyen soluciones de inyección estériles isotónicas acuosos y no acuosas, las cuales pueden contener antioxidantes, soluciones reguladoras del pH, bacteriostáticos y solutos que vuelven a la formulación isotónica con la sangre del receptor propuesto y suspensiones estériles acuosas y no acuosas que pueden incluir agentes de suspensión, solubilizadores , agentes espesantes, estabilizadores y conservadores. Las formulaciones de ácido nucleico empacadas pueden ser presentadas en recipientes sellados de una solo dosis o múltiples dosis tales como ampolletas y frascos. La administración parenteral y administración intravenosa son métodos de administración preferidos . En particular, las rutas de administración ya en uso en terapéuticos de homólogos de aminoácido naturales (por ejemplo, aquellos usados para EPO, GCSF, GMCSF, IFNs, interleucinas, anticuerpos y/o cualquier otra proteina administrada farmacéuticamente) , junto con formulaciones en uso actual, proporcionan rutas preferidas de administración y cualquier formulación para las proteínas que incluyen aminoácidos no naturales de la invención -(por ejemplo, variantes con polietilenglicol de proteínas terapéuticamente actuales, etc.). La dosis administrada a un paciente, en el contexto de la presente invención, es suficiente para efectuar una respuesta terapéutica benéfica en el paciente con el paso del tiempo o, por ejemplo para inhibir la infección por un patógeno y otra actividad apropiada, dependiendo de la aplicación. La dosis es determinada por la eficacia de una composición/formulación particular y la actividad, estabilidad o vida media en el suero del polipéptido de aminoácido no natural empleado y la condición del paciente también como el peso corporal o área superficial del paciente a ser tratado. El tamaño de la dosis es también determinado por la existencia, naturaleza y extensión de cualesquier efectos secundarios adversos que acompañan la administración de una composición/formulación particular o los semejantes en un paciente particular. En la determinación de la cantidad efectiva de la composición/formulación hacer administrada en el tratamiento o profilaxis de enfermedad (por ejemplo, canceres, enfermedades hereditarias, diabetes, SIDA o los semejantes), el médico evalúa los niveles de plasma circulantes, toxicidades de la formulación, avances de la enfermedad y/o en donde sea relevante, la producción de anti-anticuerpos de polipéptido de aminoácido no naturales . La dosis administrada, por ejemplo, a un paciente de 70 kilogramos, está comúnmente en el intervalo equivalente a dosificaciones de proteínas terapéuticas usadas actualmente, ajustadas por la actividad alterada o vida media en el suero de la composición relevante. Las composiciones/formulaciones de esta invención pueden complementar condiciones de tratamiento mediante cualquier terapia convencional conocido, en la que se incluyen administración de anticuerpos, administración de vacunas, administración de agentes citotóxicos, polipéptidos de aminoácido naturales, ácidos nucleicos, análogos de nucleótidos, modificadores de respuesta biológica y los semej antes . Para la administración, las formulaciones de la presente invención son administradas a una proporción determinada por la LD-50 de la formulación relevante y/o observación de cualesquier efectos secundarios de los aminoácidos no naturales a varias concentraciones, por ejemplo, tal como se aplica a la masa y salud global del paciente. La administración puede ser acompañada via una sola dosis o dosis dividida. Si un paciente sufre infusión de una formulación desarrolla fiebres, enfriamientos o dolores musculares, recibe la dosis apropiada de aspirina, ibuprofeno, acetaminofen u otros fármacos que controla el dolor/fiebre. Los pacientes que experimentan reacciones a la infusión tales como fiebre, dolores musculares y enfriamiento son premedicados 30 minutos antes de las infusiones futuras ya sea con aspirina, acetaminofen o, por ejemplo, difenhidramin . Se usa meperidina para enfriamientos más severos y dolores musculares que no responden rápidamente a antipiréticos y antihistamínicos . El tratamiento es frenado o discontinuado dependiendo de la severidad de la reacción.
SECUENCIAS Y VARIANTES DE ACIDOS NUCLEICOS Y POLIPEPTIDOS Como anteriormente y a continuación, la invención proporciona secuencias de polinucleótidos de ácidos nucleicos y secuencias de aminoácidos de polipéptidos, por ejemplo, 0-tARNs y 0-RSs y por ejemplo, composiciones y métodos que comprenden tales secuencias. Ejemplos de las secuencias, por ejemplo, 0-tARNs y 0-RSs son revelados en la presente (véase, Tabla 5, por ejemplo, SEQ ID NO. 3-65, 86 y otras que las secuencias ID NO. : 1 y 2) . Sin embargo, un aquel de habilidad ordinaria en la técnica apreciará que la invención no está limitadas a aquellas secuencias reveladas en la presente, por ejemplo, los Ejemplos y Tabla 5. El experimentado en la técnica apreciará que la invención también proporciona muchas secuencias relacionadas y aún secuencias no relacionadas con las funciones descritas en la presente, por ejemplo, codificación de un 0-tARN o una O-RS. La invención también proporciona polipéptidos (0-RSs) y polinucleótidos, por ejemplo, 0-tARN, polinucleótidos que codifican 0-RSs o porciones de las mismas (por ejemplo, el sitio activo de la sintetasa) , oligonucleótidos usados para construir imitantes de aminoacil-tARN sintetasa, etc. Por ejemplo, un polipéptido de la invención incluye un polipéptido que comprende una secuencia de aminoácidos como se muestra en cualquiera de las SEQ ID NO. : 36-63 (por ejemplo, 36-47, 48-63 o cualquier otro subconjunto de 36-63), y/u 86, un polipéptido que comprende una secuencia de aminoácidos codifica por una secuencia de polinucleótidos como se muestra en cualquiera de las SEQ ID NO. : 3-35 (por ejemplo, 3-19, 20-35 o cualquier otro subconjunto de secuencias 3-35) y un polipéptido que es específicamente inmunorreactivo con un anticuerpo específico para un polipéptido que comprende una secuencia de aminoácidos como se muestra en cualquiera de las SEQ ID NO.: 36-63 y/u 86 o un polipéptido que comprende una secuencia de aminoácidos codificada por una secuencia de polinucleótidos como se muestra en cualquier de las SEQ ID NO. : 3-35 (por ejemplo, 3-19, 20-35 o cualquier otro subconjunto de secuencias 3-35) . También incluidos entre los polipéptidos de al invención están polipéptidos que comprende una secuencia de aminoácidos que es por lo menos 90% idéntica de aquella de una tirosil aminoacil-tARN sintetasa (TyrRS) que se presenta de manera estable en la naturaleza (por ejemplo, SEQ ID NO. : 2) y comprende dos o más aminoácidos de los grupos A-E. Por ejemplo, el grupo A incluue valina, isoleucina, leucina, glicina, serina, alanina o treonina en una posición correspondiente a Tyr37 de tris de E. coli; el grupo B incluye aspartato en una posición correspondiente a Asnl26 de tris de E. coli; el grupo C incluye treonina, serina, arginina, asparagina o glicina en una posición correspondiente a Asp 82 de tris de E. coli? el grupo D incluye metionina, alanina, valina o tirosina en una posición correspondiente a Phel83 TyrRS de E. coli; y el grupo E incluye serina, metionina, valina, cisteina, treonina o alanina en una posición correspondiente a Leul86 TyrRS de E. coli. Cualquier subconjunto de combinaciones de estos grupos son un aspecto de la invención. Por ejemplo, en una modalidad, la O-RS tiene dos o más aminoácidos seleccionados de valina, isoleucina, leucina o treonina que ocurre en una posición correspondiente a Tyr37 de TyrRS de E. coli; treonina, serina, arginina o glicina en una posición correspondiente a Aspl82 de TyrRS de E. coli; metionina o tirosina en una posición correspondiente a Phel83 de TyrRS de E. coli; y serina o alanina en una posición correspondiente a Leul86 de TyrRS de E. coli. En otra modalidad, la O-RS incluye dos o más aminoácidos seleccionados de glicina, serina o alanina en una posición correspondiente a Tyr37 de TyrRS de E. coli, aspartato en una posición correspondiente a Asnl26 de TyrRS de E. coli, asparagina en una posición correspondiente a Aspl82 de TyrRS de E. coli, alanina o valina, en una posición correspondiente a Phel83 de TyrRS de E. coli y/o metionina, valina, cisteina o treonina, en una posición correspondiente a Leul86 de TyrRS de E. coli. Similarmente, los polipéptidos de la invención también incluyen un polipéptido que comprende por lo menos 20 aminoácidos contiguos de secuencias SEQ ID NO. : 36-63 (por ejemplo, 36-47, 48-63 o cualquier otro subconjunto de 36-63) y/u 86 y dos o más sustituciones de aminoácidos como se indica anteriormente en los grupos A-E. Véase también, Tabla 4, Tabla 6 y/o Tabla 8,. en la presente. Una secuencia de aminoácidos que comprende una variación conservadora de las polipéptidos anteriores está también incluida como polipéptido de la invención. En una modalidad, una composición incluye un polipéptido de la invención y un excipiente (por ejemplo, solución reguladora del pH, agua, excipiente aceptable farmacéuticamente, etc.) . La invención también proporciona un anticuerpo o antisuero especifico inmunorreactivo con un polipéptido de la invención. También se proporcionan polinucleótidos en la invención. Los polinucléótidos de la invención incluyen aquellos que codifican proteínas o polipéptidos de interés de la invención o que incluyen uno o más codones selectores o ambos. Por ejemplo, los polinucleótidos de la invención incluyen, por ejemplo, los polinucleótidos de la invención incluyen, por ejemplo un polinucleótido que comprende una secuencia de nucleótidos como se resume en cualquiera de las secuencias SEQ ID NO. : 3-35 (por ejemplo, 3-19, 20-35 o cualquier otro subconjunto de secuencias 3-35), 64-85; un polinucleótido que es complementario a o que codifica una secuencia de polinucleótidos del mismo; y/o un polinucleótido que codifica un polipéptido que comprende una secuencia de aminoácidos como se resume en cualquiera de las SEQ ID NO.: 36-63 y/u 86 o una variación conservadora de la misma. Un polinucleótido de la invención también incluye un polinucleótido que codifica un polipéptido de la invención. Similarmente, un ácido nucleico que se híbrida a un polinucleótido indicado anteriormente bajo condiciones altamente estringentes en sustancialmente toda la longitud del ácido nucleico es un polinucleótido de la invención. Un polinucleótido de la invención también incluye un polinucleótido que codifica un polipéptido que comprende una secuencia de aminoácidos que es por lo menos 90% idéntica a aquella de una tirosil aminoacil-tARN sintetasa (TyrRS) que se presenta de manera estable en la naturaleza (por ejemplo, SEQ ID NO. : 2) y comprende dos o más mutaciones como se indic antiriormente en los grupos A-E (anteriores) . Un polinucleótido que es por lo menos 70%, (o por lo menos 75%, por lo menos 80%, por lo menos 85%, por lo menos 90%, por lo menos 95%, por lo menos 98% o por lo menos 99% o más) a un polinucleótido indicado anteriormente y/o un polinucleótido que comprende una variación conservadora de cualquiera de los polinucleótido indicados anteriormente está también incluido entres los polinucleótidos de la invención. Véase también. Tabla 4, Tabla 6 y/o Tabla 8, en la presente. En ciertas modalidades, un vector (por ejemplo, un plásmido, un cósmido, un fago, un virus, etc.) comprende un polinucleótido de la invención. En una modalidad, el vector es un vector de expresión. En otra modalidad, el vector de expresión incluye un promotor enlazado operativamente a uno o más de los polinucleótidos de la invención. En otra modalidad, una célula comprende un vector que incluye un polinucleótido de la invención. Aquel de habilidad en la técnica apreciará que muchas variantes de las secuencias reveladas están incluidas en la invención. Por ejemplo, variaciones conservadoras de las secuencias reveladas que producen una secuencia funcionalmente idéntica están incluidas en la invención. Variantes de las secuencias de polinucleótidos de ácido nucleico, en donde las variantes hibridizan a por lo menos una secuencia revelado, se consideran incluidas en la invención. Secuencias únicas de las secuencias reveladas en la presente, tal como se determina por ejemplo, mediant técnicas de comparación de secuencias estándar, también están incluidas en la invención.
Variaciones conservadoras Debido a la degeneración del código genético, "sustituciones silentes" (esto es, sustituciones en una secuencia de ácido nucleico que no dan como resultado una alteración en un polipéptido codificado) son un aspecto implicado de cada secuencia de ácido nucleico que codifica un aminoácido. Similarmente, "sustituciones de aminoácido conservadora", en uno o unos pocos aminoácidos en una secuencia de aminoácidos son sustituidas con diferentes aminoácidos con propiedades altamente similares, son también fácilmente identificadas como altamente similares a una construcción revelada. Tales variaciones conservadoras de cada secuencia revelada son un aspecto de la presente invención . "Variaciones conservadoras" de una secuencia de ácido nucleico particular se refiere a aquellos ácidos nucleicos que codifican secuencias de aminoácidos idénticas o esencialmente idénticas o donde el ácido nucleico no codifica una secuencia de aminoácidos, a secuencias esencialmente idénticas . Aquel de habilidad en la técnica reconocerá que sustituciones individuales, cancelaciones o adiciones que alteran, agregan o cancelan un solo aminoácido un porcentaje pequeño de aminoácidos (comúnmente menos de 5%, más comúnmente menos de 4%, 2% o 1%) en una secuencia codificada son "variaciones modificadas conservadoramente" donde las alteraciones dan como resultado la cancelación de un aminoácido, adición de un aminoácido o sustitución de un aminoácido con un aminoácido químicamente similar. Así, "variaciones conservadoras" de una secuencia de polipeptidos enlistado de la presente invención incluyen sustituciones de un porcentaje pequeño, comúnmente menos de 5%, más comúnmente menos de 2% o 1%, de los aminoácidos de la secuencia de polipéptidos , con un aminoácido conservadoramente seleccionado del mismo grupo de sustitución conservador. Finalmente, la adición de secuencias que no alteran la actividad codificada de una molécula de ácido nucleico, tal como la adición de una secuencia no funcional, es una variación conservadora del ácido nucleico básico. Tablas de sustitución conservadoras que proporcionan aminoácidos funcionalmente similares son bien conocidas en el técnica. Lo siguiente resume grupos ejemplares que contienen aminoácidos naturales que incluyen "sustituciones conservadoras" para otro.
Grupos de Sustitución Conservadores 1 Alanina (A) Serina (S) Treonina (T) 2 Acido Acido aspártico (D) glutámico (E) 3 Asparagina Glutamina (Q) (N) 4 Arginina (R) Lisina (K) 5 Isoleucina Leucina (L) Metionina Valina (I) (M) (V) ¦ 6 Fenilalanina Tirosina (Y) Triptófano (F) (W) Hibridación de Acido Nucleico Se puede usar hibridación comparativa para identificar ácidos nucleicos de la invención, en las que se incluyen variaciones conservadoras de ácidos nucleicos de la invención y este método de hibridación comparativo es un método preferido para distinguir ácidos nucleicos de la invención. Además, ácidos nucleicos objetivo que hibridizan a los ácidos nucleicos representados por SEQ ID NO: 3-35 (por ejemplo, 3-19, 20-35 o cualquier otro subconjunto de secuencias 3-35) , 64-85 bajo condiciones de severidad alta, ultra-alta y ultra-ultra alta son un aspecto de la invención. Ejemplos de tales ácidos nucleicos incluyen aquellos con uno o pocas sustituciones de ácido nucleico conservadoras en comparación con una secuencia de ácido nucleico dada. Se dice que un ácido nucleico de prueba hibridiza específicamente a un ácido nucleico de sonda que hibridiza a por lo menos ½ también como a la sonda que coincide perfectamente con el objetivo complementario, esto es, con una proporción de señal a ruido por lo menos ½ tan alta como la hibridación de la sonda al objetivo bajo condiciones en las cuales la sonda que coincide perfectamente se enlaza al objetivo complementario perfectamente coincidente con una proporción de señal a ruido que es por lo menos aproximadamente 5x-10x tan alta como aquella observada para la hibridación a cualquiera de los ácidos nucleicos objetivo sin coincidir. Los ácidos nucleicos se "hibridan" cuando son asociados, comúnmente en solución. Los ácidos nucleicos se hibridan debido a una variedad de fuerzas fisicoquímicas bien caracterizadas, tales como enlace de hidróqeno, exclusión de solvente, apilado de base y los semejantes. Una guía extensa a la hibridación de ácidos nucleicos se encuentra en Tijssen (1993) Laboratory Techniques in Biochemistry and Molecular Bíology—Hybridization with Nucleic Acid Probes parte I capítulo 2, "Overview of principies of hibridación and the strategy of nucleic acid probé assays, "(Elsevier, Nueva York), también como en Ausubel, supra. Hames y Higgins (1995) Gene Probes 1 IRL Press at Oxford University Press, Oxford, England, (Hames y Higgins 1) y Hames y Higgins (1995) Gene Probes 2 IRL Press at Oxford University Press, Oxford, England (Hames y Higgins 2) proporciona detalles en cuanto a la síntesis, marcación, detección y cuantificación de ADN y ARN, que incluyen oligonucleótidos . Un ejemplo de condiciones de hibridación estringentes para la hibridación de ácidos nucleicos complementarios los cuales tienen más de 100 residuos complementarios en un filtro en un manchado de Southern o northern es formalina al 50% con un 1 mg de heparina a 42°C, con la hibridación se lleva a cabo toda la noche. Un ejemplo de condiciones de lavado estringentes es un lavado 0.2x SSC a 65 °C durante 15 minutos (véase, Sambrook, supra para una descripción de la solución reguladora del pH SSC) . Frecuentemente, el lavado de alta severidad es precedido por un lavado de baja severidad para eliminar la señal de sonda de fondo. Un ejemplo de lavado de baja severidad es 2x SSC a 40°C durante 15 minutos. En general, una proporción de señal a ruido de 5x (o más alta) que aquella observada para una sonda no relacionada en el análisis de hibridación particular indica detección de una hibridación específica. "Condiciones de lavado de hibridación estringentes" en el contexto de ' experimentos de s hibridación de ácido nucleico tales como hibridaciones Southern y northern son dependientes de la secuencia, y diferentes bajo diferentes parámetros ambientales. Una guia extensa para la hibridación de ácidos nucleicos se encuentra en Tijssen (1993), supra. y en Hames y Higgins 1 y 2. La hibridación estringente y condiciones da lavo se pueden determinar fácilmente de manera empírica para cualquier ácido nucleico de prueba. Por ejemplo, en la determinación de condiciones de hibridación altamente estringente y lavado, las condiciones de hibridación y lavado son incrementadas gradualmente (por ejemplo, al incrementar la temperatura, disminuir la concentración de sal, incrementar la concentración de detergente y/o incrementar la concentración de solventes orgánicos tales como formalina en la hibridación o lavado) , hasta que se cumple con un conjunto seleccionado de criterios. Por ejemplo, las condiciones de hibridación y lavado son incrementadas gradualmente hasta que una sonda se enlaza a un objetivo complementario perfectamente coincidente con una proporción de señal a ruido que es por lo menos 5x tal alta como aquella observada para la hibridación de la sonda con un objetivo sin coincidir. Condiciones "muy estringentes" son seleccionadas para ser iguales al punto de fusión térmica (Tm) para una sonda particular. La Tm es la temperatura (bajo fuerza iónica y H definido) a la cual el 50% de la secuencia de prueba se híbrida a una sonda perfectamente coincidente. Para los propósitos de la presente invención, en general, se seleccionan condiciones de hibridación y lavado "altamente estringentes" para ser aproximadamente 5°C más bajas que la Tm para la secuencia específica a una fuerza iónica y pH definidos . Condiciones de hibridación y lavado de "ultra alta severidad" son aquellas en las cuales la severidad de las condiciones de hibridación y lavado son incrementadas hasta que la proporción de señal a ruido para el enlace de la sonda al ácido nucleico objetivo complementario perfectamente coincidente es por lo menos lOx como alta como aquella observada para la hibridación a cualquiera de los ácidos nucleicos objetivo sin coincidir. Un ácido nucleico objetivo que se híbrida a una sonda bajo tales condiciones, con una proporción de señal a ruido de por lo menos ½ de aquella del ácido nucleico objetivo complementario perfectamente coincidente se dice que se enlaza a la sonda bajo condiciones de severidad ultra alta. Similarmente, niveles aún más altos de severidad pueden ser determinados al incrementar gradualmente las condiciones de hibridación y/o lavado del análisis de hibridación relevante. Por ejemplo, aquellos de los cuales la severidad de las condiciones de hibridación y lavado son incrementadas hasta que la proporción de señal a ruido para el enlace de la sonda al ácido nucleico objetivo complementario perfectamente coincidente es por menos lOx, 20X, 50X, 100X o 500X o más tal alta como aquella observada para la hibridación a cualquiera de los ácidos nucleicos objetivo sin coincidir. Un ácido nucleico objetivo que se h brida a una sonda bajo tales condiciones, con una proporción de señal a ruido de por lo menos ½ de aquella del ácido nucleico objetivo complementario perfectamente coincidente se dice que se enlaza a la sonda bajo condiciones de severidad ultra-alta. Los ácidos nucleicos que no se hibridan entre si bajo condiciones estringentes son todavía sustaiicialmenLe idénticos si los polipéptidos los cuales codifican son sustancialmente idénticos. Esto ocurre, por ejemplo, cuando una copia de un ácido nucleico es creada utilizando la degeneración de codón máxima permitida por el código genético . Subsecuencias únicas En un aspecto, la invención proporciona un ácido nucleico que comprende una subsecuencia única en un ácido nucleico seleccionado de las secuencias 0-tARN y 0-RS reveladas en la presente. La subsecuencia única es única en comparación con un ácido nucleico correspondiente a cualquier secuencia de ácido nucleico O-tARN o O-RS conocida. Se puede llevar a cabo la alineación utilizando por ejemplo, BLAST ajustada a parámetros predeterminados. Cualquier subsecuencia única es útil, por ejemplo, como una sonda para identificar los ácidos nucleicos de la invención. Similarmente, la invención incluye un polipéptido que comprende una subsecuencia única en un polipéptido seleccionado de las secuencias de O-RS reveladas en la presente. En la presente, la subsecuencia única es única en comparación con un polipéptido correspondiente a cualquier secuencia de polipéptidos conocida. La invención también proporciona ácidos nucleicos objetivo los cuales se hibridizan bajo condiciones estringenbes a un oligonucleóLido de codificación único que codifica una subsecuencia única en un polipéptido seleccionado de las secuencias de O-RS, en donde la subsecuencia única es única en comparación con un polipéptido correspondiente a cualquiera de los polipéptidos de control (por ejemplo, secuencias parenterales de las cuales las sintetasas de la invención fueron derivadas, por ejemplo, mediante mutación) . Las secuencias únicas son determinadas como se indica anteriormente. Comparación de secuencias identidad y homología Los términos "idénticos" o por ciento de "identidad", en el contexto de dos o más secuencias de ácido nucleico o secuencias de polipéptidos, se refiere a dos o más secuencias o subsecuencias que son las mismas o tienen un porcentaje especificado de residuos de aminoácido o nucleótidos que son los mismos, cuando son comparados y alineados para una correspondencia máxima tal como se mide al utilizar uno de los algoritmos de comparación de secuencias descritos a continuación (u otros algoritmos disponibles para los experimentados de la técnica) o mediante inspección visual . La frase "sustancialmente idéntico", en el contexto de dos ácidos nucleicos o polipéptidos (por ejemplo, ADN que codifican un 0-tARN o O-RS o la secuencia de aminoácidos de una O-RS) se refiere a dos o más secuencias o subsecuencias que tienen por lo menos aproximadamente 60%, preferiblemente 80%, más preferiblemente 90-95% de identidad de nucleótido residuo de aminoácido, cuando son comparadas y alineadas para correspondencia máxima, tal como se mide utilizando un algoritmo de comparación de secuencias o mediante inspección visual. Tales "sustancialmente idénticas" se consideran comúnmente "homologas", sin referencia a los ancestros reales. Preferiblemente, la "identidad sustancial" existe en una región de secuencias que es por lo menos aproximadamente 50 residuos de longitud, más preferiblemente en una región de por lo menos aproximadamente 100 residuos y más preferiblemente, las secuencias son sustancialmente idénticas en por lo menos aproximadamente 150 residuos o más de la longitud completa de las dos secuencias a ser comparadas. Para la comparación de secuencias y determinación de homología, comúnmente una secuencia actúa como secuencia de referencia a la cual las secuencias de prueba son comparadas. Cuando se usa un algoritmo de comparación de secuencias, secuencias de prueba y referencia son introducidas a una computadora, se designan coordenadas se subsecuencia si es necesario y se designan parámetros del problema de algoritmo de secuencias . Luego el algoritmo de comparación de secuencias calcula el por ciento de identidad de secuencia para la(s) secuencia (s) de prueba en relación con la secuencia de referencia, en base a los parámetros de programa designados. Una alineación óptima de secuencia para comparación se puede llevar a cabo, por ejemplo, mediante el algoritmo de homología local de Smith & Waterman, Ad . Appl . Math . 2:482 (1981) , mediante el algoritmo de alineación de homología de Needleman & Wunsch, J. Mol. Biol. 48:443 (1970), mediante la búsqueda del método de similaridad de Pearson & Lipman, Proc. Nat'l. Acad. Sci. EUA 85:2444 (1988), mediante implementaciones computarizadas de estos algoritmos (GAP, BESTFIT, FASTA and TFASTA en the Wisconsin Genetics Software Package, Genetics Computer Group, 575 Science Dr., Madison, I) o mediante inspección visual (véase en general, Ausubel y colaboradores, infra) .
Un ejemplo de un algoritmo que es apropiado para is determinar el por ciento de identidad de secuencia y similaridad de secuencia es el algoritmo BLAST, el cual es descrito en Altschul y colaboradores, J. Mol. Biol. 215:403-410 (1990) . Elementos de programación para llevar a cabo análisis de BLAST están disponibles públicamente a través del Centro Nacional de Información de Biotecnología (www. nebí. nlm.nih.gov/) . Este algoritmo involucra identificar primero pares de secuencia de alta puntuación (HSP) al identificar palabras cortas de longitud en la secuencia de interrogación, las cuales ya sea coinciden o satisfacen alguna puntuación de umbral de valor positivo T cuando son alineadas con una palabra de la misma longitud en una secuencia de base de datos. T es denominada como el umbral de puntuación de palabra vecina (Altschul y colaboradores, supra) . Estos aciertos de palabra inicial actúan como semillas para iniciar búsquedas de HSP más grandes que los contienen. Luego los aciertos de palabras son extendidos en ambas direcciones a lo largo de cada secuencia para en cuanto a la puntuación de alineación acumulativa se puede incrementar. Las puntuaciones acumulativas son calculadas utilizando, para secuencias de nucleótidos, los parámetros M (puntación hacia atrás para un par de residuos coincidentes; siempre > 0) y N (puntuación de penalidad para residuos que no coinciden; siempre < 0) . Para secuencias de aminoácidos, una matriz de puntuación es utilizada para calcularla puntación acumulativa. La extensión de los aciertos de palabras en cada dirección son detenidas cuando: la puntuación de alineación acumulativa cae por la cantidad mayúscula X de su valor obtenido máximo; la puntuación acumulativa va a cero o menor, debido a la acumulación de una o más alineaciones de residuos de puntuación negativa o se llega al final ya sea de una secuencia u otra. Los parámetros del algoritmo BLAST W, T y X determinan la sensibilidad y velocidad de la alineación. El programa BLASTN (para secuencias de nucleótido) utiliza como valor predeterminado una longitud palabra ( ) de 11, una esperanza (E) de 10, un corte de 100, M=5, N=-4 y una comparación de ambas hebras. Para secuencias de aminoácidos, el programa BLASTP utiliza como predeterminada una longitud de palabra (W) de 3, una esperanza (E) de 10 y la matriz de puntuación BLOSUM62 (véase Henikoff & Henikoff (1989) Proc. Nati. Acad. Sci. EUA 89: 10915) . Además de calcular el por ciento de identidad de secuencia, el algoritmo BLAST también lleva a cabo un análisis estadistico de la similaridad entre dos secuencias (véase, por ejemplo, Karlin & Altschul, Proc. Nat'l. Acad. Sci . EUA 90:5873-5787 (1993)). Una medida de similaridad provista por el algoritmo BLAST es la probabilidad de suma más pequeña (P(N)), que proporciona una indicación de la probabilidad mediante la cual ocurriría una coincidencia entre dos secuencias de nucleótidos o aminoácidos por probabilidad. Por ejemplo, un ácido nucleico es considerado similar a una secuencia de referencia si la probabilidad de suma más pequeña en una comparación del ácido nucleico de prueba al ácido nucleico de referencia es menor de aproximadamente 0.1, más preferiblemente menor de aproximadamente 0.01 y más preferiblemente menor de aproximadamente 0.001.
Mutagénesis y Otras Técnicas de Biología Molecular Textos generales que describen técnicas de biología molecular incluyen Berger y Kimmel,' Guide to Molecular Cloning Techniques, Methods in Enzymology volume 152 Academic Press, Inc., San Diego, CA (Berger); Sambrook y colaboradores, Molecular Cloning-A Laboratory Manual (2-Edición) , Volumen 1-3, Cold Spring Harbor Laboratory, Cold Spring Harbor, Nueva York, 1989 ("Sambrook") and Current Protocols in Molecular Biology, F. M. Ausubel y colaboradores, eds . , Current Protocols, a joint venture bet een Greene Publishing Associates, Inc. and John Wiley & Sons, Inc., ( supplemented through 1999) ("Ausubel")) . Estos textos describen mutagénesis, el uso de vectores, promotores y muchos otros temas relevantes relacionados con, por ejemplo, la generación de genes que incluyen codones selectores para producción de proteínas que incluyen aminoácidos no naturales, tARN ortogonales, sintetasas ortogonales y pares de los mismos. Varios tipos de mutagénesis son usados en la invención, por ejemplo, para producir bibliotecas de tARN, para producir bibliotecas de sintetasas, para insertar codones selectores que codifican aminoácidos no naturales en una proteína o polipéptido de interés. Incluyen, pero no están limitados a, mutagénesis de punto aleatorio, dirigido al sitio, recombinación homologa, suflin de ADN y otros métodos de mutagénesis recursivos, construcción quimérica, mutagénesis utilizando plantillas que contienen uracilo, mutagénesis dirigida al oligonucleótido, mutagénesis de ADN modificada por fosforotioato, mutagénesis utilizando ADN dúplex gapped o los semejantes o cualquier combinación de los mismos. Métodos apropiados adicionales incluyen reparación de desadactación de punto, mutagénesis utilizando cepas huésped de reparación deficiente, restricción-selección y restricción-purificación, - mutagénesis de cancelación, mutagénesis mediante síntesis de gen total, reparación de rompimiento de doble hebra y los semejantes. Mutagénesis, por ejemplo, que involucran construcciones quiméricas, también está incluidas en la presente invención. En una modalidad, mutagénesis puede ser guiada mediante información conocida de la molécula que se presenta de manera estable en la naturaleza o una molécula que se presenta de manera estable en la naturaleza alterada o mutada, por ejemplo, secuencia, comparaciones de secuencia, propiedades físicas, estructura cristalina o los semejantes. Los textos y ejemplos anteriores encontrados en la presente describen estos procedimientos. Información se encuentra en las siguientes publicaciones y referencias citadas en las mismas: Ling y colaboradores, Approaches to ADN mutagenesis: an overview, Anal Biochem. 254 (2) : 157-178 (1997); Dale y colaboradores, Oligonucleotide-directed random mutagenesis using the phosphorothioate ethod, Methods Mol. Biol . 57:369-374 (1996); Smith, In vitro mutagenesis, Ann . Rev. Genet. 19:423-462 (1985); Botstein & Shortle, Strategies and applications of in vitro mutagenesis, Science 229:1193-1201 (1985) ; Cárter, Site-directed mutagenesis, Biochem. J. 237:1-7 (1986); Kunkel, The efficiency of oligonucleotide directed mutagenesis, in Nucleic Acids & Molecular Biology (Eckstein, F. y Lilley, . D. M. J. eds . , Springer Verlag, Berlín)) (1987); Kunkel, Rapid and efficient site-specific mutagenesis without phenotypic selection, Proc. Nati. Acad. Sci. EUA 82:488-492 (1985); Kunkel y colaboradores, Rapid and efficient site-specific mutagenesis without phenotypic selection, Methods in Enzymol. 154, 367-382 (1987); Bass y colaboradores, Mutant Trp repressors with new ADN-binding specificities, Science 242:240-245 (1988); Methods in Enzymol. 100:468-500 (1983); Methods in Enzymol. 154:329-350 (1987); Zoller & Smith, Oligonucleotide-directed mutagenesis using M13-derived vectors : an efficient and general procedure for the production of point mutations in any ADN fragment, Nucleic Acids Res. 10:6487-6500 (1982); Zoller & Smith, Oligonucleotide-directed mutagenesis of ADN fragments cloned into MI3 vectors, Methods in Enzymol . 100:468-500 (1983); Zoller & Smith, Oligonucleotide-directed mutagenesis : a simple method using two oligonucleotide primers and a singléstranded ADN témplate, Methods in Enzymol. 154:329-350 (1987); Taylor y colaboradores, The use of phosphorothioate-modified ADN in restriction enzyme reactions to prepare nicked ADN, Nucí. Acids Res. 13:8749-8764 (1985); Taylor y colaboradores, The rapid generation of oligonucleotide-directed mutations at high frequency using phosphorothioate-modified ADN, Nucí. Acids Res. 13:8765-8787 (1985); Nakamaye & Eckstein, Inhibition of restriction endonuclease Nci I cleavage by phosphorothioate groups and íts application to oligonucleotide-directed mutagenesis, Nucí. Acids Res. 14:9679-9698 (1986); Sayers y colaboradores, Y-T Exonucleases in phosphorothioate-based oligonucleotide-directed mutagenesis, Nucí. Acids Res. 16:791-802 (1988); Sayers y colaboradores, Strand specific cleavage of phosphorothioate-containing ADN by reaction with restriction endonucleases in tiie presence of etliidium bromide, (1988) Nucí. Acids Res. 16:803-814; Kramer y colaboradores, The gapped dúplex ADN approach to oligonucleotide-directed mutation construction, Nucí. Acids Res. 12:9441-9456 (1984); Kramer & Fritz Oligonucleotide-directed construction of mutations via gapped dúplex ADN, Methods in Enzymol. 154:350-367 (1987); Kramer y colaboradores, Improved enzymatic in vitro reactions in the gapped dúplex ADN approach to oligonucleotide-directed construction of mutations, Nucí. Acids Res. 16:7207 (1988); Fritz y colaboradores, Oligonucleotide-directed construction of mutations : a gapped dúplex ADN procedure without enzymatic reactions in vitro, Nucí . Acids Res . 16:6987-6999 (1988); Kramer y colaboradores, Point Mismatch Repair, Cell 38:879-887 (1984); Cárter y colaboradores, Improved oligonucleotide site-directed mutagenesis using M13 vectors, Nucí. Acids Res. 13:4431-4443 (1985); Cárter, Improved oligonucleotide-directed mutagenesis using M13 vectors, Methods in Enzymol. 154:382-403 (1987); Eghtedarzadeh & Henikoff, Use of oligonucleotides to genérate large deletions, Nucí . Acids 14:5115 (1986); Wells y colaboradores, Importance of hydrogerz-bondfonation in stabilizing the transition state of subtilisin, Phil. Trans . R. Soc. Lond. A 317:415-423 (1986); Nambiar y colaboradores, Total synthesis and cloning of a gene coding for the ribonuclease S protein, Science 223:1299-1301 (1984); Sakamar y Khorana, Total synthesis and expression of a gene for the a-subunit of bovine rod outer segment guanine nucleotide-binding protein (transducin) , Nucí. Acids Res. 14:6361-6372 (1988); Wells y colaboradores, Cassette mutagenesls: an efficient method for generation of múltiple mutations at defined sites, Gene 34:315-323 (1985); Grundstróm y colaboradores, Oligonucleotide-directed mutagenesls by microscale' shot-gun' gene synthesis, Nucí . Acids Res. 13:3305-3316 (1985); Mandecki, Oligonucleotide-directed double-strand break repair in plasmids of Escherichia coli: a raethodfor site-specific mutagenesls, Proc. Nati. Acad. Sel. EUA, 83:7177-7181 (1986); Arnold, Protein engineering for unusual environments, Current Opinión in Biotechnology 4:450-455 (1993); Sieber y colaboradores, Nature Biotechnology, 19:456- 460 (2001) . W. P. C. Stemmer, Nature 370, 389-91 (1994); y I. A. Lorimer, I. Pastan, Nucleic Acids Res. 23, 3067-8 (1995) . Detalles adicionales en cuanto a muchos de los métodos anteriores se pueden encontran en Methods in Enzymology Volumen 154, que también describe controles útiles para resolución de problemas con varios métodos de mutagénesis. La invención también es concerniente con células huésped eucariónticas y organismos para la incorporación in vivo de un aminoácido no natural vía pares de tARN/RS ortogonales. Células huésped son diseñadas genéticamente (por ejemplo, transformadas, transducidas o transfectadas) con los polinucleótidos de la invención o constructos los cuales incluyen un polinucleótido de la invención, por ejemplo, un vector de la invención, el cual puede ser, por ejemplo, un vector de clonación o un vector de expresión. El vector puede estar por ejemplo, en forma de un plásmido, un bacterio, un virus, un polinucleótido sin recubrir o un polinucleótido conjugado. Los vectores son introducidos a las células y/o microorganismos mediante métodos estándar en los que se incluyen electroporación (From y colaboradores, Proc. Nati. Acad. Sci. EUA 82, 5824 (1985) , infección mediante vectores virales, penetración balistica de alta velocidad mediante partículas pequeñas con el ácido nucleico ya sea dentro de la matriz, de perlas pequeñas o partículas o la superficie (Klein y colaboradores, Nature 327, 70-73 (1987)) . Las células huésped diseñadas pueden ser cultivadas en medios nutrientes convencionales modificados como sea apropiado para actividades tales como, por ejemplo, seleccionar etapas, activar promotores o seleccionar transformantes. Estas células pueden ser cultivadas opcionalmente en organismos transgénicos . Otras referencia útiles, por ejemplo para aislamiento y cultivo de células (por ejemplo, para aislamiento de ácido nucleico) incluyen Freshney (1994) Culture of Animal Cells, a Manual of Basic Technique , tercera edición, Wiley-Liss, Nueva York y las referencias citadas en la misma; Payne y colaboradores, (1992) Plant Cell and Tissue Culture in Liquid Systems John iley & Sons, Inc. Nueva York, NY; Gamborg and Phillips (eds) (1995) Plant Cell, Tissue and Organ Culture; Fundamental Methods Springer Lab Manual, Springer-Verlag (Berlín Heidelberg Nueva York) y Atlas y Parks (eds) The Handbook of Microbiological Media (1993) CRC Press, Boca Ratón, FL. Varios métodos bien conocidos para introducir ácidos nucleicos objetivo en células están disponibles, cualquiera de los cuales pueden ser usados en la invención. Estos incluye: fusión de las células receptoras con protoplastos bacterianos que contienen el ADN, electroporación, bombardeo de proyectiles e infección con vectores virales (discutidos adicionalmente, posteriormente en la presente), etc. Células bacterianas pueden ser usadas para amplificar el número de plásmidos que contienen constructos de ADN de esta invención. Las bacterias son cultivadas a fase logarítmica y los plásmidos dentro de la bacteria pueden ser aislados mediante una variedad de métodos conocidos en la técnica (véase, por ejemplo, Sambrook) . Además, una plétora de equipos están disponibles comercialmente para la purificación de plásmidos de bacterias, (véase, por ejemplo, EasyPrep™, FlexiPrep™, ambos de Pharmacia Biotech; StrataClean™, de Stratagene; y QIAprep™ de Qiagen) . Luego los plásmidos aislados y purificados son manipulados adicionalmente para producir otros plásmidos, utilizados para transfectar células o incorporados a vectores relacionados para infectar organismos. Vectores típicos contienen terminadores de transcripción y traducción, secuencias de inicio de transcripción y traducción y promotores útiles para regulación de la expresión del ácido nucleico objetivo particular. Los vectores comprenden adicionalmente casettes de expresión genérica que contiene por lo menos una secuencia terminadora independiente, secuencias que permiten la replicación de los cassettes en eucariontes o procariontes o ambos, (por ejemplo, vectores de lanzadera) y marcadores de selección tanto para sistemas procariónticos y eucariónticos . Los vectores son adecuados para replicación e integración en procariontes, eucariontes o preferiblemente ambos. Véase, Giliman & Smith, Gene 8:81 (1979); Roberts y colaboradores, Nature, 328:731 (1987).; Schneider, B. y colaboradores, Protein Expr. Purif. 6435:10 (1995); Ausubel, Sambrook, Berger (all supra) . Un catálogo de Bacterias y Bacteriófagos útiles para clonación es provisto por ejemplo, por la ATCC, por ejemplo, The ATCC Catalogue of Bacteria and Bacteriophage (1992) Gherna y colaboradores, (eds) publicada por la ATCC. Procedimiento básicos, adicionales para secuenciación, clonación y otros aspectos de biología molecular y consideraciones teóricas fundamentales también se encuentran en Watson y colaboradores, (1992) Recombinant ADN Second Edition Scientific American Books, NY. Además, esencialmente cualquier ácido nucleico (y virtualmente cualquier ácido nucleico, marcado ya sea estándar o no estándar) puede ser ordenado sobre pedido o estándar de cualquiera de una variedad de fuentes comerciales, tales como Midland Certified Reagent Company (Midland, TX mcrc.com), The Great American Gene Company (Ramona, CA disponible en el Sitio de Red Mundial genco.com), ExpressGen Inc. (Chicago, IL disponible en el sitio de Red Mundial en expressgen.com), Operon Technologies Inc. (Alameda, CA) y muchos y otros.
EQUIPOS Los equipos también son un aspecto de la invención. Por ejemplo, un equipo para producir una proteina que comprende por lo menos un aminoácido no natural en una celada es proporcionado en donde el equipo incluye un recipiente que contiene una secuencia de polinucleótidos que codifica un O-tARN y/o un O-tARN y/o una secuencia de polinucleótidos que codifica una O-RS y/o una O-RS . En una modalidad, el equipo incluye además por lo menos un aminoácido no natural. En otra modalidad, el equipo comprende además materiales de instrucción para producir la proteina.
EJEMPLOS Los siguientes ejemplos son ofrecidos para ilustrar, pero no para limitar la invención reivindicada.
Aquellos de habilidad en la técnica reconocerán que una variedad de parámetros no críticos pueden ser alterados sin desviarse del alcance de la invención reivindicada.
EJEMPLO 1: METODOS PARA PRODUCIR Y COMPOSICIONES DE AMINOACIL-tARN SYNTETASAS QUE INCORPORAN AMINOACIDOS NO NATURALES EN CELULAS EUCARIONTICAS La expansión del código genético eucarióntico para incluir aminoácidos no naturales con nuevas propiedades físicas, químicas o biológicas proporcionaría herramientas útiles para analizar y controlar funciones de proteína en estas células. Hacia este objetivo, un procedimiento general para el aislamiento de aminoacil-tARN sintetasas que incorporan aminoácidos no naturales con alta fidelidad en proteínas en respuesta a un codón ámbar en Saccharomyces cerevisiae (S. cerevisiae) es descrito. El método está basado en la activación de genes reporteros sensibles GAL4, HIS3, URA3 o LacZ, mediante supresión de codones ámbar entre el dominio de enlace de ADN y dominio de activación y transcripcional de GAL4. La optimización de un reportero GAL4 para selección positiva de tirosil-tARN sintetasa (EcTyrRS) de Escherlchia colí activa es descrita. Una selección negativa de variantes de EcTyrRS inactivas también se ha desarrollado con el reportero URA3 mediante el uso de una molécula pequeña · (ácido 5-fluroorótico (5-FOA) ) agregada al medio de cultivo como , alelo tóxico' . Importantemente, ambas selecciones positiva y negativa se pueden efectuar en una célula y con un intervalo de estringencias . Esto puede facilitar el aislamiento de un intervalo de actividades de aminoacil-tARN sintetasa (aaRS) de bibliotecas grandes de sintetasas mutantes. El poder el método para aislar fenotipos de aaRS deseados es demostrado mediante selecciones modelo. La adición reciente de aminoácidos no naturales al código genérico de Escherichia coli (E. coli) proporciona un nuevo procedimiento poderoso para analizar y manipular la estructura y función de proteina tanto in vitro y in vivo. Aminoácidos con etiquetas de fotoafinidad, átomos pesados, grupos ceto y olefinicos y cromóforos han sido incorporados a proteínas en E. coli con eficiencia y fidelidad que rivalizan con aquellas de los veinte aminoácidos comunes. Véase, por ejemplo, Chin y colaboradores, (2002), Addition of a Photocrosslinker to the Genetic Code of Escherichia coli, Proc. Nati. Acad. Sci. E. U. A. 99:11020-11024; Chin y Schultz, (2002) , In vivo Photocrosslinking with ¡Innatural Amino Acid Mutagenesis, Chem BioChem 11:1135-1137; Chin y colaboradores, (2002), Addition of p-Azido-L-phenylalanine to the Genetic code of Escherichia coli, J. Am. Chem. Soc. 124:9026-9027; Zhang y colaboradores, (2002), The selective incorporation of alkenes into proteins in Escherichia coli, Angewandte Chemie. International Ed. in English 41:2840-2842; y Wang y Schultz, (2002), Expanding the Genetic Code, Chem. Comm. 1-10. Aminoácidos no naturales han sido introducidos previamente al receptor de acetilcolina nicotinico en oocitos de Xenopus (por ejemplo, M. W. Nowak y colaboradores, (1998), In vivo incorporation of unnatural amino acids into ion channels in Xenopus oote expréssion system, Method Enzymol. 293:504-529) mediante la microinyección de Tetrahymena thermophila tARN químicamente misacilado (por ejemplo, M. E. Saks y colaboradores, (1996) , An engineered Tetrahymena tRNAGln for in vivo incorporation of unnatural amino acids into proteins by nonsense suppression, J. Biol. Chem. 271:23169-23175 y el mRNA relevante. Esto ha permitido estudios biofisicos detallados del receptor en oocitos mediante la introducción de aminoácidos que contiene cadenas laterales con propiedades físicas o químicas únicas. Véase, por ejemplo, D. A. Dougherty (2000), Unnatural amino acids as prohes of protein structure and function, Curr. Opin. Chem. Biol . 4:645-652. Desafortunadamente, esta metodología, esta limitada a proteínas en células que pueden ser microinyectadas y debido a que el tARN es químicamente acilado in vitro y no puede ser re-acilado, los rendimientos de proteína son muy bajos. Esto a su vez necesita técnicas sensibles para analizar la función de proteína. Hay interés en la información genética de aminoácidos no naturales a proteínas en células eucariónticas en respuesta a un codón ámbar. Véase también, H. J. Drabkin y colaboradores, (1996), Amber suppression in mammalian cells dependent upon expression of an Escherichia coli aminoacyl-tARN synthetase gene, Molecular & Cellular Biology 16:907-913; A. K. Kowal y colaboradores, (2001), Twenty-first arninoacyl-tARN syntlaetase-suppressor tARN pairs for possible use in site-specific incorporation of amino acid analogues into proteins in eukaryotes and in eubacteria. [comment] , Proc. Nati. Acad. Sci. E. U. A. 98:2268-2273; y K. Sakamoto y colaboradores, (2002), Site-specific incorporation of an unnatural amino acid into proteins in mammalian cells, Nucleic Acids Res. 30:4692-4699. Esto tendría ventajas técnias y prácticas significativas, puesto que los tARN serían re-acilados mediante sus sintetasas cognatas conduciendo a grandes cantidades de proteína mutante. Además, aminoacil-tARN sintetasas genéticamente codificadas y tARN son, en principio, heredables permitiendo al aminoácido no natural ser incorporado a proteína por medio de muchas divisiones celulares sin dilución exponencial. Las etapas necesarias para agregar nuevos aminoácidos al código genético de E. coli han sido descritas (véase, por ejemplo, D. R. Liu, & P. G. Schultz, (1999), Progrese toward the evolution of an organism with an expanded genetic code, Proc. Nati. Acad. Sci. E. U. A. 96:4780-4785; y principios similares pueden ser útiles para expandir el código genético de eucariontes. En la primera etapa, un par de aminoacil-tARN sintetasa ortogonal (aaRS) /tRNACüA es identificado. Este par necesita funcionar con la maquinaria de traducción de las células huésped, pero el aaRS no debe cargar ningún tARN endógeno con un aminoácido y el tRNACTA aminoacilado mediante cualquier sintetasa endógena. Véase, por ejemplo, D. R. Liu y colaboradores, Engineering a tARN and aminoacyl-tARN synthetase for the site-specific incorporation of unnatural amino acids into proteins in vivo, Proc. Nati. Acad. Sci. E. ü. A. 94:10092-10097. En una segunda etapa, aquellos pares aaRS/tARN que son capaces de usar solamente el aminoácido no natural son seleccionados de una biblioteca de aaRS mutante. En E. coli la selección de aminoácidos no naturales que usan variantes de MjTyrRS se lleva a cabo utilizando las selecciones de ^tamiz doble' de dos etapas. Véase, por ejemplo, D. R. Liu, & P. G. Schultz, (1999), Progress toward the evolutinn of an organism with an expanded genetíc code, Proc. Nati. Acad. Sci. E. U. A. 96:4780-4785. Un método de selección modificado es usado en células eucariónticas . Saccharomyces cerevisiae (S. cerevisiae) fue escogido como el organismo huésped eucarióntico, ya que es unicelular, tiene un tiempo de generación rápida, también como genética relativamente bien caracterizada. Véase, por ejemplo, D. Burke y colaboradores, (2000) Methods in Yeast Genetics. Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY. Además, puesto que la maquinaria de traducción de los eucariontes es altamente conservada (véase, por ejemplo, (1996) Translational Control. Cold Spring Harbor Laboratory, Cold Spring Harbor, NY; Y. K ok, & J. T. Wong, (1980), Evolutionary relationship between Halobacterium cutirubrum and eukaryotes determined by use of aminoacyl-tARN sintetasas as phylogenetic probes, Canadian Journal of Biochemistry 58:213-218; y (2001) The Ribosome. Cold Spring harbor Laboratory Press, Cold Spring Harbor, NY) , es probable que los genes deaaRS para la incorporación de aminoácidos no naturales descubierto en S. cerevisiae puedan ser Acortados y pegados' en organismos eucariónticos superiores y utilizados en sociedad con tARN cognato (véase, por ejemplo, K. Sakamoto y colaboradores, (2002) Site-specific incorporation of an unnatural amino acid into proteins in mammalian cells, Nucleic Acids Res. 30:4692-4699; y C. Kohrer y colaboradores, (2001), Import of amber and ochre suppressor tRNAs into mammalian cells: a general approach to site-specific insertion of amino acid analogues into proteins, Proc. Nati. Acad. Sci. E. U. A. 98:14310-14315) para incorporar aminoácidos no naturales. La expansión del código genético de S. cerevisiae es por consiguiente una compuerta para expandir el código genético de organismos eucariónticos multicelulares complejos. Véase, por ejemplo, M. Buvoli y colaboradores, (2000), Suppression of nonsense mutations in cell culture and mice by multimerized suppressor tARN genes. Molecular & Cellular Biology 20:3116-3124. El par tirosilo derivado de Methanococcus jannaschii TyrRS (MjTyrRS) /tARN (véase por ejemplo, L. Wang, & P. G. Schultz, (2002), Expanding the Genetic Code, Chem. Comm. 1-10) el cual fue usado previamente para expandir el código genético de E. coli no es ortogonal en organismos eucariónticos (por ejemplo, P. Fechter y colaboradores, (2001) , Major tyrosine identity deterninants in Metlaanococcus jannaschii and Saccharomyces cerevisíae tARN (Tyr) are conserved but expressed differently, Eur. J. Biochem. 268:761-767) y se requiere un nuevo par ortogonal para expandir el código genético eucarióntico . Schimmel y colaboradores, han mostrado que el par de tirosil-tARN sintetasa (EcTyrRS) /tRNAcoA de E. coli suprime los codones ámbar en S. cerevisíae y que el tRNACuA de E. coli no es cargado por aminoacil tARN sintetasas endógenas en citosol de levadura (Figura 2) . Véase tambiénr por ejemplo, H. Edwards y colaboradores, (1991), ñn Escherichia coli tyrosine transfer ARN is a leucine-specifíc transfer ARN in the yeast Saccharomyces cerevisíae, Proc. Nati. Acad. Sci. E. U. A. 88:1153-1156; y H. Edwards, & P. Schimmel (1990), A bacterial amber suppressor in Saccharomyces cerevisíae is selectively recognized by a bacterial aminoacyl-tARN synthetase, Molecular & Cellular Biology 10:1633-1641. Además, EcTyrRS ha mostrado no cargar el tARN de levadura in vitro. Véase, por ejemplo, Y. Kwok, & J. T. Wong, (1980), Evolutionary relationship between Halobacterium cutirubrum and eukaryotes determined by use of a inoacyl-tARN syfzthetases as phylogefietic probes, Canadian Journal of Biochemistry 58:213-218; B. P. Doctor y colaboradores, (1966), Studies on the species specificity of yeast and E. coli tyrosine tRNAs, Cold Spring Harbor Symp. Quant. Biol. 31:543-548; y . Wakasugi y colaboradores, (1998), Genetic code in evolution : switching species-specific aminoacylation with a peptide transplant, EMBO Journal 17:297-305. Asi, el par EcTyrRS/tRNACD¾ es un candidato para un par ortogonal en S. cerevisiae, también como en eucariontes superiores (por ejemplo, A. K. Kowal y colaboradores, (2001), Twenty-first aminoacyl-tARN synthetase-suppressor tARN pairs for possible use in site-specific incorporation of amino acid analogues into proteins in eukaryotes and in eubacteria . [comment], Proc. Nati. Acad. Sci. E. ü. A. 98 (2001) 2268-2273) . Para ampliar la especificidad de substrato EcTyrRS en E. coli, Nishimura y colaboradores, seleccionaron una biblioteca generada por PCR propensa a error de mutantes de EcTyrRS y descubrieron un mutante con capacidad mejorada para incorporar 3-azatirosina . Véase, por ejemplo, F. Hamano-Takaku y colaboradores, (2000) , A mutant Escherichia coli tyrosyltRNA synthetase utilizes the unnatural amino acid azatyrosine more efficiently than tyrosine, J. Biol. Chem. 275:40324-40328. Sin embargo, este aminoácido es incorporado del proteoma de E. coli y la enzima evolucionada todavía prefiere tirosina como substrato. Yokoyama y colaboradores, seleccionaron una pequeña colección de variantes de sitio activo de EcTyrRS en un sistema de traducción de germen de trigo y descubrieron una variante de EcTyrRS que utiliza 3-yodotirosina más efectivamente que tirosina. Véase, D. Kiga, y colaboradores, (2002) , An engineered Escherichia coli tyrosyl-tARN synthetase for site-specific incorporation of an unnatural amino acid into proteins in eukaryotic translation and its application in a wheat germ cellfree system, Proc. Nati. Sci. E. U. ?. 99:9715-9720. En contraste con las eximas que han evolucionado en E. coli (por ejemplo, J. W. Chin y colaboradores, (2002), Addition of a Photocrosslinker to the Genetic Code of Escherichia coli, Proc. Nati. Acad. Sci. E. U. A. 99:11020-11024; J. W. Chin y colaboradores, (2002), Addition of p-Azido-L-pherzylalanine to the Genetic code of Escherichia coli, J. Am. Chem. Soc. 124:9026-9027; L. ang y colaboradores, (2001) , Expanding the genetic code of Escherichia coli, Science 292:498-500; y L . Wang y colaboradores, (2002), Adding -3- (2-naphthyl) alanine to the genetic code of E-coli, J. Am. Chem. Soc. 124:1836-1837), esta enzima todavía incorpora tirosina en la ausencia del aminoácido no natural. Véase, por ejemplo, D. Kiga y colaboradores , (2002) , An engineered Escherichia coli tyrosyl-tARN synthetase for site-specific íncorporation of an unnatural amino acid into proteins in eukaryotic translation and its application In a wheat germ cellfree system, Proc . Nati. Acad. Sci . E. U. ?. 99:9715-9720. Recientemente, Yokoyama y colaboradores, también han demostrado que este mutante EcTyrRS funciona con un tRNAcoA de Bacillus stearothermophilus para suprimir codones ámbar en células de mamíferos. Véase, K. Sakamoto y colaboradores, (2002) , Site-specific Íncorporation of an unnatural arnino acid into proteins in mammaliara cells, Nucleic Acids Res. 30:4692-4699. Un requerimiento es que cualquier aminoácido agreqado al código genético eucarióntico sea incorporado con una fidelidad a aquella de los veinte aminoácidos comunes . Para llevar a cabo este objetivo, un método de selección general, in vivo ha sido utilizado para el descubrimiento de variantes de EcTyrRS/tRNAC0A para incorporar aminoácidos no naturales, pero ninguno de los aminoácidos comunes, en respuesta al codón ámbar TAG. Una ventaja principal de una selección es que las enzimas que incorporan selectivamente aminoácidos no naturales pueden ser seleccionadas rápidamente y enriquecidas de librerías de 108 variantes de sitio activo EcTyrRS, 6-7 ordenes de magnitud más diversidad que ha sido seleccionada in vitro. Véase, por ejemplo, D. Kiga y colaboradores, (2002), An engineered Escherichia coli tyrosyl-tARN synthetase for site- specific incorporation of an unnatural amino acid into proteins in eukaryotíc translation and its application in a wheat genn cellfree system, Proc . Nati. Acad. Sci. E. U. A. 99:9715-9720. Este incremento en diversidad incrementa bastamente la probabilidad de aislar variantes de EcTyrRS para la incorporación de un intervalo diverso de funcionalidad útil con muy alta fidelidad. Véaser por ejemplo, L. Wang, & P. G. Schultz, (2002) , Expanding the Genetic Code, Chem. Comm. 1-10. Para extender el procedimiento de selección a S. cerevisiae, la proteína activadora de transcripción GAL4 fue utilizada (véase Figura 1) . Véase, por ejemplo, A. Laughon y colaboradores, (1984), Identification of two proteins encoded by the Saccharomyces cerevisiae GAL4 gene, Molecular & Cellular Biology 4:268-275; A. Laughon, & R. F. Gesteland, (1984), Primary structure of the Saccharomyces cerevisiae GAL4 gene, Molecular & Cellular Biology 4:260-267; L. Keegan y colaboradores, (1986) , Separation of ADN bindíng from the transcription-activating function of a eukaryotíc regulatory protein, Science 231:699-704; y M. Ptashne, (1988), How eukaryotíc transcriptional activators work, Nature 335:683-689. Los 147 aminoácidos de N-terminales de esta proteina de 881 aminoácidos forman un domino de enlace de ADN (DBD) que enlaza la secuencia de ADN específicamente. Véaser por ejemplo, M. Carey y colaboradores, (1989) , An amino-terminalfragment of GAL4 binds ADN as a dimer, J. Mol. Biol. 209:423-432; y E. Giniger y colaboradores, (1985), Specific ADN binding of GAL4, a positlve regulatory protein of yeast, Cell 40:767-774. El DBD es enlazado por una secuencia de proteína intermedia, a un domino de activación de 113 aminoácidos C-terminal (AD) que puede activar la transcripción cuando es enlazado a ADN. Véase, por ejemplo, J. Ma, & M. Ptashne, (1987), Deletion analysis of GAL4 defines two transcriptional actívatlng segments, Cell 48:847-853: y J. Ma, & M. Ptashne, (1987), The carboxy-terminal 30 amino acids of GAL4 are recognized by GAL80, Cell 50:137-142. Se contempla que al colocar codones ámbar hacia DBD N-terminal de un solo polipéptido que contiene tanto el DBD de N-terminal de GAL4 y su AD C-terminal, la supresión ámbar mediante el par EcTyrRS/tRNAcoA puede ser enlazada a la activación de transcripción mediante GAL4 (Figura 1, Panel A) . Mediante la elección de genes reporteros activados por GAL4 apropiados se pueden lleva a cabo tanto a selecciones positivas como negativas con el gen (Figura 1, Panel B) . Mientras que muchos genes reportero basados en complementar la auxotrofía de aminoácido de una célula pueden ser usados para selecciones positivas (por ejemplo: URA3, LEU2, HISS, LYS2) , el gen HIS3 es un gen reportero atractivo, ya que la actividad de la proteina que codifica (imidazol glicerol fosfato deshidratasa) puede ser modulada de una manera dependiente de la dosis mediante la adición de 3-aminotriazol (3-??) . Véaser por ejemplo, G. M. Kishore, & D. M. Shah, (1988), A ino acid biosynthesis inhlbitors as herbicides, Annual Review of Biochemistry 57:627-663. En S. cerevisiae, pocos genes han sido usados para selecciones negativas. Una de varias estrategias de selección negativa (véase, por ejemplo, A. J. DeMaggio y colaboradores, (2000), The yeast split-hybrid system, Method Enzymol . 328:128-137; H. M. Shih y colaboradores, (1996) , A posltive genetlc selection for dísrupting protein-protein interactions :Identification of CREB mutationsr that prevent association with the coactivator CBP, Proc. Nati. Acad. Sci. E. ü. A. 93:13896-13901; M. Vidal y colaboradores, (1996), Genetic characterization of a mammalian protein-protein interaction domain by using a yeast reverse two-hybrid system. [comment] , Proc. Nati. Acad. Sci. E. U. A. 93:10321-10326; y M. Vidal y colaboradores, (1996), Reverse two-hybrid and one-hybrid systems to detect dissociation of protein-protein and ADN-protein interactions . [commeyzt] , Proc. Nati. Acad. Sci. E. U. A. 93:10315-10320) que han sido usados exitosamente es el sistema de selección negativa de URA3/ácido 5-fluroorotico (5-FOA) (por ejemplo, J. D. Boeke y colaboradores, (1984), A positive selection for mutants lacking ozotidine-5-phosphate decarboxylase activity in yeast : 5-fluoroorotic acid resistance, Molecular & General Genetics 197:345-346) descrito en el sistema de 'dos híbridos inverso' desarrollado por Vidal y colaboradores. Véase, M. Vidal y colaboradores, (1996), Genetic characterization of a mammalian protein-protein interaction domain by sing a yeast reverse two-hybrid system. [comment] , Proc. Nati. Acad. Sci. E. U. A. 93:10321-10326; y, M. Vidal y colaboradores, (1996), Reverse two-hybrid and one-hybrid systems to detect dissociation of proteín-proteirz and ADN-protein interactions . [comment] , Proc. Nati. Acad. Sci. E. U. A. 93:10315-10320). En el sistema de dos híbridos inverso, un reportero de URA3 genómicamente integrado es colocado bajo un promotor controlado fuertemente que contiene sitios de enlace de ADN de GAL4. Cuando se producen dos proteínas que interactúan como fusiones al DBD de GAL4 y AD de GAL4 reconstituyen la actividad de GAL4 y transcripción activa de URA3. En presencia de 5-FOA, el producto de gen URA3 convierte el 5-FOA a un producto tóxico, exterminando la célula. Véase, J. D. Boeke y colaboradores, supra. Esta selección ha sido usada para seleccionar proteínas que disrumpen una interacción de proteína-proteína y para mutaciones que disrumpen una interacción de proteína-proteína. También se ha descrito una variante para seleccionar inhibidores de molécula pequeña de interacciones de proteína-proteina . Véase, por ejemplo, J. Huang, & S. L. Schreiber, (1997) A yeast genetic system for selecting small molecule inhibitors of protein- protein interactlons in nanodroplets, Proc. Nati. Acad. Sci. E. U. A. 94:13396-13401. La elección apropiada de codones ámbar en GAL4 de plena longitud permite selecciones positivas eficientes para variantes de EcTyrRS activas utilizando ya sea un HIS3 o reporteros activados por GAL4 de URL3 para complementar la auxotrofía por histidina o uracilo en células de levadura. Además, el reportero de URA3 puede ser usado en selecciones negativas para variantes de EcTyrRS inactivas en presencia de f 5-FOA. Además, análisis colorimétricos utilizando lacZ pueden ser usados para leer la actividad e aminoacil-tARN sintetasa en células de levadura.
RESULTADOS Y DISCUSION El gen EcTyrRS fue expresado bajo el control del promotor ADHl constituyente y el gen tRNAC0A fue expresado del mismo plásmido de levadura de copia alto (pEcTyrRStRNAcoAf Figura 1, Panel C) . Después de la co-transformación de pEcTyrRStRNAcüA y un reportero de baja copia que contiene una sola mutación ámbar entre el dominio de enlace de ADN y el dominio de activación de un constructo de GAL4 quimérico a MaV203, las células crecieron en medios selectivos carentes de histidina que contienen 3-AT 10-20 mM (Figura 2) . Cuando las célula MaV203 fueron transformadas con el mismo constructo de GAL4 y ya sea un mutante de sintetasa inactivo (A5) o un constructo que carece del gen EctRNA, no se observó ningún crecimiento en 3-AT 10 mM (Figura 2) . Estos experimentos establecen que el EcTyrRS puede ser expresado constitutivamente de forma funcional con el promotor de ADH1, que hay mínima supresión ámbar endógena MaV203 y que hay poca carga de EctRNAcuA de sintetasas de levadura en este sistema. Véase, por ejemplo, H. Edwards y colaboradores, (1991), An Escherichia coli tyrosine transfer ARN is a leucine-specific transfer ARN in Lhe yeasL Saccharomyces cerevisiae, Proc . Nati. Acad. Sci. E. U. A. 88:1153-1156; y H. Edwards, & P. Schimmel, (1990) , A bacterial amber suppressor in Saccharomyces cerevisiae is selectively recognized by a bacterial aminoacyl-tARN synthetase, Molecular & Cellular Biology 10:1633-1641. Puesto que el EcTyrRS no carga el tARN de S. cerevisiae (por ejemplo, Y. Kwok, & J. T. Wong, (1980), Evol tionary relationship between Halobacterium cutirubrum and eukaryotes determined by use oí anziraoacyl-tARN syntlaetases as phylogenetic probes, Canadian Journal of Biochemistry 58:213-218; B. P. Doctor y colaboradores, (1966) , Studies on tile species specificity of yeast and E. coli tyrosine tRNAs, Cold Spring Harbor Sump. Quant . Biol. 31:543-548; y K. Wakasugi y colaboradores, (1998), Genetic code in evolution: switching species-specific aminoacylation with a peptide transplant, EMBO Journal 17:297-305), estos experimentos confirman que EcTyrRS/EctRNAcoü son un par ortogonal en S. cerevisiae. En tanto que la quimera de GAL4 de primera generación fue acta de activar la transcripción del reportero HIS3 débil fue incapaz de activar la transcripción del reportero URA3 en MaV203 suficientemente para permitir el crecimiento en concentraciones de 3-?? mayores de 20 mM o sobre placas de URA (Figura 2) . Para los propósitos de selección de Ec, TyrRS, se realizó variantes de un constructo de GAL4 de segunda generación. Este reportero de GAL4 fue diseñado para ser más activo, para tener un intervalo dinámico mayor y para evitar la acumulación de revertantes. Para incrementar la actividad de reporteros de GAL4, se utilizó GAL4 de plena longitud (que tiene una actividad de activación de transcripción dos veces a aquella de la fusión DBD-AD (véase, por ejemplo, J. Ma, & M. Ptashne, (1987), Deletion analysis of GAL4 defines two transcriptional activating segments, Cell 48:847-853) bajo el control de un fuerte promotor de ADH1 y un plásmido de 2 mieras de alta copia (con un número de copia 10-30 veces aquel del plásmido centromérico de la quimera de GAL4 inicial) fue utilizado. Un incremento tanto en el número de copias del plásmido y la actividad de la proteina que codifica extendería el intervalo dinámico de los reporteros. Se apunto a mutaciones ámbar a la región del gen GAL4 que codifica residuos de aminoácido 2 y 147 (Figura 3) . Esta región es suficiente para el enlace de ADN específico de secuencia (véase, por ejemplo, M. Carey y colaboradores, (1989) , An amino-terminalfragment of GA1A binds ADN as a dimer, J. Mol. Biol. 209:423-432) y cae al lado 5' del primer dominio de activación críptico en el gen GAL4 (véase, por ejemplo, J. Ma, & M. Ptashne, (1987) Deletion analysis of GA 4 defines two transcriptional activating segments, Cell 48:847-853), de tal manear que los productos truncados producidos en ausencia de supresión ámbar no son anticipados para activar la transcripción. La elección de codones de aminoácido para mutar fue guiada por selecciones de mutagénesis de saturación previas sobre GAL4 (véase, por ejemplo, M. Jo nston, & J. Dover, (1988), Mutational analysis of the GAL4-encoded transcriptional activator protein of Saccharomyces cerevisiae, Genetics 120:63-74), también como las estructuras de rayos X de el dominio de enlace de ADN N-terminal de GAL4 (véase, por ejemplo, R. Marmorstein y colaboradores, (1992), ADN recognition by GAL4 : structure of a protein-ADN complex. [comnaentj , Nature 356:408-414; y J. D. Baleja y colaboradores, (1992), Solution structure of the ADN-binding domain of Cd2-GAL4 fro S. cerevisiae. [conunent] , Nature 356:450-453) y la estructura de MR de su región de dimerización. Véase, por ejemplo, P. Hidalgo y colaboradores, (2001), Recruitment of the transcriptional machinery through GA 11P: structure and interactíons of the GAL4 dimerization domain, Genes & Development 15:1007-1020. El GAL4 de plena longitud fue clonado a un vector a base de pUC pequeño para permitir la construcción rápida de 10 mutantes ámbar individuales (en los codones para aminoácidos L3, 113, T44, F68, RUO, V114, T121, 1127, S131, T145) mediante mutagénesis dirigida al sitio. El GAL4 y los mutantes ámbar resultantes fueron luego subclonados a un vector de levadura de 2-micras bajo en control del promotor de ADH1 de plena longitud para crear pGADGAL4 y una serie de mutantes ámbar denotados como pGADGAL4 (xxTAG) (Figura 1, Panel C) , donde xx denota el codón de aminoácido en el gen GAL4 que fue mutado al codón ámbar. Cada mutante de GAL4 fue co-transformado ya sea con EcTyrRS/tRNACUA o A5/tRNACuA a. células MaV203, convirtiendo los transformantes a leucina y protrofia de tryptófano. El pGADGAL4 por si mismos transformado con eficiencia muy baja (<10-3 veces aquella de los mutantes ámbar de GAL4 ) y es supuestamente perjudicial a las células MaV203 a tal copia alta; ninguno de tales efectos fue observado con los mutantes ámbar de GAL . Los fenotipos de reporteros de GAL4 , en presencia de una sintetasa activa muerta, fueron analizados sobre placas URA y placas de 5-FOA al 0.1% (Figura 3, Panel A) . Cinco imitantes de GAL4 (L3TAG, I13TAG, T44TAG, F68TAG, S131TAG) crecieron sobre placas URA y no crecieron sobre 5-FOA al 0.1% en presencia de ya sea EcTyrRS tipo silvestre o inactivo. En estos imitantes ámbar, la supresión endógena es aparentemente suficiente para impulsar la supresión moderada por EcTyrRS /tR AcuA más allá del intervalo dinámico del reportero de URA3 en MaV203. Cinco mutantes ámbar individuales de GAL4 (R110TAG, V114TAG, T121TAG, I127TAG, T145TAG) crecieron en ausencia de uracilo y en presencia de EcTyrRS / R coAí (pero no A5/tRNACoA) y mostraron el fenotipo inverso sobre 5-FOA. Estos mutantes muestran que los fenotipos dependientes de EcTyrRS que caen dentro del intervalo dinámico del reportero de URA3 en MaV203. El fenotipo dependiente de EcTyrRS más limpio tanto sobre URA como 5-FOA al 0.1% fue observado con el imitante RUO TAG de GAL4. Sin embargo, este mutante mostró algún color azul en análisis de X-GAL cuando es co-transformado con A5. Para mejorar además el intervalo dinámico, se hicieron una serie de seis mutantes ámbar dobles d GAL4 que contienen RUO TAG (Figura 3, Panel B) , (L3TAG, R110TAG; I13TAG, R110TAG; T44TAG, R110TAG R110TAG, T121TAG; R110TAG, J127TAG; R110TAG, T145TAG) . Cuatro de estos mutantes dobles (I13TAG, RUOTAG; R110TAG, T121TAG; R110TAG, I127TAG y T145TAG, R110TAG) fueron incapaces de crecer en ausencia de uracilo y crecieron sobre 5-FOA al 0.1%. Estos mutantes doble tienen actividades fuera (menores) del intervalo dinámico de los análisis de placas. Dos de los mutantes dobles (L3TAG, R110TAG y T44TAG, R110TAG) crecienron en presencia de EcTyrRS/tRNACuA tipo libre o silvestre, pero no con A5/tRNAC0A sobre placas ÜRA; estos mutantes también mostraron que los fenotipos reciprocoa esperados sobre 5-FOA. pGADGAL4 (T44TAG, R110TAG) , los más activos de estos dos mutantes de GAL4, fueron seleccionados para una caracterización más detallada (Figura 4) . aV203 que contiene pGADGAL4 (T44TAG, R110TAG) /pEcTyrRS-tRNAXCÜA fueron azules sobre X-GAL pero la cepa correspondiente que contiene pA5/tRNAC0A no lo fue. Similarmente MaV203 que contiene pGADGAL4 (T44TAG, R110TAG) /pEcTyrRS/tRNACÜA sobre placas con concentraciones de 3-AT de hasta 75 mM y sobre placas ÜRA pero la cepa correspondiente que contiene pA5/tRNACDA no creció en 3AT 10 mM o en ausencia de uracilo. Tomados conjuntamente, los fenotipos dependientes de EcTyrRS de pGADGAL4 (T44TAG, R110TAG) pueden abarcar el intervalo dinámico de los reporteros URA3, HIS3 y lacZ en MaV203. Fue de interés determinar la actividad de los mutantes de GAL4 en los cuales T44 o RUO fueron sustituidos con aminoácidos diferentes a tirosina, puesto que la capacidad para sustituir aminoácidos variados sin alterar la actividad de GAL4 es probable que sea útil para la selección de aminoacil-tARTSI sintetasas mutantes que pueden incorporar aminoácidos no naturales a proteínas. Véase, por ejemplo, M. Pasternak y colaboradores, (200C), A new orthogonal suppressor tRNAlaminoacyl-tARN synthetase pair for evolving an organlsm with an expanded genetic code, Helvética Chemica Acta 83:2277. Una serie de cinco mutantes de residuo de T44 en GAL4, (T44Y, T44W, T44F, T44D, T44K) fueron construidos en pGADGAL4 (R110TAG) , puesto que el pGADGAL4 es en si mismo tóxico. Una serie similar de mutantes en posición RUO en GAL , (R110Y, R110W, R110F, R110D, R110K) en pGADGAL4 (T44TAG) fue construida. Estos mutantes están polarizados o predispuestos hacia las cadenas laterales de aminoácido hidrofóbicas grandes que fueron de interés a incorporar a proteínas, pero también contienen un residuo cargado positiva y negativamente como una prueba estringente de permissividad. Cada mutante fue co-transfornado con pEcTyrRS/tRNACOA a células MaV203 y aislados leu+ trp+ analizados en cuanto a la producción de lacZ mediante hidrólisis de orto-nitrofenil-ß-D-galactopiranosuro (ONPG) (Figura 5) . La variación en actividad entre células que contienen GAL4 con diferentes aminoácidos sustituidos ya sea para T44 o RUO fue menor de 3 veces en todos los casos. Esta variabilidad mínima demuestra la permissividad de estos sitios a sustitución de aminoácidos sin alteración la actividad de transcripción de GAL4. Como se espera de la actividad de los mutantes ámbar individuales analizados sobre placas selectivas, los mutantes de T44 elaborados en el fondo GAL4 (R110TAG) conducieron a hidrólisis más lenta de ONPG que los mutantes RUO elaborados en el fondo de GAL4 (T44TAG) . Estudios de enriquecimiento de modelo fueron llevada a cabo para examinar la capacidad del sistema para seleccionar una sintetasa activa a partir de un gran exceso de sintetasas inactivas (Tabla 1, Tabla 2, Figura 6) . Esta selección modela la capacidad para seleccionar sintetasas activas a partir de una biblioteca de variantes en presencia de un aminoácido no natural. Células de MaV203 que contienen el GAL (T44, RUO) y EcTyrRS/tRNAC0A fueron mezcladas con un exceso de 10 a 106 veces de GAL4 (T44TAG, R110TAG) y A5/tRNACüa como se determinada tanto mediante OD56Q y la fracción de colonias que se vuelven azul cuando son depositadas sobre medios -leu, -trp no selectivos y analizadas mediante deposición superficial de X-GAL. Aquellas células que sobreviven sobre 3-AT 50 mM o en ausencia de uracil o fueron seleccionadas. La proporción de células que cobreviven sobre 3-AT o -URA que fueron azules en el análisis de X-GAL a aquellas que fueron blancas cuando se compraron con la misma proporción en ausencia de selección, demuestra claramente que las selecciones positivas pueden- enriquecer sintetasas activas de sintetasas muertas por un factor >105 (Tabla 1) . La medición de enriquecimientos exactos para proporciones de partida mayores de 1:105 no fue en general posible, debido a que no más de 106 células pueden ser depositadas convenientemente sin diafonia significativa entre células que conducen a fenotipos no confiables.
TABLA 1. SELECCIONES POSITIVAS DE MODELO PARA EcTyrRS FUNCIONALES Proporción de 1:10 1:10 1:103 l:10e 1:105 partida, EcYRS :A5a Dilución de 1:103 l:10 1:102 1 10J 1:10 1:103 1 1:103 Células 1360 1262 >103 1774 >104 1092 >104 1472 -Leu, Trp (81) (0) (1) (0) (-) (0) (-) (0) (#azulb) 152 9 (9) 8 0 (-) 5 0 (- 16 o (- -üra (#azulb ) (152) 7 (7) (8) 0 (-) (5) ) (14) ) -His + 50 mM3AT 135 0 (- 3 0 (- 10 0 (- (#azul ) (135) ) (3) ) (10) ) Factor de >10 >10 >103 >104 >105 enriquecimiento a) Determinado mediante ODs50 b) Sobre X-GAL TABLA 2. SELECCIONES DEMODELO NEGATIVO PARA EcTyrRS NO FUNCIONALES (A5) Proporción de partida, 1:10 1:102 1:103 1:104 A5:EcYRSa Dilución de 1:103 1:102 1:103 1:104 10 Células 353 1401 1336 1375 >104 -Leu, Txp (22) (31) (2) (0) 2(2) (#blancob) 16 41 4 (4) 0(-) 5-FOA al 0.1% (16) (41) (#blancob) Factor de >10 >45 >600 >0.67X104 enriquecimiento A) Determinado mediante OD650 b) Sobre X-GAL Después de una selección positiva en presencia de aminoácido no natural, las células seleccionadas contendrán sintetasas actas de usar aminoácidos naturales y aquellas actas de usar un aminoácido no natural agregado. Para aislar aquellas sintetasas capaces de usar solamente el aminoácido no natural, las células que codifican sintetasas que usan aminoácidos naturales deben ser canceladas de los clones seleccionados. Esto se pueden llevar a cabo con una selección negativa en la cual el aminoácido natural es retenido y aquellas sintetasas que funcionan con un aminoácido natural son eliminadas . Una selección negativa de modelo fue llevada a cabo de manera análoga a la selección positiva de modelo. EcTyrRS/tRNAcoA fue mezclado con un exceso de 10 a 105 veces de A5/tRNACoA y la selección se llevó a cabo sobre 5-FOA al 0.1%. La comparación de la proporción de células que sobreviven sobre 5-FOA al 0.1% que fueron blancas en el análisis X-GAL a aquellas fueron azules, a la misma proporción bajo condiciones no selectivas (véase Tabla 2) hace claro que las selecciones negativas pueden enriquecer las sintetasas muertas de las sintetasas activas por un factor de por lo menos 0.6 x 104. La medición de enriquecimiento exactos para proporciones de partida mayores de 1:104 no fue en general posible, debido a que no más de 10s células pueden ser depositadas convenientemente sin diafonía significativamente entre las células que conduce a fenotipos no confiables. Se desarrolló un procedimiento general que permite tanto la selección positiva de aaRS que reconocen aminoácidos no naturales y selección negativa de aaRS que reconocen aminoácidos naturales. Al hacer variar las estringencias de la selección, una variedad de actividades de sintetasa pueden ser aisladas. La aplicación de este método a una selección de modelo utilizando variantes de EcTyrRS mostraron enriquecimientos mayores de 105 en una sola ronda ya sea de selección positiva y mayor de 0.6 x 104 en una sola ronda de selección negativa. Estas observaciones sugieren que este método puede proporcionar acceso rápido a aminoacil-tARN sintetasas ortogonales que funcionan para la incorporación especifica del sitio de aminoácidos no naturales con una diversidad de cadenas laterales a proteínas en S. cerevisiae. Además, las enzimas en S. cerevisiae pueden ser usadas en eucariontes superiores.
Materiales y Métodos Construcción del vector El gen tRNACuA fue amplificado mediante PCR utilizando los cebadores tRNA5' : GGGGGGACCGGTGGGGGGACCGGTAAGCTTCCCGATAAGGGAGCAGGCCAGTAA AAAGCATTACCCCGTGGTGGGTTCCCGA ( SEQ ID NO: 89) y tRNA3' : GGCGGCGCTAGCAAGCTTCCCGATAAGGGAGCAGGCCAGTAAAAAGGGAAGTTC AGGGACTTTTGAAAAAAATGGTGGTGGGGGAAGGAT (SEQ ID NO: 90) a partir de pESCSU3üRA. Estas y todas las otras reacciones de PCR se llevaron a cabo utilizando el equipo Expand PCR de Roche, de acuerdo con las instrucciones de los fabricantes. Después de digestión de endonucleasa de restricción con Nhel y Agel este gen de tARN fue insertado entre los mismos sitios en el vector de 2 µp? pESCTrp (Stratagene) para producir ptRNAcoA- El promotor ADH1 de plena longitud fue amplificado mediante PCR a partir de pDBLeu (Invitrogen) con los cebadores PADHf: IGGGGGGACCGGTIGGGGGGACCGGTCGGGATCGAAGAAATGATGGTAAATGAAATAGGAA ATCAAGG (SEQ ID NO: 91) y pADHR : GGGGGGGAATTCAGTTGATTGTATGCTTGGTATAGCTTGAAATATTGTGCAGAAA AAGAAAC (SEQ ID NO: 92), sometidos a digestión con Agel hy EcoRI . El EcTyrRS fue amplificado con los cebadores pESCTrpl : CATAACGAGAATTCCGGGATCGAAGAAATGATGGTAAATGAAATAGGAAAT CTCATAACGAGAATTCATGGCAAGCAGTAACTTG (SEQ ID NO: 93) y pESCTrp2 : TACTACGTGCGGCCGCATGGCAAGCAGTAACTTGTTACTACGTGCGGCCGC TTATTTCCAGCAAATCAGAC (SEQ ID NO: 94) . El producto de PCR de EcTyrRS fue sometido a digestión con EcoRI y fue luego sometido a digestión con Not I. ptRNACuA con Age I y Not I. Una triple ligación de estos tres ADN produjeron pEcTyrRS-tRNAcoA- El plásmido pA5-tRNACCA en el cual los residuos de aminoácido (37, 126, 182, 183 y 186 en el sitio activo son mutados a alanina) fue creado mediante PCR de superposición utilizando los oligonucleótidos F37Afwd: CCGATCGCGCTCGCTTGCGGCTTCGATC (SEQ ID NO: 95), N126Afwd: ATCGCGGCGAACGCCTATGACTGGTTC (SEQ ID NO: 96), 182, 183, 186A, GTTGCAGGGTTATGCCGCCGCCTGTGCGAACAAACAGTAC ( SEQ ID NO: 97) y sus complementos inversos, también como los oligonucleótidos de flanqueo, 4783: GCCGCTTTGCTATCAAGTATAAATAG (SEQ ID NO: 98), 3256: CAAGCCGACAACCTTGATTGG (SEQ ID NO: 99) y pEcTyrRS—tR cuA como una plantilla. El producto PCR fue sometido a digestión con EcoRI y Not I y ligado al fragmento grande de pEcTyrRS-tRNACuA producido en la digestión con las mismas enzimas. Para construir reporteros DB-AD de primera generación, el dominio de enlace de ADN de GAL4 fue amplificad mediante PCR a partir de pGADT7 (Clontech) utilizando el cebador delantero pADfwd : GGGGACAAGTTTGTACAAAAAAGCAGGCTACGCCAATTTTAATCAAAGTGGGAATATTGC (SEQ ID NO: 100) o pADfwd (TAG) GGGGACAAGTTTGTACAAAAAAGCAGGCTAGGCCAATTTTAATCAAAGTGGGAATATTGC (SEQ ID NO: 101) y ADrev: GGGGACCACTTTGTACAAGAAAGCTGGGTTACTCTTTTTTTGGGTTTGGTGGGGTATC (SEQ ID NO: 102) . Estos productos de PCR fueron clonados en al vector pDEST3-2 (invitrogen) utilizando el procedimiento de Clonase, de acuerdo con las instrucciones del fabricante, produciendo pDB-AD y pDB- (TAG) -AD. Para construir el PGADGAL4 y variantes, e gen de GAL4 fue amplificado mediante pCLl (Clontech) mediante PCR utilizando los cebadores ADH1428-1429 AAGCTATACCAAGCATACAATC (SEQ ID NO: 103) y GAL4C: ACAAGGCCTTGCTAGCTTACTCTTTTTTTGGGTTTGGTGGGGTATCTTC (SEQ ID NO: 104) . Este fragmento fue clonado al vector pCR2.1 TOPO (Invitrogen) de acuerdo con las instrucciones del fabricante. Un clon que contiene el gen de GAL4 (pCR2.1 TOPOGAL4) fue sometido a digestión con Hind III y el gel de fragmento de .GAL4 de 2.7 kb purificado y ligado al fragmento grande de pGADT7 que habia sido sometido a digestión con Hind III, tratado con fosfatasa intestinal de becerro y purificado con gel. Variantes del gen GAL4 fueron creadas mediante reacciones de Quikchange (Stratagene) , llevada a cabo de acuerdo con las instrucciones de los fabricantes sobre pCR2.1 utilizando cebadores enlistados en la información complementaria. Los imitantes de GAL4 fueron clonados en pGADT7 de la misma manera como el gen GAL4 de tipo libre. Todos los constructos finales fueron confirmados mediante secuenciación de ADN.
Medios de levadura y manipulaciones S. cerevlsiae cepa Mav203, (Invitrogen) es MAT ; leu2-3 r112; trpl 109; his3 ?200; ade2-101; cyh2R; cyhlR; GAL4 ?; gal80 ?; GAL1 : : lacZ; HIS3UASGAL1 : : HIS3&LYS2; SPAL10UASGAL1 : : URA3. Los medios de levadura fueron comprados de Clontech, 5-FOA y X-GAL fueron de Invitrogen y 3-AT fue de BIO 101. YPER (Reactivo de Extracción de Proteínade Levadura) y ONPG fueron comprados de Pierce Chemicals . Las transformaciones de plásmido se llevaron a cabo mediante el método de PEG/acetato de litio (véase, por ejemplo, D. Burke y colaboradores, (2000) Methods in Yeast Genetics. Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY) y los transformantes seleccionados sobre los medios de goteo completos sintéticos apropiados . Para probar los fenotipos conferidos mediante varias 'combinaciones de plásmido sobre colonias de levadura de MaV203 a partir de placas de goteo completas sintéticas de cada trasformación fueron resuspendidos en 15 µ?. de agua estéril y rallado sobre los medios de interés selectivos. Cada fenotipo fue confirmado con por lo menos cinco colonias independientes . Se llevaron a cabo análisis de SeX-GAL mediante el método de deposición superficial de agarosa. Véase, I. G. Serebriiskii, & E. A. Golemis, (2000), Uses of lacZ to study gene function: evaluation of beta-galactosidase assays employed in the yeast two-hybrid system, Analytical Biochemistry 285:1-15. Brevemente, colonias o parches de células fueron sometidos a lisis sobre placas de agar mediante varias adiciones de cloroformo neto. Después de la evaporación de cloroformo, agarosa al 1% que contiene 0.25 g/L de XGAL y de pH regulado con Na2P04 con 0.1 M fue aplicado a la superficie de la placa. Una vez que la agarosa estaba fraguada, las placas fueron incubadas a 37 °C durante 12 horas. Se llevaron a cabo análisis de .ONPG mediante inoculación de 1 mL de SD-leu, -trp en un bloque de 96 cavidades con una sola colonia e incubados a 30°C con agitación. La OD66o de 100 µ?? de células y varias diluciones de células fueron registrados en paralelo en una placa de microtitulo de 96 cavidades. Las células (100 µL) fueron mezcladas con 100 µ? de YPER: ONPG (IX PBS, 50% v/v YPER, MgCl2 20mM, 0.25% v/v p-mercaptoetanol y PNPG 3 mM) e incubadas con agitación a 37 °C. Después del desarrollo del color, las células fueron transformadas en pelotillas mediante centrifugación, el sobrenadante fue transferido a una placa de microtítulo de 96 cavidades limpia (catálogo # 167008 de Nunclon) y el A420 registrado. Todos los datos mostrado son el promedio de pruebas de por lo menos 4 clones independiente y las barras de error mostradas representa la desviación estándar. Se calculó la hidrólisis de ONPG utilizando la ecuación: unidades de beta-galactosidasa = 1000. A420/(V. t. OD66o) donde V es el volumen de las células en mililitros, t es el tiempo de incubación en minutos. Véase, por ejemplo, I. G. Serebriiskii, & E. A. Golemis, (2000), Uses oí lacZ to study gene function : evaluatlon of beta-galactosidase assays employed in the yeast two~hybrid system, Analytical Biochemistry 285:1-15. Una unidad de beta-galactosidasa corresponde a la hidrólisis de 1 µpa?? de ONPG/minuto/célula . Véase, Serebriiskii and Golemis, supra. Se llevaron a cabo lecturas esectrofotométricas sobre un lector de placa SPECTRAmaxl90.
Selecciones de Modelo Selecciones Positivas: Dos cultivos en toda la noche fueron cultivados en SD-Leu, -Trp. Una contenia MaV203 que comprende pEcTyrRS-tRNAcó A/PGADGAL4 (T44, R110TAG) y el otro contenia pA5-tRNASU3/pGADGAL4 (T44, R110TAG) . Estas células fueron cosechadas mediante centrifugación y resuspendidas en NaCl al 0.9% mediante vórtice. Las dos soluciones celulares fueron luego diluidas a OD660s idénticas. El MaV203 que comprende pEcTyrRS-tRNAr pGADGAL4 (T44, R110TAG) fueron diluidos serialmente en 7 ordenes de magnitud y luego cada dilución fue mezclada 1:1 volumen: olumen con aV203 sin diluir que comprende pA5-tRNActm/pGADGAL4 (T44, R110TAG) para proporcionar proporciones de células que contienen tirosil-tARN sintetasa activa e inactiva. Para cada proporción una segunda dilución serial se llevó a cabo en la cual el número de células fue disminuido pero la proporción de células que comprenden pEcTyrRS- tRNACOa/pGADGAL4 (T44, R110TAG) y pA5-tRNACuA/pGADGAL4 (T44, R110TAG) fue mantenida. Estas diluciones fueron depositadas sobre SD-Leu, -trp, SD-Leu, -Trp, -URA y SD-Leu, -Trp, -His + 3-AT 50 mM. Después de 60 horas, el número de colonias sobre cada placa fue contado, utilizando una cámara de CCD de Eagle Eye (Stratagene) y el fenotipo de los sobrevivientes fue confirmado con un análisis de beta-galactosidasa de X-GAL. Las células de varias colonias individuales azul o blanca fueron aisladas al cultivo a saturación en SD-leu, -trp y el plásmido de ADN aislado mediante métodos estándar. La identidad de la variante fue EcTyrRS confirmada mediante secuencia de ADN.
Selección negativa: Se llevó a cabo selección negativa de modelo de manera análoga a la selección positiva, excepto que MaV203 que comprende pA5- RNACUA/ GADGAL4 (T44, R110TAG) fue diluido en serie y mezclado con una densidad fija de MaV203 que comprende pEcTyrRS-tRNAC0A/pGADGAL4 (T44, R110TAG) . Las células fueron depositadas sobre SD-leu, -trp + 5-FOA al 0.1%, el número de colonias fue contado después de 48 horas y las placas procesadas como se describe anteriormente. Los siguientes oligonucleótidos (Tabla 3) fueron usados en combinación con sus complementos inversos para construir mutantes dirigidos al sitio mediante mutagénesis de Quikchange. La posición de la mutación es denotada por el texto en negritas .
TABLA 3: OLIGONUCLEOTIDOS USADOS PARA CONSTRUIR MUTANTES DIRIGIDOS AL SITIO Oligo Secuencia de Mutantes Ambar L3TAG 5 ' -ATGAAGTAGCTGTCTTCTATCGAACAAGCATGCG-3' (SEQ ID NO: 66) I13TAG 5 ' -CGAACAAGCATGCGATTAGTGCCGACTTAAAAAG-3' (SEQ ID NO: 67) T44TAG 5 ' -CGCTACTCTCCCAAATAGAAAAGGTCTCCGCTG-3' (SEQ ID NO: 68) F68TAG 5' -CTGGAACAGCTATAGCTACTGATTTTTCCTCG-3' (SEQ ID NO: 69) R110TAG 5' -GCCGTCACAGATTAGTTGGCTTCAGTGGAGACTG-3 ' (SEQ D NO: 70) V114TAG 5' -GATTGGCTTCATAGGAGACTGATATGCTCTAAC-3' (SEQ ID NO: 11) T121TAG 5' -GCCTCTATAGTTGAGACAGCATAGAATAATGCG-3' (SEQ ID NO: 72) I127TAG 5' -GAGACAGCATAGATAGAGTGCGACATCATCATCGG-3 ' (SEQ ID NO: 73) S131TAG 5' -GAATAAGTGCGACATAGTCATCGGAAGAGAGTAGTAG-3' (SEQ ID NO: 74) T1 5TAG 5' -GGTCAAAGACAGTTGTAGGTATCGATTGACTCGGC-3 ' (SEQ ID NO: 75) Oligo Secuencia de Mutantes de Sitio Permisivos T44F 5' -CGCTACTCTCCCCAAATTTAAAAGGTCTCCGCTG-3' (SEQ ID NO: 76) T44F 5' -CGCTACTCTCCCCAAATATAAAAGGTCTCCGCTG-3' (SEQ ID NO: 77) T44W 5' -CGCTACTCTCCCCAAATGGAAAAGGTCTCCGCTG-3' (SEQ ID NO: 78) T44D 5' -CGCTACTCTCCCCAAAGATAAAAGGTCTCCGCTG-3' (SEQ ID NO: 79) T44K 5' -CGCTACTCTCCCCAAAAAAAAAAGGTCTCCGCTG-3' (SEQ ID NO: 80) T110F 5' -GCCGTCACAGATTTTTTGGCTTCAGTGGAGACTG-3 ' (SEQ ID NO 81) T110Y 5' -GCCGTCACAGATTATTTGGCTTCAGTGGAGACTG-3' (SEQ ID NO: 82) T110W 5' -GCCGTCACAGATTGGTTGGCTTCAGTGGAGACTG-3' (SEQ ID NO: 83) T110D 5' -GCCGTCACAGATGATTTGGCTTCAGTGGAGACTG-3' (SEQ ID NO: 84) T110K 5' -GCCGTCACAGATTAAATTGGCTTCAGTGGAGACTG-3' (SEQ ID NO: 85) EJEMPLO 2. UN CODIGO GENETICO EOCARIONTICO EXPANDIDO Se describe una ruta general y rápida para la adición de aminoácidos no naturales al código genético de Saccharomyces cerevisiae. Cinco aminoácidos han sido incorporados a proteínas eficientemente, con alta fidelidad, en respuesta al codón sin sentido TAG. Las cadenas laterales de estos aminoácidos contienen un grupo ceto, el cual puede ser modificado de manera única in vitro e in vivo con un amplio intervalo de sondas y reactivos; un aminoácido que contiene átomo pesado. para estudios estructurales y fotorretxculadores para estudios celulares de interacción de proteína. Esta metodología no solamente elimina las restricciones impuestas por el código genético en nuestra capacidad para manipular la estructura y función en proteína levadura, proporciona una compuerta a la expansión sistemática de los códigos genéticos de eucariontes multicelulares . Aunque los químicos han desarrollado un arreglo poderoso de métodos y estrategias para sintetizar y manipular las estructuras de moléculas pequeñas (véase, por ejemplo, E. J. Corey, & X.-M. Cheng, The Logic of Chemical Synthesis (Wiley-Interscience, Nueva York, 1995)), la capacidad para controlar racionalmente la estructura y función de la proteína está todavía en su infancia. Los métodos de mutagénesis están limitados a los bloques de construcción de los 20 aminoácidos comunes, aunque una diversidad de casos, ha sido posible incorporar competitivamente análogos estructurales estrechos de aminoácidos comunes en todo el proteoma. Véase, por ejemplo, K. Kirshenbaum y colaboradores, (2002), ChemBioChem 3:235-7; y V. Doring y colaboradores, (2001), Science 292:501-4. Síntesis total [véase, por ejemplo, B. Merrifield, (1986), Science 232: 341-7 (1986)) y metodologías semi-sintéticas [véase, por ejemplo, D. Y. Jackson y colaboradores, (1994) Science 266: 243-7; y P. E. Dawson, & S . B . Kent, (2000), Annual Review of Biochemistry 69:923-60, han hecho posible sintetizar péptidos y proteína pequeñas, pero tienen utilidad más militada con proteínas de más de 10 kilodaltons (kDa) . Los métodos biositéticos que involucran tARN ortogonales acilados químicamente [véase, por ejemplo, D. Mendel y colaboradores, (1995), Annual Review of Biophysics and Biomolecular Structure 24:435-462; y V. W. Cornish y colaboradores, (Mar. 31,1995), Angewandte Chemie- International Edition in English 34:621-633) han permitido que aminoácidos no naturales sean incorporados a proteínas más grandes, tanto in vitro (véase, por ejemplo, J.A. Ellman, et al., (1992), Science 255: 197-200) y en células microinyectadas (véase, por ejemplo. D.A. Dougherty, (2000) . Current Opinión in Chemical Biology (4:645-52). Sin embargo la naturaleza estequiométrica de la acilación química limita severamente la cantidad de proteína que puede ser generada. Asi, a pesar de esfuerzos considerables, las propiedades o de proteínas y posiblemente organismos enteros, han sido limitados por medio de la evolución por los veinte aminoácidos codificados genéticamente (con las raras excepciones de pirrolisina y selenocisteína (véase por ejemplo A. Bock et al., (1991), Molecular Microbiology 5:515-20 y G. Srinivasan, et 1., (2002), Science 296: 1459-62)). Para superar esta limitación, nuevos componentes fueron agregados a la maquinaria biosintética de proteínas del procarionte Escherichia coli (E. coli) (por ejemplo, L. Wang, et al., (2001), Science 292:498-500), lo cual hace posible codificar genéticamente aminoácidos no naturales in vivo. Un número de nuevos aminoácidos con nuevas propiedades químicas, físicas o biológicas han sido incorporados eficiente y selectivamente a proteínas en respuesta al codón ámbar, TAG. Véase, por ejemplo J.W. Chin et al., (2002), Journal of the American Chemical Society 11:1135-1137; J.W. Chin, et al., (2002), PNAS United States of America 99:11020-11024; y, L. Wang & P.G. Schultz, (2002), Chem. Com. , 1:1-10. Sin embargo, debido a que la maquinaria de traducción no es bien conservada entre procariontes y eucariontes, los componentes de la maquinaria biosintéticas agregados a E. coli no pueden n general ser usados para incorporar específicamente en el sitio aminoácidos no naturales a proteínas para estudiar o manipular procesos células en células eucariónticas . Así, se crearon componentes de traducción que expandirían el número de aminoácidos codificados genéticamente en células eucariónticas. Se escogió Saccharomyces cerevisiae como el organismo huésped eucarióntico inicial, debido a que es un eucarionte modelo útil, debido a que es un eucarionte modelo útil, la manipulaciones genéticas son fáciles (véase, por ejemplo, D. Burke, et al., (2000), Methods in Yeast Genetics (Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY) , y su maquinaria de traducción es altamente homologa a aquella de los eucariontes superiores (Véase, por ejemplo, T.R. Hughes, (2002), Funct. Integr. Genomics 2:199-211) . La adición de nuevos bloques de construcción al código genético de S. cerevisiae requiere un codón único, tARN y aminoacil-tARN sintetasa ( xaaRSr ) que no reacciona de manera cruzada con ningún componente de la maquinaria de traducción de levadura (véase por ejemplo, Noren · et al., (1989) Science 244:182; Furter (1998) Protein Sci . 7:419; y Liu et al., (1999) PNAS USA 96:4780) . Un par ortogonal candidato es el par supresor tirosil-rRNA sintetasa-tRNA ámbar de E. coli (véase, por ejemplo, H.M. Goodman, et al., (1968), Nature 217:1019-24; y D.G. Barker, et al., (1982), FEBS Letters 150:419-23). La tirosil-tARN sintetasa (TyrRS) de E. coli aminoacila eficientemente tRNACuA de E. coli cuando ambos son codificados genéticamente en S . cerevisiae pero no aminoacila tARN citoplásmicos de S. cerevisiae. Véase, por ejemplo, H. Edwards, & P. Schimmel, (1990), Molecular & Cellular Biology 10:1633-41; y H. Edwards, et al. (1991), PNAS United States of America 88:1153-6. Además, el tirosil tRNAC0A de E. coli es un sustrato deficiente para aminoacil-tARN sintetasas de S. cerevisiae (véase, por ejemplo, V. Trezeguet, et al., (1991), Molecular & Cellular Biology 11:2744-51) pero es procesado y exportado del núcleo al citoplasma (véase por ejemplo, S.L. Wolin, & A.G. Matera, (1999) Genes & Development 13:1-10) y funciona eficientemente en traducción de proteina en S. cerevisiae. Véase, por ejemplo H. Edwards, & P. Scñimmel, (1990) Molecular & Cellular Biology 10:1633-41; H. Edwards, et al., (1991), PNAS United States of America 88:1153-6; y V. Trezeguet, et al., (1991), Molecular & Cellular Biology 11:2744-51. Además, el TyrRS de E. coli no tiene un mecanismo de edición y por consiguiente no debe corregir un aminoácido no natural ligado al tARN. Para alterar la especificidad del aminoácido al TyrRS ortogonal de tal manera que aminoacile tRNAcoa con un aminoácido no natural deseado y ninguno de los aminoácidos endógeno una gran biblioteca de mutantes TyrRS fue generada y sometida a selección genética. En base a la estructura cristalina del TyrRS homólogo de cinco residuos de Bacillus stearothermophilus (véase, por ejemplo, P. Brick, et al., (1989), Journal of Molecular Biology 208:83) ( (B. stearothermophilus, Figura 7, Panel A) ) en el sitio activo de TyrRS de E. coli que están dentro de 6.5 Á de la posición para del anillo de arilo de tirosina enlazada fueron mutados. Por ejemplo para crear la biblioteca EcTyrRS de mutantes, las cinco posiciones apuntadas para mutación fueron primero convertidas a codones de alanina para producir el gen A5RS. Este fue dividido entre dos plásmidos en un sitio Pst I único en el gen. La biblioteca fue creada esencialmente como se describe mediante técnica conocidas en el arte (véase, por ejemplo, Stemmer et al., (1993) Biotechniques 14:256-265). Un plásmido contiene la mitad 5' del gen A5RS, el otro plásmido contiene la mitad 3' del gen A5RS . Se llevó a cabo mutagénesis en cada fragmento mediante PCR con cebadores oligonucleótidos para la amplificación del plásmido entero. Los cebadores son impurificados, que contienen NNK (N = A + G + T + C y K = G + T) y sitios de reconocimiento de endonucleasa de restricción Bsa I. La digestión con Bsa I y ligación produjeron dos plásmidos circulares, cada uno contiene copias mutantes de una mitad del gen EcTyrRS. Luego los dos plásmidos fueron digeridos con Pst I y ensamblados a un solo plásmido mediante ligación, conduciendo al ensamble de los genes mutantes de plena longitud. Los genes EcTyrRS imitante fueron extirpados de este plásmido y ligados a pA5RS/tRNACOA entre los sitios EcoRI y Not I. La biblioteca fue transformada en S. cerevisiae Mav203: PGADGAL4 (2TAG) utilizando el método de PEG-acetato de litio produciendo ~108 transformantes independientes. Una cepa de selección de S. cerevisiae [MaV203: PGADGAL4 (2 TAG (véase por ejemplo, M. Vidal, et al,, (1996), PNAS United States of America 93:10321-6; M. Vidal, et al., (1996), PNAS United States of América 93:10315-201 y, Chin, et al., (2003) Chem. Biol. 10:511)] fue transformada con la biblioteca para producir 108 transformantes independientes y cultivado en presencia de aminoácido no natural 1 milimolar (Figura 8, Panel C) . La supresión de dos codones ámbar permisivos en el GAL4 activador transcripcional conduce a la producción de GAL4 de plena longitud y la activación transcripcional de HIS3, sensible a GAL, genes reporteros lacZ y URA3 (Figura 8, Panel A) . Por ejemplo, los codones permisivos son para T44 y RUO de Gal4. Expresiones de HIS3 y URA3 en medios que carecen de uracilo (-ura) , o que contienen 3-aminotriazol 20 milimolar (véase, por ejemplo, G. M. Kishore, & D.M. Shan, (1988), Annual Review of Biochemistry 57, 627-63) (3-AT, un inhibidor competitivo de proteina His3 ) y carente de histidina (-his), permite que clones que expresan pares aaRS-tRNA activos sean seleccionados positivamente. Si un TyrRS mutante carga el tRNACuA con un aminoácido, luego la célula biosintetiza histidina y uracilo y sobrevive. Las células sobrevivientes fueron amplificadas en ausencia de 3-AT y aminoácido no natural para eliminar GAL4 de plena longitud de las células que incorporan selectivamente el aminoácido no natural. Para eliminar los clones que incorporan aminoácidos endógenos en respuesta al codón ámbar, se cultivaron células en medios que contienen ácido 5-fluorótico al 0.1% (5-FOA) pero que carecen del aminoácido no natural. Aquellas células que expresan URA3, como resultado de la supresión de las mutaciones ámbar de GAL4 con aminoácidos naturales, convierten el 5-FOA a un producto tóxico, exterminando la célula. Véase, por ejemplo, J.D. Boeke, et al. (1984), Molecular & General Genetics 197:345-6. Los clones sobrevivientes fueron amplificados en presencia de aminoácido no natural y vueltos a aplicar a la selección positiva. El reportero lacZ permite que pares de sintetasa tARN activos e inactivos sean discriminados colorimétricamente (Figura 8, Panel B) . Con el uso de este procedimiento, cinco nuevos aminoácidos con distintas propiedades esféricas y electrónicas (Figura 7, Panel B) fueron agregados independientemente al código genético de S. cerevisiae. Estos aminoácidos incluyen p-acetil-L-fenilalanina (1), p-benzoil-L-fenilalanina (2), p-azido-L-fenilalanina (3), O-metil-L-tirosina (4), y p-yodo-L-fenilalanina (5) (indicados por los números en la Figura 7, Panel B) . La reactividad única del grupo funcional ceto de p-acetil-L-fenilalanina permite la modificación selectiva de proteínas con un arreglo de reactivos que contienen hidrazina o hidroxilamina in vitro e in vivo (Véase por ejemplo, V. W. Cornish, et al. (28 de Agosto de 1996) , Journal of the American Chemical Society 118:8150-8151; y Zhang, Smith, Wang, Brock, Schultz, en preparación) . El átomo pesado de p-yodo-L-fenilalanina puede probar ser útil para la fase de datos de estructura de rayos X (con el uso de difracción anómala de múltiple longitud de onda) . Las cadenas laterales de benzofenona y fenilazida de p-benzoil-L-fenilalanina y p-azido-L-fenilalanina permiten la fotoreticulación in vivo e in vitro eficiente de proteínas (véase por ejemplo, Chin et al., (2002) J. Am. Chem. Soc. 124:9026; Chin y Schultz, (2002) Chem. Bio. Chem. 11:1135; y, Chin et al., (2002) PNAS, USA 99:11020). El grupo metilo de O-metil-L-tirosina puede ser sustituido fácilmente con un grupo metilo marcado isotópicamente como una sonda de estructura local y dinámica con el uso de resonancia magnética nuclear y espectroscopia vibracional . Después de 3 rondas de selección (positivo-negativo-positivo) , varias colonias fueron aisladas cuya sobrevivencia sobre -ura o sobre medio de 3-AT-his 20 milimolar fue estrictamente dependiente de la adición del aminoácido no natural seleccionado. Véase, Figura 8, Panel D. Los mismos clones fueron azules sobre x-gal solamente en presencia de aminoácido no natural 1 milimolar. Estos experimentos demuestran que los fenotipos observados resultan de la combinación de los pares de aminoacil-tARN sintetasa-tRNAcüA evolucionados y los aminoácidos cognatos (véase, Tabla 4). Por ejemplo, para seleccionar sintetasas de mutante, células (~109) fueron cultivadas durante 4 horas en SD liquido -leu, -trp + aminoácido 1 milimolar. Luego las células fueron cosechadas mediante centrifugación, resuspendidas en NaCl 0.9% y depositada sobre SD -leu, trp, -his + 20 mM 3-AT + aminoácido no natural 1 milimolar o SD -leu, -trp, —ura, + aminoácido no natural 1 milimolar. Después de 48 a 60 horas a 30°C, las células fueron raspadas de las placas a SD -leu, -trp liquido y cultivadas durante 15 horas a 30°C. Las células fueron cosechadas mediante centrifugación, resuspendidas en NaCl al 0.9% y depositadas sobre SD -leu, -trp + 5-FOA al 0.1%. Después de 48 horas a 30°C las células fueron raspadas a SD -leu liquido, -trp + aminoácido no natural 1 milimolar y cultivadas durante 15 horas. Las células fueron cosechadas mediante centrifugación, resuspendidas en NaCl al 0.9% y depositadas sobre SD -leu, -trp, -his + 20 mM 3-AT, + aminoácido no natural 1 milimolar o SD -leu, -trp, -ura, + aminoácido no natural 1 milimolar. Para filtrar los fenotipos de células seleccionadas, colonias (192) de cada selección fueron transferidas a cavidades de bloques de 96 cavidades que contienen 0.5 mililitros de Sd -leu, -trp y cultivadas a 30°C durante 24 horas. Se agrega glicerol (50% v/v; 0.5 mi.) a cada cavidad y las células fueron depositadas por replicado sobre agar (SD -leu, -trp; SD -leu, -trp, -his, +20 mM 3-AT; SD -leu, -trp, -ura) en presencia o ausencia de aminoácido no natural 1 milimolar . Se llevaron a cabo análisis X-Gal sobre placas SD -leu, -trp utilizando el método de deposición superficial de agarosa. Para demostrar que los fenotipos observados son debidos a la incorporación especifica del sitio de los aminoácidos no naturales mediante los pares de TyrRS/tARN imitantes ortogonales, mutantes de superóxido de dismutasa. humano 1 (hSOD) (véase, por ejemplo, H.E. Parge, et al., (1992), PNAS United States of America 89:6109-13) que contienen uno aminoácido no natural fueron generados y caracterizados. Por ejemplo, la adición de ADN que codifica una etiqueta de hexahistidinas C-terminal y mutación del codón para Trp 33 para un codón ámbar en el gen de superóxido de dismutasa humano se llevó a cabo mediante PCR de superposición utilizado PS356 (ATCC) como plantilla. hSOD (Trp 33 TAG) HIS fue clonado entre el promotor GAL1 y el terminador CYC1 de pYES2.1 (Invitrogen, Carlsbad, CA USA) . Los genes de sintetasa mutante y tARN sobre plásmidos derivados de pEcTyrRS-tRNACuA fueron co-transformados con pYES2.1 hSOD (Trp 33 TAG) HIS a la cepa InvSc (Invitrogen) .
Para la expresión de proteína, las células fueron cultivadas en SD -trp, -ura + raffinose y la expresión inducida a una OD66o de 0.5 mediante la adición de galactosa. Los mutantes de HSOD fueron purificados mediante cromatografía de Ni NTA (Qiagen, Valencia, CA, USA) . La producción de hSOD marcada por hexa-histidina a partir de un gen que contiene un codón ámbar en posición 33 fue estrictamente dependiente de p-acetilPheRS-l-tRNA y P- acetil-L-fenilalanina 1 milimolar (<0.1% mediante densimetría, en ausencia ya sea de un componente u otro) (véase figura 9) . hSOD de plena longitud que contiene p-acetil-L-fenilalanina fue purificado (por ejemplo, mediante cromatografía de afinidad de Ni-???) con un rendimiento de 50 ng/mL, comparable a aquel purificado a partir de células que contienen TyrRStRNAcaA. Por comparación, hSODHIS de tipo silvestre podrían ser purificados con un rendimiento de 250 ng/mL bajo condiciones idénticas. La Figura 9 ilustra la expresión de proteínas de Hsod (33TAB)HIS en S. cerevisiae que codifica genéticamente aminoácidos no naturales (como se ilustra en la Figura 7, Panel B e indicada en la Figura 9 por su numeración en la Figura 7, Panel B) . La porción superior de la Figura 9 ilustra electroforesis de gel SDS-poliacrilamida de hSOD purificado a partir de levadura en presencia (+) y ausencia (-) del aminoácido no natural indicado por el número que corresponde al aminoácido no natural ilustrado en la Figura 9, Panel B marcado con Coomassie. Las células que contienen el par sintetasa-tARN mutante seleccionado para el aminoácido indicado. La porción central de la Figura 9 ilustra una prueba inmunológica probada con un anticuerpo contra hSOD.
La porción inferior de la Figura 9 ilustra una prueba inmunológica probada con un anticuerpo contra la etiqueta His6 C-terminal. La identidad del aminoácido incorporado fue determinada al someter un digesto tríptico de la proteina mutante a cromatografía liquida y espectrometría de masas en tándem. Por ejemplo, para espectrometría de masas las bandas de proteína fueron visualizadas mediante teñido de Coomassie coloidal. Las bandas de gel correspondientes al SOD de tipo libre o silvestre y imitantes fueron extirpadas de los geles de poliacrilamida, cortadas en cubos de 1.5 mm, reducidas y alquiladas, luego- sometidas a hidrólisis de tripsina esencialmente como se describe. Véase, por ejemplo, A. Shevchenko, et al., (1996), Analytical Chemistry 68, 850-858. Péptidos trípticos que contienen el aminoácido no natural fueron analizados mediante HPLC^ESI/MS de fase inversa de nanoflujo con un espectrómetro de masas de trampa de un LCQ. El análisis de espectrometría de masas en tándem cromatografía líquida (LC-MS/MS) se llevó a cabo en un espectrómetro de masas de trampa de ion (Thermo Finnigan) equipado con una HPLC de Nanospray (Agilent 1100 series) . Véase, por ejemplo, Figura 10, Paneles A-H. Los iones precursores correspondientes a los iones cargados individual y doblemente del péptido Val-Y*-Gly-Ser-Ile-Lys (SEQ ID NO: 87) que contienen los aminoácidos no naturales (denotados como Y*) fueron separados y fragmentados con un espectrómetro de masas de trampa de iones. Las masas de iones fragmentados podrían ser asignados de manera no ambigua confirmando la incorporación específica del sitio de p-acetil-L-fenilalanina {véase, Figura 10, Panel A) . No se observó ninguna indicación de tirosina u otros aminoácidos en lugar de p-acetil-L-fenilalanina y se obtuvo un mínimo de 99.8% de pureza de incorporación de la proporción de señal a ruido de los espectros del péptido. Se observaron fidelidad y eficiencia, similares en la expresión de proteína cuando se utilizaron p-benzoilPheRS-1, p-azidoPheRS-l, O-meTyrRS-1 ó p-yodoPheRS-1 para incorporar p-benzoil-L-fenilalanina, p-azido-L-fenilalanina, O-metil-L-tirosina o p-yodo-L-fenilalanina a hSOD (Véase, Figura 9 y Figura 10, Paneles A-H) . En los experimentos, p-azido-L-fenilalanina es reducida a p-amino-L-fenilalanina en preparación de la muestra y la última es observada en los espectros de masas. La reducción no ocurre in vivo mediante derivación química de SOD purificado que contiene p-azido-L-fenilalanina . En experimentos de control, hSOD marcado por hexa-histidina que contiene triptófano, tirosina y leucina en la posición 33 fue preparado y sometido a espectrometría de masas (Véase, Figura 10, Paneles F, G, y H) . Los iones que contienen el aminoácido 33 fueron claramente visibles en los espectros de masas de estas muestras. La adición independiente de cinco aminoácidos no naturales al código genético de S. cerevisiae demuestra la generalidad del método y sugiere que puede ser aplicable a otros aminoácidos no naturales en los que se incluyen aminoácidos marcados por espín, de enlace de metal o aminoácidos fotoisomerizables . Esta metodología puede permitir la generación de proteínas con nuevas propiedades o propiedades mejoradas también como facilitar el control de proteínas en levadura. Además, en células de mamíferos, la tirosil-tARN sintetasa de E. coli forma un par ortogonal con el tR AcuA de B. stearothermophilus . Véase, por ejemplo, Sakamoto et al., (2002) Nucleic Acids Res. 30:4692. Por consiguiente, se pueden usar las minoacil-tARN sxntetasas que han evolucionado en levadura para agregar aminoácidos no naturales a los códigos genéticos de eucariontes superiores.
TABLA 4. SECUENCIAS DE AMINOACIL-TRNA SINTETASAS SELECCIONADAS Residuo # 37 126 182 183 186 # de clones Ec TyrRS Tyr Asn Asp Phe Leu p-yodoPheRS-1 Val Asn Ser Tyr Leu 1/8 p-yodoPheRS-2 lie Asn Ser Met Leu 1/8 p-yodoPheRS-3 Val Asn Ser Met Ala 6/8 p-OMePheRS-1 Val Asn Ser Met Leu 5/13 p-OMePheRS-2 Thr Asn Thr Met Leu 1/13 p-OMePheRS-3 Thr Asn Thr Tyr Leu 1/13 p-OMePheRS-4 Leu Asn Ser Met Ser 1/13 p-OMePheRS-5 Leu Asn Ser Met Ala 1/13 p-OMePheRS-6 Thr Asn Arg Met Leu 4/13 p-acetilPheRS-la lie Asn Gly Met Ala 10/10 p-benzoilPheRS-l Gly Asn Gly Phe Ala 1/2 p-benzoilPheRS-2 Gly Asn Gly Tyr Met 1/2 p-azidoPheRS-1 Leu Asn Ser Met Ala 1/6 p-azidoPheRS-2 Val Asn Ser Ala Ala 1/6 p-azidoPheRS-3 Leu Asn Ser Ala Ala 1/6 p-azidoPheRS-4 Val Asn Ser Ala Val 1/6 p-azidoPheRS-5 lie Asp Asn Phe Val 1/6 p-azidoPheRS-6 Thr Asn Ser Ala Leu 1/6 a Estos clones también contienen una mutación Aspl65Gly EJEMPLO 3: ADICIÓN DE AMINOÁCIDO CON NUEVA REACTIVIDAD AL CÓDIGO GENÉTICO DE EUCARIONTES Un método específico del sitio, rápido, confiable e irreversible de bioconjugación a proteínas basadas en una [3+2] es demostrado. Hay una necesidad considerable de reacciones químicas que modifican proteínas bajo condiciones fisiológicas de una manera altamente selectiva. Véase, por ejemplo, Lemineux, & Bertozzi, (1996) TIBTECH, 16:506-513. La mayoría de las reacciones usadas actualmente para la modificación selectiva de proteínas involucran la formación de enlaces covalentes entre socios de reacción nucleofílicos y electrofílicos, por ejemplo la reacción de a-halocetonas con cadenas laterales de histidina o cisteína. La selectividad en estos casos es determinada por el número y capacidad de acceso de los residuos nucleofílicos en la proteína. En el caso de proteínas sintéticas o semi-sintéticas, otras reacciones más selectivas pueden ser usadas tales como la reacción de un ceto-aminoácido no natural con idrazidas o compuestos aminoxi. Véase, por ejemplo, Cornish, et al., (1996) Am. Chem. Soc, 118:8150-8151; y Mahal, et al., (1997) Science, 276:1125-1128. Recientemente, ha sido posible codificar genéticamente aminoácidos no naturales (Véase por ejemplo, Wang, et al., (2001) Science, 292:498-500; Chin, et al., (2002) Am. Chem. Soc. 124:9026-9027; y, Chin, et al., (2002) Proc. Nati. Acad. Sci., 99:11020-11024), en los que se incluyen aminoácidos que contienen cetona (véase, por ejemplo Wang, et al., (2003) Proc. Nati. Acad. Sci. , 100:56-61; Zhang, et al., (2003) Biochemistry, 42:6735-6746; y, Chin, et al., (2003) Science, in press ++++), en bacterias y levaduras utilizando pares de tARN-sintetasa ortogonales con especificidades de aminoácidos alteradas. Esta metodología ha hecho posible la marcación selectiva de virtualmente cualquier proteína con un huésped de reactivos en los que se incluyen fluoroforos, agentes de reticulación y moléculas citotóxicas. ün método alternativamente eficientemente para la modificación selectiva de proteínas es descrito, que involucra la incorporación genética de aminoácidos no naturales que contienen azida o acetileno a proteínas en respuesta a por ejemplo, el codón sin sentido ámbar, TAG. Luego estas cadenas laterales de aminoácido pueden ser modificadas mediante una reacción de [3+2] cicloadición de Huisgen (véase, por ejemplo, Padwa, A. en Comprehensive Organic Synthesis, Vol . 4. (1991) Ed. Trost, B. M. , Pergamon, Oxford, p. 1069-1109; y Hisgen, R en 1.3-Dipolar Cycloaddition Chemistry, (1984) Ed. Padwa, A., Wiley, New York, p. 1-176) con derivados de alquinilo (acetileno) o azida, respectivamente. Debido a que este método involucra una cicloadición en lugar de una sustitución nucleofílica, las proteínas pueden ser modificadas con selectividad extremadamente alta (otro método que puede ser usado es el intercambio de ligandos sobre un compuesto bisarsénico con una porción de tetracisteina, véase, por ejemplo, Griffin, et al., (1998) Science 281:269-272). Esta reacción se puede llevar a cabo a temperatura ambiente en condiciones acuosas con excelente regioselectividad (1,4>1,5) mediante la adición de cantidades catalíticas de sales de Cu(l) a la mezcla de reacción. Véase, por ejemplo, Tornoe, et al., (2002) Org. Chem. 67:3057-3064; y, Rostovitsev, et al., (2002) Angew. Chem. Int. Ed. 41:2596-2599. Por supuesto, Finn y colaboradores han demostrado que esta [3+2] cicloadición de azida-alquino se puede llevar a cabo sobre la superficie de un virus cowpea de mosaico intacto. Véase, por ejemplo, angr et al., (2003), J. Am. Chem. Soc, 125:3192-3193. Para otro ejemplo reciente de la introducción electrofílica de un grupo azido a una proteína y una [3+2] cicloadición subsecuente, véase, por ejemplo, Speers, et al., (2003) J. Am. Chem. Soc . , 125:4686-4687. Con el fin de introducir selectivamente ya sea el grupo funcional alquinilo (acetileno) o azida a proteínas eucariónticas en sitios únicos, pares de TyrRS/tRNACoA ortogonales evolucionados fueron generados en levadura que codifican genéticamente el acetileno y aminoácidos de azido, Figura 11, 1 y 2, respectivamente. Las proteínas resultantes pueden ser marcadas eficiente y selectivamente con fluoróforos en una reacción de cicloadición subsecuente bajo condiciones fisiológicas. Previamente, un par de tirosil tARN-tARN sintetasa de E. coli fue demostrada siendo ortogonal en levadura, esto es, ni el tARN ni la sintetasa reaccionan de manera cruzada con el tARN de levadura endógena o sintetasas. Véase, por ejemplo, Chin, et al., (2003) Chem. Biol . , 10:511-519. Este par de tARN sintetasa ortogonal ha sido usado para incorporar selectiva y eficientemente un número de aminoácidos no naturales en levadura en respuesta al codón TAG (por ejemplo, Chin, et al., (2003) Science , in press) . Con el fin de alterar la especificidad de aminoácido de la tirosil-tARN sintetasa de ? . coli para aceptar, el aminoácido 1 ó 2 de la Figura 11, una biblioteca de ~107 imitantes fue generada al aleatorizar o desordenar los codones para Tyr37, Asn126, Asp182, Phe183 y Leu186. Estos cinco residuos fueron escogidos en base a una estructura cristalina de la sintetasa homologa de B. stearothermophilus . Para obtener una sintetasa para la cual el aminoácido particular sirve como sustrato, se utilizó un esquema de selección en el cual los codones para Thr44 y Arg110 del gen para el activador transcripcional GAL4 fueron convertidos a codones sin sentido ámbar (TAG) . Véase, por ejemplo, Chin, et al., (2003) Chem. Biol., 10:511-519. La supresión de estos codones ámbar en la cepa de levadura MaV203 : PGADGAL (2TAG) conduce a la producción de GAL4 de plena longitud (véase, por ejemplo, Keegan, et al., (1986) Science, 231:699-704; y, Ptashne, (1988) Nature, 335:683-689) que a su vez impulsa la expresión de los genes reporteros HIS3 y URA3. Los últimos productos de gen complementan la auxotropxa de histidina y uracilo permitiendo que los clones cosechen mutantes de sintetasa activos a ser seleccionados en presencia de 1 ó 2 de la Figura 11. Las sintetasas que cargan aminoácidos endógenos son eliminadas mediante cultivo sobre medio que carece de 1 ó 2 de la Figura 11 pero que contiene ácido 5-fluroorótico, el cual es convertido a un producto tóxico mediante URA3. Al hacer pasar la biblioteca a través de 3 rondas de selección (positiva-negativa-positiva) se identificaron sintetasas selectivas para 1 de la Figura 11 (pPR-EcRSl-5) y para 2 de la Figura 11 (pAZ-EcRSl-6) como se muestra en la Tabla 8. Todas las sintetasas muestran una fuerte similaridad de secuencias, que incluyen un Asn126, conservado, sugiriendo un papel funcional importante para este residuo. Sorprendentemente, las sintetasas Ppr-EcRS-2 y pAZ-EcRS-6, evolucionaron para enlazarse a 1 y 2 de la Figura 11, respectivamente, convergieron a la misma secuencia (Tyr37 - Thr37, Asn126 -? Asn126, Asp182 ? Ser182, y Phe183 ? Ala183, Leu135 —> Leu186) . Ambos enlaces de hidrógeno entre el grupo hidroxi fenólico de tirosina enlazada y Tyr37 y Asp182 son alterados mediante mutaciones a Thr y Ser, respectivamente.
Phe183 es convertido a Ala, proporcionando posiblemente más espacio para el acomodo del aminoácido no natural. Para confirmar la capacidad de esta sintetasa (y las otras sintetasas) para aceptar ya sea un aminoácido u otro como un sustrato cepas de selección que comprenden los plásmidos de sintetasa fueron cultivados sobre medios que carecen de uracilo (los mismos resultados fueron obtenidos para medios que carecen de histid na) ambos complementados ya sea con 1 ó 2 de la Figura 11. Los resultados de cultivo revelaron que cuatro de las cinco alquino sintetasas fueron aptas de cargar ambos aminoácidos no naturales sobre su tARN. Las azido sintetasas parecen ser más selectivas, puesto que solamente pAZ-EcRS-6 (el cual es idéntico con pPR-EcRS-2) fue apto de aminoacilar su tARN tanto con 1 y 2 de la Figura 11. El hecho de que ningún crecimiento fue detectado en ausencia de 1 ó 2 en la Figura 11 sugiere que las sintetasas no aceptan ninguno de los 20 aminoácidos comunes como sustrato. Véase Figura 14. Para todos los experimentos adicionales se utilizó pPR-EcRS-2 (pAZ-EcRS-6) permitiendo controlar cual aminoácido no natural es incorporado simplemente al agregar ya sea 1 ó 2 de la Figura 11 a medios que contienen la cepa de expresión. Para la producción de proteínas el codón para el residuo permisivo Trp33 de superóxido dismutasa-2 humano (SOD) fusionado a una etiqueta 6xHis C-terminal fue mutada a TAG. Por ejemplo, el HIS de superóxido de dismutasa humana (Trp33 TAG) HIS fue clonado entre el promotor GALl y el terminador CYC1 de pYES2.1 (Invitrogen, Carlsbad, CA USA). Los genes de sintetasa y tARN mutantes sobre plásmidos derivados de pECTyrRS—tRNACOA fueron co-transformados con pYES2.1 SOD (Trp33 TAG) HIS a la cepa InvSc (Invitrogen) . Para la expresión de proteínas, las células fueron cultivadas en SD -trp, -ura + raffinóse y la expresión fue inducida a una OD660 de 0.5 mediante la adición de galactosa. La proteína fue expresada en presencia o ausencia de 1 ó 2 1 milimolar de la Figura 11 y purificada mediante cromatografía de Ni-NTA (Qiagen, Valencia, CA, USA) . El análisis mediante SDS-PAGE y pruebas inmunológicas revelaron la expresión de la proteína dependiente del aminación no natural con una fidelidad de >99% tal como se juzga mediante comparaciones de densitometría a la expresión de proteína en ausencia de 1 ó 2 de la Figura 11. Véase Figura 12. Para confirmar adicionalmente la identidad del aminoácido incorporado, un digesto tríptico fue sometido a cromatografía líquida y espectrometría de masas en tándem. Por ejemplo, el hSOD de tipo libre y mutante fueron purificados utilizando columna de afinidad de níquel y las bandas de proteína fueron visualizadas mediante teñido de Coomassie coloidal. Las bandas de gel correspondientes al SOD de tipo libre y mutante fueron extirpadas de geles de poliacrilamida, cortadas en cubos de 1.5 mm, reducidas y alquiladas, luego sometidas a hidrólisis de tripsina esencialmente como se describe. Véase, por ejemplo, Shevchenko, A et al., (1996) Anal. Chem. 68:850-858. Los péptidos trípticos que contienen el aminoácido no natural fueron analizados mediante de fase inversa de nanoflujo con un espectro de masas de trampa de iones LCQ. Véase, Figura 15, Panel A y B. El análisis de espectrometría de masas en tándem cromatografía líquida (LC-MS/MS) se llevó a cabo sobre un espectrómetro de masas de trampa de iones Finnigan LCQ Deca (Thermo Finnigan) equipado con una HPLC Nanospray (Agilent 1100 series) . Los iones precursores correspondientes a los iones precursores cargados individual y doblemente del péptido VALLE*GSIK (SEQ ID NO: 87) que contienen el aminoácido no natural (denotados como y*) fueron separados y fermentados con un espectrómetro de masas de trampa de iones . Las masas iónicas del fragmento podrían ser asignadas de manera no ambigua, confirmando la incorporación específica del sitio en cada aminoácido no natural. La MS/MS de LC no indicó la incorporación de ningún aminoácido natural en esta posición. La proporción de señal a ruido del péptido para todos los mutantes fueron >1000 sugiriendo fidelidad de incorporación mejor del 99.8%. Véase, Figura 15, Paneles A y B. Para demostrar que moléculas orgánicas pequeñas pueden ser conjugadas a proteínas mediante una reacción de [3+2] cicloadición de azida-alquilo, los tintes 3-6 indicados en la figura 13, panel ?, que contiene ya sea un grupo acetilénico o azido y que llevan un fluoróforo de acil o fluoresceina, fueron sintetizados (Véase Ejemplo en la presente) . La cicloadición por si misma se llevó a cabo con proteína 0.01 milimolar en solución reguladora del pH de fosfato (PB) , pH 8, en presencia de 3-6 2 milimolar indicado en la Figura 13, panel A, CUSO4 1 milimolar y ~1 miligramo de alambre de cobre durante 4 horas a 37°C (véase Figura 13, Panel B) . Por ejemplo, a 45 de proteina en solución reguladora del pH PB (pH = 8) se agrega 1 de CUSO (50 mM en H20) , 2 de tinte (50 mM en EtOH) , 2 de tris(l-bencil-lH-[l,2,3]triazol-4-ilmetil)amina (50 mM en DMSO) y alambre de cobre. Después de 4 horas a temperatura ambiente o 37°C o toda la noche a 4°C, se agregan 450 de ¾0 y la mezcla fue agitada a través de una membrana de diálisis (corte de 10 kDa) . Después del lavado del sobrenadante con 2x500 de centrifugación la solución fue traída a un volumen de 50 mL. Una muestra de 20 mL fue analizada mediante SDS-PAGE. Ocasionalmente el tinte restante podría ser eliminado del gel mediante enjuague en H20/MeOH/AcOH (5:5:1) en toda la noche. El uso de tris (carboxietil) fosfina como el agente reductor conduce en general a una marcación menos eficiente. En contraste con las primeras observaciones (por ejemplo, Wang, Q. et al., (2003) J. Am. Chem. Soc. 125:3192-3193) , la presencia o ausencia del ligando de tris (triazolil) amina no tuvo una influencia sustancial en el resultado de la reacción. Después de la diálisis las proteínas marcadas fueron luego analizadas mediante SDS-PAGE y formadas en imagen en gel utilizando un densitómetro en caso de los tintes dansil 3-4 indicados en la Figura 13, Panel A (?T? = 337 nm, Xem = 506 nm) o un fósforo formador de imagen en el caso de los tintes de fluoresceina 5-6 indicados en la Figura 13, Panel ? (?ß? = 483 nm, ?ep? = 516 nm) . Véase por ejemplo, Blake, (2001) Curr. Opin. Pharmacol., 1:533-539; Wouters, et al., (2001), Trends in Cell Biology 11:203-211; y, Zacharias, et al., (2000) Curr. Opin. Neurobiol . , 10:416-421. Las proteínas marcadas fueron caracterizadas mediante análisis de LC MS/MS de digestos trípticos mostrando anexión específica del sitio de los fluoróforos y la conversión fue de 75% en promedio (por ejemplo, tal como se determina por comparación de los valores A280/A495 para SOD marcado con 5 ó 6 indicado en la Figura 13, Panel A) . La selectividad de esta bioconjugación es verificada por el hecho de que no hubo ninguna reacción observable entre 3 indicado en la Figura 13, Panel A y una alquino proteína o 4 indicado en la Figura 13, Panel ? y azido proteina.
TABLA 8 SINTETASAS EVOLUCIONADAS pPR-EcRS seleccionado para 1 y pAZ-EcRS seleccionado para 2 (como se indica en la Figura 11) sintetasa 37 126 182 183 186 tipo libre Tyr Asn Asp Phe Leu pPR-EcRS-1 Gly Asn Ser Met Leu pPR-EcRS-2 Thr Asn Ser Ala Leu pPR-EcRS-3 Ser Asn Thr Met Val pPR-EcRS-4 Ala Asn Ser Tyr Leu pPR-EcRS-5 Ala Asn Thr Met Cys pAZ-EcRS-1 Leu Asn Ser Met Ala pAZ-EcRS-2 Val Asn Ser Ala Ala pAZ-EcRS-3 Leu Asn Ser Ala Ala pAZ-EcRS-4 Val Asn Ser Ala Val pAZ-EcRS-5 lie Asp Asn Phe Val pAZ-EcRS-6 Thr Asn Ser Ala Leu EJEMPLO 4: SÍNTESIS DE ÜN ALQÜINO AMINOÁCIDO En un aspecto de la invención, la invención proporciona alquinil aminoácido. ün ejemplo de una estructura del alquinil aminoácido es ilustrado por la Fórmula IV: IV Un alquino aminoácido es comúnmente cualquier estructura que tiene Fórmula IV, en donde Ri es un sustituyente usado en uno de los 20 aminoácidos naturales y R2 es un sustituyente alquinilo. Por ejemplo, 1 en la Figura 11 ilustra la estructura de para-propargiloxifenilalanina . La p-propargiloxifenilalanina puede ser sintetizada, por ejemplo como se resumen a continuación. En esta modalidad, la síntesis de p-propargiloxifenilalanina se puede completar en tres etapas comenzando a partir de la N-Boc-tirosina disponible comercialmente . Por ejemplo, N-ter-butoxicarbonil-tirosina (2 g, 7 mmol, 1 equiv.) y K2CO3 (3 g, 21 mmol, 3 equiv.) fueron suspendidos en DMF anhidra (15 mL) . Se agregó lentamente bromuro de Propargilo (2.1 mL, 21 milimoles, 3 equivalentes, solución al 80% en tolueno) y la mezcla de reacción fue agitada durante 18 horas a temperatura ambiente. Se agregaron agua (75 mL) y Et2Ü (50 mL) , las capas fueron separadas y la fase acuosa fue extraída con Et2Ü (2x50 mL) . Las capas orgánicas combinadas fueron secadas (MgSC ) y el solvente fue separado bajo presión reducida. El producto fue obtenido como un aceite amarillo (2.3 g, 91%) y utilizado en la siguiente etapa sin purificación adicional. El producto Boc-protegido es ilustrado a continuación como la estructura química 8 : 8 propargil éster de ácido 2-ter-butoxicarbonilamino-3- [ 4-(prop-2-iniloxi) fenil] -propiónico Cloruro de acetilo (7 mL) fue agregado cuidadosamente a metanol (60 mL) a 0°C para dar una solución 5 M de HC1 anhidro en MeOH. El producto de la etapa previa (2 g, 5.6 mol) fue agregado y la reacción fue agitada durante 4 horas en tanto que se permite que se caliente a temperatura ambiente. Después de separar los volátiles bajo presión reducida, se obtiene un sólido amarillento (1.6 g, 98%) (véase estructura química 9) el cual fue usado directamente en la siguiente etapa. opargil éster del ácido 2-amino-3- [4- (prop-2 iniloxi) fenil] -propiónico El propargil éster (1.6 g, 5.5 mmol) de la etapa previa fue disuelto en una mezcla de NaOH 2 N acuoso (14 mL) y MeOH (10 mL) . Después de agitación durante 1.5 horas a temperatura ambiente, el pH fue ajustado a 7 al agregar HC1 concentrado. Se agrega agua (20 mL) y la mezcla fue mantenida a 4°C durante toda la noche. El precipitado fue filtrado, lavado con agua helada y secado bajo vacio produciendo 1.2 g (90%) de 1 en la Figura 11 (ácido 2-amino~3-fenilpropiónico (1) (también conocido como p-propargiloxifenilalanina) como un sólido blanco. ¾ NMR (400 MHz, D20) (como la sal de potasio en D20) d 7.20 (d, J = 8.8 Hz, 2 H) , 6.99 (d, J = 8.8 Hz, 2H) , 4.75 (s, 2H) , 3.50 (dd, J = 5.6, 7.2 Hz, 1H) , 2.95 (dd, J = 5.6, 13.6 Hz, 1H) , 2.82 (dd, J = 7.2, 13.6 Hz, 1H) ; 13C NMR (100 MHz, D20) 5 181.3, 164.9, 155.6, 131.4, 130.7, 115.3, 57.3, 56.1, 39.3; HRMS (CI) m/z 220.0969 [Ci2H13N03 (M+l) requiere 220.0968].
EJEMPLO 5: ADICIÓN DE MOLÉCULAS A PROTEÍNAS CON ÜN AMINOÁCIDO NO NATURAL POR MEDIO DE UNA [3+2] CICLOADICIÓN En un aspecto, la invención proporciona métodos y composiciones relacionadas de proteínas que comprenden aminoácidos no naturales acoplados a moléculas sustituyentes adicionales. Por ejemplo, sustituyente adicionales pueden ser agregados a un aminoácido no natural por medio de una [3+2] cicloadición . Véase por ejemplo Figura 16. Por ejemplo, la [3+2] cicloadición de una molécula deseada (por ejemplo, que incluye a un segundo grupo reactivo, tal como un triple enlace de alguino o grupo azido) a una proteina con un aminoácido no natural (por ejemplo, que tiene un primer grupo reactivo, tal como un grupo azido o triple enlace) se puede hacer siguiendo condiciones publicadas para la reacción de [3+2] cicloadición. Por ejemplo, una proteina que comprende al aminoácido no natural en solución reguladora del pH de PB (pH = 8) es agregado a CuS04, la molécula deseada y alambre de Cu. Después que la mezcla es incubada (por ejemplo, aproximadamente 4 horas a temperatura ambiente o 37 °C ó durante toda la noche a A°C) , se agrega agua y la mezcla es filtrada a través de una membrana de diálisis. La muestra puede ser analizada para la adición, por ejemplo mediante análisis de gel. Ejemplos de tales moléculas incluyen, pero no están limitadas a, por ejemplo una molécula que tiene un triple enlace o un grupo azido, tales como moléculas que tienen la estructura de fórmulas 3, 4, 5, y 6 de la Figura 13, Panel A y los semejantes. Además, triples enlaces o grupos azido pueden ser incorporados a las estructuras de otras moléculas de interés, tales como polímeros (por ejemplo, poli (etilenglicol) y derivados), agentes de reticulación, tintes adicionales, fotoreticuladores , compuestos citotóxicos, etiquetas de afinidad, biotina, sacáridos, resinas, perlas, una segunda proteína o polipéptido, queladores de metal, co-factores, ácidos grasos, carbohidratos, polinucleótidos (por ejemplo, ADN, ARN, etc.) y los semejantes, los cuales pueden luego ser usados en [3+2] cicloadiciones . En un aspecto de la invención, moléculas que tienen la Fórmula 3, 4, 5, o 6 d la Figura 13, Panel A pueden ser sintetizados como se describe a continuación. Por ejemplo, un tinte alquino como se muestra en 3 de la Figura 13, Panel A y en la estructura química 3 a continuación fue sintetizado al agregar propargilamina (250 µ?,, 3.71 mmol, 3 equiv.) a una solución de cloruro de dansilo (500 mg, 1.85 mmol, 1 equiv.) y trietilamina (258 µ?_, 1.85 mmol, 1 equiv.) en CH2CI2 (10 mL) a 0°C. Después de la agitación durante 1 hora, la mezcla de reacción fue calentada a temperatura ambiente y agitada por una hora adicional, los volátiles fueron separados en vacío y el producto crudo fue purificado mediante cromatografía sobre gel de sílice (Et20/hexanos = 1:1) produciendo 3 de la Figura 13, Panel A (418 mg, 78%) como un sólido amarillo. Los datos analíticos son idénticos con aquellos reportados en la literatura. Véase, por ejemplo, Bolletta, F y colaboradores, (1996) Organometallics 15:2415-17. Un ejemplo de una estructura de un tinte alquino que puede ser usado en la invención es mostrado en la estructura química 3: 3 Un tinte azido como se muestra en 4 de la Figura 13, Panel A y en la estructura química 4 a continuación fue sintetizado al agregar 3-azidopropilamina (por ejemplo, como se describe por Carboni, B y colaboradores, (1993) J. Org. Chem. 58:3736-3741) (371 mg, 3.71 mmol, 3 equiv.) a una solución de cloruro de dansilo (500 mg, 1. 85 mmol, 1 equiv.) y trietilamina (258 µ?, 1. 85 mmol, 1 equiv.) en CH2CI2 (10 mL) a 0°C. Después de agitación durante 1 hora, la mezcla de reacción fue calentada a temperatura ambiente y agitada por una hora adicional . Los volátiles fueron separados en vacio y el producto fue purificado mediante cromatografía sobre gel de sílice (Et20/hexanos = 1:1) produciendo 4 de la Figura 13, Panel A (548 mg, 89%) como un aceite amarillo. RMN ½ (400 MHz, CDCI3) d 8.55 (d, J = 8.4 Hz, 1H) , 8.29 (d, J = 8.8 Hz, 1H) , 8.23 (dd, J = 1.2, 7.2 Hz, 1H) , 7.56-7.49 (comp, 2H) , 7.18 (d, J = 7.6 Hz, 1H) , 5.24 (s amplio, 1H) , 3.21 (t, J = 6.4 Hz, 2 H) , 2.95 (dt, J = 6.4 Hz, 2H) , 2.89 (s, 6H) , 1.62 (quin, J = 6.4 Hz, 2H) ; RMN 13C (100 MHz, CDCI3) d 134.3, 130.4, 129.7, 129.4, 128.4, 123.3, 118.8, 115.3, 48.6, 45.4, 40.6, 28.7 (no todas las señales de los átomos de carbono cuaternarios son visibles en el espectro de RMN 13C) ; HR S (CI) m/z 334.1336 [C15H2ON502S (M+l) requeridos 334.1332] . Un ejemplo de una estructura de un tinte azido es mostrado en la estructura química : Un tinte de alquino como se muestra en 5 de la Figura 13, Panel A y en la estructura química 5 a continuación fue sintetizado al agregar EDCI (clorhidrato de l-etil-3- (3-dimetilaminopropil) carbodiimida) (83 mg, 0.43 mmol, 1 equiv. ) a una solución de fluoresceinamina (150 mg, 0.43 mmol, 1 equiv.) y ácido 10-undecinoico (79 mg, 0.43, 1 equiv.) en piridina (2 mL) a temperatura ambiente. La suspensión fue agitada durante toda la noche y la mezcla de reacción fue vertida en H20 (15 mL) . La solución fue acidificada (pH < 2) al agregar HC1 concentrado. Después de agitación durante 1 hora, el precipitado fue filtrado, lavado con ¾0 (5 mL) y disuelto en una pequeña cantidad de EtOAc. La adición de hexanos condujo a la precipitación de 5 de la Figura 13, Panel A como cristales anaranjados, los cuales fueron recolectados y secados bajo vacio (138 mg, 63%) . Los datos analíticos son idénticos con aquellos reportados en la literatura. Véase, por ejemplo, Crisp, G. T.; & Gore, J. (1997) Tetrahedron 53:1505-1522. Un ejemplo de una estructura de un tinte alquino es mostrado en la estructura química 5: Un tinte azido ' como se muestra en 6 de la Figura 13, Panel A y en la estructura química 6 a continuación fue sintetizado al agregar EDCI (83 mg, 0.43 mmol, 1 equiv.) a una solución de fluoresceinamina (150 mg, 0.43 mmol, 1 equiv.) y ácido 4- (3-azidopropilcarbamoil) -butírico (por ejemplo, sintetizado al hacer reaccionar 3-azidopropilamina con anhídrido de ácido glutárico) (92 mg, 0.43, 1 equiv.) en piridina (2 mL) a temperatura ambiente. La suspensión fue agitada durante toda la noche y la mezcla de reacción fue vertida en ¾0 (15 mL) . La solución fue acidificada (pH < 2) al agregar HC1 concentrado. Después de agitación durante 1 hora, el precipitado fue filtrado, lavado con HC1 1 N (3x3 mL) y fue disuelto en una pequeña cantidad de EtOAc. La adición de hexanos condujo a la precipitación de 6 de la Figura 13, Panel A como cristales anaranjados, los cuales fueron recolectados y secados bajo vacio (200 mg, 86%) . RMN ½ (400 MHz, CD3OD) d 8.65 (s, 1H) , 8. 15 (d, J = 8.4 Hz, 1H) , 7.61-7.51 (comp, 2H) , 7.40 (d, J = 8.4 Hz, 1H) , 7.35 (s amplio, 2H) , 7.22-7.14 (comp, 2H) , 6.85-6.56 (comp, 3H) , 3.40-3.24 (comp, 4H) , 2.54 (t, J = 7.2 Hz, 2H) , 2.39-2.30 (comp, 2H), 2.10-1.99 (comp, 2H) , 1.82-1.72 (comp, 2 H) ; RMN 13C (100 MHz, CD3OD) d 175.7, 174.4,' 172.4, 167.9, 160.8, 143.0, 134.3, 132.9, 131.8, 129.6, 124.4, 123.3, 121.1, 118.5, 103.5, 50.2, 38.0, 37.2, 36.2, 29.8, 22.9 (no todas las señales de los átomos de carbono cuaternarios están visibles en el espectro de RMN 13C) ; HRMS (CI) m/z 544.1835 [C28H28N5O7 (M+l) requeridos 544.1827]. Un ejemplo de una estructura de un tinte azido es mostrado en la estructura química 6 : 6 En una modalidad, una molécula de PEG puede también ser agregada a una molécula con un aminoácido no natural, por ejemplo un aminoácido de azido o un aminoácido de propargilo. Por ejemplo, un PEG de propargil amida (por ejemplo, ilustrado en la Figura 17, Panel A) puede ser agregado a una proteina con un aminoácido azido por medio de una [3+2] cicloadición . Véase, por ejemplo, Figura 17, Panel A. La Figura 17, Panel B ilustra un análisis de gel de una proteina con un sustxtuyente PEG agregado. En un aspecto de la invención, un PEG de propargil amida (por ejemplo, ilustrado en la Figura 17, Panel A) puede ser sintetizado como se describe a continuación. Por ejemplo, una solución de propargilamina (30 µ? en C¾Cl2 (1 mL) fue agregada al éster de PEG-hidroxisuccinimida de 20 kDa (120 mg, comprado de Nektar) . La reacción fue agitada durante 4 horas a temperatura ambiente. Luego se agrega Et20 (10 mL) , el precipitado fue filtrado y fue recristalizado dos veces de MeOH (1 mL) mediante adición de Et20 (10 mL) . EL producto fue secado bajo vacio proporcionando un sólido blanco (105 mg, rendimiento del 88%) . Véase, por ejemplo, Figura 17, Panel C.
EJEMPLO 6: O-RS Y o-Trna EJEMPLARES Un O-tARN ejemplar comprende la SEQ ID NO. : 65 (Véase, Tabla 5) . O-RS ejemplares incluyen las secuencias SEQ ID NOs.: 36-63, 86 {Véase, Tabla 5). Ejemplos de polinucleótidos que codifican O-RS o porciones de las mismas (por ejemplo, el sitio activo) incluyen las secuencias SEQ ID NOs.: 3-35. Además, los cambios de aminoácido ejemplares de O-RS son indicados en la Tabla 6.
Tabla 6: Variantes de EcTyrRS Evolucionados Residuo # 37 126 182 183 186 Representación Ec TyrRS Tyr Asn Asp Phe Leu p-yodoPheRS-1 Val Asn Ser Tyr Leu 1/8 p-yodoPheRS-2 lie Asn Ser Met Leu 1/8 p-yodoPheRS-3 Val Asn Ser Met Ala 6/8 OMeTyrRS-1 Val Asn Ser Met Leu 5/13 OMeTyrRS-2 Thr Asn Thr Met Leu 1/13 OMeTyrRS-3 Thr Asn Thr Tyr Leu 1/13 OMeTyrRS-4 Leu Asn Ser Met Ser 1/13 OMeTyrRS-5 Leu Asn Ser Met Ala 1/13 OMeTyrRS-6 Thr Asn Arg Met Leu 4/13 p-acetilPheRS-1 lie Asn Gly Met Ala 4/4 p-acetilPheRS-G Ile Asn Gly Met Ala 10/10 p-benzoilPheRS- 1/2 1 Gly Asn Gly Phe Ala p-benzoilPheRS- 1/2 2 Gly Asn Gly Tyr Met p-azidoPheRS-1 Leu Asn Ser Met Ala 1/6 p-azidoPheRS-2 Val Asn Ser Ala Ala 1/6 p-azidoP eRS-3 Leu Asn Ser Ala Ala 1/6 p-azidoPheRS-4 Val Asn Ser Ala Val 1/6 p-azidoPheRS-5 lie Asp Asn Phe Val 1/6 p-azidoPheRS-6 Thr Asn Ser Ala Leu 1/6 p-PR-EcRS-1 Gly Asn Ser Met Leu 1/10 p-PR-EcRS-2 Thr Asn Ser Ala Leu 1/10 p-PR-EcRS-3 Ser Asn Thr Met Val 1/10 p-PR-EcRS~4 Ala Asn Ser Tyr Leu 1/10 p-PR-EcRS-5 Ala Asn Thr Met Cys 1/10 p-PR-EcRS-6 Thr Asn Thr Phe Met 1/10 p-PR-EcRS-7 Thr Asn Ser Val Leu 1/10 p-PR-EcRS-8 Val Asn Ser Met Thr 1/10 p-PR-EcRS-9 Ser Asn Ser Phe Leu 1/10 p-PR-EcRS-10 Thr Asn Thr Phe Thr 1/10 aEstos clones también contienen una mutación Aspl65Gly Se comprenderá que los ejemplos y modalidades descritos en la presente son por propósitos ilustrativos solamente y que varias modificaciones y cambios a luz de los mismos se sugerirá para las personas experimentadas en la técnica y estarán incluidos dentro del espíritu y alcance de esta solicitud y al alcance de las reivindicaciones adjuntas. En que en tanto la invención anterior ha sido descrita en algún detalle por propósitos de ¦ claridad y entendimiento será claro para el experimentado de la técnica a partir de una lectura de esta revelación que varios cambios en forma y detalle se pueden efectuar sin desviarse del verdadero alcance de la invención. Por ejemplo, todas las técnicas y aparatos descritos en la presente pueden ser usados en varias combinaciones. Todas las publicaciones, patentes, solicitudes de patente y/u otros documentos citados en esta solicitud son incorporados por referencia en su totalidad para todos los propósitos a la misma extensión como si cada publicación, patente, solicitud de patente y/u otro documento individual fueran indicados individualmente para ser incorporados por referencia para todos los propósitos.

Claims (30)

  1. REIVINDICACIONES 1. Una célula eucarióntica caracterizada porque comprende una aminoacil-tARN sintetasa ortogonal (O-RS), caracterizada porque la O-RS aminoacila preferencialmente un tARN ortogonal (O-tARN) con por lo menos un aminoácido no natural en la célula eucarióntica, en donde la O-RS aminoacila el O-tARN con por lo menos un aminoácido no natural por lo menos 50% tan eficientemente como una 0--RS que tiene una secuencias de aminoácidos como se resume en la SEQ
  2. ID NO: 86. 2. La célula de conformidad con la reivindicación 1, caracterizada porque la O-RS o una porción de la misma, es codificada por una secuencia de polinucleótidos como se resume en cualquiera de las SEQ ID NO. : 3-19 o una secuencia de polinucleótidos complementaria de la misma; o en donde la O-RS comprende un secuencia de aminoácidos como se resume en cualquiera de las 36-47 o 86 o una variación conservadora de la misma.
  3. 3. La célula de conformidad con la reivindicación 1, caracterizada porque Iz O-RS comprende una secuencia de aminoácidos que es por lo menos 90% idéntica a aquella de una tirosil aminoacil-tARN sintetasa (TyrRS) que se presenta de manera estable en la naturaleza y comprende dos o más aminoácidos seleccionados del grupo que consiste de: A) valina, isoleucina, leucina o treonina en una posición correspondiente a Tyr37 de TyrRS de E. col!; B) treonina, serinaa, arginina o glicina en una posición correspondiente a Aspl82 de TyrRS de E. coli; D) metionina o tirosina en una posición correspondiente a Phel83 de TyrRS de E. coli; y, E) serina o alanina en una posición correspondiente a Leul86 de TyrRS de E. coli.
  4. 4. La célula de conformidad con la reivindicación 1, caracterizada porque la O-RS es derivada de un organismo seleccionado del gruo que consiste de: un organismo no eucarióntico, Escherichia coli y Bacillus stearothermophilus .
  5. 5. La célula de conformidad con la reivindicación 1, caracterizada porque la célula eucarióntica es una célula de levadura, una célula de Saccharomyces cerevisiae, una células de mamífero, una célula de planta, una célula de alga, una célula fungal o una célula de insecto.
  6. 6. La célula de conformidad con la reivindicación 1, caracterizada porque la O-RS tiene una o más propiedades enzimáticas mejoradas o realzadas para el por lo menos un aminoácido no natural en comparación con un aminoácido natural, tales propiedades son seleccionadas del grupo que consiste de: Km superior, Km inferior, kcat superior, koat inferior, kcat kni inferior y kcat/km superior.
  7. 7. La célula de conformidad con la reivindicación 1, caracterizada porque la célula comprende un aminoácido no natural en donde el aminoácido no natural es seleccionado del grupo que consiste de: ununa p-acetil-L-fenilalanina, ununa p-yodo-L-fenilalanina, una O-metil-L-tirosina, ununa p-propargiloxifenilalanina, una L-3- (2-naftil) alanina, una 3-metil-fenilalanina, una 0-4-alil-L-tirosina, una 4-propil-L-tirosina, una tri-O-acetil-GlcNAc -serina, una L-Dopa, una fenilalanina fluorada, una isopropil-L-fenilalanina, ununa p-azido-L-fenilalanina, ununa p-acil-L-fenilalanina, una p-benzoil-L-fenilalanina, una L-fosfoserina, una fosfonoserina, a fosfonotirosina, una p-bromofenilalanina, una p-amino-L-fenilalanina, una isopropil-L-fenilalanina, un análogo no natural de un aminoácido de tirosina; un análogo no natural de un aminoácido de glutamina; un análogo no natural de un aminoácido de fenilalanina; un análogo no natural de un aminoácido de serina; un análogo no natural de un aminoácido de treonina; un aminoácido alquilo, aril, acilo, azido, ciano, halo, hidrazina, hidrazida, hidroxilo, alquenilo, alquinilo, éter, tiol, sulfonilo, seleno, éster, tioácido, borato, boronato, fosfo, fosfono, fosfina, heterociclico, enona, imina, aldehido, hidroxilamina, ceto o amino sustituido o cualquier combinación de los mismos; un aminoácido con un agente de reticulación fotoactivable; un aminoácido marcado por epin; un aminoácido fluorescente; un aminoácido de enlace de metal; un aminoácido que contiene metal; un aminoácido radiactivo; un aminoácido fotoenjaulado y/o fotoisomerizable; un aminoácido que contiene biotina o análogo de biotina; un aminoácido que contiene ceto; un aminoácido que comprende polietilenglicol o poliéter; un aminoácido sustituido por átomo pesado; un aminoácido químicamente escindible o fotoescindible; un aminoácido con una cadena lateral alargada; un aminoácido que contiene un grupo tóxico; un aminoácido sustituido por azúcar; un aminoácido que contiene azúcar enlazado a carbono; un aminoácido redox-activo; un ácido que contiene a-hidroxi; un amino tioácido; un aminoácido a, a-disustituido; un aminoácido ß; un aminoácido cíclico diferente a prolina o histidina y un aminoácido aromático diferente a fenilalaniña, tirosina. o triptópfano .
  8. 8. La célula de conformidad con la reivindicación 1, caracterizada porque comprende además un tARN ortogonal (O-tARN) , en donde el O-tARN reconoce un codón selector y es preferiblemente aminoacilado con el por lo menos un aminoácido no natural mediante la O-RS .
  9. 9. La célula de conformidad con la reivindicación 8, caracterizada porque el O-tARN es derivado de un organismo seleccionado del grupo que consiste de: un organismo no eucarióntico, un Escherlchia col! y un Bacillus stearothenizophilus .
  10. 10. La célula de conformidad con la reivindicación 8, caracterizada porque el O-tARN modera la incorporación del por lo menos un aminoácido no natural a una proteina con por lo menos 50% de la eficiencia de un aminoácido de tARN producido mediante procesamiento celular de un ácido nucleico que comprende una de polinucleótidos como se resume en SEQ ID NO.: 65.
  11. 11. La célula de conformidad con la reivindicación 8, caracterizada porque el O-tARN es producido en una célula mediante procesamiento celular de un ácido nucleico correspondiente a SEQ ID NO. : 65 y la O-RS comprenden una secuencia de polipéptidos seleccionado del grupo que consiste de: SEQ ID NO.: 36-47, 86 y una variación conservadora de la misma .
  12. 12. La célula de conformidad con la reivindicación 8, caracterizada porque comprende además un ácido nucleico que comprende un polinucleótido que codifica un polipéptido de interés, en donde el polinucleótido comprende un codón selector que es reconocido por el O-tARN.
  13. 13. La célula de conformidad con la reivindicación 12, caracterizada porque el rendimiento del polipéptido de interés que comprende el por lo menos un aminoácido no natural es por lo menos el 5% de aquel obtenido para el polipéptido de interés que se presenta de manera estable en la naturaleza, de una célula en la cual el polinucleótido carece del codón selector o en donde la célula produce el polipéptido de interés en ausencia de por lo menos un aminoácido no natural con un rendimiento que es menor que el 5% del rendimiento del polipéptido en presencia del por lo menos un aminoácido no natural.
  14. 14. La célula de conformidad con la reivindicación 13 , caracterizada porque el polipéptido de interés comprende una proteína o una porción de una proteína seleccionado del grupo que consiste de: una proteína terapéutico, una proteína de diagnóstico, una enzima industrial, una proteína moduladora transcripcional, una proteína activadora transcripcional GAL4, una proteína represora transcripcional, una citocina, un factor de crecimiento, un receptor del factor de crecimiento, una interferona, una interleucina, una molécula inflamatoria, un producto oncógeno, una hormona de péptido, una molécula de transducción de señal, un receptor de hormona y esferoide, una eritropoyetina (EPO) , insulina, hormona de crecimiento humano, una Alfa-1 antitripsina, una Angiostatina, un factor Antihemolílico, un anticuerpo, una Apolipoproteína, un factor Apoproteína, un factor natriurético Atrial, un polipéptido natriurético Atrial, un péptido Atrial, una C-X-C quimiocina, T39765, NAP-2, ENA-78, una Gro-a, una Gro-b, una Gro-c, una IP-10, una GCP-2, una ???-4, una SDF-1, una PF , una MIG, una Calcitonina, un ligando de c-kit, una citocina, una CC quimiocina, una proteína-1 quimiotrayente de Monocito, ¦ una proteína-2 quimiotrayente de Monocito, una proteína-3 quimiotrayente de Monocito, una proteína-l alfa inflamaatoria de Monocito, una proteina-beta inflamatoria de Monocito, RANTES, 1309, R83915, R91733, HCC1, T58847, D31065, T64262, un CD40, un ligando CD40, un ligando de C-kit, un Colágeno, un factor d estimulación de Colonia (CSF) , un factor de Complemento 5a, un inhibidor de Complemento, un receptor de Complemento 1, una citocina, DHFR, un Péptido-78 que activa el Neutrófilo epitelial, un GROoJMGSA, un GRO (3, un GROy a MIP-la, a MIP-18, un MCP-1, un Factor de Crecimiento Epidérmico (EGF) , un Péptido que Activa en Neutrófilo epitelial, una Eritropoiyetina (EPO) , una toxina Exfoliadora, un Factor IX, un Factor VII, un Factor VIII, un Factor X, un Factor de Crecimiento de Fibroblasto (FGF) , un Fibrinogeno, una Fibronectina, un G-CSF, un GM-CSF, una Glucocerebrosidasa, una Gonadotropina, un factor de crecimiento, un receptor de crecimiento, una proteina de Hedgehog, una Hemoglobina, un Factor de Crecimiento de Hepatocito (HGF) , una Hirudina, una albúmina de suero Humano, una ICAM-1, un receptor de ICAM-1, una LFA-1, un receptor de LFA-1, una Insulina, un Factor de Crecimiento semejante a Insulina (IGF) , un IGF-I, un IGF-II, una interferona, un IFN-cc, un IFN-ß, un IFN-?, una interleucina, un IL-1, un IL-2, un IL-3, un IL-4, un IL-5, un IL-6, un IL-7, un' IL-8, un IL-9, un IL-10, un n IL-11, un IL-12, un Factor de Crecimiento de Queratinocito (KGF) , una Lactoferrina, un factor inhibidor de leucemia, una Luciferasa, una Neurturina, un factor inhibidor de Neutrófilo (NIF) , una oncostatina M, una proteina Osteogénica, un producto oncógeno, una hormona Paratiroide, un PD-ECSF, un PDGF, una hormona de péptido, una Hormona de Crecimiento Humano, una Pleiotropina, una Proteina A, una Proteina G, unas exotoxinas Pirogénicas A, B. o C, una Relaxina, una Renina, un SCF, un receptor I de complemento Soluble, una I-CAM 1 Soluble, un receptor de interleucina Soluble, un receptor de TNF Soluble, una Somatomedina, una Somatostatina, una Somatotropina, una Estreptocinasa , un Superantigeno, enterotoxinas Estafilococales, un SEA, un SEB, un SEC1, un SEC2, un SEC3, un SED, un SEE, un receptor de hormona de esferoide, una Superóxido dismutasa (SOD) , una toxina de síndrome de choque Tóxico, una alfa-1 Timosina, un activador de plasminógeno de Tejido, un Factor de Crecimiento de tumor (TGF) , un TGF-a, un TGF-ß, un Factor de Necrosis de Tumor, un Factor alfa de Necrosis de Tumor, un factor beta de necrosis de Tumor, un receptor del factor de necrosis de Tumor (TNFR) , una proteína VLA-4, una proteína VCAM-1, un Factor de Crecimiento Endotelial Vascular (VEGEF) ,una a Uroquinasa, un Mos, un Ras, un Raf, un Met; un p53, un Tat, un Fos, un Myc, un Jun, un Myb, un Reí, un receptor de estrógeno, un receptor de progesterona, un receptor de testosterona, un receptor de aldosterona, un receptor de LDL, un SCF/c-Kit, un CD40L/CD40, un VLA-4 /VCAM-1, un ICAM-l/LFA-1, un hialurina/CD44 y una corticosterona .
  15. 15. Una célula eucarióntica caracterizada porque comprende una aminoacil-tARN sintetasa ortogonal (O-RS) , un tARN ortogonal (O-tARN) , un aminoácido no natural y un ácido nucleico que comprende un polinucleótido que codifica un polipéptido de interés, en donde el polinucleótido comprende un codón selector que es reconocido por el O-tARN, en donde la O-RS aminoacila preferencialmente el tARN ortogonal (0-tARN) con el aminoácido no natural en la célula eucarióntica y en donde la células produce el polipéptido de interés en ausencia del aminoácido no natural con un rendimiento que es menor del 30% del rendimiento del polipéptido en presencia del aminoácido no natural .
  16. 16. Una célula eucarióntica caracterizada porque comprende un tARN ortogonal (O-tARN) , en donde el O-tARN modera la incorporación de un aminoácido no natural a una proteína que es codificada por un polinucleótido que comprende un codón selector que es reconocido por el O-tARN in vivo, en donde el O-tARN modera la incorporación del aminoácido no natural a la proteina por lo menos 50% tan eficientemente como un tARN que es producido mediante el procesamiento celular de un polinucleótido que comprende una secuencia como se resume en la SEQ ID NO.: 65.
  17. 17. La célula de conformidad con la reivindicación 16, caracterizada porque el O-tARN es modificado post-transcripcionalmente .
  18. 18. Una composición caracterizada porque comprende una proteina GAL4 o porción de la misma, en una célula eucarióntica, en donde la proteina GAL4 o porción de la misma, comprende por lo menos un aminoácido no natural.
  19. 19. Una composición caracterizada porque comprende una proteina, en donde la proteina comprende por lo menos un aminoácido no natural que comprende por lo menos una modificación post-traducción, en donde la por lo menos una modificación post-traducción comprende una porción de sacárido .
  20. 20. Una composición caracterizada porque comprende una proteina, en donde la proteina comprende por lo menos un aminoácido no natural y por lo menos una modificación pots-traducción que se efectúa in vivo mediante una célula eucarióntica, en donde la modificación pots-traducción no se hace naturalmente por una célula procarióntica .
  21. 21. La composición de conformidad con la reivindicación 20, caracterizada porque: la modificación pots-traducción comprende la anexión de un oligosacárido a una asparagina mediante un enlace de GlcNAc-asparagina; el oligosacárido comprende (GlcNAc-Man) 2-Man- GlcNAc-GlcNAc; o la modificación pots-traducción comprende la anexión de un oligosacárido a una serina o treonina mediante un enlace de GalNAc-serina, un enlace GalNAc-treonina, un elace de GlcNAc-serina o un enlace GlcNAc-treonina .
  22. 22. La composición de conformidad con la reivindicación 20, caracterizada porque modificación pots-traducción es seleccionada del grupo que consiste de: acetilación, acilación, modificación por lípido, palmitoilación, adición de palmitato, fosforilación y modificación de enlace glicolipido.
  23. 23. La composición de conformidad con la reivindicación 20, caracterizada porque la composición comprende por lo menos 100 microgramos de la proteína o en donde la composición comprende por lo menos 50 µg/litro de la proteína o en donde la proteína comprende una secreción o secuencia de localización, una etiqueta de epítopo, una etiqueta de FLAG, una etiqueta de polihistidina o una fusión GST .
  24. 24. Un polipéptido caracterizado porque es seleccionado del grupo que consiste de: (a) un polipéptido que comprende una secuencia de aminoácidos como se muestra en cualquiera de las secuencias SEQ ID NO. : 36-47 o 86; (b) un polipéptido que comprende una secuencia de aminoácidos codificada por una secuencia de polinucleótidos como se muestra en cualquiera de las secuencias SEQ ID NO.: 3-19; (c) un polipéptido que es específicamente inmunorreactivocon un anticuerpo especifico para un polipéptido de (a) o (b) ; (d) un polipéptido que comprende una secuencia de aminoácidos que es por lo menos 90% idéntica a aquella de un tirosil aminoacil-tARN sintetasa (TyrRS) que se presenta de manera estable en la naturaleza y comprende dos o más aminoácidos seleccionados del grupo que consiste de: valina, isoleucina, leucina o treonina en una posición correspondiente a Tyr37 de TyrRS de E. coli; treonina, serina, arginina o glicina en una posición correspondiente a Aspl82 de TyrRS de E. coli; metionina o tirosina en una posición correspondiente a Phel83 de TyrRS de E. coli; y serina o alanina en una posición correspondiente a Leul86 de tris de E. coli; (e) un polipéptido que comprende por lo menos 20 aminoácidos contiguos de secuencias SEQ ID NO. : 36-47 o 86 y dos o más sustituciones de aminoácido seleccionadas del grupo que consiste de: valina, isoleucina, leucina o treonina en una posición correspondiente a Tyr37 de TyrRS de E. coli; treonina, serina, arginina o glicina en una posición correspondiente a Aspl82 de TyrRS de E. coli; metionina o tirosina en una posición correspondiente a Phel83 de TyrRS de E. coli; y serina o alanina en una posición correspondiente a Leul86 de TyrRS de E. coli, en donde la numeración de los aminoácidos corresponde a aquella de TyrRS de E. coli; y, (f) una secuencia de aminoácidos que comprende una variación conservadora de (a) , (b) , (c) , (d) o (e) .
  25. 25. Un polinucleótido caracterizado porque es seleccionado del grupo que consiste de: (a) un polinucleótido que comprende una secuencia de nucleótidos como se resume en cualquiera de las secuencias SEQ ID NO.: 3-19 o 64-85; (b) un polinucleótido que es complementario a o que codifica una secuencia de polinucleótidos de (a) ; (c) un polinucleótido que codifica un polipéptido que comprende una secuencia de aminoácidos como se resume en cualquiera de las secuencias SEQ ID NO. : 36-47 o 86, o una variación conservadora de las mismas; (d) un polinucleótido que codifica un polipéptido de conformidad con la reivindicación 58; (e) un ácido nucleico que se híbrida a un polinucleótido de (a), (b) , (c) o (d) bajo condiciones altamente estringentes en sustancialmente toda la longitud del ácido nucleico; (f) un polinucleótido que codifica un polipéptido que comprende una secuencia de aminoácidos que es por lo menos 90% idéntica a aquella de una tirosil aminoacil-tARN sintetasa (TyrRS) que se presenta de manera estable en la naturaleza y comprende dos o más mutaciones seleccionadas del grupo que consiste de: valina, isoleucina, leucina o treonina en una posición correspondiente a Tyr37 de TyrRS de E. col!; treonina, serina, arginina o glicina en una posición correspondiente a Aspl82 de TyrRS de E. col!; metionina o tirosina en una posición correspondiente a Phel83 de TyrRS de E. coli} y serina o alanina en una posición correspondiente a Leul86 de TyrRS de E. coli; (g) un polinucleótido que es por lo menos 98% idéntico a un polinucleótido de (a), (b) , (c), (d) , (e) o (f) y, (h) un polinucleótido que comprende una variación conservadora de (a) , (b) , (c) , (d) , (e) , (f) o (g) .
  26. 26. Un método para producir una aminoacil-tARN sintetasa ortogonal (0-RS) que aminoacila preferencialmente un tARN ortogonal con un aminoácido no natural en una célula eucarióntica, el método está caracterizado porque comprende: (a) someter a selección positiva, en presencia de un aminoácido no natural, una población de células eucariónticas de una primera especie, en donde cada una de las células eucariónticas comprenden: i) un miembro de una biblioteca de aminoacil-tARN sintetasas (RS), ii) un tARN ortogonal (O-tARN) , iii) un polinucleótido que codifica un marcador de selección positiva y iv) un polinucleótido que codifica un marcador de selección negativo; en donde las células que sobreviven la selección positiva comprenden una RS activa que aminoacila el tARN ortogonal (O-tARN) en presencia de un aminoácido no natural; y, (b) someter a las células que sobreviven la selección positiva a selección negativa en ausencia del aminoácido no natural para eliminar las RS activas que aminoacilan el O-tARN con un aminoácido no natural, proporcionando mediante esto la O-RS que aminoacila preferiblemente el O-tARN con el aminoácido no natural.
  27. 27. Un método para producir una aminoacil-tARN sintetasa ortogonal (O-RS) que aminoacila preferiblemente un tARN ortogonal con un aminoácido no natural en una célula eucarióntica, el método está caracterizado porque comprende: (a) someter a selección positiva, en presencia de un aminoácido no natural, una población de células eucariónticas de una primera especie, en donde cada una de las células eucariónticas comprenden: i) un miembro de una biblioteca de aminoacil-tARN sintetasas (RS) , ii) un tARN ortogonal (O-tARN) , iii) un polinucleótido que codifica un marcador de selección positiva y iv) un polinucleótido que codifica un marcador de selección negativa; en donde las células que sobreviven la selección positiva comprenden una RS activa que aminoacila el tARN ortogonal (O-tARN) en presencia de un aminoácido no natural; (b) someter a las células que sobreviven la selección positiva a selección negativa en ausencia del aminoácido no natural para eliminar las RS activas que aminoacilan el O-tARN con un aminoácido natural, proporcionando mediante esto la O-RS que aminoacila preferiblemente el O-tARN con el aminoácido no natural, en donde el O-tARN es obtenido al someter a selección negativa una población de células eucariónticas de una primera especie, en donde las células eucariónticas comprenden un miembro de una biblioteca de tRNAs, para eliminar células que comprenden un miembro de la biblioteca de tRNAs que es aminoacilado mediante una aminoacil-tARN sintetasa (RS) que es endógena a las células eucariónticas, proporcionando mediante esto un cúmulo de tRNAs que son ortogonal a la célula eucarióntica de la primera especie; (c) introducir un ácido nucleico que codifica el 0-tARN y un ácido nucleico que codifica la O-RS a una célula eucarióntica de una segunda especie, en donde la primera especie es levadura y la segunda especies es seleccionada del grupo que consiste de un mamífero, un insecto, un hongo, un alga y una planta.
  28. 28. Un método para producir en una célula eucarióntica por lo menos una proteina que comprende por lo menos un aminoácido no natural, el método está caracterizado porque comprende : cultivar, en un medio apropiado, una célula eucarióntica que comprende un ácido nucleico que comprende por lo menos un codón selector y codifica la proteína; en donde el medio comprende un aminoácido no natural y la célula eucarióntica comprende: un tARN ortogonal (O-tARN) que funciona en la célula y reconoce el codón selector; y una aminoacil tARN sintetasa ortogonal (O-RS) que aminoacila preferencialmente el O-tARN con el aminoácido no natural.
  29. 29. Un método para producir una filtración o selección de proteína moduladora transcripcional el método está caracterizada porque comprende: seleccionar una primera secuencia de polinucleótido, en donde la secuencia de polinucleótidos codifica un dominio de enlace de ácido nucleico; mutar la primera secuencia de polinucleótidos para incluir por lo menos un codón selector, proporcionando mediante esto una secuencia de polinucleótidos de filtración o selección; seleccionar una segunda secuencia de polinucleótidos, en donde la segunda secuencia de polinucleótidos codifica un dominio de activación transcripcional ; proporcionar un constructo que comprende la filtración o selección de la secuencia de polinucleótidos enlazado operativamente a la segunda secuencia de polinucleótidos; y, introducir al constructo, un aminoácido no natural, una tARN ortogonal sintetasa (O-RS) y un tARN ortogonal (0-tARN) a una célula, en donde la 0-RS aminoacila preferencialmente el 0-tARN con el aminoácido no natural y el 0-tARN recoce el codón selector e incorpora el aminoácido no natural al dominio de enlace de ácido nucleico en respuesta al codón selector en la filtración o selección de la secuencia de polinucleótidos, proporcionando mediante esto la proteina moduladora transcripcional de filtración o selección .
  30. 30. ün equipo para producir una proteina que comprende por lo menos un aminoácido no natural en una células, el equipo está caracterizado porque comprende: un recipiente que contiene una secuencia de polinucleótidos que codifica un 0-tARN y una secuencia de polinucleótidos que codifica una 0-RS o una O-RS .
MXPA05011127A 2003-04-17 2004-04-16 Expansion del codigo genetico eucariontico. MXPA05011127A (es)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US46386903P 2003-04-17 2003-04-17
US47993103P 2003-06-18 2003-06-18
US49301403P 2003-08-05 2003-08-05
US49654803P 2003-08-19 2003-08-19
PCT/US2004/011786 WO2004094593A2 (en) 2003-04-17 2004-04-16 Expanding the eukaryotic genetic code

Publications (1)

Publication Number Publication Date
MXPA05011127A true MXPA05011127A (es) 2006-03-10

Family

ID=33314444

Family Applications (1)

Application Number Title Priority Date Filing Date
MXPA05011127A MXPA05011127A (es) 2003-04-17 2004-04-16 Expansion del codigo genetico eucariontico.

Country Status (12)

Country Link
US (10) US7618775B2 (es)
EP (1) EP1613735B1 (es)
JP (2) JP5642916B2 (es)
KR (1) KR101171397B1 (es)
CN (4) CN103215228A (es)
AT (1) ATE542894T1 (es)
AU (2) AU2004233083B2 (es)
CA (1) CA2520750A1 (es)
HK (1) HK1087432A1 (es)
IL (1) IL171128A (es)
MX (1) MXPA05011127A (es)
WO (1) WO2004094593A2 (es)

Families Citing this family (94)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005502322A (ja) * 2001-04-19 2005-01-27 ザ スクリップス リサーチ インスティテュート 非天然アミノ酸のインビボ組込み
KR20050073559A (ko) 2002-10-16 2005-07-14 더 스크립스 리서치 인스티튜트 당단백질 합성
US7618775B2 (en) * 2003-04-17 2009-11-17 The Scripps Research Institute Expanding the eukaryotic genetic code
EP1636340A4 (en) 2003-06-18 2009-02-11 Scripps Research Inst COMPLEMENTS TO THE GENETIC CODE OF UNNATURATIVE REACTIVE AMINO ACIDS
EP1704242A4 (en) * 2003-07-07 2008-06-18 Scripps Research Inst COMPOSITIONS WITH PAIRS OF ORTHOGONAL LEUCYL-TRNA AND AMINOACYL-TRNA-SYNTHETASE AND USES THEREOF
EP1658366A4 (en) 2003-07-07 2006-08-09 Scripps Research Inst COMPOSITIONS OF ORTHOGONAL GLUTAMYL-TRNA AND AMINOACYL-TRNA-SYNTHETASEPAARES AND THEIR USES
PT1914314E (pt) 2003-07-07 2010-09-08 Scripps Research Inst Composições de pares ortogonais de lisil-arnt e aminoacil-arnt-sintetase e suas utilizações
JP5657850B2 (ja) 2003-10-14 2015-01-21 ザ スクリプス リサーチ インスティテュート 酸化還元機能性アミノ酸のタンパク質への部位特異的組み入れ
MXPA06008496A (es) 2004-02-02 2007-01-30 Ambrx Inc Polipeptidos de interferon humano modificados y sus usos.
BRPI0511482A (pt) 2004-05-25 2007-12-26 Scripps Research Inst incorporação sìtio-especìfica de aminoácidos artificiais contendo átomos pesados em proteìnas para determinação de estrutura cristalina
MXPA06014684A (es) * 2004-06-18 2007-02-12 Ambrx Inc Novedosos polipeptidos de enlace antigeno y sus usos.
KR20070039593A (ko) * 2004-07-21 2007-04-12 암브룩스, 인코포레이티드 비천연적으로 코딩된 아미노산을 이용한 생합성 폴리펩티드
WO2009100255A2 (en) 2008-02-08 2009-08-13 Ambrx, Inc. Modified leptin polypeptides and their uses
US7718410B2 (en) 2004-09-21 2010-05-18 The Scripps Research Institute In vivo incorporation of alkynyl amino acids into proteins in eubacteria
WO2006036779A2 (en) * 2004-09-22 2006-04-06 The Scripps Research Institute Site-specific labeling of proteins for nmr studies
US20080064059A1 (en) 2004-10-20 2008-03-13 Scripps Research Institute In Vivo Site-Specific Incorporation of N-Acetyl-Galactosamine Amino Acids in Eubacteria
BRPI0517381A (pt) 2004-10-27 2008-10-07 Scripps Research Inst componentes ortogonais de tradução para a incorporação in vivo de aminoácidos não naturais
JP2008035702A (ja) * 2004-11-26 2008-02-21 Institute Of Physical & Chemical Research 蛋白質間相互作用の検出方法
US7638491B2 (en) 2004-12-22 2009-12-29 Ambrx, Inc. Therapies using non-natural amino acids and polypeptides
KR101224781B1 (ko) 2004-12-22 2013-01-21 암브룩스, 인코포레이티드 비천연적으로 코딩된 아미노산을 포함하는 인간 성장호르몬의 조제물
BRPI0518661A2 (pt) 2004-12-22 2008-12-02 Ambrx Inc mÉtodos para expressço e purificaÇço do hormânio do crescimento humano recombinante
MX2007007580A (es) * 2004-12-22 2007-12-11 Ambrx Inc Hormona del crecimiento humana modificada.
ATE541934T1 (de) 2004-12-22 2012-02-15 Ambrx Inc Zusammensetzungen von aminoacyl-trna-synthetase und verwendungen davon
GB0428012D0 (en) * 2004-12-22 2005-01-26 Hammersmith Imanet Ltd Radiolabelling methods
GB0507123D0 (en) * 2005-04-08 2005-05-11 Isis Innovation Method
EP1893229B1 (en) * 2005-06-03 2011-10-19 Ambrx, Inc. Improved human interferon molecules and their uses
KR20080069993A (ko) * 2005-10-12 2008-07-29 더 스크립스 리서치 인스티튜트 파지-디스플레이된 폴리펩티드의 선별적인 번역후 변형
PT2339014E (pt) 2005-11-16 2015-10-13 Ambrx Inc Métodos e composições compreendendo aminoácidos não-naturais
EP1968635B1 (en) 2005-12-14 2014-09-17 Ambrx, Inc. Compositions containing, methods involving, and uses of non-natural amino acids and polypeptides
EP3056575B1 (en) 2005-12-22 2017-10-11 Pacific Biosciences Of California, Inc. Polymerases for nucleotide analogue incorporation
US20070178554A1 (en) * 2006-02-01 2007-08-02 Nima Shiva Orthogonal Aminoacyl Synthetase-tRNA Pairs for Incorporating Unnatural Amino Acids Into Proteins
US20090081669A1 (en) * 2006-02-01 2009-03-26 Encode Bio, Inc. Fluorescent Assays Using Orthogonal tRNA - Aminoacyl Synthetase Pairs
US7776535B2 (en) * 2006-02-06 2010-08-17 Franklin And Marshall College Site-specific incorporation of fluorinated amino acids into proteins
JP5589186B2 (ja) * 2006-03-09 2014-09-17 ザ スクリプス リサーチ インスティテュート 真正細菌宿主細胞における直交翻訳成分の発現システム
US8217145B2 (en) 2006-03-16 2012-07-10 The Scrips Research Institute Genetically programmed expression of proteins containing the unnatural amino acid phenylselenocysteine
WO2007139870A1 (en) * 2006-05-23 2007-12-06 The Scripps Research Institute Genetically encoded fluorescent coumarin amino acids
US8420792B2 (en) * 2006-09-08 2013-04-16 Ambrx, Inc. Suppressor tRNA transcription in vertebrate cells
CN106008699A (zh) 2006-09-08 2016-10-12 Ambrx公司 经修饰的人类血浆多肽或Fc骨架和其用途
KR20090057072A (ko) * 2006-09-08 2009-06-03 암브룩스, 인코포레이티드 척추동물 세포에 의한 비천연 아미노산의 부위 특이적 도입
MX2009002987A (es) * 2006-09-21 2009-04-28 Scripps Research Inst Expresion geneticamente programada de proteinas selectivamente sulfatadas en eubacterias.
JP2010506591A (ja) * 2006-10-18 2010-03-04 ザ スクリップス リサーチ インスティテュート 哺乳動物細胞中の蛋白質への非天然アミノ酸の遺伝的組込み
EP2068909B1 (en) 2007-03-30 2012-04-25 Ambrx, Inc. Modified fgf-21 polypeptides and their uses
AU2008247815B2 (en) 2007-05-02 2012-09-06 Ambrx, Inc. Modified interferon beta polypeptides and their uses
AU2008316796A1 (en) 2007-10-25 2009-04-30 Massachusetts Institute Of Technology Genetic incorporation of 3-aminotyrosine into reductases
US20090148887A1 (en) * 2007-11-02 2009-06-11 The Scripps Research Institute Genetically encoded boronate amino acid
AU2008325239A1 (en) 2007-11-02 2009-05-14 The Scripps Research Institute Directed evolution using proteins comprising unnatural amino acids
JP5547083B2 (ja) 2007-11-20 2014-07-09 アンブルックス,インコーポレイテッド 修飾されたインスリンポリペプチドおよびそれらの使用
AU2008335778B2 (en) 2007-12-11 2014-04-10 The Scripps Research Institute In vivo unnatural amino acid expression in the methylotrophic yeast Pichia pastoris
CA2712080A1 (en) * 2008-02-08 2009-08-13 The Scripps Research Institute Breaking immunological tolerance with a genetically encoded unnatural amino acid
AU2009251883B2 (en) 2008-03-31 2014-09-11 Pacific Biosciences Of California, Inc. Generation of modified polymerases for improved accuracy in single molecule sequencing
US10138283B2 (en) 2008-07-23 2018-11-27 Ambrx, Inc. Modified bovine G-CSF polypeptides and their uses
MX348657B (es) 2008-09-26 2017-06-21 Ambrx Inc Microorganismos y vacunas dependientes de replicacion de aminoacidos no naturales.
CN107022020A (zh) 2008-09-26 2017-08-08 Ambrx公司 修饰的动物促红细胞生成素多肽和其用途
US20090197339A1 (en) * 2008-12-10 2009-08-06 The Scripps Research Institute In vivo unnatural amino acid expression in the methylotrophic yeast pichia pastoris
CN102307905B (zh) * 2008-12-10 2015-11-25 斯克利普斯研究院 利用化学反应性非天然氨基酸产生载体-肽偶联物
CA2784800A1 (en) 2009-12-21 2011-07-21 Ambrx, Inc. Modified porcine somatotropin polypeptides and their uses
AU2010341516B2 (en) 2009-12-21 2014-01-16 Ambrx, Inc. Modified bovine somatotropin polypeptides and their uses
SG10201506443TA (en) 2010-08-17 2015-10-29 Ambrx Inc Modified relaxin polypeptides and their uses
US9567386B2 (en) 2010-08-17 2017-02-14 Ambrx, Inc. Therapeutic uses of modified relaxin polypeptides
AR083006A1 (es) 2010-09-23 2013-01-23 Lilly Co Eli Formulaciones para el factor estimulante de colonias de granulocitos (g-csf) bovino y variantes de las mismas
WO2012064675A2 (en) * 2010-11-10 2012-05-18 Webb Nigel L Nuclions and ribocapsids
US20160144003A1 (en) * 2011-05-19 2016-05-26 The Scripps Research Institute Compositions and methods for treating charcot-marie-tooth diseases and related neuronal diseases
CN102925427B (zh) * 2011-08-08 2014-01-22 中国科学院生物物理研究所 丙烯酰赖氨酸翻译系统及其应用
SG10201702387YA (en) * 2012-09-24 2017-04-27 Medimmune Ltd Cell lines
CN102925476B (zh) * 2012-11-15 2014-12-03 中国科学院上海巴斯德研究所 酵母中自组装的具有免疫原性的肠道病毒病毒样颗粒的制备方法及其应用
JO3564B1 (ar) 2013-03-08 2020-07-05 Novartis Ag ببتيدات وتركيبات لعلاج ضرر المفاصل
EP3021942A4 (en) 2013-07-19 2017-04-19 The Regents of The University of California Milk fat globule epidermal growth factor 8 regulates fatty acid uptake
ES2699479T3 (es) * 2013-09-12 2019-02-11 Lanzatech New Zealand Ltd Microorganismos recombinantes y sus métodos de uso
US9834775B2 (en) 2013-09-27 2017-12-05 President And Fellows Of Harvard College Recombinant cells and organisms having persistent nonstandard amino acid dependence and methods of making them
WO2016004024A1 (en) 2014-07-02 2016-01-07 Sutro Biopharma, Inc. High growth capacity auxotrophic escherichia coli and methods of use
CN105420203B (zh) * 2014-09-03 2018-11-16 中国科学院生物物理研究所 酪氨酸类似物翻译系统和基因编码的蛋白质光致电子转移荧光传感器蛋白家族
LT3412302T (lt) 2014-10-24 2021-07-26 Bristol-Myers Squibb Company Modifikuoti fgf-21 polipeptidai ir jų panaudojimai
SG11201704487XA (en) 2014-12-04 2017-06-29 Celgene Corp Biomolecule conjugates
AU2016349786B2 (en) * 2015-11-03 2023-11-16 Ambrx, Inc. Anti-CD3-folate conjugates and their uses
WO2017093254A1 (en) * 2015-11-30 2017-06-08 European Molecular Biology Laboratory Means and methods for preparing engineered proteins by genetic code expansion in insect cells
JP2020500020A (ja) 2016-11-14 2020-01-09 ノバルティス アーゲー 融合誘導性タンパク質minionに関連する組成物、方法、および治療上の使用
MX2019005621A (es) 2016-11-14 2019-08-12 Novartis Ag Metodos y composiciones para el tratamiento del daño del cartilago y la artritis.
US10266578B2 (en) 2017-02-08 2019-04-23 Bristol-Myers Squibb Company Modified relaxin polypeptides comprising a pharmacokinetic enhancer and uses thereof
CN107119000B (zh) * 2017-04-19 2019-04-12 山东大学 荧光假单胞菌突变菌株的筛选方法及其在生物防治中的应用
JP7325341B2 (ja) 2017-07-11 2023-08-14 シンソークス,インク. 非天然ヌクレオチドの組み込み及びその方法
JP2020529976A (ja) 2017-08-03 2020-10-15 シンソークス,インク. 自己免疫疾患の処置のためのサイトカイン抱合体
AU2019263303A1 (en) 2018-05-01 2020-12-24 Ambrx, Inc. A method for optimizing antibody expression
EP3897691A4 (en) * 2018-12-21 2022-08-31 The Regents of the University of California IL-10 VACCINES AND THEIR USES
JP2022519271A (ja) 2019-02-06 2022-03-22 シンソークス, インコーポレイテッド Il-2コンジュゲートおよびその使用方法
CN110172467B (zh) * 2019-05-24 2021-03-16 浙江大学 一种利用嵌合设计方法构建正交的氨酰-tRNA合成酶/tRNA体系
EP3983543A4 (en) * 2019-06-14 2023-05-03 The Scripps Research Institute REAGENTS AND METHODS FOR REPLICATION, TRANSCRIPTION AND TRANSLATION IN SEMI-SYNTHETIC ORGANISMS
AU2020361533A1 (en) 2019-10-08 2022-04-28 Trustees Of Boston College Proteins containing multiple, different unnatural amino acids and methods of making and using such proteins
EP4069842A1 (en) 2019-12-02 2022-10-12 Shape Therapeutics Inc. Therapeutic editing
CN111996206B (zh) * 2020-06-19 2023-01-31 清华大学 光控无细胞蛋白质合成方法、该方法使用的质粒以及使用该方法的产品
CN113481228A (zh) * 2021-06-13 2021-10-08 中国药科大学 微生物非天然氨基酸引入体系及构建方法
EP4370680A2 (en) 2021-07-16 2024-05-22 Aptah Bio, Inc. Polynucleotide compositions and methods for gene expression regulation
WO2023069816A2 (en) 2021-09-20 2023-04-27 The Broad Institute, Inc. Compositions and methods for multiplex decoding of quadruplet codons
CN115261344B (zh) * 2022-08-29 2023-07-21 北京大学 基于非天然氨基酸的离子液体、其制备方法及应用
WO2024091824A1 (en) 2022-10-26 2024-05-02 Ada Forsyth Institute, Inc. Differentiation and reprogramming of chondrocyte

Family Cites Families (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE9115660U1 (de) 1991-12-18 1992-07-30 Aventis Research & Technologies GmbH & Co KG, 65929 Frankfurt L-Phenylalanyl-tRNA-Synthetase mit erweiterter Substratselektivität aus Mikroorganismen
US6706504B1 (en) 1996-11-12 2004-03-16 The Scripps Research Institute Tissue type plasminogen activator (t-PA) variants: compositions and methods of use
WO1999061654A1 (en) * 1998-05-27 1999-12-02 The Scripps Research Institute Methods and systems for predicting protein function
CA2404260A1 (en) * 2000-03-21 2001-09-27 Elitra Pharmaceuticals, Inc. Identification of essential genes in prokaryotes
AU2002306849A1 (en) * 2001-03-21 2002-10-08 Elitra Pharmaceuticals, Inc. Identification of essential genes in microorganisms
JP2005502322A (ja) 2001-04-19 2005-01-27 ザ スクリップス リサーチ インスティテュート 非天然アミノ酸のインビボ組込み
WO2003014354A1 (en) 2001-08-01 2003-02-20 Japan Science And Technology Agency Tyrosyl-trna synthase variants
CN1379094A (zh) * 2002-02-01 2002-11-13 杭州华大基因研发中心 耐高温酪氨酰tRNA合成酶基因及其编码的多肽和制备方法
DE60327369D1 (de) 2002-10-16 2009-06-04 Scripps Research Inst Stellenspezifischer einbau von ketoaminosäuren in proteine
KR20050073559A (ko) 2002-10-16 2005-07-14 더 스크립스 리서치 인스티튜트 당단백질 합성
WO2004058946A2 (en) 2002-12-22 2004-07-15 The Scripps Research Institute Protein arrays
US7618775B2 (en) 2003-04-17 2009-11-17 The Scripps Research Institute Expanding the eukaryotic genetic code
EP1636340A4 (en) 2003-06-18 2009-02-11 Scripps Research Inst COMPLEMENTS TO THE GENETIC CODE OF UNNATURATIVE REACTIVE AMINO ACIDS
PT1914314E (pt) 2003-07-07 2010-09-08 Scripps Research Inst Composições de pares ortogonais de lisil-arnt e aminoacil-arnt-sintetase e suas utilizações
EP1658366A4 (en) 2003-07-07 2006-08-09 Scripps Research Inst COMPOSITIONS OF ORTHOGONAL GLUTAMYL-TRNA AND AMINOACYL-TRNA-SYNTHETASEPAARES AND THEIR USES
EP1704242A4 (en) 2003-07-07 2008-06-18 Scripps Research Inst COMPOSITIONS WITH PAIRS OF ORTHOGONAL LEUCYL-TRNA AND AMINOACYL-TRNA-SYNTHETASE AND USES THEREOF
JP5657850B2 (ja) 2003-10-14 2015-01-21 ザ スクリプス リサーチ インスティテュート 酸化還元機能性アミノ酸のタンパク質への部位特異的組み入れ
AU2004321117B2 (en) 2003-12-18 2010-09-02 The Scripps Research Institute Selective incorporation of 5-hydroxytryptophan into proteins in mammalian cells
BRPI0511482A (pt) 2004-05-25 2007-12-26 Scripps Research Inst incorporação sìtio-especìfica de aminoácidos artificiais contendo átomos pesados em proteìnas para determinação de estrutura cristalina
WO2006034410A2 (en) 2004-09-21 2006-03-30 The Scripps Resarch Institute Adding photoregulated amino acids to the genetic code
US7718410B2 (en) 2004-09-21 2010-05-18 The Scripps Research Institute In vivo incorporation of alkynyl amino acids into proteins in eubacteria
WO2006036779A2 (en) 2004-09-22 2006-04-06 The Scripps Research Institute Site-specific labeling of proteins for nmr studies
US20080064059A1 (en) 2004-10-20 2008-03-13 Scripps Research Institute In Vivo Site-Specific Incorporation of N-Acetyl-Galactosamine Amino Acids in Eubacteria
BRPI0517381A (pt) 2004-10-27 2008-10-07 Scripps Research Inst componentes ortogonais de tradução para a incorporação in vivo de aminoácidos não naturais
KR20080069993A (ko) 2005-10-12 2008-07-29 더 스크립스 리서치 인스티튜트 파지-디스플레이된 폴리펩티드의 선별적인 번역후 변형
JP5589186B2 (ja) 2006-03-09 2014-09-17 ザ スクリプス リサーチ インスティテュート 真正細菌宿主細胞における直交翻訳成分の発現システム
US8217145B2 (en) 2006-03-16 2012-07-10 The Scrips Research Institute Genetically programmed expression of proteins containing the unnatural amino acid phenylselenocysteine
WO2007139870A1 (en) 2006-05-23 2007-12-06 The Scripps Research Institute Genetically encoded fluorescent coumarin amino acids
MX2009002987A (es) 2006-09-21 2009-04-28 Scripps Research Inst Expresion geneticamente programada de proteinas selectivamente sulfatadas en eubacterias.
JP2010506591A (ja) 2006-10-18 2010-03-04 ザ スクリップス リサーチ インスティテュート 哺乳動物細胞中の蛋白質への非天然アミノ酸の遺伝的組込み
AU2008316796A1 (en) 2007-10-25 2009-04-30 Massachusetts Institute Of Technology Genetic incorporation of 3-aminotyrosine into reductases
AU2008325239A1 (en) 2007-11-02 2009-05-14 The Scripps Research Institute Directed evolution using proteins comprising unnatural amino acids
US20090148887A1 (en) 2007-11-02 2009-06-11 The Scripps Research Institute Genetically encoded boronate amino acid
WO2009064416A2 (en) 2007-11-15 2009-05-22 The Scripps Research Institute Genetic incorporation of an alpha-hydroxy acid into proteins to generate ester backbone linkages at defined sites
CA2712080A1 (en) 2008-02-08 2009-08-13 The Scripps Research Institute Breaking immunological tolerance with a genetically encoded unnatural amino acid
WO2009151491A2 (en) 2008-02-27 2009-12-17 The Scripps Research Institute In vivo incorporation of an unnatural amino acid comprising a 1,2-aminothiol group
US20090197339A1 (en) 2008-12-10 2009-08-06 The Scripps Research Institute In vivo unnatural amino acid expression in the methylotrophic yeast pichia pastoris
CN102307905B (zh) 2008-12-10 2015-11-25 斯克利普斯研究院 利用化学反应性非天然氨基酸产生载体-肽偶联物
WO2010114615A2 (en) 2009-04-03 2010-10-07 The Scripps Research Institute A facile system for encoding unnatural amino acids in mammalian cells

Also Published As

Publication number Publication date
HK1087432A1 (en) 2006-10-13
CN101223272A (zh) 2008-07-16
US20050009049A1 (en) 2005-01-13
US20150240249A1 (en) 2015-08-27
US7625717B2 (en) 2009-12-01
JP5642916B2 (ja) 2014-12-17
EP1613735B1 (en) 2012-01-25
US7794978B2 (en) 2010-09-14
CA2520750A1 (en) 2004-11-04
JP2014195463A (ja) 2014-10-16
CN103289960B (zh) 2017-04-26
JP2007525943A (ja) 2007-09-13
CN103215228A (zh) 2013-07-24
AU2004233083B2 (en) 2010-09-16
US20080176277A1 (en) 2008-07-24
AU2004233083A1 (en) 2004-11-04
CN103289960A (zh) 2013-09-11
US20120282689A1 (en) 2012-11-08
CN103215227B (zh) 2015-09-16
US20110217733A1 (en) 2011-09-08
US20080227195A1 (en) 2008-09-18
CN103215227A (zh) 2013-07-24
EP1613735A2 (en) 2006-01-11
AU2010257225A1 (en) 2011-01-13
US8173393B2 (en) 2012-05-08
US8945926B2 (en) 2015-02-03
WO2004094593A3 (en) 2007-12-21
US7618775B2 (en) 2009-11-17
EP1613735A4 (en) 2009-01-28
IL171128A (en) 2013-07-31
US7608423B2 (en) 2009-10-27
KR20050119704A (ko) 2005-12-21
US20100160618A1 (en) 2010-06-24
US20070166791A1 (en) 2007-07-19
AU2010257225B2 (en) 2012-12-13
US9580721B2 (en) 2017-02-28
US20120253026A1 (en) 2012-10-04
CN101223272B (zh) 2013-04-03
US8357532B2 (en) 2013-01-22
KR101171397B1 (ko) 2012-08-07
US20070154952A1 (en) 2007-07-05
WO2004094593A2 (en) 2004-11-04
US8114628B2 (en) 2012-02-14
ATE542894T1 (de) 2012-02-15

Similar Documents

Publication Publication Date Title
US9580721B2 (en) Expanding the eukaryotic genetic code
US9797908B2 (en) Unnatural reactive amino acid genetic code additions
AU2013201487B2 (en) Expanding the eukaryotic genetic code
AU2004253857B2 (en) Unnatural reactive amino acid genetic code additions

Legal Events

Date Code Title Description
FG Grant or registration