MXPA03009563A - Incorporacion in vivo de aminoacidos no naturales. - Google Patents

Incorporacion in vivo de aminoacidos no naturales.

Info

Publication number
MXPA03009563A
MXPA03009563A MXPA03009563A MXPA03009563A MXPA03009563A MX PA03009563 A MXPA03009563 A MX PA03009563A MX PA03009563 A MXPA03009563 A MX PA03009563A MX PA03009563 A MXPA03009563 A MX PA03009563A MX PA03009563 A MXPA03009563 A MX PA03009563A
Authority
MX
Mexico
Prior art keywords
amino acid
protein
cell
receptor
factor
Prior art date
Application number
MXPA03009563A
Other languages
English (en)
Inventor
Zhang Zhiwen
Original Assignee
Scripps Research Inst
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Scripps Research Inst filed Critical Scripps Research Inst
Publication of MXPA03009563A publication Critical patent/MXPA03009563A/es

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P43/00Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P7/00Drugs for disorders of the blood or the extracellular fluid
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/475Growth factors; Growth regulators
    • C07K14/505Erythropoietin [EPO]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/67General methods for enhancing the expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/93Ligases (6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P13/00Preparation of nitrogen-containing organic compounds
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P13/00Preparation of nitrogen-containing organic compounds
    • C12P13/005Amino acids other than alpha- or beta amino acids, e.g. gamma amino acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P13/00Preparation of nitrogen-containing organic compounds
    • C12P13/04Alpha- or beta- amino acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P13/00Preparation of nitrogen-containing organic compounds
    • C12P13/04Alpha- or beta- amino acids
    • C12P13/22Tryptophan; Tyrosine; Phenylalanine; 3,4-Dihydroxyphenylalanine
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/26Preparation of nitrogen-containing carbohydrates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/02Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Biophysics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biomedical Technology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Physics & Mathematics (AREA)
  • Toxicology (AREA)
  • Plant Pathology (AREA)
  • Public Health (AREA)
  • Animal Behavior & Ethology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Veterinary Medicine (AREA)
  • Hematology (AREA)
  • Diabetes (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Organic Low-Molecular-Weight Compounds And Preparation Thereof (AREA)
  • Peptides Or Proteins (AREA)

Abstract

La invencion proporciona metodos y composiciones para la incorporacion in vivo de aminoacidos no naturales. Tambien se proporcionan composiciones que incluyen proteinas con aminoacidos no naturales.

Description

INCORPORACIÓN IN VIVO DE AMINOÁCIDOS NO NATURALES REFERENCIAS CRUZADAS A SOLICITUDES RELACIONADAS Esta solicitud reivindica prioridad para y en beneficio de la solicitud de patente provisional de los Estados Unidos Serie No. 60/285,030, presentada el 19 de abril de 2001 y la solicitud de patente provisional de los Estados Unidos Serie No. 60/335,514 presentada el 6 de febrero de 2002, las especificaciones de las cuales se incorporan en la presente en su totalidad. DECLARACIÓN RESPECTO A LA INVESTIGACIÓN Y DESARROLLO FEDERALMENTE PATROCINADO La invención se realizó con soporte del Gobierno de los Estados Unidos bajo la Concesión No. 6502573 de la Oficina de Investigación Naval y la Concesión No. G 62159 de los Institutos Nacionales de Salud. El Gobierno de los Estados Unidos tiene ciertos derechos en la invención. CAMPO DE LA INVENCIÓN La invención se refiere al campo de la bioquímica de la proteína. En particular, la invención se refiere al campo de las composiciones y métodos para producir proteínas que incluyen aminoácidos no naturales . ANTECEDENTES DE LA INVENCIÓN Las proteínas portan virtualmente todos los complejos procesos de la vida, desde la fotosíntesis hasta la transducción de señal y la respuesta inmune. Para entender y controlar estas complicadas actividades, se necesita un mejor entendimiento de la relación entre la estructura y la función de las proteínas . A diferencia de la síntesis de moléculas orgánicas pequeñas en donde casi cualquier cambio estructural puede hacerse para influir las propiedades funcionales de un compuesto, la síntesis de proteínas se limita a cambios codificados por los veinte aminoácidos naturales . El código genético de cada organismo conocido, desde bacterias hasta humanos, codifica los mismos veinte aminoácidos comunes. Estos aminoácidos pueden modificarse mediante la modificación post-traducción de las proteínas, e.g. , glicosilación, fosforilación u oxidación o en casos raros, mediante la modificación enzimática de los ARNts supresores aminoacilados, e.g., en el caso de selenocisteína . Sin embargo, los polipéptidos, que se sintetizan a partir de solamente estos 20 simples bloques de construcción, llevan todos los complejos procesos de la vida. Ambas mutagénesis, la dirigida al sitio y la aleatoria, en las cuales los aminoácidos específicos en una proteína pueden reemplazarse con cualquiera de los otros diecinueve aminoácidos, se han convertido en importantes herramientas para entender la relación entre la estructura y la función de las proteínas . Estas metodologías han hecho posible la generación de proteínas con propiedades mejoradas, - - incluyendo estabilidad, actividad catalítica y especificidad de unión. Sin embargo, los cambios en las proteínas se limitan a los 20 aminoácidos comunes, la mayoría de los cuales tiene grupos funcionales simples. Ver Knowles, J.R. Tinkering with enzymes : what are we learning? (Trabajando con enzimas: ¿que estamos aprendiendo?) Science, 236(4806) 1252-1258 (1987); y Zoller, M.J., Smith, M. Oligonucleotide-directed mutagenesis of DNA fragments cloned into MI3 vectors (Mutagénesis dirigida a los oligonucleótidos de los fragmentos de ADN clonados en vectores M13) , Met ods Enzymol, 154:468-500 (1983). Al expandir el código genético para incluir aminoácidos adicionales con nuevas propiedades biológicas, químicas o físicas, las propiedades de las proteínas, e.g., el tamaño, acidez, nucleofilicidad, unión a hidrógeno, propiedades hidrofóbicas , pueden modificarse en comparación a una proteína compuesta de solamente aminoácidos de los 20 aminoácidos comunes, e.g. , como en una proteína que se presenta de manera natural . Se han empleado varias estrategias para introducir aminoácidos no naturales en las proteínas. Los primeros experimentos involucraron la derivación de los aminoácidos con cadenas laterales reactivas tales como Lys, Cys y Tyr, por ejemplo, la conversión de lisina a N2-acetil-lisina . La síntesis química también proporciona un método directo para incorporar aminoácidos no naturales, pero la síntesis del péptido de fase sólida de rutina, generalmente se limita a pequeños péptidos o proteínas con menos de 100 residuos. Con el reciente desarrollo de la ligación enzimática y la ligación química nativa de los fragmentos de péptido, es posible elaborar proteínas mayores, pero el método no se alcanza fácilmente. Ver, e.g.,P.E. Dawson y S.B.H. Kent, Annu. Rev. Biochem. , 69:923 (2000). Un método general biosintético in vi tro en el cual se agrega un AR t supresor químicamente acilado con el aminoácido no natural deseado a un extracto irt vitro capaz de soportar la biosíntesis de la proteína, se ha utilizado para incorporar de manera específica al sitio más de 100 aminoáciods no naturales en una variedad de proteínas de virtualmente cualquier tamaño. Ver, e.g.r V.W. Cornish, D. Mendel y P.G. Schultz, Angew. Chem. Int. Ed. Engl . , 1995, 34:621 (1995); C.J. Noren, S.J. Anthony-Cahill, M.C. Griffith, P.G. Schultz, A general method for site-specific incorporation of unnatural amino acids into proteins (Un método general para la incorporación específica de sitio de aminoácidos no naturales en proteínas) , Science 244 182-188 (1989); y J.D. Bain, C.G. Glabe, T.A. Dix, A.R. Chamberlin, E.S. Díala, Biosynthetic site-specific incorporation of a non-natural amino acid into a polypeptide (Incorporación biosintética específica de sitio de un aminoácido no-natural en un polipéptido) , J. Am. Chem. Soc . 111 8013-8014 (1989) . Se ha introducido un amplio rango de - grupos funcionales en las proteínas para estudios de estabilidad de la proteína, duplicación de la proteína, mecanismo enzimático y transducción de señal . Aunque estos estudios demuestran que la maquinaria biosintética de la proteína tolera una amplia variedad de cadenas laterales de aminoácidos, el método es técnicamente demandante y las producciones de proteínas mutantes son bajas. Hace más de 50 años, se encontró que muchos análogos de aminoácidos naturales inhiben el desarrollo de bacterias. El análisis de las proteínas producidas en la presencia de estos análogos de aminoácidos reveló que han sido substituidos por sus contrapartes naturales, hasta varios grados. Ver, e.g., M.H. Richmond, Bacteriol . Rev. , 26:398 (1962). Esto ocurre debido a que la aminoacil-ARNt sintetasa, la enzima responsable de la unión del aminoácido correcto a su ARNt cognado, no puede distinguir rigurosamente el análogo del aminoácido natural correspondiente . Por ejemplo, la norleucina se carga mediante la metionil-ARNt sintetasa y la p-fluorofenilalanina se carga mediante la fenilalanina-ARNt sintetasa. Ver, D.B. Cowie, G.N. Cohén, E.T. Bolton y H. DeRrobinchon-Szulmaj st, Biochim. Biophys. Acta, 1959, 34:39 (1959); y R. Munier y G.N. Cohén, Biochim. Biophys. Acta, 1959, 31:378 (1959) . Un método in vivo, denominado incorporación de presión selectiva, se desarrolló posteriormente para explotar la promiscuidad de la sintetasa tipo silvestre. Ver, e.g., N. Budisa, C. Minks, S. Alefeider, W. Wenger, F.M. Dong, L. Moroder y R. Huber, FASEB J. , 13:41 (1999). Una cepa auxotrófica, en la cual se desvía la trayectoria metabólica relevante que suministra a la célula con un aminoácido natural particular, se desarrolla en un medio mínimo que contiene concentraciones limitadas del aminoácido natural, mientras la trascripción del gen objetivo se reprime. Al inicio de una fase de desarrollo estacionaria, el aminoácido natural se agota y se reemplaza con el aminoácido no natural análogo . La inducción de la expresión de la proteína recombinante da como resultado la acumulación de una proteína que contiene el análogo no natural. Por ejemplo, utilizando esta estrategia, las o, m y p-fluorofenilalaninas se han incorporado en las proteínas y exhiben dos salientes características en el espectro UV que pueden fácilmente identificarse, ver, e.g., C. Minks R. Huber, L. Moroder y N. Budisa, Anal. Biochem. , 284:29 (2000); se ha utilizado trifluorometionina para reemplazar la metionina en la lisozima T4 de bacteriófago para estudiar su interacción con los ligandos citooligosacáridos mediante 19F MR, ver, e.g., H. Duewel, E. Daub, V. Robinson y J.F. Honek, Biochemistry, 36:3404 (1997); y la trifluoroleucina se ha insertado en lugar de la leucina, dando como resultado la estabilidad térmica y química incrementada de una proteína de zipper de - leucina. Ver, e.g. Y. Tang, G. Ghirlanda, W.A. Petka, T. Nakajima, W.F. DeGrado y D.A. Tirrell, Angew. Chem. Int . Ed. Engl . , 40:1494 (2001). Además, se incorporaron selenometionina y telurometionina en varias proteínas recombinantes para facilitar la solución de fases en cristalografía de rayos X. Ver, e.g. , W.A. Hendrickson, J.R. Horton y D.M. Lemaster, EMBO J. , 9:1665 (1990); J.O. Boles, K. Lewinski, M. Kunkle, J.D. Odom, B. Dunlap, L. Lebioda y M. Hatada, Nat . Struct . Biol . , 1:283 (1994); N. Budisa, B. Steipe, P. Demange, C. Eckerskorn, J. Kellermann y R. Huber, Eur. J.Biochem. , 230:788 (1995); y N. Budisa, W. Ka nbrock, S.
Stein bacher, A. Humm, L. Prade, T. Neuefeind, L.
Moroder y R. Huber, J.Mol .Biol . , 270:616 (1977). Los análogos de metionina con alqueno o funcionalidades de alquino también se han insertado eficientemente, permitiendo la modificación adicional de las proteínas por medios químicos. Ver, e.g., J.C.M. vanHest y D.A. Tirrell, FEBS Lett . , 428:68 (1998); J.C.M. van Hest, K.L. Kiick y D.A. Tirrell, J.Am. Chem. Soc . , 122:1282 (2000); y K.L. Kiick y D.A. Tirrell, Tetrahedrom, 56:9487 (2000). El éxito de este método depende del reconocimiento de los análogos de aminoácidos no naturales mediante' aminoacil-ARNt sintetasas, las cuales, en general, requieren alta selectividad para asegurar la fidelidad de la traducción de la proteína. Mediante esto, el rango de la funcionalidad - - química accesible a través de esta ruta es limitado. Por ejemplo, aunque la tiaprolina puede incorporarse cuantitativamente en las proteínas, la oxaprolina y la selenoprolina no pueden. Ver, N. Budisa, C. Minks, F.J. Medrano, J. Lutz, R. Huber y L. Moroder, Proc.Matl .Acad.Sci .USA, 95:455 (1998). Una forma de expandir el alcance de este método es relajar la especificidad del substrato de las aminoacil-ARNt sintetasas, que se han logrado en un número limitado de casos. Por ejemplo, se encontró que la recolocación de Ala294 mediante Gly en la fenilalanil-AR t sintetasa (PheRS) de Escherichia coli incrementa el tamaño de la cavidad unida al sustrato dando como resultado la acilación de ARNtPhe por p-Cl-fenilalanina (p-Cl-Phe) . Ver, M. Ibba, P. Kast y H. Hennecke, Biochemistry, 33:7107 (1994). Una cepa de Escherichia coli que alberga este mutante PheRS permite la incorporación de la p-Cl-fenilalanina o p-Br-fenilalanina en lugar de la fenilalanina. Ver, e.g. , M. Ibba y H. Hennecke, FEBS Lett . , 364:272 (1995); y N. Sharma, R. Furter, P. Kast y D.A. Tirrell, FEBS Lett . , 467:37 (2000). De manera similar, una mutación de punto Phel30Ser cerca del sitio de unión del aminoácido de la tirosil-ARNt sintetasa de Escherichia coli mostró que permite a la azatirosina incorporarse más eficientemente que la tirosina. Ver, F. Hamano-Takaku, T. Iwama, S. Saito-Yano, K. Takaku, .Y. Monden, M. Kitabatake, D.
- - Solí y S. Nishimura, J.Biol .Chem. , 275:40324 (2000). La fidelidad de la aminoacilación se mantiene tanto a nivel de discriminación del sustrato como al cotejo de los intermediarios y productos no semejantes. Mediante esto, una estrategia alternativa para incorporar aminoácidos no naturales en las proteínas in vivo es modificar las sintetasas que tienen mecanismos de cotejo. Estas sintetasas no pueden discriminarse y mediante esto activan los aminoácidos que son estructuralmente similares a los aminoácidos naturales semejantes. Este error se corrige en un sitio separado, que desacila los aminoácidos indebidamente cargados a partir de AR t para mantener la fidelidad de la traducción de la proteína. Si la actividad de cotejo de la sintetasa se inhabilita, los análogos estructurales que se activan indebidamente pueden escapar de la función de edición y pueden incorporarse. Este procedimiento se ha demostrado recientemente con la sintetasa valil-ARNt (ValRS) . Ver, V. Doring, H.D. Mootz, L.A. Nangle, T.L. Hendrickson, V. de Crecy-Lagard, P. Schimmel y P. Marliere, Science, 292:501 (2001) . El ValRS puede indebidamente aminoacilar ARNt Val con Cys, Thr o aminobutirato (Abu) ; estos aminoácidos no semejantes se hidrolizan subsecuentemente mediante el dominio de edición. Después de la mutagénesis aleatoria del cromosoma de Escherichia coli , se seleccionó un mutante de la cepa de Escherichia coli que tiene una mutación en el sitio de edición de ValRS . Esta ValRS defectuosa de edición carga incorrectamente a ARNt Val con Cys . Debido a que Abu se asemeja estéricamente a Cys (el grupo -SH de Cys se reemplaza con -CH3 en Abu) , el ValRS mutante también incorpora Abu dentro de las proteínas cuando esta cepa mutante de Escherichia coli crece en la presencia de Abu. El análisis de espectrométrico de masas muestra que aproximadamente 24% de las valinas se sustituye por Abu en cada posición de valina en la proteina natural . Al menos una limitación principal de los métodos descritos anteriormente es que se reemplazan todos los sitios que corresponden a un aminoácido natural particular a través de toda la proteína. Puede también variar el grado de la incorporación del aminoácido natural o no natural - solamente en casos raros la sustitución cuantitativa puede lograrse ya que es difícil de consumir completamente el aminoácido natural semejante dentro de la célula. Otra limitación es que estas estrategias hacen difícil estudiar la proteína mutante en células vivientes, debido a que la incorporación de sitios múltiples de análogos con frecuencia da como resultado la toxicidad. Finalmente, este método es aplicable en general solamente para análogos estructurales cercanos de los aminoácidos comunes, de nuevo debido a que las sustituciones deben tolerarse en todos los sitios en el genoma .
La síntesis de fase sólida y los métodos semisintéticos han permitido también la síntesis de varias proteínas pequeñas que contienen nuevos aminoácidos. Por ejemplo, ver las siguientes publicaciones y referencias citadas en las mismas, que son como sigue: Crick, F.J.C., Barret , L. Brenner, S. Watts-Tobin, R. General nature of the genetic code for proteins {Naturaleza general del código genético para las proteínas) . Nature, 1227-1232 (1961) ; Hofmann, . , Bonn, H. Studies on polypeptides {Estudios sobre polipéptidos) . XXXVI . The effect of pyrazole-imidazole replacements on the S-protein activating potency of an S-peptide fragment, {El efecto del pirazol-imidazol reemplaza la potencia que activa la proteína S de un fragmento de péptido S) J.Am.Chem. , 5914-5919 (1966); Kaiser, E.T. Synthetic approaches to biologically active peptides and proteins including enzymes {Procedimientos sintéticos para péptidos y proteínas biológicamente activos incluyendo las enzimas), Acc . Chem.Res . , 47-54 (1989); Nakatsuka, T . , Sasaki, T., Kaiser, E.T. Peptide segment coupling catalysed by the semisynthetic enzyme thiosubtilisin {Acoplamiento de segmento péptido catalizado por la enzima semisintética de tiosubtilisina) , J.Am.Chem. Soc . , 3808-3810 (1987) ; Schnolzer, M., Kent, S.B.H. Constructing proteins by dovetailing unprotected synthetic peptides: backbone-engineered HIV protease {Construcción de proteínas al unir péptidos - - sintéticos no protegidos: proteasa de VIH diseñada en estructura), Science, 221-225 (1992); Chaiken, I.M. Se isynthetic peptides and proteins (Péptidos y proteínas se i intéticos) CRC Crit Rev Biochem, 255-301 (1981) ; Offord, R.E. Protein engineering by chemical means? (¿Diseño de proteína por medios químicos?) Protein Eng. , 151-157 (1987); y Jackson, D.Y., Burnier, J., Quan, C, Stanley, M. , Tom, J. , Wells, J.A. A Designed Peptide Ligase for Total Synthesis of Ribonuclease A with Unnatural Catalytic Residues, {Una Ligasa Péptida Diseñada para la Síntesis Total de Ribonucleasa A con Residuos catalíticos No Naturales) , Science , 243 (1994) . La modificación química ha sido utilizada para introducir una variedad de cadenas laterales no naturales, incluyendo los co-factores, etiquetas y oligonucleótidos de giro en las proteínas in vitro. Ver, e.g. , Corey, D.R., Schultz, P.G. Generation of a hybrid sequense-especific single-stranded deoxyribonuclease (Generación de una desoxiribonucleasa de monocatenaria específica de la secuencia híbrida), Science, 1401-1403 (1987); Kaiser, E.T., Lawrence D.S., Rokita, S.E. The chemical modification of enzymatic specificity {La modificación química de la especificidad enzimática) Rev Biochem. , 565-595 (1985) ; Kaiser, E.T., Lawrence, D.S. Chemical mutation of enzyme active sites (Mutación química de sitios activos de la enzima) Science, 505-511 (1984); Neet, K.E., Wancy A, - - Koshland, D.E. Properties of thiol-subtilisin, (Propiedades de la tiol-subtilisina) J Biol C em, 6392-6401 (1968) ; Polgar, L.B., M.L. A new enzyme containing a synthetically formed active site. Thiol-subtilisin (Una nueva enzima que contiene un sitio activo formado sintéticamente. Tiol-subtilisina) J.Am Chem Soc, 3153-3154 (1966) ; y Pollack, S.J., Nakayama, G. Schultz, P.G. Introduction of nucleophiles and spectroscopic probes into antibody combining sites (Introducción de nucleófilos y sondas espectroscópicas en sitios de combinación de anticuerpos) , Science 1038-1040 (1988) . Alternativamente, los métodos biosintéticos que emplean aminoacil-AR ts químicamente modificados se han utilizado para incorporar varias sondas biofísicas en proteínas sintetizadas in vitro. Ver, las siguientes publicaciones y referencias citadas en la presente: Brunner, J. .New Photolabeling and crosslinking methods (Nuevos métodos de fotoetiquetado y entrecruzamiento) Annu.Rev Biochem, 483-514 (1993); y Krieg, U.C., Walter, P., Hohnson, A.E. Photocrosslinking of the signal seqúense of nascent preprolactin of the 54-kilodalton polypeptide of the signal recognition partióle (Fotoentrecruzamiento de la secuencia de señal de preprolactina naciente del polipéptido de 54 kilodaltons de la partículas de reconocimiento de señal) , Proc.Natl .Acad.Sci, 8604-8608 (1986).
- Previamente, se ha mostrado que los aminoácidos no naturales pueden estar incorporados específicamente en el sitio en las proteínas in vi tro mediante la adición de ARNts supresor químicamente aminoacilado para las reacciones de síntesis de la proteína programadas con un gen que contiene una mutación sin sentido del ámbar deseado. Utilizando estos procedimientos, pueden sustituirse varios de los veinte aminoácidos comunes con homólogos estructurales cercanos, e.g., fluorofenilalanina por fenilalanina, utilizando cepas auxotrópicas para un aminoácido particular. Ver, e.g., Noren, C.J., Anthony-Cahill , Griffith, M.C., Schultz, P.G. A general method for site-specific incorporation of unnatural amino acids into proteins (Un método general para la incorporación de sitio específico de los aminoácidos no naturales en las proteínas), Science, 244: 182-188 (1989); M.W. Nowak et al., Science, 268: 439-42 (1995); Bain, J.D., Glabe, C.G., Dix, T.A., Chamberlin, A.R., Diala, E.S. Biosynthetic site-specific Incorporation of a non-natural amino acid into a polypeptide [Incorporación en sitio específico biosintético de un aminoácido no natural en un polipéptido) , J.Am Chem Soc, 111:8013-8014 (1989); N. Budisa et al., FASEB J. 13:41-51 (1999); Ellman, J.A., endel, D., Anthony-Cahill, S., Noren, C.J., Schultz, P.G. Biosynthetic method for introducing unnatural amino acids site-specifically into proteins (Método biosintético para - - introducir aminoácidos no naturales de manera específica en el sitio en proteínas) , ethods in Enz . , 301-336 (1992) ; y Mendel, D., Cornish, V.W. & Schultz, P.G. Site-Directed Mutagenesis with an Expanded Genetic Code {Mutagénesis Dirigida al Sitio con un Código Genético Expandido) , Annu ev Biophys. Biomol Struct. 24, 435-62 (1995) . Por ejemplo, se preparó un ARNt supresor que reconoció el codón de terminación UAG y se aminoaciló químicamente con un aminoácido no natural. La mutagénesis convencional dirigida al sitio se utilizó para introducir el codón de terminación TAG, en el sitio de interés en el gen de la proteína. Ver, e.g. , Sayers, J.R., Schmidt, W. Eckstein, F. 5 ' ,3' Exonuclease in phosphorothioate-based oligonucleotide-directed mutagenesis (Exonucleasa en la rautagrénesis dirigida al oligonucleótido en base a fosforotioato) , Nucleic Acid Res, 791-802 (19'88) . Cuando el AR t supresor acilado y el gen mutante se combinaron en un sistema de transcripción-traducción in vi tro, los aminoácidos no naturales se incorporaron en respuesta al codón UAG que dio una proteína que contiene aquel aminoácido en la posición especificada. Los experimentos utilizando [3H] -Phe y los experimentos con ácidos a-hidroxi demostraron que solamente los aminoácidos deseados se incorporaron en la posición especificada por el codón UAG y que este aminoácido no se incorporó en cualquier otro sitio en la proteína. Ver, e.g., - - Noren et al., supra; y Ellman, J.A. , Mendel, D . , Schultz, P.G. Slte-speciflc incorporation of novel backbone structures ínto proteins (Incorporación específica de sitio de nuevas estructuras principales en las proteínas) , Science, 197-200 (1992) . En general, estos procedimientos in vitro se limitan por las dificultades en lograr la incorporación especifica de sitio de los aminoácidos, mediante el requerimiento de que los aminoácidos son derivados simples de los veinte aminoácidos comunes o problemas inherentes en la síntesis de proteínas grandes o fragmentos de péptido. También se han utilizado técnicas de microinyección que incorporan aminoácidos no naturales en las proteínas . Ver, e.g., M.W. Nowak, P.C. Kearney, J.R. Sampson, M.E. Saks, C.G. Labarca, S.K. Silverman, W.G. Zhong, J. Thorson, J.N. Abelson, N. Davidson, P.G. Schultz, D.A. Dougherty y H.A. Lester, Science, 268:439 (1995); y D.A. Dougherty, Curr. Opin. Chem. Biol . , 4:645 (2000). Un ovocito Xenopus se co-inyectó con dos especies de AKN elaboradas in vitro; un ARNm que codifica para la proteína objetivo con un codón de terminación UAG en la posición del aminoácido de interés y un AR t supresor de ámbar aminoacilado con el aminoácido no natural deseado. La maquinaria de traducción del ovocito inserta entonces el aminoácido no natural en la posición especificada por UAG. Este método ha permitido los estudios - - de función de estructura in vivo de proteínas de membrana integrales, que generalmente no son tratables en sistemas de expresión in vitro. Los ejemplos incluyen la incorporación de un aminoácido fluorescente en un receptor de taquicinina neurocinina-2 para medir las distancias mediante transferir energía de resonancia de fluorescencia, ver, e.g. , G. Turcatti, K. Nemeth, M.D. Edgerton, U. Meseth, F. Talabot, M. Peitsch, J. Knowles, H. Vogel y A. Chollet, J.Biol .Chem. , 271:19991 (1996); la incorporación de aminoácidos biotinilados para identificar residuos expuestos a la superficie en canales de ion, ver, e.g., J.P. Gallivan, H.A. Lester y D.A. Dougherty, Chem.Biol . , 4:739 (1997); el uso de análogos de tirosina fijados para monitorear cambios conformacionales en un canal de ión en tiempo real, ver, e.g. , J.C. Miller, S. . Silverman, P.M. England, D.A. Dougherty y H.A. Lester, Neuron, 20:619 (1998); y el uso de aminoácidos alfa hidroxi para cambiar las estructuras del canal de ión para probar sus mecanismos de activación periódica. Ver, e.g., P.M. England y Zhang, D.A. Dougherty y H. A. Lester, Cell, 96:89 (1999); y T. Lu, A.Y. Ting, J. Mainland, L.Y. Jan, P.G. Schultz y J. Yang, Nat .Neurosci . , 4:239 (2001) . Sin embargo, existen limitaciones del método de microinyección, e.g., el ARNt supresor tiene que ser químicamente aminocilado con el aminoácido no natural in vitro y el ARNt acilado se consume como un reactivo estequiométrico durante la traducción y no puede regenerarse . Esta limitación da como resultado pobre eficiencia de supresión y rendimientos bajos de la proteína, necesitando técnicas altamente sensibles para analizar la proteína mutante tales como las mediciones electrofisiológicas . Además, este método solamente es aplicable a células que pueden microinyectarse . La capacidad para incorporar aminoácidos no naturales directamente en las proteínas ín vivo ofrece las ventajas de rendimientos altos de proteínas mutantes, la facilidad técnica, el potencial para estudiar las proteínas mutantes en células o posiblemente en organismos vivos y el uso de estas proteínas mutantes en tratamientos terapéuticos. La capacidad para incluir aminoácidos no naturales con varios tamaños, acideces, nucleofilicidades, hidrofobicidades y otras propiedades en las proteínas pueden expandir grandemente nuestra capacidad para manipular racional y sistemáticamente las estructuras de las proteínas, tanto para probar la función de la proteína como para crear nuevas proteínas u organismos con propiedades nuevas. Sin embargo, el proceso es difícil, debido a la naturaleza compleja de las interacciones de ARNt-sintetasa que se requieren para lograr un alto grado de fidelidad en la traducción de la proteína. En un intento por incorporar de manera específica - en el sitio el para-F-Phe, se utilizó el par supresor de ámbar de levadura ARNtPheCUA/fenilalanil-ARNt sintetasa en una cepa de Escherichia coli auxotrófica Phe resistente a p-F-P e. Ver, e.g., R. Furter, Protein Sci . , 7:419 (1998). Debido a que la levadura PiieRS no tiene alta especificidad de sustrato para p-F-Phe, el sitio de mutagénesis se tradujo con solamente 64-75% de p-F-Phe y el restante como el Phe y Lys aún en el exceso de p-F-Phe se agregó al medio de crecimiento. Además, en las posiciones del codón Phe, se encontró p-F-Phe al 7%, indicando que los PheRS de Escherichia coli endógenos incorpora . -F-Phe además de Phe. Además de su infidelidad de traducción, e.g., el ARNt supresor y el PheRS no son verdaderamente ortogonales, este procedimiento no es generalmente aplicable a otros aminoácidos no naturales . Mediante esto, son necesarias las mejoras para el proceso para proporcionar métodos más eficientes y efectivos para alterar la maquinaria biosintética de la célula. La presente invención se dirige a estas y otras necesidades, como será aparente en la revisión de la siguiente descripción. SUMARIO DE LA INVENCIÓN La presente invención proporciona una variedad de métodos para elaborar y utilizar sistemas de traducción que pueden incorporar aminoácidos no naturales en las proteínas, - - así como composiciones relacionadas . Las proteínas que comprenden aminoácidos no naturales elaboradas por el sistema de traducción también son una característica de la invención. Tanto los aminoácidos no naturales conocidos como los nuevos pueden incorporarse en las proteínas utilizando el sistema de traducción de la invención. La invención proporciona además nuevos aminoácidos no naturales; varias composiciones que incluyen los aminoácidos no naturales, e.g., proteínas y células que incluyen aminoácidos no naturales; métodos químicos y biosintéticos para producir aminoácidos no naturales; y métodos para producción y composiciones que comprenden una célula autónoma de veintiún aminoácidos . Así, en un aspecto, la presente invención se proporcionan composiciones que comprenden un sistema de traducción. El sistema de traducción comprende un AR t ortogonal (O-ARNt) y una aminoacil ARNt sintetasa ortogonal (O-RS) . Típicamente, el O-RS preferentemente aminoacila el O-ARNt con al menos un aminoácido no natural en el sistema de traducción y el O-ARNt reconoce al menos un codón selector. El sistema de traducción inserta así el aminoácido no natural en una proteína producida en el sistema, en respuesta a un codón selector codificado. Los sistemas de traducción típicos incluyen células, tales como células bacteriales (e.g., Escherichia coli, células arqueobacteriales , células eucarióticas (e.g., células de levadura, células de mamífero, células de plantas, células de Insectos) o lo similar. Alternativamente, el sistema de traducción comprende un sistema de traducción in vi ro, e.g., un extracto de traducción que incluye un extracto celular. Ejemplos de O-ARNts comprenden un ácido nucleico que comprende una secuencia de polinucleotidos seleccionada del grupo que consiste de: SEQ ID NO: 1-3 y/o una secuencia de polinucleótidos complementaria de la misma. De manera similar, ejemplos de O-RS incluyen polipeptidos seleccionados del grupo que consiste de: un polipeptido que comprende una secuencia de aminoácidos seleccionada del grupo que consiste de SEQ ID NO: 35-66 y un polipéptido codificado por un ácido nucleico que comprende una secuencia de polinucleótidos seleccionada del grupo que consiste de: SEQ ID NO: 4-34 y una secuencia de polinucleótidos complementaria de la misma. Ejemplos de aminoácidos no naturales que pueden utilizarse por el sistema de traducción incluyen: un análogo no natural de un aminoácido de tirosina; un análogo no natural de un aminoácido de glutamina; un análogo no natural de un aminoácido de fenilalanina; un análogo no natural de un aminoácido de serina; un análogo no natural de un aminoácido de treonina; un alquilo, arilo, acilo, azido, ciano, halo, hidrazina, hidrazida, hidroxilo, alquenilo, alquinilo, éter, tiol, sulfonilo, seleno, éster, tioácido, borato, boronato, - - fosfo, fosfono, fosfina, heterociclico, enona, imina, aldehido, hidroxilamina, ceto o ácido amino amino-sustituído o cualquier combinación de los mismos; un aminoácido con un reticulador fotoactivable; un aminoácido etiquetado en giro; un aminoácido fluorescente; un aminoácido con un nuevo grupo funcional ; un aminoácido que interactúa covalente o no covalentemente con otra molécula; un aminoácido que se une al metal; un aminoácido que contiene metal; un aminoácido radioactivo; un aminoácido fotoconfinado y/o fotoisomerizable; un aminoácido que contiene biotina o análogo de biotina; un aminoácido glicosilado o modificado por carbohidrato; un aminoácido que contiene ceto; aminoácidos que comprenden polietilen glicol o poliéter; un aminoácido sustituido de átomo pesado; un aminoácido químicamente desdoblable o fotodesdoblable; un aminoácido con una cadena lateral alargada; un aminoácido que contiene un grupo tóxico; un aminoácido sustituido de azúcar, e.g., una serina sustituida de azúcar o lo similar; un aminoácido que contiene azúcar enlazado a carbono; un aminoácido activo redox; un ácido que contiene a-hidroxi; un aminoácido que contiene un ácido amino tio; un aminoácido , disustituído; un ácido ß-amino; y un aminoácido cíclico diferente a prolina. Por ejemplo, el aminoácido no natural puede ser una O-metil-L-tirosina, una L-3 - (2-naftil) alanina, una 3-metil- - - fenilalanina, una ?-4-alil-L-tirosina, una 4-propil-L-tirosina, una tri-0-acetil-GlcNAc -serina, una L-Dopa, una fenilalanina fluorinada, una isopropil-L-fenilalanina, una p-azido-L-fenilalanina, una p-acil-L-fenilalanina, una p-benzoil-L-fenilalanina, una L-fosfoserina, una fosfonoserina, una fosfonotirosina, una p-yodofenilalanina, una p-bromofenilalanina, una p-amino-L-fenilalanina y una isopropil-L-fenilalanina, en una modalidad, el al menos un aminoácido no natural es una O-metil-L-tirosina . En una modalidad e emplificativa específica, el al menos un aminoácido no natural es una L-3- (2-naftil) alanina. En otro conjunto de ejemplos específicos, el al menos un aminoácido no natural es un análogo de fenilalanina que contiene amino-, isopropilo- u 0-alilo. Puede utilizarse cualquiera de una variedad de codones selectores en la presente invención, incluyendo codones sin sentido, codones raros, codones de cuatro (o más) bases o lo similar. Por ejemplo, en una modalidad, el al menos un codón selector es un codón ámbar.
Se proporciona en la presente una variedad de sistemas de traducción ejemplificativos, incluyendo e.g., una célula de Escherichia coli que comprende un A Ntm^ y un TyrRS mutante (LWJ16) , en donde el TyrRS mutante (LWJI6) preferentemente aminoacila el ARNtmT CyUAr con O-metil-L-tirosina en la célula yJ la célula utiliza el A tmCUA para reconocer un codón ámbar. En otro ejemplo, se proporciona una célula de Escherichia coli que comprende un ARNtm^ y un SS12- TyrRS, en donde el SS12-TyrRS preferentemente aminoacila el ARNtmTyr con L-3- (2 -naftil) alanina en la célula y la célula utiliza el ARNtmTyr para reconocer un codón ámbar. COA c El sistema de traducción de la presente proporciona la capacidad para sintetizar las proteínas que comprenden aminoácidos no naturales en cantidades útilmente grandes . Por ejemplo, las proteínas que comprenden al menos un aminoácido no natural pueden producirse a una concentración de al menos aproximadamente 10, 50, 100 o más microgramos por litro, e.g., en una composición que comprende un extracto celular, un amortiguador, un excipiente farmacéuticamente aceptable y/o lo similar. Otro aspecto de la presente invención proporciona la producción de proteínas que son homologas a cualquier proteína disponible, pero que comprenden uno o más homólogos de aminoácidos no naturales. Por ejemplo, las proteínas terapéuticas pueden elaborarse para comprender uno o más aminoácidos no naturales y son homologas a una o más proteína terapéutica. Por ejemplo, en un aspecto, la proteína es homologa a una proteína terapéutica u otra tal como: una citosina, un factor de crecimiento, un receptor del factor de - - crecimiento, un interferón, una interleucina, una molécula inflamatoria, un producto de oncogen, una hormona de péptido, una molécula de transducción de señal, un receptor de la hormona esferoide, un activador transcripcional , un supresor transcripcional, eritropoyetina (EPO) , insulina, hormona del crecimiento humano, Péptido-78 que Activa el Neutrófilo epitelial, GROot/MGSA, GROp, GROy, ???-?a, ???-?d, MCP-1, factor de crecimiento de hepatocitos, factor de crecimiento similar a la insulina, factor inhibidor de la leucemia, oncostatina M, PD-ECSF, PDGF, pleiotropina, SCF, ligando de c-kit, VEGEF, G-CSF, IL-1, IL-2, IL-8, IGF-I, IGF-II, FGF (factor de crecimiento de fibroblastos) , PDGF, TNF, TGF-a, TGF-ß, EGF (factor de crecimiento epidérmico) , GF (factor de crecimiento de queratinocitos) , SCF/c-kit, CD40L/CD40, VLA-4/VCAM-l, ICAM-l/LFA-1, hyalurin/CD44 , Mos, Ras, Raf, Met; p53, Tat, Fos, Myc, Jun, Myb, Reí, receptor de estrógenos, receptor de progesterona, receptor de testosterona, receptor de aldoesterona, Receptor LDL y/o corticosterona . En otro conjunto de modalidades, la proteina es homologa a una proteína terapéutica u otra tal como: una Antitripsina Alfa-1, una Angiostatina, un Factor antihemolxtico, un anticuerpo, una Apolipoproteína, una Apoproteína, un Factor natriurético atrial, un Polipéptido natriurético atrial, un Péptido atrial, una quimosina C-X-C, T39765, NAP-2, ENA-78, un Gro-a, un Gro-b, un Gro-c, un IP-10, un GCP-2, un NAP-4, un SDF-1, - - un PF4, un MIG, una Calcitonina, un ligando de c-kit, una citosina, una quimosina CC, una Proteína-1 quimoatrayente de monocitos, una Proteína-2 quimoatrayente de monocitos, una Proteína-3 quimoatrayente de monocitos, una Proteína-1 alfa inflamatoria de monocitos, una Proteína-1 beta inflamatoria de monocitos, RAMTES, 1309, R83915, R91733, HCC1, T58847, D31065, T64262, un CD40, un ligando CD40, un ligando de c-kit, un Colágeno, un factor de estimulación de Colonia (CSF) , un factor 5a del Complemento, un inhibidor del Complemento, un receptor 1 del Complemento, una citosina, un Péptido-78 que Activa el Neutrofilo Epitelial, un GROa/MGSA, un GRC> , un GROy, un MIEP-la, un ???-?d, un MCP-1, un Factor de Crecimiento Epidérmico (EGF) , un Péptido que Activa el Neutrofilo Epitelial, una Eritropoyetina (EPO) , una Toxina exfoliante, un Factor IX, un Factor VII, un Factor VIII, un Factor X, un Factor de Crecimiento de Fibroblastos (FGF) , un Fibrinógeno, una Fibronectina, un G-CSF, un GM-CSF, una Glucocerebrosidasa, una Gonadotropina, un factor de crecimiento, un receptor del factor de crecimiento, una proteína Hedgehog, una Hemoglobina, un Factor de crecimiento de hepatocitos (HGF) , una Hirudina, una albúmina de suero humano, un ICAM-1, un receptor ICAM-1, un LFA-1, un receptor de LFA-1, una Insulina, un Factor de crecimiento similar a la Insulina (IGF), un IGF-1, un IGF-II, un interferón, un IFN-a, un IFN-ß, un IFN-?, una interleucina, un IL-1, un IL-2, un - IL-3, un IL-4, un IL-5, un IL-6, un IL-7, un IL-8, un IL-9, un IL-10, un IL-11, un IL-12, un Factor de crecimiento de queratinocitos (KGF) , una Lactoferrina, un factor inhibidor de la leucemia, una Luciferasa, una Neurturina, un Factor inhibidor de neutrófilos (NIF) , una oncostatina M, una Proteína osteogénica, un producto de oncogen, una Hormona paratiroidea, un PD-ECSF, un PDGF, una hormona de péptido, una Hormona del Crecimiento Humano, una Pleiotropina, una Proteína A, una Proteína G, las Exotoxinas pirogénicas A, B o C, una Relaxina, una Renina, un SCF, un Receptor I soluble del complemento, un I-CAM 1 soluble, unos Receptores solubles de interleucina, un Receptor soluble TNF, una Somatomedina, una Somatostatina, una Somatotropina, una Streptocinasa, unos Superantígenos, unas Enterotoxinas estafilococales , un SEA, un SEB, un SEC1, un SEC2, un SEC3, un SED, un SEE, un receptor de la hormona esteroide, una Superóxido dismutasa, una Toxina del síndrome de choque toxico, una Timosina alfa 1, un Activador plasminógeno de tejido, un factor de crecimiento tumoral (TGF) , un TGF-oc, un TGF-ß, un Factor de Necrosis Tumoral, un Factor Alfa de Necrosis Tumoral, un Factor Beta de Necrosis Tumoral, un receptor del Factor de Necrosis Tumoral (TNFR) , una proteína VLA-4, una proteína VCAM-1, un Factor de Crecimiento Endotelial Vascular (VEGEF) , una Urocinasa, un Mos, un Ras, un Raf, un Met; un p53, un Tat, un Fos, un yc, un Jun, un Myb, un Reí, un receptor de estrógenos, un receptor de progesterona, un receptor de testosterona, un receptor de aldoesterona, un Receptor LDL y/o una corticosteron . En un aspecto, las composiciones en la presente comprenden una proteína que comprende un aminoácido no natural y un excipiente farmacéuticamente aceptable, incluyendo, e.g., cualquiera de las proteínas anotadas anteriormente y un excipiente farmacéuticamente aceptable . La homología en el polipéptido puede inferirse al llevar a cabo un alineamiento de secuencia, e.g., utilizando BLASTN o BLASTP, e.g., establecidos para parámetros predeterminados. Por ejemplo, en una modalidad, la proteína es de al menos aproximadamente 50%, al menos aproximadamente 75%, al menos aproximadamente 80%, al menos aproximadamente 90% o al menos aproximadamente 95% idéntica a una proteína terapéutica conocida (e.g., una proteína presente en el Genebank u otras bases de datos disponibles) . Por e emplo, en una modalidad preferida, la proteína terapéutica es eri ropoyetina (EPO) . La proteína de interés puede contener 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 o más aminoácidos no naturales . Los aminoácidos no naturales pueden ser los mismos o diferentes, e.g., pueden ser 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 o más sitios diferentes en la proteína que comprende 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 o más aminoácidos no naturales diferentes. Por ejemplo, en una modalidad, la proteína es DHFR y el al menos un aminoácido no natural se selecciona a partir del grupo que consiste de O-metil-L-tirosina y L-3- (2-naftil) alanina . La presente invención también proporciona los métodos para producir al menos una proteína en un sistema de traducción tal como la al menos una protelna que comprende al menos un aminoácido no natural. En los métodos, el sistema de traducción se proporciona con al menos un ácido nucleico que comprende al menos un codón selector, en donde el ácido nucleico codifica la al menos una proteína. También se proporciona el sistema de traducción con un ARNt ortogonal (O-ARNt) , que funciona en el sistema de traducción y reconoce el al menos un codón selector y una aminoacil ARNt sintetasa ortogonal (O-RS) , que preferentemente aminoacila el O-ARNt con el al menos un aminoácido no natural en el sistema de traducción. También se proporciona el sistema de traducción con el al menos un aminoácido no natural , produciendo así , en el sistema de traducción, la al menos una protelna que comprende el al menos un aminoácido no natural . Todas las características estructurales anteriores de las composiciones pueden incorporarse en los métodos, e.g., tipos de sistemas de traducción (e.g., células, extractos celulares, etc.), tipos de proteínas producidas en el sistema de traducción (e.g., homólogos de EPO y las otras - - proteínas anotadas en la presente) proteínas imitantes específicas, aminoácidos no naturales específicos y lo similar. En un aspecto, la(s) proteína (s) que comprenden Aminoácidos no naturales que se producen, se procesan y se modifican en una forma dependiente de la célula. Esto proporciona la producción de proteínas que establemente se duplican, glicosilan o de otro modo modifican por la célula. El . aminoácido no natural se proporciona opcionalmente de forma exógena al sistema de traducción. Alternativamente, e.g., en donde el sistema de traducción es una célula, el aminoácido no natural puede biosintetizarse por el sistema de traducción.
En una modalidad ej emplificativa específica, la invención proporciona los métodos para producir en una célula de Escherichia coll al menos una protelna que comprende al menos una O-metil-L-tirosina . El método incluye proporcionar el sistema de traducción con al menos un ácido nucleico que comprende un codón ámbar, en donde el ácido nucleico codifica la al menos una proteína; proporciona el sistema de traducción con un AR tm en donde el ARNtm funciona en la CUA CUA célula y en donde el ARNtmTyr reconoce el codón ámbar; CUA proporcionando el sistema de traducción con un TyrRS mutante (LWJ16) , en donde el TyrRS mutante (LWJ16) aminoacila el AR tmTyr con la O-metil-L-tirosina en la célula; y Cua proporciona la célula con la O-metil-L-tirosina, produciendo mediante esto en la célula al menos una proteina que comprende la O-metil-L-tirosina . En otra modalidad ejemplificativa, la invención proporciona un método para producir en una célula de Escherichia coli al menos una proteína que comprende al menos una L-3- (2-naftil) alanina. En esta modalidad ejemplificativa, el método incluye: proporcionar el sistema de traducción con al menos un ácido nucleico que comprende un codón ámbar, en donde el ácido nucleico codifica la al menos una proteína; eproporcionar la célula con un ARNtmTCYUAr , en donde el AR tmTCyUAr funciona en la célula y ¦* en donde el AR tmTCyUAr reconoce el codón ámbar; proporcionar la célula con un SS12-TyrRS, en donde el SS12-Ty JrRS aminoacila el ARNtmTCyUAr con la L-3- (2-naftil) alanina en la célula; y proporcionar la célula con la L-3- (2 -naftil) alanina, produciendo mediante esto en la célula al menos una proteína que comprende la L-3- (2-naftil) alanina.
En otro aspecto, la presente invención proporciona aminoácidos no naturales, e.g., análogos de fenilalanina meta sustituidos, tales como 3-acetil-fenilalanina y 3-metoxi fenilalanina; análogos de tirosina, tales como 4-alil tirosina; aminoácidos glicosilados y lo similar. También se proporcionan varias composiciones que comprenden aminoácidos no naturales, e.g., proteínas y células que comprenden los aminoácidos no naturales de la invención. Por ejemplo, se proporcionan las composiciones que comprenden un aminoácido no natural y un AR t ortogonal, e.g., unidos covalentemente . También se proporcionan composiciones que comprenden aminoácidos no naturales y una aminoacil ARNt sintetasa ortogonal, e.g., unida a hidrógeno. En otro aspecto, la presente invención proporciona los métodos para sintetizar aminoácidos. Por ejemplo, la 4-alil-L-tirosina, se sintetiza típicamente al reaccionar una tirosina protegida con bromuro de alilo, e.g., en la presencia de hidruro de sodio y DNF y desproteger para producir 4-alil-L-tirosina . Típicamente se utiliza una tirosina protegida de NBoc o Fmoc, e.g., con una desprotección acídica, e.g., en la presencia de ácido clorhídrico y dioxano. El producto final se extrae opcionalmente, e.g., con etanol o dielorómetano . Los análogos de fenilalanina meta-sustituidos se sintetizan típicamente al condensar dietilacetamidomalonato y un bromuro de bencilo meta-sustituido. El producto de la condensación se hidroliza típicamente entonces para producir el análogo de fenilalanina meta-sustituido, e.g., un ceto, acetilo o fenilalanina metoxi sustituida tales como 3-metoxi-fenilalanina o 3 -acetil-fenilalanina . El bromuro de bencilo meta sustituido deseado se sintetiza opcionalmente al reaccionar N-bromosuccinimida (NBS) con 3-metilacetofenona para producir un producto bromxnado y cristalizar el producto brom nado en una solución de hexano. La cristalización produce un producto de monobromuro como opuesto a una mezcla - - de un monobromuro y un dibromuro. En otro aspecto, la presente invención proporciona métodos biosintétícos para producir aminoácidos no naturales . Por ejemplo, los aminoácidos glicosilados se encuentran opcionalmente sintetizados in vivo, e.g., al transformar una célula con un plásmido que comprende un gen para una N-acetil-galactosaminidasa, una transglicosilasa o una serina-glicosilhidrolasa . La célula produce entonces el aminoácido glicosilado deseado, e.g. a partir de fuentes celulares. En otro ejemplo, se sintetiza la p-aminofenilalanina, e.g., in vivo, mediante convertir enzimáticamente corismato a un ácido 4-amino-4-desoxicorismico; que se convierte enzimáticamente a ácido 4-amino-4-desoxiprefénico; y convertir enzimáticamente el ácido 4-amino-4-desoxiprefénico a ácido p-aminofenil-pirúvico, que se convierte enzimáticamente a p-aminofenilalanina . Las conversiones enzimáticas se llevan a cabo típicamente utilizando una 4-amino-4-desoxicorismato sintasa, e.g., PapA, una corismato mutasa, e.g., Pap B y una prefenato deshidrogenasa, e.g., PapC, respectivamente. La etapa final se lleva a cabo típicamente al poner en contacto el ácido p-aminofenil-pirúvico con una aminotransferasa, e.g., una aminotransferasa de tirosina no específica, e.g., derivada de E coli. Las aminotransferasas de uso en la presente invención incluyen, pero no se limitan a, tyrB, aspS o ilvE. Típicamente las etapas anteriores se llevan a cabo - - in vivo, e.g., al transformar una célula con un plásmido que comprende los genes que codifican las enzimas utilizadas para la síntesis. En otro aspecto, La presente invención proporciona un método para producir p-aminofenilalanina en una célula de Escherichia coli. El método . típicamente comprende transformar la célula con un plásmido que comprende papA, papB y papC, en donde la célula comprende corismato y una aminotransferasa . La expresión de papA, papB y papC da como resultado una sintasa, una mutasa y una deshidrogenasa, en donde estas enzimas junto con la aminotransferasa producen p-fenilalanina a partir de corismato. En otro aspecto, la presente invención proporciona una célula de veintiún aminoácidos (o más) autónomos. La célula, e.g., una célula bacterial, típicamente comprende un sistema de trayectoria biosintética para producir un aminoácido no natural, e.g., p-aminofenilalanina, a partir de una o más fuentes de carbono dentro de la célula, e.g., corismato y un sistema de traducción que comprende un AR t ortogonal (O-ARNt) y una aminoacil ARNt sintetasa ortogonal (O-RS) . La O-RS preferentemente aminoacila el O-ARNt con el aminoácido no natural y el O-ARNt incorpora el aminoácido no natural en una proteína en respuesta a un codón selector, e.g., un codón sin sentido tal como TAG, un codón de cuatro bases o un codón ámbar. La célula puede comprender más de un - - aminoácido no natural, e.g. 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 o más aminoácidos no naturales opcionalmente con más de un ARNt ortogonal (e.g. uno por aminoácido no natural para proporcionar la incorporación de sitio específico de cada aminoácido no natural en una proteína o más o menos, para ajustar la especificidad de la incorporación del aminoácido no natural) y/o más de una aminoacil ARNt sintetasa ortogonal (O-RS) (e.g. una por ARNt ortogonal o más o menos para ajustar la especificidad de la incorporación del aminoácido no natural) . En algunas modalidades, los sistemas de trayectoria biosintética producen una cantidad celular natural del aminoácido no natural, e.g., la célula produce el aminoácido no natural en una cantidad suficiente para la bioslnteisis de la proteina, cuya cantidad no altera sustancialmente la concentración de aminoácidos naturales o agota sustancialmente los recursos celulares en la producción de aminoácidos no naturales . En una clase de modalidades e emplificativas, la célula autónoma se diseña para producir p-aminofenilalanina a partir de corismato como se describió anteriormente. En esta modalidad, la célula se diseña para producir las enzimas deseadas como se describió anteriormente, e.g., una sintasa, una deshidrogenasa y una mutasa derivada a partir de Streptomyces Venezuelae o Streptomyces pristinaespiralis y una aminotransferasa derivada a partir de E. coli . Por ejemplo, las células de la invención se transforman opcionalmente con un plásmido, e.g., pSClOl de bajo número de copias derivado del plásmido, que comprende papA, papB y papC, en donde el plásmido comprende además un promotor Ipp y un promotor lac. En algunas modalidades, el plásmido comprende además uno o más sitios de unión a ribosoma. Otros aminoácidos no naturales que se producen opcionalmente por las células de la invención incluyen, pero no se limitan a, dopa, O-metil-L-tirosina, aminoácidos glicosilados, aminoácidos pegilados, otros aminoácidos no naturales anotados en la presente y lo similar. En otro aspecto relacionado, la presente invención proporciona una célula que comprende uno o más sistemas para producir al menos veintiún aminoácidos e incorporar específicamente uno o más de los aminoácidos en una o más proteínas dentro de la célula, en donde al menos uno de los aminoácidos incorporados comprende un aminoácido no natural . En otro aspecto, la presente invención proporciona un método para identificar una ventaja proporcionada por un aminoácido no natural que se ha incorporado en una o más proteínas de una célula. El método típicamente comprende proporcionar una biblioteca de células, cada una de tales células comprende un plásmido aleatorizado, e.g., derivado a partir de un genoma de E. coli. Uno o más de los plásmidos - - aleatorizados típicamente confiere en las células una capacidad para incorporar un aminoácido no natural en una proteína. La biblioteca de células se clasifica entonces para identificar células con crecimiento mejorado, e.g., en comparación con una célula de E. coli natural, indetificando mediante esto una ventaja proporcionada por el aminoácido no natural. En algunas modalidades, se utiliza una segunda detección para verificar adicionalmente que cualquier ventaja identificada se deba al aminoácido no natural . Los equipos son una característica adicional de la invención. Por ejemplo, los equipos pueden incluir uno o más sistemas de traducción como los anotados anteriormente (e.g., una célula, una células de 21 o más aminoácidos, etc.) uno o más aminoácidos no naturales, e.g., con material de empaque apropiado, contenedores para sostener los componentes del equipo, materiales de instrucción para practicar los métodos en la presente y/o lo similar. Similarmente, los productos del sistema de traducción (e.g., proteínas tales como análogos de EPO que comprenden aminoácidos no naturales) pueden proporcionarse en la forma de equipo, e.g., con contenedores para sostener los componentes del equipo, materiales de instrucción para practicar los métodos en la presente y/o lo similar. BREVE DESCRIPCIÓN DE LAS FIGURAS La Figura 1 es una vista estereoscópica de los - - residuos de aminoácido en el sitio activo de Tyr S (modificado por P. Brick, T. N. Bhat, D. M. Blow, J.Mol .Biol . 208, 83-98 (1988)). Se muestran en la figura, los residuos de TyrRS de B. stearothermophilus. La Figura 2 ilustra la acumulación de la proteína de DHFR de E. coli, tanto tipo silvestre (peso) como mutante bajo diferentes condiciones. Las condiciones de expresión se anotan en la parte superior de cada zona entre líneas. La zona entre líneas izquierda es el marcador del peso molecular. La Figura 2A es un gel SDS-PAGE teñido con plata del DHFR purificado. La Figura 2B es una inmunotransferencia Western del gel en la Figura 2A. La Figura 3 es un espectro de masa en tándem de un péptido terminal H2 de DHFR, MIY*MIAALAVDR. La secuencia parcial Y*MIAALAVDR del péptido que contiene el residuo de O-metil-L-tirosina (?*) puede leerse a partir de las series de iones b o y anotadas . La Figura 4 ilustra la acumulación de la proteína DHFR de ratón, tanto tipo silvestre (peso) como mutante, bajo diferentes condiciones . Las condiciones de expresión se anotan en la parte superior de cada zona entre líneas. La zona entre líneas izquierda es el marcador del peso molecular. La Figura 4? es un gel SDS-PAGE teñido con plata del DHFR purificado. La Figura 4B es una inmunotransferencia Western del gel en la Figura 4?.
- - Figura 5 es un espectro de masas en tándem del péptido típico LLPEX*TGVLSEVQEEK (X* representa L-3- (2-naftil) -alanina) . La secuencia puede leerse a partir de las series de iones b o y anotadas; aunque, no se observan b7 y ??3. El pico base 821.7 (100%) asignado al ion ?14 doblemente cargado se trunca por claridad. La Figura 6, Paneles A-D, ilustra las características del sistema informador de fluorescencia amplificable . La Figura 6A es pREP de plásmido. La transcripción de la polimerasa de ARN T7 se controla por el promotor ara; la expresión de la proteína depende de la supresión de los codones ámbar en diversas ubicaciones dentro del gen. La expresión de GFPuv se controla por la polimerasa de ARN T7. El pREP de plásmido es compatible para utilizarse con un plásmido de ColEl que expresa un par sintetasa ortogonal/ ARNt. La Figura 6B ilustra el mejoramiento de la composición y fluorescencia del gen de polimerasa ARN T7 construido dentro de pREP(l-12) . El número de construcción se indica a la izquierda de cada uno. Los mejoramientos de la fluorescencia, indicados a la derecha de cada construcción, se calculan como la proporción de la concentración celular corregida de la fluorescencia, como se midió fluorimétricamente, de células que contienen pREP(l-12) y pQ o pQD. Las posiciones de las mutaciones de ámbar dentro del - - gen se indican en la parte superior en cada construcción. La Figura 6C ilustra el análisis citométrico de células que contienen pREP(10} y ya sea pQD (en la parte superior) o pQ (en la parte inferior) . La Figura 6D ilustra los análisis fluorimétricos de células que contienen pREP(10) y varias expresiones de ARNts supresoras de E. coli. "Ninguno" indica que las células no contienen AR t supresor. La Figura 7, Paneles A-C, ilustra los componentes de un sistema informador de plásmidos de múltiples aplicaciones para dirigir la evolución de TyrRS de M. jannaschii . La Figura 7A ilustra los plásmidos pREP/YC-JYCUA. El pREP de plásmido/YC-JYCUA es compatible para utilizarse con el plásmido pBK y variantes. La Figura 7B ilustra las estructuras de aminoácidos no naturales utilizadas como objetivos para la evolución de TyrRS de M. jannaschii . La Figura 7C ilustra una estrategia para una evolución de una aminoacil ARNt sintetasa utilizando el pREP de plásmido/YC-JYCUA. Las células fluorescentes y no fluorescentes se muestran en negro y gris, respectivamente. La Figura 8, Paneles A-D, ilustra la actividad de la variante de sintetasa dominante a partir de cada experimento de evolución exitoso. La Figura 8A es una fotografía que ilustra la iluminación ultravioleta de longitud de onda larga de células que contienen pREP/YC-JYCUA y la variante de sintetasa indicada, desarrollada ya sea en la presencia (+) o ausencia (-) de los aminoácidos no naturales correspondientes. La Figura 8B ilustra un análisis fluorimétrico de células que contienen pREP/YC-JYCUA y la variante de sintetasa indicada, desarrollada en ya sea la presencia (izguíerda) o ausencia {derecha) del aminoácido no natural correspondiente . La Figura 8C es una tabla que ilustra un análisis CmICS0 de células que contienen pREP/YC-JYCUA y la variante de sintetasa indicada, desarrollada en ya sea la presencia o ausencia del aminoácido no natural correspondiente. La Figura 8D ilustra un análisis de expresión de proteina a partir de células que contienen pBAD/JYAMB-4TAG y la variante de sintetasa indicada, desarrollada en ya sea la presencia (+) o ausencia (-) del aminoácido no natural correspondiente . La Figura 9 ilustra las comparaciones de actividad de las variantes OAY-RS derivadas utilizando una detección en base a FACS negativa [OAY-RS (1,3,5)] o [OAY-RS (B) ] de selección en base a barnasa negativa. Las células que contienen pREP/YC-JYCUA y la variante de sintetasa indicada se desarrollaron en ya sea la presencia (bloque sólido, izquierda) o ausencia (bloque sólido, derecha) del aminoácido no natural correspondiente y se analizó fluorimétricamente . El aumento de fluorescencia (.barra, posterior) se calculó como la proporción corregida de la concentración celular de la fluorescencia de células que se desarrollaron en la presencia versus la ausencia del aminoácido no natural. La Figura 10 es una autoradiografxa de una inmunotransferencia Western que demuestra la expresión de DHFR incorporado de m- eO-Phe- y m-Acetil-Phe- . La Figura 11 ilustra el espectro de emisión de fluorescencia de la protelna etiquetada con fluoresceina hidrazida . La Figura 12 ilustra los aminoácidos no naturales para-azido-fenilalanina y para-benzol-fenilalanina . La Figura 13 ilustra un esquema químico para la síntesis de una fenilalanina alil-sustituída . La Figura 14 ilustra un esquema químico para la síntesis de fenilalaninas meta-sustituidas . La Figura 15 ilustra la biosíntesis de p-aminofenilalanina . El Panel A ilustra un plásmido utilizado para la biosíntesis de p-aminofenilalanina y el Panel B ilustra un esquema biosintético para la producción de p-aminofenilalanina a partir de corismato, e.g., utilzando el plásmido del Panel A. La Figura 16 ilustra una variedad de aminoácidos no naturales . La Figura 17 ilustra una variedad de aminoácidos no naturales . La Figura 18 ilustra una variedad de aminoácidos no naturales .
- - La Figura 19 ilustra aminoácidos adicionales, naturales y no naturales para la incorporación en las proteínas a través de la supresión in vivo. La Figura 20 proporciona un esquema biosintético para la producción de dopa. La Figura 21 ilustra un método para determinar las ventajas evolutivas en una célula debido a la capacidad para incorporar específicamente veintiún aminoácidos. La Figura 22 ilustra un método para la incorporación en sitio específico de aminoácidos no naturales . La Figura 23 ilustra la síntesis de varios análogos de glutamina. La Figura 24 ilustra la síntesis de un análogo de glutamina gamma-sustituido . La Figura 25 ilustra la síntesis de un derivado de glutamina cíclico. La Figura 26 ilustra una variedad de análogos de tirosina . La Figura 27 ilustra un esquema sintético para la producción de análogos de tirosina. La Figura 28 ilustra un esquema biosintético para producir aminoácidos glicosilados . La Figura 29 ilustra una variedad de aminoácidos no naturales, e.g. , como se utiliza en un estudio de absorción - - celular. Cualquiera o todas las figuras anteriores son de naturaleza esquemática. DESCRIPCIÓN DETALLADA EN GENERAL La presente invención proporciona composiciones y métodos para aumentar la maquinaria biosintética de la proteína de una célula para adaptar adicionalmente aminoácidos genéticamente codificados utilizando pares ortogonales de ARNt/aminoacil AR t sintetasa (0-AR t/O-RS) . Las composiciones y métodos descritos en la presente pueden utilizarse con aminoácidos no naturales, e.g. , proporcionando nueva propiedades espectroscópicas , químicas o estructurales para las proteínas utilizando cualquiera de un amplio arreglo de cadenas laterales. La invención es aplicable tanto para células procarióticas {e.g., Eubacteria, Arqueobacteria) como eucarióticas (e.g., levadura, mamífero, planta o insecto). Estas composiciones y métodos son útiles para la incorporación en sitio específico de aminoácidos no naturales a través de codones selectores, e.g., codones de terminación, codones de cuatro bases y lo similar. La invención también proporciona proteínas, incluyendo aminoácidos no naturales, producidas utilizando las composiciones o elaboradas mediante los métodos de la invención. La capacidad para introducir aminoácidos no naturales en las proteínas directamente en células vivientes proporciona nuevas herramientas para - - estudios de la proteína y la función celular y puede conducir a la generación de proteínas con propiedades mejoradas útiles para e.g., terapéuticos. DEFINICIONES Homólogos: Proteínas y/o secuencias de proteínas son "homologas" cuando se derivan natural o artificialmente, a partir de una proteína o secuencia de proteína ancestral común. De manera similar, los ácidos nucleicos y/o las secuencias de ácidos nucleicos son homólogos cuando se derivan natural o artificialmente a partir de un ácido nucleico o secuencia de ácidos nucleicos ancestral común. Por ejemplo, cualquier ácido nucleico que ocurre de manera natural puede modificarse mediante cualquier método de mutagénesis disponible para incluir uno o más codones selectores. Cuando se expresan estos ácidos nucleicos mutagenizados codifican un polipéptido que comprende uno o más aminoácidos no naturales. El proceso de mutación puede, por supuesto alterar adicionalmente uno o más codones estándar, cambiando mediante esto uno o más aminoácidos estándar también en la proteína mutante resultante. La homología se deduce generalmente a partir de la similitud de secuencia entre dos o más aminoácidos o proteínas (o secuencias de los mismos) . El porcentaje preciso de similitud entre las secuencias que es útil para establecer homologías varía con el ácido nucleico y la proteína en - - cuestión, pero tan poco como 25% de similitud de secuencia se utiliza rutinariamente para establecer la homología. También pueden utilizarse niveles mayores de similitud de secuencia, e.g., 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95% o 99% o más para establecer la homología. Los métodos para determinar los porcentajes de similitud de secuencia (e.g., BLASTP y BLASTN utilizando parámetros pre-establecidos) se describen en la presente y generalmente se encuentran disponibles . Ortogonal : Como se utiliza en la presente, el término "ortogonal" se refiere a una molécula (e.g., un ARNt ortogonal (O-ARNt) y/o un aminoacil ARNt sintetasa ortogonal (O-RS) ) que se utiliza con eficiencia reducida mediante un sistema de interés (e.g., un sistema de traducción, e.g., una célula) . Ortogonal se refiere a la incapacidad o eficiencia reducida, e.g., menos de 20% eficiente, menos de 10% eficiente, menos de 5% eficiente o e.g., menos de 1% eficiente de un ARNt ortogonal y/o RS ortogonal para funcionar en el sistema de traducción de interés. Por ejemplo, un ARNt ortogonal en un sistema de traducción de interés aminoacila cualquier RS endógeno de un sistema de traducción de interés con eficiencia reducida o aún de cero, cuando se compara a la aminoacilación de un ARNt endógeno mediante el RS endógeno. En otro ejemplo, un RS ortogonal aminoacila cualquier ARNt endógeno en el sistema de traducción de interés con eficiencia reducida o aún de cero. - - cuando se compara a la aminoacilación de un ARNt endógeno mediante un RS endógeno. Pre£erentemente Aminoacila : El término "preferentemente aminoacila" se refiere a una eficiencia de, e.g., aproximadamente 70% eficiente, aproximadamente 75% eficiente, aproximadamente 85% eficiente, aproximadamente 90% eficiente, aproximadamente 95% eficiente o aproximadamente 99% o más eficiente, al cual un O-RS aminoacila un O-ARNt con un aminoácido no natural comparado con un ARNt que ocurre de manera natural o material de inicio utilizado para generar el O-ARNt . El aminoácido no natural se incorpora entonces en una cadena de polipéptido en desarrollo con alta fidelidad, e.g., mayor de aproximadamente 75% de eficiencia para un codón selector dado, a mayor de aproximadamente 80% de eficiencia para un codón selector dado, a mayor de aproximadamente 90% de eficiencia para un codón selector dado, a mayor de aproximadamente 95% de eficiencia para un codón selector dado o a mayor de aproximadamente 99% o más de eficiencia para a un codón selector dado. Codón selector: El término "codón selector" se refiere a codones reconocidos por el O-ARNt en el proceso de traducción y no reconocido por un ARNt endógeno. El ciclo anti-codón O-ARNt reconoce el codón selector en el ARNm e incorpora su aminoácido, e.g., un aminoácido no natural, en este sitio en el polipéptido. Los codones selectores pueden - - incluir, e.g., codones sin sentido, tales como, codones de terminación, e.g., codones ámbar ocre y ópalo; codones de cuatro o más bases; codones derivados a partir de pares base naturales o no naturales y lo similar. Para un sistema dado, un codón selector también puede incluir uno de los tres codones base naturales, en donde el sistema endógeno no utiliza dichos tres codones base naturales, e.g., un sistema que carece de un ARNt que reconoce el codón de tres bases naturales o un sistema en donde el codón de tres bases naturales es un codón raro. AR t supresor: Un ARNt supresor es un ARNt que altera la lectura de un ARN mensajero (ARNm) en un sistema de traducción dado. Un ARNt supresor puede leer a través de, e.g., un codón de terminación, un codón de cuatro bases o un codón raro. Sistema de traducción: El término "sistema de traducción" se refiere a los componentes necesarios para incorporar un aminoácido que ocurre de manera natural en una cadena de polipéptido en desarrollo (proteína) . Los componentes de un sistema de traducción pueden incluir, e.g., ribosomas, ARNts, sintetasas, ARNm y lo similar. Los componentes de la presente invención pueden agregarse a un sistema de traducción, in vivo o in vitro. Un sistema de traducción puede ser una célula, ya sea procariótica, e.g., una célula de E. coli o eucariótica, e.g., una célula de - - levadura, de mamífero, de planta o de insecto. Aminoácido no natural : Como se utiliza en la presente, el término "aminoácido no natural" se refiere a cualquier aminoácido, aminoácido modificado y/o aminoácido análogo que no es uno de los 20 aminoácidos que se presentan de manera natural o seleno cisteína. A menos que se defina de otro modo en la presente o en más adelante en el resto de la especificación, todos los términos técnicos y científicos utilizados en la presente tienen el mismo significado que comúnmente se entiende por aquellos de experiencia ordinaria en la técnica a la cual pertenece la invención. EXPOSICIÓN Las proteínas se encuentran en las encrucijadas de virtualmente todo proceso biológico, desde la fotosíntesis y la visión para la transducción de señal y la respuesta inmune. Estas funciones complejas resultan de un polímero en base a poliamida que consiste de veinte bloques de construcción relativamente simples dispuestos en una secuencia primaria definida. La presente invención incluye los métodos y composición para utilizarse en la incorporación en sitio específico de aminoácidos no naturales directamente en las proteínas in vivo. De manera importante, el aminoácido no natural se agrega al repertorio genético, en lugar de la sustitución por uno de los 20 aminoácidos comunes. La presente invención, e.g., (i) permite el sitio selectivo o la inserción aleatoria de uno o más aminoácidos no naturales en cualquier posición deseada de cualquier proteína, (ii) es aplicable tanto en células procarióticas como eucarióticas, (iii) permite estudios in vivo de proteínas imitantes en adición a la generación de grandes cantidades de proteínas mutantes purificadas y (iv) es adaptable para incorporar cualquiera de una gran variedad de aminoácidos no naturales en las proteínas in vivo. La invención proporciona composiciones y métodos útiles para la incorporación en sitio específico in vivo de aminoácidos no naturales . Específicamente, la invención proporciona sistemas de traducción, e.g., células, que incluyen un A t ortogonal (O-ARNt) , una aminoacil ARNt sintetasa ortogonal (O-RS) y un aminoácido no natural, en donde el O-RS aminoacila el O-ARNt con el aminoácido no natural y la célula utiliza ' los componentes para incorporar el aminoácido no natural en una cadena de polipéptido en desarrollo. La invención proporciona además los métodos para la incorporación en sitio específico in vivo de aminoácidos no naturales utilizando los sistemas de traducción de la invención. La invención también proporciona proteínas producidas mediante los métodos de la invención. Las proteínas reivindicadas incluyen aminoácidos no naturales.
Las composiciones y los métodos de la invención utilizan un par de ARNt ortogonal (O-ARNt) de aminoacil A Nt sintetasa (O-RS) . Puede utilizarse un amplio rango de pares con las siguientes propiedades: el O-ARNt se encuentra preferentemente aminoacilado con un aminoácido no natural mediante el O-RS. Además, las funciones del par ortogonal en el sistema de traducción de interés, e.g., el sistema de traducción utiliza el O-ARNt aminoacilado de aminoácido no natural para incorporar el aminoácido no natural en una cadena de polipéptidos . La incorporación ocurre en una manera de sitio específico, e.g., el O-ARNt reconoce un codón selector, e.g., un codón de terminación, en el ARNm que codifica para la proteína.
En una modalidad, el O-ARNt se deriva de un Tyr- ARNt a partir de una célula de Methanococcus jannaschii. En una modalidad preferida, el O-ARNt es aquel referido en la cpresente como ARNtmTCÜyAr . En otra modalidad, el O-ARNt incluye una secuencia de polipéptidos de ácido nucleico seleccionada a partir del grupo que incluye la SEQ ID NO: 1-3 o una secuencia de polinucleótidos complementaria de la misma .
En algunas modalidades de la invención, el O-RS se deriva de TyrRS a partir de una célula de Methanococcus jannaschii. En una modalidad preferida, el O-RS se refiere en la presente como TyrRS mutante (LWJ16) o SS 12-TyrRS. En - - una modalidad adicional, el O-RS incluye un polipéptido seleccionado a partir del grupo que consiste de un polipéptido que comprende una secuencia de aminoácidos seleccionada del grupo que consiste de la SEQ ID NO: 35-66 y un polipéptido codificado por un ácido nucleico que comprende una secuencia de polinucleótidos seleccionada del grupo que consiste de: ¦ SEQ ID NO: 4-34 o una secuencia de polinucleótidos complementaria de la misma.
En una modalidad preferida, la invención incluye una célula de Escherichía coli que comprende un AR tm^ un TyrRS mutante (LWJ16) , en donde el TyrRS mutante (LWJ16) preferentemente aminoacila al ARNtm CUyAr con O-metil-L-tirosina en la célula y la célula utiliza el ARNtmT CyUAr ^para reconocer un codón ámbar.
En otra modalidad preferida, la invención incluye una célula de Escherichía coli que comprende un AR tm^ y un SS12 -TyrRS, en donde el SS12-TyrRS preferentemente aminoacila el ARNtmT CyUAr con L-3- (2-naftil) alanina en la célula y^ la célula utiliza el ARNtmT CyUAr para reconocer un codón ámbar.
Las secuencias de las moléculas O-ARNt y O-RS ej emplificativas se describen en los Ejemplos. Pares de ARNt ortogonal y de aminoacil ARNt sintetasa ortogonal - - Un par ortogonal se compone de un O-ARNt, e.g. , un ARNt supresor, un AR t de cambio del marco de lectura o lo similar y un O-RS . El O-ARNt no se acila mediante sintetasas endógenas y es capaz de decodificar un codón selector, como se describió anteriormente. El O-RS reconoce el O-ARNt, e.g., con un ciclo de anticodón extendido y preferentemente aminoacila el O-ARNt con un aminoácido no natural. El desarrollo de múltiples pares de ARNt ortogonal/sintetasa puede permitir la incorporación simultánea de múltiples aminoácidos no naturales utilizando diferentes codones . El O-ARNt y el O-RS pueden ocurrir de manera natural o pueden derivarse mediante la mutación de un ARNt que ocurre de manera natural y/o RS a partir de una variedad de organismos, que se describen bajo fuentes y huéspedes. En varias modalidades, el O-ARNt y el O-RS se derivan de al menos un organismo. En otra modalidad, el O-ARNt se deriva de un ARNt que se presenta de manera natural o mutado que se presenta de manera natural a partir de un primer organismo y el O-RS se deriva de un RS que se presenta de manera natural o mutado que se presenta de manera natural a partir de un segundo organismo. Los métodos (de derivación, de mutación, de selección) para obtener O-ARNt, O-RS y pares para utilizarse en las composiciones y métodos de la invención también se describen en la solicitud de Patente de los Estados Unidos Serie No. , titulada "Methods and Corapositions for the production of orthogonal tRNA-tRNA synthetase pair" ("Métodos y Composiciones para la producción de pares de sintetasa de ARNt ortogonal-ARNt" ) (Expediente de abogado número 54-000130US por Schultz et al) presentada concurrentemente con la presente solicitud, cuya descripción se incorpora en su totalidad. Estos métodos resuelven los problemas tratados en la sección de antecedentes para las otras estrategias que se intentaron para generar pares ARNt/RS ortogonales. Específicamente, estos métodos incluyen: (a) generar una biblioteca de ARNts derivada de al menos un ARNt a partir de un primer organismo; (b) seleccionar negativamente la biblioteca para ARNts que se aminoacilan mediante una aminoacil-ARNt sintetasa (RS) proveniente de un segundo organismo en la ausencia de un RS del primer organismo, proporcionando mediante esto un agrupamiento de ARNts; (c) seleccionar el agrupamiento de ARNts para miembros que se aminoacilan mediante un RS ortogonal (O-RS) introducido, proporcionando mediante esto al menos un O-ARNt recombinante . El al menos un O-ARNt recombinante reconoce un codón selector y no reconoce la eficiencia por el RS a partir del segundo organismo y se aminoacila preferentemente mediante el O-RS. El método también incluye: (d) generar una biblioteca de RSs mutantes derivadas de al menos una aminoacil ARNt sintetasa - - (RS) a partir de un tercer organismo; (e) seleccionar la biblioteca de RSs para miembros que aminoacilan preferentemente el al menos un O-ARNt recombinante en la presencia de un aminoácido no natural y un aminoácido natural, proporcionando mediante esto un agrupamiento de RSs activo; y (f) seleccionar negativamente el agrupamiento para RSs activas que aminoacilan preferentemente el al menos un 0-ARNt recombinante en la ausencia del aminoácido no natural, proporcionando mediante esto el al menos un par 0-ARNt/O-RS específico, en donde el al menos un par 0-ARNt/O-RS especifico comprende al menos una O-RS recombinante que es específica para el aminoácido no natural y el al menos un 0-AR t recombinante. Una estrategia para generar un par ortogonal involucra generar bibliotecas mutantes a partir de las cuales detectar y/o seleccionar un O-ARNt o un O-RS. Una segunda estrategia para generar un par de ARNt/sintetasa ortogonal involucra importar un par de ARNt/sintetasa heterólogo, e.g., importar un par proveniente de otro, e.g., organismo fuente en la célula huésped. Las propiedades del candidato de sintetasa heterólogo incluyen e.g., que no carga cualquier ARNt de célula huésped y las propiedades del candidato de ARNt heterólogo incluyen e.g., que no se acila mediante cualquier sintetasa de célula huésped. Además, el ARNt heterólogo derivado del ARNt heterólogo es ortogonal para todas las sintetasas de célula huésped. Utilizando los métodos descritos en la presente y en la solicitud de Patente de los Estados Unidos Serie No. , titulada "Methods and Compositions for the production of orthogonal tRNA-tRNA synthetase pair" ("Métodos y Composiciones para la producción de pares de sintetasa de ARNt ortogonal-ARNt" ) (Expediente de abogado número 54-000130US por Schultz et al) los pares y componentes de pares deseados anteriormente se desarrollan para generar pares de ARNt/sintetasa ortogonales que poseen características deseadas e.g., que pueden aminoacilar preferentemente un 0-ARNt con un aminoácido no natural . Aunque se trató con referencia a las estrategias para incorporar en la presente aminoácidos no naturales en proteínas in vivo, se apreciará que también pueden desarrollarse estrategias para incorporar aminoácidos naturales en respuesta a los codones selectores, proporcionando una base adicional de y para la mutagénesis. Es decir, que puede modificarse una sintetasa para cargar un aminoácido natural en un ARNt ortogonal que reconoce un codón selector en una forma similar a la carga de un aminoácido no natural como se describió a través de todo el documento. Producción de aminoacil ARNt sintetasas ortogonales (0-RS) Los métodos para producir una 0-RS se basan en generar un agrupamiento de las sintetasas imitantes a partir de la estructura de una sintetasa tipo silvestre y después seleccionar RSs mutadas en base a su especificidad para un aminoácido no natural en relación a los veinte comunes. Para aislar tal sintetasa, los métodos de selección de la presente invención son: (i) sensitivo, ya que la actividad de las sintetasas deseadas a partir de las rondas iniciales puede ser baja y pequeña la población; (ii) "adaptable", ya que es deseable variar la rigurosidad de selección en diferentes rondas de selección; y (iii) general, de modo que puede utilizarse para diferentes aminoácidos no naturales. Los métodos para generar una aminoacil ARNt sintetasa ortogonal incluyen mutar la sintetasa, e.g. , en el sitio activo en la sintetasa, en el sitio del mecanismo de edición en la sintetasa, en diferentes sitios mediante la combinación de diferentes dominios de sintetasas o lo similar y aplicar un proceso de selección. Se utiliza una estrategia que se basa en la combinación de una selección positiva seguida por una selección negativa. En la selección positiva, la supresión del codón selector introducido en una (unas) posición (es) no esencial (es) de un marcador positivo permite a las células sobrevivir bajo la presión de la selección positiva. En la presencia tanto de aminoácidos naturales como no naturales, los sobrevivientes codifican asi sintetasas activas cargando el ARNt supresor ortogonal con ya sea un aminoácido natural o no natural . En la selección negativa, la supresión de un codón selector introducido en una (unas) posición (es) no esencial (es) de un marcador negativo retira las sintetasas con especificidades de aminoácido natural . Los sobrevivientes de la selección negativa y positiva codifican sintetasas que aminoacilan (cargan) el ARNt supresor ortogonal con solamente aminoácidos no naturales . Estas sintetasas pueden someterse entonces a mutagenesis adicional, e.g., redistribución del ADW u otros métodos de mutagénesis recursivos. La biblioteca de RSs mutantes puede generarse utilizando varias técnicas de mutagénesis conocidas en la materia. Por ejemplo, las RSs mutantes pueden generarse mediante mutaciones en sitio específico, mutaciones de punto aleatorio, recombinación homologa, construcción quimérica o lo similar. La etapa de selección positiva puede incluir e.g., introducir un marcador de selección positiva, e.g., un gen de resistencia antibiótica o lo similar y la biblioteca de las RSs mutantes en una pluralidad de células, en donde el marcador de selección positiva comprende al menos un codón selector, e.g., un codón ámbar; que desarrolla la pluralidad de células en la presencia de un agente de selección; seleccionar células que sobreviven en la presencia del agente de selección al suprimir el al menos un codón selector en el - - marcador de selección positiva, proporcionando mediante esto un subconjunto de células positivamente seleccionadas que contienen el agrupamiento de RSs mutantes activas . Opcionalmente, la concentración del agente de selección puede variar. La selección negativa puede incluir, e.g., introducir un marcador de selección negativo con el agrupamiento de las RSs mutantes activas a partir de la selección positiva en una pluralidad de células de un segundo organismo, en donde el marcador de selección negativo es un gen de resistencia al antibiótico, e.g., un gen de cloranfenicol acetiltransferasa (CAT) , que comprende al menos un codón selector; y células de selección que sobreviven en un 1er medio complementado con el aminoácido no natural y un agente de selección, pero falla para sobrevivir en un 2do medio no complementado con el aminoácido no natural y el agente de selección, proporcionando mediante esto células sobrevivientes con el al menos un O-RS recombinante . Opcionalmente, la concentración del agente de selección varía. La selección positiva puede basarse en la supresión de un codón selector en un marcador de selección positivo, e.g., un gen de cloranfenicol acetiltransferasa (CAT) que comprende un codón selector, e.g., un codón de terminación ámbar, en el gen CAT, de manera que el cloroanfenicol puede - - aplicarse como la presión de selección positiva. Además, el gen CAT puede utilizarse tanto como un marcador positivo como un marcador negativo según se describe en la presente en la presencia y ausencia de un aminoácido no natural . Opcionalmente, el gen CAT que comprende un codón selector se utiliza para la selección positiva y un marcador de selección negativo, e.g., un marcador tóxico, tal como un gen de barnasa que comprende al menos uno o más codones selectores, se utiliza para la selección negativa. La selección positiva también puede basarse en la supresión de un codón selector en una posición no esencial en el gen de ß-lactamasa, volviendo las células resistentes a la ampicilina; y se utiliza una selección negativa utilizando la barnasa de ribonucleasa como el marcador negativo. En contraste a la ß-lactamasa, que se secreta en el periplasma, CAT se localiza en el citoplasma; además, la ampicilina es bacteriocida, mientras que el cloranfenicol es bacteriostático . El 0-RS recombinante puede mutarse y seleccionarse adicionalmente . En una modalidad, los métodos para producir al menos una aminoacil ARNt sintetasa ortogonal (O-RS) recombinante puede comprender además: (d) aislar el al menos un O-RS recombinante; (e) generar un segundo conjunto de O-RS mutados derivados a partir de al menos un ORS recombinante; y (f) repetir las etapas (b) y (c) hasta que se obtenga un O-RS mutado que comprenda la capacidad para aminoacilar preferentemente el O-ARNt. Opcionalmente, se repiten las etapas (d) - (f) , e.g., al menos aproximadamente dos veces. En un aspecto, el segundo conjunto de O-RS mutado puede generarse mediante la mutagénesis, e.g., mutagénesis aleatoria, mutagénesis de sitio específico, recombinación o una combinación del mismo. Producción de ARNt ortogonal (O-ARNts) Los métodos para producir un ARNt ortogonal (0-ARNt) recombinante se proporcionan en la solicitud de Patente de los Estados Unidos Serie No. , titulada "Methods and Compositions for the production of orthogonal tRNA-tRNA synthetase pairs" ("Métodos y Composiciones para la producción de pares de sintetasa de ARNt ortogonal-ARNt " ) (Expediente de abogado número 54-000130US por Schultz et al) . Los métodos para producir un 0-ARNt recombinante incluyen: (a) generar una biblioteca de ARNts mutantes derivados a partir de al menos un ARNt , e.g., un ARNt supresor, a partir de un primer organismo; (b) seleccionar negativamente la biblioteca para ARNts mutantes que se aminoacila mediante una aminoacil ARNt sintetasa (RS) a partir de un segundo organismo en la ausencia de una RS a partir del primer organismo, proporcionando mediante esto un agrupamiento de ARNts mutantes; y (c) seleccionar el agrupamiento del ARNts mutantes para miembros que se aminoacilan mediante una RS ortogonal introducida (ORS) , proporcionando mediante esto al menos un O-ARNt recombinante; en donde el al menos un O-ARNt recombinante reconoce un codón selector y no se reconoce la eficiencia por la RS a partir del segundo organismo y se aminoacila preferentemente por la O-RS . En una modalidad, el O-ARNt recombinante posee una mejora de ortogonalidad. Por ejemplo, para mejorar la ortogonalidad de un ARNt mientras conserva su afinidad hacia un RS deseado, los métodos incluyen una combinación de selecciones negativas y positivas con una biblioteca de ARNt supresor mutante en la ausencia y presencia de la sintetasa cognato, respectivamente. En la selección negativa, se introduce un (unos) codón(es) selector (es) en un gen marcador, e.g., un gen tóxico, tal como barnasa, en una posición no esencial. Cuando un miembro de la biblioteca de ARNt mutada, e.g., derivado a partir de Methanococcus jannaschií, se aminoacila por un huésped endógeno, e.g., sintetasas de Escherichia coli (i.e., no es ortogonal para el huésped, e.g., sintetasa de Escherichia coli), el codón selector, e.g., un codón ámbar, se suprime y el producto del gen tóxico producido conduce a la muerte de la célula. Las células que albergan ARNts ortogonales o ARNTs no funcionales sobreviven. Las sobrevivientes se someten entonces a una selección positiva en la cual un codón selector, e.g., un codón ámbar, se coloca - - en un gen marcador positivo, e.g., un gen resistente a la droga, tal como un gen de ß-lactamasa. Estas células también contienen un vector de expresión con un RS cognato. Estas células se desarrollaron en la presencia de un agente de selección, e.g., ampicilina. Los ARNts se seleccionan entonces por su capacidad para aminoacilarse mediante la sintetasa cognato co-expresada y para insertar un aminoácido en respuesta a este codón selector. Las células que albergan ARNTs no funcionales o ARNts que no pueden reconocerse por la sintetasa de interés son sensibles al antibiótico. Por lo tanto, las ARNts que: (i) no son sustratos para el huésped endógeno, e.g., sintetasas de Escherichia coli; (ii) pueden aminoacilarse mediante la sintetasa de interés; y (iii) son funcionales en sobrevivir a la traducción de ambas selecciones. Se construyen bibliotecas de ARNt mutado. Las mutaciones pueden introducirse en una(s) posición (es) específica (s) , e.g., en una(s) posición(es) no conservadora (s) o en una posición conservadora, en una(s) posició (es) aleatorizada (s) o una combinación de ambas en un ciclo deseado de un ARNt, e.g., un ciclo anticodón, (brazo D, ciclo V, brazo Ti|/C) o una combinación de ciclos o todos los ciclos. Las bibliotecas quiméricas de ARNt también se incluyen en la presente invención. Debe notarse que las bibliotecas de las sintetasas de ARNt a partir de varios - - organismos (e.g., microorganismos tales como eubacterias o arquebacterias) tales como bibliotecas que comprenden diversidad natural (ver, e.g., la Patente de E.U. No. 6,238,884 de Short et al; la Patente de E.U. No. 5,756,316 de Schallenberger et al; la Patente de E.U. No. 5,783,431 de Petersen et al; la Patente de E.U. No. 5,824,485 de Thompson et al; la Patente de E.U. No. 5,958,672 de Short et al), se construyen y detectan opcionalmente para pares ortogonales. Por ejemplo, seleccionar negativamente la biblioteca para los ARNts mutantes que se aminoacilan mediante una aminoacil ARNt sintetasa pueden incluir: introducir un gen marcador tóxico, en donde el gen marcador tóxico comprende al menos uno de los codones selectores y la biblioteca de ARNts mutantes dentro de una pluralidad de células provenientes del segundo organismo; y, seleccionar células sobrevivientes, en donde las células sobrevivientes contienen el agrupamiento de ARNts mutantes que comprende al menos un ARNt ortogonal o ARNt no funcional. Por ejemplo, el gen marcador tóxico es un gen de barnasa de ribonucleasa, en donde el gen de barnasa de ribonucleasa comprende al menos un codón ámbar. Opcionalmente, el gen de barnasa de ribonucleasa puede incluir dos o más codones ámbar. Las células sobrevivientes pueden seleccionarse, e.g., al utilizar una proporción de comparación de análisis de densidad celular.
- - En otro ejemplo, seleccionar el agrupamiento de AR ts mutantes para miembros que se aminoacilan mediante un RS ortogonal introducido (O-RS) puede incluir: introducir un gen marcador de selección positiva, en donde el gen marcador de selección positiva comprende un gen de resistencia a la droga, e.g., un gen de ß-lactamasa, que comprende al menos uno de los codones selectores, e.g., un gen de ß-lactamasa que comprende al menos un codón de terminación ámbar, el O-RS y el agrupamiento de ARNts mutantes en una pluralidad de células provenientes del segundo organismo; y, seleccionar células sobrevivientes desarrolladas en la presencia de un agente de selección, e.g., un antibiótico, proporcionando mediante esto un agrupamiento de células que poseen el al menos un ARNt recombinante, en donde el ARNt recombinante se aminoacila mediante el O-RS e inserta un aminoácido en un producto de traducción codificado por el gen marcador positivo, en respuesta a el al menos uno de los codones selectores. En otra modalidad, la concentración del agente de selección varía. Los O-AR ts recombinantes producidos mediante los métodos se incluyen en la presente invención. La rigurosidad de las etapas de selección, e.g., la etapa de selección positiva, la etapa de selección negativa o ambas etapas la de selección positiva como la negativa, en los métodos descritos anteriormente, opcionalmente incluyen variar la rigurosidad de selección. Por ejemplo, debido a - - que la barnasa es una proteína extremadamente tóxica, la rigurosidad de la selección negativa puede controlarse al introducir números diferentes de codones selectores en el gen de barnasa. En un aspecto de la presente invención, se varía la rigurosidad debido a que la actividad deseada puede ser baja durante las primeras rondas. Así, se aplica el criterio de selección de baja rigurosidad en las primeras rondas y se aplica el criterio de más rigurosidad en las rondas posteriores de selección. Pueden utilizarse otros tipos de selecciones en la presente invención para generar, e.g., ares O-RS, O-ARNt y pares O-ARNt/O-RS . Por ejemplo, la etapa de selección positiva, la etapa de selección negativa o ambas etapas la de selección positiva como negativa pueden incluirse utilizando un informador, en donde el informador se detecta mediante clasificación celular activada por fluorescencia (FACS) . Por ejemplo, una selección positiva puede hacerse primero con un marcador de selección positiva, e.g., gen de cloranfenicol acetiltransferasa (CAT) , en donde el gen CAT comprende un codón selector, e.g. , un codón de terminación ámbar, en el gen CAT, que es seguido por una detección de selección negativa, que se basa en la inhabilidad para suprimir un (os) codón(es) selector (es) , e.g., dos o más, en posiciones dentro de un marcador negativo, e.g., el gen de T7 AR polimerasa. En una modalidad, el marcador de selección positiva y el - - marcador de selección negativa pueden encontrarse en el mismo vector, e.g., un plásmido. La expresión del marcador negativo acciona la expresión del informador, e.g., la proteína fluorescente verde (GFP) . La rigurosidad de la selección y la detección pueden variar, e.g., la intensidad de la luz necesaria para la fluorescencia del informador puede variar. En otra modalidad, puede hacerse una selección positiva con un . informador como un marcador de selección positiva, que se detecta mediante FACs, seguido por una detección de selección negativa, que se basa en la inhabilidad para suprimir un (os) codón(es) selector (es) , e.g., dos o más, en posiciones dentro de un marcador negativo, e.g., gen de barnasa. Opcionalmente, el informador se despliega en una superficie celular en un despliegue de fago o lo similar. El despliegue de superficie celular, e.g., el sistema de despliegue de superficie celular en base a OmpA, depende de la expresión de un epítope particular, e.g., un péptido C3 de poliovirus fusionado a un OmpA de porina de membrana externa en la superficie de la célula de Escherichia coli. El epítope se despliega en la superficie celular solamente cuando un codón selector en el mensaje de la proteína se suprime durante la traducción. El péptido desplegado contiene entonces el aminoácido reconocido mediante una de las aminoacil AR t sintetasas mutantes en la biblioteca y la - - célula que contiene el gen de sintetasa correspondiente puede aislarse con anticuerpos originados contra péptidos que contienen aminoácidos no naturales específicos. El sistema de despliegue de superficie celular en base a OmpA se desarrolló y optimizó por Georgiou et al. Como una alternativa para el despliegue de fago. Ver, Francisco, J. A., Campbell, R., Iverson, B. L. & Georgoiu, G. Production and fluorescene-activated cell sorting of Escherichia coli expressing a functional antibody fragment on the external surface (Producción y clasificación celular de Escherichia coli activada por fluorescencia que expresa un f agmento de anticuerpo funcional sobre la superficie externa) . Proc Nati Acad Sci USA. 90:10444-8 (1993). También pueden llevarse a cabo in vitro las etapas de selección. El componente seleccionado, e.g., sintetasa y/o ARNt, puede introducirse entonces en una célula para utilizarse en la incorporación in vivo de un aminoácido no natural . Fuente y Organismos Huésped El par ARNt-RS ortogonal, e.g., derivado a partir de al menos un primer, e.g., organismo fuente o al menos dos organismo fuentes, que puede ser el mismo o diferentes, puede utilizarse en un variedad de organismos huésped, e.g., un segundo organismo. El primero y el segundo organismos de los métodos de la presente invención puede ser el mismo o - - diferentes. En una modalidad, el primer organismo es un organismo procariótico, e.g., Methanococcus jannaschii, Methanobacterium thermoautotrophicum, Halobacterium, Escherichia coli, A. fulgidus, Halobacterium, P. furiosus, P. horikoshii, A. pernix, T. thermophilus o lo similar. Alternativamente, el primer organismo es un organismo eucariótico, e.g., plantas (e.g., plantas complejas tales como monocotiledóneas o dicotiledóneas) , algas, protistos, hongos (e.g. levadura, etc.), animales (e.g., mamíferos, insectos, artrópodos, etc.) o lo similar. En otra modalidad, el segundo organismo es un organismo procariótico, Methanococcus jannaschii, Methanobacterium thermoautotrophicum, Halobacterium, Escherichia coli, A. fulgidus, Halobacterium, P. furiosus, P. horikoshii, A. pernix, T. thermophilus o lo similar. Alternativamente, el segundo organismo puede ser un organismo eucariótico, e.g., plantas, hongos, animales o lo similar. Como se describió anteriormente, los componentes individuales de un par pueden derivarse del mismo organismo o diferentes organismos. Por ejemplo, ARNt puede derivarse de un organismo procariótico, e.g., una arqueobacteria, tales como Methanococcus jannaschii y Halobacterium NRC-1 o una eubacteria, tal como Escherichia coli, mientras puede derivarse la sintetasa del mismo u otro organismo procariótico, tales como, Methanococcus jannaschii, - - Archaeoglobus fulgidus, Methanobacterium thermoautotrophicum, P. furiosus, P. horikoshii, A. pernix, T. thermophilus, Halobacterium, Escherichia coli o lo similar. También pueden utilizarse las fuentes eucarióticas , e.g. , plantas (e.g., plantas complejas tales como monocotiledóneas o dicotiledóneas) , algas, protistos, hongos (e.g. levadura, etc.), animales (e.g., mamíferos, insectos, artrópodos, etc.) o lo similar. Codones selectores Los codones selectores de la presente invención expanden la estructura genética del codón de la maquinaria biosintética de la proteína. Por ejemplo, un codón selector incluye, e.g., un único codón de tres bases, un codón sin sentido, tal como un codón de terminación, e.g., un codón ámbar o un codón ópalo, un codón no natural, un codón de al menos cuatro bases o lo similar. Puede introducirse un número de codones selectores en un gen deseado, e.g. uno o m s, dos o más, más de tres, etc. Los 64 codones genéticos codifican para 20 aminoácidos y 3 codones de terminación. Debido a que solamente se necesita un codón de terminación para la terminación de la traducción, los otros dos pueden en principio utilizarse para codificar aminoácidos no proteinogénicos . El codón de terminación ámbar, UAG, se ha utilizado exitosamente en el sistema biosintético in vitro y - - en ovocitos Xenopus para dirigir la incorporación de aminoácidos no naturales . Entre los 3 codones de terminación, UAG es el último codón de terminación utilizado en Escherichia coli. Algunas cepas de Escherichia coli contienen supresores AR ts naturales, que reconocen UAG e insertan un aminoácido natural. Además, estos ARNts supresores de ámbar se han utilizado en la mutagénesis convencional de la proteina En una modalidad, los métodos incluyen el uso de un codón selector que es un codón de terminación para la incorporación de aminoácidos no naturales in vivo. Por ejemplo, se genera un 0-ARNt que reconoce el codón de terminación, e.g., UAG y se aminoacila mediante una O-RS con el aminoácido no natural deseado. Este O-ARNt no se reconoce por las aminoacil ARNt sintetasas que se presentan de manera natural . La mutagénesis dirigida al sitio convencional puede utilizarse para introducir el codón de terminación, e.g., TAG, en el sitio de interés en el gen de proteina. Ver, e.g., Sayers, J.R., Schmidt, W. Eckstein, F. 5 ',3' Exonuclease in phosphorothioate-based oligonucleotide-directed mutagénesis (Exonucleasa en la mutagénesis dirigida al oligonucleótido en base a fosforotioato) . Nucleic Acids Res, 791-802 (1988) . Cuando la O-RS, el 0-ARNt y el gen mutante se combinan in vivo, el aminoácido no natural se incorpora en respuesta al codón UAG para dar una proteína que contiene el aminoácido no natural en la posición especificada. La incorporación de aminoácidos no naturales in vivo puede hacerse sin perturbación significativa del huésped, e.g., Escherichia coli. Por ejemplo, debido a la eficiencia de supresión para que el codón UAG dependa de la competencia entre el O-ARNt, e.g., el ARNt supresor ámbar y el factor 1 de liberación (RF1) (que se une al codón UAG e inicia la liberación del péptido en desarrollo a partir del ribosoma) , la eficiencia de supresión puede modularse mediante, e.g., ya sea incrementar el nivel de expresión de O-ARNt , e.g., el ARNt supresor o utilizando una cepa deficiente de RF1. Los aminoácidos no naturales pueden también codificarse con codones raros. Por ejemplo, cuando se reduce la concentración de arginina en una reacción de síntesis de protexna in vitro, el codón de arginina raro, AGG, ha probado ser eficiente para la inserción de Ala mediante un ARNt sintético acilado con alanina. Ver,, e.g., C.H. Ma, W. udlicki, O.W. Odom, G. Kramer y B. Hardesty, Biochemestry, 32:7939 (1993). En este caso, el ARNt sintético compite con el ARNtArg que se presenta de manera natural, el cual existe como una especie menor en Escherichia coli . Algunos organismos no utilizan todos los codones de triplete . Un codón no asignado AGA en Micrococcus luteus se ha utilizado - - para la inserción de aminoácidos en un extracto de transcripción/traducción in vitro. Ver, e.g. , A.K. Kowal y J.S. Oliver, Nucí .Acid.Res. , 25:4685 (1997). Los componentes de la presente invención pueden generarse para utilizar estos codones raros in vivo. Los codones selectores también comprenden codones de cuatro o más bases, tales como, cuatro, cinco, seis o codones de más bases. Los ejemplos de codones de cuatro bases incluyen, e.g., AGGA, CUAG, UAGA, CCCU y lo similar. Los ejemplos de codones de cinco bases incluyen, e.g., AGGAC, CCCCU, CCCUC, CUAGA, CUACU, UAGGC y lo similar. Por ejemplo, en la presencia de 0-ARNts mutados, e.g., unos ARNts supresores especiales de cambio del marco de lectura, con ciclos de anticodón, e.g., con al menos 8-10 nt ciclos de anticodón, los codones de cuatro o más bases se leen como aminoácido sencillo. En otras modalidades, los ciclos de anticodón pueden decodificar, e.g., al menos un codón de cuatro bases, al menos un codón de cinco bases o al menos un codón de seis bases o más. Ya que existen 256 posibles codones de cuatro bases, pueden codificarse múltiples aminoácidos no naturales en la misma célula utilizando el codón de cuatro o más bases. Ver, J. Christopher Anderson et al., Exploring t e Limits of Codon and Anticodón Size (Explorando los Límites del Tamaño del Codón y Anticodón) Chemistry and Biology, Yol. 9, 237-244 (2002); Thomas J.
- - Magliery, Expanding t e Genetic Code: Selection of Efficient Suppressors of Four-base Codons and Identification of "Shifty" Four-base Codons with a Library Approach in Escherichia coli [Expansión del Código Genético: Selección de los Supresores Eficientes de Codones de cuatro bases e identificación del "cambio" de los Codones de cuatro bases con un procedimiento de biblioteca en Escherichia coli) , J.Mol.Biol. 307:755-769 (2001). Los métodos de la presente invención incluyen utilizar codones extendidos en base a la supresión del cambio del marco de lectura. Pueden insertarse codones de cuatro o más bases, e.g., uno o múltiples aminoácidos no naturales en la misma proteina. Por ejemplo, se han utilizado codones de cuatro bases para incorporar aminoácidos no naturales en proteínas utilizando métodos biosintéticos in vitro. Ver, e.g., C.H. Ma, W. Kudlicki, O.W. Odom, G. Kramer y B. Hardesty, Biochemestry, 1993, 32, 7939 (1993); y T. Hohsaka, D. Kajihara, Y. Ashizuka, H. Murakami y M. Sisado, J.Am.Chem.Soc. , 121:34 (1999). CGGG y AGGU se utilizaron para incorporar simultáneamente 2 -naftilalanina y un derivado BD de lisina en la estreptavidina in vitro con dos ARNts supresores de cambio del marco de lectura químicamente acilados. Ver, e.g., T. Hohsaka, Y. Ashizuka, H. Sasaki, H. Murakami y M. Sisido, J.Am.Chem.Soc, 121:12194 (1999). En un estudio in vivo, Moore et al., examinaron la capacidad de - - derivados de ARNtLeu con anticodones NCUA para suprimir los codones UAGN (N puede ser U, A, G o C) y encontraron que el UAGA cuádruplo puede decodificarse mediante un ARMtLeu con un anticodón UCUA con una eficiencia de 13 a 26% con poca decodificación en la estructura 0 o -1. Ver, B. Moore, B.C. Persson, C.C. Nelson, R.F. Gesteland y J.F. Atkins, J.Mol .Biol . , 298:195 (2000). En una modalidad, los codones extendidos que se basan en codones raros o codones sin sentido pueden utilizarse en la presente invención, lo cual puede reducir la lectura completa sin sentido y la supresión de cambio del marco de lectura en otros sitios no deseados. También puede utilizarse un sistema de derivación de traducción para incorporar un aminoácido no natural en un polipéptido deseado. En un sistema de derivación de traducción, se inserta una secuencia grande en un gen pero no se traduce hacia la proteína. La secuencia contiene una estructura ' que sirve como una indicación para inducir al ribosoma a saltar sobre la secuencia y reanudar la traducción aguas debajo de la inserción. Alternativamente o en combinación con otros métodos descritos anteriormente para incorporar un aminoácido no natural en un polipéptido, puede utilizarse un sistema de trans-traducción. Este sistema incluye una molécula llamada AR tm presente en Escherichia coli . Esta molécula de AR se relaciona estructuralmente a un AR t de alanilo y se - aminoacila mediante la sintetasa de alanilo. La diferencia entre A Ntm y AR t es que el ciclo de anticodón se remplaza con una secuencia grande especial . Esta secuencia permite al ribosoma reanudar la traducción sobre las secuencias que se han evitado utilizando una estructura de lectura abierta codificada dentro del ARNtm como un modelo. En la presente invención, puede generarse un ARNtm ortogonal que se aminoacila preferentemente con una sintetasa ortogonal y se carga con un aminoácido no natural . Al transcribir un gen utilizando el sistema, el ribosome evita un sitio específico; el aminoácido no natural se introduce en ese sitio, reanudando después la traducción, utilizando la secuencia codificada dentro del ARNtm ortogonal . Los codones selectores opcionalmente incluyen pares de bases no naturales . Estos pares de bases no naturales expanden adicionalmente el alfabeto genético existente. Un par de bases extra incrementa el número de codones del triplete de 64 a 125. Las propiedades de los terceros pares de bases incluyen la formación de pares de bases estable y selectiva, la incorporación enzimática eficiente en el ADN con alta fidelidad mediante una polimerasa y la eficiente extensión del iniciador continuada después de la síntesis del par de bases no natural naciente. Las descripciones de pares de bases no naturales que pueden adaptarse a los métodos y composiciones incluyen, e.g., Hirao, et- al., An unnatural - ¬ base pair for incorporating amino acid analogues into protein (Un par de bases no naturales para incorporar aminoácidos análogos en la proteína), JNTature Biotechnology, 20:177-182 (2002) . Se listan más adelante otras publicaciones relevantes . Para la utilización in vivo, el nucleósido no natural es una membrana permeable y se fosforila para formar el trifosfato correspondiente. Además, la información genética incrementada es estable y no se destruye mediante enzimas celulares . Esfuerzos previos por Benner y otros toman ventaja de patrones de unión a hidrógeno que son diferentes a aquellos en pares de Watson-Crick canónicos, de los cuales el ejemplo más digno de atención es el par iso-C:iso-G. Ver, e.g., C. Switzer, S.E. oroney y S.A. Benner, J.Am.Chem. Soc . , 111:8322 (1989); y J.A. Piccirilli, T. Krauch, S.E. Moroney y S.A. Benner, Nature, 1990, 343:33 (1990); E.T. Kool, Curr. Opin. Chem.Biol . , 4:602 (2000). Estas bases en general se parean erróneamente en algún grado con bases naturales y no pueden replicarse enzimáticamente . Kool y colaboradores demostraron que las interacción de empaque hidrofóbico entre las bases puede remplazar las uniones de hidrógeno para accionar la formación del par base. Ver, E.T. Kool, Curr. Opin. Chem. Biol . , 4:602 (2000); y K.M. Guckian y E.T. Kool, Angew. Chem. Int . Ed. Engl . , 36, 2825 (1998). En un esfuerzo para desarrollar un par base no natural que - - satisfaga todos los requerimientos anteriores, Schultz, Romesberg y colaboradores han sintetizado y estudiado sistemáticamente una serie de bases hidrofóbicas no naturales. Un auto-par PICS:PICS se encontró ser más estable que los pares base naturales y puede incorporarse eficientemente en ADN mediante el fragmento Klenow de la polimerasa I de ADN de Escherichia coli (KF) . Ver, e.g. , D. L. McMinn, A.K. Ogawa Y.Q. Wu, J.Q. Liu, P.G. Schultz y F.E. Romesberg, J.Am. Chem. Soc . , 121:11586 (1999); y A.K. Ogawa Y.Q. Wu, D.L. McMinn, J.Q. Liu, P.G. Schultz y F.E. Romesberg, J.Ara. Chem. Soc . , 122:3274 (2000). Un auto-par 3 N:3MN puede sintetizarse mediante KF con eficiencia y selectividad suficiente para la función biológica. Ver, e.g., A.K. Ogawa Y.Q. Wu, M. Berger, P.G. Schultz y F.E. Romesberg, - J.Am. Chem. Soc. , 122:8803 (2000). Sin embargo, ambas bases actúan como un terminador de cadena para replicación adicional. Se ha desarrollado recientemente una polimerasa de ADN mutante que puede utilizarse para replicar el auto-par PICS. Además, puede replicarse un auto-par 7AI . Ver, e.g., E.J. L. Tae Y.Q. Wu, G. Xia, P.G. Schultz y F.E. Romesberg, J.Am. Chem. Soc .- 123:7439 (2001). Se ha desarrollado también un nuevo par de metalobase, Dipic:Py, que forma un par estable al unirse a Cu (II) . Ver, E. Meggers, P.L. Holland, W.B. Tolman, F.E. Romesberg y P.G. Schultz, J.Am. Chem. Soc. , 122:10714 (2000). Debido a que los codones extendidos y los codones no naturales son intrínsecamente ortogonales a los codones naturales, los métodos de la presente invención pueden tomar ventaja de esta propiedad para generar ARNt ortogonales para ellos. Aminoácidos no naturales Como se utiliza en la presente un aminoácido no natural se refiere a cualquier aminoácido, aminoácido modificado o análogo de aminoácido diferente a la selenocisteína y los siguientes veinte aminoácidos alfa genéticamente codificados: alanina, arginina, asparagina, ácido asp rtico, cisteína, glutamina, ácido glutámico, glicina, histidina, isoleucina, leucina, lisina, metionina, fenilalanina, prolina, serina, treonina, triptofano, tirosina, valina. La estructura genética de un aminoácido alfa se ilustra por la Fórmula I: I R H2 ' ^ ,'C¾H Un aminoácido no natural es típicamente cualquier estructura que tiene la Fórmula I en donde el grupo R es cualquier sustituyente diferente a uno utilizado en los veinte aminoácidos naturales. Ver, e.g., Biochemistry por L. Stryer, 3a ed. 1988, Freeman y Company, New York, para las estructuras de veinte aminoácidos naturales. Nótese que, los - - aminoácidos no naturales de la presente invención pueden ser compuestos que se presentan de manera natural diferentes a los veinte aminoácidos alfa anteriores . Debido a que los aminoácidos no naturales de la invención típicamente difieren de los aminoácidos naturales en solamente la cadena lateral, los aminoácidos no naturales forman uniones de amida con otros aminoácidos, e.g., natural o no natural, en la misma forma en la cual se forman en las proteínas que se presentan de manera natural. Sin embargo, el aminoácido no natural tiene grupos de cadena lateral que se distinguen de los aminoácidos naturales. Por ejemplo, en la Fórmula I opcionalmente comprende un grupo alquil-, aril-, acil-, ceto-, azido-, hidroxilo-, hidrazina, ciano-, halo-, hidrazida, alquenilo, alquinilo, éter, tiol, seleno-, sulfonilo-, borato, boronato, fosfo, fosfono, fosfina, heterocíclico, enona, imina, aldehido, éster, tioácido, hidroxilamina, amino o lo similar o cualquier combinación de los mismos. Otros aminoácidos no naturales de interés incluyen, pero no se limitan a, aminoácidos que comprenden un reticulador fotoactivable, aminoácidos etiquetados por giro, aminoácidos ¦ fluorescentes, aminoácidos de unión a metal, aminoácidos que contienen metal, aminoácidos radioactivos, aminoácidos con nuevos grupos funcionales, aminoácidos que interactúan covalente o no covalentemente con otras moléculas, aminoácidos foto inmovilizados y/o fotoisomerizables , aminoácidos que comprenden biotina o un análogo de biotina, aminoácidos glicosilados tales como una serina sustituida de azúcar, otros aminoácidos modificados de carbohidrato, aminoácidos que contienen ceto, aminoácidos que comprenden polietilen glicol o poliéter, aminoácidos sustituidos del átomo pesado, aminoácidos químicamente desdoblables y/o fotodesdoblables, aminoácidos con unas cadenas laterales alargadas en comparación a los aminoácidos naturales, e.g., poliéteres o hidrocarburos de cadena larga, e.g., mayor a aproximadamente 5 o mayor a aproximadamente 10 carbonos, aminoácidos que contienen azúcar enlazada a carbono, aminoácidos redox activos, aminoácidos que contiene amino tioácido y aminoácidos que comprenden uno o más residuos tóxicos . , Además para los aminoácidos no naturales que contienen nuevas cadenas laterales, los aminoácidos no naturales también comprenden opcionalmente estructuras principales modificadas, e.g., como se ilustró por las estructuras de la Fórmula II y III : - II III en donde Z típicamente comprende OH, NH2, SH, H-R' o S-R' ; X y Y, que pueden ser el mismo o diferente, típicamente comprenden S u O y R y R' , que son opcionalmente el mismo o diferente, se encuentran típicamente seleccionados a partir de la misma lista de constituyentes para el grupo R descrito anteriormente para los aminoácidos no naturales que tienen la Fórmula I así como hidrógeno. Por ejemplo, los aminoácidos no naturales de la invención opcionalmente comprenden sustituciones en el grupo amino o carboxilo como se ilustró por las Fórmulas II y III . Los aminoácidos no naturales de este tipo incluyen, pero no se limitan a, ácidos cc-hidroxi, -tioácidos -aminotiocarboxilatos , e.g. , con cadenas laterales correspondientes a los veinte aminoácidos naturales comunes o cadenas laterales no naturales. Además, las sustituciones en el a-carbono opcionalmente incluyen aminoácidos L, D o a-a-disustituídos tales como D-glutamato, - - D-alanina, D-metil-O-tirosina, ácido aminobutírico y lo similar. Otras alternativas estructurales incluyen aminoácidos cíclicos, tales como análogos de prolina así como análogos de prolina de anillo de 3,4,6,7,8 y 9 miembros, aminoácidos ß y ? tales como ácido ß-alanina y ?-amino butírico sustituido Por ejemplo, muchos aminoácidos no naturales se basan en aminoácidos naturales, tales como tirosina, glutamina, fenilalanina y lo similar. Los análogos de tirosina incluyen tirosinas para-sustituídas, tirosinas orto-sustituidas y tirosinas meta sustituidas, en donde la tirosina sustituida comprende un grupo acetilo, un grupo benzoilo, un grupo amino, una hidrazina, unan hidroxiamina, un grupo tiol, un grupo carboxi, un isopropilo, un grupo metilo, una cadena recta C6-C2o o hidrocarburo ramificado, un hidrocarburo saturado o insaturado, un grupo O-metilo, un grupo poliéter, un grupo nitro o lo similar. Además, también se contemplan los anillos de arilo múltiplemente sustituidos. Los análogos de glutamina de la invención incluyen, pero no se limitan a, derivados oc-hidroxi y derivados ?-sustituidos, derivados cíclicos y derivados de glutamina amida sustituidos. Ejemplos de análogos de fenilalanina incluyen, pero no se limitan a, fenilalaninas meta-sustituidas, en donde el sustituyente comprende un grupo hidroxi, un grupo metoxi, un grupo metilo, un grupo alilo, un grupo acetilo o - - lo similar. Ejemplos específicos de aminoácidos no naturales incluyen, pero no se limitan a una O-metil-L-tirosina, una L-3- (2-naftil) alanina, una 3-metil-fenilalanina, una 0-4-alil-L-tirosina, una 4-propil-L-tirosina, una tri-O-acetil-T?????ß-e?^^, una L-Dopa, una fenilalanina fluorinada, una isopropil-L-fenilalanina, una p-azido-L-fenilalanina, una p-acil-L-fenilalanina, una p-benzoil-L-fenilalanina, una L-fosfoserina, una fosfonoserina, una fosfonotirosina, una p-yodo-fenilalanina, una p-bromofenilalanina, una p-amino-L-fenilalanina y una isopropil-L-fenilalanina y lo similar. Las estructuras de una variedad de aminoácidos no naturales se proporcionan en las figuras, e.g., Figuras 17, 18, 19, 26 y 29. Típicamente, los aminoácidos no naturales de la invención se seleccionan o diseñan para proporcionar características adicionales no disponibles en los veinte aminoácidos naturales. Por ejemplo, el aminoácido no natural se diseña o selecciona opcionalmente para modificar las propiedades biológicas de una proteína, e.g., dentro de la cual se incorporan. Por ejemplo, las siguientes propiedades se modifican opcionalmente mediante la inclusión de un aminoácido no natural en una proteína: toxicidad, biodistribución, solubilidad, estabilidad, e.g., térmica, hidrolítica, oxidativa, resistencia a la degradación enzimática y lo similar, facilidad de purificación y procesamiento, propiedades estructurales, propiedades espectroscópicas, propiedades químicas y/o fotoquímicas, actividad catalítica, potencial redox, vida media, capacidad para reaccionar con otras moléculas, e.g., covalente o no covalentemente y lo similar. Síntesis Química de Aminoácidos no Naturales Muchos de los aminoácido no naturales proporcionados anteriormente se encuentran comercialmente disponibles, e.g., de Sigma (USA) o Aldrich (Milwaukee, WI, USA) . Aquellos que no se encuentran comercialmente disponibles se encuentran opcionalmente sintetizados como se proporcionó en los ejemplos siguientes o utilizando métodos estándar conocidos por aquellos expertos en la técnica. Para las técnicas de síntesis orgánica, ver, e.g. Química Orgánica de Fessendon y Fessendon, (1982, Segunda Edición, Willard Grant Press, Boston Mass.); Química Orgánica Avanzada de March (Tercera Edición, 1985, Wiley y Sons, New York) ; y Química Orgánica Avanzada de Carey y Sundberg (Tercera Edición, Partes A y B, 1990, Plenum Press, New York) . Por ejemplo, las fenilalaninas meta-sustituidas se sintetizan en un procedimiento como se resume en la Figura 14. Típicamente, NBS (N-bromosuccinimida) se agrega a un compuesto de metilbenceno meta-sustituido para dar un bromuro de bencilo meta-sustituido, que se hace reaccionar entonces con un compuesto de malonato para dar la fenilalanina meta-sustituida. Los sustituyentes típicos utilizados para la posición meta incluyen, pero no se limitan a, cetonas, grupos metoxi, alquilos, acetilos y lo similar. Por ejemplo, 3-acetil-fenilalanina se elabora al hacer reaccionar BS con una solución de 3-metilacetofenona . Para más detalles ver los ejemplos siguientes. Una síntesis similar se utiliza para producir una 3-metoxí fenilalanina . El grupo R en la posición meta del bromuro de bencilo en el caso es -OCH3. Ver, e.g., Matsoukas et al., J. ed.C em., 1995, 38, 4660-4669. En algunas modalidades, el diseño de aminoácidos no naturales se predispone mediante la información conocida acerca de los sitios activos de las sintetasas, e.g., sintetasas ARNt ortogonales utilizadas para aminoacilar un ARNt ortogonal. Por ejemplo, se proporcionan tres clases de análogos de glutamina, incluyendo derivados sustituidos en el nitrógeno de amida (1) , un grupo metilo en la posición ? (2) y un derivado N-CY-ciclico (3) . En base a la estructura de cristal de rayos x de E. coli GlnRS, en la cual los residuos del sitio de unión clave son homólogos a la levadura GlnRS, los análogos se diseñaron para complementar un arreglo de las mutaciones de cadena lateral de los residuos dentro de una envoltura de 10 Á de la cadena lateral de glutamina, e.g., una mutación del Phe233 del sitio activo para un pequeño aminoácido hidrofóbico puede complementarse mediante el - - volumen estérico incrementado en la posición Cy de Gln. Por ejemplo, N-ftaloilo-L-glutámico 1 , 5-anhídrido (número de compuesto 4 en la Figura 23) opcionalmente se utiliza para sintetizar análogos de glutamina con sustituyentes en el nitrógeno de la amida. Ver, e.g., King, F.E. 5 Kidd, D.A.A. A New Synthesis of Glutamine and of ?-Dipeptides of Glutamic Acid From Phthylated Intermediates (Una Nueva Síntesis de Glutamina y de ?-Dipéptidos de Ácido Glutamínico a Partir de Intermediarios Ftilados) J. Chem. Soc . , 3315-3319 (1949); Friedman, O.M. & Chatterrji, R. Synthesis of Derivatives of Glutamine as Model Substrates for Anti-Tumor Agents (Síntesis de Derivados de Glutamina como Sustratos Modelo para Agentes de Anti-Tumor) J.Am. Chem. Soc. , 81, 3750-3752 (1959); Craigh, J.C. et al . , .Absolute Configuration of the Enantiomers of 7-Chloro-4 [ [4- (diethylamino) -1-methylbutyl] amino] quinoline (Chloroquine) (Configuración Absoluta de los Enantiomeros de 7-Cloro-4 [ [4- (dietilamino) -1-metilbutil] amino] quinolina (Cloroquina) J.Org.Chem. 53, 1167-1170 (1988); y Azoulay, M. Vilmont, M. & Frappier, F. Glutamine analogues as Potential Antimalarials (Análogos de Glutamina como Antimalarios Potenciales) , Eur.J.Med.Chem. 26, 201-5 (1991) . El anhídrido se prepara típicamente a partir de ácido glutámico mediante la primer protección de la amina como la ftalmida seguida por reflujo en ácido acético. El anhídrido se abre entonces con un número de aminas, dando como resultado un rango de sustituyentes en la amida. La desprotección del grupo ftaloilo con hidracina proporciona un aminoácido libre como se muestra en la Figura 23. La sustitución en la posición ? se lleva a cabo típicamente a través de la alquilación del ácido glutámico. Ver, e.g. , Koskinen, ?.?.?. & Rapoport, H. Synthesis of 4-Substituted Prolines as Conformationally Constrained Amino Acid Analogues (Síntesis de Prolinas 4-Sustituídas como Análogos de Aminoácido que se Restringen Conformacionalmente) J.Org.Chem. 54, 1859-1866 (1989). Un aminoácido protegido, e.g., como se ilustró por el número de compuesto 5 en la Figura 24 se prepara opcionalmente mediante la primer alquilación del residuo amino con 9-bromo-9-fenilfluoreno (PhflBr) (ver, e.g., Christie, B.D. & Rapoport, H. Synthesis of Optically Puré Pxpecolates from L-Asparagine (Síntesis de Pipecolatos Opcionalmente Puros a partir de L-Asparagina) . Application to the Total Synthesis of (+) -Apovincamine through Amino Acid Decarbonylation and Iminium Ion Cyclization (Aplicación de la Síntesis Total de (+) -Apovicamina a través de la Descarbonilación del Aminoácido y Ciclización del I n de Iminio) J.Org.Chem. 1989, 1859-1866 (1985) ) y después la esterificación del residuo ácido utilizando O-tert-butil-N, 1\T -diisopropilisourea . La adición de K (Si (CH3) 3) 2 desprotona regioselectivamente en la posición a del metil éster para formar el enolato, que se alguilata opcionalraente entonces con un rango de yoduros de alquilo. La hidrólisis del t-butil éster y el grupo Phfl da el análogo de glutamina de ?-metil deseado (Compuesto número 2 en la Figura 24) . Un análogo N-CT cíclico, como se ilustra por el Compuesto número 3 en la Figura 25, se prepara opcionalmente en 4 etapas a partir de Boc-Asp-Ot-Bu como se describió previamente. Ver, e.gr. , Barton, D.H.R. , Herve, Y., Potier, P. & Thierry, J. Synthesis of Novel a-Amino-Acids and Derivatives Using Radical Chemistry: Synthesis of L- and D-a-Amino-Adipic Acids, L-a-aminopimelic Acid and Appropriate Unsaturated Derivatives (Síntesis de unos Nuevos Aminoácidos y Derivados Utilizando Química Radical: Síntesis de Ácidos Adípicos Amino L- y D-a, Ácidos aminopimélicos L-a y Derivados Insaturados Apropiados) Tetrahedron Lett. 43, 4297-4308 (1987) y Subasinghe, N. , Schulte, . , Roon, R.J., Koerner, J.F. & Johnson, R.L. Quisqualic acid analogues: synthesis of beta-heterocyelic 2-aminopropanoic acid derivatives and their activity at a novel quisqualate-sensitized site (Análogos de Ácido Quisqualico: síntesis de los derivados del ácido beta-heterocíclico 2-aminopropiónico y su actividad en un nuevo sitio de quiscualato sensibilizado) J Med Chem. 35 4602-7 (1992) . La generación del anión del N-t-Boc-pirrolidinona, pirrolidinona u - - oxazolidona seguida por la adición del compuesto 7, como se muestra en la Figura 25, da como resultado un producto de adición de Michael . La desprotección con TFA da como resultado entonces los aminoácidos libres. Además de los aminoácidos no naturales anteriores, se ha diseñado también una biblioteca de análogos de tirosina. En base a la estructura de cristal de B. stearothermophilus TyrRS, cuyo sitio de actividad es altamente homólogo a aquel de la sintetasa de M. jannashii, se mutaron los residuos dentro de una envoltura de 10 Á de la cadena lateral aromática de tirosina (?32, G34, L65, Q155, D158, A167, Y32 y D158) . La biblioteca de los análogos de tirosina, como se muestra en Figura 26, se ha diseñado para complementar un arreglo de sustituciones para aquellos aminoácidos de sito activo. Estos incluyen una variedad de patrones se sustitución de fenilo, que ofrecen diferentes propiedades hidrofóbicas y de unión a hidrógeno. Los análogos de tirosina se preparan opcionalmente utilizando la estrategia general ilustrada por la Figura 27. Por ejemplo, se genera opcionalmente un enolato de dietil acetamidomalonato utilizando etóxido de sodio. Puede prepararse entonces el análogo de tirosina deseado al agregar un bromuro de bencilo apropiado seguido por hidrólisis. Absorción celular de aminoácidos no naturales La absorción del aminoácido no natural es un problema que se considera típicamente cuando se diseñan y seleccionan aminoácidos no naturales, e.g., para la incorporación en una proteína. Por ejemplo, la alta densidad de carga de a-aminoácidos sugiere que estos compuestos son improbablemente permeables a la célula. Los aminoácidos naturales se absorben en la bacteria a través de una colección de sistemas de transporte en base a la proteína desplegando varios grados de especificidad de aminoácidos. Por lo tanto, la presente invención proporciona una detección rápido para valorar qué aminoácidos no naturales, si los hay, se absorben por las células - Por ejemplo, una variedad de aminoácidos no naturales se examinan opcionalmente en un medio mínimo para la toxicidad de las células. Las toxicidades típicamente se clasifican en cinco grupos: (1) sin toxicidad, en la cual no ocurre cambio significativo en los tiempos de duplicación; (2) baja toxicidad, en la cual los tiempos de duplicación se incrementan por menos de aproximadamente 10%; (3) moderada toxicidad, en la cual los tiempos de duplicación se incrementan por aproximadamente 10% hasta aproximadamente 50%; (4) alta toxicidad, en la cual los tiempos de duplicación se incrementan por aproximadamente 50% hasta aproximadamente 100%; y (5) extrema toxicidad, en la cual los tiempos de duplicación se incrementan por más de aproximadamente 100%. Ver, e.g., Liu, D.R. & Schultz, P.G.
- Progress toward the evolution of an organism with an expanded gentic code (Progreso hacia la evolución de un organismo con un código genético expandido) . Proceedings of the National Academy of Sciences of the United States of America 96, {Procedimientos de la Academia Nacional de Ciencias de los Estados Unidos de América 96) 4780-47 85 (1999) . La toxicidad de los aminoácidos que se registra como alta o extremadamente tóxica se mide típicamente como una función de su concentración para obtener valores IC50. En general, los aminoácidos que son análogos muy cercanos de los aminoácidos naturales o que despliegan funcionalidad reactiva demuestran las toxicidades más altas . La tendencia anterior sugiere que los mecanismos de toxicidad para estos aminoácidos no naturales pueden ser la incorporación en proteínas o la inhibición de enzimas esenciales que procesan aminoácidos naturales . Para identificar posibles trayectorias de absorción para aminoácidos tóxicos, los ensayos de toxicidad se repiten opcionalmente a niveles IC50, e.g., en un medio complementado con un exceso de un aminoácido natural estructuralmente similar. Para los aminoácidos tóxicos, la presencia del exceso de aminoácido natural típicamente salva la capacidad de la células para desarrollarse en la presencia de la toxina, presumiblemente debido a que el aminoácido natural supera efectivamente la toxina para ya sea absorción celular - - o para unir a enzimas esenciales. En estos casos, el aminoácido tóxico se asigna opcionalmente a una trayectoria de absorción posible y etiqueta un "alelo letal" cuya complementación se requiere para la sobrevivencia celular. Estos alelos letales son extremadamente útiles para analizar la capacidad de las células para absorber los aminoácidos no naturales no tóxicos. La complementación del alelo tóxico, evidenciada por la restauración del crecimiento celular, sugiere que el aminoácido no tóxico se absorba por la célula, posiblemente mediante la misma trayectoria de absorción que la asignada al alelo letal . No es concluyente una falta de complementación. Para estudios ej emplificativos y conclusiones ver los ejemplos proporcionados más adelante. Los resultados obtenidos, e.g., como se describe en los ejemplos más adelante, demuestran que la complementación de alelos de aminoácido no natural letales es un método eficiente para valorar cualitativamente la absorción de aminoácidos. El método típicamente requiere bastante menos esfuerzos que grandes números de radioetiquetado de los compuestos y es por lo tanto un método más ventajoso para analizar los aminoácidos no naturales de interés. Esta estrategia general se utiliza opcionalmente para evaluar rápidamente la absorción celular de un amplio rango de moléculas tales como análogos base de ácido nucleico, análogos de carbohidrato o análogos de péptido. Por ejemplo, esta estrategia se utiliza opcionalraente para evaluar la absorción celular de los aminoácidos no naturales presentados en la presente. La presente invención también proporciona un método general para suministrar aminoácidos no naturales, que es independiente de todas las trayectorias de absorción de aminoácido. Este método general depende de la absorción a través de las permeasas de péptido, que transportan dipéptidos y tripéptidos a través de la membrana citoplásmica. Las permeasas de péptido no son muy especificas de la cadena lateral y los valores KD para sus sustratos son comparables con los valores KD de las permeasas de aminoácido, e.g., aproximadamente 0.1 mM hasta aproximadamente 10 mM) . Ver, e.g., Nickitenko, A., Trakhanov, S . & Quiocho, S. A structure of DppA, a periplasmic dipeptide transport/chemosensory receptor (Una estructura de DppA, un receptor de transporte/quimiosensitivo de dipéptido periplásmico) . Biochemistry 34, 16585-16595 (1995) y Dunten, P., Mo bray, S.L. Crystal structure of the dipeptide binding protein from Escherichia coli involved in active transport and chemotaxis (Estructura de cristal del dipéptido que se une a la proteína proveniente de Escherichia coli involucrada en el transporte activo y la quimiotáxis) . Proteína Science 4, 2327-34, (1995) . Los aminoácidos no naturales se absorben entonces como conjugados de amino cidos naturales, tales como - Usina y se liberan en el citoplasma en la hidrólisis del dipéptido mediante una de las peptidasas de E. coli endógenas. Para probar este procedimiento, se sintetizaron varios dipeptidos Unn-Lys y Lys-Unn mediante la síntesis de fase sólida y se probó el crecimiento de una cepa de E. coli deficiente en la biosíntesis de Usina en un medio mínimo de lisina en la presencia y ausencia de estos dipéptidos. La única fuente de lisina disponible para estas células es el dipéptido que contiene el aminoácido no natural . Se ha analizado de esta forma la absorción de fosfonoserina, fosfonotirosina, pentafluorofenilalanina y serina inmovilizada. En todos los cuatro casos, se observó el crecimiento en 10 mM y concentraciones de dipéptido mayores. Aunque la absorción se analiza fácilmente con el método proporcionado en la presente, una alternativa para diseñar aminoácido no natural que sea dócil para las trayectorias de absorción celulares, es proporcionar trayectorias biosintéticas para crear aminoácidos in vivo. Biosíntesis de Aminoácidos no naturales Ya existen muchas trayectorias biosintéticas en células para la producción de aminoácidos y otros compuestos. Aunque un método biosintético para un aminoácido no natural particular no pueda existir en la naturaleza, e.g., en E. coli, la presente invención proporciona tales métodos. Por ejemplo, las trayectorias biosintéticas para aminoácidos no - - naturales se generan opcionalmente en E. coli al agregar nuevas enzimas o modificar las trayectorias de E. coli existentes. Nuevas enzimas adicionales son opcionalmente enzimas que se presentan de manera natural o enzimas desarroladas artificialmente. Por ejemplo, la biosíntesis de p-aminofenilalanina (como se presenta en un ejemplo más adelante) depende de la adición de una combinación de enzimas conocidas a partir de otros organismos. Los genes para estas enzimas pueden introducirse en una célula, e.g., una célula de E. coli, al transformar la célula con un plásmido que comprende los genes. Los genes, cuando se expresan en la célula, proporcionan una trayectoria enzimática para sintetizar el compuesto deseado. Ejemplos de los tipos de enzimas que se agregan opcionalmente se proporcionan en los ejemplos siguientes. Se encontraron secuencias de enzimas adicionales, e.g., en Genbank. Las enzimas desarrolladas artificialmente también se agregaron opcionalmente en una célula en la misma forma. De esta forma, la maquinaria celular y los recursos de una célula se manipularon para producir aminoácidos no naturales . Se encuentra disponible una variedad de métodos para producir nuevas enzimas para utilizarse en las trayectorias biosintéticas o para la evolución de las trayectorias existentes. Por ejemplo, la recombinación recursiva, e.g., como se desarrolló por Maxygen, Inc. (en la - - de red mundial en maxygen.com), se utiliza opcionalmente para desarrollar nuevas enzimas y trayectorias. Ver, e.g., Stemmer 1994, "Rapid evolution of a protein in vitro by DNA shuffling" ("Rápida evolución de una proteína in vitro mediante redistribución de ADN") Nature Vol . 370 No. 4:Pg. 389-391; y Stemmer, 1994, "DNA shuffling by random fragmentation and reassembly: In vitro recombination for molecular evolution" ("Redistribución de ADN mediante fragmentación y reinstalación aleatorias" ) Proc.Natl.Acad.Sci. USA. Vol.91: Pg.10747-10751. De manera similar DesignPath™, desarrollado por Genencor (en la red mundial en genencor.com) se utiliza opcionalmente para ingeniería de trayectoria metabólica, e.g., para diseñar una trayectoria para crear 0-metil-L-tirosina en E coli. Esta tecnología reconstruye las trayectorias existentes en organismos huésped utilizando una combinación de nuevos genes, e.g., identificados a través de genómicos funcionales y evolución y diseño molecular. La Diversa Corporation (en la red mundial en diversa . com) también proporciona la tecnología para examinar rápidamente bibliotecas de genes y trayectorias genéticas, e.g., para crear nuevas trayectorias. Típicamente, los métodos de biosíntesis de la presente invención, e.g., la trayectoria para crear p-aminofenilalanina (pAF) a partir de corismato, no afecta la concentración de otros aminoácidos producidos en la célula.
- - Por ejemplo una trayectoria utilizada para producir pAF a partir de corismato produce pAF en la célula mientras que no se afectan sustancialmente las concentraciones de otros aminoácidos aromáticos típicamente producidos a partir de corismato. Típicamente el aminoácido no natural producido con una trayectoria biosintéticamente diseñada de la presente invención se produce en una concentración suficiente para la biosíntesis eficiente de la proteína, e.g., una cantidad celular natural, pero no a tal grado que afecte la concentración de otros aminoácidos o agote los recursos celulares . Las concentraciones típicas producidas in vivo en esta forma son de aproximadamente 10 mM hasta aproximadamente 0.05 mM. Una vez que se transforma una bacteria con un plásmido que comprende los genes utilizados para producir enzimas deseadas para una trayectoria específica y se genera un vigésimo primer aminoácido, e.g., pAF, dopa O-metil-L-tirosina o lo similar, las selecciones in vivo se utilizan opcionalmente para optimizar adicionalmente la producción del aminoácido no natural tanto para la síntesis de la proteína ribosomal como para el desarrollo celular. Composiciones que incluyen proteínas con aminoácidos no naturales La invención proporciona composiciones de materia, incluyendo proteínas con al menos un aminoácido no natural . La invención también proporciona composiciones de materia que - - incluyen proteínas con al menos un aminoácido no natural producido utilizando las composiciones y los métodos de la invención. En una modalidad, las proteínas se procesan y modifican en una forma dependiente de la célula, e.g., fosforiladas, glicosiladas, duplicadas, unida a la membrana, etc . En un aspecto, la composición opcionalmente incluye al menos aproximadamen e 10 microgramos , e.g., al menos aproximadamente 50 microgramos, al menos aproximadamente 100 microgramos, al menos aproximadamente 500 microgramos, al menos aproximadamente 1 miligramo o aún al menos aproximadamente 10 miligramos o más de la proteina, e.g., una cantidad que puede lograrse con los métodos de producción de proteína in vivo (se proporcionan en la presente detalles de la producción y purificación de la proteína recombinante) . Por ejemplo, la proteína se presenta opcionalmente en la composición a una concentración de al menos aproximadamente 10 microgramos por litro, al menos aproximadamente 50 microgramos por litro, al menos aproximadamente 100 microgramos por litro, al menos aproximadamente 500 microgramos por litro, al menos aproximadamente 1 miligramo por litro o al menos aproximadamente 10 miligramos por litro de la proteína o más microgramos o proteína por litro, e.g., en un lisado celular, amortiguador farmacéutico u otra suspensión líquida (e.g., en un volumen de, e.g., cualquiera desde aproximadamen e 1 ni hasta aproximadamente 100L) . La producción de grandes cantidades (e.g., mayor a la típicamente posible con otros métodos, e.g., traducción in vitro) de una proteína incluyendo al menos un aminoácido no natural es una característica de . la invención y es una ventaja sobre la técnica anterior. La producción de grandes cantidades (e.g., mayor a la típicamente posible con otros métodos, e.g., traducción in vitro) de una proteína incluyendo al menos un aminoácido no natural es una característica de la invención y es una ventaja sobre la técnica anterior. Por ejemplo, la capacidad para sintetizar grandes cantidades de proteínas que contienen e.g., átomos pesados, facilita la vía de determinación de estructura de la proteína, e.g., cistalografía por rayos X. La incorporación de un aminoácido no natural puede hacerse para, e.g., diseñar cambios en la estructura y/o funcionamiento de la proteína, e.g., para cambiar el tamaño, acidez, nucleofilicidad, unión a hidrógeno, hidro obicidad, accesibilidad de los sitios objetivo de proteasa, etc. Las proteínas que incluyen un aminoácido no natural pueden tener propiedades catalíticas o físicas mejoradas o aún totalmente nuevas. Por ejemplo, las siguientes propiedades se modifican opcionalmente mediante la inclusión de un aminoácido no natural en una proteína: toxicidad, biodistribución, propiedades estructurales, propiedades espectroscópicas, propiedades químicas y/o fotoquímicas, capacidad catalítica, vida media (e.g., vida media en suero), capacidad para reaccionar con otras moléculas, e.g., covalente o no covalentemente y lo similar. Las composiciones que incluyen proteínas que incluyen al menos un aminoácido no natural son útiles para, e.g., nuevos terapéuticos, diagnósticos, enzimas catalíticas, proteínas de unión (e.g., anticuerpos) y e.g., el estudio de la estructura y función de la proteína. En un aspecto de la invención, una composición incluye al menos una proteína con al menos uno, e.g., al menos dos, al menos tres, al menos cuatro, al menos cinco, al menos seis, al menos siete, al menos ocho, al menos nueve, al menos diez o más aminoácidos no naturales . Para una proteína dada con más de un aminoácido no natural, los aminoácidos no naturales pueden ser idénticos o diferentes (e.g., la proteína puede incluir dos o más diferentes tipos de aminoácidos no naturales o puede incluir dos o más sitios diferentes que tienen aminoácidos no naturales o ambos) . Esencialmente cualquier proteína que incluye un aminoácido no natural (y cualquier ácido nucleico correspondiente de codificación, e.g., que incluye uno o más codones selectores) puede producirse utilizando las composiciones y los métodos de la presente. No se hacen intentos para identificar los cientos de miles de proteínas conocidas, cualquiera de las cuales pueden modificarse para - - incluir uno o más aminoácidos no naturales, e.g., mediante la adaptación de cualquier método de mutación disponible para incluir uno o más codones selectores apropiados en el sistema de traducción relevante. Los depósitos comunes de secuencias para las proteínas conocidas incluyen el GenBank EMBL, DDBJ y el NCBI . Pueden identificarse fácilmente otros depósitos al buscar en la internet . Una clase de proteínas preferida que puede hacerse utilizando las composiciones y los métodos para la incorporación in vivo de aminoácidos no naturales descrita en la presente incluye las proteínas terapéuticas. Ejemplos de proteínas terapéuticas y otras que pueden modificarse para comprender un o más no naturales incluyen, e.g., anticuerpos de Antitripsina Alfa-1, Angiostatina, Factor antihemolítico, (los detalles adicionales de anticuerpos se encuentran más adelante) , Apolipoproteína, Apoproteína, Factor natriurético atrial, Polipéptido natriurético atrial, Péptidos atriales, quimocinas C-X-C (e.g., T39765, NAP-2, ENA-78, Gro-a, Gro-b, Gro-c, IP-10, GCP-2, NAP-4, SDF-1, PF , MIG) , Calcitonina, quimocinas CC (e.g., Proteína-1 quimioatrayente de monocitos, Proteína-2 quimioatrayente de monocitos, Proteína-3 quimioatrayente de monocitos, Proteína-1 alfa inflamatoria de monocitos, Proteína-1 beta inflamatoria de monocitos, RANTES, 1309, R83915, R91733, HCC1, T58847, D31065, T64262), ligando CD40, ligando de c-kit, Colágeno, Factor de estimulación de - colonia (CSF) , Factor 5a del complemento, Inhibidor del complemento, Receptor 1 del complemento, citocinas, (e.g., Péptido-78 que Activa el Neutrófilo Epitelial, GROoc/MGSA, GROP, GROy, ???-?a, ???-?d, MCP-1) , Factor de Crecimiento Epidérmico (EGF) , Eritropoyetina ("EPO, que representa un objetivo preferido para la modificación mediante la incorporación de uno o más aminoácidos no naturales) , Toxinas de Exfoliación A y B, Factor IX, Factor VII, Factor VIII, Factor X, Factor de crecimiento de fibroblastos (FGF) , Fibrinógeno, Fibronectina, G-CSF, GM-CSF, Glucocerebrosidasa, Gonadotropina, factores de crecimiento, proteínas de Hedgehog (e.g., Sonic, India, Desert) , Hemoglobina, Factor de Crecimiento de Hepatocitos (HGF) , Hirudina, Albúmina de suero humano, Insulina, Factor de Crecimiento similar a la Insulina (IGF) , interferones {e.g., IFN-a, IFN-ß, IFN-?) , interleucinas (e.g., IL-1, IL-2, IL-3, IL-4, IL-5, IL-6, IL-7, IL-8, IL-9, IL-10, IL-11, IL-12, etc.), Factor de crecimiento de gueratinocitos (KGF) , Lactoferrina, factor inhibidor de la leucemia, Luciferasa, Neurturina, Factor inhibidor de neutrófilo (NIF) , oncostatina , Proteína osteogénica, Hormona paratiroidea, PD-ECSF, PDGF, hormonas de péptido (e.g., Hormona del crecimiento humano), Pleiotropina, Proteína A, Proteína G, Exotoxinas pirogénicas A, B, y C, Relaxina, Renina, SCF, Receptor I soluble del complemento, I-CAM 1 soluble, receptores de xnterleucxna solubles (IL-1, 2, - - 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 14, 15), Receptor TRR soluble, Somatomedina, Somatostatina, Somatotropina, Estreptocinasa, Superantígenos , i.e., Enterotoxinas estafilococales (SEA, SEB, SEC1, SEC2 , SEC3 , SED, SEE) , Dismutasa de superóxido, toxina del síndrome de choque tóxico (TSST-1) Timosina alfa 1, Activador del tejido plasminógeno, Factor beta de necrosis tumoral (TNF beta) , Receptor del factor de necrosis tumoral (TNFR) , factor-alfa de necrosis tumoral (TNF alfa) , Factor de Crecimiento Endotelial Vascular (VEGEF) , Urocinasa y muchos otros. Se conocen muchas de estas proteínas que se encuentra comercialmente disponibles (Ver, e.g., el catálogo Sigma BioSciences 2002 y la lista de precios) y las secuencias de proteína y genes correspondientes y, típicamente muchas variantes de las mismas (ver, e.g., GeneBank) . Cualquiera de ellas puede modificarse mediante la inserción de uno o más aminoácidos no naturales de acuerdo con la presente invención, e.g., para alterar la proteína con respecto a una o más propiedades terapéuticas de interés . Ejemplos de propiedades terapéuticamente relevantes incluyen vida media en suero, vida media de anaquel, estabilidad, inmunogenicidad, actividad terapéutica, detectabilidad {e.g., mediante la inclusión de grupos informadores {e.g., etiquetas o sitios de unión de etiquetas) en los aminoácidos no naturales) reducción de LD-50 u otros efectos laterales, la - - capacidad para entrar al cuerpo a través del tracto gástrico (e.gr., disponibilidad oral) o lo similar. Una clase de proteínas que puede hacerse utilizando las composiciones y métodos para la incorporación in vivo de aminoácidos no naturales descritos en la presente, incluye activadores transcripcionales y de expresión. Ejemplos de activadores transcripcionales y de expresión incluyen genes y proteínas que modulan el crecimiento, la diferenciación, la regulación celulares o lo similar. Los activadores de expresión y transcripcionales se encuentran en procariotes, virus y eucariotes, incluyendo, hongos, plantas y animales, incluyendo mamíferos, que proporcionan un amplio rango de objetivos terapéuticos. Se apreciará que los activadores de expresión y transcripcionales regulan la transcripción mediante muchos mecanismos, e.g., mediante la unión a receptores, estimulación de una cascada de transducción de señal, regulando la expresión de los factores de transcripción, uniéndose a promotores y mejoradores, uniéndose a proteínas que se unen a los promotores y a los mejoradores, desenvolviendo el ADN, empalmando el pre-A Nm, poliadenilando el AR y degradando el ARN. Una clase de proteínas preferida de la invención (e.gr., proteínas con uno o más aminoácidos no naturales) incluye los activadores de expresión tales como citocinas, moléculas inflamatorias, factores de crecimiento, sus - - receptores y productos del oncogen, e.g., interleucinas {e.g., IL-1, IL-2, IL-8, etc.), xnterferones FGF, IGF-I, IGF-II, FGF, PDGF, TNF, TGF-a, TGF-ß, EGF, GF, SCF/c-kit, CD40L/CD40, VLA-4/VCAM-1, ICAM-l/LFA-1 e hyalurxn/CD44 ; las moléculas de transducción de señal y productos del oncogen correspondientes, e.g., Mos, Ras, Raf y Met; y activadores y supresores transcripcionales , e.g., p53 , Tat, Fos, Myc, Jun, Myb, Reí y receptores de la hormona esteroide tales como aquellos para estrógeno, progesterona, testosterona, aldoesterona, el ligando receptor LDL y corticosterona. Una variedad de otras proteínas pueden también modificarse para incluir uno o más aminoácidos no naturales de la invención. Por ejemplo, la invención puede incluir sustituir uno o más aminoácidos naturales en una o más proteínas de vacuna con un aminoácido no natural, e.g., en proteínas provenientes de hongos infecciosos, e.g., las especies Aspergillus, Candida; bacterias, particularmente E. coli, que sirve como modelo para las bacterias patogénicas, así como bacterias médicamente importantes tales como Staphylococci (e.g., aureus) o Streptococci (e.g., pneumoniae) ; protozoa tal como sporozoa (e.g., Plasmodia) , rhizopods (e.g., Entamoeba) y flagelados (Trypanosoma, Leishmania, Trichomonas, Giardia, etc.); virus tales como virus de ARN (+) (los ejemplos incluyen Poxvirus e.g., vaccinia; Picornavirus, e.g. polio; Togavirus, e.g., rubella; - - Flavivirus, e.g., HCV; y Coronaviruses, virus de ARN (-) (e .g. , R abdovirus , e.g., VSV Paramixovimses , e.g., RSV; Ortomixovimses, e.g., influenza; Buniavirus; y Arenavirus) , virus de ADNds (Por ejemplo, Reovirus) , virus de ARN a ADN, i.e., Retrovirus, e.g., HIV y HTLV y ciertos virus de ADN a ARN tales como Hepatitis B. También puede modificarse una variedad de' enzimas (e.g., enzimas industriales) para incluir uno o más aminoácidos no naturales de acuerdo con los métodos de la presente, tales como amidasas, racemasas de aminoácidos, acilasas, deshalogenasas , dioxigenasas, peroxidasas de diarilpropano, epimerases, hidrolasas deepóxido, esterasas, isomerasas, cinasas, glucosa isomerasas, glicosidasas, glicosil transferasas, haloperoxidasas , monooxigenasas (e.g., p450s) , lipasas, peroxidasas de lignina, hidratasas de nitrilo, nitrilasas, proteasas, fosfatasas, subtilisinas , transaminasa y nucleasas. Las proteínas agrícolamente relacionadas tales como las proteínas resistentes a insectos (e.g., las proteínas Cry) , enzimas de producción de almidón y lípidos, toxinas de plantas e insectos, proteínas resistentes a la toxina, Proteínas de destoxificación de micotoxina, enzimas de crecimiento de plantas (e.g., Ribulose 1,5- Bisfosfato Carboxilasa/Oxigenasa, "RUBISCO"), lipoxigenasa (LOX) y Fosfoenolpiruvato (PEP) carboxilasa son objetivos también - - adecuados para la modificación de aminoácidos no naturales . Los genes que codifican para proteínas que incluyen al menos un aminoácido no natural pueden mutagenizarse utilizando métodos bien conocidos por un experto en la técnica y se describe en la presente bajo "Técnicas Generales de Biología Molecular". Por ejemplo, un ácido nucleico para una proteína de interés se mutageniza para incluir uno o más codones selectores, proporcionado la inserción del uno o más aminoácidos no naturales . La presente invención incluye cualquiera de tales variantes, e.g., mutante, versiones de cualquier proteína, e.g., incluyendo al menos un aminoácido no natural De manera similar, la presente invención también incluye ácidos nucleicos correspondientes, i.e., cualquier ácido nucleico con uno o más codones selectores que codifican uno o más aminoácidos no naturales . En una modalidad ej emplificativa, la invención proporciona composiciones que incluyen un mutante Aspll2TAG de cloroanfenicol acetilransferasa (CAT) producido mediante las composiciones y los métodos de la invención, en donde la proteína CAT incluye al menos un aminoácido no natural, e.g., una O-metil-L-tirosina, una L-3- (2-naftil) lanina, un análogo de tirosina que contiene amino-, isopropilo-, o alilo, etc. y la proteína se encuentra presente en la composición a una concentración de al menos aproximadamente 100 microgramos por litro. E otra modalidad, la invención proporciona composiciones que incluyen un mutante Tyrl63TAG de reductasa de dihidrofolato de ratón (DHF ) en donde la proteína DHFR incluye al menos un amino no natural, e.g., una O-metil-L-tirosina, una L-3- (2-naftil) alanina, un análogo de tirosina que contiene amino-, isopropilo- o alilo, etc. y la proteína se encuentra presente en la composición a una concentración de al menos aproximadamente 100 microgramos por litro. Elaboración de anticuerpos para proteínas que comprenden aminoácidos no naturales En un aspecto, la presente invención proporciona anticuerpos para aminoácidos y proteínas no naturales que comprenden aminoácidos no naturales . Los anticuerpos para aminoácidos y proteínas no naturales que comprenden tales aminoácidos no naturales son útiles como reactivos de purificación, e.g., para purificar las proteínas y aminoácidos no naturales de la invención. Además, los anticuerpos pueden utilizarse como reactivos indicadores para indicar la presencia de un aminoácido o proteína no natural que comprende un aminoácido no natural. También, por supuesto, es el caso que el aminoácido no natural puede comprender por si mismo uno o más aminoácidos no naturales, proporcionando mediante esto un anticuerpo con una o más propiedades conferidas por el uno o más aminoácidos no naturales .
- - Un anticuerpo de la invención puede ser una proteína que comprende uno o más polipéptidos sustancialmente o parcialmente codificados por genes de inmunoglogulina o fragmentos de genes de inmunoglobulina . Los genes de inmunoglobulina reconocidos incluyen los genes de región constante kappa, lambda, alfa, gamma, delta, épsilon y mu, así como los innumerables genes de región variable de inmunoglobulina. Las cadenas ligeras se clasifican ya sea como cappa o lambda. Las cadenas pesadas se clasifican como gamma, mu, alfa, delta o épsilon, las cuales a su vez definen las clases de inmunoglobulina, IgG, IgM, IgA, IgD e IgE, respectivamente . Una unidad estructural de inmunoglobulina típica (i.e., anticuerpo) comprende un tetrámero. Cada tetramero esta compuesto de dos pares idénticos de cadenas de polipéptidos, teniendo cada par una cadena "ligera" (aproximadamente 25 kD) y una "pesada" (aproximadamente 50-70 kD) . La N-terminal de cada cadena define una región variable de aproximadamente 100 a 110 o más aminoácidos responsables principalmente del reconocimiento del antígeno. El término cadena ligera variable (VL) y cadena pesada variable (VH) se refiere a estas cadenas ligera y pesada, respectivamente. Los anticuerpos existen como inmunoglobulinas intactas o como varios fragmentos bien caracterizados producidos por la digestión con varias peptidasas. Así, por ejemplo, la pepsina digiere un anticuerpo por debajo de los - - enlaces de disulfuro en la región de articulación para producir F(ab')2, un dímero de Fab que por si mismo es una cadena ligera unida VH-CH1 mediante un enlace de disulfuro. El F(ab')2 puede reducirse mediante condiciones benignas para romper en enlace de disulfuro en la región de articulación convirtiendo mediante esto el dímero F(ab' )2 en un monómero Fab' . El monómero Fab' es esencialmente un Fab con parte de la región de articulación (ver. Fundamental Immunology, W.E. Paul, Ed., Raven Press, N.Y. (1999), para una descripción más detallada de otros fragmentos de anticuerpo) . Aunque se definen varios fragmentos de anticuerpo en términos de la digestión de un anticuerpo intacto, alguien de experiencia apreciará que tales fragmentos Fab', etc. pueden sintetizarse de nuevo ya sea químicamente o al utilizar metodología de ADN recombinante . Asi, el término anticuerpo, como se utiliza en la presente, también incluye opcionalmente fragmentos de anticuerpo ya sea producidos por la modificación de anticuerpos completos o sintetizados de novo utilizando metodologías de ADN recombinante . Los anticuerpos incluyen anticuerpos monocatenarios, que incluyen anticuerpos de una cadena FV (sFv o scFv) en el cual una cadena pesada variable y una ligera variable se unen juntos (directamente o a través de un enlace peptídico) para formar un polipéptido continuo. Los anticuerpos de la invención pueden ser e.g., policlonales, monoclonales , quiméricos, monocatenarios, fragmentos Fab, fragmentos producidos por una biblioteca de expresión Fab, o lo similar. En general, los anticuerpos de la invención son valiosos, tanto como reactivos generales así como reactivos terapéuticos en una variedad de procesos biológicos moleculares o f rmacéuticos. Los métodos para producir anticuerpos policlonales y monoclonales se encuentran disponibles, y pueden aplicarse para elaborar los anticuerpos de la presente invención. Varios de los textos básicos describen procesos estándar de producción de anticuerpos, incluyendo, e.g. , Borrebaeck (Ed.) (1995) Antibody Engineering, 2a. Edición Freeman and Company, NY (Borrebaeck); McCafferty et al., (1996) Antibody Engineering, A Practical Approch IRL en Oxford Press, Oxford, Inglaterra (McCafferty) , y Paul (1995) Antibody Engineering Protocole Humana Press, Towata, NJ (Paul) ; Paul (Ed) , (1999) Fundamental Immunology, Quinta edición Raven Press, ?.?.; Coligan (1991) Current Protocole in Immunology Wiley/Green, NY; Harlow y Lañe (1989) Antibodies : A Laboratory Manual Cold Spring Harbor Press, NY; Stites et al., (eds) Basic and Clinical Immunology (4a. Ed.) Lange Medical Publications , Los Altos, CA, y las referencias citadas en la presente; Goding (1986) Monoclonal Antibodies : Principies and Practice (2a Ed.) Academic Press, New York, NY; y Kohler y Milstein (1975) Nature 256: 495-497.
Una variedad de técnicas recombinantes para la preparación de anticuerpos las cuales no dependen de, e.g., la inyección de un antígeno en un animal que se ha desarrollado y puede utilizarse en el contexto de la presente invención. Por ejemplo, es posible generar y seleccionar archivos de anticuerpos recombinantes en fago o vectores similares. Ver, e.g., Winter et al., (1994) "Making Antibodies by Phage Display Technology" ("Elaboración de Anticuerpos Mediante Tecnología de Despliegue de Fago"), Annu. Re . Immunol . 12:433-55 y las referencias citadas en la presente para una revisión. Ver también, Griffiths y Duncan (1998) "Strategies for selection of antibodies by phage display" ("Estrategias para la selección de anticuerpos mediante despliegue de fago"), Curr Opin Biotechnol 9: 102-8; Hoogenboom et al., (1998) "Antibody phage display technology and its applications" ("Tecnología de despliegue de fago de anticuerpo y sus aplicaciones"), Immunotechnology 4: 1-20; Gram et al., (1992) "in vitro selection and affinity maturation of antibodies from a naive combinational immunoglobulin library" ("selección in vitro y maduración por afinidad de anticuerpos a partir de una biblioteca de inmunoglobulina combinacional naive"), PNAS 89:3576-3580: Huse et al., (1989) Science 246: 1275-1281; y Ward et al., (1989) Nature 341: 544-546.
- - En una modalidad, las bibliotecas de anticuerpos pueden incluir repertorios de genes V {e.g., cosechados de poblaciones de linfocitos o ensamblados in vitro) los cuales se clonan para desplegar dominios variables de cadena pesada y ligera asociados sobre la superficie de bacteriófagos filamentosos. El fago se selecciona mediante la unión a un antlgeno. Los anticuerpos solubles se expresan de bacterias infectadas por fago y los anticuerpos pueden mejorarse, e.g., a través de mutagénesis . Ver e.g., Balint y Larrick (1993) "Antibody Engineering by Parsimonious Mutagénesis" ("Diseño de Anticuerpo Mediante Mutagénesis Parsimoniosa"), Gene 137:109-118; Stemmer et al., (1993) "Selection of an Active Single Chain Fv Antibody From a Protein Linker Library Prepared by Enzimatíc Inverse PCR" ("Selección de un Anticuerpo Fv Activo de Una Cadena a Partir de una Biblioteca de Enlazador de Proteína Preparado por PCR Inversa Enzimática" ) , Biotechniques 14 (2) :256-65; Crameri et al., (1996) "Construction and evolution of antibody-phage librarles by DNA shuffling" ("Construcción y evolución de archivos de anticuerpo-fago mediante la recombinación de ADN"), Nature Medicine 2: 100-103; y Crameri y Stemmer (1995) "Combinational múltiple cassette mutagénesis creates all the permutations of mutant and wildtype cassettes" ("La mutagénesis de múltiples casetes combinacionales crean todas las permutaciones de los casetes mutantes y tipo silvestre") , - BioTechniques 18:194-195. Los equipos para la clonación y expresión de sistemas de fago de anticuerpo recombinante también se conocen y se encuentran disponibles, e.g., el "módulo ScFv de ratón del sistema de anticuerpo de fago recombinante" de Amersham-Pharmacia Biotechnology (Uppsala, Suecia) . Las bibliotecas de anticuerpo de bacteriófago también se han producido para elaborar anticuerpos humanos de alta afinidad mediante recombinación de cadena (Ver, e.g. , Marks et al., (1992) "By-Passing Immunization: Building High Affinity Human Antibodies by Chain Shuffling" ("Inmunización por Desviación; Construcción de Anticuerpos Humanos de Alta Afinidad Mediante Recombinación de Cadena"), Biotechniques 10: 779-782. Ciertamente, los anticuerpos pueden ordenarse según el cliente típicamente a partir de una variedad de fuentes, tal como PeptidoGenic (pkim@conet.com), HTI Bio-products, inc . (www.htibio.com) , BMA Biomedicals Ltd (U.K.), Bio . Syntesis, Inc. Research Genetics (Huntsville, Alabama) y muchos otros. En ciertas modalidades es útil "humanizar" los anticuerpos de la invención, e.g., cuando los anticuerpos se administran terapéuticamente. El uso de anticuerpos humanizados tiende á reducir la incidencia de respuestas inmunes indeseables contra los anticuerpos terapéuticos (e.g. , cuando el paciente es un humano) . Las referencias anteriores de anticuerpos describen estrategias de - - humanización. Además de los anticuerpos humanizados, los anticuerpos humanos también son una característica de la invención. Los anticuerpos humanos consisten de secuencias de inmunoglobulinas característicamente humanas. Los anticuerpos humanos pueden producirse utilizando una amplia variedad de métodos (ver e.g., Larrick et al., Pa . de E.U. No. 5,001,065 para revisión). Un procedimiento general para producir anticuerpos humanos mediante tecnología trioma se describe por Ostberg et al., (1983), Hybridoma 2: 361-367, Ostberg, Pat. de E.U. No. 4,634,664 y Engelman et al., Pat. de E.U. No. 4, 634,666. Se conoce una variedad de métodos para utilizar anticuerpos en la purificación y detección de proteínas y pueden aplicarse para detectar y purificar proteínas que comprenden aminoácidos no naturales como se anota en la presente. En general, los anticuerpos son reactivos útiles para ELISA, inmuno nálisis western, inmunoquímica, métodos de cromatografía de afinidad, SPR y muchos otros métodos. Las referencias anotadas arriba proporcionan detalles de cómo realizar los análisis ELISA, inmunotransferencia western, resonancia superficial del plasmón (SPR) y lo similar. En un aspecto de la invención, los anticuerpos de la invención por si mismos incluyen aminoácidos no naturales, que proporcionan los anticuerpos con propiedades de interés (e.g-., vida media mejorada, estabilidad, toxicidad, o lo similar. Los anticuerpos dan razón de cercanamente el 50% de todos los compuestos actualmente en las pruebas clínicas ( ittrup, (1999) "Phage on display" ("Fago en despliegue"), Tibtech 17: 423-424 y los anticuerpos se utilizan de manera ubicua como reactivos para diagnóstico. De acuerdo con lo anterior, la capacidad de modificar los anticuerpos con aminoácidos no naturales proporciona una importante herramienta para modificar estos valiosos reactivos. Por ejemplo, existen muchas aplicaciones de MTABs para los campos de diagnósticos. Los análisis varían de pruebas puntuales hasta métodos más complicados tales como NR-LU-10 Mab radioetiquetado de DuPont Merck Co. utilizado para formar la imagen del tumor (Rusch et al., (1993) "exploración del anticuerpo monoclonal NR-LU-10. Un nuevo aditamento útil para la tomografía computada para evaluar células no pequeñas de cáncer de pulmón" . J Thorac Cardiovasc Surg 106: 200-4) . Como se anotó, los Mabs son reactivos centrales para ELISA, inmunotransferencia western, inmunoquímica, métodos de cromatografía de afinidad y lo similar. Cualquiera de tales anticuerpos de diagnóstico pueden modificarse para incluir uno o más aminoácidos no naturales, alterar e.g., la especificidad o afinidad del Ab para un objetivo, o alterar una o más propiedades detectables, e.g., al incluir una etiqueta detectable [e.g., espectrográfica, fluorescente, luminiscente. etc.) en el aminoácido no natural . Una clase de reactivos de anticuerpo valiosos son los Abs terapéuticos. Por ejemplo, los anticuerpos pueden ser Mabs específicos de tumor que interrumpen el crecimiento del tumor al elegir como objetivo las células de tumor para la destrucción mediante citotoxicidad mediada por células dependientes del anticuerpo (ADCC) o lisis mediada por el complemento (CML) (estos tipos generales de Abs se refieren algunas veces como "balas mágicas") . Un ejemplo es Rituxan, un Mab anti-CD20 para el tratamiento de linfoma no de Hodgkins (Scott (1998) "Rituximab: Un nuevo anticuerpo monoclonal terapéutico para linfoma no de Hodgkin" Cáncer Pract 6: 195-7). Un segundo ejemplo se refiere a anticuerpos que interfieren con un componente crítico de crecimiento de tumor. Herceptin es un anticuerpo monoclonal HER-2 para el tratamiento de cáncer de seno metastásico, y proporciona un ejemplo de un anticuerpo con este mecanismo de acción (Baselga et al., (1998) "Recombinant humanized anti_HER-2 antibody (Herceptin) enhances the antitumor activity of paclitaxel and doxorubicin against HER2/neu overexpressing human breast cáncer xenograftd ("El anticuerpo anti HER-2 humanizado recombinante (Herceptin) mejora la actividad antitumoral dé paclitaxel y doxorubicin contra HER2/xenoinj ertos de cáncer de seno humano que sobreexpresan neu [las erratas publicadas aparecen en Cáncer Res (1999) - - 59(8):2020], Cáncer Res 58:2825-31). Un tercer ejemplo, se refiere a anticuerpos para el suministro de compuestos citotóxicos (toxinas, radionúclidos, etc. directamente a un tumor u otro sitio de interés. Por ejemplo, un Mab de aplicación es CYT-356, un anticuerpo enlazado a 90Y que dirige la radiación directamente hacia las células del tumor de próstata (Deb et al., (1996) "Treatment of hormone-refractory prostate cáncer with 90Y-CYT-356 monoclonal antibody" ("Tratamiento del cáncer de próstata refractario a la hormona con anticuerpo monoclonal 90Y-CYT-356" Clin Cáncer Res 2: 1289-97. Una cuarta aplicación es la terapia de prodroga de enzima dirigida al anticuerpo, en donde una enzima co-localizada hacia un tumor activa una prodroga sistémicamente administrada en las inmediaciones del tumor. Por ejemplo, un anticuerpo anti-Ep-CAMI enlazado a una carboxipeptidasa A se esta desarrollando para el tratamiento del cáncer colorectal (Wolfe et al., (1999) "Antibody-directed enzime prodrug therapy with the T268G mutant of human carboxypeptidase Al: in vitro and in vivo studies whith prodrugs of methotrexate and the thymidylate synthase inhibitors GW1031 and GW1843" ("Terapia de prodroga de enzima dirigida al anticuerpo con el mutante T268G de la carboxipeptidasa humana Al: estudios in vit.ro e in vivo con prodrogas de los inhibidores de metrotrexato y timidilato sintasa GW1031 y GW1843"), Bioconjug Chem 10: 38-48). Otros - - Abs (e.g., antagonistas) se diseñan para inhibir específicamente las funciones celulares normales para beneficio terapéutico. Un ejemplo es el Ortoclon 0KT3 , y el Mab anti-CD3 ofrecido por Johnson and Johnson para reducir el rechazo agudo del transplante de órgano (Strate et al., (1990) "Orthoclone 0KT3 as first-line therapy in acute renal allograft rejection" (" Ortoclon OKT3 como terapia de primera línea en el rechazo agudo de aloinjerto") , Transplant Proc 22:219-20. Otra clase de productos de anticuerpo son los agonistas. Estos Mabs se diseñan para mejorar específicamente las funciones celulares normales o el beneficio terapéutico. Por ejemplo, los agonistas a base de Mab de receptores de acetilcolina para neuroterapía se encuentran bajo desarrollo (Xie et al., (1997) "Direct demostration of MuSK involvement in acetylcholine receptor clustering through identification of agonist ScFv" ("Demostración directa de la complicación de MuSK en la aglomeración de receptores de acetilcolina a través del agonista ScFv" ) Nat . Biotechnol . 15: 768-71. Cualquiera de estos anticuerpos puede modificarse para incluir uno o más aminoácidos no naturales para mejorar una o más propiedades terapéuticas (especificidad, afinidad, vida media en suero, etc . ) . Otra clase de productos de anticuerpo proporciona nuevas funciones. Los principales anticuerpos en este grupo - son anticuerpos catalíticos tales como secuencias de Ig que se han diseñado para imitar las capacidades catalíticas de las enzimas (Wentworth y Janda (1998) "Catalytic antibodies" Curr Opin Chem Biol 2: 138-44. Por ejemplo, una aplicación de interés incluye utilizar el anticuerpo catalítico mAb-15A10 para hidrolizar la cocaína in vivo para la terapia de adicción (Mets et al., (1998) "A catalytic antibody against cocaine prevents cocaine's reinforcing and toxic effects in rats" ("Un anticuerpo catalítico contra evita el refuerzo de cocaína y los efectos tóxicos en ratas") Proc Nati Acad Sci U S A 95: 10176-81). Los anticuerpos catalíticos también pueden modificarse para incluir uno o más aminoácidos no naturales para mejorar una o más propiedades de interés. Purificación de proteínas recombinantes que comprenden aminoácidos no naturales Las proteínas de la invención, e.g., las proteínas que comprenden aminoácidos no naturales, los anticuerpos de proteínas que comprenden aminoácidos no naturales, etc. pueden purificarse, ya sea parcial o substancialmente para homogeneidad, de acuerdo a procedimientos estándar conocidos y utilizados por aquellos de experiencia en la materia. De acuerdo con lo anterior, los polipéptidos de la invención pueden recuperarse y purificarse por cualquiera de varios métodos bien conocidos en la materia, incluyendo e.g., precipitación en sulfato de amonio o etanol, extracción ácida o base, cromatografía de columna, cromatografía de columna por afinidad, cromatografía de intercambio aniónico o catiónico, cromatografía de fosfocelulosa, cromatografía de interacción hidrofóbica, cromatografía de hidroxilapatita, cromatografía de lectina, electrofosesis de gel y lo similar. Las etapas de reduplicación de las proteínas pueden utilizarse, según se desee, al elaborar correctamente la duplicación de las proteínas maduras. La cromatografía líquida de alta resolución (HPLC) , cromatografía de afinidad u otros métodos adecuados pueden emplearse en las etapas finales de purificación cuando se desea alta pureza. En una modalidad, los anticuerpos elaborados contra aminoácidos no naturales (o proteínas que comprenden aminoácidos no naturales) se utilizan como reactivos de purificación, e.g., purificación de proteínas en base a la afinidad que comprende uno o más aminoácido (s) no natural (es) . Una vez purificados, parcialmente o para homogeneidad, según se desee, los polipéptidos se utilizan opcionalmente, e.g., como componentes de análisis, reactivos terapéuticos o como inmunógenos para la producción de anticuerpos . Además de otras referencias anotadas en la presente, se conoce bien en la técnica una variedad de métodos de purificacón/duplicación de proteínas, incluyendo, e.g., aquellos establecidos en R. Scopes Protein Purification, Spring-Verlag, N.Y. (1982) ; Deutscher, Methods - - in Enzimology Vol . 182: Guide of Protein Purification, Academic Press, Inc . N.Y. (1990); Sandana (1997) Bioseparation of Proteins, Academic Press, Inc.; Bollag et al., (1996) Protein Methods, 2a. Edición Wiley-Liss. NY; Walker (1996) Proteína Purificación Applications: A Practical Approch IRL Press al Oxford, Oxford, Inglaterra; Harris and Angel Protein Purification Methods : A Practical Approch IRL Press at Oxford, Oxford, Inglaterra; Scopes (1993) Protein Purification: Principies and Practice 3a Edición Springer Verlag, NY; Janson and Ryden (1998) Protein Purification: Principies, High Resolution Methods and Applications Segunda Edición Wiley-VCH, NY; y Walker (1998) Protein Protocols on CD-ROM Humana Press, NJ; y las referencias citadas en la presente . Como se anotó, aquellos de experiencia en la materia reconocerán que, después de la síntesis, expresión y/o purificación, las proteínas pueden poseer una diferente conformación de las conformaciones deseadas de los polipéptidos relevantes. Por ejemplo, los polipéptidos producidos por los sistemas procarióticos con frecuencia se optimizan al exponerse a agentes caotrópicos para lograra la duplicación apropiada. Durante la purificación de, e.g., lisados derivados de E. coli, la proteína expresada opcionalmente se desnaturaliza y después se naturaliza. Esto se realiza, e.g., al solubilizar las proteínas en un agente - - caotropico tal como HCl de guanidina. En general, es deseable ocasionalmente desnaturalizar y reducir los polipeptidos expresados y después hacer que los polipeptidos se re-plieguen en la conformación preferida. Por ejemplo, puede agregarse guanidina, urea, DTT, DTE, y/o una chaperonina a un producto de interés de traducción. Los métodos para reducir, desnaturalizar o renaturalizar las proteínas se conocen bien por aquellos de experiencia en la materia (ver, las referencias anteriores, y Debinski, et al., (1993) J. Biol . Chem, 268: 14065-14070; Kreitman y Pasten (1993) Bioconjug. Chem. , 4:581-585; y Buchner, et al., (1992) Anal. Biochem. , 205: 263-270). Debinski et al.,, por ejemplo, describe la desnaturalización y reducción de las proteínas del cuerpo de inclusión en guanidina-DTE . Las proteínas pueden reduplicarse en un amortiguador redox que contiene, e.g., glutatión oxidado y L-arginina. Los reactivos reduplicados pueden fluir o moverse de otro modo hacia el contacto con uno o más polipeptidos u otros productos de expresión, o viceversa. Variantes de secuencia de aminoácidos y polipeptidos Como se describe arriba y más adelante, la invención proporciona secuencias de ácidos nucleicos y polinucleótidos y secuencias de aminoácidos de polipéptidos, e.g. , 0-ARNts y O-RSs, y, e.g., composiciones y métodos que - - comprenden dichas secuencias. Ejemplos de dichas secuencias, e.g., O-ARNts y O-RSs se describen en la presente. Sin embargo, alguien de experiencia en la materia apreciará que la invención no se limita por las secuencias descritas en la presente, e.g., los Ejemplo. Alguien de experiencia apreciará que la presente invención proporciona muchas secuencias no relacionadas con las funciones descritas en la presente, e.g., que codifican un O-ARNts o un O-RS. También, alguien de experiencia apreciará que muchas variantes de las secuencias descritas se incluyen en la invención. Por ejemplo, las variantes consecutivas de las secuencias descritas que producen una secuencia funcionalmente idéntica se incluyen en la invención. Las variantes de las secuencias de polinucleótidos de ácidos nucleicos, en donde las variantes hibrizan a al menos una secuencia descrita, se considera que se encuentran incluidas dentro de la invención. También se incluyen en la invención las secuencias únicas de las secuencias descritas en la presente, como se determina por, e.g., las técnicas de comparación de secuencia estándar. Variaciones consecutivas Debido a la degeneración del código genético, la "sustitución silenciosa" (i.e., sustituciones en un ácido nucleico que no dan como resultado una alteración en un polipéptido codificado) son una característica implícita de - - cada secuencia de ácidos nucleicos que codifican un ácido nucleico. De manera similar, Las "sustituciones de aminoácidos consecutivos" , en uno o pocos aminoácidos en una secuencia de aminoácidos que se sustituyen con diferentes aminoácidos con propiedades altamente similares, también se identifican fácilmente como siendo altamente similares a una construcción descrita. Tales variaciones consecutivas de cada secuencia descrita son una característica de la presente invención. Las "variaciones consecutivas" de una secuencia de ácidos nucleicos particular se refieren a aquellos ácidos nucleicos que codifican secuencias de aminoácidos idénticas o sustancialmente idénticas, o, en donde los ácidos nucleicos no codifican una secuencia de aminoácidos, para secuencias esencialmente idénticas . Un experto reconocerá que las sustituciones, cancelaciones o adiciones individuales, que alteran, agregan o cancelan- un solo aminoácido o un pequeño porcentaje de aminoácidos (Típicamente menos del 5%, más típicamente menos del 4%, 2% o 1%) en una secuencia codificada son "variaciones consecutivamente modificadas" en donde las alteraciones dan como resultado la cancelación de un aminoácido , adición de un aminoácido o sustitución de un aminoácido con una aminoácido químicamente similar. Así, las "variaciones consecutivas" de una secuencia de polipéptidos listados de la presente invención incluyen sustituciones de un pequeño porcentaje, típicamente menor del 5%, más típicamente menos del 2% o 1%, de los aminoácidos de la secuencia de polipéptidos, con un aminoácido conservadoramente seleccionado del mismo grupo de la sustitución conservadora. Finalmente, la adición de secuencias que no alteran la actividad codificada de la molécula de ácido nucleico, tal como la adición de una secuencia no funcional, es un variación conservadora del ácido nucleico básico. Las tablas de sustitución conservadora que proporcionan aminoácidos funcionalmente similares se conocen bien, en la materia. Lo siguiente establece los grupos ejemplificativos que contienen aminoácidos naturales que incluyen las "sustituciones conservadoras" entre si Grupos de Sustitución Conservadora 1 Alanina (A) Serina (S) Treonina (T) 2 Ácido aspártico Ácido Glutámico (D) (E) 3 Asparagina (N) Glutamina (Q) 4 Arginina (R) Lisina (K) 5 Isoleucina (I) Leucina (L) Metionina Valina (M) (V) 6 Fenilalanina (F) Tirosina (Y) Triptofano (W) Hibridación de Ácidos Nucleicos Puede utilizarse la hibridación comparativa para identificar los ácidos nucleicos de la invención, incluyendo las variaciones conservadoras de ácidos nucleicos de la invención, y este método de hibridación comparativa es un método preferido para distinguir los ácidos nucleicos de la invención. Además, los ácidos nucleicos objetivo que hibridizan a los ácidos nucleicos representados en la SEQ ID NO: 1-34 bajo altas, ultra altas y ultra-ultra altas condiciones rigurosas son una característica de la invención. Los ejemplos de tales ácidos nucleicos incluyen aquellos con una o unas pocas sustituciones de ácidos nucleicos silenciosas o conservadoras según se compara a una secuencia de ácidos nucleicos dada. Se dice que un ácido nucleico de prueba es el que hibridiza específicamente a un ácido nucleico sonda cuando hibridiza al menos ½ así como la sonda al objetivo complementario perfectamente acoplado i.e., con una proporción señal a ruido al menos de la ½ tan alto como la hibridación de la sonda al objetivo bajo condiciones en las que la sonda perfectamente acoplada se une al objetivo complementario perfectamente acoplado con una - proporción de señal a ruido que es al menos aproximadamente 5x-10x tan alta como la observada por la hibridación en cualquiera de los ácidos nucleicos objetivo no acoplados.
- - Los ácidos nucleicos se "hibridizan" cuando se asocian, típicamente en solución. Los ácidos nucleicos se hibridizan debido a una variedad de fuerzas físico-químicas bien caracterizadas, tal como la unión a hidrógeno, exclusión de solvente, apilamiento de bases y lo similar. Una guía extensa para la hibridación de ácido nucleicos se encuentra en Tijssen (1993) Laboratory Techniques in Biochemistry and Molecular Biology-Hlbrldizatlon with Nucleic Acid Probes parte I capítulo 2, "Overview of principies of hibridization and the strategy of nucleic acid probé assays" ("Revisión de los principios de hibridación y la estrategia de los análisis de sonda de ácidos nucleicos") (Elsevier, New York) ; así como en Ausubel, supra. Hames and Higgins (1995) Gene Probes 1 IRL Press en la Oxford University Press, Oxford, Inglaterra, (Hames y Higgins 1) y Hames and Higgins (1995) Gene Probes 2 IRL Press en la Oxford University Press, Oxford, Inglaterra, (Hames y Higgins 2) proporcionan detalles sobre la síntesis, etiquetado, detección y cuantificación del ADN y ARN, incluyendo los oligonucleótidos . Un ejemplo de condiciones de hibridación rigurosas para la hibridación de los ácidos nucleicos complementarios que tienen más de 100 residuos complementarios en un filtro en una inmunotransferencia Soutern o Nortern es 50% formalina con 1 mg de heparina a 42°C, llevándose a cabo la hibridación durante la noche. Un ejemplo de condiciones de lavado - rigurosas es un lavado con 0.2x SSC a 65°C durante 15 minutos (ver, Sambrook, supra para una descripción de amortiguados SSC) . Con frecuencia el lavado de alta rigurosidad se precede por un lavado de baja rigurosidad para retirar la señal de la sonda de fondo. Un ejemplo de lavado de baja rigurosidad es 2x SSC a 40 °C durante 15 minutos. En general, una proporción de señal a ruido de 5x (o mayor) de la observada para una sonda no relacionada en el análisis de hibridación particular indica la detección de una hibridación especifica. Las "condiciones rigurosas de lavado de hibridación" en el contexto de los experimentos de hibridación de ácidos nucleicos tal como las hibridaciones Soutern o northern dependen de la secuencia, y son diferentes bajo diferentes parámetros ambientales. Una guia extensa para la hibridación de ácidos nucleicos se encuentra en Tijssen (1993), supra. y en Hames y Higgins, 1 y 2. Las condiciones rigurosas de hibridación y lavado pueden determinarse fácilmente de manera empírica para cualquier ácido nucleico de prueba. Por ejemplo, en la determinación de las condiciones de lavado e hibridación altamente rigurosas, las condiciones de hibridación y lavado se incrementan gradualmente (e.g.r al incrementar la temperatura, disminuir la concentración de sal, incrementar la concentración de detergente y/o incrementar la - - concentración de solventes orgánicos tales como formalina en la hibridación o lavado) , hasta que se encuentre un conjunto de criterios seleccionado. Por ejemplo, las condiciones de lavado e hibridación se incrementan gradualmente hasta una sonda que se une perfectamente a un objetivo complementario perfectamente acoplado con una proporción de señal a ruido que es al menos 5x tan alta como la observada para la hibridación de la sonda a un objetivo no acoplado. Las condiciones "muy rigurosas" se seleccionan para ser igual al punto térmico de fusión (Tm) para una sonda particular. El Tm es la temperatura (bajo la resistencia iónica y pH definidos) en el cual el 50% de la secuencia de prueba hibridiza a una sonda perfectamente acoplada. Para los propósitos de la presente invención, en general, las condiciones de hibridación y lavado "altamente rigurosas" se seleccionan para ser de aproximadamente 5°C menor que el Tm para la secuencia específica a una intensidad iónica y pH definidos . Las condiciones de hibridación y lavado de "ultra alta rigurosidad" son aquellas en las cuales la rigurosidad de las condiciones de hibridación y lavado que se incrementan hasta la proporción de señal a ruido para la unión de la sonda al ácido nucleico objetivo complementario perfectamente acoplado se encuentra a menos de lOx tan alta como la observada para la hibridación a cualquiera de los ácidos - - nucleicos objetivo no acoplados. Se dice que un ácido nucleico objetivo que hibridiza a una sonda bajo tales condiciones, con una proporción de señal a ruido de al menos ½ de la del ácido nucleico objetivo perfectamente acoplado, se une a la sonda bajo condiciones de ultra alta rigurosidad. De manera similar, aún a niveles mayores de rigurosidad puede determinarse al incrementar gradualmente las condiciones de hibridación y/o lavado del análisis de hibridación relevante. Por ejemplo, aquellos en los cuales la rigurosidad de las condiciones de hibridación y lavado se incrementan hasta la proporción de señal a ruido para la unión de la sonda al ácido nucleico objetivo complementario perfectamente acoplado es al menos ???, 20x, 50x, lOOx o 500x o más tan alto como aquel observado para la hibridación a cualquiera de los ácidos nucleicos objetivo no acoplados. Se dice que un ácido nucleico objetivo que hibridiza a una sonda bajo tales condiciones, con una proporción de señal a ruido de al menos ½ de esa del ácido nucleico objetivo complementario perfect mente acoplado, se une a la sonda bajo condiciones de rigurosidad ultra-ultra altas . Los ácidos nucleicos que no se hibridizan entre si bajo condiciones rigurosas son todavía sustancialmente idénticos si los polipéptidos que codifican son sustancialmente idénticos. Esto ocurre, e.g., cuando una copia de los ácidos nucleicos se crea utilizando la degeneración máxima del codón permitida por el código genético . Secuencias únicas En un aspecto, la invención proporciona un ácido nucleico que comprende una subsecuencia única en un ácido nucleico seleccionado de la s secuencias de O-ARNts y O-RSs descritas en la presente. La subsecuencia única es única según se compara a un ácido nucleico que corresponde a cualquier secuencia de ácidos nucleicos de O-ARNt u O-RSs . El alineamiento puede realizarse utilizando, e.g., el conjunto BLAST para parámetros predeterminados. Cualquier subsecuencia única es útil, e.g., como un sonda para identificar los ácidos nucleicos de la invención. De manera similar, la invención incluye un polipéptido que comprende una subsecuencia única en un polipéptido seleccionado de las secuencias de O-RSs descritas en la presente. Aquí, la subsecuencia única es única según se compara a un polipéptido que corresponde a cualquier secuencia de polipéptidos conocida. La invención también proporciona los ácidos nucleicos objetivo que se hibridizan bajo condiciones rigurosas para un oligonucleotido de codificación única que codifica una subsecuencia única en un polipéptido seleccionado de las secuencias de O-RSs en donde la subsecuencia única es única según se compara a un polipéptido que corresponde a cualquiera de los polipéptidos de control [e.g., secuencia original a partir de la cual se derivaron las sintetasas de la invención, e.g. , por mutación). Las secuencias únicas se determinan como se anotó arriba. Comparación, identidad y homología de secuencia Los términos "idéntico" o porcentaje de "identidad" en el contexto de dos o más secuencias de ácidos nucleicos o polipéptidos, se refiere a dos o más secuencias o subsecuencias que son la misma o tienen un porcentaje específico de residuos de aminoácido o nucleótidos que son el mismo, cuando se comparan y se alinean para la correspondencia máxima, según se mide utilizando uno de los algoritmos de comparación de secuencias descritos más adelante (u otros algoritmos disponibles para personas de experiencia) o cualquier inspección visual. La frase " sustancialmente idéntico" en el contexto de dos ácidos nucleicos o polipéptidos (e.g., ADNs que codifican un O-ARNt u O-RS, o la secuencia de aminoácidos de un O-RS) se refiere a dos o más secuencias o subsecuencias que tienen al menos aproximadamente 60%, preferentemente 80%, más preferentemente 80%, más preferentemente 90-95% de identidad de residuos de aminoácido o nucleótido, cuando se comparan y alinean para correspondencia máxima, según se mide utilizando un algoritmo de comparación de secuencia o por inspección visual . Tal secuencias "sustancialmente - - idénticas" se consideran típicamente ser "homologas" , sin la referencia al linaje verdadero. Preferentemente, la "identidad sustancial" existe sobre una región de las secuencias que es al menos de aproximadamente de 50 residuos de longitud, más preferentemente sobre una región de al menos aproximadamente 100 residuos, y más preferentemente las secuencias son sustancialmente idénticas sobre al menos 150 residuos, o sobre la longitud total de las dos secuencias a compararse . Para la comparación de secuencia y determinación de homología, típicamente una secuencia actúa como una secuencia de referencia a la cual se compara la secuencia de prueba. Cuando se utiliza un algoritmo de comparación de secuencia, las secuencias de prueba y referencia entran a una computadora, si es necesario, se diseñan las coordenadas se subsecuencia, y se diseñan los parámetros del programa de algoritmo de secuencia. El algoritmo de comparación de secuencia calcula entonces el porcentaje de identidad de secuencia para la(s) secuencia (s) de prueba con relación a la secuencia de referencia, en base a los parámetros diseñados del programa. El óptimo alineamiento de secuencias para la comparación puede conducirse, e.g., por el algoritmo de homología local de Smith & Waterman, Adv. Appl. Math. 2:482 (1981) , mediante el algoritmo de alineamiento de homología de - - Needleman & Wunscli, J". Mol. Biol. 48:443 (1970), para la búsqueda por los métodos de similitud de Pearson & Lipman, Proc. Nat'l Acad. Sci. USA '85:2444 (1988), por implementacion.es computarizadas de estos algoritmos (GAP, BESTFIT, FASTA, y TFASTA en el Wisconsin Genetics Software Package, Genetics Computer Group, 575 Science Dr., Madison, I) , o por inspección visual (ver en general, Ausubel et al., infra) . Un ejemplo de un algoritmo que es adecuado para la determinación del porcentaje de identidad de secuencia y la similitud de secuencia es el algoritmo BLAST, que se describe en Altsc ul et al., J. Mol. Biol. 215:403-410 (1990). El software para realizar el análisis BLAST se encuentra públicamente disponible a través del National Center for Biotechnology Information (www.ncbi.nlm.nih.gov/). Esta algoritmo incluye primero identificar los pares de secuencias de alta marcación (HSPs) al identificar palabras cortas de longitud W en la secuencia de consulta, que ya sea se acopla o satisface alguna marca T de umbral valuada como positiva cuando se alinea con una palabra de la misma longitud en una secuencia de base de datos . T se refiere como el umbral (threshold) de la puntuación de palabra del entorno (Altschul et al., supra) . Estos golpes de palabra del entorno inicial actúan como semillas para iniciar las búsquedas para encontrar los HSPs más largos que las contienen. Los golpes - - de palabra se extienden entonces en ambas direcciones a lo largo de cada secuencia según la puntuación del alineamiento acumulativo pueda incrementarse. Las puntuaciones acumulativas se calculan utilizando, para las secuencias de nucleótidos, los parámetros M (puntuación de recompensa para un par de residuos de acoplamiento; siempre > 0) y N (puntuación de penalidad para residuos de desacoplamiento; siempre < 0) . Para las secuencias de aminoácidos, se utiliza una matriz de puntuación para calcular la puntuación acumulativa. La extensión del golpe de palabra en cada dirección se detiene cuando : la puntuación del alineamiento acumulativo cae por la cantidad X de su valor máximo logrado; la puntuación acumulativa va a cero o más abajo debido a la acumulación de uno o más alineamientos de puntuación negativa; o se alcanza el extremo de cualquiera de las secuencias. Los parámetros del algoritmo BLAST W, T y X determinan la sensibilidad y velocidad del alineamiento. El programa BLASTN (para las secuencias de nucleótido) utiliza como predeterminados una longitud de palabra (W) de 11, una expectativa (E) de 10, un corte de 100, M=5, N=4, y una comparación de ambos filamentos . Para secuencias de aminoácidos , el programa BLASTP utiliza como predeterminados una longitud de palabra (W) de 3, una expectativa (E) de 10 y la matriz de puntuación BLOSUM62 {ver Henikoff & Heníkoff (1989) Proc. Nati. Acad. Sci USA 89:10915) .
- - Además de calcular el porcentaje de identidad de secuencia, el algoritmo BLAST también realiza un análisis estadístico de la similitud entre dos secuencias (ver, e.g., Karlin & Altschul, Proc. Nat'l Acad. Sci . USA 90:5873-5787 (1993)). Una medida de similitud proporcionada por el algoritmo BLAST es la probabilidad de la suma más pequeña (P (N) ) , que proporciona una indicación de la probabilidad a la cual podría ocurrir un acoplamiento entre dos secuencias de nucleótidos o aminoácidos mediante un cambio. Por ejemplo, un ácido nucleico se considera similar a una secuencia de referencia si la probabilidad de la suma más pequeña en una comparación del ácido nucleico de prueba al ácido nucleico de referencia es menos de aproximadamente 0.1, más preferentemente menor de aproximadamente 0.01, y más preferentemente menor de aproximadamente 0.001. Polipéptidos de Definición por Inmunorreactividad Debido a que los polipéptidos de la invención proporcionan una variedad de nuevas secuencias de polipéptidos (e.g., que comprenden aminoácidos no naturales en el caso de proteínas sintetizadas en los sistemas de traducción en la presente, o, e.g., en el caso de la nueva sintetasa de la presente, nuevas secuencias de aminoácidos estándar) , las polipeptidasas también proporcionan nuevas características estructurales que pueden reconocerse, e.g., en análisis inmunológicos . La generación de antisuero que - - une específicamente los polipéptidos de la invención, así como los polipéptidos que se unen por tal antisuero, son una característica de la invención. Por ejemplo, la invención incluye proteínas de sintetasa que se unen específicamente o que son específicamente reactivas con un anticuerpo o antisuero generado contra un inmunogeno que comprende una secuencia de aminoácidos seleccionada de una o más de (SEQ ID NO: 33-66. Para eliminar la actividad cruzada con otros homólogos, el anticuerpo o antisuero se sustrae con las sitetasas disponibles, tal como la tirosil sintetasa (Tyr S) del Methanococcus jannaschii [M. jannaschii) tipo silvestre. Cuando la tirosil sintetasa (TyRS) de Methanococcus jannaschii (M. jannaschii) tipo silvestre corresponde a un ácido nucleico, un polipéptido codificado por el ácido nucleico se genera y se utiliza para propósitos de sustitución del anticuerpo/antisuero . En un formato típico, el inmunoanálisis utiliza un antisuero policlonal que se elevó contra uno o más polipéptidos que comprenden una o más de las secuencias que corresponden a una o más de las SEQ ID NO: 35-66) o una subsecuencia sustancial de la misma. (i.e., al menos aproximadamente 30% de la secuencia de longitud total proporcionada) . El conjunto de inmunógenos de polipéptido potenciales derivados de las SEQ ID NO: 35-66) se refieren - - colectivamente a continuación como "los polipéptidos inmunogénicos" . El antisuero resultante se selecciona opcionalmente para tener baja reactividad cruzada contra los homólogos de la sintetasa de control y se retira cualquiera de tal reactividad cruzada, e.g., por inmunoabsorción, con uno u más de los homólogos de sitetasa de control, antes del antisuero policlonal en el inmunoanálisis . A fin de producir antisuero para el uso en un inmunoanálisis, se produce uno o más de los polipéptidos inmunogénicos y se purifica como se describe en la presente . Por e emplo, la proteína recombinante puede producirse en una célula recombinante. Una cepa endógama de ratón (utilizada en este análisis debido a que los resultados son más reproducibles debido a la identidad genética virtual del ratón) se inmuniza con la(s) proteína (s) inmunogénica (s) en combinación con un adyuvante estándar, tal como adyuvante de Freund, y un protocolo estándar de inmunización de ratón (ver, e.g., Harlow y La e (1988) Antibodies, A Laboratory Manual, Cold Spring Harbor Publications, New York, para una descripción estándar de la generación de anticuerpos, formatos de inmunoanálisis y condiciones que pueden utilizarse para determinar la inmunoreactividad específica. Las referencias adicionales y la exposición de anticuerpos también se encuentra en la presente y puede aplicarse aquí para definir los polipéptidos por inmunoreactividad) . De - manera alternativa, uno o más polipéptidos sintéticos o recombinantes derivados de las secuencias descritas en la presente se conjuga a una proteína vehículo y se utiliza como un inmunógeno. El suero policlonal se recolecta y titula contra el polipéptido inmunogénico en un inmunoanálisiis , por ejemplo, un inmunoanálisis de fase sólida con una o más de las proteínas inmunogénicas inmunolizadas sobre un soporte sólido. El antisuero policlonal con un título de 10s o mayor se seleccionan, se agrupan y se sustraen con los polipéptidos de la sintetasa de control para producir antisuero policlonal titulado, agrupado sustraído. El antisuero policlonal titulado, agrupado sustraído se prueba para la reactividad cruzada contra los homólogos de control en un inmunoanálisis comparativo. En este análisis comparativo, las condiciones de unión discriminatoria se determinan por el antisuero policlonal titulado sustraído que da como resultado al menos aproximadamente 5-10 veces mayor que la proporción de señal a ruido para la unión del antisuero policlonal titulado para la sintetasa inmunogénica según se compara a la unión a los homólogos de la sintetasa de control. Es decir, la rigurosidad de la reacción de unión se ajusta por la adición de los competidores no específicos tales como albúmina o leche deshidratada sin grasa y/o al ajusfar las condiciones de sal, temperatura y/o lo similar. Estas condiciones de unión se utilizan en análisis subsecuentes para determinar si un polipéptido de prueba (un polipéptido que se compara a los polipéptidos inmunogénicos y/o los polipéptidos de control) se une específicamente por el antisuero policlonal agrupado sustraído. En particular, los polipéptidos de prueba que muestran al menos una proporción de señal a ruido mayor de 2-5x que los homólogos de la sintetasa de control bajo condiciones de unión de discriminación, y al menos aproximadamente ½ de la proporción de señal a ruido según se compara al (los) polipéptido (s) inmunogénico (s) , comparten la similitud estructural sustancial con el polipéptido inmunogénico según se compara a las sintetasas conocidas y es, por lo tanto un polipéptido de la invención. En otro ejemplo, los inmunoanálisis en el formato de unión competitiva se utilizan para la detección de un polipéptido de prueba. Por ejemplo, como se anotó, los anticuerpos de reactividad cruzada se retiran de la mezcla de antisuero agrupado por inmunoabsorción con los polipéptidos de control. El (los) polipéptido (s) inmunogénico (s) se inmoviliza (n) entonces a un soporte sólido que se expone al antisuero agrupado sustraído. Las proteínas de prueba se agregan al análisis para competir por la unión al antisuero agrupado. la capacidad de la (s) proteína (s) de prueba para competir por la unión al antisuero agrupado sustraído según se compara a la(s) proteína (s) inmovilizada (s) se compara a la capacidad del (los) polipéptido (s) inmunogénico (s) agregados al análisis para competir por la unión (los polipéptidos inmunogénicos compiten efectivamente con los polipéptidos inmunogénicos inmovilizados por la unión al antisuero agrupado) . El porcentaje de reactividad cruzada para las proteínas de prueba se calcula, utilizando cálculos est ndar . En un análisis paralelo, la capacidad de las proteínas de control para competir por la unión al antisuero agrupado sustraído se determina opcionalmente según se compara a la capacidad del (los) polipéptidos inmunogénicos para competir por la unión al antisuero. De nuevo, el porcentaje de reactividad cruzada para los polipéptidos de control se calcula, utilizando cálculos estándar. Cuando el porcentaje de reactividad cruzada es al menos 5-10x tan alto para los polipéptidos de prueba según se compara a los polipéptidos de control y o cuando la unión de los polipéptidos de prueba se encuentra aproximadamente en el rango de la unión de los polipéptidos inmunogénicos, se dice que los polipéptidos de prueba se unen específicamente al antisuero agrupado sustraído. En general, el antisuero inmunoabsorbido y agrupado puede utilizarse en un inmunoanálisis de unión competitiva como se describe en la presente para comparar cualquier polipéptido de prueba al (los) polipéptido (s) inmunogénico (s) y/o de control. Con el fin de hacer esta comparación, los polipéptidos inmunogénicos , de prueba y de control de analizan cada uno en un amplio rango de concentraciones y la cantidad de cada polipéptido requerido para inhibir el 50% de la unión del antisuero sustraído a e.g., una proteína de control inmovilizada, de prueba o inmunogénica se determina utilizando técnicas estándar. Si la cantidad del polipéptido de prueba requerida para la unión en el análisis competitivo es menor que dos veces la cantidad del polipéptido inmunogénico que se requiere, entonces se dice que el polipéptido de prueba se une específicamente a un anticuerpo generado por la proteína inmunogénica, siempre que la cantidad sea al menos aproximadamente de 5-10x tan alta como para el polipéptido de control. Como una determinación adicional de la especificidad, el antisuero agrupado opcionalmente se inmunoabsorbe completamente con el (los) polipéptido (s) inmunogénico (s) (preferentemente los polipéptidos de control) hasta que se detecta una pequeña o ninguna unión del antisuero agupado sustraído del polipéptido inmunogénico resultante para el (los) polipéptido (s) inmunogénico (s) utilizados en la inmunoabsorción. Este suero totalmente inmunoabsorbido se prueba entonces para la reactividad con el polipéptido de prueba. Si se observa una pequeña o ninguna - - reactividad (i.e., no más de 2x de la proporción de señal a ruido observada para la unión del antisuero totalmente inmunoabsorbido al polipéptido inmunogénico) , entonces el polipéptido de prueba se une específicamente por el antisuero producido por la proteina inmunogénica . Técnicas Generales de Biología Molecular Los textos en general que describen técnicas de biología molecular incluyen Berger and Kimmel, Guide to Molecular Cloning Techniques, ethods in Enzimology volumne 152 Academic Press, Inc., San Diego, CA (Berger); Sambrook et al., Molecular Cloning - A Laboratory Manual (2a. Ed.) , Vol . 1-3. Cold Spring Harbor Laboratory, Cold Spring Harbor, New York, 1989 ("Sambrook") y Current Protocols in Molecular Biology, F.M. Ausubel et al., Eds . , Current Protocols, una empresa conjunta entre Greene Publishing Associates, Inc. y John Wiley & Sons, Inc., (complementado a través de 1999) (" Ausubel")). Estos textos describen la mutagénesis, el uso de vectores, promotores y muchos otros tópicos relevantes para, e.gr. , la generación de genes que incluyen codones selectores para la producción de proteínas que incluyen aminoácidos no naturales, ARNts ortogonales, sistetasas ortogonales y pares de los mismos. Se utilizan varios tipos de mutagénesis en la presente invención, e.g., para insertar los codones selectores que codifican los aminoácidos no naturales en una - proteína. Estos incluyen, pero no se limitan mutagénesis dirigida la sitio, de punto aleatorio, recombinación de homólogos (redistribución de ADN) mutagénesis utilizando uracilo que contiene los modelos, mutagénesis dirigida a oligonucleótidos , mutagénesis de ADN modificado por fosforotioato, mutagénesis de ADN duplicado con intersticios o lo similar. Los métodos adicionales adecuados incluyen reparación de puntos de desacoplamiento, mutagénesis utilizando cepas huésped deficientes en reparación, restricción-selección y restricción-purificación, mutagénesis por cancelación, mutagénesis por síntesis genética total, reparación del doble filamento fracturado, y lo similar. La mutagénesis, e.g. , incluyendo las construcciones quiméricas, también se incluyen en la presente invención. En una modalidad, la mutagénesis puede guiarse por la información conocida de la molécula que ocurre de manera natural o la molécula alterada o mutada que ocurre de manera natural, e.g., la secuencia, comparaciones de secuencias, propiedades físicas, estructura cristalina o lo similar. Los textos y ejemplos anteriores encontrados en la presente describen estos procedimientos . La información adicional se encuentra en las siguientes publicaciones y referencias citadas dentro: Ling et al., Approches to DNA mutagénesis: a overview, Anal Biochem. 254(2): 157-178 (1997); Dale et al., Oligonucleotide-directed random mutagenesls using the phosphorothiote method, Methods Mol . Biol . 57:369-374 (1996); Smith, In vitro utagenesis, Ann. Re . Gene . 19:423-462 (1985); Boststein & Shortle, Strategies and applications of in vitro mutagenesis, Science 299: 1193-1201 (1985); Cárter, Site-directed mutagenesis, Biochem. J. 237:1-7 (1986); Kunkel, The efficiency of oligonucleotide directed mutagenesis, en Nucleic Acids & Molecular Biology (Eckstein, F. y Lilley, D.M.J. Eds . , Springer Verlag, Berlín)) (1987); Kunkel, Rapid and efficient site-specific mutagenesis without phenotipic selection, Proc . Nati. Acad. Sci . USA 82:488-492 (1985); Kunkel et al., Rapid and efficient site-specific mutagenesis without phenotipic selection, Methods in Enzymol . 154:367-382 (1987); Bass, et al., Mutant Trp repressors with new DNA-binding specificities, Science 242:240-245 (1988); Methods in Enzymol . 100:468-500 (1983); Methods in Enzymol. 154:329-350 (1987) ; Zoller & Smith, Oligonucleotide-directed mutagenesis using M13-derived vectors: an efficient and general procedure for the production of point mutations in any DNA fragment, Nucleic Acid Res . 10:6487-6500 (1982); Zoller & Smith, Oligonucleotide-directed mutagenesis of DNA fragments cloned into M13 vectors, Methods in Enzymol . 100:468-500 (1983); Zoller & Smith, Oligonucleotide-directed mutagenesis : a simple method using two oligonucleotide primers and a singléstranded DNA t mplate, Methods in Enzymol . 154:329-350 - - (1987); Taylor et al., The use of phosphorothioate-modified DNA in restrictions to prepare nicked DNA, Nucí . Acids Res . 13: 8749-8764 (1985); Taylor et al., The rapid generation of oligonucleotide-directed mutations at high frequency using phosphorothioate-modified DNA, Nucí. Acids Res. 13: 8765-8787 (1985) ; Nakamaye & Eckstein, Inhibition of restriction endonuclease Nci I cleavage by phosphorothioate groups and its application to oligonucleotide-directed mutagenesis, Nucí . Acids Res . 14: 9679-9698 (1986); Sayers et al., Y-T Exonucleases in phosphorothioate-based oligonucleotide-directed mutagenesis, Nucí ¦ Acids Res . 16:791-802 (1988); Sayers et al., Strand specific cleavage of phosphorothioate-containing DNA by reaction with restriction endonucleases in the presence of ethidium bromide, (1988) Nucí . Acids Res . 16: 803-814; ramer et al., The gapped dúplex DNA approach to oligonucleotide-directed mutation construction, Nucí . Acids Res . 12: 9441-9456 (1984); Kramer & Fritz Oligonucleotide-directed construction of mutations via gapped dúplex DNA, Methods in Enzymol . 154:350-367 (1987); Kramer et al., Improved enzymatic in vitro reactions in the gapped dúplex DNA approach to oligonucleotide-directed construction of mutations, Nucí . Acids Res . 16: 7207 (1988); Fritz et al., Oligonucleotide-directed construction of mutations: a gapped dúplex DNA procedure without enzymatic reactions in vitro, Nucí. Acids Res. 16: 6987-6999 (1988); Kramer et al., Point - - Mismatch Repair, Cell 38:879-887 (1984); Cárter et al . , Improved oligonucleotide site-directed mutagenesis using M13 vectors, Nucí . Acids Res . 13: 4431-4443 (1985); Cárter, Improved oligonucleotide-directed mutagenesis using M] 3 vectors, Methods in Enzymol . 154: 382-403 (1987); Eghtedarzadeh & Henikoff, Use oí oligonucleotides to genérate large deletions, Nucí . Acids Res . 14: 5115 (1986); Wells et al., Importance of hydrogen-bond formation in stabilizing the transí tion state of subtilisin, Phil . Trans . R. Soc. Lond. A 317:415-423 (1986); Namblar et al., Total synthesis and cloning of a gene coding for the ribonuclease S protein, Science 223: 1299-1301 (1984); Sakamar and horana, Total synthesis and expression of a gene for the a-subunit of bovine rod outer segment guanine nucleotide-binding protein (transducin) , Nucí . Acids Res . 14: 6361-6372 (1988); Wells et al., Cassette mutagenesis: an efficient ethod for generation of múltiple utations at defined sites, Gene 34:315-323 (1985); Grundstrom et al., Oligonucleotide-directed mutagenesis by microscale ' shot-gun' gene synthesis, Nucí . Acids Res . 13: 3305-3316 (1985); Mandecki, Oligonucleotide-directed double-strand break repair in plasmids of Escherichia coli: a method for site-specific mutagenesis, Proc. Nati. Acad. Sci . USA, 83:7177-7181 (1986); Arnold, Pjrotein engineering for unusual environments, Current Opinión in Biotechnology 4:450-455 (1993); Sieber, et al., Nature Biotechology, 19:456-460 (2001). W.P.C. Stemmer, Nature 370, 389-91 (1994); e l. A. Lorimer, I. Pastan, Nucleic Acids Res. 23, 3067-8 (1995) . Los detalles adicionales en muchos de los métodos anteriores pueden encontrarse en Methods in Enzymology Volumen 154, que también describen los controles útiles para los problemas de localización de errores con varios métodos de mutagenesis. La presente invención también se refiere a células huésped y organismos para la incorporación in vivo de un aminoácido no natural a través de los pares de ARNts/RS ortogonales. Las células huésped se diseñan genéticamente (e.g., transformadas, transducidas o transfectadas) con ,los vectores de esta invención, que pueden ser, por ejemplo, un vector de clonación o un vector de expresión. El vector puede ser, por ejemplo, en la forma de un plásmido, una bacteria, un virus, un polinucleótido desnudo, o un polinucleótido conjugado. Los vectores se introducen en células y/o microorganismos por métodos estándar incluyendo electroporación (From et al., Proc. Nati. Acad. Sci . USA 82, 5824 (1985) , infección por vectores virales, penetración balística de alta velocidad mediante pequeñas partículas con los ácidos nucleicos ya sea dentro de la matriz o pequeñas perlas o partículas, o sobre la superficie (Klein et al., Nature 327, 70-73 (1987)). Las células huésped diseñadas pueden cultivarse en - - medio nutriente convencional modificado según sea apropiado para tales actividades como, por ejemplo, etapas de selección, promotores de activación o transformantes de selección. Estas células pueden cultivarse opcionalmente en organismos transgénicos . Se encuentran disponibles varios métodos bien conocidos para introducir ácidos nucleicos objetivo en células bacteriales, cualquiera de los cuales puede utilizarse en la presente invención. Estos incluyen: fusión de las células receptoras con protoplasmas bacteriales que contienen el ADN, electroporación, bombardeo de partículas nucleares, e infección con vectores virales (tratados adicionalmente más adelante), etc. Las células bacteriales pueden utilizarse para amplificar el número de plasmidos que contienen las construcciones de ADN de esta invención. La bacteria se desarrolla hasta la fase logarítmica y los plásmidos dentro de la bacteria pueden aislarse mediante una variedad de métodos conocidos en la técnica (ver, por ejemplo, Sambrook) . Además, una plétora de equipos se encuentran comercialmente disponibles para la purificación de los plásmidos provenientes de la bacteria (ver, e.g., EasyPrep™, FlexiPrep™, ambos de Pharmacia Biotech StataClean™, de Statagene; y QIAprep™ de Qiagen) . Los plásmidos aislados y purificados se manipulan entonces además para producir otros plásmidos, utilizados para transíectar - - las células o incorporarse en vectores relacionados para infectar organismos . Los vectores típicos contienen terminadores de transcripción y traducción, secuencias de inicio de transcripción y traducción, promotores útiles para la regulación de la expresión del ácido nucleico objetivo particular. Los vectores comprenden opcionalmente casetes de expresión genética que contienen al menos una secuencia terminadora independiente, secuencias que permiten la replicación del cásete en eucariotes o procariotes o ambos, (e.g., vectores de redistribución) y marcadores de selección para ambos sistemas procarióticos y eucarióticos . Los vectores son adecuados para la replicación e integración en procariotes o eucariotes o preferentemente ambos . Ver, Giliman & Smith, Gene 8:81 (1979); Roberts, et al., Nature, 328:731 (1987); Schneider, B. et al., Protein Expr. Purif. 6435:10 (1995); Ausubel, Sambrook, Berger (todos supra) . Se proporciona un catálogo de Bacterias y Bacteriófagos útiles para la clonación, e.g., por el ATCC, e.g., The ATCC Catalogue of Bacteria and Bacterlophage (1992) Gherna et al., (Eds.) publicado por la ATCC. Procedimientos básicos adicionales para secuenciar, clonar y otros aspectos de biología molecular y las consideraciones teóricas subyacentes también se encuentran en Watson et al., (1992) recombinant DNA Second Edltlon Scientific American Books, NY. Otras referencias útiles, e.g., para el - - alineamiento y cultivo de células {e.g., para el aislamiento de ácidos nucleicos subsecuentes) incluyendo Freshney (1994) Culture of Animal Cells, a Manual of Basic Technique, tercera edición, Wiley-Liss, New York y las referencias citadas en la presente; Payne et al., (1992) Plant Cell and Tissue Culture in Liquid Systems John Wiley & Sons, Inc. New York, NY; Gamborg and Phillips (Eds . ) (1995) Plant Cell, Tissue and Organ Culture; Fundamental Methods Springer Lab Manual, Springer_Verlag (Berlín Heidelberg New York) y Atlas and Parks (Eds.) The Handbook of Microbiological Media (1993) CRC Press, Boca Ratón, FL . Además, esencialmente cualquier ácido nucleico (y virtualmente cualquier ácido nucleico etiquetado, ya sea estándar o no estándar) puede ordenarse según especificaciones o estándar a partir de una variedad de fuentes comerciales, tales como The Midland Certified Reagent Company (mcrc@oligos . com) , The Great American Gene Company (www.genco.com), ExpressGen Inc. (www.expressgen.com), Operon Technologies Inc. (Alameda, CA) y muchos otras. Composiciones Farmacéuticas Las proteínas, e.g., polipéptidos, péptidos, etc. de la invención {e.g., que comprenden uno o más aminoácidos no naturales) se emplean opcionalmente para usos terapéuticos, e,g, en combinación con un vehículo farmacéuticamente adecuado. Tales composiciones, e.g., - comprenden una cantidad terapéuticamente efectiva del compuesto, y un vehículo o excipiente farmacéuticamente aceptable. Tal vehículo o excipiente incluye, pero no se limita a, salina, salina amortiguada, dextrosa, agua, glicerol, etanol y/o combinaciones de las mismas. La formulación se elabora para adaptarse al modo de administración. En general, los métodos para administrar las proteínas se conocen bien en la técnica y pueden aplicarse para la administración de los polipéptidos de la invención. Las composiciones terapéuticas que comprenden uno o más polipéptidos de la invención se prueban opcionalmente en uno o más modelos de enfermedad animal apropiados in vi tro y/o in vivo, para confirmar la eficacia, el metabolismo de los tejidos y las dosis estimadas, de acuerdo con los métodos bien conocidos en la materia. En particular, las dosis pueden determinarse inicialmente mediante la actividad, estabilidad y otras mediciones adecuadas de homólogos de aminoácidos no naturales en la presente a naturales (e.g., comparación de un EPO modificado para incluir uno o más aminoácidos no naturales a un EPO de aminoácido natural) , i.e., en un análisis relevante. La administración es por cualquiera de las rutas normalmente utilizadas para introducir una molécula en contacto máximo con células de sangre o tejido. Los polipéptidos de aminoácidos no naturales de la invención se - - administran de cualquier manera adecuada, opcionalmente con uno ¦ o más vehículos farmacéuticamente aceptables. Los métodos adecuados de administrar tales polipéptidos en el contexto de la presente invención a un paciente se encuentran disponibles, y aunque puede utilizarse más de una ruta para administrar una composición particular, con frecuencia, una ruta particular puede proporcionar una acción o reacción más inmediata y más efectiva que otra ruta. Los vehículos farmacéuticamente aceptables se determinan en parte por la composición particular que se administra, asi como por el método particular utilizado para administrar la composición. De acuerdo con lo anterior, existe una amplia variedad de formulaciones adecuadas de composiciones farmacéuticas de la presente invención. Las composiciones de polipéptidos pueden administrarse por varias rutas incluyendo, pero sin limitarse a: medios orales, intravenosos, intraperitoneales , intramusculares, intradérmicos , subcutáneos, tópicos, sublinguales o rectales. Una composición de polipéptido de aminoácidos no naturales también puede administrarse a través de liposomas. Tales rutas de administración y formulaciones apropiadas se conocen en general por aquellos de experiencia en la materia. El polipéptido de aminoácidos no naturales, sólo o en combinación con otros componentes adecuados, también puede - - elaborarse en formulaciones de aerosol (i.e. pueden "nebulizarse" ) para administrarse a través de la inhalación. Las formulaciones en aerosol pueden colocarse en propelentes aceptables presurizados, tal como diclorodifluorometano, propano, nitrógeno, y lo similar. Las formulaciones adecuadas para administración parenteral, tal como, por ejemplo, mediante las rutas intraarticular (en las articulaciones) , intravenosa, intramuscular, intradérmica, intraperitoneal y subcutánea, incluyen soluciones de inyección acuosa y no acuosa, isotónica estéril, que pueden contener antioxidantes, amortiguadores, bacteriostáticos, y solutos que vuelven la formulación isotónica con la sangre del receptor propuesto, y suspensiones acuosas y no acuosas estériles que pueden incluir agentes de suspensión, solubilizadores, agentes espesantes, estabilizadores y conservadores. Las formulaciones de ácidos nucleicos empacados pueden presentarse en contenedores sellados de dosis única o múltiples dosis, tal como ampolletas y viales. La administración parenteral y la administración intravenosa son métodos preferidos de administración. En particular, las rutas de administración ya en uso para terapéuticos de homólogos de aminoácidos naturales (e.g., aquellos utilizados típicamente para EPO, GCSF, GMCSF, IFNs, interleucinas , anticuerpos y/o cualquier otra proteína - - suministrada farmacéuticamente) , junto con formulaciones en uso actual, proporcionan rutas preferidas de administración y formulación para el aminoácido no natural de la invención. La dosis administrada a un paciente, en el contexto de la presente invención, es suficiente para efectuar una respuesta terapéutica benéfica en el paciente a través del tiempo, o e.g., para inhibir la infección por un patógeno, u otra actividad apropiada, dependiendo de la aplicación. La dosis se determina por la eficacia del vector apropiado, o la formulación, y la actividad, estabilidad o vida media en suero del polipéptido de aminoácidos no naturales empleado y la condición del paciente, así como el peso corporal o área superficial del paciente a tratarse . El tamaño de la dosis también se determina por la existencia, naturaleza y grado de cualquier efecto colateral adverso que acompañe la administración de un vector particular, formulación o lo similar en un paciente particular. Al determinar la cantidad efectiva del vector o formulación a administrarse en el tratamiento o profilaxis de enfermedad {e.g., cánceres, enfermedades hereditarias, diabetes, SIDA o lo similar) , los médicos evalúan los niveles de plasma circulante, toxicidad de la formulación, progreso de la enfermedad y/o cuando es relevante, la producción de anticuerpos de polipéptidos de aminoácidos no naturales . La dosis administrada, e.g., a un paciente de 70 - - kilogramos se encuentra típicamente en el rango equivalente a las dosis de proteínas terapéuticas actualmente utilizadas, ajustadas por la actividad alterada o la vida media en suero de la composición relevante. Los vectores de esta invención pueden complementar las condiciones del tratamiento mediante cualquier terapia convencional conocida, incluyendo la administración de anticuerpos, la administración de vacunas, la administración de agentes citotoxicos, los polipéptidos de aminoácidos naturales, ácidos nucleicos, análogos de nucleótidos, modificadores de la respuesta biológica y lo similar . Para la administración, las formulaciones de la presente invención se administran a una tasa determinada por la LD50 de la formulación relevante y/o la observación de cualquier efecto colateral de los aminoácidos no naturales a diversas concentraciones, e.g., según se aplica a la masa y la salud total del paciente. La administración puede realizarse a través de dosis única o dividida. Si un paciente que experimenta la infusión de una formulación desarrolla fiebre, escalofríos o dolores musculares él/ella recibe la dosis apropiada de la aspirina, ibuprofen, acetaminofen u otra droga que controla el dolor/fiebre . Los pacientes cuya experiencia reaccionan a la infusión tal como fiebre, dolores musculares y escalofríos se premedican 30 minutos de las futuras infusiones con ya sea - aspirina, acetaminofen o e.g. , difenilhidramina . La meperidina se utiliza para escalofríos y dolores musculares más severos que no responden rápidamente a los antipiréticos y antihistamínicos . La infusión celular es lenta o discontinua dependiendo de la severidad de la reacción. EJEMPLOS Ejemplo 1; Incorporación in vivo de O-metil-L-tirosina Un par AR t/sintetasa ortogonal en E. coli puede generarse al importar un par de un organismo diferente, si la aminoacilación de especies cruzadas es ineficiente (Y. Kwok, J. T. ong, Can. J. Biochem. 58, 213-8 (1980)), y el ciclo anticodón no es una clave determinante del reconocimiento de la sintetasa. Uno de tal par candidato es el par ARNttirosil/sintetasa de Methanococcus jannaschii (M. jannaschii) , una arqueobacteria cuyo ARNt identifica elementos diferentes de aquellos de ARNtTyr de E. coli, cuya tirosil sintetasa (TyrRS) carece de un dominio de unión al ciclo de anticodón (B.A. Steer, P. Schimmel, J. Biol . Chem. 274, 356001-6 (1999)). Además, la TyrRS de M. jannaschii no tiene un mecanismo de edición (H. Jakubowski, E. Goldman, Microbiol. Rev. 56, 412-29 (1992)), y por lo tanto no debe cotejarse aminoácido no natural ligado al ARNt.
Se ha mostrado que un ARNt supresor de ámbar derivado del ARNtTyr de M. jannaschii no se aminoacila - - eficientemente por las sintetasas de E. coli, pero funciona eficientemente en la traducción de proteínas en E. coli (L. Wang, T.J. Magliery, D.R. Liu, P.G. Schultz, J. Am. C em. Soc. 122, 5010-1 (2000)). Además, la TyrRS de M. jannaschii es ortogonal a los AR ts de E. coli (B.A. Steer, P. Schimmel, J. Biol. Chem. 274, 356001-6 (1999)), pero aún aminoacila eficientemente su propio A Nt^ supresor (L. Wang, T.J.
Magliery, D.R. Liu, P.G. Schultz, J. Am. Chem. Soc. 122, 5010-1 (2000)). Así el ARNt ^ /TyrRS de M. jannaschii funciona como un par ortogonal, y puede incorporar eficientemente la tirosina en respuesta al codón ámbar, UAG, en E. coli.
Para reducir adicionalmente el reconocimiento de este ARNt ortogonal por la sintetasa de E. coli, se realizo el esquema de mutagénesis y selección. Para detalles adicionales, ver la solicitud de patente de Estados Unidos Serie No. , titulada "Methods and Compositions for the production of orthogonal tRNA.tRNA synthetase pairs" ("Métodos y Composiciones para la producción de los pares de sintetasa ortogonal ARNt-ARNt")/ (Caso de Abogado número 54-000130US, por Schultz et al.,) presentada concurrentemente con la presente solicitud, la descripción de la cual se incorpora en su totalidad. En resumen, los once nucleótidos del ARNt CTyUrA de M. jannaschii que no interactúan directamente con la TyrRS de . jannaschii se mutaron aleatoriamente hasta aforar una biblioteca de ARNt supresor. esta biblioteca de ARNt se pasó a través de una selección negativa que retira los AKNt que se aminoacilan mediante las sintetasas de E. coli, seguidos por una selección positiva para los ARNt que se aminoacilan eficientemente por la TyrRS de M. jannaschhii . La ortogonalidad de los AR ts supresores resultantes se probó mediante un análisis de complementación in vivo, a base de la supresión de un codón de terminación ámbar en una posición no esencial (Alal84) del gen de beta-lactamasa TEM-1 portado en el plásmido pBLAM. La aminoacilación de un ARNt supresor transformado mediante cualquier sintetasa de E. coli endógena da como resultado el crecimiento celular en la presencia de ampicilina. El E. coli transformado con del ARNt CTyUrA de M. axxna.sch.ii y pBLAM sobrevive en 55.5 microgramos/ml ampicilina. Cuando el mejor ARNt supresor mutante (ARNtm^ ) seleccionado de la biblioteca se expresa, las células sobreviven en sólo 12.4 microgramos/ml ampicilina. El ARNtm "- supresor mutante contiene las siguientes sustituciones de nucleótido: C17A, U17aG, U20C, G37A y U47G. Por comparación, las células con pBLAM sólo (en la ausencia de cualquier ARNt supresor) sobreviven a 9.7 microgramos/ml de ampicilina. Cuando la TyrRS de M. jannaschii se coexpresa con este ARNtm CTyUrA , las células sobreviven a 436 microgramos/ml de ampicilina. Así, el AR tm^ es un sustrato más pobre para las sintetasas endógenas que la ARNtmCTyUrA de M. Jjannaschii yJ aún se aminoacila eficientemente por la TyrRS de M. jannaschii . Al alterar la especificidad del aminoácido de la TyrRS de M. jannaschii ortogonal a fin de cambiar la AR tm^ con un aminoácido no natural deseado, una biblioteca de TyrRS mutante se generó y se seleccionó. En base a la estructura de cristal de la TyrRS homologa del Bacillus stearothermophilus (P. Brick, T. N. Bhat, D. M. Blow, J. Mol. Biol. 208, 83-98 (1988)), se mutaron cinco residuos (Tyr32, Glul07, Aspl58, Ilel59 y Leul62) en el sitio activo de TyrRS M. jannaschii, que se encuentran dentro de 6.5 Á de la para posición del anillo arilo de la txrosina unida. Los residuos correspondientes de una TyrRS de M. jannaschii (TyrRSmut, para aminoacilacion con O-metil-L-tirosina) son Tyr32 (Tyr34) , Glu107 (Asn123) , Asp158 (Asp176) , lie159 (Phe177) , y Leu162 (Leu180) - - con los residuos de la TyrRS de B. stearothermophilus en paréntesis . Como se describe en más detalle abajo, inicialniente se mutaron todos a alanina para generar una TyrRS de Ala5, q^ue es incapaz de cambiar el AR tmCTyUrA con tirosina. Esta TyrRS de Ala5 mutante se utilizó como un modelo para generar una biblioteca de mutantes TyrRS en la cual los cinco residuos se mutaron aleatoriamente mediante mutagénesis de PCR con oligonucleótidos impuros El gen de TyrRS de M. jannaschii se expresó bajo el control del promotor y terminador GlnRS de E. coli en el plásmido pBK-JYRS, un plásmido derivado de pBR322 con resistencia a la kanamicina. Los residuos Tyr32, Glul07, Aspl58, Ilel59 y Leul62 se sustituyeron con Ala por mutagénesis dirigida al sitio para aforar el plásmido pBK-JYA5. Los oligonucleotides LW157 5'- GGAATTCCATATGGACGAATTTGAAATG-3 ' , L 164 5' -GTATTT TACCACTTGGTTCAAAACCTATMMNAGCAGATTTTTCATCTTTTTTTCATCTTTTTTTAAA AC-3 ' , LW159 5 ' -TAGGTTTTGAACCAAGTGGTAAAATAC-3', LW165 5 ' -CATTCAGTGTATAATCCTTATCAAGCTGGAAMNNACTTCCATAA ACATATTTTGCCTTTAAC-3', LWI61 5'-TCCAGCTTGATAAGGATTATACA CTGAATG-3 ' , LW167 5' -CATCCCTCCAACTGCAACATCAACGCCMNNATA ATGMNI NATTAACCTGCATTATTGGATAGATAAC-3 ' , L 163 5 ' -GCGT TGATGTTGCAGTTGGAGGGATG-3 ' , y LW105 5' -AAACTGCAGTTATAAT - - CTCTTTCTAATTGGCTC-3 ' con NNK (N=A+T+G+C, K=G+T, y M=C+A (Operon, Alameda, CA) en los sitios de mutación se utilizaron para amplificación PCR del mutante TyrRS Ala5 (pB -JYA5) y se ligó de regreso hacia el pBK-JYA5 de Ndel-PstI-digerido para aforar la biblioteca TyrRS. Los vectores ligados se transformaron en células competentes de E. col DH10B para producir una biblioteca de 1.6 X 109 colonias que forman unidades (cfu) . Los genes TyrRS de 40 colonias aleatoriamente recogidas se secuenciaron para confirmar que no existía desviación en las posiciones NNK aleatorizadas y ninguna otra mutación no esperada. La biblioteca se amplificó mediante maxiprep, y el ADN superenrollado se utilizó para transformar la cepa de selección pYC-J17.
Se aplicó entonces una selección positiva que se basa en la supresión de un codón de terminación ámbar en una posición no esencial (Aspll2) en el gen de cloranfenicol acetiltransferasa (CAT) (M. Pastrnak, T. J. Magliery, P. G. Schultz, Helvética Chimica Acta. 83, 2277-86 (2000) . Las células se desarrollaron en un medio que contenía el aminoácido no natural y se seleccionó para su supervivencia en la presencia de varias concentraciones de cloranfenicol .
Si una TyrRS cambia la ANtm^ con cualquier aminoácido, ya sea natural o no natural, las células producen CAT y - 5 - sobreviven. Las células sobrevivientes se desarrollaron en la presencia de cloranfenicol y en la ausencia del aminoácido no natural. Aquellas células que no sobrevivieron, i.e. , las cuales codifican a la TyrRSs mutante que cambia el ARNtm Tyr CUA ortogonal con un aminoácido no natural se aislaron de una placa de réplica complementadas con el aminoácido no natural . Los genes de TyrRS se aislaron a partir de esas células, recombinadas ín vi tro por la redistribución del ADN, y se transformaron de regreso a E coli por rondas adicionales de selección.
Siete análogos de tirosina con diferentes grupos funcionales en la para posición del anillo de arilo (acetilo, amino. carboxilo, isopropilo, metilo, O-metilo y nitro) se utilizaron individualmente en las selecciones que se realizaron como sigue. El q 3en que codifica la ARNtmCTyUrA baJjo el control del promotor Ipp y el terminador rrnC se insertó en el plasmido pACMDl12TAG (un plásmido pACYC184 con un codón de terminación TAG que reemplaza a Aspll2 en su gen CAT (M. Pastrnak, T. J. Magliery, P. G. Schultz, Helvética Chimica Acta. 83, 2277-86 (2000))) para aforar el plásmido pYC-J17. El ADN - - superenrollado que codifica la biblioteca TyrRS se transformó en células competentes DHIOB de E. coli que contienen el pYC-J17 para producir una biblioteca de tamaño mayor que 3 X 109 cfu, asegurando la cobertura completa de la biblioteca original . Las células se colocaron entonces en placas en placas de medio mínimo conteniendo 1% de glicerol y leucina 0.3 mM (GMMIL) con 17 microgramos/ml de tetraciclina (Tet) , 25 microgramos/mi de kanamicina (Kan) , 50 microgramos/ml de cloranfenicol (Cm) , y 1 de aminoácido no natural. Después de la incubación a 37°C durante 44 horas, las colonias en las placas suministradas con O-metil-L-tirosina se agruparon, los plásmidos se aislaron y retransformaron en células competentes DH10B de E. coli conteniendo pYC-J17, y las células transformadas se seleccionaron positivamente en 50 microgramos/ml de Cm. Las colonias (96) se seleccionaron individualmente desde la placa, se diluyeron en 100 mi de medio líquido G ML, y se estriaron en dos conjuntos de placas Kan/Tet GMML con varias concentraciones de Cm. No se agregó O-metil-L-tirosina al conjunto de placas 1 y la concentración de Cm se varió de 10 - 25 microgramos/ml; el conjunto de placas 2 contenía 1 mM de O-metil-L-tirosina y 59 microgramos de Cm. Las réplicas de las colonias que no crecieron en 15 microgramos/ml de Cm en el conjunto de placas 1 se - - seleccionaron del conjunto de placas 2. Los plásmidos conteniendo el gen TyrRS se purificaron y recombinaron in vitro mediante la redistribución del ADN utilizando el protocolo de Stemmer (W. P. C. Stemmer, Nature 370,389-91 (1994) ) con la expectativa de 10 mM Mn2+ en lugar de Mg2+ en la reacción de fragmentación (I. A. Lorimer, I. Pastan, Nucleic Acids Res. 23, 3067-8 (1995) . La biblioteca se religó entonces al vector pBK-JYA5 predigerido para aforar una segunda generación de biblioteca TyrRS con un tamaño típico de 8 X 108 a 3 X 109 cfu. Los treinta miembros aleatoriamente seleccionados de la biblioteca se secuenciaron. La tasa mutagónica introducida por la redistribución del ADN fue 0.35%. Esta biblioteca se transformó en la cepa de selección para la siguiente ronda de selección seguida por la redistribución. La concentración de Cm en la selección positiva y en el conjunto de placas 2 se elevó a 80 microgramos/ml para la segunda ronda y 120 microgramos/ml para la tercera ronda; la concentración de Cm en el conjunto de placas 1 no se cambió. Después de tres rondas de redistribución de ADN, las colonias empezaron a crecer en 20 - 25 microgramos/ml de Cm en el conjunto de placas 1, indicando que los imitantes de TyrRS fueron aceptando los aminoácidos naturales como substratos . Por lo - - tanto, el mejor clon seleccionado después de dos rondas de redistribución de ADN se caracterizó en detalle. Después de las dos rondas de selección y la redistribución de ADN, se extrajo un clón (TyrRS imitante (LWJ16) ) cuya supervivencia en cloranfenicol dependió de la adición de ImM O-metil-L-tirosina al medio de crecimiento. En la ausencia de O-metil-L-tirosina, las células que alojaron el TyrRS mutante (LWJI6) no fueron viables en las placas de medio mínimo conteniendo 1% de glicerol, 0.3 M leucina (GMML) , y 15 microgramos/ml de cloranfenicol . Las células fueron capaces de crecer en placas de GMML con 125 microgramos/ml de cloranfenicol en la presencia de 1 mM O-metil-L-tirosina . Se obtuvieron resultados similares en GMML liquido. Como un control, las células AR tm^ y la TyrRS de Ala5 no sobrevivió a la concentración más baja de cloranfenicol utilizada, ya sea en la presencia o ausencia de ImM O-metil-L-tirosina. Esto indica que el crecimiento de las células en cloranfenicol depende de la expresión del TyrRS mutante (LWJ16) y no es un simple efecto nutricional de O-metil-L-tirosina. Además de ImM O-metil-L-tirosina por si mismo no afecta significativamente la tasa de crecimiento de E. colí.
Para demostrar adicionalmente que el fenotipo observado se debe a la incorporación del sitio especifico de O-metil-L-tirosina por el par AR tm^ ortogonal/ TyrRS mutante (LWJ16) en respuesta a un codón de terminación ámbar, se generó y se caracterizó un mutante de O-metil-L-tirosina de la dihidrofolato reductasa (DHFR) . El tercer codón del gen DHFR de E. coli (un sitio permisivo) se mutó a TAG y se agregó una etiqueta Hiss en la C-terminal a fin de separar la proteína mutante del DHFR de E. coli endógena. Como un control, la AR tm^ se coexpresó con la TyrRS de M. jannaschii tipo silvestre, dando como resultado la supresión eficiente del codón sin sentido en el DHFR con tirosina. Ver la Figure 2. Cuando la TyrRS mutante (LWJI6) se expresó en la presencia de AR tm CTyUrA y 1 mM O-metil-L-tirosina en medio de crecimiento GMML liquido, la longitud total de DHFR también se produjo y pudo purificarse por cromatografía de afinidad Ni con un rendimiento aislado de 2 mg/litro. El rendimiento de la proteína purificada es aproximadamente 26 veces menor en medio GMML líquido en comparación al medio rico en 2YT. Por ejemplo, cuando el - - AKNtm^ y TyrRS de M. je naschii tipo silvestre se coexpresan, el rendimiento de DHFR es 67 mg/ml en 2YT y 2.6 mg/1 en GMML líquido. En la ausencia de cualquier O-metil-L-tirosina, ARNtm^ o TyrRS mutante (LWJ16) , ningún DHFR .(0.1% por densitometria) se observó mediante el análisis con electroforesis de gel SDS-poliacrilamida y tinción de plata. Ver Figura 2. El análisis Western demostró además que no se produjo ninguna cantidad de trazas de DHFR en la ausencia de cualquier AR tm^ , TyrRS mutante (LWJ16) , o O-metil-L- tirosina. Ver la Figure 2.
La identidad del aminoácido insertado en respuesta al codón TAG se confirmó por análisis de masas tanto de la proteina intacta como de los fragmentos trípticos.. El promedio de masa de la proteína intacta se determinó por ionización de electroaspersión Fourier Transform Ion Cyclotron Resonance Mass Spectrometry (Espectrometría de Masas de Resonancia Ciclotrónica de Iones de Transformada de Fourier) (FT-ICR MS) . El valor observado para la masa monoisotópica de la siguiente aglomeración para el calibrante interno fue 18096.002 Da, que se encuentra dentro de 5 ppm de la masa teórica de 18095.908 Da y demuestra claramente la - - incorporación de O-metil-L-tirosina. Para este experimento se utilizó un DHFR mutante que carece de la etiqueta His en la C-terminal y se purificó por cromatografía de afinidad de metotrexato. En la proteina mutante, el tercer codón se cambió a TAG, y el cuarto codón se cambió de CTG a ATG para mejorar la eficiencia de la supresión de ámbar, dando como resultado una mutación Leu4Met . Este resultado indica también que otras sintetasas de E. coli endógenas no utilizan la O-metil-L-tirosina como un sustrato. Se llevó a cabo la espectrometría de masas en tándem con la cromatografía líquida de digestiones trípticas para confirmar la secuencia del peptido de la N-terminal . Un ejemplo de un espectro MS en tándem se muestra en la Figura 3. El ión precursor doblemente cambiado en 691.5 Da, que corresponde al peptido tríptico de la M-terminal MIY*MIAALAVDR, se seleccionó y fragmentó en un espectrómetro de masas de trampa de ion (ITMS) . Las masas de ión en fragmento pudieron asignarse de manera no ambigua como se muestra en la Figura 3, confirmando la incorporación en el sitio específico de la O-metil-L-tirosina. Ni el espectro de masas de proteína ni los mapas de peptido tríptico dieron ninguna indicación de la incorporación de la tirosina u otro aminoácido en lugar de la O-metil-L-tirosina de la proporción de señal a ruido del espectro de masas de proteina se obtuvo - - un mínimo de 95% de pureza de incorporación para O-metil-litarosina . Tomadas juntas, el crecimiento celular, la expresión de la proteina y los experimentos de espectrometría de masas demuestran que el par ortogonal AR tm^ /TyrRS mutante (LWJ16) es capaz de insertar selectivamente O-metil-L-tirosina en la proteínas en respuesta al codón ámbar con una fidelidad que rivaliza a la de los aminoácidos naturales. Loa análisis de la secuencia TyrRS mutante (LWJ1,6) que cambia la AR tmCTyUrA con O-metil-L-tirosina revela los cambios de 12 nucleótidos, dos de los cuales fueron silenciosos . Las diez mutaciones no silenciosas dieron como resultado las siguientes sustituciones de residuo de aminoácido con relación a TyrRS: Tyr32 tipo silvestre, cuyos enlaces de hidrógeno al átomo de oxígeno del arilo de la tirosina del substrato natural, se mutaron a Gln; Aspl58, cuyos enlaces de hidrógeno al grupo hidroxilo de la tirosina se mutaron a Ala; Glul07, cuyos enlaces de hidrógeno a Aspl58, se mutaron a Thr; y Leul62, la cual se localiza en la parte inferior de la cavidad de unión, se mutó a Pro. En base a la estructura de cristal de rayos X del homólogo de TyrRS de B. stearothermophilus, se puede especular que la - - pérdida de la red de enlaces de hidrógeno entre Tyr32, Asp 158 y la tirosina substrato debe desfavorecer la unión de la tirosina al TyrRS mutante (LWJ16) . Verdaderamente, la mutación de Aspl76 (que corresponde, a Aspl58 en M. jannaschii) de TyrRS de B. stearothermophilus produce enzima inactiva (G. D. P. Gray, H. W. Duckworth, A. R. Fersht, FEBS 318, 167-71 (1993)). Al mismo tiempo, las mutaciones Aspl58AIa y Leul62Pro crean una cavidad hidrofóbica que permite al grupo metilo de O-metil-L-tirosina extender adicionalmente hacia la cavidad de unión del substrato. Otros importantes residuos catalíticos en el sitio activo, que se unen al grupo ribosa o al fosfato del adenilato, no se cambiaron después de dos rondas de redistribución de ADN. El análisis detallado de estas mutaciones espera la estructura tridimensional del TyrRS mutante (LWJI6) .
Las cinéticas de la formación de adenilato de 0-metil-L-tirosina y tirosina con ATP catalizado por la TyrRS mutante (L J16) se analizaron in vitro utilizando un análisis de intercambio de pirofosfato. El gen de TyrRS mutante (LWJI6) con seis histidinas en su C-terminal se clonó en el plásmido pQE-60 (Qiagen, CA) para aforar el plásmido pQE-mJYRS . La proteina se purificó mediante cromatografía de afinidad de metal inmovilizado de acuerdo al protocolo del - - fabricante (Qiagen, CA) . El intercambio del pirofosfato (PPi) se llevó a cabo a 37°C en una mezcla de reacción conteniendo 100 mM TrisHCI (pH7.5), 10 mM KF, 5 mM MgCI2, 2 m ATP, 2 mM NaPPi, 0.1 mg/ml albúmina de suero bovino, aproximadamente 0.01 microCi/ml [32P]NaPPi, y varias concentraciones de tirosina o O-metil-L-tirosina . Las reacciones se iniciaron con la adición de la TyrRS mutante purificada (LWJ16) , y se tomaron alícuotas periódicamente y se templaron con 0.2 ItNaPPi, 7% ácido perclórico, y 2% carbón vegetal activado . El carbón vegetal se filtró y se lavó con 10 mM NaPPi (pH2) , después se midió mediante conteo de centelleo para determinar los niveles 32P en el ATP absorbido en el carbón vegetal . Los valores de kcat y Km se calcularon por ajuste directo de la ecuación Michaelis-Menten utilizando análisis de regresión no lineal. Tabla 1. Parámetros cinéticos para la TyrRS mutante (LWJ16) hacia la tirosina y O-metil-L- tirosina medidos por análisis de intercambio de pirofosfato.
Los resultados de este análisis se muestran en la Tabla 1. El Km para la tirosina (5833 µ?) es aproximadamente 13 veces mayor que para O-metil-L-tirosina, y el kcat para la tirosina (1.8 X 10-3 s-1) es 8 veces Inferior con relación a ese para O-metil-L-tirosina. Asi, el valor de kcat/Km de la TyrRS mutante (LWJ16) para O-metil-L-tirosina es aproximadamente 100 veces mayor que el de tirosina. La concentración fisiológica de la tirosina en E. coli es aproximadamente 80 µ?, que se encuentra lejos por abajo del valor Km (5833 lxM) de la TyrRS mutante (LWJI6) para la tirosina. Presumiblemente, la concentración de O-metil-L-tirosina en células es comparable o mayor que el Km (443 gM) . Ejemplo 2: Incorporación in vivo de L-3- (2-naftil) alanina Se realizó la incorporación de sitio específico de un segundo aminoácido no natural, L-3 - (2-naftil) alanina hacia las proteínas en E. coli. Este resultado muestra que este esquema total es aplicable a un huésped de aminoácidos . Ninguna sintetasa específica para L-3- (2naftil) -alanina se seleccionó a partir de la biblioteca de TyrRS mutante producida en el Ejemplo 1, anteriormente descrito.
Un codón de terminación ámbar y su ADNt supresor ámbar ortogonal correspondiente, ARNtm^ se seleccionó para codificar el aminoácido no natural (Wang, L.; Schultz, P. G. Chem. Biol 8, 883-890 (2001)). La sintetasa del ARNt-tirosil de M. jannaschii (TyrRS) se utilizó como el punto de - inicio para la generación de una sintetasa ortogonal con la especificidad del aminoácido no natural . Este TyrRS no aminoacila ningún ARNts endógeno de E. coli (Steer, B. A.; Schimmel, P. J. Biol Chem. , 274, 35601-35606 (1999)), pero aminoacila el ARNtm^ , con tirosina (Wang, L.; Magliery, T.
J.; Liu, D. R. ; Schultz, P. G. J. ñm. Chem. Soc. , 122, 5010-5011 (2000) ) . L-3- (2-naftil) -alanina se seleccionó para este estudio ya que representa una perturbación estructural significativa a partir de tirosina y puede tener nuevas propiedades de paquete. Para cambiar la especificidad de aminoácido de la TyrRS de manera que cambie la R tm^ con L-3- (2-naftil) - alanina y ninguno de los 20 aminoácidos comunes, se generó y se seleccionó una biblioteca mutantes TyrRS de M. jannaschii . En base a un análisis de la estructura de cristal de la TyrRS homologa del Bacillus stearothermophilus (Brick, P.; Bhat, T. N. ; Blow, D. M. J. Mol. Biol., 208, 83-98 (1989)) se mutaron cinco residuos (Tyr32, Asp158, lie159, Leu162, y Ala167) in el sitio activo de TyrRS de M. jannaschii que se encuentran dentro de 7 Á de la para posición del anillo de arilo de tirosina. Para reducir la contaminación de la sintetasa tipo silvestre en la siguiente selección, estos residuos (excepto Ala ) se rautaron primero todos a alanina. El gen TyrRS Ala5 inactivo resultante se utilizó como un modelo por la mutagenesis aleatoria de la reacción en cadena de polimerasa (PCR) con oligonucleótidos que lleven mutaciones aleatorias en los sitios correspondientes . La biblioteca TyrRS mutante se pasó primero a través de una selección positiva en base a la supresión de un codón de terminación ámbar en una posición no esencial (Aspll2) en el gen de cloranfenicol acetiltransferasa (CAT) . Las células transformadas con la biblioteca TyrRS mutante y el gen AR tm CTyUrA crecieron en medio mínimo conteniendo 1 mM L- 3- (2-naftil) -alanina y 80 g/ml de cloranfenicol . Las células pueden sobrevivir si sólo una TyrRS mutante aminoacila la ARNtm CTyUrA con cualquier aminoácido natural o L- 3- (2-naftil) -alanina . Las células sobrevivientes crecieron entonces en la presencia de cloranfenicol y en la ausencia del aminoácido natural . Aquellas células que no sobrevivieron debieron codificar un TyrRS mutante que cambió el ARNtm^ con L-3- (2-naftil) -alanina, y se recogieron de una placa de réplica suministrada con el aminoácido no natural . Después de tres rondas de selección positiva seguidas por una selección negativa, cuatro TyrRS' s mutantes se caracterizaron utilizando un análisis in vivo en base a la supresión del codón de Asp 112TAG en el gen CAT. En la ausencia de L-3- (2-naftil) -alanina, las células que expresan la TyrRS seleccionada y la ARNtm CTyUrA sobrevivieron en 25 a 35 µg/ml de cloranfenicol en placas de medio mínimo conteniendo 1% de glicerol y 0.3 mM leucina (placa de G ML) ; en la presencia de L-3- (2-naftil) -alanina, las células sobrevivieron en 100 a 120 µg/ml de cloranfenicol en placas de GMML. Comparado al valor IC50 en la ausencia de cualquier TyrRS (4 µg/ml cloranfenicol) , estos resultados indican que los TyrRS's seleccionados aceptan la L-3- (2-naftil) -alanina, pero también cambian aún los aminoácidos naturales en algún grado .
Para reducir la actividad de la TyrRS mutante hacia aminoácidos naturales, se llevó a cabo una ronda de redistribución de ADN utilizando los cuatro genes mutantes anteriores como modelos. La biblioteca de TyrRS mutante resultante se pasó a través de dos rondas adicionales de selecciones positivas y selecciones negativas . Se desarrolló un TyrRS mutante (SS 12-TyrRS) , cuya actividad para aminoácidos naturales se redujo grandemente (IC50=9 µg/ml cloranfenicol) mientras su actividad hacia L-3- (2-naftil) -alanina se mejoró (IC50=150 µ9/p?1 cloranfenicol) . Los resultados descritos arriba en an lisis CAT in vivo utilizando varios mutante TyrRS se muestran en la Tabla 2. Se utilizó un pYC-J17 plásmido para expresar el gen ARNtm Tyr , y el gen del cloranfenicol acetilfransferasa con un CUA 2 3 codón de terminación ámbar en Aspll2. Se utilizó un plásmido pBK para expresar TyrRS, y se cotransformó con pYC-J17 en E. coli DH10B. Las células sobrevivientes en las placas G MLCell se titularon en la presencia de diferentes concentraciones de cloranfenicol .
Tabla 2. Análisis in vivo de cloranfenicol acetiltransferasa de TyrRS mutante. ICS0 ^ /ml de cloranfenicol) TyrRS Mutante Sin L-3- (2-naftil) -Ala Con L-3- (2-naftil) - Ala sin TyrRS 4 4 TyrRS en peso 240 240 Después de la selección SI-TyrRS 30 120 S2-TyrRS 30 120 S3-TyrRS 25 110 S4-TyrRS 35 100 Después de redistribuir el ADN SS12- TyrRS 9 150 Una L-3- (2-naftil) -alanina mutante de dihidrofolato reductasa de ratón (DHFR) se generó y caracterizó para - - confirmar la capacidad del par AR tm^ /TyrRS para incorporarse específicamente al sitio L-3- (2-naftil) -alanina en respuesta a un codón de terminación ámbar. El codón Tyrl63 del gen de DHFR de ratón se mutó a TAG, y se agregó una etiqueta His6 a la terminal COOH de la DHFR para facilitar la purificación de la proteína utilizando Ni2+ cromatografía de afinidad. Como un control positivo la TyrRS tipo silvestre de M. jannaschii se coexpresó con la A tm^ resultante en supresión eficiente del codón TAG con tirosina (Figura 4) . Cuando SS12-TyrRS se coexpresó con la mu ARNt^ en la presencia de 1 mM L-3- (2-naf il) -alanina, también se generó la DBIFR de longitud completa de ratón (con rendimiento de 2.2 mg/1 en medio mínimo GMML líquido) . En la ausencia de cualquiera de L-3 (2-naftil) -alanina, ARNtm Tyr , o ^ CUA SS 12-TyrRS, .no se produjo DHFR de longitud completa. Se utilizó un anticuerpo penta-His para detectar la etiqueta His6 en la terminal COOH de la DHFR en una inmunotransferencia Western. No pudo detectarse la DHFR en la ausencia de cualquiera de los tres componentes anteriores .
Las digestiones trípticas de la L-3- (2-naftil) -alanina mutante de ratón se analizaron por MALDI FT-ICR y cromatografía líquida en tanden con espectrometría de masas para confirmar ambiguamente la incorporación de L-3- (2-naftil) -alanina. El mapa del péptido de la digestión internamente calibrada muestra un pico principal en 1867.962, que se encuentra dentro de 3.5 ppm de la masa teórica del péptido tríptico LLPEX*TGVLSEVQEEK en donde X* representa el residuo de L-3- (2-naftil) -alanina (Prol64 se mutó a Thr para mejorar la eficiencia de supresión ámbar) . Además, el espectro de masa en tándem interpretado del ion precursor en m/z 934.5, que corresponde al ion doblemente cambiado del péptido de interés se muestra en la Figura 5. La información de secuencia recogida del espectro claramente demuestra la incorporación específica de sitio de L-3- (2-naftil) -alanina en la proteína. Ninguno de los mapas de péptido ni las series LC MSIMS produjeron alguna indicación de los mutantes en los cuales el residuo L-3- (2-naftil) -alanina se sustituyó por otro aminoácido. La proporción de señal a ruido de más de 1500 observada en los mapa de péptido muestra una fidelidad en la incorporación de L-3- (2-naftil) -alanina mejor que 99.8%. El SS12-TyrRS desarrollado tiene las siguientes mutaciones: Tyr32?Leu32 , Aspl58-»Prol58 , Iel59-4Alal59, Leul62-»Glnl62 , y Alal67?-Vall67. Los residuos correspondientes de B. stearothermophilus son Tyr32 (Tyr34) , Asp158 (Asp17S) , lie159 (Phe177) , Leu152 (Leu180) , y Ala167 (Gln189) con los residuos TyrRS de B. stearothermophilus en paréntesis . En base a la estructura de cristal de la TyrRS homologa de B. stearothermophilus, las mutaciones de Tyr32?4Leu32 y Aspl58—»Prol58 probablemente den como resultado la pérdida de los enlaces de hidrógeno entre Tyr32, Aspl58, y la tirosina de sustrato nativo, desfavoreciendo asi la unión de la tirosina a SS12-TyrRS. La mayoría de los residuos se mutan a aminoácidos con cadenas laterales hidrofóbicas, que se espera favorezcan la unión de L-3- (2-naftil) -alanina.
En resumen, los experimentos de crecimiento celular, expresión de proteína, y espectrometría de masas demuestran que el par ARNtm^/SS 12-TyrRS es capaz de insertar selectivamente L-3- (2-naftil) -alanina en las proteínas en respuesta al codón ámbar con fidelidad que rivaliza con esa de los aminoácidos naturales.
Ejemplo 3: Incorporación in vivo de análogos de tirosina que contienen amino, isopropil, o alil Se utilizó un sistema de selección a base de FACs para desarrollar rápidamente tres variantes de sintetasa altamente selectivas que aceptan análogos de tirosina amino, - - isopropilo, o alilo. El sistema incluye un plásmido informador de múltiples propósitos utilizado para aplicaciones de presión selectiva tanto positiva como negativa y para la evaluación fácil y cuantitativa de la actividad de la sitetasa. Un marcador de cloranfenicol acetil transferasa (CAT) permite la selección positiva para la actividad de la tirosil-RNAt sintetasa (TyrRS) de M. jannaschii. Un sistema informador polimerasa/GFP T7 permite la valoración de la actividad de la sintetasa dentro del crecimiento celular tanto en presencia como en ausencia de un aminoácido no natural . Se utilizó la selección celular activada por fluorescencia (FACS) para selección contra variantes de sintetasa que aceptan los aminoácidos naturales, aunque los análisis visual y floremétrico valoró la actividad de la sintetasa cualitativamente y cuantitativamente, de manera respectiva. Diseño de un sistema informador de fluorescencia amplificable. Los esfuerzos para desarrollar un sistema de selección versátil para la valoración de la actividad de la sintetasa en células vivas surgen inicialmente de un deseo para un grado mayor de control sobre la presión selectiva aplicada a las poblaciones de las variantes de sintetasa, especialmente presión selectiva negativa. Como el sistema se utilizó para valorar las actividades de un gran número de variantes de sintetasa, se buscó un informador que pudiera - - estar dispuesto a la selección de alto rendimiento. Además, se desea un informador que pudiera permitir la evaluación cualitativa y cuantitativa. Para cumplir estos requerimientos, se diseñó una selección a base de fluorescencia. El sistema se basó en la producción de GFPuv dependiente de sintetasa, una variante de la proteína fluorescente verde que se ha optimizado para la expresión en E. coli (Crameri, A., Whitehorn, E.A., Tate, E. & Stemmer, W.P., Nature Biotechnol 1996, 14, 315-319). Este fluoróforo Este fluoróforo esta dispuesto para utilizarse en FACS y fluorometría, asi como la inspección visual en placas y en cultivo líquido. El sistema se diseñó de manera que la supresión del selector dependiente de la sintetasa, e.g., codones ámbar sin sentido pudieran dar como resultado la producción de una señal de fluorescencia. A fin de maximizar la sensibilidad del informador, se hizo amplificable mediante la colocación de los codones dentro del gen para la polimerasa AR T7, que se diseñó para accionar la expresión del gen informador GFOuv en analogía a otros sistemas informadores intracelulares amplificables (Lorincz, M., Roederer, M., Diwu, Z., Herzenberg, L.A., Nolan, G.P. Cytojfletry, 1996, 24, 321-329; Zlokamik, G. , Negulescu, P.A., Knapp, T.E., Mere, L . , Burres, N. , Feng, L. , Whitney, M. , Roemer, K. & Tsien, R.Y. , Science, 1998, 279, 84-88). El gen de polimerasa de ARN T7 se colocó bajo control del promotor - - de arabinosa a fin de permitir la fácil optimización de la producción de la transcripción de ARN para la polimerasa de ARN T7 que contiene el codón ámbar. Optimización de la polimerasa de ARN T7/sistema informador GFPuv. Un plásmido informador copiado del medio, pREP, se diseñó para expresar las variantes de la polimerasa de ARN T7 que contiene ámbar bajo el control del promotor de arabinosa y el gen GFPuv bajo el control del promotor T7 (Figura 6a) . Una serie de doce variantes de polimerasa de ARN T7, diseñadas para optimizar el mejoramiento de florescencia dependiente de la sintetasa (Figura 6b) , se insertó en PREP para crear los plásmidos pREP(l-12) . Todas las variantes contienen una secuencia guía N-terminal de siete aminoácidos (MTMITVH) y 1-3 codones de terminación ámbar (TAG) . Las variantes 1-3 contenían uno, dos, y tres codones de terminación ámbar, respectivamente, sustituidos por la metionina en la posición uno (MI) , justo corriente debajo de la secuencia guía. Las variantes 4-9 contenían un codón ámbar sustituido por DIO, R96, Q107, A159, Q169, o Q232, respectivamente, que se predijeron para localizarse en las regiones de ciclo de la estructura (Jeruzalmi, D. & Steitz, T.A., EMBO J. , 1998, 17, 4101-4113) . Las variantes 10-12 contenían codones de terminación ámbar sustituidos en las posiciones MI y ya sea Q107, A159, o Q232, respectivamente. Las construcciones de plásmido se evaluaron - - por fluorometria y citometría de flujo de células vivas para mejorar la fluorescencia utilizando un plásmido compatible conteniendo la glutaminil-ARNt sintetasa ortogonal y Glutamina RNAtCuA del S. cerevisiae. Los plásmidos pREP(l-12) se encontró que proporcionan niveles variantes de mejoramiento de fluorescencia dependiente de la sintetasa, con la mejor construcción, pREP(10) que exhibe fluorescencia mayor de 220 veces por fluorometria (Figura 6c) y -400 veces mayor que la fluorescencia media por citometría (Figura 6d) en células que contienen la sintetasa tipo silvestre versus un mutante inactivo. La sustitución de una variedad de grupos funcionales en las posiciones que corresponden a los codones ámbar dentro de pREP(10) demuestran que posición 107 dentro de la polxmerasa de ARN T7 es altamente tolerante . Construcción de un plásmido informador de múltiples propósitos. Con el fin de construir un plásmido de múltiples propósitos para utilizarse en variantes tanto de selección como de detección de un TyrRS de M. jannaschii, el plásmido pREP(10) se combinó con el plásmido PYC-J 17 (Wang, L, Brock, A., Herberich, B. & Schultz, P.G., Science, 2001, 292, 498-500) para obtener pREP/YC-JYCUA (Figura 7b) . El plásmido pREP/YC-JYCUA se valoró para la función con un plásmido compatible que expresa una variante de TyrRS de M. jannaschii (pB -mJYRS; Wang, L, Brock, A., Herberich, B. & Schultz, P.G., Science, 2001, 292, 498-500) selectiva para incorporar - - O-Metil-Tirosina (OMY) . Las células que contienen pREP/YC-JYCUA y pBKMJYRS, desarrolladas en la presencia de OMY, exhibieron un valor IC50 de cloranfenicol (Cm) de 120 microgramos/ml , idéntico al que se obtuvo utilizando el plásmido pYC-JI7, y una mejora de fluorescencia de 330 veces para las células desarroladas en la presencia de versus la ausencia de OMY, según se midió por fluorometría . Evolución de la especificidad del sustrato de la tirosil-ARNt sintetasa de M. jannaschii . Los resultados han mostrado que la cadena lateral de los aminoácidos que se une a la cavidad de la TyrRS de M. jannaschii puede desarrollarse para acomodar selectivamente los grupos químicos diferentes a la cadena lateral del . fenol de la tirosina (Wang, L, Brock, A., Herberich, B. & Schultz, P.G., Science, 2001, 292,498-500; Wang, L., Brock, A. & Schultz, P.G. J". Am. Che . Soc. 2002, 124, 1836-1837) . Buscamos para explorar adicionalmente la generalidad de la adaptación de los aminoácidos no naturales mediante la TyrRS de M. jannaschii al desafiar a la enzima para aceptar cuatro nuevas funcionalidades: p-Isopropil-Fenilalaniña (pIF) , p-Amino-Fenilalanina (PAF) , pCarboxil-Fenilalaniña (pCF) , o O-Alil-Tirosina (OAT) (Figura 7b) . Una biblioteca de variantes de TyrRS de M. jannaschii conteniendo aleatorizaciones en las posiciones Y32, E107, D158, 1159, y L162 (Wang, L, Brock, A., Herberich, B. & Schultz, P.G., Science, 2001, 292, 498-500), los residuos - - considerados para formar la cavidad de unión para la para posición del anillo tirosilo, se introdujo en las células que contenían el plásmido PREPIYC-JYCUA. Estas células, que comprenden una diversidad de bibliotecas de ~109, se utilizaron para iniciar cuatro experimentos de evolución para identificar las variantes de la sintetasa selectivas para pIF, pAF, pCF, o OAT (Figura 7c) . Se llevaron a cabo dos ciclos de selección positiva al permitir que los cultivos celulares se desarrollaran hasta la saturación en la presencia de Cm y uno de los cuatro aminoácidos naturales . Se retiraron alícuotas de células después del segundo ciclo de la selección positiva y se utilizaron para inocular un nuevo cultivo no conteniendo aminoácidos o Cm agregado, y al cultivo se le dejo de nuevo crecer hasta la saturación. En este punto, las células con fluorescencia probablemente contienen variantes de sintetasa que pueden aceptar uno de los 20 aminoácidos naturales. Aproximadamente 108 células de cada línea se sometieron a detección negativa utilizando FACS con el fin de eliminar los aminoácidos naturales que aceptan las variantes de sintetasa. Las células no fluorescentes se recolectaron y se amplificaron a través del crecimiento hasta la saturación. Estas células amplificadas se utilizaron para inocular un nuevo cultivo para un ciclo final de selección positiva en cultivo líquido conteniendo aminoácidos no naturales y Cm. Después del crecimiento hasta la saturación, cada población de células se colocó en placas en el medio conteniendo 0, 30, 60, o 100 microgramos/ml Cm y ya sea 0 o 1 mM del aminoácido no natural apropiado. Identificación y caracterización de variantes de sintetasa desarrolladas. Placas de Cm complementadas con pIF, pAF, y OAT produjeron números 10-100 veces más de colonias fluorescentes que las placas no conteniendo aminoácidos agregados. En contraste, las placas para la población pCF produjeron el mismo número de colonias fluorescentes con o sin la adición de pCF. Las diez colonias fluorescentes más grandes se recogieron para cada una de las poblaciones pIF, pAF, y OAT de las placas conteniendo aminoácidos no naturales y se desarrollaron hasta la saturación en medio liquido con o sin aminoácido no natural . Visualmente se hizo una valoración cualitativa de la producción fluorescente con el uso de una lámpara portátil de longitud de onda larga ultravioleta (Figura 8a) . Se secuenciaron las variantes de sintetasa correspondientes a los clones que producen diferencias significativas en fluorescencia. Todos los diez clones de las poblaciones pIF y pAF tuvieron secuencias idénticas, aunque se identificaron tres diferentes clones de la población OAT. Los cambios en aminoácido ocurrieron dentro de los cinco sitios aleatorizados en todos los clones, con la excepción de dos sustituciones adicionales dentro de las - - variantes de sintetasa pIF-ARNt (pIF-RS)Las actividades de los diferentes clones se valoraron cuantitativamente. La fluorescencia se midió fluorométricamente para las células desarrolladas en cultivo líquido en la presencia o ausencia de aminoácido no natural (Figura 8b) . Los IC50s de Cm se determinaron al colocar en placas loas células o variando las concentraciones de Cm en la presencia o ausencia de un aminoácido no natural (Figura 8c) . Un gen de mioglobina conteniendo un codón ámbar en la cuarta posición se utilizó para valorar la producción de proteína conteniendo aminoácido no natural . El gen se expresó en células, utilizando la variante pIF-RS, pAF-RS o OMY-RS, respectivamente, en ya sea la presencia o ausencia de pIF, pAF, o OAT (Figura 8d) . Los rendimientos de proteína fueron comparables para todas las tres variantes, que variaron de 1-2 miligramos de proteína por litro de cultivo celular conteniendo aminoácido no natural. En contraste, la producción de proteína fue virtualmente indetectable en cultivos desarrollados en la ausencia de aminoácido no natural . Las proteínas se analizaron mediante espectrometría de masas por, que dieron masas de 18457.40 ± 0.81 (18457.28 esperado) para la proteína que contiene pIF, 18430.30 ± 0.27 (18430.21 esperado) para la proteína que contiene pAF. Las mediciones de actividad obtenidas utilizando el IC50 de Cm, fluorometría, y los análisis de expresión de proteína se - - correlacionaron bien, sin embargo, la actividad del PIF-RS parece ser algo subestimado por fluorometria. Según se compara a otros análisis la medición de fluorometría desproporcionalmente baja para la variante pIF-RS, muestra que la polimerasa de AR T7 puede desestabilizarse parcialmente a la incorporación del análogo pEF, a pesar de la aparente tolerancia de las posiciones de ámbar dentro del informador . Utilidad del sistema informador de múltiples propósitos. El sistema informador descrito aquí permite el uso de un solo plasmido de múltiples propósitos tanto para la selección positiva como para la detección negativa, obviando la necesidad de redistribuir los plásmidos entre rondas alternas de selección positiva y negativa. Un total de solo tres rondas de selección positiva y una ronda de detección negativa de las variantes de sintetasa se requieren para permitir la identificación de las variantes de la sintetasa que aceptan selectivamente los aminoácidos no naturales deseados . Estas características permiten los experimentos de evolución para llevarse a cabo en una materia de días . El sistema de detección puede utilizarse para identificar fácilmente las variantes de sintetasa activa utilizando placas de agar que contienen aminoácido no natural y para analizar individualmente la especificidad del aminoácido de las variantes .
Como se describe arriba, la polimerasa de ARN T7/sistema GFP puede utilizarse para comparar cuantitativamente las actividades de las variantes de la sintetasa. La disponibilidad de los tres clones OAT-RS aquí descritos y un clon OAT-RS diferente independientemente derivado de la misma biblioteca utilizando una selección positiva/negativa en base a CAT y barnasa (Tabla 2) permite la posibilidad de comparar los dos diferentes sistemas de evolución en términos de las variantes de sintetasa que resultan de cada una (Figura 9) . Este análisis revela que los tres clones derivados de la selección positiva y la detección negativa exhibe niveles ligeramente bajos de fluorescencia en la presencia de OAT, pero niveles ~10 veces menor que los de fondo en la ausencia del aminoácido no natural. La mejora de fluorescencia para las células desarrolladas en la presencia versus ausencia del aminoácido no natural es así aproximadamente 6 veces mayor para las células que expresan OAT-RS (I) a partir de la selección y detección que para las células que expresan el clón OAT-RS derivado de la selección positiva/negativa utilizando barnasa. Aunque no es claro si este ejemplo es representativo, estos datos sugieren que la polimerasa de ARN T7/sistema GFP puede permitir más rigor en la selección contra las variantes de la sintetasa que son confusas hacia los sustratos de aminoácido natural. Sin embargo, la mejora de fluorescencia para el crecimiento celular en la presencia versus la ausencia de un aminoácido no natural se espera que represente un límite inferior para la fidelidad de la incorporación del aminoácido no natural, según la rivalidad de los aminoácidos no naturales por unirse mediante una variante de sintetasa desarrollada reducirla la unión de los aminoácidos naturales. Además, aunque la alta fidelidad es claramente deseable, existe la probabilidad de hacer un trueque entre la fidelidad y la actividad total de la sintetasa, que podría depender de la aplicación deseada. Generalidades de la evolución de la aminoacil AR t sintetasa. Los resultados anteriores y los presentes demuestran aquí que la cadena, lateral de aminoácido que se une a la cavidad de la TyrRS de M. jannaschii es completamente maleable. Esta enzima puede desarrollarse para adaptar una variedad de funcionalidades en lugar de la cadena lateral de fenol de la tirosina y puede hacerse así con alta selectividad. En esta aplicación se demostró que la enzima puede desarrollarse para adaptar una funcionalidad amina, isopropil, o alil éter en la para posición del anillo de tirosina, en lugar del hidroxilo. Construcción de plásmido. El plásmido pREP (Figura 6a) se construyó mediante la inserción del fragmento de PCR sobrepuesto a un BairíRI/ApaLI que contiene el gen de polimerasa de ARN T7 corriente arriba de una región de terminación de la transcripción rrnB, seguido por un fragmento de PCR sobrepuesto a ApaLl/Ahdl conteniendo el gen araC y la región promotora ara del plásmido pBAD/ yc-Fus A (Invitrogen; para el control transcripcional del gen de polimerasa de ARN T7) y el gen GFPuv (Clontech; corriente arriba de la región de terminador T7 y corriente abajo del promotor T7) entre los sitios Ahdl/Bairíñl del plásmido pACYCI77 (New England Biolabs) . Los plásmidos pREP(l-12) se construyeron mediante el reemplazo de un fragmento Hpal/ApaLI de la polimerasa de ARN T7 con fragmentos de PCR de sobreposición que contienen mutaciones ámbar en las posiciones descritas. Los plásmidos pREP/YC-JYCUA se construyeron mediante ligación de un fragmento Afel/SacII de pREP(10) y un fragmento Earl (despuntado) /SacII de pYC-JI7 (Wang, L, Brock, A., Herberich, B. & Schultz, P.G., Science, 2001, 292,498-500). La construcción deseada se identificó siguiendo la trans ormación en las células que contienen la detección del plásmido pQ para la fluorescencia. El plásmido pQ se construyó mediante triple ligación de un fragmento de PCR sobrepuesto a Aatil/Salí que contiene el ScQRS corriente debajo de la región de promotor lac y corriente arriba de la región de terminación QRS de E. coli, un fragmento de PCR de sobreposición Salí/Aval que contiene el ARNt (CUA) Gln de S. cerevisiae corriente debajo de la región de promotor Ipp y corriente arriba de una región de terminación rrnC, y el fragmento Aval/Aatil de pBR322 (New England Biolabs) . El plásmido pQD se construyó mediante el reemplazo del fragmento pQ entre BamHI y BglII con un fragmento BamB.1/BglII del mutante ScQRS (D291 A) . El plásmido pBAD/JYAMB-4TAG se construyó mediante la inserción de un fragmento de PCR del mutante S4Amber de mioglobina, conteniendo una etiqueta C-terminal 6His, en el plásmido pBAD/YC-JYCUA, un híbrido del plásmido pYC-J17 (Wang, L, Brock, A., Herberich, B. & Schultz, P.G., Science, 2001, 292,498-500) y pBAD/Myc-His A (Invitrogen) conteniendo el gen para MjYtAR CuA, y el promotor pBAD y las regiones de clonación para la expresión heterologa de un gen insertado. Análisis fluorométrico y citométrico. Las colonias simples que contienen los plásmidos deseados se utilizaron para inocular cultivos de GMML de 2 mi conteniendo los antibióticos apropiados, 0.002% Arabinosa, y un aminoácido no natural si se desea. Los cultivos se desarrollaron hasta la saturación y las células (200 µ?) se aglomeraron y resuspendieron en 1 mi de salina amortiguada con fosfato (PBS) . La concentración celular se analizó por absorbancia a 600 nm y se midieron los niveles de fluorescencia a 505 nm con excitación a 396 nm utilizando un fluorímetro FluoroMax-2. Las células suspendidas en PBS se analizaron citométricamente . Para evaluar la permisividad de las posiciones ámbar dentro del gen de polimerasa T7 de pREP(10), el plásmido informador se transformó en un panel de cepas supresoras, que se analizaron subsecuentemente de manera fluorométrica . Evolución de variantes de aminoacil-AR t sintetasa. Las variantes de TyrRS de M. jannaschii aleatorizadas en las posiciones Y32, E107, D158,I159, y L162 (Wang, L, Brock, A., Herberich, B. & Schultz, P.G., Science, 2001, 292, 498-500) se transformaron en células DH10B de E. coli (Life Technologies) conteniendo pREP/YC-JYCUA para generar una biblioteca con una diversidad de ~109. Los transformantes se dejaron recuperar en el medio SOC durante 60 min a 37°C, y se desarrollaron hasta la saturación en medio de LB. Para iniciar una selección positiva, se utilizaron 2 mi de cultivo de biblioteca, aglomerado y resuspendido en el medio GMML, para inocular 500 mi de GMML conteniendo 25 µg/ml de Tetraciclina (Tet) , 35 µg/ml Kanamycina (Kn) , y 1 mM pIF, pAF, pCF, o OAY. Después de la incubación durante 3 horas a 37°C, se agregó Cm a la concentración final de 75 g/ml y las células se desarrollaron hasta la saturación (~48 hr) . . For la segunda selección positiva, se inoculó 100-ml de cultivo GMML conteniendo Tet, Kn, 75 µg/ml Cm, y 1 mM pIF, pAF, pCF, o OAY con células de la selección positiva inicial (500 µ?) y se desarrolló hasta la saturación a 37°C (~24-36 horas) . En la preparación para la detección negativa, se inoculó un cultivo de 25-ml de GMML conteniendo Tet, Kn, y 0.02% de arabinosa (Ara) con células de la segunda selección positiva (100 mi, aglomerado y resuspendido in GMML) y desarrollado hasta la saturación a 37°C (-24 hr) . Las células ara-inducidas crecieron en la ausencia de aminoácidos no naturales (1 mi) se aglomeraron y resuspendieron en 3 mi de salina amortiguada con fosfato (PBS) . Las células se clasificaron por carecer de expresión de GFPuv utilizando un clasificador de células BDIS FACVantage TSO con un láser iónico Coherent Enterprise II con excitación a 351 nm y emisiones detectadas utilizando un filtro de paso de banda de 575125 nm. Las células recolectadas se diluyeron en al menos 10 volúmenes de LB, conteniendo Tet y Kn, y se desarrollaron hasta la saturación. Para iniciar la tercera ronda de selección positiva, 100 µ? de células de la detección negativa se aglomeraron y resuspendieron en GMML, y se utilizaron para inocular 25 mi de GMML conteniendo Tet, Kn, y 1 mM pIF, pAF, pCF, o OAY. Después de la incubación durante 3 horas a 37°C, se agregó Cm a la concentración final de 75 g/ml y las células se desarrollaron hasta la saturación (-24 horas) . Después de la tercera selección positiva las células se colocaron en placas en GMML/agar conteniendo Tet, Kn, 0.002% Ara, 0, 75, o 100 g/ml Cm, y 0 o 1 mM pIF, pAF, pCF, o OAY, y crecieron durante 48 horas a 37°C. Expresión y caracterización de proteínas conteniendo aminoácido no natural. Las células DHIOB cotransformadas con pBAD/JYAMB-4TAG y el plásmido pBK apropiado se utilizaron para inocular un cultivo inicial de 100-mi GMML conteniendo Kn y Tet, las cuales se desarrollaron hasta la saturación. Un cultivo de 500-ml conteniendo Kn, Tet, 0.002% Ara, 5 µ? FeCl3, y el aminoácido no natural deseado (o ninguno) se inoculó con 50 mi del cultivo de inicio y se desarrolló hasta la saturación (-18 hr) . Los cultivos se aglomeraron, sonicaron y la proteina de mioglobina se aisló de acuerdo al protocolo del equipo de purificación de etiqueta His de QiaExpressionist (Qiagen) . Las proteínas se analizaron elecroforáticamente en un gel de poliamida SDS de gradiente 12-20% y por elecrometría de masas por elecrorocío. Ejemplo 4; Creación de una bacteria de 21 aminoácidos autónomos Como se describió anteriormente los veinte aminoácidos comunes se conservan a través de todos los organismos conocidos. Sin embargo, en la presente se proporciona un código genético extendido, e.g., para agregar determinación de funcionalidad, estructura y lo similar. Para determinar si el código genético extendido es ventajoso para una célula, e.g., con un aminoácido no natural, es deseable una bacteria autónoma que produzca e incorpore el aminoácido no natural de interés . La presente invención proporciona tal organismo de veintiún aminoácidos autónomos, y los resultados pueden extenderse a la producción de organismos de aminoácidos adicionales, e.g., organismos de 22 aminoácidos y lo similar. Para producir una bacteria autónoma, típicamente se consideran tres factores: (i) la capacidad de sintetizar un nuevo aminoácido a partir de fuentes simples de carbono; (ii) una aminoacil sintetasa que utilice de manera única este nuevo aminoácido y no otro; y (iii) un ARNt que se acilata por esta sintetasa y no otra, y el cual suministra el aminoácido hacia proteínas en respuesta a un codón que no codifica ningún otro aminoácido. Una gran cantidad de esfuerzos se ha hecho hacia la incorporación in vivo de nuevos aminoácidos al código genético pero la mayoría de estos no tiene la especificidad de incorporación para generar una bacteria saludable de 21 aminoácidos. Ver, e.g.., Hest, J.C.M.V., K.L. Kiick, y D.A. Tirrell, J. Am. Chem. Soc. , 2000. 122: p. 1282; Hamano-Takaku, F . , et al., J. Biol. Chem., 2000. 275: p. 40324; y Budisa, N. , et al., FASEB J., 1999. 13: p. 41-5 1. Sin embargo, se ha mostrado recientemente que podrían agregarse nuevos componentes a la maquinaria translacional de E. coli e incorpora específicamente al sitio una variedad de nuevos aminoácidos en las proteínas in vivo, e.g., con alta fidelidad. Ver, e.g., Wang, L. , et al., Science, 2001, 292: p. 498-500 y Wang, L. y P.G. Schultz, Chem. Comm. , 2002: p. 1-10. Ver también, la solicitud de patente co-presentada "Methods and Corapositions for t e Production of Orthogonal tRNA-tRNA Synthetase Pairs," ("Métodos y Composiciones para la Producción de los Pares ARNt Ortogonal-ARNt Sintetasa") por Schultz et al. (Expediente de Abogado Número 54-000130), presentada el 13 de Abril, de 2002. La presente invención combina la tecnología anterior con un sistema de trayectoria biosintética para producir una bacteria de veintiún aminoácidos autónomos . Además, la presente invención se dirige a la interrogación de si tal organismo puede o se ha desarrollado para tener una ventaja evolucionaría sobre los organismos que utilizan los veinte aminoácidos naturales . Una bacteria completamente autónoma típicamente comprende un sistema de trayectoria biosintética, e.g., para producir una aminoácido no natural, y un sistema de traducción para incorporar el aminoácido no natural en una o más proteínas en la bacteria. El sistema de traducción típicamente comprende una aminoacil sintetasa que utiliza de manera única este aminoácido no natural y no otro, y un ARNt que se acila por esta sintetasa y no otra, y la cual suministra el aminoácido no natural hacia las proteínas en respuesta a un codón que no codifica ningún otro aminoácido. En una modalidad, los genes del sistema de trayectoria biosintética, aminoacila los genes de la sintetasa genes, y los genes de ARNt se colocan típicamente en plásmidos separados para tnaximizar el control de la bacteria modificada . En un ejemplo, el aminoácido no natural, p-aminofenilalanina (pAF) , se produce biosintéticamente y se incorpora en las proteínas in vivo . El pAF se selecciona opcionalmente como un aminoácido no natural para una célula autónoma, e.g., en base a sus propiedades físicas de interés, e.g., efectos de donación p, propiedades de unión a hidrógeno, y débil basicidad, su falta de toxicidad para E. coli, y el hecho de ser un metabolito secundario conocido. Además, los genes que conducen a la producción de pAF como un intermediario metabolico en la producción del cloranfenicol y pristinamicina se han identificado en Streptomyces Venezuelae y Streptomyces pristinaespiralis, respectivamente. Ver, e.g., Yanai, . y et. al., genes de Streptomyces venezuelae papA, papB, papC, en la Sol. Int. del PCT 2001, Meiji Seika aisha Ltd.: Japón. p. 1-83; y Blanc, V., et al., Identification and analysis of genes from Streptomyces pristinaespiralis encoding enzymes involved in the biosynthesis of the 4-dimethylamino-L-phenylalanine precursor of pristinamycin I {Identificación y análisis de genes de Streptomyces pristinaespiralis que codifica las enzimas involucradas en la hiosíntesis del presursor de 4-dimetilamino-L-fenilalanina de pristinamicina I) . Molecular icrobiology, 1997. 23(2): p. 191-202. Como se trató anteriormente, pAF se sintetiza opcionalmente en E. coli corismato 2 (un intermediario biosintético en la síntesis de aminoácidos aromáticos) utilizando las enzimas PapA, PapB, y PapC de S. Venezuelae junto con una aminotransferasa de E. coli. Un plásmido, e.g., como se proporciona en la Figura 15A se utiliza opcionalmente para transformar una célula para proporcionar una célula que sintetiza su propio suministro de pAF in vivo. Un ejemplo de plásmido para el uso en la biosíntesis de pAF in vivo se proporciona en la SEQ. ID. NO.:67. La SEQ ] ID NO.:68 proporciona las secuencias para los genes individuales papABC que codifican las enzimas que se utilizan para llevar a cabo la conversión del corismato a pAF. Una vez que la célula se modifica para producir un aminoácido no natural, e.g., pAF, O-metil-L-tirosina, un aminoácido glicosilado, L-dopa o lo similar, típicamente la célula también se modifica por la adición de un sistema de traducción para incorporar el aminoácido no natural en una o más proteínas dentro de la célula. El sistema de traducción se proporciona típicamente para la célula a través de un plásmido separado como aquel por el cual la célula se modifica para contener el sistema de trayectoria biosintética ya que esto permite el control más cercano sobre las funciones de los plásmidos en la célula, e.g.., con respecto al número de copias , promotores , etc .
La maquinaria de traducción típicamente comprende un par RNAt ortogonal/RS, e.g., como se proporciona por la solicitud de patente co-presentada "Methods and Compositions for the Production of Orthogonal tRNA-tRNA Synthetase Pairs," ("Métodos y Composiciones para la Producción de los Pares ARNt Ortogonal-ARNt Sintetasa") por Schultz et al. (Expediente de Abogado Número 54-000130) , presentada el 13 de Abril, de 2002 Por ejemplo, un par ARNt ortogonal/RS para pAF se progenera opcionalmente utilizando un par tirosil-ARNt sintetasa (TyrRS) de Methanococcus jannaschii y el ARNt supresor ámbar de tirosina mutante (ARNtm CTyXJrA ) como un punto de inicio. Ver, e.g., Wang, L., et al., A new functional suppressor tRNA/aminoacyl-tRNA synthetase pair for the in vivo incorporation of unnatural amino acids into proteins. (Un nuevo par funcional ARNt supresor/aminoacil-ARNt sintetasa para la incorporación in vivo de aminoácidos no naturales en las proteínas) J. Am. Chem. Soc, 2000 122: p. 5010-5011; y Wang, L. y P.G. Schultz, Chem. and Biol . , 2001, 8:883.
Por ejemplo, una sintetasa específica de pAF (PAFRS) se genera opcionalmente al modificar la especificidad del aminoácido de la TyrRS de M. jannaschii para aceptar el pAF y ningún otro de los veinte aminoácidos comunes. Ver, e.g., Wang, L., et al., Expanding the genetic code de Escherichia coli (Expandiendo el código genético de E. coli) . Science, 2001, 292: p. 498-500; Wang, L. y P.G. Sc ultz, Expanding the Genetic Code (Expandiendo el Código Genético) . Chem. Comm. , 2002: 1:1-10; y Wang, L . , A. Brock, y P.G. Schultz, Adding L-3- (2-naphthyl) alanine to the genetic code of E. coli. (Agregar L-3- (2-naftil) alanina al código genético de E. coli) J. Am. Chem. Soc. , 2002. 124: p. 1836. Se utiliza opcionalmente una combinación de selecciones positivas y detecciones negativas para identificar una enzima pAFrs de una biblioteca de variantes de TyrRS conteniendo aminoácidos aleatorios en cinco posiciones, e.g., Tyr32, Glul07 , Aspl58, Ilel59, y Leul62. Se utiliza opcionalmente un solo plásmido informador tanto para selección como para detección, e.g., como se proporciona por la solicitud de patente co-presentada "Methods and Compositions for the Production of Orthogonal tRNA-tRNA Synthetase Pairs," ("Métodos y Composiciones para la Producción de los Pares ARNt Ortogonal-ARNt Sintetasa" ) por Schultz et al. (Expediente de Abogado Número 54-000130) , presentada el 13 de Abril, de 2002 La selección positiva típicamente se basa en la supresión de un codón TAG en una posición permisiva dentro del gen de cloranfenicol acetilfransferasa (CAT) . (ver, e.g., Wang, L. , et al., Expanding the genetic code de Escheric ia coli. (Expandiendo el código genético de Escherichia coli) Science, 2001, 292: p. 498-500 y Pasternak, M. , T.J. agliery, y P.G. Schultz, A new ortogonal suppressor tRNA/aminoacil-ARNt synthetase pair for evolving an organism with an expanded genetic code. (Un nuevo par ARNt supresor ortogonal/aminoacil-ARNt sintetasa para desarrollar un organismo con un código genético expandido) Helvética Che ica Acta, 2000 83: p. 2277), e.g., por cualquier pAFor un aminoácido endógeno. Las células que contienen la biblioteca TyrRS y el plásmido informador desarrollado en cultivo líquido conteniendo pAF se seleccionan típicamente por sobrevivencia, e.g., en la presencia de cloranfenicol (Cm) . La detección negativa se basa en la supresión de dos codones de terminación UAG en posiciones permisivas dentro del gen de polimerasa de ARN T7 activa la expresión de la proteína verde fluorescente (GFP) . Las células positivamente seleccionadas que crecen en la ausencia de pAF y Cm, típicamente se detectan después, e.g., utilizando detección de célula activada por fluorescencia (FACS) por la falta de fluorescencia .
Evolución de pAFrs: El plásmido informador, pREP (2) /YC-JYCUA, contiene los genes para CAT, polimerasa de 7vt~ ARN T7, GFP, y ARNtm , y un marcador seleccionable para la resistencia Tet (Santoro resultados no publicados) . El gen CAT contiene una sustitución de codón TAG en la posición D112. El gen de polimerasa de AR T7 contiene un péptido guía N-'terminal de siete aminoácidos y las sustituciones TAG en MI y Q107. para la selección positiva, las células se desarrollaron en medio mínimo GMML conteniendo 35 µ9/t?1 Kn, 25 µg/ml Tet, 75 µg/ml Cm, y ImM pAF (Sigma) . Para la detección negativa, las células se desarrollaron en medio GMML conteniendo 35 µg/ml Kn, 25 µg/ml Tet, y 0.002% arabinosa . FACS se llevó a cabo utilizando un detector-celular BDIS FACVantage TSO con un láser iónico Coherent Enterprise II . La excitación de la longitud de onda fue de 351 nm y la emisión se detectó utilizando un filtro de paso da banda a 575/25 nm. las células recolectadas se diluyeron en al menos 10 volúmenes de LB, conteniendo Tet y Kn, y se desarrollaron hasta la saturación.
Adición de la trayectoria biosintética de pAF: Los genes papA, papB, y papC se amplificaron por PCR a partir del ADN genómico de S. Venezuele (ATCC 10712) . Los genes, papABC se conjuntaron por PCR de sobreposicion y se insertaron en un plásmido derivado de pSClOl, PLASC, y se mantuvieron por selección de ampicilina. Los sitios de unión al ribosoma (rbs) fueron del 5'UTR de LacZ, malE, y ero y se colocaron antes de papA, papB, y papC, respectivamente. los genes papABC se colocaron bajo el control del promotor de lac y lpp para aforar dos plásmidos de trayectoria pLASC-lacPW y pLASC-lppPW . Prueba de la biosintesis de pAF con pAFRS: Las células que alojan tres plásmidos, el plásmido informador (pREP (2) /YC-JYCUA) , la sintetasa (pAFRS) , y el plásmido de trayectoria (pLASC-lacPW o pLASC-lppPW) se desarrollaron hasta la saturación en medio mínimo de GMML (se utilizó pLASC para el fondo, sin ensayos pAF, y 1 mm pAF exógeno) . DHIOB no de desarrolló con plásmidos para determinar el nivel de supresión de fondo del plásmido informador. Una muestra de cada crecimiento celular se diluyó hasta un OD de 1.0 (600 nm) con agua y 200 µ? de aglomerado. Las células se suspendieron en 1 mi de PBS al 1% y se analizaron utilizando un detector fluorescente Fluoromax-2 (la longitud de onda de la excitación fue 351 nm y se monitoreo una emisión de pico a 505 nm) . DH10B produjo 1.0 x 10 4 unidades fluorescentes, aunque la fluorescencia de fondo (sin agregar pAF) del sistema informador produjo 2.5 xl04 unidades fluorescentes. El lacPW, lppP , y 1 mM de pAF agregado de manera exógena produjo 7.9 xl04, 3.0 xl06, y 3.0 xl04 unidades fluorescentes, respectivamente. la inducción del lacPW con IPTG no fue factible debido a su efecto inhibidor sobre el promotor de arabinosa en el plásmido - - informador, (pREP (2 ) /YC-JYCUA) . Concentración del aminoácido aromático: Las células DH10B de E. coli que alojaron el plásmido pLASC y pLASC-lacPW o pLASC-lppPW se desarrollaron en medio mínimo de GMML (1% glicerol, 0.3mM leucina) conteniendo 110 µ9/??1 de ampicilina hasta la saturación. Las células que se desarrollaron con pAF agregado de manera exógena contenían 1 mM de aminoácido al inicio del crecimiento. Las células se cosecharon por centrifugación (100 mi) , se lavaron, se agregó 1 mi de agua y 0.2 mi de tolueno. Las células se agitaron a 37°C durante 30 minutos y después se separaron por centrifugación. La capa acuosa se filtro (microcon YM-10) y se analizó por HPLC-MS (Agilent 1100) : 5-15 µ? de la capa acuosa separada en la columna Zorbax SB-C18 (5 µp?, 4.6X150mm) con un gradiente de agua 1% TFA/acetonitrilo 1% TFA (95:5) a (5:95) durante 10 minu os. Los aminoácidos se identificaron al abstraer su MW(+1) del espectro de masa iónica total. El área del ion abstraído se utilizó para calcular la cantidad de aminoácidos presentes en cada muestra. Las concentraciones celulares se basaron en la cantidad de agua en el aglomerado celular, 70% por masa. Expresión de proteína que contiene pAF: El plásmido pBAD/JYAMB-4 AG con resistencia a la tetraciclina se utilizó para expresar el gen ARNtmu Tyr CUA bajo el control de promotor Ipp y el terminador rrnC, y el gen de mioglobina (con un codón de terminación ámbar en Ser4) bajo el control del promotor arabinosa y el terminador rrnB. Se agregó una etiqueta his6 a la terminal carboxilo de la mioglobina. Los genes TyrRS y PAFRS genes se expresaron bajo el control del promotor y terminador GlnRS de E. coli. y en el plásmido derivado pBR322 con resistencia a la kanamicina. Los genes papABC se expresaron a partir de pLASC-lacPW o pLASC-lppPW (13) bajo el control del termiandor natural. Las células DH10B células de E. coli que alojan los plásmidos pBAD/JYAMB-4TAG, pB -TyrRS o pBK-pAFRS, y un plásmido derivado pLASC (pLASC, pLASC-lacPW o pLASC-lppPW como se indicó) se desarrollaron en medio mínimo de 0.5 1 conteniendo 0.002% de arabinosa. Los ensayos de expresión con pAF exógeno contuvieron una concentración final de 1 mM pAF (Sigma) . Para todos los ensayos, las células se desarrollaron hasta la saturación (20-30 hrs) en paralelo a 37°C, aglomeradas, y la proteína se purificó por cromatografía de afinidad de Ni +2 de acuerdo al protocolo del fabricante bajo condiciones naturales (Qiagen, Valencia, Ca) . Quince µ? de solución final de proteína (3.5 mi) de cada preparación se separaron en un gel de poliacrilamida SDS 12% y tinción de plata. Ejemplo 5: Incorporación in vivo de O-metil-L- tirosina en una célula de E. coli que se ha diseñado genéticamente para biosintetizar el aminoácido no natural Como se trata en la presente, un aspecto de la invención es las trayectorias biosintéticas para los aminoácidos no naturales en E. coli. Esto se realiza por e.g., adición a la célula de genes o modificación de las trayectorias de E. coli existentes. En este ejemplo, E. coli se diseñó genéticamente para producir el aminoácido no natural O-metil-L-tirosina . Las O-metiltransferasas de planta son enzimas involucradas en el metabolismo secundario, que convierte un grupo hidroxilo en un grupo metilo. Dos enzimas, (iso)eugenol O-metiltransferasa (IEMT) y O-metiltransferasa de ácido cafeico (COMT) (Clarkia brewery) se seleccionaron para la incorporación en E. coli. IEMT metil eugenol/isoeugenol , y COMT metila el ácido cafeico. Los sustratos de estas dos enzimas son similares a la tirosina. Sin embargo, ambas enzimas tienen alta especificidad de sustrato y regioespecificidad de metilación. Se utilizó un enfoque combinacional para desarrollar la especificidad de sustrato de ambas enzimas para tirosina, convirtiendo mediante esto la tirosina a 0-metil-L-tirosina . Los sitios activos .de la proteína se mutaron para producir grandes bibliotecas mutantes y se completaron varias rondas de selección. Se identificaron tres clones . Los clones se caracterizaron y al menos uno se seleccionó para generar una cepa de E. coli que - biosintetizara a O-metil-L-tirosina . Esta cepa de E. coli de diseñó genéticamente para expresar también el par ARNt/RS descrito en el Ejemplo 1 anterior, proporcionado mediante esto una célula para la incorporación autónoma in vivo de un aminoácido no natural . Ejemplo 6: Incorporación in vivo de aminoácidos de átomo pesado Los descubrimientos de drogas guiados por la estructura, históricamente ha sido un proceso lento, laborioso, utilizado sólo en una fracción modesta de los programas de descubrimiento de drogas en la industria. Un cuello de botella es el problema de fase encontrado cuando se utiliza cristalografía de rayos X para resolver la estructura de las proteínas. Típicamente, la proteína se ha expresado de nuevo en la presencia de selenometionina, que duplica la carga de trabajo y puede no dar como resultado cristalización exitosa. Un método alternativo es impregnar el cristal en una solución que contiene átomos pesados, que puede dar como resultado cristal triturado. La incorporación in vivo de aminoácidos no naturales que contienen átomos pesados en proteínas es una herramienta útil para acelerar la resolución de estructuras cristalina de la proteína. se realizó la incorporación in vivo específica de sitio de la p-yodo-fenilalanina y -bromo-fenilalaniña en proteínas. El yodo y el bromo son átomos pesados, y la incorporación facilita la resolución de fase utilizando MAD. La introducción específica de sitio de átomos pesados utilizando aminoácidos no naturales también proporciona selectividad y flexibilidad en posiciones de selección para los átomos pesados . Las sintetasas mutantes con especificidades para p-yodo-fenilalanina y p-bromo-fenilalanina, respectivamente, se generaron siguiendo los métodos y composiciones descritas en el Ejemplo 1. El dominio Z de proteína (B. Nilsson, et al, Protein Eng. 1: 107-113 (1987)) se expresó, en el cual el bromo o yodo se introdujo selectivamente en la forma de p-yodo-fenilalanina y p-bromo-fenilalanina utilizando incorporación ín vivo de los aminoácidos no naturales. Los ensayos de cristal de proteína se establecieron siguiendo los protocolos estándar. La estructura tridimensional de la proteína se resolvió utilizando cristalografía de rayos X; la fase se determinó utilizando los átomos pesados presentes en la proteína . Ejemplo 7: Incorporación in vivo de análogos de -tirosina generó una TyrRS ortogonal para aminoacilación de la (describes in Ejemplo 1) con analoguos de meta-tirosina .
Preparación de plásmidos de biblioteca TyrRS imitantes. Se construyó una biblioteca de plásmidos que codifica TryRSs mutante de M. jannaschii dirigida a derivados de tirosina meta-substituidos tirosina, siguiendo en general los métodos descritos en el Ejemplo 1. En resumen, se mutaron seis residuos (Tyr32 , Ala67, His70, Gln155, Asp158, Ala167) en el sitio activo de TyrRS de M. jannaschii que se encuentran dentro de 6.9 Á de la meta-posición del anillo de arilo de la tirosina unida en la estructura cristalina de TyrRS de Bacillus stearothermophilus para todos los 20 aminoácidos a nivel del ADN utilizando el esquema de codón NNK como se describió en el Ejemplo 1 anterior. La biblioteca de plásmidos construida pBK-lib contenia alrededor de IxlO9 clones independientes . Evolución de los pares ARNt-sintetasa para la incorporación de m-acetil fenilalanina. Después de 3 rondas se selección positiva y 2 rondas de selección negativa, emergieron cinco clones candidato (SEQ ID NO: 17-21) cuya sobrevivencia en cloranfenicol dependió de la adición del aminoácido no natural. En la ausencia de m-acetil fenilalanina, el IC50 de resistencia al cloranfenicol para las células que alojan uno de los tres plásmidos TyrRS mutante es 20 µg/ml. En la presencia de m-acetil fenilalanina, el IC50 de resistencia al cloranfenicol para las mismas células en 100 µg/ml. La gran diferencia entre estos dos números - refleja la capacidad de la síntesis seleccionada para especificar la incorporación de m-acetil fenilalanina sobre los aminoácidos naturales en la célula. Los datos para m-metoxi fenilalanina fueron similares; se aislaron cinco clones (SEQ ID NO: 22-26) . La expresión de la proteína del aminoácido no natural incorpora DHFR. La m-metoxi fenilalanina y la m-acetil fenilalanina sintetasas seleccionadas anteriormente se utilizaron para incorporar los aminoácidos no naturales en respuesta a un codón ámbar en DHFR como se describió previamente en el E emplo 1 anterior. Como un control negativo, las células que contenían tanto el par ortogonal de ARNt-sintetasa como el vector mut nte ámbar que codifica DHFR se desarrollaron en la ausencia de un aminoácido no natural . Los resultados de la expresión de la proteína se muestran en la Figura 10. Estos resultados demuestran claramente la especificidad del par ortogonal de ARNt-sintetasa m-metoxi fenilalanina y m-acetil fenilalanina no naturales. los rendimientos de la proteína DHFR expresada son aproximadamente 0.5 mg/1 de cultivo en ambos casos.. Utilización de meta-acetil fenilalanina como una asa química. La proteína DHFR incorporada en la m-acetil fenilalanina se etiquetó con derivados de hidracina, tanto extra-celularmente como intra-celularmente a una escala de miligramos. El grupo carbonilo reaccionó rápidamente con hidracida en solución acuosa para formar hidrazona que es estable bajo condiciones fisiológicas (Shao, J. ; Tara, J. J. Am. Chem. Soc . 117, 3893-3899 (1995)). Esta química se ha utilizado por Schultz y colaboradores para etiquetar específicamente una cetona conteniendo, lisozima T4 purificada con fluoresceína hidrazida (Cornish, V. . ; Hahn, K. M. ; Schultz, P. G. J. Am. Chem. Soc. 118, 8150-8151 (1996) ) . La proteína DHFR incorporada en la m-acetil fenilalanina se trató con fluoresceína hidracida en amortiguador acuoso. Como un control paralelo, una proteína DHFR purificada incorporada en m-metoxi fenilalanina se sometió a las mismas condiciones de reacción. Después de la reacción, ambas proteínas se purificaron y después de excitaron a 491 nm para obtener el espectro de emisión de fluorescencia mostrado en la Figura 11. Bajo condiciones idénticas, la DHFR purificada incorporada en la m-acetil fenilalanina se etiquetó con fluoresceína hidracida, aunque m-metoxi fenilalanina no se etiquetó. La fluoresceína hidracida es permeable a la célula y no lisa las células a 4°C. Así es ' osible etiquetar la proteína DHFR incorporada a la m-acetil fenilalanina intracelularmente con floresceina hidrazida . Las células que expresaron la DHFR incorporada a la "asa de cetona" se incubaron con solución de fluoresceína hidracida. Después de 36 horas a 4°C y lavados extensivos para retirar el exceso de fluoresceína hidracida, la proteína DHFR etiquetada se purificó y se sometió a pruebas de emisión de fluorescencia. Como un control negativo en paralelo, la DHFR incorporada a la m-metoxi fenilalanina también se purificó con los mismos procedimientos. Resultados similares al experimento extra-celular (Figura 15) se obtuvieron con células intactas cuando se etiquetaron con fluoresceína hidracida y las DHFRs se purificaron subsecuentemente . Estos experimentos demostraron un ejemplo de la utilidad de una proteína con al menos una aminoácido no natural . Otros compuestos pueden utilizarse para etiquetar proteínas in vivo con al menos un aminoácido. Los ejemplos incluyen, e.g., biotina hidrazida y otros derivados de hidrazida. Ejemplo 8: Incorporación in vivo de aminoácidos fotoreactivos Introducción: Se realizaron experimentos en los cuales los aminoácidos fotoreticuladores se codificaron genéticamente y se incorporaron específicamente en el sitio en una proteína específiva in vivo. Esta proteína se retículo entonces a voluntad por excitación del control temporal que proporciona el grupo fotorreactivo . Esta invención será útil para, e.g., explorar las interacciones de proteína. Por ejemplo, esta invención es útil para definir los residuos en la secuencia primaria de la proteína que media las interacciones con diferentes componentes celulares al variar la posición del reticulador en la proteína. Debido a que se forma un enlace covalente entre la proteína y la molécula que interactúa con esta, es posible detectar la debilidad en las interacciones transitorias . Dos grupos químicos funcionales han ganado prominencia como reticuladores, aril-azidas y benofenonas ya que pueden activarse en longitudes de onda por arriba de 300 nm (por debajo de lo cual el daña a la protelna a través de fotooxidación puede ser un problema) . Estos dos grupos reticuladores se incorporaron en los aminoácidos no naturales p-azido-fenilalanina y p-benzoil-fenilalanina respectivamente (Figura 12) . Generación de O-RS específico para los aminoácidos fotoreticuladores . El par ortogonal descrito en el Ejemplo 1, el par, Methanococcus janna.sch.ii ARNtmjJj se utilizó como el punto de inicio para generar un O-RS específico para el aminoácido no natural del reticulador p-azido-fenilalanina (pBpa) . Los métodos para la mutagénesis, detección y selección se realizaron siguiendo el perfil experimental descrito en el Ejemplo 1. En resumen, se generó una biblioteca MjTyrRS de mutantes en la cual cinco residuos (Tyr 34, Glu 107, Asp 158, lie 159, Leu 162) se aleatorizaron . Estos residuos se seleccionaron sobre la base de la estructura cristalina de TyrRS de en complejo con tirosil adenilato (P.Brick, T.N.Bhat & D.M.Blow Journal of Molecular Biology 208, 83 (1989)) en la cual los residuos homólogos (Tyr34, Asnl23, Aspl76, Phel77, Leul80) se encuentran dentro de 6 Á de la para posición del anillo arilo de la tirosina unida. La biblioteca TyrRS imitante se pasó a través de una selección positiva en base a la supresión de un codón de terminación ámbar en un sitio permisivo (Aspll2) en el gen de cloranfenicol acetil transferasa (CAT) . Las células transformadas con la biblioteca de tesinterasa, y el CAT mutante se desafiaron para crecer en la presencia de lmM pBpa y cloranfenicol . Las células sobrevivientes contenían sintetasas capaces de desafiar la ARNtmJj ortogonal con aminoácido ya sea natural o no natural . Estos genes de sintetasa se transfirieron a célula que contenían ARNtirJBB y una variante del gen que codifica la proteína barnasa tóxica, que contiene tres mutaciones ámbar en sitios permisivos (Gln2, Asp'44, Gly65) (Wang, L., Brock, A., Herberich, B . & Schultz, P. G. Science 292, 498-500(2001)). El crecimiento de estas células en la ausencia del pBpa se seleccionó contra las sintetasas capaces de utilizar aminoácidos naturales.
Después de las rondas de la selección positiva y negativa los plásmidos de sintetasa sobrevivientes se transformaron en una cepa informadora en la cual la producción de CAT de longitud completa y ARN T7 polimerasa (T7 RNAP) son dependientes en la supresión de los codones de terminación ámbar en el CAT y el gen ARNP T7, respectivamente (Santoro SW, Schultz PG. Proc Nati Acad Sci USA Apr 2;99 (7) :4185-90 (2002)). Debido a que el ARNP T7 dirige la expresión de la proteína verde fluorescente (GFP) estas células pueden detectarse fluorometricamente . Noventa y seis clones se detectaron por pBpa dependientes de la resistencia al cloranfenicol y la fluorescencia GFP. Seis distintas sintetasas confirieron la resistencia lie cloranfenicol en E coli con IC50s de 120 mg/1 y 5 mg/1 en la presencia y ausencia de 1 mM pBpa respectivamente; estas también mostraron el pbpa dependiente de la fluorescencia GFP. La gran diferencia entre la resistencia al cloranfenicol en la presencia y ausencia de pbpa mostró una especificidad substancial in vivo de los pares de sintetasa/ARN seleccionados para la inserción de pBpa sobre todos los veinte aminoácidos naturales encontrados en la célula en respuesta a un codón ámbar.
Incorporación in vivo de pBpa en la mioglobina. Para medir la fidelidad y eficacia de la incorporación de pBpa, el codón para Ser4 en mioglobina de esperma de ballena (conteniendo una etiqueta His6 de C-terminal) se convirtió a un codón ámbar. En la presencia tanto de Mj p-BpaRS-1, AR tm^ como pBpa, se produjo la mioglobina de longitud total con una producción purificada de 2 mg/L. Ninguna proteína mioglobina fue detectable mediante tinción de plata o inmunotransferencia Western contra la etiqueta His6 de C-terminal sobre la mioglobina si cualquiera de los tres componentes responsables de la supresión del ámbar específico con pBpa (aminoácido, sintetasa o ARN) se retuvieron. Estos datos proporcionan evidencia adicional de que la sintetasa seleccionada es muy selectiva para pBpa. ha espectrometría de masas atrapadas en ión por electroroclo-ionización de la mioglobina mutante da una masa de 18519 ± 0.5 la cual es idéntica a la masa calculada de 18519.0 para la proteína que contiene pBpa. Esto confirma la incorporación de pBpa en un solo sitio en la proteína. No se observaron masas en el espectro de masas que corresponde a la incorporación de aminoácidos naturales proporcionando evidencia adicional para la incorporación de alta fidelidad de pBpa. Análisis de secuencias de 0-RS mutante. La sintetasa seleccionada muestra interesante convergencia de - secuencias. Tyr32 de M. jannaschii TyrRS se convierte a alanina o glicina en cinco de los seis clones imitantes de sintetasa. Aspl58 del M. jannaschii TyrRS se convierte a treonina en cinco de los seis mutantes seleccionados, mientras Ilel59 se convierte a serina en cuatro de los seis mutantes . Las substituciones de serina o prolina dominan en la posición 107 de M. jannaschii TyrRS; Leul62 se conserva en cuatro de los seis mutantes. Un conjunto de mutaciones de consenso (32:Gly, Ala/l07:Ser, Pro/158 :Thr/l59 :Ser/l62 :Leu) surge de estos análisis. Incorporación in vivo de pBpa en GST. Para demostrar la utilidad de esta metodología para representar interacciones proteína-proteína, se llevó a cabo un experimento de entrecruzamiento con glutatión-S-transferasa . Esta proteína es un dímero de dos sub-unidades idénticas que previamente se han entrecruzado de manera no específica utilizando gluteraldehido . La estructura cristal del glutatión de Schistosoma Japónica dimérica-S-transferasa (SjGST) (McTigue, M.A. , Williams, D.R.& Tainer, J.A. Journal of Molecular Biology 246,21-27(1995)) se utilizó para identificar dos sitios para sustituir con pBp: residuo Phe52, el cual se oculta en la interfaz del dímero de la estructura cristal y el residuo Tyrl98 que se expone al solvente. Los codones correspondientes a Phe52 o Tyrl98 en el gen para una proteína Sj GST de 27 kDa, se reemplazaron con codones ámbar.
El par de ARNt sintetasa ortogonal se utilizó entonces para incorporar al sitio específicamente pBpa en SjGST en E.coli en estos sitios . Al irradiar con radiación ultravioleta de longitud de onda larga el SjGST purificado se convierte a un homodímero covalentemente enlazado como se juzga por la desnaturalización de SDS PAGE. Aproximadamente 70% del SjGST presente se entrecruzó en 5 minutos. En contraste, los experimentos de control utilizando ya sea SjGST tipo silvestre o SjGST conteniendo pBpa en el residuo 198, el cual se encuentra fuera de la interfaz del dimero, muestra entrecruzamiento no detectable en respuesta a la irradiación UV. Estos resultados demuestran que la sustitución de pBpa de sitio específico puede utilizarse para definir los aminoácidos involucrados en una interacción proteína-proteína . Caracterización de Sintetasas Mutantes. Los clones de sintetasa individuales en DHlOB/pREP (2) YC-JYCUA se utilizaron para inocular 0.5 mi de LB complementado con kanamicina y tetraciclina a 30, 20 mg/L. Después de 20 horas de desarrollo (37 °C, 300 rpm) se diluyeron células 104 veces en dH20 y la " réplica se marcó en dos conjuntos de placas GMML. Un conjunto de placas se complementaron con kanamicina y tetraciclina a 30 y 20 microgramos/L, respectivamente y cloranfenicol a concentraciones que varían desde 0 micrograraos/L hasta 110 microgramos/L . El segundo conjunto de placas fueron idénticas a las primeras, excepto que se complementaron con 1 mM pBpa. Después de 48 h el ICso de resistencia al cloranfenicol en la presencia y ausencia de pBpa, se calculó a partir de la concentración de cloranfenicol a la cual la mitas del número de colonias en las placas sin cloranfenicol fueron visibles. La expresión de GFP en la presencia o ausencia de pBpa, se representó en imágenes utilizando un formador de imágenes de fósforo (Molecular dynamics) (Dinámicas moleculares) de Storm. Los genes de sintetasa imitantes que exhiben la dependencia de aminoácidos más fuerte tanto en la señal GFP como en la resistencia al cloranfenicol se aislaron y secuenciaron mediante métodos estándar.
Expresión de la Proteína. El plásmido PYC/SjGSTmut, que contiene el gen SjGST imitante en un promotor de arabinosa y el terminador rrnB, y ARNtm^ en un promotor Ipp y el terminador rrnC, y un marcador de resistencia a la tetraciclina se co-transformó con un vector pBK que expresa p-BpaRS en E.coli. DH10B. Las células se amplificaron en 10 mi de 2x-YT conteniendo kanamicina a 30 microgramos/L. y tetraciclina a 25 microgramos/L. antes de lavarse en PBS y utilizarse para inocular 1 1. de GMML líquido con los antibióticos apropiados y pBpa a 1 mM. La expresión de la proteina se indujo a un OD600 de 0.6 mediante la adición de arabinosa a 0.2% seguida mediante 5 horas de desarrollo. Las células se recolectaron mediante centrifugación y las proteínas se purificaron en virtud de una etiqueta de hexa-histidina en la C-terminal utilizando cromatografía de afinidad Ni-NTA.
La mioglobina de esperma de ballena se expresó y purificó a partir de células que contienen pBAD/JYAMB-4TAG en una manera análoga a SjGST, excepto que la inducción fue constitutiva con 0.002% de arabinosa. Las muestras para la espectrometría de masa se desalaron en una columna NAP-10 (Pharmacia) y purificaron mediante HPLC. Para verificar la incorporación de pBpa, la masa de proteínas se investigó mediante espectrometría de masas atrapadas en ión por electrorocío-ionización. Clonación de SjGST mutante. Los genes SjGST mutantes se instalaron mediante PCR de sobreposición, utilizando pGEX-3 (Pharmacia) como un modelo. Todas las reacciones de PCR se llevaron a cabo utilizando el equipo de PCR Expand (Roche) de acuerdo con las instrucciones de los fabricantes . Los genes resultantes se digirieron con las enzimas de restricción Neo I y Kpn I y se clonaron en el vector pBADJYC desfosforilado, predigerido entre los mismos sitios de restricción y en la estructura con una etiqueta de hexa-histidina de la C-terminal. Todas las construcciones finales se confirmaron mediante secuenciacion de ADN. Entrecruzamiento foto-activado. Las reacciones de entrecruzamiento se realizaron en una placa de microtitulación de 96 pozos (Nuncsorb) utilizando 100 µ? de 10 ng/µ? de SjGST (en 50 mM NaH2Po4, 300 mM NaCl, 250mM imidazol) a 4°C. Las muestras se irradiaron a 365 nm utilizando una lámpara de UV portátil (115V, 60 Hz, 0.2 A; Spectronics, ??, EUA) , durante 1 min. o 5 min. Las muestras se retiraron de los pozos y se diluyeron con SDS con carga de amortiguador antes de la resolución de los productos mediante' SDS-PAGE en un gel de 10-20% de gradiente. El SjGST se transfectó a PVDF (Biorad) y se probó mediante inmunotransferencia Western utilizando anti-GST de cabra (Pharmacia) y un conjugado de HRP de ratón anti cabra secundario (Sigma) . La señal se reveló utilizando Super Signal West (Pierce) y se visualizó mediante la exposición en hiperpelícula (Amersham) .
Ejemplo 9; Síntesis de fenilalaninas meta- substituidas En un aspecto, la presente invención proporciona fenilalaninas meta substituidas como se muestra en la Fórmula IV: y en la Fórmula V: La Fórmula IV ilustra la estructura de 3-acetil-fenilalanina y la Formula V representa 3-metoxi-fenilalanina. Las fenilalaninas meta-sustituidas se sintetizan en un procedimiento como se delinea en la Figura 14. Típicamente, se agrega NBS (W-bromosuccinimida) a un compuesto de metilbenceno meta-substituido para dar un bromuro de bencilo meta substituido, el cual se hace reaccionar entonces con un compuesto de malonato para dar la fenilalanina meta substituida. Los substituyentes típicos utilizados para la posición meta incluyen, pero no se limitan a, cetonas, grupos metoxi, alquilos, acetilos, y lo similar. Un ejemplo específico se proporciona a continuación. Se recristalizó NBS (N-bromosuccinimida) a partir de agua hirviente antes de su uso. Se agregó NBS (1.85 g, . 10.5 mmol) a una solución de 3-metil acetofona (1.34 g, 10 mmol) . Se agregó a la mezcla AIBN (2',2'-azobisiosbutironitrilo) (0.043 g, 0.25 mmol). La mezcla de reacción se refluyó durante 4 horas . La terminación de la reacción se verificó mediante TLC (8 : 1/hexanos : EtOAc) . Después del tratamiento, el solvente orgánico se retiró y los hexanos se agregaron para dar un sólido. El sólido se filtró y se lavó con hexanos y EtOAc. Después la mezcla se recristalizó con hexanos. El sobrenadante se recolectó y el solvente se retiró para dar el compuesto (1- (3-bromornetil-fenil) etanona) . se agregó a gotas etanol seco (50 mi) a piezas de sodio lavadas con pentano (2.3 g, 0. 1 mol) bajo atmósfera de argón. Después de la terminación de la adición, se requirió agitación para disolver las últimas piezas de sodio. Una solución de dietil acetilamido-malonato éster (21.7g, 0.1 mol) se agregó durante 30 minutos. I- (3-bromoetil-fenil) etanona (21.1 g,0.1 mol) en etanol seco se agregó a gotas durante 90 minutos. Después de que la mezcla se refluyó durante la noche, se agregó éter y agua, y se separó la capa orgánica. Después del tratamiento, las capas orgánicas se combinaron, se lavaron con salmuera, se secaron sobre MgS04 y se filtraron. Los solventes se retiraron al vacío. Se agregó al residuo Hexanos-diclorometano, 4:1, y el material insoluble se filtró y se lavó exhaustivamente con 10:1 diclorometano-bencene para dar dietil 2-acetamido-2 [3-acetil-fenil]-raetil] malonato . Este compuesto se agitó con 8 HCI en dioxano durante la noche . Después la mezcla se secó, se agregó agua, y se secó de nuevo para dar el compuesto final m-acetilfenilalanina hidrocloruro . Se utilizó BPLC para purificar el compuesto deseado como un sólido blanco. La producción total fue 64%. 1H MR (D20) : d 7.85-7.28 (m, 4H) , 4.23 (dd, 1H) , 3.2 (m, 2H) , 2.7 (s, 3H) . Peso molecular calculado: 243.69, peso molecular obtenido: 243.07. Se utilizó una síntesis similar para producir una 3-metoxi fenilalanina . El grupo R en la posición meta del bencil bromuro en ese caso es 0CH3- Ver, e.g., Matsoukas et al., J. Med Chem. , 1995, 38, 4660-4669. Ejemplo 10; Síntesis de 4-alil-L-tirosina En otro aspecto, la presente invención proporciona 4-alil-L-tirosina, cuya estructura se muestra en la fórmula Formula II: II El compuesto de la Fórmula II, 4-alil-L-tirosina, se sintetiza de acuerdo al esquema establecido en la Figura 13. Una tirosina protegida, e.g., una tirosina protegida Nboc o Fmoc, se hace reaccionar con alil bromuro, dando como resultado una alil tirosina protegida, la cual típicamente después se desprotege para producir 4-alil-L-tirosina. Por ejemplo, se disolvió N- (tert-Butoxicarbonil) L-tirosina (2.95g, 10 mmol) en 80 mi de DMF. La solución se enfrió a 5°C y se agregó NaH (0.63g, 25 mmol) . La mezcla de reacción se dejó calentar hasta 10 °C y se agitó durante 2 horas adicionales. Después de que el, alil bromuro (1.33g, 11 mmol) se agregó a la mezcla y la reacción se calentó a temperatura ambiente. La mezcla de reacción se agitó durante 4 horas. Se agregó agua para tratar la reacción. La capa acuosa se extrajo con acetato de etilo y CH2CI2. La capa orgánica se secó sobre MgS04 anhidro. El solvente orgánico se retiró para dar un sólido blanco. Este compuesto se refluyó después en 4M HC1 en 1.4-dioxano durante 4 horas. Todo el solvente se evaporó para dar el producto deseado como -un sólido blanco (1.9g, 86%). 1 HNMR (CD30D) : d ppm 3.1 (m, 2H) , 4.1 (t, 1H) , 4.5 (d, 2H) , 5.3 (q, 1H) , 5.9 (m, 1H) , 6.9 (d, 2H) , 7.1 (d, 2H) . Peso molecular calculado: 221, peso molecular obtenido: 222. Ejemplo 11: Selección de la absorción celular de aminoácidos no naturales Una variedad de aminoácidos no naturales y ácidos ct-hidroxi de interés, comercialmente obtenidos o mediante síntesis corta a partir de los materiales de inicio disponibles (I. Shin, B. Herberich, A. Varvak, T. Magliery, P. Schultz, los resultados no publicados, se seleccionaron para la toxicidad celular) . Por ejemplo, Figura 29 proporciona una biblioteca de aminoácidos no naturales útiles para la siguiente selección. Cada aminoácido se seleccionó en un medio mínimo de glicerol 1 M para la toxicidad en las células, e.g., los pBLAM-YQRS y pACYsupA38 que alberga DH10B. Las toxicidades se clasifican en cinco grupos: (1) sin toxicidad, en la cual no ocurren cambios significativos en los tiempos de duplicación; (2) baja toxicidad, en la cual los tiempos de duplicación se incrementan por menos de aproximadamente 10% (ver con los siguientes compuestos en la Figura 29: S63, S69, S74, S75, S81, S95) ; (3) moderada toxicidad, en la cual los tiempos de duplicación se incrementan por aproximadamente 10% hasta aproximadamente 50% (ver en los siguientes compuestos mostrados en la Figura 29: B, M, P, S12, S14, S22, S41, S45, S49, S52, S62, S64, S65, S71, S91, S93, B10) ; (4) alta toxicidad, en la cual los tiempos de duplicación se incrementan por aproximadamente 50% hasta aproximadamente 100% (ver en los siguientes compuestos de la Figura 29: C, Q, V, BB, S2, S5, S50, S60, S78, S83, S89, S90) ; y (5) extrema toxicidad, en la cual los tiempos de duplicación se incrementan por más de aproximadamente 100% (observada para los siguientes compuestos de la Figura 29: W, S15, S26, S27, S30, S31, S39, S47, S88, S94) . Ver, e.g., Liu, D. . & Schultz, P.G. Progreso hacia la evolución de un organismo con un código genético expandido. Piroceedíjags of the National Academy of Sciences of the United States of America (Procedimientos de la Academia Nacional de Ciencias de los Estados Unidos de América) 96,4780-4785 (1999). La toxicidad de los aminoácidos que se clasifica como alta o extremadamente tóxica se mide típicamente como una función de su concentración para obtener los valores IC50. En general, los aminoácidos que son análogos muy cercanos de los aminoácidos naturales (e.g., Q, W, S5, S26, S27, S50, S90, S94) o que despliegan funcionalidad reactiva (e.g., S15, S39, S47) demostraron las más altas toxicidades. Para identificar posibles trayectorias de absorción para aminoácidos tóxicos, se repitieron análisis de toxicidad en niveles IC50 (típicamente 3 µ? a 500 µ?) en un medio complementado con un exceso de (2 mM) de un aminoácido natural estructuralmente similar. Para aminoácidos tóxicos, la presencia del exceso de aminoácido natural recupera la capacidad de las células para desarrollarse en la presencia de la toxina, presumiblemente debido a que el aminoácido natural efectivamente compite con la toxina por ya sea la absorción celular o por la unión a las enzimas esenciales. En estos casos, el aminoácido tóxico puede asignarse a una posible trayectoria de absorción y etiquetarse un "alelo letal" cuya complementación se requiere para que la célula - sobreviva. Los alelos letales identificados de esta manera (16 de los aminoácidos no naturales tóxicos) se expanden diez posibles grupos de absorción de aminoácidos: alanina, ácido glut mico, lisina, leucina, metionina, prolina, glutamina, arginina, treonina, y tirosina. Estos alelos letales son extremadamente útiles para analizar la capacidad de las células para absorber los aminoácidos no tóxicos no naturales . Cada aminoácido no tóxico no natural se agregó a 2 mM a un medio conteniendo Niveles IC50 de cada alelo letal. La complementación del alelo tóxico, evidenciada por la restauración del crecimiento celular, muestra que el aminoácido no tóxico se absorbe por la célula, posiblemente por la misma trayectoria de absorción que la asignada al alelo letal. La falta de complementación no es concluyente . Utilizando este método, se evaluó la capacidad de los análogos de la glutamina 22 y el ácido glutámico para ser absorbidos por DH10B . Los aminoácidos S27 y S47 se utilizaron como alelos de glutamina tóxica a 100 µ? y 30 µ?, respectivamente, aunque S50 se empleó como un alelo de ácido glutámico tóxico a 150 µ?. Los resultados de la complementación de S27 y S47 fueron en completo acuerdo e identificaron los aminoácidos B, Z, S6, S60, S61, y S62 (además de S27 y S47) como siendo absorbidos por las células posiblemente a través de la trayectoria de absorción de la glutamina. De manera similar, la complementación de S50 identificó B, C, K, X, S60, S65, y S84 como siendo absorbidos en DH10B, posiblemente a través del sistema de transporte del ácido glutámico. Estos hallazgos indican que las trayectorias de transporte de glutamina y ácido glutámico de E. coli pueden tolerar perturbaciones significativas en la estructura de los aminoácidos, incluyendo el alargamiento de la cadena lateral (X y Z) , la colocación de la cetona o metileno en la posición ? (B, C, S65) , el reemplazo de carboxamida con un sulfóxido (S61) , un sustrato conocido para un transportador de glutamina bacterial o hidracida (S 7) , también un sustrato conocido transportador de glutamina así como una variedad de cambios de hibridación en la terminal de la cadena lateral (S60, S62, K, S84) . Ver, e.g., Jucovic, M. & Hartley, R.W. Interacción proteina-proteina : una selección genética para compensar las mutaciones en la interfaz barnase-barstar . Proceedings of the National Academy of Sciences of the United States of America 93, 2343-2347 (1996) y Weiner, J.H., Furlong, CE. & Heppel, L.A. Una proteína de unión para la L-glütamina y su relación al transporte activo en E. coli. Archives de Biochemistry and Biophysics (Archivos de Bioquímica y Biofísica) 142, 715-7 (1971) . Ejemplo 12: Biosíntesis de p-aminofenilalanina Para producir el aminoácido no natural p-aminofenilalanina (pAF) in vivo, se utilizaron opcionalmente genes que dependen de las trayectorias que conducen al cloranfenicol y pristinamicina. Por ejemplo, in Streptomyces Venezuelae y Streptomyces pristinaespiralis, estos genes producen pAF como un intermediario metabólico. Ver, e.g., Yanai, K. y e. al., Streptomyces Venezuelae genes papA , papB, papC, en PCT Int . Appl. 2001, Meiji Seika Kaisha Ltd.: Japón, p. 1-83; y Blanc, V., et al., Identification and analysis of genes from Streptomyces pristinaespiralis encoding enzimas involved in the biosíntesis of the 4-dimethylamino-L-phenylalanina precursor of pristina icin I (Identificación y análisis de genes provenientes de Streptomyces pristinaespiralis que codifica enzimas involucradas en la biosíntesis del precursor de 4-dimetilamino-L-phenilalanina de pristinamicina I) . Molecular Microbiology, 1997. 23(2): p.191-202. Se muestra una trayectoria biosintetica para pAF en la Figura 15, Panel B. pAF se sintetiza opcionalmente en E. coli a partir de corismato (compuesto 2 En la Figura 15, Panel B) , el cual es un intermediario biosintético en la síntesis de aminoácidos aromáticos. Para sintetizar pAF a partir de corismato, una célula típicamente utiliza una corismato sintasa, una corismato mutasa, una deshidrogenasa, e.g., una prefenato deshidrogenase, y una amino transferasa. Por ejemplo, utilizando las enzimas S. Venezuelae PapA, PapB, y PapC junto con una E. col ¡ aminotransferasa, e.g. , como se muestra en la Figura 15, Panel B, PapA, el corismato se utiliza para producir pAF. Por ejemplo, la 4-amino-4-desoxicorismato sintasa convierte el corismato a ácido 4-amino-4-desoxicorismic (compuesto 3 en la Figura 15, Panel B) , e.g., utilizando amoniaco (de glutamina) en una reacción simple de adición-eliminación. PapB y PapC, los cuales son análogos a la corismato mutasa y a la prefenato deshidrogenasa, respectivamente, se utilizan para convertir el ácido 4-amino-4-desoxicorismic a ácido 4-amino-4-desoxiprefénic (compuesto 4 en la Figura 15, Panel B) y después a ácido p-aminofenil-pirúvic (compuesto 5 en la Figura 15, Panel B) . Una tirosina aminotransferasa no-especifica, e.g., de E. coli se utiliza para convertir ácido p-aminofenil-pirúvico a pAF. Ver, e.g., Escherichia coli y Salmonella, 2nd ed, ed. F.C. Neidhardt . Vol. 1. 1996, Washington, D. C: ASM Press. Por ejemplo, tyrB, aspS, o ilvE se utiliza opcionalmente para producir pAF a partir de ácido p-aminofenil-pirúvico . La Figura 13 ilustra un plásmido para utilizarse en la biosíntesis de pAF. El plásmido representado comprende genes de S. Venezuelae papA, papB, y papC clonados en un plásmido pLASC derivado de pSClOl, e.g., bajo el control del promotor lac o lpp. El plásmido se utiliza para transformar una célula, e.g., una célula bacterial, de tal manera que la célula produzca las enzimas codificadas por los genes.
Cuando se expresan, las enzimas catalizan una o más reacciones diseñadas para producir el aminoácido no natural deseado, e.g., pAF. Por ejemplo, las proteínas PapA, PapB y PapC convierten el corismato a ácido p-aminofenil-pirúvico, mientras una aminotransferasa aromática de E. coli completa la biosíntesis para producir pAF. Típicamente, la síntesis de pAF a partir de corismato, en la presente invención no afecta la concentración de otros aminoácidos producidos en la célula, e.g. , otros aminoácidos aromáticos típicamente producidos a partir de corismato. Típicamente, la p-aminofenilalanina se produce en una concentración suficiente para la biosíntesis eficiente de la proteína, e.g., una cantidad celular natural, pero no a tal grado que afecte la concentración de los otros aminoácidos aromáticos o agote los recursos celulares. Las concentraciones típicas de pAF producidas in vivo de esta manera son de aproximadamente 10 mM hasta aproximadamente 0.05 mM. En S. Venezuelae la evidencia sugiere que la regulación de la trayectoria de shiquimate se modifica para responder por el consumo de corismato al hacer un cuarto aminoácido aromático. Ver, e.g., He, J., et al., Microbiology, 2001 147: p. 2817-2829. Una vez que la bacteria se transforma con el plásmido que comprende los genes utilizados para producir las enzimas utilizadas en la trayectoria anterior, y se genera pAF como el aminoácido veintiuno, las selecciones in vivo se utilizan opcionalmente para optimizar adicionalmente la producción de pAF tanto para la síntesis de la proteína ribosomal como para el crecimiento celular . Ya que un par de pAF ARNt-sintetasa permite la supresión de un codón TAG en una posición no esencial de una proteína, la efectividad de la trayectoria biosintética se monitorea opcionalmente y optimiza mediante la producción de esa proteína. Solamente las células que producen una concentración de pAF suficiente para la biosíntesis de la proteína son capaces de suprimir el codón TAG. Al mismo tiempo, uno puede seleccionar la producción pAF óptima en base a las tasas de crecimiento de E. coli si la Proteína TAG es una proteína esencial para el desarrollo celular. Colocar los genes biosintéticos sobre un plásmido permite que el nivel de pAF producido se modifique, e.g., al cambiar el número de copias del plásmido y fuerza del promotor. Para determinar si la adición de una trayectoria biosintética de pAF afecta la producción de otros aminoácidos aromáticos en E. coli, y para cuantificar la producción de pAF, las concentraciones celulares de los aminoácidos aromáticos se monitorea opcionalmente, e.g., mediante extracción y análisis LCMS. Ver, e.g., Moss, R.E., Methods in Enzymology, 1995. 262: p. 497-499 y Nimura, H. , S. Nagata, y T. atsumoto, Biosci. Biotech. Biochem. , 1994. 58(10): p. 1873-1874 Ejemplo 13; Biosíntesis de Dopa Para producir biosintéticamente dopa in vivo, ose clonan uno o más genes, e.g., hpaBC, para una hidroxilasa no específica aromática, e.g., de E. coli se clonan en a vector de bajo número de copias, e.g., un derivado de pSClOl, el cual se coloca típicamente bajo el control de un promotor Ipp. Esta construcción produce dopa (2) a partir de tirosina (1) , in vivo, como se muestra en la Figura 20 aunque no siendo tóxico para las células en desarrollo. Se hizo un trabajo similar con este gen para sobre-producir dopa para propósitos de purificación. Ver, e.g., Jang-Young Lee, Luying Xun, Biotechnology Letters, 1998, 20, 479-482. Sin embargo, como se describió anteriormente, la sobreproducción no se desea típicamente. En esta solicitud, se utiliza un plásmido de bajo número de copias para producir dopa en una cantidad celular natural . Ejemplo 14; Biosíntesis de O-metil-L-tirosina La O-metil-L-tirosina que se produce opcionalmente de manera biosintética mediante la planta de O- metiltransferasas son enzimas involucradas en el metabolismo secundario, lo cual convierte un grupo hidroxilo en un grupo metoxilo. Se seleccionaron dos de tales enzimas: (iso)eugenol O-metiltransferasa (IEMT) y ácido caféico O- metiltransferasa (COMT) . Ambas de ellas son de Clarkia ' breweri . eugenol/isoeugenol de metilatos de IEMT, y ácido caféico de metilatos COMT. Los sustratos de estas dos enzimas son similares a la tirosina. Sin embargo, ambas enzimas tienen alta especificidad de sustrato y regioespecificidad de metilación. Por lo tanto, se adoptó un procedimiento combinatorio para involucrar estas dos enzimas de manera que ellas pudieran tomar a la tirosina como su sustrato y convertir la tirosina en O-metil-L-tirosina . Se seleccionaron residuos de sitios activos para la mutación, y se crearon grandes bibliotecas de mutantes . Después de varias rondas de selección, se hablan identificado al menos aproximadamente tres aciertos . En otras modalidades, las enzimas utilizadas para reducir O-metil-L-tirosina también pueden involucrarse artificialmente, e.g., para producir una metoxi fenilalanina meta substituida como se prevé en la Formula III. Ejemplo 15; Biosxntesis de aminoácidos glicosilados La presente invención también proporciona métodos biosintéticos para la producción de aminoácidos glicosilados . Formar aminoácidos glicosilados in vivo se realiza opcionalmente de varias maneras. Por ejemplo, transformar una célula con un plásmido que comprende a gene para una N-acetil-galactosaminidase, una transglicosilasa, o una hidralasa, e.g., serina-glicosil hidrolasa, e.g., que actúa en la dirección inversa, proporciona una célula que produce un aminoácido glicosilado. Cuando se combina con un sistema de traducción como se proporciona más adelante, la trayectoria biosintética da como resultado una célula que produce e incorpora a aminoácido glicosilado en una o más proteínas dentro de la célula. Por ejemplo, ver, e.g., Figura 28, que ilustra la formación de un aminoácido glicosilado, en donde R es opcionalmente un alcohol, una amina, o una N-acetil amina. Un ejemplo de estructura se muestra por la Formula IV: IV Ejemplo 16: Identi icación de las ventajas debidas a la incorporación de aminoácidos no naturales Dada la capacidad mostrada en la presente de desarrollar una bacteria completamente autónoma que pueda biosintetizar un aminoácido no natural a partir de fuentes de carbono básico e incorporar este aminoácido en las proteínas, e.g., en respuesta a un codón sin sentido en el ADN, con alta eficiencia y fidelidad de traducción, permanece la pregunta de si tales adiciones realmente proporcionan una ventaja a la bacteria sobre un organismo que incorpora solamente los veinte aminoácidos naturales . La presente invención proporciona un método para determinar si un código genético expandido proporciona cualquiera de tales ventajas así como identificar el tipo de ventaja y el aminoácido no natural al cual se debe . Desde el siglo XIX los bacteriólogos han estado interesados en los cambios extraordinarios de los cultivos bacteriales desarrollados- bajo diversas condiciones. Ver, e.g., Summers, W.C., J. Hist. Biol . , 1991, 24: P. 171-190. Sin embargo, todas las formas de evolución se han estudiado con los organismos de veinte aminoácidos. La presente invención se dirige a la posibilidad de expandir el código genético de E. coli con aminoácidos no naturales y proporciona métodos para probar si la capacidad para incorporar aminoácidos adicionales proporciona E. coli con una ventaja evolucionarla. Para determinar si la adición de nuevos aminoácidos al código genético puede proporcionar una ventaja evolucionarla en E. coli. la evolución de una bacteria de veinte aminoácidos se comparó opcionalmente a la de una bacteria de veinte aminoácidos . El procedimiento combina nuevos conjuntos de maquinaria de traducción para la incorporación de aminoácidos no naturales en proteínas con una biblioteca genómica de E. coli mutagenizado colocado bajo presiones selectivas. El procedimiento de selección genética descrito anteriormente y en otra parte por Schultz y colaboradores tiene, hasta ahora, producidos al menos aproximadamente once nuevas aminoacil sintetasas que pueden incorporar nuevos aminoácido en las proteínas de manera eficiente y con alta fidelidad en respuesta al codón TAG. utagenizar una biblioteca de plásmidos del genoma de E. coli mezcla los codones y agrega aleatoriamente codones sin sentido TAG a través de todo el genoma. Los nuevos codones TAG pueden suprimirse mediante la incorporación de nuevos aminoácidos en la proteína expresada. Estos sistemas bacteriales se colocan bajo presiones selectivas para seleccionar el desarrollo de E coli mejorado. Ver, e.g., Figura 21. Los fragmentos genómicos seleccionados provenientes de la biblioteca que confieren una ventaja se aislan y seleccionan opcionalmente para la capacidad de desarrollo mejorada cuando incorporan los otros aminoácidos no naturales y la tirosina en respuesta a los codones TAG. Un vector de bajo número de copias pSCIOl (aproximadamente 5 copias/célula) se utiliza opcionalmente para construir un gran inserto (7-14 kb)de la biblioteca genómica de E. coli mediante métodos estándar conocidos por aquellos de experiencia en la técnica. Por ejemplo, una biblioteca genómica de E. _coli en base a pSCIOl de 600 miembros proporciona una cobertura completa del genoma de E. coli y también es compatible con la aminoacil sintetasa, y los plásmidos ARNt descritos anteriormente. Se han estudiado muchos mutágenos por su capacidad para incorporar Codones TAG en los genes. Ver, e.g., Miller, J.H., Un pequeño curso sobre genética bacterial. 1992, Vista en planta: Cold Spring Harbor Laboratory Press. Se utilizan opcionalmente múltiples métodos de mutagénesis ya que cada mut geno no es completamente aleatorio en su formación de codones TAG. Mediante la mutagenización la misma biblioteca genomica de E. coli de 600 miembros con cuatro diferentes codones TAG mutágenos se colocan típicamente en tantos sitios como sea posible. Cuatro métodos adecuados incluyen, pero no se limitan a, Irradiación UV, una cepa mutadora (XL1 rojo) , 4-nitro-quinolina-l-oxido (NQO) , y etilmetano sulfonato (EMS) para mutar la biblioteca genomica, y combinarlos para hacer una biblioteca genomica mutada de >1010 miembros. Todos estos métodos de mutación dependen principalmente de formar mutación de punto pero se complementan entre si en el mecanismo de mutagénesis dando como resultado sobre todo una más uniforme distribución de codones TAG. La irradiación UV y la cepa mutadora generan todas las sustituciones de base mientras NQO y EMS causan principalmente las transiciones de G:C a A:T. La mayor parte de las mutaciones de punto generadas a partir de codones que codifican para uno de los veinte aminoácidos naturales. Ya que sólo aproximadamente 12.5% de las mutaciones de punto único pueden formar un codón TAG, se necesitan grandes bibliotecas genómicas altamente mutagenizadas . Este método típicamente genera al menos aproximadamente 106 copias mutadas de cada gene con muchos nuevos codones colocados aleatoriamente. La biblioteca genómica se verifica después típicamente para la incorporación del codón TAG mediante secuenciar un subconjunto de miembros de biblioteca antes y después de la mutagénesis Para determinar que genes pueden mejorarse mediante la incorporación de uno de los nuevos aminoácidos cualquiera de una variedad de presiones selectivas se utilizaron opcionalmente para seleccionar ese objetivo en un rango de biología celular: funciones catalíticas, interacciones de proteína, fuentes de carbono, genes de respuesta múltiple, y amplias funciones metabólicas. Por ejemplo, se utiliza presión de selección en base a quinolonas para dirigir topoisomerasa y ADN girasa. Se utiliza 5-fluorouracilo para dirigir la síntesis de ADN; se utiliza omeprazol para dirigir los inhibidores de la bomba de protones; el uso de ácidos grasos como una única fuente de carbono y un medio acídico se utilizan para dirigir una variedad de genes relacionados a la utilización de carbono y a la respuesta; y el medio reductivo se utiliza para dirigir la trayectoria tiol-redox y las proteínas que contienen disulfuro. Ver, e.g., Bronson, J.J. y J.F. Barrett, Curr. Med. Chemistry, 2001 8: p. 1775-1793; Bearden, D.T. y L.H. Danziger, Pharmacotherapy, 2001 21(10): p. 224S-232S; Matthews, D.A., et al., J. Mol Biol . , 1990. 2144(4): p. 937-948; Knox, M.R. y J.E. Harris, Arch. Microbiol., 1988. 149(6): p. 55760; McGowan, C.C., T.L. Cover, y M.J. Blaser, Gasteroenterology, 1994.107(5): p. 1573-8; Clark, D.P. y J.E. Cronan, Dos compuestos de carbono y ácidos grasos como fuentes de carbono. Escherichia coli y Salmonella celular y biología molecular, ed. F.C. Neidhardt . Vol. 1. 1996, Washington D. C: ASM press; Slonczewski, J.L. y J.W. Foster, genes regulados por pH- y supervivencia a pH extremo. Escherichia coli y Salmonella celular y biología molecular, ed. F.C. Neidhardt. Vol. 1. 1996, Washington D.C. : ASM press; y Ritz, D. y J. Beckwith, Annu. Rev. Microbiol, 2001. 55: p. 21-48. La selección de la biblioteca genómica imitada produce un conjunto de fragmentos genómicos mutados que confieren una ventaja de desarrollo bajo una cierta presión de selección. Estos fragmentos se comparan para determinar si son los mismos a los encontrados en las selecciones con el aminoácido no natural presente mediante la representación de restricción y la secuenciación. Los fragmentos que producen una mejora de desarrollo a partir de la selección de un aminoácido no natural de este fragmento, se re-seleccionan opcionalmente mediante comparar la tasa de desarrollo con cada aminoácido no natural y la tirosina que suprime al codón TAG. Ver, e.g., Figura 21. Esta re-selección de los fragmentos genómicos seleccionados asegura que el aminoácido no natural sea el factor que confiere una ventaja de desarrollo. Para los fragmentos que muestran una ventaja de desarrollo selectiva con un aminoácido no natural que se inserta en los codones TAG, el (los) gen (es) que confieren una ventaja se aislan e identifican opcionalmente, e.g., mediante digestión y subclonación. La proteína puede estudiarse para identificar como el aminoácido no natural mejora la función celular. La proteina mejorada se purifica opcionalmente y se compara a una proteína natural con ambos estudios in vitro e in vivo. La técnicas estándar de enzimas se utilizaron opcionalmente para estudiar la estabilidad de la proteína, la cinética, y su interacción con otros componentes de la trayectoria biosintética .
Ejemplo 17; Secuencias SEQ SECUENCIA Notas ARNt o ID # RS M.jannaschii 1 CCGGCGGTAGTTCAGCAGGGCAGAACGGCGGACTCTAAATCCGCATGGCGCTGG TC Tyr ARNtm ARNt CUA AAATCCGGCCCGCCGGACCA HLAD03; un ARNt 2 CCCAGGGTAG CCAAGCTCGG CCAACGGCGA CGGACTCTAA ATCCGTTCTC supresor ámbar ARNt optimizado GTAGGAGTTC GAGGGTTCGA ATCCCTTCCC TGGGACCA HL325A; un ARNt 3 GCGAGGGTAG CCAAGCTCGG CCAACGGCGA CGGACTTCCT AATCCGTTCT supresor de ARNt cambio de marco de lectura de CGTAGGAGTT CGAGGGTTCG AATCCCTCCC CTCGCACCA AGGA optimizado 4 ATGGACGAATTTGAAATGATAAAGAGAAACACATCTGAAATTATCAGCGAGGAAGAG TyrRS imitante RS TTAAGAGAGGTTTTAAAAAAAGATGAAAAATCTGCTCAGATAGGTTTTGAACCAAGT (LWJ1S) GGTAAAATACATTTAGGGCATTATCTCCAAATAAAAAAGATGATTGATTTACAAAAT GCTGGATTTGATATAATTATATTGTTGGCTGATTTACACGCCTATTTAAACCAGAAA GGAGAGTTGGATGAGATTAGAAAAATAGGAGATTATAACAAAAAAGTTTTTGAAGCA ATGGGGTTAAAGGCAAAATATGTTTATGGAAGTACTTTCCAGCTTGATAAGGATTAT ACACTGAATGTCTATAGATTGGCTTTAAAAACTACCTTAAAAAGAGCAAGAAGGAGT ATGGAACTTATAGCAAGAGAGGATGAAAATCCAAAGGTTGCTGAAGTTATCTATCCA ATAATGCAGGTTAATGCAATTCATTATCCTGGCGTTGATGTTGCAGTTGGAGGGATG GAGCAGAGAAAAATACACATGTTAGCAAGGGAGCTTTTACCAAAAAAGGTTGTTTGT ATTCACAACCCTGTCTTAACGGGTTTGGATGGAGAAGGGAAGATGAGTTCTTCAAAA GGGAATTTTATAGCTGTTGATGACTCTCCAGAAGAGATTAGGGCTAAGATAAAGAAA GCATACTGCCCAGCTGGAGTTGTTGAAGGAAATCCAATAATGGAGATAGCTAAATAC TTCCTTGAAIATCC TAACCATAAAAAGGCCAGAAAAATTTGGTGGAGATTTGACA GTTAGTAGCTATGAGGAGTTAGAGAGTTTATTTAAAAATAAGGAATTGCATCCAATG GATTTAAAAAATGCTGTAGCTGAAGAACTTATAAAGATTTTAGAGCCAATTAGAAAG SEQ SECUENCIA Notas ARNt o ID # RS AGATTATAA 5 ATGGACGAATTTGAAATGAIAAAGAGAAACACATCTGAAATTATCAGCGAGGAAGAG p-iPr-PheRS RS TTAAGAGAGGTTTTAAAAAAAGATGAAAAATCTGCTGGGATAGGTTTTGAACCAAGT GGTAAAATACATTTAGGGCATTATCTCCAAATAAAAAAGATGATTGATTTACAAAAT GCTGGATTTGATATAATTAIATTGTTGGCTGATTTACACGCCTATTTAAACCAGAAA GGAGAGTTGGATGAGATTAGAAAAATAGGAGATTATAACAAAAAAGTTTTTGAAGCA ATGGGGTTAAAGGCAAAATGTGCTTATGGAAGTCCTTTCCAGCTTGATAAGGATTAT ACACTGAATGTCTATAGATTGGCTTTAAAAACTACCTTAAAAAGAGCAAGAAGGAGT ATGGAACTTATAGAAGAGAGGATGAAAATCCAAAGGTTGCTGAAGTTATCTATCCAA TAATGCAGGTTAATGGTTATCATTATCTTGGCGTTGATGTTGCAGTTGGAGGGATGG AGCAGAGAAAAATACACATGTTAGCAAGGGAGCTTTTACCAAAAAAGGTTGTTTGTA TTCACAACCCTGTCTTAACGGGTTTGGATGGAGAAGGAAAGATGAGTTCTTCAAAAG GGAATTTTATAGCTGTTGATGACTCTCCAGAAGAGATTAGGGCTAAGATAAAGAAAG CATACTGCCCAGCTGGAGTTGTTGAAGGAAATCCAATAATGGAGATAGCTAAATACT TCCTTGAATATCCTTTAACCATAAAAAGGCCAGAAAAATTTGGTGGAGATTTGACAG TTAATAGCTATGAGGAGTTAGAGAGTTTATTTAAAAATAAGGAATTGCATCCAATGG ATTTAAAAAATGCTGTAGCTGAAGAACTTATAAAGATTTTAGAGCCAATTAGAAAGA GATTA 6 ATGGACGAATTTGAAATGATAAAGAGAAACACATCTGAAATTATCAGCGAGGAAGAG P-NH2-PheRS(l) RS TTAAGAGAGGTTTTAAAAAAAGATGAAAAATCTGCTCAGATAGGTTTTGAACCAAGT GGTAAAATACATTTAGGGCATTATCTCCAAATAAAAAAGATGATTGATTTACAAAAT CCTGGATTTGATATAATTATATTGTTGGCTGATTTACACGCCTATTTAAACCAGAAA GGAGAGTTGGATGAGATTAGAAAAATAGGAGATTATAACAAAAAAGTTTTTGAAGCA SEQ SECUENCIA Notas ARHt o ID # RS ATGGGGTTAAAGGCAAAATATGTTTATGGAAGTCCTTTCCAGCTTGATAAGGATTAT ACACTGAATGTCTATAGATTGGCTTTAAAAACTACCTTAAAAAGAGCAAGAAGGAGT ATGGAACTTATAGAAGAGAGGATGAAAATCCAAAGGTTGCTGAAGTTATCTATCCAA TAATGCAGGTTAATTGTTCTCATTATTATGGCGTTGATGTTGCAGTTGGAGGGATGG AGCAGAGAAAAATACACATGTTAGCAAGGGAGCTTTTACCAAAAAAGGTTGTTTGTA TTCACAACCCTGTCTTAACGGGTTTGGATGGAGAAGGAAAGATGAGTTCTTCAAAAG GGAATTTTATAGCTGTTGA GACTCTCCAGAAGAGATTAGGGCTAAGATAAAGAAAG CATACTGCCCAGCTGGAGT GTTGAAGGAAATCCAATAATGGAGATAGCTAAATACT TCCTTGAATATCCTTTAACCATAAAAAGGCCAGAAAAATTTGGTGGAGATTTGACAG TTAATAGCTATGAGGAGTTAGAGAGTTTATTTAAAAATAAGGAATTGCATCCAATGG ATTTAAAAAATGCTGTAGCTGAAGAACTTATAAAGATTTTAGAGCCAATTAGAAAGA GATTA 7 ATGGACGAATTTGAAATGATAAAGAGAAACACATCTGAAATTATCAGCGAGGAAGAG p-NH2-PheRS (2) RS TTAAGAGAGGTTTTAAAAAAAGATGAAAAATCTGCTACTATAGGTTTTGAACCAAGT GGTAAAATACATTTAGGGCAT ATCTCCAAATAAAAAAGATGATTGATTTACAAAAT GCTGGATTTGATATAATTATATTGTTGGCTGATTTACACGCCTATTTAAACCAGAAA GGAGAGTTGGATGAGATTAGAAAAATAGGAGATTATAACAAAAAAGTTTTTGAAGCA ATGGGGTTAAAGGCAAAATATGTTTATGGAAGTACGTTCCAGCTTGATAAGGATTAT ACACTGAATGTCTATAGATTGGCTTTAAAAACTACCTTAAAAAGAGCAAGAAGGAGT ATGGAACTTATAGAAGAGAGGATGAAAATCCAAAGGTTGCTGAAGTTATCTATCCAA TAATGCAGGTTAATCCGTTGCATTATGCTGGCGTTGATGTTGCAGTTGGAGGGATGG AGCAGAGAAAAATACACATGTTAGCAAGGGAGCTTTTACCAAAAAAGGTTGTTTGTA TTCACAACCCTGTCTTAACGGGTTTGGATGGAGAAGGAAAGATGAGTTCTTCAAAAG SEQ SECUENCIA Notas ARNt o ID # RS GGAATTTTATAGCTGTTGATGACTCTCCAGAAGAGATTAGGGCTAAGATAAAGAAAG CATACTGCCCAGCTGGAGTTGTTGAAGGAAATCCAATAATGGAGATAGCTAAATACT TCCTTGAATATCCTTTAACCATAAAAAGGCCAGAAAAATTTGGTGGAGATTTGACAG TTAATAGCTATGAGGAGTTAGAGAGTTTATTTAAAAATAAGGAATTGCATCCAATGG ATTTAAAAAATGCTGTAGCTGAAGAACTTATAAAGATTTTAGAGCCAATTAGAAAGA GATTA 8 ATGGACGAATTTGAAATGATAAAGAGAAACACATCTGAAATTATCAGCGAGGAAGAG p-NH2-PheRS (3a) RS TTAAGAGAGGTTTTAAAAAAAGATGAAAAATCTGCTCATATAGGT TTGAACCAAGT GGTAAAATACATTTAGGGCATTATCTCCAAAATAAAAAGATGATTGATTTACAAAAT GCTGGATTTGATATAATTATATTGTTGGCTGATTTACACGCCTATTTAAACCAGAAA GGAGAGTTGGATGAGATTAGAAAAATAGGAGATTATAACAAAAAAGTTTTTGAAGCA ATGGGGTTAAAGGCAAAATATGTTTATGGAAGTOAGTTCCAGCTTGATAAGGATTAT ACACTGAATGTCTATAGATTGGCTTTAAAAACTACCTTAAAAAGAGCAAGAAGGAGT ATGGAACTTATAGAAGAGAGGATGAAAATCCAAAGGTTGCTGAAGTTATCTATCCAA TAATGCAGGTTAATCGGCCGCATTATCCTGGCGTTGATGTTGCAGTTGGAGGGATGG AGCAGAGAAAAATACACATGTTAGCAAGGGAGCTTTTACCAAAAAAGGTTGTTTGTA TTCACAACCCTGTCTTAACGGGTTTGGATGGAGAAGGAAAGATGAGTTCTTCAAAAG GGAATTTTATAGCTGTTGATGACTCTCCAGAAGAGATTAGGGCTAAGATAAAGAAAG CATACTGCCCAGCTGGAGTTGTTGAAGGAAATCCAATAATGGAGATAGCTAAATACT TCCTTGAATATCCTTTAACCATAAAAAGGCCAGAAAAATTTGGTGGAGATTTGACAG TTAATAGCTATGAGGAGTTAGAGAGTTTATTTAAAAATAAGGAATTGCATCCAATGG ATTTAAAAAATGCTGTAGCTGAAGAACTTATAAAGATTTTAGAGCCAATTAGAAAGA GATTA - SEQ SECUENCIA Notas ARWt o ID # RS 9 ATGGACGAATTTGAAATGATAAAGAGAAACACATCTGAAATTATCAGCGAGGAAGAG p-NH2-PheES(3b) RS TTAAGAGAGGTTTTAAAAAAAGATGAAAAATCTGCTTATATAGGTTTTGAACCAAGT GGTAAAATACATTTAGGGCATTATCTCCAAATAAAAAAGATGATTGATTTACAAAAT GCTGGATTTGATATAATTATATTGTTGGCTGATTTACACGCCTATTTAAACCAGAAA GGAGAGTTGGATGAGATTAGAAAAATAGGAGATTATAACAAAAAAGTTTTTGAAGCA ATGGGGTTAAAGGCAAAATATGTTTATGGAAGTCCTTTCCAGCTTGATAAGGATTAT ACACTGAATGTCTATAGATTGGCTTTAAAAACTACCTTAAAAAGAGCAAGAAGGAGT ATGGAACTTATAGAAGAGAGGATGAAAATCCAAAGGTTGCTGAAGTTATCTATCCAA TAATGCAGGTTAATCAGAGTCATTATGATGGCGTTGATGTTGCAGTTGGAGGGATGG AGCAGAGAAAAATACACATC-TTAGCAAGGGAGCTT TACCAAAAAAGGTTGTTTGTA TTCACAACCCTGTCTTAACGGGTTTGGATGGAGAAGGAAAGATGAGTTCTTCAAAAG GGAATTTTATAGCTGTTGATGACTCTCCAGAAGAGATTAGGGCTAAGATAAAGAAAG CATACTGCCCAGCTGGAGTTGTTGAAGGAAATCCAATAATGGAGATAGCTAAATACT TCCTTGAATATCCTTTAACCATAAAAAGGCCAGAAAAATTTGGTGGAGATTTGACAG TTAATAGCTATGAGGAGTTAGAGAGTTTATTTAAAAATAAGGAATTGCATCCAATGG ATTTAAAAAATGCTGTAGC GAAGAACTTATAAAGATTTTAGAGCCAATTAGAAAGA GATTA 10 ATGGACGAATTTGAAATGATAAAGAGAAACACATCTGAAATTATCAGCGAGGAAGAG O-Allyl-TyrRS(l) RS TTAAGAGAGGTTTTAAAAAAAGATGAAAAATCTGCTTCGATAGGTTT GAACCAAGT GGTAAAATACATTTAGGGCATTATCTCCAAATAAAAAAGATGATTGATTTACAAAAT GCTGGATTTGATATAATTATATTGTTGGCTGATTTACACGCCTATTTAAACCAGAAA GGAGAGTTGGATGAGATTAGAAAAATAGGAGATTATAACAAAAAAGTTTTTGAAGCA ATGGGGTTAAAGGCAAAATATGTTTATGGAAGTACGTTCCAGCTTGATAAGGAITAT SEQ SECUENCIA Notas ARHt o ID # RS ACACTGAATGTCTATAGATTGGCTTTAAAAACTACCTTAAAAAGAGCAAGAAGGAGT ATGGAACTTATAGAAGAGAGGATGAAAATCCAAAGGTTGCTGAAGTTATCTATCCAA TAATGCAGGTTAATACGTATCATTATGCTGGCGTTGATGTTGCAGTTGGAGGGATGG AGCAGAGAAAAATACACATGTTAGCAAGGGAGCTTTTACCAAAAAAGGTTGTTTGTA TTCACAACCCTGTCTTAACGGGTTTGGATGGAGAAGGAAAGATGAGTTCTTCAAAAG GGAATTTTATAGCTGTTGATGACTCTCCAGAAGAGATTAGGGCTAAGATAAAGAAAG CATACTGCCCAGCTGGAGTTGTTGAAGGAAATCCAATAATGGAGATAGCTAAATACT TCCTTGAATATCCTTTAACCATAAAAAGGCCAGAAAAATTTGGTGGAGATTTGACAG TTAATAGCTATGAGGAGTTAGAGAGTTTATTTAAAAATAAGGAATTGCATCCAATGG ATTTAAAAAATGCTGTAGCTGAAGAACTTATAAAGATTTTAGAGCCAATTAGAAAGA GATTA 11 ATGGACGAATTTGAAATGATAAAGAGAAACACATCTGAAATTATCAGCGAGGAAGAG 0-Allyl-TyrRS(3) RS TTAAGAGAGGTTTTAAAAAAAGATGAAAAATCTGCTCCTATAGGTTTTGAACCAAGT GGTAAAATACATTTAGGGCATTATCTCCAAATAAAAAAGATGATTGATTTACAAAAT GCTGGATT GATATAATTATATTGTTGGCTGATTTACACGCCTATTTAAACCAGAAA GGAGAGTTGGATGAGATTAGAAAAATAGGAGATTATAACAAAAAAGTTTTTGAAGCA ATGGGGTTAAAGGCAAAATATGTTTATGGAAGTATGTTCCAGCTTGATAAGGATTAT ACACTGAATGTCTATAGATTGGCTTTAAAAACTACCTTAAAAAGAGCAAGAAGGAGT ATGGAACTTATAGAAGAGAGGATGAAAATCCAAAGGTTGCTGAAGTTATCTATCCAA TAATGCAGGTTAATAATACGCATTATGGGGGCGTTGATGTTGCAGTTGGAGGGATGG AGCAGAGAAAAATACACATGTTAGCAAGGGAGCTTTTACCAAAAAAGGTTGTTTGTA TTCACAACCCTGTCTTAACGGGTTTGGATGGAGAAGGAAAGATGAGTTCTTCAAAAG GGAATTTTATAGCTGTTGATGACTCTCCAGAAGAGATTAGGGCTAAGATAAAGAAAG SEQ SECUENCIA Notas ARNt o ID # RS CATACTGCCCAGCTGGAGTTGTTGAAGGAAATCCAATAATGGAGATA6CTAAATACT TCCTTGAATATCCTTTAACCATAAAAAGGCCAGAAAAATTTGGTGGAGATTTGACAG TTAATAGCTATGAGGAGTTAGAGAGTTTATTTAAAAATAAGGAATTGCATCCAATGG ATTTAAAAAATGCTGTAGCTGAAGAACTTATAAAGATTTTAGAGCCAATTAGAAAGA GATTA 12 ATGGACGAATTTGAAATGATAAAGAGAAACACATCTGAAATTATCAGCGAGGAAGAG 0-Allyl-TyrRS(4) RS TTAAGAGAGGTTTTAAAAAAAGATGAAAAATCTGCTACGATAGGTTTTGAACCAAGT GGTAAAATACATTTAGGGCATTATCTCCAAATAAAAAAGATGATTGATTTACAAAAT GCTGGATTTGATATAATTATATTGTTGGCTGATTTACACGCCTATTTAAACCAGAAA GGAGAGTTGGATGAGATTAGAAAAATAGGAGATTATAACAAAAAAGTTTTTGAAGCA ATGGGGTTAAAGGCAAAATATGTTTATGGAAGTCATTTCCAGCTTGATAAGGATTAT ACACTGAATGTCTATAGATTGGCTTTAAAAACTACCTTAAAAAGAGCAAGAAGGAGT ATGGAACTTATAGAAGAGAGGATGAAAATCCAAAGGTTGCTGAAGTTATCTATCCAA TAATGCAGGTTAATCAGACTCATTATGAGGGCGTTGATGTTGCAGTTGGAGGGATGG AGCAGAGAAAAATACACATGTTAGCAAGGGAGCTTTTACCAAAAAAGGTTGTTTGTA TTCACAACCCTGTCTTAACGGGTTTGGATGGAGAAGGAAAGATGAGTTCTTCAAAAG GGAATTTTATAGCTGTTGATGACTCTCCAGAAGAGATTAGGGCTAAGATAAAGAAAG CATACTGCCCAGCTGGAGT GTTGAAGGAAATCCAATAATGGAGATAGCTAAATACT TCCTTGAATATCCTTTAACCATAAAAAGGCCAGAAAAATTTGGTGGAGATTTGACAG TTAATAGCTATGAGGAGTTAGAGAGTTTATTTAAAAATAAGGAATTGCATCCAATGG ATTTAAAAAATGCTGTAGCTGAAGAACTTATAAAGATTTTAGAGCCAATTAGAAAGA GATTA 13 ATGGACGAATTTGAAATGATAAAGAGAAACACATCTGAAATTATCAGCGAGGAAGAG p-Br-PheRS RS SEQ SECUENCIA Notas ARNt o ID # RS TTAAGAGAGGTTTTAAAAAAAGATGAAAAATCTGCTCATATAGGTTTTGAACCAAGT GGTAAAATACATTTAGGGCATTATCTCCAAATAAAAAAGATGATTGATTTACAAAAT GCTGGATTTGATATAATTATATTGTTGGCTGATTTACACGCCTATTTAAACCAGAAA GGAGAGTTGGATGAGATTAGAAAAATAGGAGATTATAACAAAAAAGTTTTTGAAGCA ATGGGGTTAAAGGCAAAATATGTTTATGGAAGTAAGTTCCAGCTTGATAAGGATTAT ACACTGAATGTCTATAGAT1GGCTTTAAAAACTACCTTAAAAAGAGCAAGAAGGAGT ATGGAACTTATAGAAGAGAGGATGAAAATCCAAAGGTTGCTGAAGTTATCTATCCAA TAATGCAGGTTAATCCGTGTCATTATCATGGCGTTGATGTTGCAGTTGGAGGGATGG AGCAGAGAAAAATACACATGTTAGCAAGGGAGCTTTTACCaAAAAAGGTTGTTTGTA TTCACAACCCTGTCTTAACGGGTTTGGATGGAGAAGGAAAGATGAGTTCTTCAAAAG GGAATTTTATAGCTGTTGAIGACTCTCCAGAAGAGATTAGGGCTAAGATAAAGAAAG CATACTGCCCAGCTGGAGTIGTTGAAGGAAATCCAATAATGGAGATAGCTAAATACT TCCTTGAATATCCTTTAACCATAAAAAGGCCAGAAAAATTTGGTGGAGATTTGACAG TTAATAGCTATGAGGAGTTAGAGAGTTTATTTAAAAATAAGGAATTGCATCCAATGG ATTTAAAAAATGCTGTAGCTGAAGAACTTATAAAGATTTTAGAGCCAATTAGAAAGA GATTA 14 ATGGACGAATTTGAAATGATAAAGAGAAACACATCTGAAATTATCAGCGAGGAAGAG p-Az-HieRS(l) RS TTAAGAGAGGTTTTAAAAAAAGATGAAAAATCTGCTGCTATAGGTTTTGAACCAAGT GGTAAAATACATTTAGGGCATTATCTCCAAATAAAAAAGATGATTGATTTACAAAAT GCTGGATTTGATATAATTATATTGTTGGCTGATTTACACGCCTATTTAAACCAGAAA GGAGAGTTGGATGAGATTAGAAAAATAGGAGATTATAACAAAAAAGTTT TGAAGCA ATGGGGTTAAAGGCAAAATATGTTTATGGA¾GTCGGTTCCACCTTGATAAGGATTAT ACACTGAATGTCTATAGATTGGCTTTAAAAACTACCTTAAAAAGAGCAAGAAGGAGT SEQ SECUENCIA Notas ARNt o ID # ES ATGGAACTTATAGAAGAGAGGATGAAAATCCAAAGGTTGCTGAAGTTATCTATCCAA TAATGCAGGTTAATGTGATTCATTATGATGGCGTTGATGTTGCAGTTGGAGGGATGG AGCAGAGAAAAATACACATGTTAGCAAGGGAGCTTTTACCAAAAAAGGTTGTTTGTA TTCACAACCCTGTCTTAACGGGTTTGGATGGAGAAGGAAAGATGAGTTCTTCAAAAG GGAATTTTATAGCTGTTGATGACTCTCCAGAAGAGATTAGGGCTAAGATAAAGAAAG CATACTGCCCAGCTGGAGTTGTTGAAGGAAATCCAATAATGGAGATAGCTAAATACT TCCTTGAATATCCTTTAACCATAAAAAGGCCAGAAAAATTTGGTGGAGATTTGACAG TTAATAGCTATGAGGAGTTAGAGAGTTTATTTAAAAATAAGGAATTGCATCCAATGG ATTTAAAAAATGCTGTAGCTGAAGAACTTATAAAGATTTTAGAGCCAATTAGAAAGA GATTA 15 ATGGACGAATTTGAAATGAIAAAGAGAAACACATCTGAAATTATCAGCGAGGAAGAG p-Az-PheRS (3) RS TTAAGAGAGGTTTTAAAAAAAGATGAAAAATCTGCTGGGATAGGTTTTGAACCAAGT GGTAAAATACATTTAGGGCATTATCTCCAAATAAAAAAGATGATTGATTTACAAAAT GCTGGATTTGATATAATTATATTGTTGGCTGATTTACACGCCTATTTAAACCAGAAA GGAGAGTTGGATGAGATTAGAAAAATAGGAGATTATAACAAAAAAGTTTTTGAAGCA ATGGGGTTAAAGGCAAAATATGTTTATGGAAGTACTTTCCAGCTTGATAAGGATTAT ACACTGAATGTCTATAGATTGGCTTTAAAAACTACCTTAAAAAGAGCAAGAAGGAGT ATGGAACTTATAGAAGAGAGGATGAAAATCCAAACGTTGCTGAAGTTATCTATCCAA TAATGCAGGTTAATACGTATTATTATGCTGGCGTTCATGTTGCAGTTGGAGGGATGG AGCAGAGAAAAATACACATGTTAGCAAGGGAGCTTTTACCAAAAAAGGTTGT TGTA TTCACAACCCTGTCTTAACGGGTTTGGATGGAGAAGGAAAGATGAGTTCTTCAAAAG GGAATTTTATAGCTGTTGATGACTCTCCAGAAGAGATTAGGGCTAAGATAAAGAAAG CATACTGCCCAGCTGGAGTTGTTGAAGGAAATCCAATAATGGAGATAGCTAAATACT SEQ SECUENCIA Notas ARNt o ID # RS TCCTTGAATATCCTTTAACCATAAAAAGGCCAGAAAAATTTGGTGGA6ATTTGACAG TTAATAGCTATGAGGAGTTAGAGAGTTTATTTAAAAATAAGGAATTGCATCCAATGG ATTTAAAAAATGCTGTAGCTGAAGAACTTATAAAGATTTTAGAGCCAATTAGAAAGA GATTA 16 ATGGACGAATTTGAAATGATAAAGAGAAACACATCTGAAATTATCAGCGAGGAAGAG p-Az-PheRS(B) RS TTAAGAGAGGTTTTAAAAAAAGATGAAAAATCTGCTCTGATAGGTTTTGAACCAAGT GGTAAAATACATTTAGGGCATTATCTCCAAATAAAAAAGATGATTGATTTACAAAAT GCTGGATTTGATATAATTATATTGTTGGCTGATTTACACGCCTATTTAAACCAGAAA GGAGAGTTGGATGAGATTAGAAAAATAGGAGATTATAACAAAAAAGTTTTTGAAGCA ATGGGGTTAAAGGCAAAATATGTTTATGGAAGTCCGTTCCAGCTTGATAAGGATTAT ACACTGAATGTCTATAGATTGGCTTTAAAAACTACCTTAAAAAGAGCAAGAAGGAGT ATGGAACTTATAGAAGAGAGGATGAAAATCCAAAGGTTGCTGAAGTTATCTATCCAA TAATGCAGGTTAATCAGATTCATTCTAGTGGCGTTGATGTTGCAGTTGGAGGGATGG AGCAGAGAAAAATACACATGTTAGCAAGGGAGCTTTTACCAAAAAAGGTTGTTTGTA TTCACAACCCTGTCTTAACGGGTTTGGATGGAGAAGGAAAGATGAGTTCTTCAAAAG GGAATTTTATAGCTGTTGATGACTCTCCAGAAGAGATTAGGGCTAAGATAAAGAAAG CATACTGCCCAGCTGGAGTTGTTGAAGGAAATCCAATAATGGAGATAGCTAAATACT TCCTTGAATATCCTTTAACCATAAAAAGGCCAGAAAAATTTGGTGGAGATTTGACAG TTAATAGCTATGAGGAGTTAGAGAGTTTATTTAAAAATAAGGAATTGCATCCAATGG ATTTAAAAAATGCTGTAGCTGAAGAACTTATAAAGATTTTAGAGCCAATTAGAAAGA GATTA Sintetasas 17 ATGGACGAATTTGAAATGATAAAGAGAAACACATCTGAAATTATCAGCGAGGAAGAG imitantes para RS incorporar m- acil TTAAGAGAGGTTTTAAAAAAAGATGAAAAATCTGCTGACATAGGTTTTGAACCAAGT fenilalanina en proteínas (Cetona 3-4) - - SEQ SECUENCIA Notas ARNt o ID # RS GGTAAAATACATTTAGGGCATTATCTCCAAATAAAAAAGATGATTGATTTACAAAAT GCTGGATTTGATATAATTATATTGTTGGCTGATTTACACGCCTATTTAAACCAGAAA GGAGAGTTGGATGAGATTAGAAAAATAGGAGATTATAACAAAAAAGTTTTTGAAGCA ATGGGGTTAAAGGCAAAATATGTTTATGGAAGTGAATTCCAGCTTGATAAGGATTAT ACACTGAATGTCTATAGATTGGCTTTAAAAACTACCTTAAAAAGAGCAAGAAGGAGT ATGGAACTTATAGCAAGAGAGGATGAAAATCCAAAGGTTGCTGAAGTTATCTATCCA ATAATGCAGGTTAATGGAATGCATTATCAAGGCGTTGATGTTGCAGTTGGAGGGATG GAGCAGAGAAAAATACACATGTTAGCAAGGGAGCTTTTACCAAAAAAGGTTGTTTGT ATTCACAACCCTGTCTTAACGGGTTTGGATGGAGAAGGAAAGATGAGTTC TCAAAA GGGAATTTTATAGCTGTTGATGACTCTCCAGAAGAGATTAGGGCTAAGATAAAGAAA GCATACTGCCCAGCTGGAGTTGTTGAAGGAAATCCAATAATGGAGATAGCTAAATAC TTCCTTGAATATCCTTTAACCATAAAAAGGCCAGAAAAATTTGGTGGAGATTTGACA GTTAATAGCTATGAGGAGTIAGAGAGTTTATTTAAAAATAAGGAATTGCATCCAATG GATTTAAAAAATGCTGTAGCTGAAGAACTTATAAAGATTTTAGAGCCAATTAGAAAG AGATTATAA Sintetasa 18 ATGGACGAATTTGAAATGATAAAGAGAAACACATCTGAAATTATCAGCGAGGAAGAG m tante para RS incorporar m- acil TTAAGAGAGGTTTTAAAAAAAGATGAAAAATCTGCTTACATAGGTTTTGAACCAAGT fenilalanina en proteínas (Cetona 3-7) GGTAAAATACATTTAGGGCATTATCTCCAAATAAAAAAGATGATTGATTTACAAAAT GCTGGATTTGATATAATTATATTGTTGGCTGATTTACACGCCTATTTAAACCAGAAA GGAGAGTTGGATGAGATTAGAAAAATAGGAGATTATAACAAAAAAGTTTTTGAAGCA ATGGGGTTAAAGGCAAAATATGTTTATGGAAGTCTATTCCAGCTTGATAAGGA1TAT ACACTGAATGTCTATAGATTGGCTTTAAAAACTACCTTAAAAAGAGCAAGAAGGAGT ATGGAACTTATAGCAAGAGAGGATGAAAATCCAAAGGTTGCTGAAGTTATCTATCCA SEQ SECUENCIA Notas ARNt o ID # ES ATAATGCAGGTTAATGATATTCATTATACAGGCGTTGATGTTGCAGTTGGAGGGATG GAGCAGAGAAAAATACACATGTTAGCAAGGGAGCTTTTACCAAAAAAGGTTGTTTGT ATTCACAACCCTGTCTTAACGGGTTTGGATGGAGAAGGAAAGATGAGTTCTTCAAAA GGGAATTTXATAGCTGTTGATGACTCTCCAGAAGAGATTAGGGCTAAGATAAAGAAA GCATACTGCCCAGCTGGAGTTGTTGAAGGAAATCCAATAATGGAGATAGCTAAATAC TTCCTTGAATATCCTTTAACCATAAAAAGGCCAGAAAAATTTGGTGGAGATTTGACA GTTAATAGCTATGAGGAGTTAGAGAGTTTATTTAAAAATAAGGAATTGCATCCAATG GATTTAAAAAATGCTGTAGCTGAAGAACTTATAAAGATTTTAGAGCCAATTAGAAAG AGATTATAA Sintetasa 19 ATGGACGAATTTGAAATGATAAAGAGAAACACATCTGAAATTATCAGCGAGGAAGAG mutante para RS incorporar ra- acil TTAAGAGAGGTTTTAAAAAAAGATGAAAAATCTGCTCTAATAGGTTTTGAACCAAGT fenilalanina en proteínas (Cetona 4-1) GGTAAAATACATTTAGGGCATTATCTCCAAATAAAAAAGATGATTGATTTACAAAAT GCTGGATTTGATATAATTATATTGTGACAGATTTAAACGCCTATTTAAACCAGAAA GGAGAGTTGGATGAGATTAGAAAAATAGGAGATTATAACAAAAAAGTTTTTGAAGCA ATGGGGTTAAAGGCAAAATATGTTTATGGAAGTGAATTCCAGCTTGATAAGGATTAT ACACTGAATGTCTATAGATIGGCTTTAAAAACTACCTTAAAAAGAGCAAGAAGGAGT ATGGAACTTATAGCAAGAGAGGATGAAAATCCAAAGGTTGCTGAAGTTATCTATCCA ATAATGCAGGTTAATGATAT CATTATTTAGGCGTTGATGTTGCAGTTGGAGGGATG GAGCAGAGAAAAATACACAGTTAGCAAGGGAGCTTTTACCAAAAAAGGTTGTTTGT ATTCACAACCCTGTCTTAACGGGTTTGGATGGAGAAGGAAAGATGAGTTCTTCAAAA GGGAATTTTATAGCTGTTGATGACTCTCCAGAAGAGATTAGGGCTAAGATAAAGAAA GCATACTGCCCAGCTGGAGTTGTTGAAGGAAATCCAATAATGGAGATAGCTAAATAC TTCCTTGAATATCCTTTAACCATAAAAAGGCCAGAAAAATTTGGTGGAGATTTGACA SEQ SECUENCIA Notas ARNt o ID # RS GTTAATAGCTATGAGGAGTTAGAGAGTTTATTTAAAAATAAGGAATTGCATCCAATG GATTTAAA&AATGCTGTAGCTGAAGAACTTATAAAGATTTTAGAGCCAATTAGAAAG AGATTATAA Sintetasa 20 ATGGACGAATTTGAAATGATAAAGAGAAACACATCTGAKATTATCAGCGAGGAAGAG mutante para RS incorporar m- acil TTAAGAGAGGTTTTAAAAAAAGATGAAAAATCTGCTCTAATAGGTTTTGAACCAAGT fenilalanina en proteínas (Cetona 5-4) GGTAAAATACATTTAGGGCATTATCTCCAAATAAAAAAGATGATTGATTTACAAAAT GCTGGATTTGATATAATTATATTGTTGACAGATTTAAAAGCCTATTTAAACCAGAAA GGAGAGTTGGATGAGATTAGAAAAATAGGAGATTATAACAAAAAAGTTTTTGAAGCA ATGGGGTTAAAGGCAAAATATGTTTATGGAAGTGAATTCCAGCTTGATAAGGATTAT ACACTGAATGTCTATAGATTGGCTTTAAAAACTACCTTAAAAAGAGCAAGAAGGAGT ATGGAACTTATAGCAAGAGAGGATGAAAATCCAAAGGTTGCTGAAGTTATCTATCCA ATAATGTCAGTTAATGTAA1TCATTATTTAGGCGTTGATGTTGTAGTTGGAGGGATG GAGCAGAGAAAAATACACATGTTAGCAAGGGAGCTTTTACCAAAAAAGGTTGTTTGT ATTCACAACCCTGTCTTAACGGGTTTGGATGGAGAAGGAAAGATGAGTTCTTCAAAA GGGAATTTTATAGCTGTTGATGACTCTCCAGAAGAGATTAGGGCTAAGATAAAGAAA GCATACTGCCCAGCTGGAGTTGTTGAAGGAAATCCAATAATGGAGATAGCTAAATAC TTCCTTGAATATCCTTTAACCATAAAAAGGCCAGAAAAATTTGGTGGAGATTTGACA GTTAATAGCTATGAGGAGTTAGAGAGTTTATTTAAAAATAAGGAATTGCATCCAATG GATTTAAAAAATGCTGTAGCTGAAGAACTTATAAAGATTTTAGAGCCAATTAGAAAG AGATTATAA Sintetasa 21 ATGGACGAATTTGAAATGATAAAGAGAAACACATCTGAAATTATCAGCGAGGAAGAG mutante para RS incorporar m- acil TTAAGAGAGGTTTTAAAAAAAGATGAAAAATCTGCTCTAATAGGTTTTGAACCAAGT fenilalanina en proteínas (Cetona 6-8) GGTAAAATACATTTAGGGCATTATCTCCAAATAAAAAAGATGAITGATTTACAAAAT SEQ SECUENCIA Notas ARNt o ID # RS GCTGGATTTGATATAATTAIATTCSTTGCCAGATTTATCAGCCTATTTAAACCAGAAA GGAGAGTTGGATGACATTAGAAAAATAGGAGATTATAACAAAAAAGTTTTTGAAGCA ATGGGGTTAAAGGCAAAATATGTTTATGGAAGTGAATTCCAGCTTGATAAGGATTAT ACACTGAATGTCTATAGATTGGCTTTAAAAACTACCTTAAAAAGAGCAAGAAGGAGT ATGGAACTTATAGCAAGAGAGGATGAAAATCCAAAGGTTGCTGAAGTTATCTATCCA ATAATGCAGGTTAATGATATTCATTATTTAGGCGTTGATGTTGCAGTTGGAGGGATG GAGCAGAGAAAAATACACATGTTAGCAAGGGAGCTTTTACCAAAAAAGGTTGTrTGT ATTCACAACCCTGTCTTAACGGGTTTGGATGGAGAAGGAAAGATGAGTTCTTCAAAA GGGAATTTTATAGCTGTTGATGACTCTCCAGAAGAGATTAGGGCTAAGATAAAGAAA GCATACTGCCCAGCTGGAGTTGTTGAAGGAAATCCAATAATGGAGATAGCTAAATAC TTCCTTGAATATCCTTTAACCATAAAAAGGCCAGAAAAATTTGGTGGAGATTTGACA GTTAATAGCTATGAGGAGTTAGAGAGTTTATTTAAAAATAAGGAATTGCATCCAATG GATTTAAAAAATGCTGTAGCTGAAGAACTTATAAAGATTTTAGAGCCAATTAGAAAG AGATTATAA Si tetasa 22 ATGGACGAATTTGAAATGATAAAGAGAAACACATCTGAAATTATCAGCGAGGAAGAG mutante para RS incorporar m- metoxi TTAAGAGAGGTTTTAAAAAAAGATGAAAAATCTGCTACAATAGGTTTTGAACCAAGT fenilalanina en proteínas (OMe i-e) GGTAAAATACATTTAGGGCATTATCTCCAAATAAAAAAGATGATTGATTTACAAAAT GCTGGATTTGATATAATTATATTGTTGGCTGATTTACACGCCTATTTAAACCAGAAA GGAGAGTTGGATGAGATTAGAAAAATAGGAGATTATAACAAAAAAGTTTTTGAAGCA ATGGGGTTAAAGGCAAAATATGTTTATGGAAGTGAATTCCAGCTTGATAAGGATTAT ACACTGAATGTCTATAGATTGGCTTTAAAAACTACCTTAAAAAGAGCAAGAAGGAGT ATGGAACTTATAGCAAGAGAGGATGAAAATCCAAAGGTTGCTGAAGTTATCTATCCA ATAATGCAGGTTAATGATATTCATTATGCAGGCGTTGATGTTGCAGTTGGAGGGATG SEQ SECUENCIA Notas ARNt o ID # RS GAGCAGAGAAAAATACACATGTTAGC!AAGGGAGCTTTTACCAAAAAAGGTTGTTTGT ATTCACAACCCTGTCTTAACGGGTTTGGATGGAGAAGGAAAGATGAGTTCTTCAAAA GGGAATTTTATAGCTGTTGATGACTCTCCAGAAGAGATTAGGGCTAAGATAAAGAAA GCATACTGCCCAGCTGGAGTTGTTGAAGGAAATCCAATAATGGAGATAGCTAAATAC TTCCTTGAATATCCTTTAACCATAAAAAGGCCAGAAAAATTTGGTGGAGATTTGACA GTTAATAGCTATGAGGAGTTAGAGAGTTTATTTAAAAATAAGGAATTGCATCCAATG GATTTAAAAAATGCTGTAGCTGAAGAACTTATAAAGATTTTAGAGCCAATTAGAAAG AGATTATAA Sintetasas 23 ATGGACGAATTTGAAATGATAAAGAGAAACACATCTGAAATTATCAGCGAGGAAGAG mutantes para RS incorporar m- metoxi TTAAGAGAGGTTTTAAAAAAAGATGAAAAATCTGCTACAATAGGTTTTGAACCAAGT fenilalanina en proteínas (OMe 1-8) GGTAAAATACATTTAGGGCATTATCTCCAAATAAAAAAGATGATTGATTTACAAAAT GCTGGATTTGATATAATTATATTGTTGTCCGATTTACCAGCCTATTTAAACCAGAAA GGAGAGTTGGATGAGATTAGAAAAATAGGAGATTATAACAAAAAAGTTTTTGAAGCA ATGGGGTTAAAGGCAAAATATGTTTATGGAAGTGAATTCCAGCTTGATAAGGATTAT ACACTGAATGTCTATAGATTGGCTTTAAAAACTACCTTAAAAAGAGCAAGAAGGAGT ATGGAACTTATAGCAAGAGAGGATGAAAATCCAAAGGTTGCTGAAGTTATCTATCCA ATAATGCAGGTTAATGATATTCATTATTTAGGCGTTGATGTTGCAGTTGGAGGGATG GAGCAGAGAAAAATACACATGTTAGCAAGGGAGCTTTTACCAAAAAAGGTTGTTTGT ATTCACAACCCTGTCTTAACGGGTTTGGATGGAGAAGGAAAGATGAGTTCTTCAAAA GGGAATTTTATAGCTGTTGArGACTCTCCAGAAGAGATTAGGGCTAAGATAAAGAAA GCATACTGCCCAGCTGGAGTrGTTGAAGGAAATCCAATAATGGAGATAGCTAAATAC TTCCTTGAATATCCTTTAACCATAAAAAGGCCAGAAAAATTTGGTGGAGATTTGACA GTTAATAGCTATGAGGAGTTAGAGAGTTTATTTAAAAATAAGGAATTGCATCCAATG SEQ SECUENCIA Notas ARNt o ID # RS GATTTAAAAAATGCTGTAGCTGAAGAACTTATAAAGATTTTAGAGCCAATTAGAAAG AGATTATAA Sintetasa 24 ATGGACGAATTTGAAATGATAAAGAGAAACACATCTGAAATTATCAGCGAGGAAGAG mutante para RS incorporar m- metoxi TTAAGAGAGGTTTTAAAAAAAGATGAAAAATCTGCTACAATAGGTTTTGAACCAAGT fenilalanina en proteínas (OMe 2-7) GGTAAAATACATTTAGGGCATTATCTCCAAATAAAAAAGATGATTGATTTACAAAAT GCTGGATTTGATATAATTATATTGTTGGCTGATTTACACGCCTATTTAAACCAGAAA GGAGAGTTGGATGAGATTAGAAAAATAGGAGATTATAACAAAAAAGTTTTTGAAGCA ATGGGGTTAAAGGCAAAATATGTTTATGGAAGTATGTTCCAGCTTGATAAGGATTAT ACACTGAATGTCTATAGATTGGCTTTAAAAACTACCTTAAAAAGAGCAAGAAGGAGT ATGGAACTTATAGCAAGAGAGGATGAAAATCCAAAGGTTGCTGAAGTTATCTATCCA ATAATGCAGGTTAATTCATCACATTATGACGGCGTTGATGTTGCAGTTGGAGGGATG GAGCAGAGAAAAATACACATGTTAGCAAGGGAGCTTTTACCAAAAAAGGTTGTTTGT ATTCACAACCCTGTCTTAACGGGTTTGGATGGAGAAGGAAAGATGAGTTCTTCAAAA GGGAATTTTATAGCTGTTGATGACTCTCCAGAAGAGATTAGGGCTAAGATAAAGAAA GCATACTGCCCAGCTGGAGTTGTTGAAGGAAATCCAATAATGGAGATAGCTAAATAC TTCCTTGAATATCCTTTAÁCCATAAAAAGGCCAGAAAAATTTGGTGGAGATTTGACA GTTAATAGCTATGAGGAGTTAGAGAGTTTATTTAAAAATAAGGAATTGCATCCAATG GATTTAAAAAATGCTGTAGCTGAAGAACTTATAAAGATTTTAGAGCCAATTAGAAAG AGATTATAA Sintetasa 25 ATGGACGAATTTGAAATGATAAAGAGAAACACATCTGAAATTATCAGCGAGGAAGAG mutante para RS incorporar m- metoxi TTAAGAGAGGTTTTAAAAAAAGATGAAAAATCTGCTCAAATAGGTTTTGAACCAAGT fenilalanina en proteínas (OMe 4-1) GGTAAAATACATTTAGGGCATTATCTCCAAATAAAAAAGATGATTGATTTACAAAAT GCTGGATTTGATATAATTATATTGTTGCCAGATTTACACGCCTATTTAAACCAGAAA SEQ SECUENCIA Notas ARNt o ID # RS GGAGAGTTGGATGAGATTAGAAAAATAGGAGATTATAACAAAAAAGTTTTTGAAGCA ATGGGGTTAAAGGCAAAATATGTTTATGGAAGTGAATTCCAGCTTGATAAGGATTAT ACACTGAATGTCTATAGATTGGCTTTAAAAACTACCTTAAAAAGAGCAAGAAGGAGT ATGGAACTTATAGCAAGAGAGGATGAAAATCCAAAGGTTGCTGAAGTTATCTATCCA ATAATGCAGGTTAATGATATTCATTATTTAGGCGTTGATGTTGACGTTGGAGGGATG GAGCAGAGAAAAATACACATGTTAGCAAGGGAGCTTTTACCAAAAAAGGTTGTTTGT ATTCACAACCCTGTCTTAACGGGTTTGGATGGAGAAGGAAAGATGAGTTCTTCAAAA GGGAATTTTATAGCTGTTGATGACTCTCCAGAAGAGATTAGGGCTAAGATAAAGAAA GCATACTGCCCAGCTGGAGTTGTTGAAGGAAATCCAATAATGGAGATAGCTAAATAC TTCCTTGAATATCCTTTAACCATAAAAAGGCCAGAAAAAT TGGTGGAGATTTGACA GTTAATAGCTATGAGGAGTTAGAGAGTTTATTTAAAAATAAGGAATTGCATCCAATG GATTTAAAAAATGCTGTAGCTGAAGAACTTATAAAGATTTTAGAGCCAATTAGAAAG AGATTATAA Sintetasa 26 ATGGACGAATTTGAAATGATAAAGAGAAACACATCTGAAATTATCAGCGAGGAAGAG mutante para RS incorporar m- metoxi TTAAGAGAGGTTTTAAAAAAAGATGAAAAATCTGCTCACATAGGTTTTGAACCAAGT fenilalanina en proteínas (OMe 4-8) GGTAAAATACATTTAGGGCATTATCTCCAAATAAAAAAGATGATTGATTTACAAAAT GCTGGATTTGATATAATTATATTGTTGGCTGATTTACACGCCTATTTAAACCAGAAA GGAGAGTTGGATGAGATTAGAAAAATAGGAGATTATAACAAAAAAGTTTTTGAAGCA ATGGGGTTAAAGGCAAAATATGTTTATGGAAGTGCATTCCAGCTTGATAAGGATTAT ACACTGAATGTCTATAGATTGGCTTTAAAAACTACCTTAAAAAGAGCAAGAAGGAGT ATGGAACTTATAGCAAGAGAGGATGAAAATCCAAAGGTTGCTGAAGTTATCTATCCA ATAATGCAGGTTAATGGACACCATTATATAGGCGTTGATGTTGCAGTTGGAGGGATG GAGCAGAGAAAAATACACATGTTAGCAAGGGAGCTTTTACCAAAAAAGGTTGTTTGT SEQ SECUENCIA Notas ARNt o ID # RS ATTCACAACCCTGTCTTAACGGGTTTGGATGGAGAAGGAAAGATGAGTTCTTCAAAA GGGAATTTTATAGCTGTTGATGACTCTCCAGAAGAGATTAGGGCTAAGATAAAGAAA GCATACTGCCCAGCTGGAGTTGTTGAAGGAAATCCAATAATGGAGATAGCTAAATAC TTCCTTGAATATCCTTTAACCATAAAAAGGCCAGAAAAATTTGGTGGAGATTTGACA GTTAATAGCTATGAGGAGTTAGAGAGTTTATTTAAAAATAAGGAATTGCATCCAATG GAT TAAAAAATGCTGTAGCTGAAGAACTTATAAAGATTTTAGAGCCAATTAGAAAG AGATTATAA Sintetasa 27 ATGGACGAATTTGAAATGATAAAGAGAAACACATCTGAAATTATCAGCGAGGAAGAG mutante para RS incorporar p-O- alil tirosina en TTAAGAGAGGTTTTAAAAAAAGATGAAAAATCTGCTTACATAGGTTTTGAACCAAGT proteínas Alilo GGTAAAATACATTTAGGGCATTATCTCCAAATAAAAAAGATGATTGATTTACAAAAT GCTGGATTTGATATAATTATATTGTTGGCTGATTTACACGCCTATTTAAACCAGAAA GGAGAGTTGGATGAGATTAGAAAAATAGGAGATTATAACAAAAAAGTTTTTGAAGCA ATGGGGTTAAAGGCAAAATATGTTTATGGAAGTGCATTCCAGCTTGATAAGGATTAT ACACTGAATGTCTATAGATTGGCTTTAAAAACTACCTTAAAAAGAGCAAGAAGGAGT ATGGAACTTATAGCAAGAGAGGATGAAAATCCAAAGGTTGCTGAAGTTATCTATCCA ATAATGCAGGTTAATTGCGCACATTATTTAGGCGTTGATGTTGCAGTTGGAGGGATG GAGCAGAGAAAAATACACAIGTTAGCAAGGGAGCTTTTACCAAAAAAGGTTGTTTGT ATTCACAACCCTGTCTTAACGGGTTTGGATGGAGAAGGAAAGATGAGTTCTTCAAAA GGGAATTTTATAGCTGTTGATGACTCTCCAGAAGAGATTAGGGCTAAGATAAAGAAA GCATACTGCCCAGCTGGAGTTGTTGAAGGAAATCCAATAATGGAGATAGCTAAATAC TTCCTTGAATATCCTTTAACCATAAAAAGGCCAGAAAAATTTGGTGGAGATTTGACA GTTAATAGCTATGAGGAGTTAGAGAGTTTATTTAAAAATAAGGAATTGCATCCAATG GATTTAAAAAATGCTGTAGCTGAAGAACTTATAAAGATTTTAGAGCCAATTAGAAAG SEQ SECUENCIA Notas ARNt o ID # RS AGATTATAA Clon de 28 ATGGACGAATTTGAAATGATAAAGAGAAACACATCTGAAATTATCAGCGAGGAAGAG aminoacil ARNt RS sintetasa para la incorporación TTAAGAGAGGTTTTAAAAAAAGATGAAAAATCTGCTGGTATAGGTTTTGAACCAAGT de p-benzoil-L- fenilalanina (p- BpaRS (HS) ) GGTAAAATACATTTAGGGCATTATCTCCAAATAAAAAAGATGATTGATTTACAAAAT GCTGGATTTGATATAATTATATTGTTGGCTGATTTACACGCCTATTTAAACCAGAAA GGAGAGTTGGATGAGATTAGAAAAATAGGAGATTATAACAAAAAAGTTTTTGAAGCA ATGGGGTTAAAGGCAAAATATGTTTATGGAAGTTCCTTCCAGCTTGATAAGGAT AT ACACTGAATGTCTATAGATTGGCTTTAAAAACTACCTTAAA AGAGCAAGAAGGAGT ATGGAACTTATAGAAGAGAGGATGAAAATCCAAAGGTTGCTGAAGTTATCTATCCAA TAATGCAGGTTAATACGAGTCATTATCTGGGCGTTGATGTTGCAGTTGGAGGGATGG AGCAGAGAAAAATACACATGTTAGCAAGGGAGCTTTTACCAAAAAAGGTTGTTTGTA TTCACAACCCTGTCTTAACGGGTTTGGATGGAGAAGGAAAGATGAGTTCTTCAAAAG GGAATTTTATAGCTGTTGATGACTCTCCAGAAGAGATTAGGGCTAAGATAAAGAAAG CATACTGCCCAGCTGGAGTTGTTGAAGGAAATCCAATAATGGAGATAGCTAAATACT TCCTTGAATATCCTTTAACCATAAAAAGGCCAGAAAAATTTGGTGGAGATTTGACAG TTAATAGCTATGAGGAGTTAGAGAGTTTATTTAAAAATAAGGAATTGCATCCAATGG ATTTAAAAAATGCTGTAGCIGAAGAACTTATAAAGATTTTAGAGCCAATTAGAAAGA GATTA Clon de 29 ATGGACGAATTTGAAATGAXAAAGAGAAACACATCTGAAATTATCAGCGAGGAAGAG aminoacil ARNt RS sintetasa para la incorporación TTAAGAGAGGTTTTAAAAAAAGATGAAAAATCTGCTACGATAGGTTTTGAACCAAGT de p-azido- fen lalanina (p- Az-PheRS(3) ) GGTAAAATACATTTAGGGCATTATCTCCAAATAAAAAAGATGATTGATTTACAAAAT GCTGGATTTGATATAATTATATTGTTGGCTGATTTACACGCCTATTTAAACCAGAAA GGAGAGTTGGATGAGATTAGAAAAATAGGAGATTATAACAAAAAAGTTTTTGAAGCA SEQ SECUENCIA Notas ARNt o ID # RS ATGGGGTTAAAGGCAAAATATGTTTATGGAAGTAATTTCCAGCTTGATAAGGATTAT ACACTGAATGTCTATAGATTGGCTTTAAAAACTACCTTAAAAAGAGCAAGAAGGAGT ATGGAACTTATAGAAGAGAGGATGAAAATCCAAAGGTTGCTGAAGTTATCTATCCAA TAATGCAGGTTAATCCGCTICATTATCAGGGCGTTGATGTTGCAGTTGGAGGGATGG AGCAGAGAAAAATACACATGTTAGCAAGGGAGCTTTTACCAAAAAAGGTTGTTTGTA TTCACAACCCTGTCTTAACGGGTTTGGATGGAGAAGGAAAGATCAGTTCTTCAAAAG GGAATTTTATAGCTGTTGA1GACTCTCCAGAAGAGATTAGGGCTAAGATAAAGAAAG CATACTGCCCAGCTGGAGTIGTTGAAGGAAATCCAATAATGGAGATAGCTAAATACT TCCTTGAATATCCTTTAACCATAAAAAGGCCAGAAAAATTTGGTGGAGATTTGACAG TTAATAGCTATGAGGAGTTAGAGAGTTTATTTAAAAATAAGGAATTGCATCCAATGG ATTTAAAAAATGCTGTAGCTGAAGAACTTATAAAGATTTTAGAGCCAATTAGASAGA GATTA Clon de 30 ATGGACGAATTTGAAATGATAAAGAGAAACACATCTGAAATTATCAGCGAGGAAGAG aminoacil ARNt RS sintetasa para la incorporación TTAAGAGAGGTTTTAAAAAAAGATGAAAAATCTGCTACGATAGGTTTTGAACCAAGT de p-azido- fenilalanina (p- Az-PheRS(6) ) GGTAAAATACATTTAGGGCATTATCTCCAAATAAAAAAGATGATTGATTTACAAAAT GCTGGATTTGATATAATTATATTGTTGGCTGATTTACACGCCTATTTAAACCAGAAA GGAGAGTTGGATGAGATTAGAAAAATAGGAGATTATAACAAAAAAGTTTTTGAAGCA ATGGGGTTAAAGGCAAAATATGTTTATGGAAGTCTGTTCCAGCTTGATAAGGATTAT ACACTGAATGTCTATAGATTGGCTTTAAAAACTACCTTAAAAAGAGCAAGAAGGAGT ATGGAACTTATAGAAGAGAGGATGAAAATCCAAAGGTTGCTGAAGTTATCTATCCAA TAATGCAGGTTAATCCTCTTCATTATGAGGGCGTTGATGTTGCAGTTGGAGGGATGG AGCAGAGAAAAATACACATGTTAGCAAGGGAGCTTTTACCAAAAAAGGTTGTTTGTA TTCACAACCCTGTCTTAACGGGTTTGGATGGAGAAGGAAAGATGAGTTCTTCAAAAG SEQ SECUENCIA Notas ARNt o ID # RS GGAATTTTATAGCTGTTGATGACTCTCCAGAAGAGATTAGGGCTAAGATAAAGAAAG CATACTGCCCAGCTGGAGTTGTTGAAGGAAATCCAATAATGGAGATAGCTAAATACT TCCTTGAATATCCTTTAACCATAAAAAGGCCAGAAAAATTTGGTGGAGATTTGACAG TTAATAGCTATGAGGAGTTAGAGAGTTTATTTAAAAATAAGGAATTGCATCCAATGG ATT AAAAAATGCTGTAGCTGAAGAACTTATAAAGATTTTAGAGCCAATTAGAAAGA GATTA Clon de 31 ATGGACGAATTTGAAATGATAAAGAGAAACACATCTGAAATTATCAGCGAGGAAGAG aminoacil ARNt RS sintetasa para la incorporación TTAAGAGAGGTTTTAAAAAAAGATGAAAAATCTGCTCTTATAGGTTTTGAACCAAGT de p-azido- fenilalanina (p- Az-PheRS (20) ) GGTAAAATACATTTAGGGCATTATCTCCAAATAAAAAAGATGATTGATTTACAAAAT GCTGGATTTGATATAATTATATTGTTGGCTGATTTACACGCCTATTTAAACCAGAAA GGAGAGTTGGATGAGATTAGAAAAATAGGAGATTATAACAAAAAAGTTTTTGAAGCA ATGGGGTTAAAGGCAAAATATGTTTATGGAAGTACTTTCCAGCTTGATAAGGATTAT ACACTGAATGTCTATAGATTGGCTTTAAAAACTACCTTAAAAAGAGCAAGAAGGAGT ATGGAACTTATAGAAGAGAGGATGAAAATCCAAAGGTTGCTGAAGTTATCTATCCAA TAATGCAGGTTAATCCGGTTCATTATCAGGGCGTTGATGTTGCAGTTGGAGGGATGG AGCAGAGAAAAATACACATGTTAGCAAGGGAGCTTTTACCAAAAAAGGTTGTTTGTA TTCACAACCCTGTCTTAACGGGTTTGGATGGAGAAGGAAAGATGAGTTCTTCAAAAG GGAATTTTATAGCTGTTGATGACTCTCCAGAAGAGATTAGGGCTAAGATAAAGAAAG CATACTGCCCAGCTGGAGTTGTTGAAGGAAATCCAATAATGGAGATAGCTAAATACT TCCTTGAATATCCTTTAACCATAAAAAGGCCAGAAAAATTTGGTGGAGATTTGACAG TTAATAGCTATGAGGAGTTAGAGAGTTTATTTAAAAKTAAGGAATTGCATCCAATGG ATTTAAAAAATGCTGTAGCTGAAGAACTTATAAAGATTTTAGAGCCAATTAGAAAGA GATTA SEQ SECUENCIA Notas ARNt o ID # RS Clon de 32 ATGGACGAATTTGAAATGATAAAGAGAAACACATCTGAAATTATCAGCGAGGA¾GAG aminoacil AKNt RS sintetasa para la incorporación TTAAGAGAGGTTTTAAAAAAAGATGAAAAATCTGCTACTATAGGTTTTGAACCAAGT de p-azido- fenilalanina (p- Az-PheRS (24) ) GGTAAAATACATTTAGGGCATTATCTCCAAATAAAAAAGATGATTGATTTACAAAAT GCTGGATT GATATAATTATATTGTTGGCTGATTTACACGCCTATTTAAACCAGAAA GGAGAGTTGGATGAGATTAGAAAAATAGGAGATTATAACAAAAAAGTTTTTGAAGCA ATGGGGTTAAAGGCAAAATATGTTTATGGAAGTTCGTTCCAGCTTGATAAGGATTAT- ACACTGAATGTCTATAGAT1GGCTTTAAAAACTACCTTAAA&AGAGCAAGAAGGAGT ATGGAACTTATAGAAGAGAGGATGAAAATCCAAAGGTTGCTGAAGTTATCTATCCAA TAATGCAGGTTAATCCACTGCATTATCAGGGCGTTGATGTTGCAGTTGGAGGGATGG AGCAGAGAAAAATACACATGTTAGCAAGGGAGCTTTTACCAAAAAAGGTTGTTTGTA TTCACAACCCTGTCTTAACGGGTTTGGATGGAGAAGGAAAGATGAGTTCTTCAAAAG GGAATTTTATAGCTGTTGATGACTCTCCAGAAGAGATTAGGGCTAAGATAAAGAAAG CATACTGCCCAGCTGGAGTTGTTGAAGGAAATCCAATAATGGAGATAGCTAAATACT TCCTTGAATATCCTTTAACCATAAAAAGGCCAGAAAAATTTGGTGGAGATTTGACAG TTAATAGCTATGAGGAGTTAGAGAGTTTATTTAAAAATAAGGAATTGCATCCAATGG ATTTAAAAAATGCTGTAGCTGAAGAACTTATAAAGATTTTAGAGCCAATTAGAAAGA GATTA Leucil ARNt- 33 ATGAGCGATT TCAGGATAAT TGAGGAGAAG TGGCAGAAGG CGTGGGAGAA sintetasa de RS archaeoglobus fulgidus (AFLRS) GGACAGAATT TTTGAGTCCG ATCCT ATGA GAAGGAGAAG TTTTTTCTCA CAATTCCCTA TCCTTACCTT AATGGAAATC TTCACGCAGG TCACACGAGA ACCTTCACAA TTGGCGATC-C CTTCGCCAGA TACATGAGAA TGAAGGGCTA CAACGTTCTC TTTCCCCTCG GCTTTCATGT TACGGGCACC CCAATCATTG GCCTTGCGGA GCTCATAGCC AAGAGGGACG AGAGGACGAT AGAGGTTTAC SEQ SECÜENCIA Notas ARNt o ID # RS ACCAAATACC ATGACGTTCC GCTGGAGGAC TTGCTTCAGC TCACAACTCC AGAGAAAATC" GTTGAGTACT TCTCAAGGGA GGCGCTGCAG GCTTTGAAGA GCATAGGCTA CTCCATTGAC TGGAGGAGGG TTTTCACCAC AACCGATGAA GAGTATCAGA GATTCATCGA GTGGCAGTAC TGGAAGCTCA AGGAGCTTGG CCTGATTGTG AAGGGCACCC ACCCCGTCAG ATACTGCCCC CACGACCAGA ATCCTGTTGA AGACCACGAC CTTCTCGCTG GGGAGGAGGC AACTATTGTT GAATTTACCG TTATAAAGTT CAGGCTTGAA GATGGAGACC TCATTTTCCC CTGTGCAACT CTCCGTCCCG AAACCGTGTT TGGCGTCACG AACATCTGGG TAAAGCCGAC AACCTACGTA ATTGCCGAGG TGGATGGGGA AAAGTGGTTT GTGAGCAAAG AGGCTTACGA GAAGCTCACC TACACGGAGA AAAAAGTCAG GCTGCTGGAG GAGGTTGATG CGTCGCAGTT CTTCGGCAAG TACGTCATAG TCCCGCTGGT AAACAGAAAA GTGCCAATTC TGCCTGCAGA GTTTGTTGAC ACCGACAACG CAACAGGAGT TGTGATGAGC GTTCCCGCAC ACGCTCCTTT TGACCTGGCT GCCATTGAGG ACTTGAAGAG AGACGAGGAA ACGCTGGCGA AGTACGGAAT TGACAAAAGC GTTGTAGAGA GCATAAAGCC AATAGTTCTG ATTAAGACGG ACATTGAAGG TGTTCCTGCT GAGAAGCTAA TAAGAGAGCT TGGAGTGAAG AGCCAGAAGG ACAAGGAGCT GCTGGATAAG GCAACCAAIGA CCCTCTACAA GAAGGAGTAC CACACGGGAA TCATGCTGGA CAACACGATG AACTATGCTG GAATGAAAGT TTCTGAGGCG AAGGAGAGAG TTCATGAGGA TTTGGTTAAG CTTGGCTTGG GGGATGTTTT CTACGAGTTC AGCGAGAAGC CCGTAATCTG CAGGTGCGGA ACGAAGTGCG TTGTTAAGGT TGTTAGGGAC CAGTGGTTCC TGAACTACTC CAACAGAGAG TGGAAGGAGA AGGTTCTGAA TCACCTTGAA AAGATGCGAA TCATCCCCGA CTACTACAAG GAGGAGTTCA SEQ SECUENCIA Notas ARNt o ID # RS GGAACAAGAT TGAGTGGCTC AGGGACAAGG CTTGTGCCAG AAGGAAGGGG CTTGGAACGA GAATTCCGTG GGATAAGGAG TGGCTCATCG AGAGCCTTTC AGACTCAACA ATCTACATGG CCTACTACAT CCTTGCCAAG TACATCAACG CAGGATTGCT CAAGGCCGAG AACATGACTC CCGAGTTCCT CGACTACGTG CTGCTGGGCA AAGGTGAGGT TGGGAAAGTT GCGGAAGCTT CAAAACTCAG CGTGGAGTTA ATCCAGCAC-A TCAGGGACGA CTTCGAGTAC TGGTATCCCG TTGACCTAAG AAGCAGTGGC AAGGACTTGG TTGCAAACCA CCTGCTCTTC TACCTCTTCC ACCACGTCC-C CATTTTCCCG CCAGATAAGT GGCCGAGGGC AATTGCCGTA AACGGATACG TCAGCCTTGA GGGCAAGAAG ATGAGCAAGA GCAAAGGGCC CTTGCTAACG ATGAAGAGGG CGGTGCAGCA GTATGGTGCG GATGTGACGA GGCTCTACAT CCTCCACGCT GCAGAGTACG ACAGCGATGC GGACTGGAAG AGCAGAGAGG TTGAAGGGCT TGCAAACCAC CTCAGGAGGT TCTACAACCT CGTGAAGGAG AACTACCTGA AAGAGGTGGG AGAGCTAACA ACCCTCGACC GCTGGCTTGT GAGCAGGATG CAGAGGGCAA TAAAGGAAGT GAGGGAGGCT ATGGACAACC TGCAGACGAG GAGGGCCGTG AATGCCGCCT TCTTCGAGCT CATGAACGAC GTGAGATGGT ATCTGAGGAG AGGAGGTGAG AACCTCGCTA TAATACTGGA CGACTGGATC AAGCTCCTCG CCCCCTTTGC TCCGCACATT TGCGAGGAGC TGTGGCACTT GAAGCATGAC AGCTACGTCA GCCTCGAAAG CTACCCAGAA TACGACGAAA CCAGGGTTGA CGAGGAGGCG GAGAGAATTG AGGAATACCT CCGAAACCTT GTTGAGGACA TTCAGGAAAT CAAGAAGTTT GTTAGCGATG CGAAGGAGGT TTACATTGCT CCCGCCGAAG ACTGGAAGGT TAAGGCAGCA AAGGTCGTTG CTGAAAGCGG GGATGTTGGG GAGGCGATGA AGCAGCTTAT GCAGGACGAG GAGCTTAGGA AGCTCGGCAA SEQ SECUENCIA Notas ARNt o ID # RS AGAAGTGTCA AATTTCGTCA AGAAGATTTT CAAAGACAGA AAGAAGCTGA TGCTAGTTAA GGAGTGGGAA GTTCTGCAGC AGAACCTGAA ATTTATTGAG AATGAGACCG GACTGKAGGT TATTCTTGAT ACTCAGAGAG TTCCTGAGGA GAAGAGGAGG CAGGCAGTTC CGGGCAAGCC CGCGATTTAT GTTGCTTAA Leucil ARNt- 34 GTGGATATTG AAAGAAAATG GCGTGATAGA TGGAGAGATG CTGGCATATT sintetasa de RS metanobacterium thermoautotrop i TCAGGCTGAC CCTGATGACA CAGAAAAGAT ATTCCTCACA GTCGCTTACC cum (MtLRS) CCTACCCCAG TGGTGCGATG CACATAGGAC ACGGGAGGAC CTACACTGTC CCTGATGTCT ATGCACGGTT CAAGAGGATG CAGGGCTACA ACGTCCTGTT TCCCATGGCC TGGCATGTCA CAGGGGCCCC TGTCATAGGG ATAGCGCGGA GGATTCAGAG GAAGGATCCC TGGACCCTCA AAATCTACAG GGAGGTCCAC AGGGTCCCCG AGGATGAGCT TGAACGTTTC AGTGACCCTG AGTACATAGT TGAATACTTC AGCAGGGAAT ACCGGTCTGT TATGGAGGAT ATGGGCTACT CCATCGACTG GAGGCGTGAA TTCAAAACCA CGGATCCCAC CTACAGCAGG TTCATACAGT GGCAGATAftG GAAGCTGAGG GACCTTGGCC TCGTAAGGAA GGGCGCCCAT CCTGTTAAGT ACTGCCCTGA ATGTGAAAAC CCTGTGGGTG ACCATGACCT CCTTGAGGC-T GAGGGGGTTG CCATAAACCA GCTCACACTC CTCAAATTCA AACTTGGAC-A CTCATACCTG GTCGCAGCCA CCTTCAGGCC CGAGACAATC TATGGGGCCA CCAACCTCTG GCTGAACCCT GATGAGGATT ATGTGAGGGT TGAAACAGGT GGTGAGGAGT GGATAATAAG CAGGGCTGCC GTGGATAATC TTTCACACCA GAAACTGGAC CTCAAGGTTT CCGGTGACGT CAACCCCGGG GACCTGATAG GGATGTGCGT GGAGAATCCT GTGACGGGCC AGGAACACCC CATACTCCCG GCTTCCTTCG TTGACCCTGA ATATGCCACA GGTGTTGTGT TCTCTGTCCC TGCACATGCC CCTGCAGACT TCATAGCCCT SEQ SECUENCIA Notas ARNt o ID # RS TGAGGACCTC AGGACAGACC ATGAACTCCT TGAAAGGTAC GGTCTTGAGG ATGTGGTTGC TGATATTGAG CCCGTGAATG TCATAGCAGT GGATGGCTAC GGTGAGTTCC CGGCGGCCGA GGTTATAGAG AAATTTGGTG TCAGAAACCA GGAGGACCCC CGCCTTGAGG ATGCCACCGG GGAGCTATAC AAGATCGAGC ATGCGAGGGG TGTTATGAGC AGCCACATCC CTGTCTATGG TGGTATGAAG GTCTCTGAGG CCCGTGAGGT CATCGCTGAT GAACTGAAGG ACCAGGGCCT TGCAGATGAG ATGTATGAAT TCGCTGAGCG ACCTGTTATA TGCCGCTGCG GTGGCAGGTG CGTTGTPAGG GTCATGGAGG ACCAGTGGTT CATGAAGTAC TCTGATGACG CCTGGAIGGA CCTCGCCCAC AGGTGCCTCG ATGGCATGAA GATAATACCC GAGGAGGTCC GGGCCAACTT TGAATACTAC ATCGACTGGC TCAATGACTG GGCATGTTCA AGGAGGATAG GCCTTGGAAC AAGGCTGCCC TGGGATGAGA GGTGGATCAT CGAACCCCTC ACAGACTCAA CAATCTACAT GGCATATTAC ACCATCGCAC ACCGCCTCAG GGAGATGGAT GCCGGGGAGA TGGACGATGA GTTCTTTGAT GCCATATTCC TAGATGATTC AGGAACCTTT GAGGATCTCA GGGAGGAATT CCGGTACTGG TACCCCCTTG ACTGGAGGCT CTCTGCAAAG GACCTCATAG GCAATCACCT GACATTCCAT ATATTCCACC ACTCAGCCAT ATTCCCTGAG TCAGGGTGGC CCCGGGGGGC TGTGGTCTTT GGTATGGGCC TTCTTGAGGG CAACAAGATG TCATCCTCCA AGGGCAACGT CATACTCCTG AGGGATGCCA TCGAGAAGCA CGGTGCAGAC GTGGTGCGGC TCTTCCTCAT GTCCTCAGCA GAGCCATGGC AGGACTTTGA CTGGAGGGAG AGTGAGGTCA TCGGGACCCG CAGGAGGATT GAATGGTTCA GGGAATTCGG AGAGAGGGTC TCAGGTATCC TGGATGGTAG GCCAGTCCTC AGTGAGGTTA CTCCAGCTGA ACCTGA AGC TTCATTGGAA GGTGGATGAT GGGTCAGCTG SEQ SECUENCIA Motas ARHt O ID # RS AACCAGAGGA TACGTGAAGC CACAAGGGCC CTTGAATCAT TCCAGACAAG AAAGGCAGTT CAGGAGGCAC TCTATCTCCT TAAAAAGGAT GTTGACCACT ACCTTAAGCG TGTTGAGGGT AGAGTTGATG ATGAGGTTAA ATCTGTCCTT GCAAACGTTC TGCACGCCTG GATAAGGCTC ATGGCTCCAT TCATACCCTA CACTGCTGAG GAGATGTGGG AGAGGTATGG TGGTGAGGGT TTTGTAGCAG AAGCTCCATG GCCTGACTTC TCAGATGATG CAGAGAGCAG GGATGTGCAG GTTGCAGAGG AGATGGTCCA GAATACCGTT AGAGACATTC AGGAAATCAT GAAGATCCTT GGATCCACCC CGGAGAGGGT CCACATATAC ACCTCACCAA AATGGAAATG GGATGTGCTA AGGGTCGCAG CAGAGGTAGG AAAACTAGAT ATGGGCTCCA TAATGGGAAG GGTTTCAGCT GAGGGCATCC ATGATAACAT GAAGGAGGTT GCTGAATTTG TAAGGAGGAT CATCAGGGAC CTTGGTAAAT CAGAGGTTAC GGTGATAGAC GAGTACAGCG TACTCATGGA TGCATCTGAT TACATTGAAT CAGAGGTTGG AGCCAGGGTT GTGATACACA GCAAACCAGA CTATGACCCT GAAAACAAGG CTGTGAATGC CGTTCCCCTG AAGCCAGCCA TATACCTTGA ATGA TyxRS mutante 35 MDEFE IKRNTSEIISESELREVLKKDEKSAQIGFEPSGKIHLGHYLQIKKMIDLQN (LWJ16) RS AGFDIIILIADLHAYLNQKGELDEIRKIGDYNKKVFEAMGLKA YVYGSTFQLDKDY TLNVYRIALKTTLKRARRSMELIAREDEHPKVAEVIYPI QVNAIHYPGVDVAVGG EQR IHMLARELLPKKWCIHNPVLTGLDGEGKMSSSKGNFIAVDDSPEEIRAKI K AYCPAGWEGNPIMEIAKYFLEYPLTI RPEKFGGDLTVSSYEELESLFKNKELHPM DLKNAVAEELI ILEPIR RL TyrRS (SS12) 36 MDEFEMIKRNTSEIISEEELREVLK DE SAQIGFEPSGKIHLGHYLQIKKMIDLQN RSV AGFDIIILLADLHAYLNQKGELDEIRKIGDY KKVFEAMGLKA YVYGSTFQLDKDY SEQ SECUENCIA Notas ARNt o ID # RS TLWYRLALKTTLKEARRSKELIAREDENE VAEVIYPIMQV AIHYQGVDVV/GGM EQRKIHMLARELLPKKWCIHNPVLTGLDGEGKMSSSKGNFIAVDDSPEEIRAKIKX AYCPAGWEGNPIMEIAKYFLEYPLTI p-iPr-PheRS 37 MDEFEMIKRNTSEIISEEEIREVLKKDE SAGIGFEPIGKIHLGHYLQIKKMIDLQN RS AGFDIIILLADLHAYIiNQKGELDEIRKIGDYNKKVFEAMGLKAKCAYGSPFQLDKDY TL VYRLALKTTLJRARRSMELIAREDFNPKVAEVIYPIMQVNGYHYLGVDVAVGGM EQRKIHMLARELLP WCIHNPVLTGLDGEGKMSSSKGNFIAVDDSPEEIRA IKK AYCPAGWEGNPIMEIAKYFLEYPLTIKRPEKFGGDLTV SYEELESLF ELHPM DLKUAVAEELIKILEPIRKRL p-NH2-PlieRS (1) 38 MDEFEMI RNTSEIISEEELREVLKKDEKSAOIGFEPSGKIHLGHYLQIKKMIDLQN AGFDIIILLADLHAYLNQKGELDEIRKIGDYNKKVFEAI^GLKA YVYGSPFQLDKDY TLNVYRLALKTTLKRARRSMELIAREDENPKVAEVIYPIMOVNCSHYYGVDVAVGGM EQRKIHMLARELLP KVVCIHNPVLTGLDGEGKMSSSKGNFIAVDDSPEEIRA IKK AYCPAGWEGNPIMEIA YFLEYPLTIKRPEKFGGDLTVNSYEELESLFK KELHPM DLKNAVAEELIKILEPIRKRL p-N¾-PheRS(2) 39 MDEFEMI KN SEIISEEEIiREVLK DE SATIGFEPSGKIHLGHYLQIKKMIDLQN RS AGFDIIILLADLHAYLNQKGELDEIRKIGDYNKKVFEAMGLKAKYVYGSTFQLDKDY TLNVYRLALKTTLKRARRSMELIAREDENPKVAEVIYPIMQVHPLHYAGVDVAVGGM EQRKIHMLARELLPK WCIHNPVLTGLDGEGKMSSSKGNFIAVDDSPEEIRA IKK AYCPAGWEGNPIMEIA YFLEYPLTIKRPEKFGGDLTVNSYEELESLFKNKELHP DLKUAVAEELIKILEPIRKRL p-NH2-PheRS (3a) 40 mEFEMIKSHTSEIISEEELREVLKKDEKSAHIGFEPSGKIHLGHYLQIKKMIDLQN RS AGFDIIILIADLHAYLNQKGELDEIRKIGDYNK VFEAMGLKAKYVYGSEFQLD DY SEQ SECUENCIA Notas AR t o ID # RS TLNVYRLAL TTLKRARRSMELIAREDENPKVAEVIYPIMQVWREHYLGVDVAVGGM EQRKIHMLARELLPKKVVCIHNPVLTGLDGEGKMSSSKGNFIAVDDSPEEIRAKIKK AYCPAG EGNPIMEIAKYFLEYPLTIKRPEKFGGDLTVNSYEELESLF NKELHPM DLKNAVAEELIKILEPIRKRL p- H2-PlieRS(3b) 41 SIEFEMIKR TSEIISEEELREVLKKDE SAQIGFEPSGKIHLGHYLQIKKMIDLQN RS AGFDIIILLADLHAYIJflQKC-ELDEIRKIGDYNKKVFEA GLKAKYVYGSPFQLDKDY TLNVYRLALKTTLKRARRSKELIAREDENPYVAEVIYPIMQVNQSHYDGVDVAVGGM EQRKIHMLARELLPKKVVCIHNPVLTGLDGEGKMSSSKGNFIAVDDSPEEIRAKIKK AYCPAGWEGNPIMEIAKYFLEYPLTIKRPEKFGGDLTVNSYEELESLFKNKELHPM DLKNAVAEELIRILEPIRKRL O-Alil-TyrRS (1) 42 DEFE IKRNTSEIISEEELREVLKKDEKSASIGFEPSGKIHLGHYLQIKKMIDLQN RS AGFDIIILLADLHAYLMQKGELDEIRKIGDY KKVFEAIJGLKAKYVYGSTFQLDKDY TLNVYRLALKTTLKRARRSMELIAREDENPKVAEVIYPIMQVNTYHYAGVDVAVGG EQRKIHMl-AREIjLPKKWCIHNPVLTGLDGEGKIlSSSKGNFIAVDDSPEEIRA IKK AYCPAGWEGNPIMEIAKYFLEYPLTIKRPEKFGGDLTVHSYEELESLFKN ELHPM DLKNAVAEELIKILEPIRKRL O-Alil-TyrRS (3) 43 MDEFEMIKRNTSEIISEEELREVLKKDEKSAPIGFEPSGKIHLGHYLQIKKMIDLQN RS AGFDIIILLADLHAYLNQKGELDEIRKIGDYNKKVFEAMGLKAKYVYGS FQLD DY TIWYRLALKTTLKRARRS ELIAREDENPKVAEVIYPIMQVHNTHYGGVDVAVGGM EQRKIHMLARELLPKKVYCIEMPVLTGLDGEGKMSSSKGNFIAVDDSPEEIRAKIKK AYCPAGWEGNPIMEIAKYFLEYPLTIKRPEKFGGDLTV SYEELESLFKNKELHPM DLKNAVAEELIKILEPIRKRL O-Alil-TyrRS (4) 44 DEFEMIKRN SEIISEEELREVLWDEKSATIGFEPSGKIHLGHYLQIKKMIDLQN RS SEQ SECUENCIA Hotas ARNt o ID # RS AGFDIIILLADLHAYlANQKGELDEIRKIGDYMKKVFEAMGL AKYVYGSHFQtDKDY TLNVYRLALKTTLKRARRSMELIAREDENP VAEVIYPIMQV QTHYEGVDVAVGGM EQRKIHMLARELLPK WCIHNPVLTGLDGEGKMSSSKGNFIAVDDSPEEIRA IK AYCPAGWEGNPIMEIAKYFLEYPLTIKRPEKFGGDLTVNSYEELESLFKNKELHPM DL NAVAEELIKILEPIRKRL p-Br-PheRS 45 I IEFEMIKRNTSEIISEEELREVL'KKDEKSHRIGFEPSGKIHLGHYLQIK MIDLQN RS AGFDIIILLADLHAYLNQ GELDEIRKIGDYN KVFEAMGLKA YVYGSKFQLDKDY TL VYRLALKTTL RARRSMELIAREDENP VAEVIYPI QVNPCHYHGVDVAVGGM EQRKIHMLARELLPKKWCIHNPVLTGLDGEGKMSSSKGNFIAVDDSPEEIRAKIKK AYCPAGWEGNPIMEIAKYFLEYPLTI RPEYFGGDLTVNSYEELESLFKNKELHPM DLKNAVAEELIKILEPIRKRL p-Az-PheRS (1) 46 DEFEMIKRNTSEIISEEELREVLKKDEKSAAIGFEPSGKIHLGHYLQIKKMIDLQN RS AGFDIIILLADLHAYLNQKGELDEIRKIGDYNKKVFEAMGLKAKYVYGSRFQLDKDY TIÍNVYRIJ JKTTLKRARRSMELIAREDENPKVAEVIYPIMQVISIVYHYDGVDVAVGGM EQRKIHMLARELLPKKWCIHNPVLTGLDGEGK SSSKGNFIAVDDSPEEIRAKIKK AYCPAGWEGNPIMEIAKYFLEYPLTIKRPEKFGGDLTVNSYEELESLFKNYELHPM DLKNAVAEELIKILEPIRKRL p-Az-PheRS (3) 47 MEFEMIKRNTSEIISEEELREVLKKDEKSAGIGFEPSGKIHLGHYLQIKKMIDLQN RS AGFDIIILLADIJHAYIJNQKGELDEIRKIGDYNKKVFEHMGLKAKYVYGSTFQLDKDY TIÍWYRLALKTTLKRARRSMELIAREDENPKVAEVIYPI QVNTYYYLGVDVAVGGM EQRKIHMIARELLPKKWCIHNPVLTGLDGEGK SSSKGNFIAVDDSPEEIRAKIKK AYCPAGWEGNPIMEIAKYELEYPLTIKRPEKFGGDLTVNSYEELESLFKNKELHPM DLKNAVAEELIKILEPIRKRL SEQ SECUENCIA Notas ARNt o ID # RS p-Az-PheRS (5) 48 DEFEMIKRNTSEIISEEELREVL IDEKSALIGFEPSGKIHLGHYLQIKKMIDLQN RS AGFD11ILLADLHAYLNQKGELDEIRKIGDYNKKVFEA GLKAKYVYGSPFQLDKDY TIJNVYRLALKTTL RARRSMELIAREDENPKVAEVIYPIMQVNQIHSSGTOVAVGGM EQRKIHMLARELLPKKWCIHHPVLTGLDGEGK SSSKGNFIAVDDSPEEIRA I K AYCPAGWEGNPI EIAKYFLEYPLTI RPEXFGGDLTVNSYEELESLFKNKELHPM DLK JAVAEELIKIIiEPIR RL Sintetasa 49 MDEFEMIKRNTSEIISEEELREVLKKDEKSADIGFEPSGKIHLGHYLQIK MIDLQN imitante para RS incorporar m- acil AGFDIIILLADLHAYLNQKGELDEIRKIGDYNKKVFEA GL AKYVYGSEFQLDKDY fenilalanina en proteínas (Cetona 3-4) TIJWYRLAL TTnKKARRSMELIAREDENPKVAEVIYPIMQWGMHYQGVDVAVGGM EQR imiLARELLPKK CIHNPVLTGLDGEGKMSSSKGNFIAVDDSPEEIRAKIKK AYCPAGWEGNPIMEIAKYFLEYPLTI RPE FGGDLTVNSYEELESLF NKELHPM DLKNAVAEELIKILEPIRKRL* Sintetasa 50 MDEFEMIKRNTSEIISEEELREVLKKDE SAYIGFEPSGKIHLGHYLQIKKMIDLQN imitante para RS incorporar m- acil AGFDIIILLADLHAYLNQKGELDEIRKIGDYN VFEAMGLKA YVYGSLFQLDKDY fenilalanina en proteínas (Cetona 3-7) TIJWYRLALKTTLKRARRSKELIAREDENP VAEVIYPIMQVNDIHYTGVDVAVGGM EQRKIHMLARELLPK WCIHHPVLTGLDGEGKMSSSKGNFIAVDDSPEEIRA IK AYCPAGVVEGNPIMEIAKYFLEYPLTIKRPEKFGGDLTVNSYEELESLFKNKELHPM DLKNAVAEELIKILEPIRKRL# Sintetasa 51 MDEFEMIK NTSEIISEEELREVLKKDE SALIGFEPSGKIHLGHYLQIK MIDLQN imitante para RS incorporar m- acil AGFDIIILLTDL AYLNQKGELDEIR IGDYNKKVFEAMGLKAKYVYGSEFQLDKDY fenilalanina en proteínas (Cetona 4-1) TL VYRLALKTTL RARRSMELIAREDEMPKVAEVIYPIMQVMDIHYLGVDVAVGG EQRKIHMLARELLPK WCIHNPVLTGLDGEGKMSSSKGNFIAVDDSPEEIRA IKK AYCPAGVÍEGNPIMEIA YFLEYPLTIKRPEKFGGDLTWSYEELESLFKN ELHPM SEQ SECUENCIA Notas ARNt o ID # RS DLKNAVAEELIKILEPIRKRL# Sintetasa 52 IVTOEFEMIKRN SEIISEEELREVLKKDERSALIGFEPSGKIHLGHYLQIKKMIDLQN mutante para RS incorporar m- acil AGFDIIILLTDLKAYLHQKGELDEIR IGDYIJ KVFEAMGLKA YVYGSEFQLDKDY fenilalanina en proteínas (Cetona 5-4) TLWVYRIiALKTTLKRARRSMELIAREDENP VAE IYPIMSVNVIHYLGVDVWGGM EQRKIHMLARELLPKKWCIHNPVLTGLDGEGKMSSSKGNFIAVDDSPEEIRA IKK AYCPAGWEGNPIMEIA YFLEYPLTIKRPEKFGGDLTVNSYEELESLFKNKELHPM DLKNAVAEELIKILEPIRYRL# Sintetasa 53 MDEFEMI imTSEIISEEELREVL DE SALIGFEPSG IHLGHYLQIKKMIDLQN mutante para RS incorporar m- acil AGFDIIILLPDLSAYIJJQKGELDEIRKieDYNKKVFEAMGLAKYVyGSEFQLDKDY enilalanina en proteínas (Cetona 6-8) TLNVYRLALKTTLKRARRSMELIAREDENP VAEVIYPIMQ DIHYLGVDVAVGGM EQR IHMLARELLPKKWCIHNPVLTGLDGEGKMSSSKGNFIAVDDSPEEIRA IKK AYCPAGWEGNPIMEIAKYFLEYPLTIKRPEKFGGDLTV SYEELESLFKNKELHPM DLKNAVAEELIXILEPIRKRL# Sintetasa 54 MDEFEMIKRWTSEIISEEELREVLKKDEKSATIGFEPSGKIHLGHYLQIKKMIDLQN mutante para RS incorporar m- metoxi AGFDIIILLADLHAYLNQKGELDEIR IGDYNKKVFEA GLKA YVYGSEFQLDKDY fenilalanina en proteínas (OMe 1-6) Tl^rVYRIJU.KTTLKRARRSMELIAREDENPKVAEVIYPIMQ'OTDIHYAGVDVAVGGM EQRKIHMLARELLPKKWCIHNPVLTGLDGEGKMSSSKGNFIAVDDSPEEIRAKIKK AYCPAGWEGNPI EIAKYFLEYPLTIKRPEKFGGDLTVNSYEELESLFKNKELHPM DLKNAVAEELIKILEPIRKRL* Sintetasa 55 MDEFE I RNTSEIISEEELREVLK DEKSATIGFEPSGKIHLGHYLQIKKMIDLQN mutante para RS incorporar m- metoxi AGFDIIILLSDLPAYLNQKGELDEIRKIGDYNK VFEAMGLKA YVYGSEFQLDKDY fenilalanina en proteínas (OMe 1-8) TLNVYRLALKTTLKRARRS^LIAREDENP VAEVIYPI Q DIHYLGVDVAVGGM EQR IHMLARELLP K CIHNPVLTGLDGEGKMSSSKGNFIAVDDSPEEIRA IK - SEQ SECUENCIA Notas ARNt o ID # RS AYCPAG EGWPI EIA YFLEYPLTIKRPE FGGDLTVNSYEELESLF NIELHPM DLKNAVAEELIKILEPIRKRL# Sintetasa 56 MDEFEMI RNTSEIISEEELREVLKKDEKSATIGFEPSGKIHLGHYLQIKKMIDLQN mutante para RS incorporar m- metoxi AGFDIIILLADLHAYLWQKGELDEIRKIGDYEJKKVFEAMGL A YVYGSMFQLD DY fenilalanina en proteínas (OMe 2-7) TLÍNMU-ALKTTLKRARRSMELIAREDENPKVAEVIYPIMQVNSSHYDGVDVAVGGM EQRKIAIÍLARELLPKKWCIHKPVLTGLDGEGKMSSSKGNFIAVDDSPEEITÍAKTKK: AYCPAGWEGNPIMEIAKYFLEYPLTIKRPEKFGGDLTVNSYEELESLFKNKELHPM DLKNAVAEELIKILEPIRKRL# Sintetasa 57 MDEFEMIKRNTSEIISEEELREVLKKDE SAQIGFEPSGKIHLGHXXQIKKMIDLQN mutante para RS incorporar m- metoxi AGFDIIILLPDLHAYLNQKGELDEIRKIGDYNK VFEA GLKAKYVYGSEFQLDKDY fenilalanina en proteínas TIJJVYRLALKTTLKRARRSMELIAREDENPKVAEVIYPIMQVHDIHYLGVDVDVGGM OMe 4-1 EQR IHMLARELLPKKWCIHNPVLTGIJÍGEGKMSSSKGNFIAVDDSPEEIRAKIKK AYCPAGVVEGNPIMEIAKYFLEYPLTIKRPEKFGGDLTV SYEELESLFIMELHPM DLKNAVAEELIKILEPIRRL# Sintetasa 58 DEFE I RNTSEIISEEELREVLKKDEKSAHIGFEPSGKIHLGHY1QIKMIDLQN mutante para RS incorporar m- metoxi AGFDIIILLADLHAYLNQKGELDEIRKIGDY KKVFEAMGLKA YVYGSAFQLD DY fenilalanina en proteínas TMnrYRLALKTTLKRARRSMELIAREDENPKVAEVIYPIMQWGHHYIGVDVAVGGM OMe 4-8 EQR imiiAREliLPKKWCIÍDIPVLTGLDGEGKMSSSKGNFIAVDDSPEEIRA IK AYCPAGWEGWPIMEIA YFLEYPLTIKRPE FGGDIiTV SYEEIiESLFKNKELHPM DLKNAVAEELIKILEPIRKRLtf Sintetasa 59 MDEFE IKRNTSEIISEEEL EVLKKDE SAYIGFEPSGKIHLGHYLQIKKMIELQN mutante para RS incorporar p-0- alil tirosina en AGFDIIILIiADLHAYLNQKGELDEIRKIGDYNKVFEAMGLKAKYVYGSAFQLDKDY proteínas T].NVYRLALKTTLKRARRSMELIAREDEKPKVAEVIYPIMQVHCAHYLGVDVAVGGM Alilo SEQ SECUENCIA Notas ARNt o ID # RS EQRKIHMLARELLPK WCIHNPVIiTGLDGEGKMSSSKGNFIAVDDSPEEIRAKIKK AYCPAGVVEGNPIMEIAKYFLEYPLTIKRPEKFGGDLTVNSYEELESLFKNKELHPM DLKNAVAEELIKILEPIRKRL# 60 MDEFEMI RNTSEIISEEELREVLKKDE SAGIGFEPSGKIHLGHYLQI K IDLQN Aminoacil ARNt RS AGFDIIILLADLHAYLNQKGELDEIRKIGDYHKKVFEAMGLKA YVYGSSFQLDKDY sintetasa para TLNVYRLALKTTLKRARRSMELIAREDENPKVAEVIYPIMQTOTSHYLGVDVAVGGM la incorporación EQRKIHMLARELLP WCIHNPVLTGLDGEG MSSSKGNFIAVDDSPEEIRA IKK de p-benzoil-L- AYCPAGWEGNPIMEIAKYFLEYPLTIKRPEKFGGDLTVNSYEELESLFKNKELHPM fenilalaniña DLKNAVAEELIKILEPIRKRL p-BpaRS (H6) 61 DEFEMIKPJITSEIISEEELREVLKKDE SATIGFEPSGKIHLGHYLQIKKMIDLQN Aminoacil ARNt RS AGFDIIILLADLHAYLNQ GELDEIRKIGDYN VFEAMGLKA YVYGSNFQLD DY sintetasa para TLNVYRLALKTTLKRARRSMELIAREDENP VAEVIYPIMQVNPLHYQGVDVAVGGM la incorporación EQRKIHMLARELLPKKVVCIH1IPVLTGLDGEGKMSSSKGNFIAVDDSPEEIRA IKK de p-azido AYCPAGWEGNPIMEIA YFLEYPLTI PE FGGDLTVNSYEELESLF NKELHPM fenilalanina DLKNAVAEELIKILEPIRKRL p-Az-PheRS(3) 62 MDEFEMIKRNTSEIISEEELREVLK DE SATIGFEPSGKIHLGHYLQIKKMIDLQN Aminoacil ARNt RS AGFDIIILLADLHAYMIQKGELDEIR IGDYN KVFEAMGLA YVYGSSFQLDKDY sintetasa para TLWYRLALKTTLKRARRSMELIAREDENP VAEVIYPIMQWPLHYQGVDVAVGGM la incorporación EQRKIHMLARELLPKKWCIHNPVLTGLDGEGKMSSSKGNFIAVDDSPEEIRAKIKX de p-azido AYCPAGVVEGNPIMEIAKYFLEYPLTIKRPEKFGGDLTVNSYEELESLFKNKELHPM fenilalanina DLKNAVAEELIKILEPIRKRL p-Az-P eRS (6) 63 DEFEMIKRNTSEIISEEELREVLKKDEKSALIGFEPSGKIHLGHYLQI KMIDLQN Aminoacil ARNt RS HGFDIIILIADLHAYLMQKGELDEIRKIGDYNKKVFEAMGLKAKYVYGSTFQLDKDY sintetasa para SEQ SECUENCIA Notas ARNt o ID # RS TLNVYRIALKTTL RAERSMELIAREDENPKVAEVIYPIMQWPVHYQ6VDVAVGGM la incorporación EQRKIHMLARELLPKKWCIHNPVLTGLDGEGKMSSSKGNFIAVDDSPEBIRAKIKK de p-azido AYCPAGWEGNPIMEIAKYFLEYPLTIKRPEKFGGDLTVNSYEELESLFKNKELHPM fenilalanina DLKNAVAEELIKILEPIRKRL p-Az-PheRS (20) 64 MDEFE IKRNTSEIISEEELREVLKKDEKSATIGFEPSGKIHLGHYLQIKK IDLQN Aminoacil ARNt RS AGFDIIILLADLHAYLNQ GELDEIRKIGDYNICKVFEAMGL AKYVYGSSFQLDKDY sintetasa para TLNVYRIJU-KTTLKRARRSMELIAREDENPKVAEVIYPIMQWPSHYQGVIVAVGGM la incorporación EQRKIHMLARELLPKKWCIHNPVLTGLDGEGKMSSS GNFIAVDDSPEEIRAKI K de p-azido AYCPAGWEGNPIMEIA YPLEYPLTI RPEKFGGDD VtJSYEELESLP WELHPM £enilnl niña DLKNAVAEELIKILEPIRKRL p-Az-PheRS (24) Leucil trna- 65 MSDFRIIEEK WQ AWEYDRI FESDPNEKEK FFLTIPYPYL NGNLHAGHTR sintetasa de RS archeoglobus fulgidus (AFLRS) TFTIGDAFAR YMRMKGYNVL FPLGFHVTGT PIIGLHELIH KRDERTIEVY TKYHDVPLED LLOLTTPEKI VEYFSREALQ ALKSIGYSID WRRVFTTTDE EYQRFIE QY WKLKELGLIV GTHPVRYCP HDQNPVEDHD LLAGEEATIV EFTVIKFRLE DGDLIFPCAT LRPETVFGVT NIWVKPTTYV IAEVDGE WF VSKEAYEKLT Y EKKVRLLE EVDASQFFGK YVIVPLVMRK VPILPAEFVD TDNATGWMS VPAHAPFDIA AIEDLKRDEE TLAKYGIDKS WESIKPIVL IKTDIEGVPA EKLIRELGVK SQKDKELLDK ATKTLYKKEY HTGIMLDNTM NYAGMKVSEA KERVHEDLVK LGLGDVFYEF SEKPVICRCG TKCW WRD QWFLNYSNRE WKEKVLNHLE KKRIIPDYYK EEFRNKIEWL RDKACARRKG LGTRIPWDKE WLIESLSDST IY AYYILAK YINAGLLKAE NMTPEFLDYV LLGKGEVGKV AEASKLSVEL IQQIRDDFEY WYPVDBRSSG KDLVANHLLF YLFHHVAIFP PDKWPRAIAV NGYVSLEGK MSKSKGPLLT MKRAVQQYGA SEQ SECÜENCIA Notas ARNt o ID # RS DVTRLYILHA AEYDSDADWK SREVEGLANH LRRFYNLVKE NYLKEVGELT TLDRWLVSRM QRAIKEVREA MDNLQTRRAV NAAFFELMND VRWYLRRGGE NLAIILDDWI KLLAPFAPHI CEELWHLKHD SYVSLESYPE YDETRVDEEA ERIEEYLRNL VEDIQEIKKF VSDAKEVYIA PAEDWKVKAA KWAESGDVG EAMKQLMQDE ELRKLGKEVS NFVKKIFKDR KKLMLVKEWE VLQQNLKFIE NETGLKVTLD TQRVPEEKRR QAVPGKPAIY VA* Leucil trna- 166 VDIERKWRDR WRDAGIFQAD PDDREKIFLT VAYPYPSGAM HIGHGRTYTV sintetasa de RS methanobacterium thermoautotrophi PDVYARFKRM OGYNVLFPMA WHVTGAPVIG IARRIQRKDP WTLKIYREVH cum (MtLRS) RVPEDELERF SDPEYIVEYF SREYRSVMED MGYSIDWRRE FKTTDPTYSR FIQWQIRKLR DLGLVRKGAH PVKYCPECEN PVGDHDLLEG EGVAINQLTL L FKLGDSYL VAATFRPETI YGATNLWLNP DEDYVRVETG GEE IISRAA VDÜLSHQKLD LKVSGDVNPG DLIGMCVENP VTGQEHPILP ASFVDPEYAT GWFSVPAHA PADFIALEDL RTDHELLERY GLEDWADIE PVNVIAVDGY GEFPAAEVIE KFGVRNQEDP RLEDATGELY KIEHARGVMS SHIPVYGGMK VSEAREVIAD ELKDQGLADE KYEFAERPVI CRCGGRCWR VMEDQWFMKY SDDAWKDLAH RCLDGMKIIP EEVRANFEYY IDWLNDWACS RRIGLGTRLP WDERWIIEPL TDSTIYMAYY TIAHRLREMD AGEMDDEFFD AIFLDDSGTF EDLREEFRYW YPLDWRLSAK DLIGNHLTFH IFHHSAIFPE SGWPRGAWF GMGLLEGNKM SSSKGNVILL RDAIEKHGAD WRLF1MSSA EP QDFDWRE SEVIGTRRRI EWFREFGERV SGILDGRPVL SEVTPAEPES FIGRWMMGQL MQRIREATRA LESFQTRKAV QEALYLLKKD VDHYLKRVEG RVDDEVKSVL ANVLHAWIRL MAPFIPYTAE EMWERYGGEG FVAEAP PDF SDDAESRDVQ VAEEMVQNTV RDIQEIMKIL GSTPERVHIY TSPKWKWDVL RVAAEVGKLD SEQ SECUENCIA Notas ARNt O ID # RS MGSIMGRVSA EGIHDNMKEV AEFVRRIIRD LGKSEVTVID EYSVLMDASD YIESEVGARV VIHSKPDYDP ENKAVNAVPL KPAIYLE* (plasc-papabc) 67 GAATTCACAC ACAGGAAACA GCTATGCGCA CGCTTCTGAT CGACAACTAC Plás GACTCGTTCA CCCAGAACCT GTTCCAGTAC ATCGGCGAGG CCACCGGGCA mido GCCCCCCGTC GTGCCCAACG ACGCCGACTG GTCGCGGCTG CCCCTCGAGG ACTTCGACGC GATCGTCGTG TCCCCGGGCC CCGGCAGCCC CGACCGGGAA CGGGACTTCG GGATCAGCCG CCGGGCGATC ACCGACAGCG GCCTGCCCGT CCTCGGCGTC TGCCTCGGCC ACCAGGGCAT CGCCCAGCTC TCGGCGGAAC CCATGCACGG CCGGGTCTCC GAGGTGCGGC ACACCGGCGA GGACGTCTTC CGGGGCCTCC CCTCGCCGTT CACCGCCGTG CGCTACCACT CCCTGGCCGC CACCGACCTC CCCGACGAGC TCGAACCCCT CGCCTGGAGC GACGACGGCG TCGTCATGGG CCTGCGGCAC CGCGAGAAGC CGCTGATGGG CGTCCAGTTC CCACCGGAGT CCATCGGCAG CGACTTCGGC CGGGAGATCA TGGCCAACTT CCGCGACCTC GCCCTCGCCC ACCACCGGGC ACGTCGCGAC GCGGCCGACT GGGGCTACGA ACTCCACGTG CGCCGCGTCG ACGTGCTGCC GGACGCCGAA GAGGTACGCC GCGCTGCCTG CCCGGCCGAG GGCGCCACGT TCTGGCTGGA CAGCAGCTCC GTCCTCGAAG GCGCCTCGCC GTTCTCCTTC CTCGGCGACG ACCGCGGCCC GCTCGCCGAG TACCTCACCT ACCGCGTCGC CGACGGCGTC GTCTCCGTCC GCGGCTCCGA CGGCACCACG ACCCGGGACG CGGCGACCCT CTTCAGCTAC CTGGAGGAGC AGCTCGAACC GCCGGCGGGT CCCGTCGCCC CCGACCTGCC CTTCGAGTTC AACCTCGGCT ACGTCGGCTA CCTCGGCTAC GAGCTGAAGG CGGAGACCAC CGGCGACCCC GCAGTACCGG CCCCGCACCC CGACGCCGCG TTCCTCTTCG CCGACCGCGC CATCGCCCTC GACCACCAGG SEQ SECUENCIA Notas ARNt O ID # RS AAGGCTGCTG CTACCTGCTG GCCCTCGACC GCCGGGGCCA CGACGACGGC GCCCGCGCCT GGCTGCGGGA GACGGCCGAG ACCCTCACCG GCCTGGCCGT CCGCGTCCGG CCGAGGCCGA CCCCCGCCAT GGTCTTCGGG GTCCCCGAGG CGGCGGCCGG CTTCTGCCCC CTGGCTCGCG CACGCCACGA CAAGGACGCC TCGGCGCTCC GCAACGGCGA GTCGTACGAG ATCTGCCTGA CCAACATGGT CACCGCGCCG ACCGAGGCGA CGGCCCTGCC GCTCTACTCC GCGCTGCGCC GCATCAGCCC CGTCCCGTCT GGCGCCCTGC TCGAGTTCCC CGAGCTGTCG GTGCTCAGCG CCTCGCCCGA GCGGTTCCTC ACGATCGGCG CCGACGGCGG CGTCGAGTCC AAGCCCATCA AGGGGACCCG CCCCCGGGGC GCACCGGCGG AGGAGGACGA GCGGCTCCC-C GCCGACCTGG CCGGCCGGGA GAAGGACCGG GCCGAGAACC TGATGATCC-T CGACCTGGTC CGCAACGACC TCAACAGCGT CTGCGCGATC GGCTCCGTCC ACGTGCCCCG GCTCTTCGAG GTGGGAGACC TCGCGCCCGT GCACCAGCTG GTGTCGACCA TCCGGGGACG GCTGCGGCCC GGCACCAGCA CCGCCGCCTG CGTACGCGCC GCCTTCCCCG GCGGCTCCAT GACCGGCGCG CCCAAGAAGC GACCCATGGA GATCATCGAC CGCCTGGAGG AAGGCCCCCG GGGCGTCTTA CCCGGGGCGC TCGGATGGTT CGCCCTCAGC GGCGCCGCCG ACCTCAGCAT CGTCATCCGC ACCATCGTGC TGGCCGACGG CCGGGCCGAG TTCGGCGTCG GCGGGGCGAT CGTGTCCCTC TCCGACCAGG AGGAGGAGTT CAGGCAGACC GTGGTCAAGG CCCGCGCCAT GGTCACCGCC CTCGACGGCA GCGCAGTGGC GGGCGCACGA TGACACCAAC AAGGACCATA GCATATGACC GAGCAGAACG AGCTGCAGGT TGCGGCTGCG CGCGGAGCTC GACGCCCTCG ACGGGACGCT TCTGGACACG GTGCGGCGCC GCATCGACCT CGGTGTCCGC ATCGCGCGGT ACAAGTCCCG GCACGGCGTC CCGATGATGC SEQ SECUENCIA Notas AR t O ID # RS AGCCCGGCCG GGTCAGCCTG GTCAAGGACA GGGCCGCCCG CTACGCCGCC GACCACGGCC TCGACGAATC GTTCCTGGTG AACCTCTACG ACGTGATCAT CACGGAGATG TGCCGCGTCG AGGACCTGGT GATGAGCCCG TCATGTACTA AGGAGGTTGT ATGAGTGGCT TCCCCCGGAG CGTCGTCGTC GGCGGCAGCG GAGCGGTGGG CGGCATGTTC GCCGGGCTGC TGCGGGAGGC GGGCAGCCGC ACGCTCGTCG TCGACCTCGT ACCGCCGCCG GGACGGCCGG ACGCCTGCCT GGTGGGCGAC GTCACCGCC-C CGGGGCCCGA GCTCGCGGCC GCCCTCCGGG ACGCGGACCT CGTCCTGCTC GCCGTACACG AGGACGTGGC CCTCAAGGCC GTGGCGCCCG TGACCCGGCT CATGCGACCG GGCGCGCTGC TCGCCGACAC CCTGTCCGTC CGGACGGGCA TGGCCGCGGA GCTCGCGGCC CACGCCCCCG GCGTCCAGCA CGTGGGCCTC AACCCGATGT TCGCCCCCGC CGCCGGCATG ACCGGCCGGC CCGTGGCCGC CGTGGTCACC AGGGACGGGC CGGGCGTCAC GGCCCTGCTG CGGCTCGTCG AGGGCGGCGG CGGCAGGCCC GTACGGCTCA CGGCGGAGGA GCACGACCGG ACGACGGCGG CGACCCAGGC CCTGACGCAC GCCGTGATCC TCTCCTTCGG GCTCGCCCTC GCCCGCCTCG GCGTCGACGT CCGGGCCCTG GCGGCGACGG CACCGCCGCC CCACCAGGTG CTGCTCGCCC TCCTGGCCCG TGTGCTCGGC GGCAGCCCCG AGGTGTACGG GGACATCCAG CGGTCCAACC CCCGGGCGGC GTCCGCGCGC CGGGCGCTCG CCGAGGCCCT GCGCTCCTTC GCCGCGCTGA TCGGCGACGA CCCGGACCGC GCCGAGGACC CGGACCGCGC CGACGACCCC GACCGCACCG ACAACCCCGG CCATCCCGGG GGATGCGACG GCGCCGGGAA CCTCGACGGC GTCTTCGAGG AACTCCGCCG GCTCATGGGA CCGGAGCTCG CGGCGGGCCA GGACCACTGC CAGGAGCTGT TCCGCACCCT CCACCGCACC GACGACGAAG GCGAGAAGGA CCGATGAATT SEQ SECUENCIA Notas ARNt o ID # RS TAGGTGACAC TATAGGGATC CTCTACGCCG GACGCATCGT GGCCGGCATC ACCGGCGCCA CAGGTGCGGT TGCTGGCGCC TATATCGCCG ACATCACCGA TGGGGAAGAT CGGGCTCGCC ACTTCGGGCT CATGAGCGCT TGTTTCGGCG TGGGTATGGT GGCAGGCCCC GTGGCCGGGG GACTGTTGGG CGCCATCTCC TTGCATGCAC CATTCCTTGC GGCGGCGGTG CTCAACGGCC TCAACCTACT ACTGGGCTGC TTCCTAATGC AGGAGTCGCA TAAGGGAGAG CGTCGACCGA TGCCCTTGAG AGCCTTCAAC CCAGTCAGCT CCTTCCGGTG GGCGCGGGGC ATGACTATCG TCGCCGCACT TATGACTGTC TTCTTTATCA TGCAACTCGT AGGACAGGTG CCGGCAGCGC TCTGGGTCAT TTTCGGCGAG GACCGCTTTC GCTGGAGCGC GACGATGATC GGCCTGTCGC TTGCGGTATT CGGAATCTTG CACGCCCTCG CTCAAGCCTT CGTCACTGGT CCCGCCACCA AACGTTTCGG CGAGAAGCAG GCCATTATCG CCGGCATGGC GGCCGACGCG CTGGGCTACG TCTTGCTGGC GTTCGCGACG CGAGGCTGGA TGGCCTTCCC CATTATGATT CTTCTCGCTT CCGGCGGCAT CGGGATGCCC GCGTTGCAGG CCATGCTGTC CAGGCAGGTA GATGACGACC ATCAGGGACA GCTTCAAGGA TCGCTCGCGG CTCTTACCAG CCTAACTTCG ATCACTGGAC CGCTGATCGT CACGGCGATT TATGCCGCCT CGGCGAGCAC ATGGAACGGG TTGGCATGGA TTGTAGGCGC CGCCCTATAC CTTGTCTGCC TCCCCGCGTT GCGTCGCGGT GCATGGAGCC GGGCCACCTC GACCTGAATG GAAGCCGGCG GCACCTCGCT AACGGATTCA CCACTCCAAG AATTGGAGCC AATCAATTCT TGCGGAGAAC TGTGAATGCG CAAACCAACC CTTGGCAGAA CATATCCATC GCGTCCGCCA TCTCCAGCAG CCGCACGCGG CGCATCTCGG GCAGCGTTGG GTCCTGGCCA CGGGTGCGCA TGATCGTGCT CCTGTCGTTG AGGACCCGGC TAGGCTGGCG GGGTTGCCTT SEQ SECUENCIA Notas ARílt O ID # RS ACTGGTTAGC AGAATGAATC ACCGATACGC GAGCGAACGT GAAGCGACTG CTGCTGCAAA ACGTCTGCGA CCTGAGCAAC AACATGAATG GTCTTCGGTT TCCGTGTTTC GTAAAGTCTG GAAACGCGGA AGTCCCCTAC GTGCTGCTGA AGTTGCCCGC AACAGAGAGT GGAACCAACC GGTGATACCA CGATACTATG ACTGAGAGTC AACGCCATGA GCGGCCTCAT TTCTTATTCT GAGTTACAAC AGTCCGCACC GCTGCCGGTA GCTACTTGAC TÁTCCGGCTG CACTAGCCCT GCGTCAGATG GCTCTGATCC AAGGCAAACT GCCAAAATAT CTGCTGGCAC CGGAAGTCAG CGCCCTGCAC CATTATGTTC CGGATCTGCA TCGCAGGATG CTGCTGGCTA CCCTGTGGAA CACCTACATC TGTATTAACG AAGCGCTGGC ATTGACCCTG AGTGATTTTT CTCTGGTGCC GCCCTATCCC TTTGTGCAGC TTGCCACGCT CAAAGGGGTT TGAGGTCCAA CCGTACGAAA ACGTACGGTA AGAGGAAAAT TATCGTCTGA AAAATCGATT AGTAGACAAG AAAGTCCGTT AAGTGCCAAT TTTCGATTAA AAAGACACCG TTTTGATGGC GTTTTCCAAT GTACATTATG TTTCGATATA TCAGACAGTT ACTTCACTAA CGTACGTTTT CGTTCTATTG GCCTTCAGAC CCCATATCCT TAATGTCCTT TATTTGCTGG GGTTATCAGA TCCCCCCGAC ACGTTTAATT AATGCTTTCT CCGCCGGAGA TCGACGCACA GGCTTCTGTG TCTATGATGT TATTTCTTAA TAATCATCCA GGTATTCTCT TTATCACCAT ACGTAGTGCG AGTGTCCACC TTAACGCAGG GCTTTCCGTC ACAGCGCGAT ATGTCAGCCA GCGGGGCTTT CTTTTGCCAG ACCGCTTCCA TCCTCTGCAT TTCAGCAATC TGGCTATACC CGTCATTCAT AAACCACGTA AATGCCGTCA CGCAGGAAGC CAGGACGAAG AATATCGTCA GTACAAGATA AATCGCGGAT TTCCACGTAT AGCGTGACAT CTCACGACGC ATTTCATGGA TCATCGCTTT CGCCGTATCG GCAGCCTGAT TCAGCGCTTC SEQ SECUENCIA Notas A Nt o ID # RS TGTCGCCGGT TTCTGCTGTG CTAATCCGGC TTGTTTCAGT TCTTTCTCAA CCTGAGTGAG CGCGGAACTC ACCGATTTCC TGACGGTGTC AGTCATATTA CCGGACGCGC TGTCCAGCTC ACGAATGACC CTGCTCAGCG TTTCACTTTG CTGCTGTAAT TGTGATGAC-G CGGCCTGAAA CTGTTCTGTC AGAGAAGTAA CACGCTTTTC CAGCGCCTGA TGATGCCCGA TAAGGGCGGC AATTTGTTTA ATTTCGTCGC TCATACAAAA TCCTGCCTAT CGTGAGAATG ACCAGCCTTT ATCCGGCTTC TGTCGTATCT GTTCGGCGAG TCGCTGTCGT TCTTTCTCCT GCTGACGCTG TTTTTCCGCC AGACGTTCGC GCTCTCTCTG CCTTTCCATC TCCTGATGTA TCCCCTGGAA CTCCGCCATC GCATCGTTAA CAAGGGACTG AAGATCGATT TCTTCCTGTA TATCCTTCAT GGCATCACTG ACCAGTGCGT TCAGCTTGTC AGGCTCTTTT TCAAAATCAA ACGTTCTGCC GGAATGGGAT TCCTGCTCAG GCTCTGACTT CAGCTCCTGT TTTAGCGTCA GAGTATCCCT CTCGCTGAGG GCTTCCCGTA ACGAGGTAGT CACGTCAATT ACGCTGTCAC GTTCATCACG GGACTGCTGC ACCTGCCTTT CAGCCTCCCT GCGCTCAAGA ATGGCCTGTA GCTGCTCAGT ATCGAATCGC TGAACCTGAC CCGCGCCCAG ATGCCGCTCA GGCTCACGGT CAATGCCCTG CGCCTTCAGG GAACGGGAAT CAACCCGGTC AGCGTGCTGA TACCGTTCAA GGTGCTTATT CTGGAGGTCA GCCCAGCGTC TCCCTCTGGG CAACAAGGTA TTCTTTGCGT TCGGTCGGTG TTTCCCCGAA ACGTGCQTTT TTTGCGCCAC CGCGTCCGGC TCTTTGGTGT TAGCCCGTTT AAKATACTGC TCAGGGTCAC GGTGAATACC GTCATTAATG CGTTCAGAGA ACATGATATG GGCGTGGGGC TGCTCGCCAC CGGCTATCGC TGCTTTCGGA TTATGGATAG CGAACTGATA GGCATGGCGG TCGCCAATTT CCTGTTGGAC AAAATCGCGG ACAAGCTCAA GACGTTGTTC GGGTTTTARC SEQ SECUENCIA Notas ARNt o ID # RS TCACGCGGCA GGGCAATCTC. GATTTCACGG TAGGTACAGC CGTTGGCACG TTCAGACGTG TCAGCGGCTT TCCAGAACTC GGACGGTTTA TGCGCTGGCC ACGCCGGCAT ATTGCCGGAC TCCTTGTGCT CAAGGTCGGA GTCTTTTTCA CGGGCATACT TTCCCTCACG CGCAATATAA TCGGCATGAG GAGAGGCACT GCCTTTTCCG CCGGTTTTTA .CGCTGAGATG ATAGGATGCC ATCGTGTTTT ATCCCGCTGA AGGGCGCACG TTTCTGAACG AAGTGAAGAA AGTCTAAGTG CGCCCTGATA AATAAAAGAG TTATCAGGGA TTGTAGTGGG ATTTGACCTC CTCTGCCATC ATGAGCGTAA TCATTCCGTT AGCATTCAGG AGGTAAACAG CATGAATAAA AGCGAAAAAA CAGGAACAAT GGGCAGCAGA AAGAGTGCAG TATATTCGCG GCTTAAAGTC GCCGAATGAG CAACAGAAAC TTATGCTGAT ACTGACGGAT AKAGCAGATA AAACAGCACA GGATATCAAA ACGCTGTCCC TGCTGATGAA GGCTGAACAG GCAGCAGAGA AAGCGCAGGA AGCCAGAGCG AAAGTCATGA ACCTGATACA GGCAGAAAAG CGAGCCGAAG CCAGAGCCGC CCGTAAAGCC CGTGACCATG CTCTGTACCA GTCTGCCGGA TTGCTTATCC TGGCGGGTCT GGTTGACAGT AAGACGGGTA AGCCTGTTGA TGATACCGCT GCCTTACTGG GTGCATTAGC CAGTCTGAAT GACCTGTCAC GGGATAATCC GAAGTGGTCA GACTGGAAAA TCAGAGGGCA GGAACTGCTG AACAGCAAAA AGTCAGATAG CACCACATAG CAGACCCGCC ATAAAACGCC CTGAGAAGCC CGTGACGGGC TTTTCTTGTA TTATGGGTAG TTTCCTTGCA TGAATCCATA AAAGGCGCCT GTAGTGCCAT TTACCCCCAT TCACTGCCAG AGCCGTGAGC GCAGCGAACT GAATGTCACG AAAAAGACAG CGACTCAGGT GCCTGATGGT CGGAGACAAA AGGAATATTC AGCGATTTGC CCGAGCTTGC GAGGGTGCTA CTTAAGCCTT TAGGGTTTTA AGGTCTGTTT TGTAGAGGAG CAAACAGCGT SEQ SECUENCIA Notas ARNt o ID # RS TTGCGACATC CTTTTGTAAT ACTGCGGAAC TGACTAAAGT AGTGAGTTAT ACACAGGGCT GGGATCTATT CTTTTTATCT TTTTTTATTC TTTCTTTATT CTATAAATTA TAACCACTTG AATATAAACA AAAAAAACAC ACAAAGGTCT AGCGGAATTT ACAGAGGGTC TAGCAGAATT TACAAGTTTT CCAGCAAAGG TCTAGCAGAA TTTACAGATA CCCACAACTC AAAGGAAAAG GACTAGTAAT TATCATTGAC TAGCCCATCT CAATTGGTAT AGTGATTAAA ATCACCTAGA CCAATTGAGA TGTATGTCTG AATTAGTTGT TTTCAAAGCA AATGAACTAG CGATTAGTCG CTATGACTTA ACGGAGCATG AAACCAAGCT AATTTTATGC TGTGTGGCAC TACTCAACCC CACGATTGAA. AACCCTACAA GGAAAGAACG GACGGTATCG TTCACTTATA ACCAATACGC TCAGATGATG AACATCAGTA GGGAAAATGC TTATGGTGTA TTAGCTAAAG CAACCAGAGA GCTGATGACG AGAACTGTGG AAATCAGGAA TCCTTTGGTT AAAGGCTTTG AGATTTTCCA GTGGACAAAC TATGCCAAGT TCTCAAGCGA AAAATTAGAA TTAGTTTTTA GTGAAGAGAT ATTGCCTTAT CTTTTCCAGT TAAAAAAATT CATAAAATAT AATCTGGAAC ATGTTAAGTC TTTTGAAAAC AAATACTCTA TGAGGATTTA TGAGTGGTTA TTAAAAGAAC TAACACAAAA GAAAACTCAC AAGGCAAATA TAGAGATTAG CCTTGATGAA TTTAAGTTCA TGTTAATGCT TGAAAATAAC TACCATGAGT TTAAAAGGCT TAACCAATGG GTTTTGAAAC CAATAAGTAA AGATTTAAAC ACTTACAGCA ATATGAAATT GGTGGTTGAT AAGCGAGGCC GCCCGACTGA TACGTTGATT TTCCAAGTTG AACTAGATAG ACAAATGGAT CTCGTAACCG AACTTGAGAA CAACCAGATA AAAATGAATG GTGACAAAAT ACCAACAACC ATTACATCAG ATTCCTACCT ACGTAACGGA CTAAGAAAAA CACTACACGA TGCTTTAACT GCAAAAATTC AGCTCACCAG TTTTGAGGCA SEQ SECUENCIA Notas ARNt o ID # RS AAATTTTTGA GTGACATGCA AAGTAAGCAT GATCTCAATG GTTCGTTCTC ATGGCTCACG CAAAAACAAC GAACCACACT AGAGAACATA .CTGGCTAAAT ACGGAAGGAT CTGAGGTTCT TATGGCTCTT GTATCTATCA GTGAAGCATC AAGACTAACA AACAAAAGTA GAACAACTGT TCACCGTTAG ATATCAAAGG GAAAACTGTC CATATGCACA GATGAAAACG GTGTAAAAAA GATAGATACA TCAGAGCTTT TACGAGTTTT TGGTGCATTT AAAGCTGTTC ACCATGAACA GATCGACAAT GTAACAGATG AACAGCATGT AACACCTAAT AGAACAGGTG AAACCAGTAA AACAAAGCAA CTAGAACATG AAATTGAACA CCTGAGACAA CTTGTTACAG CTCAACAGTC ACACATAGAC AGCCTGAAAC AGGCGATGCT GCTTATCGAA TCAAAGCTC-C CGACAACACG GGAGCCAGTG ACGCCTCCCG TGGGGAAAAA ATCATGGCAA TTCTGGAAGA AATAGCGCTT TCAGCCGGCA AACCTGAAGC CGGATCTGCG ATTCTGATAA CAAACTAGCA ACACCAGAAC AGCCCGTTTG CGGGCAGCAA AACCCGTACT TTTGGACGTT CCGGCGGTT TTTGTGGCGA GTGGTGTTCG GGCGGTGCGC GCAAGATCCA TTATGTTAAA CGGGCGAGTT TACATCTCAA AACCGCCCGC TTAACACCAT CAGAAATCCT CAGCGCGATT TTAAGCACCA ACCCCCCCCC GTAACACCCA AATCCATACT GAAAGTGGCT TTGTTGAATA AATCGAACTT TTGCTGAGTT GAAGGATCAG ATCACGCATC CTCCCGACAA CACAGACCAT TCCGTGGCAA AGCAAAAGTT CAGAATCACC AACTGGTCCA CCTACAACAA AGCTCTCATC AACCGTGGCT CCCTCACTTT CTGGCTGGAT GATGAGGCGA TTCAGGCCTG GTATGAGTCG GCAACACCTT CATCACGAGG AAGGCCCCAG CGCTATTCTG ATCTCGCCAT CACCACCGTT CTGGTGATTA AACGCGTATT CCGGCTGACC CTGCGGGCTG CGCAGGGTTT TÁTTGATTCC ATTTTTGCCC TGATGAACGT TCCGTTGCGC SEQ SECUENCIA Notas ARNt o ID # RS TGCCCGGATT ACACCAGTGT CAGTAAGCGG GCAAAGTCGG TTAATGTCAG TTTCAAAACG TCCACCCGGG GTGAAATCGC ACACCTGGTG ATTGATTCCA CCGGGCTGAA GGTCTTTGGT GAAGGCGAAT GGAAAGTCAG AAAGCACGGC AAAGAGCGCC GTCGTATCTG GCGAAAGTTG CATCTTGCTG TTGACAGCAA CACACATGAA GTTGTCTGTG CAGACCTGTC GCTGAATAAC GTCACGGACT CAGAAGCCTT CCCGGGCCTT ATCCGGCAGA CTCACAGAAA AATCAGGGCA GCCGCGGCAG ACGGGGCTTA CGATACCCGG CTCTGTCACG ATGAACTGCG CCGCAAAAAA ATCAGCGCGC TTATTCCTCC CCGAAAAGGT GCGGGTTAC? GGCCCGGTGA ATATGCAGAC CGTAACCGTG CAGTGGCTAA TCAGCGAATG ACCGGGAGTA ATGCGCTGTG GAAATGGACA ACAGATTACA ACCGTCGCTC GATAGCGGAA ACGGCGATGT ACCGGGTAAA ACAGCTGTTC GGGGGTTCAC TGACGCTGCG TGACTACGAT GGTCAGGTTG CGGAGGCTAT GGCCCTGGTA CGAGCGCTGA ACAAAATGAC GAAAGCAGGT ATGCCTGAAA GCGTGCGTAT TGCCTGAAAA CACAACCCGC TACGGGGGAG ACTTACCCGA AATCTGATTT ATTCAACAAA GCCGGGTGTG GTGAACTACA AAGCAGACCC GTTGAGGTTA TCAGTTCGAT GCACAATCAG CAGCGCATAA AATATGCACA AGAACAGGAG CACCCTTCGC ATTAAGCTGT GGTGGTAACA AGTAGTGCCG GGCTACCATC AGCGAGCATG ATGCGCTCCC ACAGCATTCG CCTTGGCAGT ATGGAAGTTC CTCGCTCCAG TTCGGGCCGG TATCCACCTC GAGAGGTGGC ACTTTTCGGG GAAATGTGCG CGGAACCCCT ATTTGTTTAT TTTTCTAAAT ACATTCAAAT ATGTATCCGC TCATGAGACA ATAACCCTGA TAAATGCTTC AATAATATTG AAAAAGGAAG AGTATGAGTA TTCAACATTT CCGTGTCGCC CTTATTCCCT TTTTTGCGGC ATTTTGCCTT CCTGTTTTTG CTCACCCAGA AACGCTGGTG SEQ SECUENCIA Notas ARHt o ID # RS AAAGTAAAAG ATGCTGAAGA TCAGTTGGGT GCACGAGTGG GTTACATCGA ACTGGATCTC AACAGCGGTA AGATCCTTGA GAGTTTTCGC CCCGAAGAAC GTTTTCCAAT GATGAGCACT TTTAAAGTTC TGCTATGTGG CGCGGTATTA TCCCGTGTTG ACGCCGGGCA AGAGCAACTC GGTCGCCGCA TACACTATTC TCAGAATGAC TTGGTTGAGT ACTCACCAGT CACAGAAAAG CATCTTACGG ATGGCATGAC AGTAAGAGAA TTATGCAGTG CTGCCATAAC CATGAGTGAT AACACTGCGG CCAACTTACT TCTGACAACG ATCGGAGGAC CGAAGGAGCT AACCGCTTTT TTGCACAACA TGGGGGATCA TGTAACTCGC CTTGATCGTT GGGAACCGGA GCTGAATGAA GCCATACCAA ACGACGAGCG TGACACCACG ATGCCTGCAG CAATGGCAAC AACGTTGCGC AAACTATTAA CTGGCGAACT ACTTACTCTA GCTTCCCGGC AACAATTAAT AGACTGGATG GAGGCGGATA AAGTTGCAGG ACCACTTCTG CGCTCGGCCC TTCCGGCTGG CTGGTTTATT GCTGATAAAT CTGGAGCCC-G TGAGCGTGGG TCTCGCGGTA TCATTGCAGC ACTGGGGCCA GATGGTAAGC CCTCCCGTAT CGTAGTTATC TACACGACGG GGAGTCAGGC AACTATGGAT GAACGAAATA GACAGATCGC TGAGATAGGT GCCTCACTGA TTAAGCATTG GTAACCCGGG ACCAAGTTTA CTCATATATA CGGACAGCGG TGCGGACTGT TGTAACTCAG AATAAGAAAT GAGGCCGCTC ATGGCGTTCT GTTGCCCGTC TCACTGGTGA AAAGAAAAAC AACCCTGGCG CCGCTTCTTT GAGCGAACGA CAAAAATAA GTGGCGCCCC ATCAAAAAAA TATTCTCAAC ATAAAAAACT TTGTGTAATA CTTGTAACGC T S8 ATGCGCACGC TTCTGATCGA CAACTACGAC- TCGTTCACCC AGAACCTGTT tres genes Plás CCAGTACATC GGCGAGGCCA CCGGGCAGCC CCCCGTCGTG CCCAACGACG (papaABC) mido CCGACTGGTC GCGGCTGCCC CTCGAGGACT TCGACGCGAT CGTCGTGTCC SEQ SECUENCIA Notas ARNt o ID # RS CCGGGCCCCG GCAGCCCCC-A CCGGGAACGG GACTTCGGGA TCAGCCGCCG GGCGATCACC GACAGCGGCC TGCCCGTCCT CGGCGTCTGC CTCGGCCACC AGGGCATCGC CCAGCTCTCG GCGGAACCCA TGCACGGCCG GGTCTCCGAG GTGCGGCACA CCGGCGAGGA CGTCTTCCGG GGCCTCCCCT CGCCGTTCAC CGCCGTGCGC TACCACTCCC TGGCCGCCAC CGACCTCCCC GACGAGCTCG AACCCCTCGC CTGGAGCGAC GACGGCGTCG TCATGGGCCT GCGGCACCGC GAGAAGCCGC TGATGGGCGT CCAGTTCCCA CCGGAGTCCA TCGGCAGCGA CTTCGGCCGG GAGATCATGG CCAACTTCCG CGACCTCGCC CTCGCCCACC ACCGGGCACG TCGCGACGCG GCCGACTGGG GCTACGAACT CCACGTGCGC CGCGTCGACG TGCTGCCGGA CGCCGAAGAG GTACGCCGCG CTGCCTGCCC GGCCGAGGGC GCCACGTTCT GGCTGGACAG CAGCTCCGTC CTCGAAGGCG CCTCGCCGTT CTCCTTCCTC GGCGACGACC GCGGCCCGCT CGCCGAGTAC CTCACCTACC GCGTCGCCGA CGGCGTCGTC TCCGTCCGCG GCTCCGACGG CACCACGACC CGGGACGCGG CGACCCTCTT CAGCTACCTG GAGGAGCAGC TCGKACCGCC GGCGGGTCCC GTCGCCCCCG ACCTGCCCTT CGAGTTCAAC CTCGGCTACG TCGGCTACCT CGGCTACGAG CTGAAGGCGG AGACCACCGG CGACCCCGCA GTACCGGCCC CGCACCCCGA CGCCGCGTTC CTCTTCGCCG ACCGCGCCAT CGCCCTCGAC CACCAGGAAG GCTGCTGCTA CCTGCTGGCC CTCGACCGCC GGGGCCACGA CGACGGCGCC CGCGCCTGGC TGCGGGAGAC GGCCGAGACC CTCACCGGCC TGGCCGTCCG CGTCCGGCCG AGGCCGACCC CCGCCATGGT CTTCGGGGTC CCCGAGGCGG CGGCCGGCTT CGGCCCCCTG GCTCGCGCAC GCCACGACAA GGACGCCTCG GCGCTCCGCA ACGGCGAGTC GTACGAGATC TGCCTGACCA ACATGGTCAC CGCGCCGACC GAGGCGACGG SEQ SECUENCIA Notas ARHt o ID # RS CCCTGCCGCT CTACTCCGCG CTGCGCCGCA TCAGCCCCGT CCCGTCTGGC GCCCTGCTCG AGTTCCCCGA GCTGTCGGTG CTCAGCGCCT CGCCCGAGCG GTTCCTCACG ATCGGCGCCG ACGGCGGCGT CGAGTCCAAG CCCATCAAGG GGACCCGCCC CCGGGGCGCA CCGGCGGAGG AGGACGAGCG GCTCCGCGCC GACCTGGCCG GCCGGGAGAA GGACCGGGCC GAGAACCTGA TGATCGTCGA CCTGGTCCGC AACGACCTCA ACAGCGTCTG CGCGATCGGC TCCGTCCACG TGCCCCGGCT CTTCGAGGTG GGAGACCTCG CGCCCGTGCA CCAGCTGGTG TCGACCATCC GGGGACGGCT GCGGCCCGGC ACCAGCACCG CCGCCTGCGT ACGCGCCGCC TTCCCCGGCG GCTCCATGAC CGGCGCGCCC AAGAAGCGAC CCATGGAGAT CATCGACCGC CTGGAGGAAG GCCCCCGGGG CGTCTTACCC GGGGCGCTCG GATGGTTCGC CCTCAGCGGC GCCGCCGACC TCAGCATCGT CATCCGCACC ATCGTGCTGG CCGACGGCCG GGCCGAGTTC GGCGTCGGCG GGGCGATCGT GTCCCTCTCC GACCAGGAGG AGGAGTTCAG GCAGACCGTG GTCAAGGCCC GCGCCATGGT CACCGCCCTC GACGGCAGCG CAGTGGCGGG CGCCCGATGA GCGGCTTCCC CCGGAGCGTC GTCGTCGGCG GCAGCGGAGC GGTGGGCGGC ATGTTCQCCG GGCTGCTGCG GGAGGCGGGC AGCCGCACGC TCGTCGTCGA CCTCGTACCG CCGCCGGGAC GGCCGGACGC CTGCCTGGTG GGCGACGTCA CCGCGCCGGG GCCCGAGCTC GCGGCCGCCC TCCGGGACGC GGACCTCGTC CTGCTCGCCG TACACGAGGA CGTGGCCCTC AAGGCCGTGG CGCCCGTGAC CCGGCTCATG CGACCGGGCG CGCTGCTCGC CGACACCCTG TCCGTCCGGA CGGGCATGGC CGCGGAGCTC GCGGCCCACG CCCCCGGCGT CCAGCACGTG GGCCTCAACC CGATGTTCGC CCCCGCCGCC GGCATGACCG GCCGGCCCGT GGCCGCCGTG GTCACCAGGG ACGGGCCGGG CGTCACGGCC SEQ SECUENCIA Notas ARNt o ID # RS CTGCTGCGGC TCGTCGAGGG CGGCGGCGGC AGGCCCGTAC GGCTCACGGC GGAGGAGCAC GACCGGACGA CGGCGGCGAC CCAGGCCCTG ACGCACGCCG TGATCCTCTC CTTCGGGCTC GCCCTCGCCC GCCTCGGCGT CGACGTCCGG GCCCTGGCGG CGACGGCACC GCCGCCGCAC CAGGTGCTGC TCGCCCTCCT GGCCCGTGTG CTCGGCGGCA GCCCCGAGGT GTACGGGGAC ATCCAGCGGT CCAACCCCCG GGCGGCGTCC GCGCGCCGGG CGCTCGCCGA GGCCCTGCGC TCCTTCGCCG CGCTGATCGG CGACGACCCG GACCGCGCCG AGGACCCGGA CCGCGCCGAC GACCCCGACC GCACCGACAA CCCCGGCCAT CCCGGGGGAT GCGACGGCGC CGGGAACCTC GACGGCGTCT TCGAGGAACT CCGCCGGCTC ATGGGACCGG AGCTCGCGGC GGGCCAGGAC CACTGCCAGG AGCTGTTCCG CACCCTCCAC CGCACCGACG ACGAAGGCGA GAAGGACCGA TGACCGAGCA GAACGAGCTG CAGGTTGCGG CTGCGCGCGG AGCTCGACGC CCTCGACGGG ACGCTTCTGG ACACGGTGCG GCGCCGCATC GACCTCGGTG TCCGCATCGC GCGGTACAAG TCCCGGCACG GCGTCCCGAT GATGCAGCCC GGCCGGGTCA GCGTGGTCAA GGACAGGGCC GCCCGCTACG CCGCCGACCA CGGCCTCGAC GAATCGTTCC TGGTGAACCT CTACGACGTG ATCATCACGG AGATGTGCCG CGTCGAGGAC CTGGTGATGA GCCGGGAGAG CCTGACGGCC GAGGACCGGC GGTGA Aunque la anterior invención se ha descrito en algún detalle para propósitos de claridad y entendimiento, será claro para alguien experto en la técnica a partir de la lectura de esta exposición que pueden hacerse varios cambios en forma y detalle sin apartarse del verdadero alcance de la invención. Por ejemplo, todas las técnicas y aparatos descritos anteriormente pueden utilizarse en varias combinaciones. Todas las publicaciones, patentes, solicitudes de patente y/u otros documentos citados en esta solicitud se incorporan mediante la referencia en su totalidad para todos los propósitos hasta el mismo grado como si cada individual publicación, patente, solicitud de patente y/u otro documento se indicara individualmente que se incorporara mediante la referencia para todos los propósitos.

Claims (1)

  1. REIVINDICACIONES 1. Una composición que comprende un sistema de traducción, comprendiendo el sistema de traducción un ARNt ortogonal (O-AR t) y una aminoacil ARNt sintetasa ortogonal (O-RS) , en donde la O-RS preferentemente aminoacila el O-ARNt con al menos un aminoácido no natural en el sistema de traducción y el O-ARNt reconoce al menos un codón selector. 2. La composición de la reivindicación 1, en donde el sistema de traducción comprende una célula. 3. La 'composición de la reivindicación 2, en donde el sistema de traducción comprende una célula bacterial . 4. La composición de la reivindicación 3 , en donde el sistema de traducción comprende una célula de Escherichia coli . 5. La composición de la reivindicación 2, en donde el sistema de traducción comprende una célula argueobacterial . 6. La composición de la reivindicación 2 , en donde el sistema de traducción comprende una célula eucariotica . 7. La composición de la reivindicación 6, en donde la célula eucariotica comprende una célula de levadura, una célula de mamífero, una célula de planta o una célula de insecto . 8. La composición de la reivindicación 1, en donde el sistema de traducción comprende un sistema de traducción in vitro. 9. La composición de la reivindicación 8, en donde el sistema de traducción comprende un extracto celular. 10. La composición de la reivindicación 1, en donde el 0-ARNt comprende un ácido nucleico que comprende una secuencia de polinucleotidos seleccionada del grupo que consiste de: SEQ ID NO: 1-3 y una secuencia de polinucleotidos complementaria de las mismas. 11. La composición de la reivindicación 1, en donde la O-RS comprende un polinucleótido seleccionado del grupo que consiste de: un polipéptido que comprende una secuencia de aminoácidos seleccionada del grupo que consiste de la SEQ ID NO: 4-34 un polipéptido codificado por un ácido nucleico que comprende una secuencia de polinucleotidos seleccionada del grupo que consiste de: SEQ ID NO:35-66 y una secuencia de polinucleotidos complementaria de las mismas. 12. La composición de la reivindicación 1, en donde el al menos un aminoácido no natural se selecciona del grupo que consiste de una O-metil-L-tirosina, una L-3- (2-naftil) alanina, una 3-metil-fenilalanina, una ?-4-alil-L-tirosina, una 4-propil-L-tirosina, una tri-O-acetil-GlcNAc ß-serina, una L-Dopa, una fenilalanina fluorinada, una isopropil-L-fenilalanina, una p-azido-L-fenilalanina, una p-acil-L-fenilalanina, una p-benzoil-L-fenilalanina, una L-fosfoserina, una fosfonoserina, una fosfonotirosina, una p-yodo-fenilalanina, una p-bromofenilalanina, una p-amino-L-fenilalanina, una isopropil-L-fenilalanina, un análogo no natural de un aminoácido de tirosina; un análogo no natural de un aminoácido de glutamina; un análogo no natural de un aminoácido de fenilalanina; un análogo no natural de un aminoácido de serina; un análogo no natural de un aminoácido de treonina; un alquilo, arilo, acilo, azido, ciano, halo, hidrazina, hidrácido, hidroxilo, alquenilo, alquinilo, éter, tiol, sulfonilo, seleno, éster, tioácido, borato, boronato, fosfo, fosfono, fosfina, heterocíclico, enona, imina, aldehido, hidroxilamina, ceto o aminoácido amino -sustituido o cualquier combinación de los mismos; un aminoácido con un degradador fotoactivable; un aminoácido etiquetado de giro; un aminoácido fluorescente,- un aminoácido con un nuevo grupo funcional ,- un aminoácido que interactúa covalente o no covalentemente con otra molécula; un aminoácido que se une a metal; un aminoácido que contiene metal; un aminoácido radioactivo; un aminoácido fotoinmovilizado y/o fotoisomerizable ; una biotina o aminoácido que contiene un análogo de biotina; un aminoácido glicosilado o carbohidrato modificado; un aminoácido que contiene ceto; aminoácidos que comprenden polietilen glicol o poliéter; un aminoácido átomo pesado sustituido; un aminoácido quxmicamente desdoblable o fotodesdoblable,- un aminoácido con una cadena lateral agrandada; un aminoácido que contiene un grupo tóxico; un aminoácido azúcar sustituido, e.g. , una serina azúcar sustituida o lo similar; un aminoácido que contiene azúcar enlazado a carbono; un aminoácido redox-activo; un ácido que contiene a-hidroxi; un aminoácido que contiene ácido de amino tio; un aminoácido a,a disustituido; un aminoácidop; y un aminoácido cíclico diferente a la prolina. 13. La composición de la reivindicación 12, en donde el al menos un aminoácido no natural es una O-metil-L-tirosina . 14. La composición de la reivindicación 12, en donde el al menos un aminoácido no natural es una L-3-(2-naftil) alanina. 15. La composición de la reivindicación 12, en donde el al menos un aminoácido no natural es un análogo de fenilalanina que contiene amino, isopropilo, u 0-alilo. 16. La composición de la reivindicación 1, en donde el al menos un codón selector es un codón sin sentido, un codón raro, o un codón de cuatro bases. 17. La composición de la reivindicación 16, en donde el al menos un codón selector es un codón ámbar. Una célula de Escherichia coli que comprende un AR tm^ y una TyrRS mut nte (LWJ16) , en donde la TyrRS mutante (LWJ16) preferentemente aminoacila el ARNtrn^ con O- metil-L-tirosina en la célula y la célula utiliza el ARNtmTyr CUA para reconocer un codón ámbar . 19. Una célula de Escherichia coli que comprende un A Ntm^ y una SS12 -TyrRS, en donde la SS12-TyrRS preferentemente aminoacila el ARNtm^ con L-3- (2- naftil) alanina en la célula y la célula utiliza el AR tmTyr CUA para reconocer un codón ámbar. 20. Una composición que comprende una proteína, en donde la protelna comprende al menos un aminoácido no natural, y la proteína se encuentra presente en una concentración de al menos aproximadamente 100 microgramos por litro . 21. La composición de la reivindicación 20, en donde la proteína es homologa a una proteína terapéutica seleccionada del grupo que consiste de una citocina, un factor de crecimiento, un receptor del factor de crecimiento, un interferón, una interleucina, una molécula inflamatoria, un producto oncógeno, una hormona de péptido, una molécula de transducción de señal, un receptor de la hormona esteroide, un activador transcripcional , un supresor transcripcional , eritropoyetina (EPO) , insulina, hormona del crecimiento humano, Péptido-78 que Activa el Neutrófilo Epitelial, GROa/MGSA, GROp, GROy, MIP-l , ???-?d, MCP-1, factor del crecimiento de hepatocitos, factor del crecimiento similar a insulina, factor inhibidor de leucemia, oncostatina M, PD-ECSF, PDGF, pleotropina, SCF, ligando c-Kit, VEGEF, G-CSF, IL-1, IL-2, IL-8, IGF-1, IGF-II, FGF (factor de crecimiento de fibroblastos) , PDGF, TNF, TGF-a, TGF-ß, EGF (factor de crecimiento epidérmico) , KGF (factor de crecimiento de queratinocitos) , SCF/c-Kit, CD40L/CD40, VLA-4/VCAM-1 , ICAM-1/LFA-l, hyalurin/CD44, Mos, Ras, Raf, Met; p53, Tat, Fos, Myc, Jun, Myb, Reí, receptor de estrógenos, receptor de progesterona, receptor de testosterona, receptor de aldosterona, receptor de LDL, y corticosterona . 22. La composición de la reivindicación 20, en donde la proteina es homologa a una proteína terapéutica seleccionada del grupo que consiste de una Antitripsina Alpha-1, una Angiostatina, un Factor antihemolítico, un anticuerpo, una Apolipoproteína, una Apoproteína, un Factor natriurético atrial, un Polipéptido natriurético atrial, un Péptido atrial, una quimocina C-X-C, T39765, NAP-2, ENA-78, un Gro-a, un Gro-b, un Gro-c, un IP-10, un GCP-2, un NAP-4, un SDF-1, un PF4, un MIG, una Calcitonina, un ligando c-Kit, una citocina, una quimocina CC, una Proteína-1 quimoatrayente de monocitos, una Proteína-2 quimoatrayente de monocitos, una Protelna-3 quimoa rayente de monocitos, una Protelna-1 alfa inflamatoria de monocitos, una Proteína-1 beta inflamatoria de monocitos, RANTES, 1309, R83915, R91733, HCC1 , T58847, D31065, T64262, un CD40, un ligando CD40, un ligando c-Kit, un Colágeno, un Factor que estimula la colonia (CSF) , un Factor 5a del complemento, un Inhibidor del complemento, un Receptor 1 del complemento, una citocina, un Péptido-78 que Activa el Neutrofilo Epitelial, un GRO /MGSA, un GROP, un GROy, un MIP-l , un ???-?d, un MCP-1, un Factor de crecimiento epidérmico (EGF) , un Péptido que Activa el Neutrofilo Epitelial, una Eritropoyetina (EPO) , una Toxina de exfoliación, un Factor IX, un Factor VII, un Factor VIII, un Factor X, un Factor de crecimiento de fibroblastos (FGF) , un Fibrinógeno, una Fibronectina, un G-CSF, un GM-CSF, una Glucocerebrosidasa, una Gonadotropina, un factor de crecimiento, un receptor del factor de crecimiento, una proteína de Hedgehog, una Hemoglobina, un Factor del Crecimiento de Hepatocitos (HGF) , una Hirudina, una albúmina de suero humano, un ICAM-1, un receptor de ICAM-1, un LFA-1, un receptor de LFA-1, una Insulina, un Factor del Crecimiento Similar a Insulina (IGF), un IGF-I, un IGF-II, un interferón, un IFN- , un IFN-ß, un IFN-?, una interleucina, un IL-1, un IL-2, un IL-3, un IL-4, un IL-5, un IL-6, un IL-7, un IL-8, un IL-9, un IL-10, un IL-11, un IL-12, un Factor de Crecimiento de Queratinocitos (KGF) , una Lactoferrina, un Factor inhibidor de leucemia, una Luciferasa, una Neürturina, un Factor inhibidor de neutrófilos (NIF) , una oncostatina M, una Proteína osteogénica, un producto oncógeno, una Hormona paratiroidea, un PD-ECSF, un PDGF, una hormona de péptido, una Hormona del Crecimiento Humano, una Pleotropina, una proteína A, una proteína G, las Exotoxinas pirogénicas A, B, o C, una Relaxina, una Renina, un SCF, un Receptor 1 soluble del complemento, una I-CAM 1 soluble, los receptores de interleucina solubles, un receptor de TNF soluble, una Somatomedina, una Somatostatina, una Somatotropina, una Estreptocinasa, unos Superantigenos , unas Enterotoxinas estafilococales, un SEA, un SEB, un SEC1, un SEC2 , un SEC3, un SED, un SEE, un receptor de la hormona esteroide, una Superoxido dismutasa, una toxina del síndrome de choque tóxico, una Timosína alfa 1, un activador del plasminógeno de tejido, un factor de crecimiento tumoral (TGF) , un TGF-cc, un TGF-ß, un factor de necrosis tumoral, un Factor Alfa de Necrosis Tumoral, un factor beta de necrosis tumoral, un receptor del factor de necrosis tumoral (TNFR) , una proteína VLA-4, una proteína VCAM-1, un Factor de Crecimiento Endotelial Vascular (VEGEF) , una Urocinasa, un Mos, un Ras, un Raf, un Met; un p53, un Tat, un Fos, un Myc, un Jun, un Myb, un Reí, un receptor de estrógenos, un receptor de progesterona, un receptor de testosterona, un receptor de aldosterona, un Receptor de LDL, y una corticosterona . 23. La composición de la reivindicación 22, en donde la protelna es al menos aproximadamente 50% o al menos aproximadamente 75% idéntica a la protelna terapéutica. 24. La composición de la reivindicación 22, en donde la proteína terapéutica es eritropoyetina (EPO) . 25. La composición de la reivindicación 20, en donde la proteína comprende al menos dos aminoácidos no naturales . 26. La composición de la reivindicación 20, en donde la proteína comprende al menos tres aminoácidos no naturales . 27. La composición de la reivindicación 20, en donde la proteína comprende al menos cuatro aminoácidos no naturales . 28. La composición de la reivindicación 20, en donde la proteína comprende al menos cinco o más aminoácidos no naturales . 29. La composición de la reivindicación 20, en donde la composición comprende al menos aproximadamente 100 microgramos de proteína. 30. La composición de la reivindicación 20, en donde la proteína es DHFR y el al menos un aminoácido no natural se selecciona del grupo que consiste de O-metil-L-tirosina y L-3- (2-naftil) alanina . 31. Una composición que comprende una proteína, en donde la protexna comprende al menos un aminoácido no natural, y la proteina es homologa a una proteína terapéutica seleccionada del grupo que consiste de una citocina, un factor de crecimiento, un receptor del factor de crecimiento, un interferón, una interleucina, una molécula inflamatoria, un producto oncógeno, una hormona de péptido, una molécula de transducción de señal, un receptor de la hormona esteroide, un activador transcripcional , un supresor transcripcional , eritropoyetina (EPO) , insulina, hormona del crecimiento humano, Péptido-78 que Activa el Neutrófilo epitelial, GROoc/MGSA, G O , GROy, ???-?a, ???-?d, MCP-1, factor del crecimiento de hepatocitos, factor del crecimiento similar a insulina, factor inhibidor de leucemia, oncostatina M, PD-ECSF, PDGF, pleotropina, SCF, ligando c-Kit, VEGEF, G-CSF, IL-1, IL-2, IL-8, IGF-I, IGF-H, FGF (factor de crecimiento de fibrobl stos) , PDGF, TNF, TGF-a, TGF-ß, EGF (factor de crecimiento epidérmico) , KGF (factor de crecimiento de queratinocitos) , SCF/c-Kit, CD40L/CD40 , VLA-4/VCAM-1 , ICA -1/LFA-l, hyalurin/CD44, Mos, Ras, Raf, Met; p53, Tat, Fos, yc, Jun, Myb, Reí, receptor de estrógenos, receptor de progesterona, receptor de testosterona, receptor de aldosterona, Receptor de LDL, y corticosterona . 32. lina composición que comprende una proteína, en donde la proteína comprende al menos un aminoácido no natural, y la proteína es homologa a una proteína terapéutica seleccionada del grupo que consiste de una Antitripsina Alpha-1, una Angiostatina, un Factor antihemolítico, un anticuerpo, una Apolipoproteina, una Apoproteína, un Factor natriurético atrial, un Polipéptido natriurético atrial, un Péptido atrial, una quimocina C-X-C, T39765, NAP-2, ENA-78, un Gro-a, un Gro-b, un Gro-c, un IP-10, un GCP-2, un NAP-4, un SDF-1, un PF4, un MIG, una Calcitonina, un ligando c-Kit, una citocina, una quimocina CC, una Proteína-1 quimoatrayente de monocitos, una Proteína-2 quimoatrayente de monocitos, una Proteína-3 quimoatrayente de monocitos, una Protexna-1 alfa inflamatoria de monocitos, una Proteína-1 beta inflamatoria de monocitos, A TES, 1309, R83915, R91733, HCC1, T58847, D31065, T64262, un CD40, un ligando de CD40, un ligando c-Kit, un Colágeno, un Factor que Estimula la Colonia . (CSF) , un Factor 5a del complemento, un Inhibidor del complemento, el Receptor 1 del complemento, una citocina, un Péptido-78 que Activa el Neutrófilo Epitelial, un GROa/MGSA, un GROP, un GROy, un MIP-l , un ???-?d, un MCP-I, un Factor de Crecimiento Epidérmico (EGF) , un Péptido que Activa el Neutrófilo Epitelial, una Eritropoyetina (EPO) , una Toxina de exfoliación, un Factor IX, un Factor VII, un Factor VIII, un Factor X, un Factor de Crecimiento de Fibroblastos (FGF) , un Fibrinógeno, una Fibronectina, un G-CSF, un GM-CSF, una Glucocerebrosidasa, una Gonadotropina, un factor de crecimiento, un receptor del factor de crecimiento, una proteina de Hedgehog, una Hemoglobina, un Factor del crecimiento de hepatocitos (HGF) , una Hirudina, una albúmina de suero humano, un ICAM-1, un receptor de ICAM-1, un LFA-1, un receptor de LFA-1, una Insulina, un Factor del crecimiento similar a insulina (IGF) , un IGF-I, un IGF-II, un interferón, un IFN- , un IFN-ß, un IFN-?, una interleucina, un IL-1, un IL-2, un IL-3, un IL-4, un IL-5, un IL-6, un IL-7, un IL-8, un IL-9, un IL-10, un IL-11, un IL-12, un Factor de Crecimiento de Queratinocitos (KGF) , una Lactoferrina, un Factor inhibidor de leucemia, una Luciferasa, una Neurturina, un Factor inhibidor de neutrofilos (NIF) , una oncostatina M, una Proteína osteogénica, un producto oncógeno, una Hormona paratiroidea, un PD-ECSF, un PDGF, una hormona de péptido, una Hormona del Crecimiento Humano, una Pleotropina, una Proteína A, una Proteína G, unas Exotoxinas Pirogénicas A, B, o C, un Relaxina, una Reni a, un SCF, un Receptor 1 del complemento soluble, un I-CAM 1 soluble, los receptores de interleucina solubles, un receptor de TNF soluble, una Somatomedina, una Somatostatina, una Somatotropina, una Estreptocinasa, unos Superantígenos, unas Enterotoxinas estafilococales, un SEA, un SEB, un SEC1, un SEC2, un SEC3 , un SED, un SEE, un receptor de la hormona esteroide, una Superoxido dismutasa, una toxina del síndrome de choque tóxico, una Timosina alfa 1, un activador del plasminógeno de tejido, un factor de crecimiento tumoral (TGF) , un TGFa, un TGF-ß, un Factor de Necrosis Tumoral, un Factor Alfa de Necrosis Tumoral, un Factor Beta de Necrosis Tumoral, un Receptor del Factor de Necrosis Tumoral (TNFR) , una proteína VLA-4, una proteína VCAM-1, un Factor de Crecimiento Endotelial Vascular (VEGEF) , una Urocinasa, un Mos, un Ras, un af, un Met; un p53 , un Tat, un Fos, un Myc, un Jun, un yb, un Reí, un receptor de estrógenos, un receptor de progesterona, un receptor de testosterona, un receptor de aldosterona, un Receptor de LDL, y una corticosterona . 33. La composición de la reivindicación 32, en donde la protexna comprende al menos dos aminoácidos no naturales . 34. La composición de la reivindicación 32, en donde la proteína comprende al menos tres aminoácidos no naturales . 35. La composición de la reivindicación 32, en donde la proteína comprende al menos cuatro aminoácidos no naturales . 36. La composición de la reivindicación 32, en donde la proteína comprende al menos cinco o más aminoácidos no naturales . 37. La composición de la reivindicación 32, en donde la proteína es al menos aproximadamente 50% o al menos aproximadamente 75% idéntica a la proteína terapéutica. 38. La composición de la reivindicación 32, en donde la proteína terapéutica es eritropoyetina (EPO) . 39. Una composición que comprende una proteína y un excipiente farmacéuticamente aceptable, en donde la proteína comprende al menos un aminoácido no natural . 40. La composición de la reivindicación 39, en donde la proteína comprende al menos dos aminoácidos no naturales . 41. La composición de la reivindicación 39, en donde la proteína comprende al menos tres aminoácidos no naturales . 42. La composición de la reivindicación 39, en donde la proteína comprende al menos cuatro aminoácidos no naturales . 43. La composición de la reivindicación 39, en donde la proteína comprende al menos cinco o más aminoácidos no naturales . 44. La composición de la reivindicación 39, en donde la proteína es homologa a una proteína terapéutica seleccionada del grupo que consiste de una citocina, un factor de crecimiento, un receptor del factor de crecimiento, un interferón, una interleucina, una molécula inflamatoria, un producto oncógeno, una hormona de péptido, una molécula de transducción de señal, un receptor de la hormona esteroide, un activador transcripcional , un supresor transcripcional, eritropoyetina (EPO) , insulina, hormona del crecimiento humano, Péptido-78 que Activa el Neutrófilo epitelial, GRO /MGSA, GROP, GROy, MIP-la, ???-?d, MCP-1, factor del crecimiento de hepatocitos, factor del crecimiento similar a insulina, factor inhibidor de leucemia, oncostatina M, PD-ECSF, PDGF, pleotropina, SCF, ligando c-Kit, VEGEF, G-CSF, IL-1, IL-2, IL-8, IGF-I, IGF-II, FGF (factor de crecimiento de fibroblastos), PDGF, TNF, TGF- , TGF-ß, EGF (factor de crecimiento epidérmico) , KGF (factor de crecimiento de queratinocitos) , SCF/c-Kit, CD40L/CD40, VLA-4/VCAM-1 , ICAM-1/LFA-l, hyalurin/CD44 , Mos, Ras, Raf, Met; p53 , Tat, Fos, Myc, Jun, Myb, Reí, receptor de estrógenos, receptor de progesterona, receptor de testosterona, receptor de aldosterona, receptor de LDL, y corticosterona . 45. La composición de la reivindicación 39, en donde la proteína es homologa a una proteina terapéutica seleccionada del grupo que consiste de una Antitripsina Alpha-1, una Angiostatina, un Factor antihemolítico, un anticuerpo, una Apolipoproteina, una Apoproteína, un Factor natriurético atrial, un Polipéptido natriurético atrial, un Péptido atrial, una quimocina C-X-C, T39765, NAP-2, ENA-78, un Gro-a, un Gro-b, un Gro-c, una IP-10, un GCP-2, un NAP-4, un SDF-1, un PF4, un MIG, una Calcitonina, un ligando c-Kit, una citocina, una quimocina CC, una Proteína-1 quimoatrayente de monocitos, una Proteína-2 quimoatrayente de monocitos, una Proteína-3 quimoatrayente de monocitos, una proteína-1 alfa inflamatoria de raonocitos, una Proteina-1 beta inflamatoria de monocitos, RANTES, 1309, R83915, R91733, HCC1, T58847, D31065, T64262, un CD40, un ligando CD40, un ligando c-Kit, un Colágeno, un Factor que estimula la colonia (CSF) , un Factor 5a del complemento, un Inhibidor del complemento, un Receptor 1 del complemento, una citocina, un Péptido-78 que Activa el Neutrofilo Epitelial, una GROoc/MGSA, un GROp, un GROy, un MIP-loc, un ???-?d, un MCP-1, un Factor de Crecimiento Epidérmico (EGF) , un Péptido que Activa el Neutrofilo Epitelial, una Eritropoyetina (EPO) , una Toxina de exfoliación, un Factor IX, un Factor VII, un Factor VIII, un Factor X, un Factor de crecimiento de fibroblastos (FGF) , un Fibrinógeno, una Fibronectina, un G-CSF, un GM-CSF, una Glucocerebrosidasa, una Gonadotropina, un factor de crecimiento, un receptor del factor de crecimiento, una proteina de Hedgehog, una Hemoglobina, un Factor del crecimiento de hepatocitos (HGF) , una Hirudina, una albúmina de suero humano, un ICA -1, un receptor de ICA -1, un LFA-1, un receptor de LFA-1, una Insulina, un Factor del crecimiento similar a insulina (IGF), un IGF-I, un IGF-II, un interferón, un IFN-oc, un IFN-ß, un IFN-?, una interleucina, un IL-1, un IL-2, un IL-3, un IL-4, un IL-5, un IL-6, un IL-7, un IL-8, un IL-9, un IL-10, un IL-11, un IL-12, un Factor de Crecimiento de Queratinocitos (KGF) , una Lactoferrina, un Factor inhibidor de leucemia, una Luciferasa, una Neurturina, un Factor inhibidor de neutrófilos (NIF) , una oncostatina M, una Proteína osteogénica, un producto oncógeno, una Hormona Paratiroidea, un PD-ECSF, un PDGF, una hormona de péptido, una Hormona del crecimiento humano, una Pleotropina, una proteína A, una proteína G, unas Exotoxinas Pirogénicas A, B, o C, una Relaxina, una Renina, un SCF, un Receptor 1 del complemento soluble, una I-CAM 1 soluble, los receptores de interleucina solubles, un receptor de TNF soluble, una Somatomedina, una Somatostatina, una Somatotropina, una Estreptocinasa, unos Superantígenos , unas Enterotoxinas Estafilococales, un SEA, un SEB, un SEC1, un SEC2 , un SEC3 , un SED, un SEE, un receptor de hormona esteroide, una Superoxido dismutasa, una Toxina del síndrome de choque tóxico, una Timosina alfa 1, un activador del plasminógeno de te ido, un factor de crecimiento tumoral (TGF) , un TGF-oc, un TGF-ß, un Factor de Necrosis Tumoral, un Factor alfa de Necrosis Tumoral, un Factor beta de necrosis tumoral, un receptor del f ctor de necrosis tumoral (TNFR) , una proteína VLA-4, una proteína VCAM-1, un Factor de Crecimiento Endotelial Vascular (VEGEF) , una Urocinasa, un Mos, un Ras, un Raf, un Met ; un p53, un Tat , un Fos, un Myc, un Jun, un yb, un Reí, un receptor de estrógenos, un receptor de progesterona, un receptor de testosterona, un receptor de aldosterona, un Receptor de LDL y una cortxcosterona. 4G. La composición de la reivindicación 45, en donde la proteína es al menos aproximadamente 50% o al menos aproximadamente 75% idéntica a la protelna terapéutica. 47. La composición de la reivindicación 45, en donde la proteína terapéutica es eritropoyetina (EPO) . 48. Un método para producir en un sistema de traducción al menos una proteína que comprende al menos un aminoácido no natural, comprendiendo el método: proporcionar el sistema de traducción con al menos un ácido nucleico que comprende al menos un codón selector, en donde el ácido nucleico codifica la al menos una proteína; proporcionar el sistema de traducción con un AR t ortogonal (O-ARNt) , en donde el 0-ARNt funciona en el sistema de traducción y en donde el 0-ARNt reconoce el al menos un codón selector; proporcionar el sistema de traducción con una aminoacil ARNt sintetasa ortogonal (O-RS) , en donde la O-RS preferentemente aminoacila el O-ARNt con el al menos un aminoácido no natural en el sistema de traducción; y proporcionar el sistema de traducción con el al menos un aminoácido no natural, produciendo mediante esto en el sistema de traducción la al menos una proteína que comprende el al menos un Aminoácido no natural . 49. El método de la reivindicación 48, en donde el sistema de traducción comprende una célula. 50. El método de la reivindicación 49, en donde el sistema de traducción comprende una célula bacterial . 51. El método de la reivindicación 50, en donde el sistema de traducción comprende una célula de Escherichia coli . 52. El método de la reivindicación 49, en donde el sistema de traducción comprende una célula arqueobacterial . 53. El método de la reivindicación 49, en donde el sistema de traducción comprende una célula eucariótica. 54. El método de la reivindicación 53 , en donde la célula eucariótica comprende una célula de levadura, una célula de mamífero, una célula de planta o una célula de insecto. 55. La proteína que comprende al menos un aminoácido no natural producido por el método de la reivindicación 49, en donde la proteína se procesa y modifica en una forma dependiente de la célula. 56. La proteína de la reivindicación 55, en donde la proteína es homologa a una proteína terapéutica seleccionada del grupo que consiste de una citocina, un factor de crecimiento, un receptor del factor de crecimiento, un interferón, una interleucina, una molécula inflamatoria, un producto oncógeno, una hormona de péptido, una molécula de transducción de señal, un receptor de la hormona esteroide, un activador transcripcional , un supresor transcripcional , eritropoyetina (EPO) , insulina, hormona del crecimiento humano, Péptido-78 que Activa el Neutrófilo epitelial, G O /MGSA, GROp, GROy, MIP-l , ???-?d, MCP-1, factor del crecimiento de hepatocitos, factor del crecimiento similar a insulina, factor inhibidor de leucemia, oncostatina M, PD-ECSF, PDGF, pleotropina, SCF, ligando c-Kit, VEGEF, G-CSF, IL-1, IL-2, IL-8, IGF-I, IGF-II, FGF (factor de crecimiento de fibroblastos) , PDGF, TNF, TGF-a, TGF-ß, EGF (factor de crecimiento epidérmico) , KGF (factor de crecimiento de queratinocitos) , SCF/c-Kit, CD40L/CD40, VLA-4/VCAM-1 , ICAM-1/LFA-l, hyalurin/CD44, Mos, Ras, Raf, Met; p53, Tat, Fos, Myc, Jun, Myb, Reí, receptor de estrógenos, receptor de progesterona, receptor de testosterona, receptor de aldosterona, Receptor de LDL, y corticosterona . 57. La proteína de la reivindicación 55, en donde la proteína es homologa a una proteína terapéutica seleccionada del grupo que consiste de una Antitripsina Alpha-1, una Angiostatina, un Factor antihemolítico, un anticuerpo, una Apolipoproteína, una Apoproteína, un Factor natriurético atrial, un Polipéptido natriurético atrial, un Péptido atrial, una quimocina C-X-C, T39765, NAP-2, ENA-78, un Gro-a, un Gro-b, un Gro-c, un IP-10, un GCP-2, un NAP-4, un SDF-1, un PF4, un MIG, una Calcitonina, un ligando c-Kit, una citocina, una quimocina CC, una Proteína-1 quimoatrayente de monocitos, una Proteína-2 quimoatrayente de monocitos, una Proteína-3 quimoatrayente de monocitos, una Proteína-1 alfa inflamatoria de monocitos, una Proteína-1 beta inflamatoria de monocitos, RANTES, 1309, R83915, R91733, HCC1, T58847, D31065, T64262, un CD40, un ligando CD40, un ligando c-Kit, un Colágeno, un factor que estimula la colonia (CSF) , un Factor 5a del complemento, un Inhibidor del complemento, un Receptor 1 del complemento, una citocina, un Péptido-78 que Activa el Neutrofilo Epitelial, un GRO /MGSA, un GRC-ß, un GROy, un MlP-la, un ???-?d, un MCP-1, un Factor de crecimiento epidérmico (EGF) , un Péptido que Activa el Neutrofilo Epitelial, una Eritropoyetina (EPO) , una Toxina de exfoliación, un Factor IX, un Factor VII, un Factor VIII, un Factor X, un Factor de crecimiento de fibroblastos (FGF) , un Fibrinógeno, una Fibronectina, un G-CSF, un GM-CSF, una Glucocerebrosidasa, una Gonadotro ina, un factor de crecimiento, un receptor del factor de crecimiento, una proteína de Hedgehog, una Hemoglobina, un Factor del Crecimiento de Hepatocitos (HGF) , una Hirudina, una albúmina de suero humano, un ICAM-1, un receptor de ICAM-1, un LFA-1, un receptor de LFA-1, una Insulina, un Factor del Crecimiento Similar a Insulina (IGF) , un IGF-I, un IGF-II, un interferón, un IFN-oc, un IFN-ß, un IFN-?, una interleucina, un IL-1, un IL-2, un IL-3, un IL-4, un IL-5, un IL-6, un IL-7, un IL-8, un IL-9, un IL-10, un IL-11, un IL-12, un Factor de Crecimiento de Queratinocitos (KGF) , una Lactoferrina, un Factor inhibidor de leucemia, una Luciferasa, una Neurturina, un Factor inhibidor de neutrofilos (NIF) , una oncostatina M, una Proteína osteogénica, un producto oncógeno, una Hormona paratiroidea, un PD-ECSF, un PDGF, una hormona de péptido, una Hormona del Crecimiento Humano, una Pleotropina, una proteína A, una proteína G, las Exotoxinas Pirogénicas A, B, o C, una Relaxina, una Renina, un SCF, un receptor 1 soluble del complemento, una I-CAM 1 soluble, los receptores de interleucina solubles, un receptor de TNF soluble, una Somatomedina, una Somatostatina, una Somatotropina, una Estreptocinasa, unos Superantígenos , unas Enterotoxinas Estafilococales, un SEA, un SEB, un SEC1, un SEC2 , un SEC3 , un SED, un SEE, un receptor de la hormona esteroide, una Superoxido dismutasa, una toxina del síndrome de choque tóxico, una Timosina alfa 1, un activador del plasminógeno de tejido, un factor de crecimiento tumoral (TGF) , un TGF-cc, un TGF-ß, un factor de necrosis tumoral, un Factor Alfa de Necrosis Tumoral, un factor beta de necrosis tumoral, un receptor del factor de necrosis tumoral (TNFR) , una proteína VLA-4, una proteína VCAM-1, un Factor de Crecimiento Endotelial Vascular (VEGEF) , una Urocinasa, un Mos, un Ras, un Raf, un Met; un p53, un Tat, un Fos, un Myc, un Jun, un Myb, un Reí, un receptor de estrógenos, un receptor de progesterona, un receptor de testosterona, un receptor de aldosterona, un Receptor de LDL, y una corticosteron . 58. La proteína de la reivindicación 57, en donde la protelna es al menos aproximadamente 50% o al menos aproximadamente 75% idéntica a la proteína terapéutica. 59. La proteína de la reivindicación 57, en donde la proteína terapéutica es eritropoyetina (EPO) . 60. La proteína de la reivindicación 55, en donde la proteína comprende al menos dos aminoácidos no naturales. 61. La proteína de la reivindicación 55, en donde la proteína comprende al menos tres aminoácidos no naturales . 62. La proteína de la reivindicación 55, en donde la proteína comprende al menos cuatro aminoácidos no naturales . 63. La proteína de la reivindicación 55, en donde la proteína comprende al menos cinco o más aminoácidos no naturales . 64. El método de la reivindicación 48, en donde el sistema de traducción comprende un sistema de traducción in vitro . 65. El método de la reivindicación 64, en donde el sistema de traducción comprende un extracto de célula. 66. El método de la reivindicación 48 en donde la al menos una proteína es un mutante Aspll2TAG de cloranfenicol acetiltransferasa (CAT) , un mutante Tyrl63TAG de reductasa de dihidrofolato de ratón (DHFR) o un mutante Tyrl63TAG de reductasa de dihidrofolato de ratón (DHFR) que comprende un COOH His6tag. 67. El método de la reivindicación 48 en donde el aminoácido no natural se selecciona del grupo" que consiste de: una O-metil-L-tirosina, una L-3- (2-naftil) alanina, una 3-raetilfenilalanina, una 0-4-alil-L-tirosina, una 4-propil-L-tirosina, una tri-O-acetil-GlcNAcP-serina, una L-Dopa, una fenilalanina fluorinada, una isopropil-L-fenilalanina, una p-azido-L-fenilalanina, una p-acil-L-fenilalanina, una p-benzoil-L-fenilalanina, una L-fosfoserina, una fosfonoserina, una fosfonotirosina, una p-yodo-fenilalanina, una p-bromofenilalanina, una p-amino-L-fenilalanina, una isopropil-L-fenilalanina, un análogo no natural de un aminoácido de tirosina; un análogo no natural de un aminoácido de glutamina; un análogo no natural de un aminoácido de fenilalanina; un análogo no natural de un aminoácido de serina; un análogo no natural de un aminoácido de treonina; un alquilo, arilo, acilo, azido, ciano, halo, hidrazina, hidrácido, hidroxilo, alquenilo, alquinilo, éter, tiol, sulfonilo, seleno, éster, tioácido, borato, boronato, fosfo fosfono, fosfina, heterocíclico, enona, imina, aldehido, hidroxilamina, ceto o aminoácido sustituido de amino o cualquier combinación de los mismos; un aminoácido con un reticulador fotoactivable,- un aminoácido etiquetado de giro; un aminoácido fluorescente; un aminoácido con un nuevo grupo funcional ; un aminoácido que interactúa covalente o no covalentemente con otra molécula; un aminoácido que se une a metal; un aminoácido que contiene metal; un aminoácido radioactivo; un aminoácido fotocargado y/o fotoisomerizable ; una biotina o aminoácido que contiene un análogo de biotina; un aminoácido glicosilado o carbohidrato modificado; un aminoácido que contiene ceto; aminoácidos que comprenden polietilen glicol o poliéter; un aminoácido sustituido de átomo pesado; un aminoácido químicamente desdoblable o fotodesdoblable; un aminoácido con una cadena lateral agrandada; un aminoácido que contiene un grupo tóxico; un aminoácido azúcar sustituido, e.g., una serina azúcar sustituida o lo similar; un aminoácido que contiene azúcar enlazado a carbono; un aminoácido redox-activo; un ácido que contiene oc-hidroxí; un aminoácido que contiene ácido aminotio; un aminoácido a, disustituido; un ß-aminoácido; y un aminoácido cíclico diferente a la prolina. 68. El método de la reivindicación 48 en donde el al menos un aminoácido no natural es una O-metil-L-tirosina. 69. El método de la reivindicación 48 en donde el al menos un aminoácido no natural es una L-3- (2-naftil) alanina. 70. El método de la reivindicación 48 en donde el al menos un aminoácido no natural es un análogo de fenilalanina que contiene amino-, isopropilo- u O-alilo. 71. El método de la reivindicación 48, en donde el O-ARNt comprende un ácido nucleico que comprende una secuencia de polinucleótidos seleccionada del grupo que consiste de: SEQ ID NO: 1-3 y una secuencia de polinucleótidos complementaria de las mismas . 72. El método de la reivindicación 48 en donde el al menos un codón selector es un codón sin sentido, un codón raro, o un codón de cuatro bases. 73. El método de la reivindicación 72 en donde el codón sin sentido es un codón ámbar. 74. El método de la reivindicación 48, en donde la 0-RS preferentemente aminoacila el O-ARMt con una O-metil-L-tirosina . 75. El método de la reivindicación 48, en donde la 0-RS preferentemente aminoacila el 0-AKNt con un análogo de fenilalanina que contiene amino- , isopropil-, u O-alilo. 76. El método de la reivindicación 48, en donde la O-RS comprende un polipéptido seleccionado del grupo que consiste de: un polipéptido que comprende una secuencia de aminoácidos seleccionada del grupo que consiste de SEQ ID NO: 4-34; y un polipéptido codificado por un ácido nucleico que comprende una secuencia de polinucleótidos seleccionada del grupo que consiste de SEQ ID NO: 35-66 y una secuencia de polinucleótidos complementaria de las mismas. 77. El método de la reivindicación 48 en donde el aminoácido no natural se proporciona de manera exógena . 78. El método de la reivindicación 48 en donde el sistema de traducción es una célula y el aminoácido no natural se biosintetiza por la célula. 79. Un método para producir en una célula de Escherichia coli al menos una proteina que comprende al menos una O-metil-L-tirosina, comprendiendo el método: proporcionar el sistema de traducción con al menos un ácido nucleico que comprende un codón ámbar, en donde el ácido nucleico codifica para la al menos una proteína; proporcionar el sistema de traducción con un ARNtm CUyAr , en donde el ARNtmT CUyAr funciona en la célula yJ en donde el AR tmTCyUAr reconoce el codón ámbar; proporcionar el sistema de traducción con un TyrRS mutante (LWJ16) , en donde el TyrRS mutante (LWJ16) aminoacila el ARNtmT CyUAr con la O-metil-L-tirosina en la célula; yJ proporcionar la célula con la O-metil-L-tirosina, produciendo mediante esto en la célula al menos una proteína que comprende la O-metil-L-tirosina. 80. Un método para producir en una célula de Escherichia coli al menos una proteína que comprende al menos ¦una L-3- (2-naftil) alanina, comprendiendo el método: proporcionar el sistema de traducción con al menos un ácido nucleico -que comprende un codón ámbar, en donde el ácido nucleico codifica para la al menos una proteína; proporcionar la célula con un ARNtmT CUyAr , en donde el ARNtmTCUyAr funciona en la célula y en donde el ARNfc CUA reconoce el codón ámbar; proporcionar la célula con una SS 12-TyrRS, en donde el SS 12-TyrRS aminoacila el ARNtmT CYUAr con la L-3- (2 -naftil) alanina en la célula; y proporcionar la célula con la L-3- (2-naftil) alanina, produciendo mediante esto en la célula al menos una proteina que comprende la L-3- (2-naftil) alanina. 81. Una composición que comprende un aminoácido no natural como se muestra en la Fórmula I : I 82. Una composición que comprende un aminoácido no natural como se muestra en la Fórmula II : p 83. Una composición que comprende un aminoácido no natural como se muestra en la Fórmula III: 84. Una composición que comprende un aminoácido no natural como se muestra en la Fórmula IV: IV 85. La composición de la reivindicación 81, reivindicación 82 , reivindicación 83, o reivindicación 84, que comprende además un ARNt ortogonal . 86. La composición de la reivindicación 85, en donde el aminoácido no natural se enlaza covalentemente al ARNt ortogonal . 87. La composición de la reivindicación 85, en donde el aminoácido no natural se enlaza covalentemente al ARNt ortogonal a través de un enlace amino-acilo. 88. La composición de la reivindicación 85, en donde el aminoácido no natural se enlaza covalentemente a un 3 ' OH o un 2 'OH de un azúcar ribosa terminal del ARNt ortogonal . 89. La composición de la reivindicación 81, reivindicación 82, reivindicación 83, o reivindicación 84, que comprende además una aminoacil ARNt sintetasa ortogonal . 90. La composición de la reivindicación 89, en donde el aminoácido no natural es hidrógeno enlazado a la aminoacil ARNt sintetasa ortogonal . 91. Una proteína que comprende el aminoácido no natural de la reivindicación 81, reivindicación 82, reivindicación 83 , o reivindicación 84. 92. Una célula que comprende el aminoácido no natural de la reivindicación 81, reivindicación 82, reivindicación 83, o reivindicación 84. 93. Un método para sintetizar una 4-alil-L-tirosina, comprendiendo el método: (a) hacer reaccionar una tirosina protegida con bromuro de alilo, dando como resultado una tirosina de alilo protegida; y, (b) desproteger la tirosina de alilo protegida para producir 4-alil-L-tirosina. 94.. El método de la reivindicación 93, que comprende hacer reaccionar el bromuro de alilo y la tirosina protegida en la presencia de hidruro de sodio y DMF. 95. El método de la reivindicación 93 , en donde la tirosina protegida comprende una tirosina NBoc protegida. 96. El método de la reivindicación 95, en donde (b) comprende desproteger la tirosina de alilo protegida en una solución acídica. 97. El método de la reivindicación 95, en donde (b) comprende desproteger la tirosina de alilo protegida en la presencia de ácido clorhídrico y dioxano. 98. El método de la reivindicación 9 , que comprende además extraer la 4-alil-L-tirosina con etanol o diclorometano . 99. Un método para sintetizar un análogo de fenilalanina meta-sustituido, comprendiendo el método: (a) condensar dietilacetamidomalonato y un bromuro de bencilo meta-sustituido, dando como resultado un compuesto que tiene la fórmula V: (b) hidrolizar el compuesto que tiene la Fórmula V, dando como resultado un análogo de fenilalanina meta-sustituido . 100. El método de la reivindicación 99, en donde R consta de un grupo ceto, acetilo o metoxi . 101. El método de la reivindicación 99, en donde el análogo de fenilalanina meta sustituido consta de 3-metoxi-fenilalanina o 3-acetil-fenilalanina . 102. El método de la reivindicación 99, en donde el compuesto de la Fórmula V comprende 1- (3-bromometil-fenil) -etanona . 103. El método de la reivindicación 99, comprendiendo además el método proporcionar el bromuro de bencilo meta sustituido mediante: hacer reaccionar N-bromosuccinimida con 3-metilacetofenona para producir un producto bromado; y cristalizar el producto bromado en una solución de hexano . 104. Un método para preparar un aminoácido glicosilado in vivo, comprendiendo el método: transformar una célula con un plásmido que comprende un gen para una N-acetil-galactosaminidasa, una transglicosilasa o una serina-glicosilhidrolasa . 105. Un método para preparar p-aminofenilalanina, comprendiendo el método: (a) convertir enzimáticamente corismato a ácido 4-amino-4-desoxicorísmico; (b) convertir enzimáticamente el ácido 4-amino-4-desoxicorismico a ácido 4-amino-4-desoxiprefénico; (c) convertir enzimáticamente el ácido 4-amino-4-desoxiprefénico a ácido p-aminofenil-pirúvico; y (d) convertir enzimáticamente el ácido p-aminofenil-pirúvico en p-aminofenilalanina . 106. El método de la reivindicación 105, en donde (a) comprende poner en contacto el corismato con una 4-amino-4-desoxicorismato sintasa. 107. El método de la reivindicación 106, en donde la 4-amino-4-desoxicorismato sintasa comprende papA. 108. El método de la reivindicación 105, en donde (b) comprende poner en contacto el ácido 4-amino-4-desoxicorismico con una corismato mutasa. 109. El método de la reivindicación 108, en donde la corimato mutasa comprende papB. 110. El método de la reivindicación 105, en donde (c) comprende poner en contacto el ácido 4-amino-4-desoxiprefénico con una prefenato deshidrogenasa . 111. El método de la reivindicación 110, en donde la prefenato deshidrogenasa comprende papC. 112. El método de la reivindicación 105, en donde (d) comprende poner en contacto el ácido p-aminofenil-pirúvico con una aminotransferasa. 113. El método de la reivindicación 112 , en donde la aminotransferasa comprende una aminotransferasa de tirosina no específica derivada de E coli . 114. El método de la reivindicación 116, en donde la aminotransferasa comprende tyrB, aspS o UVE. 115. El método de la reivindicación 105, en donde las etapas (a) a (d) se realizan in vivo. 116. Un método para producir p-aminofenilalanina en una célula de Escherichia coli, comprendiendo el método transformar la célula con un plásmido que comprende papA, papB y papC, en donde la célula comprende corismato y una aminotransferasa y en donde la expresión de papA, papB y papC da como resultado una sintasa, una mutasa y una deshidrogenasa, en donde la sintasa, la mutasa, la deshidrogenasa y la aminotransferasa producen p-fenilalanina a partir de corismato. 117. Una célula que comprende: (a) un sistema de trayectoria biosintética para producir un aminoácido no natural a partir de una o más fuentes de carbono dentro de la célula; y (b) un sistema de traducción que comprende un ARNt ortogonal (O-AR t) y una aminoacil ARNt sintetasa ortogonal (O-RS) , en donde la O-RS preferentemente aminoacila el O-ARNt con el aminoácido no natural y el O-ARNt incorpora el aminoácido no natural en una proteína en respuesta a un codón selector. 118. La célula de la reivindicación 117, en donde la célula comprende una célula bacterial. 119. La célula de la reivindicación 117, en donde el codón selector comprende un codón sin sentido, un codón de cuatro bases o un codón ámbar. 120. La célula de la reivindicación 119, en donde el codón sin sentido comprende un codón TAG. 121. La célula de la reivindicación 117, en donde el sistema de trayectoria biosintética produce una cantidad celular natural del aminoácido no natural . 122. La célula de la reivindicación 117, en donde el sistema de trayectoria biosintética comprende una sintasa, una mutasa, una deshidrogenasa y una aminotransferasa . 123. La célula de la reivindicación 122, en donde la sintasa comprende 4-amino-4-desoxicorismato sintasa. 124. La célula de la reivindicación 122, en donde la mutasa comprende corismato mutasa. 125. La célula de la reivindicación 122, en donde la deshidrogenasa comprende prefenato deshidrogenasa. 126. La célula de la reivindicación 122, en donde la sintasa, la deshidrogenasa y la mutasa se derivan de Streptomyces Venezuelae o Streptomyces pristinaespiralis y la aminotransferasa se deriva de E. coli. 127. La célula de la reivindicación 117, en donde el aminoácido no natural comprende p-aminofenilalaniña, dopa u O-metil-L-tirosina . 128. La célula de la reivindicación 117, en donde el aminoácido no natural comprende un aminoácido glicosilado o un aminoácido pegilado. 129. La célula de la reivindicación 117, en donde la fuente de carbono comprende corismato. 130. La célula de la reivindicación 117, en donde el sistema de trayectoria biosintética produces p-aminofenilalanina a partir de corismato. 131. La célula de la reivindicación 117, en donde el sistema de trayectoria biosintética: (a) convierte enzimáticamente corismato a ácido 4-amino-4-desoxicorísmico; (b) convierte enzimáticamente el ácido 4-amino-4-desoxicorismico a ácido 4-amino-4-desoxiprefénicos; (c) convierte enzimáticamente el ácido 4-amino-4-desoxiprefénico a ácido p-aminofenil-pirúvico; y (d) convierte enzimáticamente el ácido p-aminofenil-pirúvico en p-aminofenilalanina. 132. La célula de la reivindicación 117, en donde la célula produce el aminoácido no natural en una cantidad suficiente para la biosíntesis de la proteína, cuya cantidad no altera sustancialmente la concentración de cualquier aminoácido natural o agotar el recurso celular. 133. La célula de la reivindicación 132, en donde el aminoácido no natural es p-aminofenilalanina, L-dopa u 0-metil-L-tirosina. 134. La célula de la reivindicación 117, en donde el sistema de trayectoria biosintética comprende un plásmido, cuyo plásmido comprende un polinucleótido que codifica una corismato sintasa, un polinucleótido que codifica una corismato mutasa y un polinucleótido que codifica una prefenato deshidrogenasa . 135. La célula de la reivindicación 117, en donde la célula comprende un plásmido, cuyo plásmido comprende un gen papA, un gen papB y un gen papC. 136. La célula de la reivindicación 135, en donde el plásmido comprende además un promotor Ipp y un promotor lac . 137. La célula de la reivindicación 135, en donde el plásmido comprende además uno o más sitios de unión a ribosoma . 138. La célula de la reivindicación 135, en donde el plásmido es un plásmido derivado de un pSClOl de bajo número de copias . 139. Una célula que comprende uno o más sistemas para producir al menos veintiún aminoácidos y específicamente incorporar uno o más de los aminoácidos en una o más proteínas dentro de la célula, dando como resultado uno o más aminoácidos incorporados, en donde al menos uno de los aminoácidos incorporados comprende un aminoácido no natural . 140. Un método para identificar una ventaja proporcionada por un aminoácido no natural que se ha incorporado en una célula, comprendiendo el método: (a) proporcionar una biblioteca de células, comprendiendo cada una de las células un plásmido aleatorizado derivado de un genoma de E. coli, en donde uno o más de los plásmidos aleatorizados confiere a las células la capacidad para incorporar un aminoácido no natural en una proteína . (b) examinar la biblioteca de células para identificar una o más células con desarrollo mejorado en comparación a una célula natural de E. coli, identificando así una ventaja proporcionada por el aminoácido no natural.
MXPA03009563A 2001-04-19 2002-04-19 Incorporacion in vivo de aminoacidos no naturales. MXPA03009563A (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US28503001P 2001-04-19 2001-04-19
US35551402P 2002-02-06 2002-02-06
PCT/US2002/012465 WO2002085923A2 (en) 2001-04-19 2002-04-19 In vivo incorporation of unnatural amino acids

Publications (1)

Publication Number Publication Date
MXPA03009563A true MXPA03009563A (es) 2004-12-06

Family

ID=26962950

Family Applications (2)

Application Number Title Priority Date Filing Date
MXPA03009563A MXPA03009563A (es) 2001-04-19 2002-04-19 Incorporacion in vivo de aminoacidos no naturales.
MXPA03009566A MXPA03009566A (es) 2001-04-19 2002-04-19 Metodos y composicion para la produccion de pares trna-aminoaciltrna sintetasa ortogonales.

Family Applications After (1)

Application Number Title Priority Date Filing Date
MXPA03009566A MXPA03009566A (es) 2001-04-19 2002-04-19 Metodos y composicion para la produccion de pares trna-aminoaciltrna sintetasa ortogonales.

Country Status (11)

Country Link
US (19) US7045337B2 (es)
EP (5) EP2322631B1 (es)
JP (7) JP2004537984A (es)
AU (2) AU2002256292C1 (es)
CA (2) CA2443757C (es)
DK (4) DK1456360T3 (es)
ES (1) ES2464532T3 (es)
HK (4) HK1065065A1 (es)
IL (7) IL158419A0 (es)
MX (2) MXPA03009563A (es)
WO (2) WO2002086075A2 (es)

Families Citing this family (395)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DK1456360T3 (en) * 2001-04-19 2015-08-31 Scripps Research Inst Methods and Composition for Preparation of Orthogonal TRNA-Aminoacyl-TRNA Synthetase Pairs
US6964859B2 (en) 2001-10-16 2005-11-15 Massachusetts Institute Of Technology Suppressor tRNA system
US20030148391A1 (en) * 2002-01-24 2003-08-07 Salafsky Joshua S. Method using a nonlinear optical technique for detection of interactions involving a conformational change
US7112435B1 (en) 2002-08-07 2006-09-26 Ambit Biosciences Corporation Uncoupling of DNA insert propagation and expression of protein for phage display
US20040038273A1 (en) * 2002-06-17 2004-02-26 Whitehead Institute For Biomedical Research Bifunctional tRNA for in vitro selection
WO2004011902A2 (en) * 2002-07-25 2004-02-05 Mds Proteomics Inc. Improved systems and methods for analysis of protein post-translational modification
US7897381B2 (en) * 2002-08-07 2011-03-01 Ambit Biosciences Corporation Uncoupling of DNA insert propagation and expression of protein for phage display
US7833741B2 (en) * 2002-08-07 2010-11-16 Ambit Biosciences Corporation Uncoupling of DNA insert propagation and expression of protein for phage display
US7563600B2 (en) 2002-09-12 2009-07-21 Combimatrix Corporation Microarray synthesis and assembly of gene-length polynucleotides
WO2004035605A2 (en) 2002-10-16 2004-04-29 The Scripps Research Institute Glycoprotein synthesis
SI1578949T1 (sl) 2002-10-16 2009-08-31 Scripps Research Inst Usmerjena vključitev keto aminokislin v proteine
US7642085B2 (en) 2002-12-22 2010-01-05 The Scripps Research Institute Protein arrays
ATE512674T1 (de) 2003-01-06 2011-07-15 Angiochem Inc Angiopep-1, verwandte verbindungen, und deren verwnedungen
US7772188B2 (en) 2003-01-28 2010-08-10 Ironwood Pharmaceuticals, Inc. Methods and compositions for the treatment of gastrointestinal disorders
JP2006180701A (ja) * 2003-02-10 2006-07-13 Institute Of Physical & Chemical Research チロシルtRNA合成酵素の変異体及びその作製方法
JP5642916B2 (ja) 2003-04-17 2014-12-17 ザ スクリプス リサーチ インスティテュート 真核遺伝コードの拡張
AU2013201487B2 (en) * 2003-04-17 2014-09-18 The Scripps Research Institute Expanding the eukaryotic genetic code
WO2004110964A2 (en) * 2003-06-16 2004-12-23 Nuevolution A/S Encoded molecules by translation (emt)
CN102618605B (zh) 2003-06-18 2015-09-02 斯克利普斯研究院 非天然活性氨基酸遗传密码增加
US7527943B2 (en) 2003-07-07 2009-05-05 The Scripps Research Institute Compositions of orthogonal glutamyl-tRNA and aminoacyl-tRNA synthetase pairs and uses thereof
US20060160175A1 (en) * 2003-07-07 2006-07-20 The Scripps Research Institute Compositions of orthogonal leucyl-trna and aminoacyl-trna synthetase pairs and uses thereof
EP1649004A4 (en) * 2003-07-07 2008-04-09 Scripps Research Inst COMPOSITIONS WITH PAIRS OF ORTHOGONAL LYSYL-TRNA AND AMINOACYL-TRNA-SYNTHETASE AND USES THEREOF
WO2005047461A2 (en) * 2003-08-18 2005-05-26 The Regents Of The University Of California Polypeptide display libraries and methods of making and using thereof
DK1687401T3 (da) * 2003-10-14 2013-02-04 Scripps Research Inst Sted-spicifik inkorporing af redoxaktive aminosyrer i protiener
US20050181395A1 (en) * 2003-12-12 2005-08-18 Conjugon, Inc. Systems for tightly regulated gene expression
JP4752002B2 (ja) * 2003-12-18 2011-08-17 ザ スクリプス リサーチ インスティチュート 哺乳動物細胞内の蛋白質への5−ヒドロキシトリプトファンの選択的組込み
GB2429207A (en) * 2004-02-02 2007-02-21 Ambrx Inc Modified human interferon polypeptides and their uses
AU2005319099B2 (en) 2004-02-02 2010-09-16 Ambrx, Inc. Modified human growth hormone
CA2558749A1 (en) * 2004-02-27 2005-09-29 President And Fellows Of Harvard College Polynucleotide synthesis
FR2868081A1 (fr) * 2004-03-23 2005-09-30 Libragen Sa Methode d'identification de famille de voie metabolique par selection positive
US20050260711A1 (en) * 2004-03-30 2005-11-24 Deepshikha Datta Modulating pH-sensitive binding using non-natural amino acids
WO2005100560A1 (ja) * 2004-04-09 2005-10-27 Chugai Seiyaku Kabushiki Kaisha 細胞死誘導剤
US20050287639A1 (en) * 2004-05-17 2005-12-29 California Institute Of Technology Methods of incorporating amino acid analogs into proteins
EP1774018A2 (en) 2004-05-25 2007-04-18 The Scripps Research Institute Site specific incorporation of heavy atom-containing unnatural amino acids into proteins for crystal structure determination
US20060008844A1 (en) * 2004-06-17 2006-01-12 Avidia Research Institute c-Met kinase binding proteins
KR101699142B1 (ko) * 2004-06-18 2017-01-23 암브룩스, 인코포레이티드 신규 항원-결합 폴리펩티드 및 이의 용도
ZA200609926B (en) * 2004-06-18 2009-02-25 Ambrx Inc Novel antigen-binding polypeptides and their uses
US7740846B2 (en) 2004-07-20 2010-06-22 Genentech, Inc. Inhibitors of angiopoietin-like 4 protein, combinations, and their use
EP1771573A4 (en) * 2004-07-21 2009-02-18 Ambrx Inc BIOSYNTHETIC POLYPEPTIDES OBTAINED FROM NON-NATURALLY CITED AMINO ACIDS
JP2008513039A (ja) * 2004-09-21 2008-05-01 ザ スクリップス リサーチ インスティテュート 真正細菌の蛋白質へのアルキニルアミノ酸のインビボ組込み
JP2008513806A (ja) * 2004-09-22 2008-05-01 ザ スクリップス リサーチ インスティテュート Nmr試験のための蛋白質の部位特異的標識
JP2008523786A (ja) * 2004-10-18 2008-07-10 コドン デバイシズ インコーポレイテッド 高忠実度合成ポリヌクレオチドのアセンブリ方法
US20070122817A1 (en) * 2005-02-28 2007-05-31 George Church Methods for assembly of high fidelity synthetic polynucleotides
EP1809758A4 (en) * 2004-10-20 2009-04-01 Scripps Research Inst LOCAL IN VIVO INSTALLATION OF N-ACETYLGALACTOSAMINE AMINO ACIDS IN EU BACTERIA
US8216804B2 (en) * 2004-10-27 2012-07-10 The Scripps Research Institute Orthogonal translation components for the in vivo incorporation of unnatural amino acids
AU2011204773B2 (en) * 2004-10-27 2012-02-02 The Scripps Research Institute Orthogonal translation components for the in vivo incorporation of unnatural amino acids
EP1814573B1 (en) 2004-10-29 2016-03-09 ratiopharm GmbH Remodeling and glycopegylation of fibroblast growth factor (fgf)
WO2006055898A2 (en) * 2004-11-20 2006-05-26 Massachusetts Institute Of Technology Orthogonal suppressor trnas and aminoacyl-trna synthetases and uses thereof
US20090023139A1 (en) * 2004-11-22 2009-01-22 Kazuya Nishikawa Method For Site-Specifically Introducing Non-Natural Amino Acid Into Protien Using Mitochondrial Protein and Method For Effectively Preparing Trna
EP1836298B1 (en) 2004-12-22 2012-01-18 Ambrx, Inc. COMPOSITIONS OF AMINOACYL-tRNA SYNTHETASE AND USES THEREOF
DK1828224T3 (en) * 2004-12-22 2016-07-18 Ambrx Inc Compositions containing, methods including, AND USES OF NON-NATURAL AMINO ACIDS AND POLYPEPTIDES
AU2013205030B2 (en) * 2004-12-22 2016-05-12 Ambrx, Inc. Compositions containing, methods involving, and uses of non-natural amino acids and polypeptides
US8080391B2 (en) * 2004-12-22 2011-12-20 Ambrx, Inc. Process of producing non-naturally encoded amino acid containing high conjugated to a water soluble polymer
US7816320B2 (en) * 2004-12-22 2010-10-19 Ambrx, Inc. Formulations of human growth hormone comprising a non-naturally encoded amino acid at position 35
PA8660701A1 (es) 2005-02-04 2006-09-22 Pfizer Prod Inc Agonistas de pyy y sus usos
WO2006107813A2 (en) * 2005-04-05 2006-10-12 Yale University Site specific incorporation of phosphoserine into polypeptides using phosphoseryl-trna synthetase
EP1871795A4 (en) 2005-04-08 2010-03-31 Biogenerix Ag COMPOSITIONS AND METHOD FOR PRODUCING GLYCOSYLATION MUTANTS OF A PROTEASE-RESISTANT HUMAN GROWTH HORMONE
WO2006122224A1 (en) * 2005-05-11 2006-11-16 Wayne State University Methods and compositions for the identification of antibiotics that are not susceptible to antibiotic resistance in pseudomonas aeruginosa
CN101238143A (zh) * 2005-06-03 2008-08-06 Ambrx公司 将非天然编码氨基酸并入蛋白质中
ATE529442T1 (de) * 2005-06-03 2011-11-15 Ambrx Inc Verbesserte humane interferon-moleküle und ihre verwendungen
AU2006256041B2 (en) * 2005-06-10 2012-03-29 Chugai Seiyaku Kabushiki Kaisha Stabilizer for protein preparation comprising meglumine and use thereof
WO2007005053A1 (en) * 2005-06-30 2007-01-11 Codon Devices, Inc. Hierarchical assembly methods for genome engineering
EP2233156B1 (en) 2005-07-15 2013-05-01 Angiochem Inc. Use of aprotinin polypeptides as carriers in pharmaceutical conjugates
ATE485376T1 (de) * 2005-07-15 2010-11-15 Medical Res Council Zusammensetzungen und verfahren in verbindung mit orthogonalen ribosomen-mrna-paaren
US8008453B2 (en) 2005-08-12 2011-08-30 Amgen Inc. Modified Fc molecules
AU2005335491B2 (en) * 2005-08-18 2010-11-25 Ambrx, Inc. Compositions of tRNA and uses thereof
WO2007027935A2 (en) 2005-08-31 2007-03-08 The Regents Of The University Of California Cellular libraries of peptide sequences (clips) and methods of using the same
RU2459866C2 (ru) * 2005-10-12 2012-08-27 Зе Скрипс Ресеч Инститьют Селективная посттрансляционная модификация экспонируемых фагами полипептидов
PT2339014E (pt) 2005-11-16 2015-10-13 Ambrx Inc Métodos e composições compreendendo aminoácidos não-naturais
EP1968635B1 (en) * 2005-12-14 2014-09-17 Ambrx, Inc. Compositions containing, methods involving, and uses of non-natural amino acids and polypeptides
CA2633524A1 (en) 2005-12-22 2007-07-05 Pacific Biosciences Of California, Inc. Polymerases for nucleotide analogue incorporation
CN102702105A (zh) * 2005-12-30 2012-10-03 Ambrx公司 含有非天然氨基酸和多肽的组合物、涉及非天然氨基酸和多肽的方法以及非天然氨基酸和多肽的用途
WO2007094916A2 (en) * 2006-01-19 2007-08-23 Ambrx, Inc. Non-natural amino acid polypeptides having modulated immunogenicity
US20070178554A1 (en) * 2006-02-01 2007-08-02 Nima Shiva Orthogonal Aminoacyl Synthetase-tRNA Pairs for Incorporating Unnatural Amino Acids Into Proteins
US20090081669A1 (en) * 2006-02-01 2009-03-26 Encode Bio, Inc. Fluorescent Assays Using Orthogonal tRNA - Aminoacyl Synthetase Pairs
WO2007092475A2 (en) * 2006-02-06 2007-08-16 Franklin And Marshall College Site-specific incorporation of fluorinated amino acids into proteins
PT1999259E (pt) 2006-03-03 2014-09-24 California Inst Of Techn Incorporação sítio-específica de aminoácidos em moléculas
AU2007223830A1 (en) 2006-03-09 2007-09-13 The Scripps Research Institute System for the expression of orthogonal translation components in eubacterial host cells
US8217145B2 (en) * 2006-03-16 2012-07-10 The Scrips Research Institute Genetically programmed expression of proteins containing the unnatural amino acid phenylselenocysteine
JP5313129B2 (ja) 2006-05-02 2013-10-09 アロザイン, インコーポレイテッド 非天然アミノ酸置換ポリペプチド
US20080096819A1 (en) * 2006-05-02 2008-04-24 Allozyne, Inc. Amino acid substituted molecules
AU2007267950B2 (en) * 2006-05-23 2012-08-16 The Scripps Research Institute Genetically encoded fluorescent coumarin amino acids
UA97953C2 (uk) * 2006-06-09 2012-04-10 Новартіс Аг Стабілізовані поліпептиди інсуліноподібного фактора росту
JP5305440B2 (ja) * 2006-06-28 2013-10-02 独立行政法人理化学研究所 変異体SepRS及びこれを用いるタンパク質への部位特異的ホスホセリン導入法
US8715958B2 (en) * 2006-06-29 2014-05-06 The Board Of Trustees Of The Leland Stanford Junior University Cell-free synthesis of proteins containing unnatural amino acids
CA2657385A1 (en) * 2006-07-13 2008-01-17 Naoki Kimura Cell death inducer
AU2007292891B2 (en) * 2006-09-08 2012-04-12 Ambrx, Inc. Site specific incorporation of non-natural amino acids by vertebrate cells
AU2013202770B2 (en) * 2006-09-08 2015-08-20 Ambrx, Inc. Modified human plasma polypeptide or Fc scaffolds and their uses
WO2008030613A2 (en) * 2006-09-08 2008-03-13 Ambrx, Inc. Hybrid suppressor trna for vertebrate cells
WO2008030614A2 (en) 2006-09-08 2008-03-13 Ambrx, Inc. Suppressor trna transcription in vertebrate cells
AU2012203737B2 (en) * 2006-09-08 2014-06-19 Ambrx, Inc. Modified human plasma polypeptide or Fc scaffolds and their uses
DK2615108T3 (en) * 2006-09-08 2017-01-30 Ambrx Inc Modified human plasma polypeptide or fc scaffolds and their applications
US8114652B2 (en) * 2006-09-21 2012-02-14 The Scripps Research Institute Genetically programmed expression of selectively sulfated proteins in eubacteria
WO2008073184A2 (en) 2006-10-18 2008-06-19 The Scripps Research Institute Genetic incorporation of unnatural amino acids into proteins in mammalian cells
JP2010510794A (ja) 2006-11-28 2010-04-08 ハナル ファーマシューティカル カンパニー リミテッド 修飾型エリスロポエチンポリペプチド及びこの治療用用途
EP1936340A1 (en) * 2006-12-21 2008-06-25 Koninklijke Philips Electronics N.V. Sub wavelength aperture
EP2112928A4 (en) * 2007-02-22 2014-01-08 Univ Utah Res Found SYNTHESIS OF NOVEL XYLOSIDES AND ITS POSSIBLE USES
CL2008000719A1 (es) * 2007-03-12 2008-09-05 Univ Tokushima Chugai Seiyaku Agente terapeutico para cancer resistente a agentes quimioterapeuticos que comprende un anticuerpo que reconoce hla de clase i como ingrediente activo; composicion farmaceutica que comprende dicho anticuerpo; y metodo para tratar cancer resistente a
KR20140012199A (ko) 2007-03-30 2014-01-29 암브룩스, 인코포레이티드 변형된 fgf-21 폴리펩티드 및 그 용도
US8183037B2 (en) * 2007-04-13 2012-05-22 The Salk Institute For Biological Studies Methods of genetically encoding unnatural amino acids in eukaryotic cells using orthogonal tRNA/synthetase pairs
CN103965347B (zh) * 2007-05-02 2017-07-18 Ambrx公司 经修饰干扰素β多肽和其用途
US9365634B2 (en) 2007-05-29 2016-06-14 Angiochem Inc. Aprotinin-like polypeptides for delivering agents conjugated thereto to tissues
US8969514B2 (en) 2007-06-04 2015-03-03 Synergy Pharmaceuticals, Inc. Agonists of guanylate cyclase useful for the treatment of hypercholesterolemia, atherosclerosis, coronary heart disease, gallstone, obesity and other cardiovascular diseases
ES2393885T7 (es) 2007-06-04 2014-01-30 Synergy Pharmaceuticals Inc. Agonistas de la guanilato ciclasa útiles para el tratamiento de trastornos gastrointestinales, inflamación, cáncer y otros trastornos
WO2009014726A1 (en) * 2007-07-26 2009-01-29 The Regents Of The University Of California Methods for enhancing bacterial cell display of proteins and peptides
CA2707840A1 (en) * 2007-08-20 2009-02-26 Allozyne, Inc. Amino acid substituted molecules
US20110178029A1 (en) * 2007-09-14 2011-07-21 Ambrx, Inc. Modified Human Apolipoprotein A-1 and Their Uses
EP2217700A4 (en) * 2007-10-08 2011-02-16 Synthetic Genomics Inc SYSTEM AND METHOD FOR PRODUCING SYNTHETIC MICROORGANISMS CAPABLE OF TRANSLATING PROTEINS CONTAINING NON-STANDARD AMINO ACIDS
CA2703736A1 (en) * 2007-10-25 2009-04-30 The Scripps Research Institute Genetic incorporation of 3-aminotyrosine into reductases
CA2704494A1 (en) * 2007-11-02 2009-05-14 The Scripps Research Institute Directed evolution using proteins comprising unnatural amino acids
WO2009059056A2 (en) * 2007-11-02 2009-05-07 The Scripps Research Institute A genetically encoded boronate amino acid
EA201000718A1 (ru) 2007-11-02 2011-06-30 Новартис Аг Молекулы и способы, предназначенные для модуляции родственного рецептору липопротеидов низкой плотности белка 6 (lrp6)
WO2009064416A2 (en) * 2007-11-15 2009-05-22 The Scripps Research Institute Genetic incorporation of an alpha-hydroxy acid into proteins to generate ester backbone linkages at defined sites
AU2008326324B9 (en) * 2007-11-20 2012-11-15 Ambrx, Inc. Modified insulin polypeptides and their uses
EP2889370A1 (en) * 2007-12-11 2015-07-01 The Scripps Research Institute In vivo unnatural amino acid expression in the methylotrophic yeast Pichia pastoris
PL2238242T3 (pl) 2008-01-03 2015-06-30 Basf Enzymes Llc Transferazy i oksydoreduktazy, kwasy nukleinowe kodujące je oraz sposoby ich wytwarzania i zastosowania
CA2713348C (en) 2008-01-30 2018-10-09 Indiana University Research And Technology Corporation Ester-based peptide prodrugs
BRPI0906388A2 (pt) * 2008-02-08 2015-07-07 Scripps Research Inst Quebra de tolerância imunológica com um aminoácido não natural geneticamente codificado
EP3103880A1 (en) 2008-02-08 2016-12-14 Ambrx, Inc. Modified leptin polypeptides and their uses
US20110015345A1 (en) * 2008-03-19 2011-01-20 Ambrx, Inc. Modified FGF-23 Polypeptides and Their Uses
EP2271662A4 (en) * 2008-03-21 2012-03-21 Univ California HIGH SENSITIVITY FLUORESCENT ENERGY TRANSFER ASSAY USING FLUORESCENT AMINO ACIDS AND FLUORESCENT PROTEINS
PL2274008T3 (pl) 2008-03-27 2014-07-31 Zymogenetics Inc Kompozycje i sposoby hamowania PDGFRbeta i VEGF-A
AU2009251883B2 (en) 2008-03-31 2014-09-11 Pacific Biosciences Of California, Inc. Generation of modified polymerases for improved accuracy in single molecule sequencing
PT2274331E (pt) 2008-05-02 2014-02-27 Novartis Ag Moléculas de ligação baseadas em fibronectina melhoradas e suas utilizações
ES2522968T3 (es) 2008-06-04 2014-11-19 Synergy Pharmaceuticals Inc. Agonistas de guanilato ciclasa útiles para el tratamiento de trastornos gastrointestinales, inflamación, cáncer y otros trastornos
ES2669591T3 (es) 2008-06-20 2018-05-28 Novartis Ag Inmunoglobulinas con agregación reducida
WO2009158649A1 (en) 2008-06-26 2009-12-30 Atyr Pharma, Inc. Compositions and methods comprising glycyl-trna synthetases having non-canonical biological activities
EP3130603A1 (en) 2008-06-30 2017-02-15 ESBATech, an Alcon Biomedical Research Unit LLC Functionalized polypeptides
KR20110031373A (ko) * 2008-07-10 2011-03-25 에스바테크, 언 알콘 바이오메디칼 리서치 유닛 엘엘씨 마크로분자 전달을 증강하는 방법 및 조성물
AU2009270833B2 (en) 2008-07-16 2015-02-19 Bausch Health Ireland Limited Agonists of guanylate cyclase useful for the treatment of gastrointestinal, inflammation, cancer and other disorders
UA118536C2 (uk) 2008-07-23 2019-02-11 Амбркс, Інк. Модифікований поліпептид бичачого гранулоцитарного колонієстимулювального фактора та його застосування
US9182406B2 (en) * 2008-08-04 2015-11-10 Biodesy, Inc. Nonlinear optical detection of molecules comprising an unnatural amino acid possessing a hyperpolarizability
EP2331112A1 (en) * 2008-08-19 2011-06-15 Ferring B.V. Peptidic pth receptor agonists
EP3216800A1 (en) 2008-09-26 2017-09-13 Ambrx, Inc. Modified animal erythropoietin polypeptides and their uses
MX348657B (es) 2008-09-26 2017-06-21 Ambrx Inc Microorganismos y vacunas dependientes de replicacion de aminoacidos no naturales.
BRPI0920209A2 (pt) 2008-10-15 2015-12-22 Angiochem Inc conjugados de agonistas de glp-1 e usos dos mesmos
KR101316159B1 (ko) 2008-10-24 2013-10-15 아이알엠 엘엘씨 생합성적으로 생성된 피롤린-카르복시-리신, 및 피롤린-카르복시-리신 및 피롤리신 잔기의 화학적 유도체화를 통한 부위 특이적 단백질 변형
AU2009322043A1 (en) 2008-12-05 2011-07-07 Angiochem Inc. Conjugates of neurotensin or neurotensin analogs and uses thereof
US20090197339A1 (en) * 2008-12-10 2009-08-06 The Scripps Research Institute In vivo unnatural amino acid expression in the methylotrophic yeast pichia pastoris
CN102307905B (zh) 2008-12-10 2015-11-25 斯克利普斯研究院 利用化学反应性非天然氨基酸产生载体-肽偶联物
AU2009327267A1 (en) 2008-12-17 2011-07-14 Angiochem, Inc. Membrane type-1 matrix metalloprotein inhibitors and uses thereof
US8481485B2 (en) 2008-12-19 2013-07-09 Indiana University Research And Technology Corporation Insulin analogs
EP2376098A4 (en) * 2008-12-19 2014-06-11 Univ Indiana Res & Tech Corp DIPEPTIDE-LINKED MEDICAL AGENTS
PE20120332A1 (es) 2008-12-19 2012-04-14 Univ Indiana Res & Tech Corp Profarmacos de peptido de la superfamilia de glucagon basado en amida
AU2009335715B2 (en) 2008-12-19 2016-09-15 Indiana University Research And Technology Corporation Amide-based insulin prodrugs
WO2010096394A2 (en) 2009-02-17 2010-08-26 Redwood Biosciences, Inc. Aldehyde-tagged protein-based drug carriers and methods of use
WO2010099477A2 (en) 2009-02-27 2010-09-02 Atyr Pharma, Inc. Polypeptide structural motifs associated with cell signaling activity
US20100310576A1 (en) * 2009-03-31 2010-12-09 Adams Ryan A COMPOSITIONS AND METHODS COMPRISING ASPARTYL-tRNA SYNTHETASES HAVING NON-CANONICAL BIOLOGICAL ACTIVITIES
EP2421562B1 (en) 2009-04-20 2019-03-13 Angiochem Inc. Treatment of ovarian cancer using an anticancer agent conjugated to an angiopep-2 analog
US9243253B2 (en) 2009-05-11 2016-01-26 Pfenex, Inc. Production of recombinant proteins utilizing non-antibiotic selection methods and the incorporation of non-natural amino acids therein
ES2537566T3 (es) 2009-06-04 2015-06-09 Novartis Ag Métodos para identificación de sitios para conjugación de IgG
CN102596993A (zh) 2009-07-02 2012-07-18 安吉奥开米公司 多聚体肽结合物以及其应用
US20110054019A1 (en) * 2009-09-01 2011-03-03 Pedro Anastacio Serrano-Ojeda Cancer Starvation Therapy
US10292956B2 (en) 2009-09-01 2019-05-21 Serbig Pharmaceutics Corp. Cancer starvation therapy
EP2311947A1 (en) * 2009-10-14 2011-04-20 Ludwig-Maximilians-Universität München Protein synthesis via click chemistry
WO2011056502A1 (en) 2009-10-26 2011-05-12 Genentech, Inc. Bone morphogenetic protein receptor type ii compositions and methods of use
WO2011056494A1 (en) 2009-10-26 2011-05-12 Genentech, Inc. Activin receptor-like kinase-1 antagonist and vegfr3 antagonist combinations
WO2011056497A1 (en) 2009-10-26 2011-05-12 Genentech, Inc. Activin receptor type iib compositions and methods of use
WO2011051327A2 (en) 2009-10-30 2011-05-05 Novartis Ag Small antibody-like single chain proteins
WO2011051466A1 (en) 2009-11-02 2011-05-05 Novartis Ag Anti-idiotypic fibronectin-based binding molecules and uses thereof
US20120282276A1 (en) 2009-11-05 2012-11-08 The Regents Of The University Of Michigan Biomarkers predictive of progression of fibrosis
CN102753573A (zh) 2009-12-21 2012-10-24 Ambrx公司 经过修饰的牛促生长素多肽和其用途
US9051593B2 (en) 2009-12-21 2015-06-09 Trustees Of Dartmouth College Recombinant prokaryotes and use thereof for production of O-glycosylated proteins
NZ600363A (en) 2009-12-21 2014-07-25 Ambrx Inc Modified porcine somatotropin polypeptides and their uses
ES2802623T3 (es) 2010-01-27 2021-01-20 Massachusetts Inst Technology Agentes polipeptídicos técnicamente diseñados para la neutralización dirigida de amplio espectro de la gripe
WO2011092233A1 (en) 2010-01-29 2011-08-04 Novartis Ag Yeast mating to produce high-affinity combinations of fibronectin-based binders
WO2011098449A1 (en) 2010-02-10 2011-08-18 Novartis Ag Methods and compounds for muscle growth
US8674064B2 (en) * 2010-03-03 2014-03-18 Onkologix Ltd Immunogenic compositions against human progastrin peptides
US8464858B2 (en) 2010-03-12 2013-06-18 Cabin Creek Inc. Conveyor belt scraper and system for the same
US20130078660A1 (en) * 2010-03-23 2013-03-28 Salk Institute For Biological Studies Methods and compositions for detecting protein modifications
US8980253B2 (en) 2010-04-26 2015-03-17 Atyr Pharma, Inc. Innovative discovery of therapeutic, diagnostic, and antibody compositions related to protein fragments of cysteinyl-tRNA synthetase
CN103096911B (zh) 2010-04-27 2018-05-29 Atyr 医药公司 与异亮氨酰-tRNA合成酶的蛋白片段相关的治疗、诊断和抗体组合物的创新发现
US8986681B2 (en) 2010-04-27 2015-03-24 Atyr Pharma, Inc. Innovative discovery of therapeutic, diagnostic, and antibody compositions related to protein fragments of threonyl-tRNA synthetases
AU2011248489B2 (en) 2010-04-28 2016-10-06 Pangu Biopharma Limited Innovative discovery of therapeutic, diagnostic, and antibody compositions related to protein fragments of alanyl tRNA synthetases
CN103097523B (zh) 2010-04-29 2016-09-28 Atyr医药公司 与天冬酰胺酰-tRNA合成酶的蛋白片段相关的治疗、诊断和抗体组合物的创新发现
WO2011150279A2 (en) * 2010-05-27 2011-12-01 Atyr Pharma, Inc. Innovative discovery of therapeutic, diagnostic, and antibody compositions related to protein fragments of glutaminyl-trna synthetases
EP2563383B1 (en) 2010-04-29 2017-03-01 Atyr Pharma, Inc. Innovative discovery of therapeutic, diagnostic, and antibody compositions related to protein fragments of valyl trna synthetases
EP2566496B1 (en) 2010-05-03 2018-02-28 aTyr Pharma, Inc. Innovative discovery of therapeutic, diagnostic, and antibody compositions related to protein fragments of methionyl-trna synthetases
CN103108655B (zh) 2010-05-03 2017-04-05 Atyr 医药公司 与丝氨酰‑tRNA合成酶的蛋白片段相关的治疗、诊断和抗体组合物的创新发现
CA2797277C (en) 2010-05-03 2021-02-23 Atyr Pharma, Inc. Innovative discovery of therapeutic, diagnostic, and antibody compositions related to protein fragments of arginyl-trna synthetases
US9034321B2 (en) 2010-05-03 2015-05-19 Atyr Pharma, Inc. Innovative discovery of therapeutic, diagnostic, and antibody compositions related to protein fragments of phenylalanyl-alpha-tRNA synthetases
CA2798301C (en) 2010-05-04 2020-09-15 Atyr Pharma, Inc. Innovative discovery of therapeutic, diagnostic, and antibody compositions related to protein fragments of glutamyl-prolyl-trna synthetases
CA2798139C (en) 2010-05-04 2019-09-24 Atyr Pharma, Inc. Innovative discovery of therapeutic, diagnostic, and antibody compositions related to protein fragments of p38 multi-trna synthetase complex
CN103200953B (zh) * 2010-05-14 2017-02-15 Atyr 医药公司 与苯丙氨酰‑β‑tRNA合成酶的蛋白片段相关的治疗、诊断和抗体组合物的创新发现
CN103096914B (zh) 2010-05-17 2015-08-12 Atyr医药公司 与亮氨酰-tRNA合成酶的蛋白片段相关的治疗、诊断和抗体组合物的创新发现
AU2011261486B2 (en) 2010-06-01 2017-02-23 Pangu Biopharma Limited Innovative discovery of therapeutic, diagnostic, and antibody compositions related to protein fragments of lysyl-tRNA synthetases
US8940860B2 (en) 2010-06-16 2015-01-27 Indiana University Research And Technology Corporation Single-chain insulin agonists exhibiting high activity at the insulin receptor
US9340790B2 (en) 2010-06-16 2016-05-17 Riken Method for constructing recombinant bacterium for producing non-native protein, and utilization of same
MX2012014576A (es) 2010-06-24 2013-02-21 Univ Indiana Res & Tech Corp Profarmacos de peptido de la superfamilia de glucagon basado en amida.
WO2011163462A2 (en) 2010-06-24 2011-12-29 Indiana University Research And Technology Corporation Amide-based insulin prodrugs
KR20130102534A (ko) 2010-07-12 2013-09-17 에이티와이알 파마, 인코포레이티드 히스티딜­trna 합성효소의 단백질 단편에 관련된 치료적, 진단적, 및 항체 조성물의 혁신적 발견
US8999321B2 (en) 2010-07-12 2015-04-07 Atyr Pharma, Inc. Innovative discovery of therapeutic, diagnostic, and antibody compositions related to protein fragments of glycyl-tRNA synthetases
EP2593125B1 (en) 2010-07-12 2017-11-01 aTyr Pharma, Inc. Innovative discovery of therapeutic, diagnostic, and antibody compositions related to protein fragments of glycyl-trna synthetases
NZ603811A (en) * 2010-07-12 2015-03-27 Atyr Pharma Inc Innovative discovery of therapeutic, diagnostic, and antibody compositions related to protein fragments of aspartyl-trna synthetases
BR112013003522B1 (pt) 2010-08-17 2021-05-25 Ambrx, Inc. polipeptídeos relaxina modificados compreendendo um aminoácido não codificado naturalmente, seu método de preparação e seu uso, bem como ácido nucleico e célula hospedeira
US9567386B2 (en) 2010-08-17 2017-02-14 Ambrx, Inc. Therapeutic uses of modified relaxin polypeptides
CN103108650A (zh) 2010-08-25 2013-05-15 Atyr医药公司 与酪氨酰-tRNA合成酶的蛋白片段相关的治疗、诊断和抗体组合物的创新发现
JP6173911B2 (ja) 2010-09-10 2017-08-09 メディミューン リミテド 抗体誘導体
US9616097B2 (en) 2010-09-15 2017-04-11 Synergy Pharmaceuticals, Inc. Formulations of guanylate cyclase C agonists and methods of use
TWI480288B (zh) 2010-09-23 2015-04-11 Lilly Co Eli 牛顆粒細胞群落刺激因子及其變體之調配物
CA2812795C (en) 2010-10-06 2021-08-31 Atyr Pharma, Inc. Innovative discovery of therapeutic, diagnostic, and antibody compositions related protein fragments of tryptophanyl trna synthetases
US9090928B2 (en) 2010-10-07 2015-07-28 Yale University Site-specific incorporation of phosphoserine into proteins in Escherichia coli
US9023791B2 (en) 2010-11-19 2015-05-05 Novartis Ag Fibroblast growth factor 21 mutations
RU2606016C2 (ru) 2011-01-14 2017-01-10 Редвуд Байосайнс, Инк. Меченые альдегидом полипептиды иммуноглобулина и способы их применения
EP3279211B1 (en) 2011-02-03 2020-04-29 Embl Unnatural amino acids comprising a norbornenyl group and uses thereof
WO2012129347A1 (en) 2011-03-21 2012-09-27 Biodesy, Llc Classification of kinase inhibitors using nonlinear optical techniques
US20140249090A1 (en) * 2011-04-01 2014-09-04 Max-Planck-Gesellschaft zur Förderung der Wissenschaft e.V. Peptides and pharmaceutical compositions for use in the treatment by nasal administration of patients suffering from anxiety and sleep disorders
EP2694095B1 (en) 2011-04-05 2018-03-07 Longevity Biotech, Inc. Compositions comprising glucagon analogs and methods of making and using the same
WO2012166559A1 (en) 2011-05-27 2012-12-06 Ambrx, Inc. Compositions containing, methods involving, and uses of non-natural amino acid linked dolastatin derivatives
CA2837586C (en) 2011-05-27 2018-12-11 Ambrx, Inc. Compositions containing, methods involving, and uses of non-natural amino acid linked dolastatin derivatives
US10240158B2 (en) 2011-07-11 2019-03-26 Yale University Compositions and methods for making selenocysteine containing polypeptides
WO2013009868A1 (en) 2011-07-11 2013-01-17 Yale University Compositions and methods for making selenocysteine containing polypeptides
US11788111B2 (en) 2011-07-11 2023-10-17 Yale University Compositions and methods for making selenocysteine containing polypeptides
US10876142B2 (en) 2011-07-11 2020-12-29 Yale University Compositions and methods for making selenocysteine containing polypeptides
CN102888387B (zh) * 2011-07-21 2015-03-18 中国科学院生物物理研究所 3-氯代酪氨酸翻译系统及其应用
EP3613852A3 (en) 2011-07-22 2020-04-22 President and Fellows of Harvard College Evaluation and improvement of nuclease cleavage specificity
CN102925427B (zh) * 2011-08-08 2014-01-22 中国科学院生物物理研究所 丙烯酰赖氨酸翻译系统及其应用
US9714419B2 (en) 2011-08-09 2017-07-25 Atyr Pharma, Inc. PEGylated tyrosyl-tRNA synthetase polypeptides
TW201315742A (zh) 2011-09-26 2013-04-16 Novartis Ag 治療代謝病症之雙功能蛋白質
WO2013068874A1 (en) 2011-11-11 2013-05-16 Pfizer Inc. Antibody-drug conjugates
US9816084B2 (en) 2011-12-06 2017-11-14 Atyr Pharma, Inc. Aspartyl-tRNA synthetases
US9822353B2 (en) 2011-12-06 2017-11-21 Atyr Pharma, Inc. PEGylated aspartyl-tRNA synthetase polypeptides
EP2793932B1 (en) 2011-12-20 2018-10-03 Indiana University Research and Technology Corporation Ctp-based insulin analogs for treatment of diabetes
TWI713889B (zh) 2011-12-28 2020-12-21 中外製藥股份有限公司 胜肽化合物之環化方法
CA2858613A1 (en) 2011-12-29 2013-08-08 Atyr Pharma, Inc. Aspartyl-trna synthetase-fc conjugates
US9395358B2 (en) 2012-02-05 2016-07-19 Biodesy, Inc. Methods for detecting allosteric modulators of protein
KR20140123571A (ko) 2012-02-16 2014-10-22 에이티와이알 파마, 인코포레이티드 자가면역 및 염증성 질환의 치료를 위한 히스티딜­trna 신테타제
EP3492101A3 (en) 2012-05-10 2019-10-23 Massachusetts Institute Of Technology Agents for influenza neutralization
EP2858676B1 (en) 2012-06-07 2019-03-13 Ambrx, Inc. Prostate-specific membrane antigen antibody drug conjugates
EP3505534A1 (en) 2012-06-08 2019-07-03 Sutro Biopharma, Inc. Antibodies comprising sitespecific nonnatural amino acid residues, methods of their preparation and methods of their use
KR102190832B1 (ko) 2012-06-19 2020-12-15 암브룩스, 인코포레이티드 항cd70 항체 약물 컨쥬게이트
ES2611788T3 (es) 2012-06-26 2017-05-10 Sutro Biopharma, Inc. Proteínas de Fc modificadas que comprenden residuos de aminoácidos no naturales específicos del sitio, conjugados de las mismas, métodos para su preparación y métodos para su uso
CN103571804B (zh) * 2012-08-10 2015-08-12 中国科学院生物物理研究所 3-吡唑基酪氨酸翻译系统及其应用
US9730993B2 (en) 2012-08-22 2017-08-15 The United States Of America, As Represented By The Secretary, Department Of Health And Human Services Engineered anthrax lethal toxin for targeted delivery
WO2014035364A2 (en) * 2012-08-27 2014-03-06 Empire Technology Development Llc Gelatin alkyd peptides and uses thereof
BR112015004022B1 (pt) 2012-08-31 2023-04-25 Sutro Biopharma, Inc Aminoácidos modificados compreendendo um grupo azido
US9732367B2 (en) 2012-09-24 2017-08-15 Medimmune Limited Cell lines
CA2886228A1 (en) 2012-09-26 2014-04-03 Indiana University Research And Technology Corporation Insulin analog dimers
CN102875733B (zh) * 2012-10-25 2014-06-11 西安科技大学 具有仿细胞外层膜结构的纳米颗粒及其制备方法
US20140120116A1 (en) 2012-10-26 2014-05-01 The Chinese University Of Hong Kong Treatment of cancer using smad3 inhibitor
UY35144A (es) 2012-11-20 2014-06-30 Novartis Ag Miméticos lineales sintéticos de apelina para el tratamiento de insuficiencia cardiaca
KR102182523B1 (ko) 2012-12-18 2020-11-25 노파르티스 아게 안정화된 인슐린-유사 성장 인자 폴리펩티드
JP2016507520A (ja) 2013-01-23 2016-03-10 ザ ボード オブ トラスティーズ オブ ザ レランド スタンフォード ジュニア ユニバーシティー 安定化されたb型肝炎コアポリペプチド
AU2014218599C1 (en) 2013-02-25 2018-09-06 Bausch Health Ireland Limited Guanylate cyclase receptor agonists for use in colonic cleansing
US9255255B2 (en) 2013-03-04 2016-02-09 The Board Of Trustees Of The Leland Stanford Junior University Synthesis of linear and branched polymers of polypeptides through direct conjugation
UY35368A (es) 2013-03-08 2014-10-31 Irm Llc Péptidos y composiciones para el tratamiento de daño articular
CA2904332A1 (en) 2013-03-14 2014-10-02 Indiana University Research And Technology Corporation Insulin-incretin conjugates
CA2905435A1 (en) 2013-03-15 2014-09-25 Synergy Pharmaceuticals Inc. Compositions useful for the treatment of gastrointestinal disorders
JP2016514671A (ja) 2013-03-15 2016-05-23 シナジー ファーマシューティカルズ インコーポレイテッド グアニル酸シクラーゼのアゴニストおよびその使用
AU2014233436B2 (en) 2013-03-15 2019-12-05 Atyr Pharma, Inc. Histidyl-tRNA synthetase-Fc conjugates
WO2014145654A1 (en) * 2013-03-15 2014-09-18 The Trustees Of The University Of Pennsylvania Method for the site-specific covalent cross-linking of antibodies to surfaces
EP2968469A4 (en) 2013-03-15 2016-08-31 Longevity Biotech Inc PEPTIDES COMPRISING NON-ENDOGENIC AMINO ACIDS AND METHODS OF MAKING AND USING SAME
JP6574754B2 (ja) 2013-03-19 2019-09-11 ベイジン シェノゲン ファーマ グループ リミテッド エストロゲン受容体関連疾患を処置するための抗体及び方法
US10011637B2 (en) 2013-06-05 2018-07-03 Synergy Pharmaceuticals, Inc. Ultra-pure agonists of guanylate cyclase C, method of making and using same
KR101568336B1 (ko) 2013-07-02 2015-11-12 서강대학교산학협력단 목적 단백질의 돌연변이체를 생성하는 세포, 상기 세포의 제조 방법, 및 상기 세포를 이용한 목적 단백질의 돌연변이체의 제조 방법
US9764039B2 (en) 2013-07-10 2017-09-19 Sutro Biopharma, Inc. Antibodies comprising multiple site-specific non-natural amino acid residues, methods of their preparation and methods of their use
US10005838B2 (en) 2013-07-19 2018-06-26 The Regents Of The University Of California Milk fat globule epidermal growth factor 8 regulates fatty acid uptake
AU2014293387B2 (en) 2013-07-25 2017-04-20 Novartis Ag Bioconjugates of synthetic apelin polypeptides
KR20160031551A (ko) 2013-07-25 2016-03-22 노파르티스 아게 심부전의 치료를 위한 시클릭 폴리펩티드
US9163284B2 (en) 2013-08-09 2015-10-20 President And Fellows Of Harvard College Methods for identifying a target site of a Cas9 nuclease
JP6694385B2 (ja) 2013-08-09 2020-05-13 アーデリクス,インコーポレーテッド リン酸塩輸送阻害のための化合物及び方法
US9359599B2 (en) 2013-08-22 2016-06-07 President And Fellows Of Harvard College Engineered transcription activator-like effector (TALE) domains and uses thereof
US10011649B2 (en) 2013-08-26 2018-07-03 Arizona Board Of Regents On Behalf Of Arizona State University High affinity synbodies for influenza
US9228207B2 (en) 2013-09-06 2016-01-05 President And Fellows Of Harvard College Switchable gRNAs comprising aptamers
US9737604B2 (en) 2013-09-06 2017-08-22 President And Fellows Of Harvard College Use of cationic lipids to deliver CAS9
US9322037B2 (en) 2013-09-06 2016-04-26 President And Fellows Of Harvard College Cas9-FokI fusion proteins and uses thereof
EP3054969B1 (en) 2013-10-10 2021-03-10 Bausch Health Ireland Limited Agonists of guanylate cyclase useful for the treatment of opioid induced dysfunctions
WO2015054658A1 (en) 2013-10-11 2015-04-16 Sutro Biopharma, Inc. Modified amino acids comprising tetrazine functional groups, methods of preparation, and methods of their use
US20160235810A1 (en) 2013-10-18 2016-08-18 Novartis Ag Methods of treating diabetes and related disorders
US20150166982A1 (en) 2013-12-12 2015-06-18 President And Fellows Of Harvard College Methods for correcting pi3k point mutations
DK3094977T3 (en) 2014-01-14 2018-12-10 European Molecular Biology Laboratory Multiple cycloaddition reactions to select molecules
US10501734B2 (en) 2014-02-06 2019-12-10 Yale University Compositions and methods of use thereof for making polypeptides with many instances of nonstandard amino acids
US10329556B2 (en) 2014-05-13 2019-06-25 Bioatla, Llc Conditionally active biological proteins
ES2818109T3 (es) 2014-06-23 2021-04-09 Novartis Ag Modificaciones de proteínas específicas para un sitio
US10588980B2 (en) 2014-06-23 2020-03-17 Novartis Ag Fatty acids and their use in conjugation to biomolecules
EP3164501A4 (en) 2014-07-02 2018-01-17 Sutro Biopharma, Inc. High growth capacity auxotrophic escherichia coli and methods of use
US11254933B2 (en) 2014-07-14 2022-02-22 The Regents Of The University Of California CRISPR/Cas transcriptional modulation
US10077453B2 (en) 2014-07-30 2018-09-18 President And Fellows Of Harvard College CAS9 proteins including ligand-dependent inteins
WO2016036916A1 (en) 2014-09-03 2016-03-10 Bioatla, Llc Discovering and producing conditionally active biologic proteins in the same eukaryotic cell production hosts
ES2947409T3 (es) 2014-09-24 2023-08-08 Univ Indiana Res & Tech Corp Profármacos de insulina a base de amida lipídica
EP3206710B1 (en) 2014-09-24 2020-05-06 Indiana University Research & Technology Corporation Incretin-insulin conjugates
US11408007B2 (en) 2014-09-26 2022-08-09 Yale University Compositions and methods for biocontainment of microorganisms
KR20240024362A (ko) 2014-10-24 2024-02-23 브리스톨-마이어스 스큅 컴퍼니 변형된 fgf-21 폴리펩티드 및 그의 용도
CN114656483A (zh) 2014-12-04 2022-06-24 细胞基因公司 生物分子共轭物
EP3237906B8 (en) 2014-12-23 2020-10-28 Bluelight Therapeutics, Inc. Attachment of proteins to interfaces for use in nonlinear optical detection
SE538541C2 (en) * 2015-01-19 2016-09-13 Fogelstrand Per Method for preparing a biological sample for use in an immunolabeling process
EA201791668A1 (ru) 2015-01-23 2017-11-30 Новартис Аг Синтетические конъюгаты апелина с жирной кислотой с улучшенным периодом полураспада
CN107429254B (zh) 2015-01-30 2021-10-15 加利福尼亚大学董事会 原代造血细胞中的蛋白递送
JP7020910B2 (ja) 2015-03-13 2022-02-16 中外製薬株式会社 改変アミノアシルtRNA合成酵素およびその用途
US10483262B2 (en) * 2015-05-15 2019-11-19 Taiwan Semiconductor Manufacturing Co., Ltd. Dual nitride stressor for semiconductor device and method of manufacturing
EP3309250A4 (en) * 2015-06-09 2019-06-19 National Institute of Advanced Industrial Science and Technology NUCLEIC ACID MODIFIED WITH AMINO ACID AND USE THEREOF
CA2989400A1 (en) 2015-06-15 2016-12-22 Angiochem Inc. Ang1005 for the treatment of leptomeningeal carcinomatosis
US10813979B2 (en) 2015-07-10 2020-10-27 The Hong Kong University Of Science And Technology Methods and compositions for treating neurodegenerative and neuroinflammatory conditions
US10800826B2 (en) 2015-10-05 2020-10-13 Merck Sharp & Dohme Corp. Antibody peptide conjugates that have agonist activity at both the glucagon and glucagon-like peptide 1 receptors
IL294014B1 (en) 2015-10-23 2024-03-01 Harvard College Nucleobase editors and their uses
CN108367053A (zh) 2015-12-22 2018-08-03 诺华股份有限公司 使用生长分化因子15(gdf-15)治疗或改善代谢性疾病的方法
NZ743474A (en) 2015-12-23 2023-03-31 Amgen Inc Method of treating or ameliorating metabolic disorders using binding proteins for gastric inhibitory peptide receptor (gipr) in combination with glp-1 agonists
CN106929482A (zh) * 2015-12-31 2017-07-07 北京大学 定点突变的流感病毒、其活疫苗及其制备方法和应用
CA3009814A1 (en) 2016-01-11 2017-07-20 Synergy Pharmaceuticals, Inc. Formulations and methods for treating ulcerative colitis
SG11201806419RA (en) 2016-01-27 2018-08-30 Sutro Biopharma Inc Anti-cd74 antibody conjugates, compositions comprising anti-cd74 antibody conjugates and methods of using anti-cd74 antibody conjugates
CN109071634A (zh) 2016-04-26 2018-12-21 R.P.谢勒技术有限责任公司 抗体偶联物及其制备和使用方法
EP3455628A4 (en) 2016-05-09 2019-12-04 Biodesy, Inc. METHOD AND DEVICES FOR DETECTING INTERACTIONS OF PERIPHERAL MEMBRANE PROTEINS USING NONLINEAR OPTICAL TECHNIQUES
EP3465204B1 (en) 2016-05-25 2023-08-02 Kromnigon AB Method for preparing a biological sample for use in an immunolabeling process
KR102492057B1 (ko) 2016-06-15 2023-01-26 노파르티스 아게 골 형태형성 단백질 6(bmp6)의 억제제를 사용한 질병의 치료 방법
AU2017306676B2 (en) 2016-08-03 2024-02-22 President And Fellows Of Harvard College Adenosine nucleobase editors and uses thereof
CA3033327A1 (en) 2016-08-09 2018-02-15 President And Fellows Of Harvard College Programmable cas9-recombinase fusion proteins and uses thereof
WO2018039438A1 (en) * 2016-08-24 2018-03-01 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
CN110214180A (zh) 2016-10-14 2019-09-06 哈佛大学的校长及成员们 核碱基编辑器的aav递送
EP3309260A1 (en) 2016-10-14 2018-04-18 European Molecular Biology Laboratory Archaeal pyrrolysyl trna synthetases for orthogonal use
KR20190084287A (ko) 2016-11-14 2019-07-16 노파르티스 아게 연골 손상 및 관절염 치료 방법 및 조성물
US11339209B2 (en) 2016-11-14 2022-05-24 Novartis Ag Compositions, methods, and therapeutic uses related to fusogenic protein minion
EP3555272A2 (en) 2016-12-19 2019-10-23 Quantum-si Incorporated Polymerizing enzymes for sequencing reactions
WO2018119359A1 (en) 2016-12-23 2018-06-28 President And Fellows Of Harvard College Editing of ccr5 receptor gene to protect against hiv infection
WO2018126229A2 (en) 2016-12-30 2018-07-05 Sutrovax, Inc. Polypeptide-antigen conjugates with non-natural amino acids
US11951165B2 (en) 2016-12-30 2024-04-09 Vaxcyte, Inc. Conjugated vaccine carrier proteins
JOP20190177A1 (ar) 2017-01-17 2019-07-16 Amgen Inc طريقة لعلاج أو تحسين اضطرابات أيضية باستخدام مساعدات مستقبل glp-1 مقترنة بمناهضات لمستقبل ببتيد مثبط معوي (gipr)
CN110637027A (zh) 2017-02-08 2019-12-31 百时美施贵宝公司 包含药代动力学增强子的修饰的松弛素多肽及其用途
US11898179B2 (en) 2017-03-09 2024-02-13 President And Fellows Of Harvard College Suppression of pain by gene editing
JP2020510439A (ja) 2017-03-10 2020-04-09 プレジデント アンド フェローズ オブ ハーバード カレッジ シトシンからグアニンへの塩基編集因子
KR20190130613A (ko) 2017-03-23 2019-11-22 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 핵산 프로그램가능한 dna 결합 단백질을 포함하는 핵염기 편집제
EP3381932A1 (en) 2017-03-28 2018-10-03 Technische Universität Berlin Modified mussel proteins, uses thereof and related compounds
JP2020517638A (ja) 2017-04-20 2020-06-18 エータイアー ファーマ, インコーポレイテッド 肺の炎症を治療するための組成物および方法
WO2018209320A1 (en) 2017-05-12 2018-11-15 President And Fellows Of Harvard College Aptazyme-embedded guide rnas for use with crispr-cas9 in genome editing and transcriptional activation
RS65370B1 (sr) 2017-06-02 2024-04-30 Ambrx Inc Metode i kompozicije za unapređenje proizvodnje proteina koji sadrže neprirodne aminokiseline
WO2018225851A1 (ja) 2017-06-09 2018-12-13 中外製薬株式会社 N-置換アミノ酸を含むペプチドの合成方法
SG11202000167SA (en) 2017-07-11 2020-02-27 Synthorx Inc Incorporation of unnatural nucleotides and methods thereof
KR101956042B1 (ko) * 2017-07-13 2019-03-08 서강대학교산학협력단 표적 단백질 내 l-디하이드록시페닐알라닌의 도입 방법
WO2019023316A1 (en) 2017-07-26 2019-01-31 Sutro Biopharma, Inc. METHODS OF USING ANTI-CD74 ANTIBODIES AND ANTIBODY CONJUGATES IN THE TREATMENT OF A T CELL LYMPHOMA
WO2019023680A1 (en) 2017-07-28 2019-01-31 President And Fellows Of Harvard College METHODS AND COMPOSITIONS FOR EVOLUTION OF BASIC EDITORS USING PHAGE-ASSISTED CONTINUOUS EVOLUTION (PACE)
MA49770A (fr) 2017-08-03 2021-05-26 Synthorx Inc Conjugués de cytokine destinés au traitement de maladies prolifératives et infectieuses
US11319532B2 (en) 2017-08-30 2022-05-03 President And Fellows Of Harvard College High efficiency base editors comprising Gam
TW201920249A (zh) 2017-09-07 2019-06-01 美商信號生物製藥公司 具有結合位點之t細胞調節多聚體多肽及其使用方法
US20200353076A1 (en) 2017-09-18 2020-11-12 Sutro Biopharma, Inc. Anti-folate receptor alpha antibody conjugates and their uses
US11795443B2 (en) 2017-10-16 2023-10-24 The Broad Institute, Inc. Uses of adenosine base editors
WO2019117274A1 (ja) 2017-12-15 2019-06-20 中外製薬株式会社 ペプチドの製造方法、及び塩基の処理方法
MX2020011529A (es) 2018-05-01 2021-01-29 Ambrx Inc Un metodo para optimizar la expresion de anticuerpos.
WO2019237119A1 (en) 2018-06-08 2019-12-12 The United States Of America As Represented By The Secretary Of The Department Of Health And Human Services New compositions and detection methods for onchocerca volvulus infection
US20210356377A1 (en) * 2018-09-07 2021-11-18 Medimmune, Llc Methods Of Cell Selection
US20220056093A1 (en) 2018-09-11 2022-02-24 Ambrx, Inc. Interleukin-2 polypeptide conjugates and their uses
US20220047716A1 (en) 2018-09-17 2022-02-17 Sutro Biopharma, Inc. Combination therapies with anti-folate receptor antibody conjugates
EP3867265A1 (en) 2018-10-19 2021-08-25 Ambrx, Inc. Interleukin-10 polypeptide conjugates, dimers thereof, and their uses
WO2020097261A1 (en) 2018-11-06 2020-05-14 The United States Of America As Represented By The Secretary Of The Department Of Health And Human Services New compositions and methods for treating beta-globinopathies
JPWO2020111238A1 (ja) 2018-11-30 2021-10-21 中外製薬株式会社 ペプチド化合物、またはアミド化合物の脱保護法および固相反応における脱樹脂方法、並びにペプチド化合物の製造方法
EP3923974A4 (en) 2019-02-06 2023-02-08 Synthorx, Inc. IL-2 CONJUGATES AND METHODS OF USE THEREOF
BR112021015832A2 (pt) 2019-02-12 2022-01-18 Ambrx Inc Composições que contêm conjugados de anticorpo-agonista de tlr, métodos e usos dos mesmos
EP3696189A1 (en) 2019-02-14 2020-08-19 European Molecular Biology Laboratory Means and methods for preparing engineered target proteins by genetic code expansion in a target protein selective manner
US20220259585A1 (en) * 2019-03-04 2022-08-18 The Texas A&M University System Methods of making and utilizing amber-obligated phage display libraries
EP3942040A1 (en) 2019-03-19 2022-01-26 The Broad Institute, Inc. Methods and compositions for editing nucleotide sequences
EP3962951A1 (en) 2019-05-03 2022-03-09 Sutro Biopharma, Inc. Anti-bcma antibody conjugates
WO2020236907A1 (en) * 2019-05-20 2020-11-26 Albert Einstein College Of Medicine Compounds and methods for treatment of bacterial infections
EP3980057A1 (en) 2019-06-04 2022-04-13 Institut Curie Methods of producing shiga toxin b-subunit (stxb) monomers and oligomers, and uses thereof
CN114269749A (zh) 2019-06-10 2022-04-01 苏特罗生物制药公司 5H-吡咯并[3,2-d]嘧啶-2,4-二氨基化合物及其抗体偶联物
US20220259202A1 (en) 2019-06-17 2022-08-18 Sutro Biopharma, Inc. 1-(4-(aminomethyl)benzyl)-2-butyl-2h-pyrazolo[3,4-c]quinolin-4-amine derivatives and related compounds as toll-like receptor (tlr) 7/8 agonists, as well as antibody drug conjugates thereof for use in cancer therapy and diagnosis
MX2022000055A (es) 2019-06-28 2022-05-30 Quantum Si Inc Enzimas de polimerización para reacciones de secuenciación.
AU2020361533A1 (en) 2019-10-08 2022-04-28 Trustees Of Boston College Proteins containing multiple, different unnatural amino acids and methods of making and using such proteins
TW202128996A (zh) * 2019-10-10 2021-08-01 美商史基普研究協會 用於活體內合成非天然多肽的組合物及方法
US11149280B2 (en) 2019-10-29 2021-10-19 Yale University Engineering organisms resistant to viruses and horizontally transferred genetic elements
US20220389466A1 (en) * 2019-11-05 2022-12-08 Nitro Biosciences, Inc. Biosynthesis of para-nitro-l-phenylalanine
CN115260313B (zh) 2019-12-31 2023-07-18 北京质肽生物医药科技有限公司 Glp-1和gdf15的融合蛋白以及其缀合物
EP4084819A1 (en) 2020-01-03 2022-11-09 The United States of America, as represented by the Secretary, Department of Health and Human Services Tnap locally administered for promoting periodontal health
CN115322794A (zh) 2020-01-11 2022-11-11 北京质肽生物医药科技有限公司 Glp-1和fgf21的融合蛋白的缀合物
WO2021165968A1 (en) * 2020-02-20 2021-08-26 B. G. Negev Technologies And Applications Ltd., At Ben-Gurion University Mutant aminoacyl-trna synthetases
EP3868882A1 (en) 2020-02-21 2021-08-25 European Molecular Biology Laboratory Archaeal pyrrolysyl trna synthetases for orthogonal use
WO2021178597A1 (en) 2020-03-03 2021-09-10 Sutro Biopharma, Inc. Antibodies comprising site-specific glutamine tags, methods of their preparation and methods of their use
KR20220151202A (ko) 2020-03-11 2022-11-14 암브룩스, 인코포레이티드 인터류킨-2 폴리펩타이드 접합체 및 그의 사용 방법
CN111302975A (zh) * 2020-03-30 2020-06-19 滨海吉尔多肽有限公司 一种n-叔丁氧羰基-o-烯丙基-l-酪氨酸的制备方法
TW202203973A (zh) 2020-04-22 2022-02-01 美商默沙東藥廠 對介白素-2受體βγc二聚體具偏性且結合至非肽、水溶性聚合物之人類介白素-2結合物
US20210340586A1 (en) 2020-04-30 2021-11-04 Sutro Biopharma, Inc. Methods of Producing Full-Length Antibodies Using E. coli
CN115551875A (zh) 2020-05-05 2022-12-30 基因泰克公司 用于酪氨酸酶介导的位点特异性蛋白质缀合的系统和方法
MX2022014008A (es) 2020-05-08 2023-02-09 Broad Inst Inc Métodos y composiciones para la edición simultánea de ambas cadenas de una secuencia de nucleótidos de doble cadena objetivo.
WO2021234458A1 (en) 2020-05-22 2021-11-25 Takeda Pharmaceutical Company Limited Adamts13 compositions and methods for treating and diagnosing complications of coronavirus disease
JP2023538071A (ja) 2020-08-20 2023-09-06 アンブルックス,インコーポレイテッド 抗体-tlrアゴニストコンジュゲート、その方法及び使用
TW202227480A (zh) * 2020-09-14 2022-07-16 美商蘇特羅生物製藥公司 使用無細胞蛋白質合成系統來大規模生產抗體之方法
CN115925994B (zh) 2020-09-30 2023-09-22 北京质肽生物医药科技有限公司 多肽缀合物和使用方法
CA3213805A1 (en) 2021-04-03 2022-10-06 Feng Tian Anti-her2 antibody-drug conjugates and uses thereof
US20230016731A1 (en) * 2021-05-21 2023-01-19 The Regents Of The University Of California Affinity purification sequencing
WO2023281482A1 (en) 2021-07-09 2023-01-12 Bright Peak Therapeutics Ag Cd20-targeted il-2 and its uses
CA3222358A1 (en) 2021-07-09 2023-01-12 Vijaya Raghavan PATTABIRAMAN Checkpoint inhibitors conjugated to il-2, and uses thereof
EP4366778A1 (en) 2021-07-09 2024-05-15 Bright Peak Therapeutics AG Antibody conjugates and manufacture thereof
EP4366782A1 (en) 2021-07-09 2024-05-15 Bright Peak Therapeutics AG Conjugates of checkpoint inhibitors with il-2, and uses thereof
CA3222357A1 (en) 2021-07-09 2023-01-12 Bertolt Kreft Modified il-2 polypeptides for treatment of inflammatory and autoimmune diseases
WO2023031445A2 (en) 2021-09-06 2023-03-09 Veraxa Biotech Gmbh Novel aminoacyl-trna synthetase variants for genetic code expansion in eukaryotes
AU2022348582A1 (en) * 2021-09-17 2024-04-11 Absci Corporation Composition of transfer rnas and use in production of proteins containing non-standard amino acids
WO2023069816A2 (en) 2021-09-20 2023-04-27 The Broad Institute, Inc. Compositions and methods for multiplex decoding of quadruplet codons
WO2023081167A2 (en) 2021-11-02 2023-05-11 The Regents Of The University Of California P-selectin mutants and modulation of integrin-mediated signaling
EP4186529A1 (en) 2021-11-25 2023-05-31 Veraxa Biotech GmbH Improved antibody-payload conjugates (apcs) prepared by site-specific conjugation utilizing genetic code expansion
WO2023094525A1 (en) 2021-11-25 2023-06-01 Veraxa Biotech Gmbh Improved antibody-payload conjugates (apcs) prepared by site-specific conjugation utilizing genetic code expansion
WO2023104941A1 (en) 2021-12-08 2023-06-15 European Molecular Biology Laboratory Hydrophilic tetrazine-functionalized payloads for preparation of targeting conjugates
WO2023146807A1 (en) 2022-01-25 2023-08-03 The Regents Of The University Of California Vegf mutants and modulation of integrin-mediated signaling
WO2023161854A1 (en) 2022-02-23 2023-08-31 Bright Peak Therapeutics Ag Immune antigen specific il-18 immunocytokines and uses thereof
WO2023161857A1 (en) 2022-02-23 2023-08-31 Bright Peak Therapeutics Ag Bifunctional cytokine compositions
TW202408589A (zh) 2022-06-30 2024-03-01 美商舒卓生物製藥公司 抗ror1抗體及抗體結合物、包含抗ror1抗體或抗體結合物之組合物,及製造及使用抗ror1抗體及抗體結合物之方法
NL2033185B1 (en) 2022-09-29 2024-04-08 Stichting Vu Compounds for rna stabilisation and delivery
WO2024077277A1 (en) 2022-10-07 2024-04-11 Ambrx, Inc. Drug linkers and antibody conjugates thereof
WO2024091824A1 (en) 2022-10-26 2024-05-02 Ada Forsyth Institute, Inc. Differentiation and reprogramming of chondrocyte

Family Cites Families (49)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CH652145A5 (de) 1982-01-22 1985-10-31 Sandoz Ag Verfahren zur in vitro-herstellung von hybridomen welche humane monoklonale antikoerper erzeugen.
US4634666A (en) 1984-01-06 1987-01-06 The Board Of Trustees Of The Leland Stanford Junior University Human-murine hybridoma fusion partner
US5001065A (en) 1987-05-27 1991-03-19 Cetus Corporation Human cell line and triomas, antibodies, and transformants derived therefrom
DE9115660U1 (de) * 1991-12-18 1992-07-30 Aventis Research & Technologies GmbH & Co KG, 65929 Frankfurt L-Phenylalanyl-tRNA-Synthetase mit erweiterter Substratselektivität aus Mikroorganismen
CA2219136A1 (en) 1995-04-24 1996-10-31 Chromaxome Corp. Methods for generating and screening novel metabolic pathways
US5958672A (en) 1995-07-18 1999-09-28 Diversa Corporation Protein activity screening of clones having DNA from uncultivated microorganisms
US5756316A (en) 1995-11-02 1998-05-26 Genencor International, Inc. Molecular cloning by multimerization of plasmids
US6238884B1 (en) 1995-12-07 2001-05-29 Diversa Corporation End selection in directed evolution
US5783431A (en) 1996-04-24 1998-07-21 Chromaxome Corporation Methods for generating and screening novel metabolic pathways
US6706504B1 (en) 1996-11-12 2004-03-16 The Scripps Research Institute Tissue type plasminogen activator (t-PA) variants: compositions and methods of use
DK1456360T3 (en) 2001-04-19 2015-08-31 Scripps Research Inst Methods and Composition for Preparation of Orthogonal TRNA-Aminoacyl-TRNA Synthetase Pairs
DE10151556A1 (de) * 2001-10-23 2003-04-30 Bosch Gmbh Robert Vorrichtung zum Öffnen und Schließen eines beweglichen Teils
ITTO20020441A1 (it) * 2002-05-24 2003-11-24 Telecom Italia Lab Spa Metodo per determinare l'installazione di costo minimo per le apparecchiature di una rete fissa di telecomunicazione.
SI1578949T1 (sl) 2002-10-16 2009-08-31 Scripps Research Inst Usmerjena vključitev keto aminokislin v proteine
WO2004035605A2 (en) 2002-10-16 2004-04-29 The Scripps Research Institute Glycoprotein synthesis
US7642085B2 (en) 2002-12-22 2010-01-05 The Scripps Research Institute Protein arrays
JP5642916B2 (ja) 2003-04-17 2014-12-17 ザ スクリプス リサーチ インスティテュート 真核遺伝コードの拡張
CN102618605B (zh) 2003-06-18 2015-09-02 斯克利普斯研究院 非天然活性氨基酸遗传密码增加
US7527943B2 (en) 2003-07-07 2009-05-05 The Scripps Research Institute Compositions of orthogonal glutamyl-tRNA and aminoacyl-tRNA synthetase pairs and uses thereof
US20060160175A1 (en) 2003-07-07 2006-07-20 The Scripps Research Institute Compositions of orthogonal leucyl-trna and aminoacyl-trna synthetase pairs and uses thereof
EP1649004A4 (en) 2003-07-07 2008-04-09 Scripps Research Inst COMPOSITIONS WITH PAIRS OF ORTHOGONAL LYSYL-TRNA AND AMINOACYL-TRNA-SYNTHETASE AND USES THEREOF
DK1687401T3 (da) 2003-10-14 2013-02-04 Scripps Research Inst Sted-spicifik inkorporing af redoxaktive aminosyrer i protiener
JP4752002B2 (ja) 2003-12-18 2011-08-17 ザ スクリプス リサーチ インスティチュート 哺乳動物細胞内の蛋白質への5−ヒドロキシトリプトファンの選択的組込み
EP1774018A2 (en) 2004-05-25 2007-04-18 The Scripps Research Institute Site specific incorporation of heavy atom-containing unnatural amino acids into proteins for crystal structure determination
JP2008513039A (ja) 2004-09-21 2008-05-01 ザ スクリップス リサーチ インスティテュート 真正細菌の蛋白質へのアルキニルアミノ酸のインビボ組込み
WO2006034410A2 (en) 2004-09-21 2006-03-30 The Scripps Resarch Institute Adding photoregulated amino acids to the genetic code
JP2008513806A (ja) 2004-09-22 2008-05-01 ザ スクリップス リサーチ インスティテュート Nmr試験のための蛋白質の部位特異的標識
EP1809758A4 (en) 2004-10-20 2009-04-01 Scripps Research Inst LOCAL IN VIVO INSTALLATION OF N-ACETYLGALACTOSAMINE AMINO ACIDS IN EU BACTERIA
US8216804B2 (en) 2004-10-27 2012-07-10 The Scripps Research Institute Orthogonal translation components for the in vivo incorporation of unnatural amino acids
FR2888097B1 (fr) * 2005-07-06 2007-10-05 Oreal Dispositif de conditionnement et d'application comportant un organe d'essorage
RU2459866C2 (ru) 2005-10-12 2012-08-27 Зе Скрипс Ресеч Инститьют Селективная посттрансляционная модификация экспонируемых фагами полипептидов
AU2007223830A1 (en) 2006-03-09 2007-09-13 The Scripps Research Institute System for the expression of orthogonal translation components in eubacterial host cells
US8217145B2 (en) 2006-03-16 2012-07-10 The Scrips Research Institute Genetically programmed expression of proteins containing the unnatural amino acid phenylselenocysteine
AU2007267950B2 (en) 2006-05-23 2012-08-16 The Scripps Research Institute Genetically encoded fluorescent coumarin amino acids
US7421795B2 (en) * 2006-08-04 2008-09-09 Seagate Technology Llc Sapphire alignment fixture
US8114652B2 (en) 2006-09-21 2012-02-14 The Scripps Research Institute Genetically programmed expression of selectively sulfated proteins in eubacteria
WO2008073184A2 (en) 2006-10-18 2008-06-19 The Scripps Research Institute Genetic incorporation of unnatural amino acids into proteins in mammalian cells
TWI334126B (en) * 2007-07-17 2010-12-01 Au Optronics Corp Voltage adjusting circuit, method, and display apparatus having the same
JP4978419B2 (ja) * 2007-10-23 2012-07-18 富士ゼロックス株式会社 光送受信モジュール
CA2703736A1 (en) 2007-10-25 2009-04-30 The Scripps Research Institute Genetic incorporation of 3-aminotyrosine into reductases
WO2009059056A2 (en) 2007-11-02 2009-05-07 The Scripps Research Institute A genetically encoded boronate amino acid
CA2704494A1 (en) 2007-11-02 2009-05-14 The Scripps Research Institute Directed evolution using proteins comprising unnatural amino acids
WO2009064416A2 (en) 2007-11-15 2009-05-22 The Scripps Research Institute Genetic incorporation of an alpha-hydroxy acid into proteins to generate ester backbone linkages at defined sites
US8218509B2 (en) * 2008-01-15 2012-07-10 Apple Inc. Dynamic allocation of communication resources in a wireless system
BRPI0906388A2 (pt) 2008-02-08 2015-07-07 Scripps Research Inst Quebra de tolerância imunológica com um aminoácido não natural geneticamente codificado
US20110076718A1 (en) 2008-02-27 2011-03-31 The Scripps Research Institute In vivo incorporation of an unnatural amino acid comprising a 1,2-aminothiol group
US20090197339A1 (en) 2008-12-10 2009-08-06 The Scripps Research Institute In vivo unnatural amino acid expression in the methylotrophic yeast pichia pastoris
CN102307905B (zh) 2008-12-10 2015-11-25 斯克利普斯研究院 利用化学反应性非天然氨基酸产生载体-肽偶联物
WO2010114615A2 (en) 2009-04-03 2010-10-07 The Scripps Research Institute A facile system for encoding unnatural amino acids in mammalian cells

Also Published As

Publication number Publication date
DK1456360T3 (en) 2015-08-31
JP2013255502A (ja) 2013-12-26
US8173364B2 (en) 2012-05-08
JP2016112021A (ja) 2016-06-23
WO2002085923A3 (en) 2004-05-27
US20090068717A1 (en) 2009-03-12
IL196762A (en) 2015-03-31
HK1158259A1 (en) 2012-07-13
CA2444098C (en) 2016-06-21
US20080261311A1 (en) 2008-10-23
US20080167243A1 (en) 2008-07-10
EP1456360B1 (en) 2015-06-03
DK2128246T3 (da) 2014-05-12
US20090053791A1 (en) 2009-02-26
AU2002256292B2 (en) 2007-12-06
US20060063244A1 (en) 2006-03-23
US20050250183A1 (en) 2005-11-10
US20030082575A1 (en) 2003-05-01
US20030108885A1 (en) 2003-06-12
HK1069848A1 (en) 2005-06-03
US8114648B2 (en) 2012-02-14
HK1203558A1 (en) 2015-10-30
IL196714A (en) 2013-10-31
US20060233744A1 (en) 2006-10-19
US20120101006A1 (en) 2012-04-26
ES2464532T3 (es) 2014-06-03
EP1456360A4 (en) 2005-05-25
JP2009077731A (ja) 2009-04-16
EP1490483A4 (en) 2007-02-07
JP5766925B2 (ja) 2015-08-19
EP1490483B1 (en) 2015-06-03
MXPA03009566A (es) 2004-12-06
JP2009132704A (ja) 2009-06-18
US7354761B2 (en) 2008-04-08
CA2443757A1 (en) 2002-10-31
EP1456360A2 (en) 2004-09-15
CA2444098A1 (en) 2002-10-31
WO2002085923A2 (en) 2002-10-31
US8012739B2 (en) 2011-09-06
EP2796546B1 (en) 2017-08-09
US7045337B2 (en) 2006-05-16
US20090227002A1 (en) 2009-09-10
US7915025B2 (en) 2011-03-29
US20080227152A1 (en) 2008-09-18
US20080166783A1 (en) 2008-07-10
US20130309720A1 (en) 2013-11-21
EP2322631B1 (en) 2014-11-12
US9163271B2 (en) 2015-10-20
IL158419A (en) 2013-05-30
IL187588A (en) 2011-11-30
WO2002086075A2 (en) 2002-10-31
IL158419A0 (en) 2004-05-12
US20060234367A1 (en) 2006-10-19
US7638300B2 (en) 2009-12-29
IL196714A0 (en) 2009-11-18
EP2322631A1 (en) 2011-05-18
AU2002256292C1 (en) 2008-08-14
US7713721B2 (en) 2010-05-11
EP2796546A1 (en) 2014-10-29
US8183012B2 (en) 2012-05-22
JP6239888B2 (ja) 2017-11-29
US20110027867A1 (en) 2011-02-03
IL187775A0 (en) 2011-08-01
JP6294368B2 (ja) 2018-03-14
US20050208536A1 (en) 2005-09-22
JP2011030571A (ja) 2011-02-17
US7083970B2 (en) 2006-08-01
JP2004537984A (ja) 2004-12-24
JP2005502322A (ja) 2005-01-27
IL158418A0 (en) 2004-05-12
EP1490483A2 (en) 2004-12-29
AU2002303431B2 (en) 2007-10-04
US8030074B2 (en) 2011-10-04
HK1065065A1 (en) 2005-02-08
IL196762A0 (en) 2011-07-31
US7368275B2 (en) 2008-05-06
AU2002303431C1 (en) 2008-03-06
EP2128246A1 (en) 2009-12-02
CA2443757C (en) 2016-09-27
WO2002086075A3 (en) 2004-06-24
EP2128246B1 (en) 2014-03-12
US20120202243A1 (en) 2012-08-09
US8173392B2 (en) 2012-05-08
US20070117184A1 (en) 2007-05-24
DK1490483T3 (en) 2015-09-07
DK2322631T3 (en) 2015-01-12

Similar Documents

Publication Publication Date Title
US8173392B2 (en) In vivo incorporation of unnatural amino acids
AU2002256292A1 (en) In vivo incorporation of unnatural amino acids
AU2008200780B2 (en) In vivo incorporation of unnatural amino acids

Legal Events

Date Code Title Description
FG Grant or registration