BRPI0711811A2

BRPI0711811A2 - aminoácidos de cumarina fluorescente geneticamente codificados

Info

Publication number: BRPI0711811A2
Application number: BRPI0711811-2A
Authority: BR
Inventors: Jiangyun Wang; Jianming Xie; Peter G Schultz
Original assignee: Scripps Research Inst
Priority date: 2006-05-23
Filing date: 2007-05-21
Publication date: 2011-12-06
Also published as: EP2018429A4; JP2009538136A; AU2007267950B2; EP2018429A1; US20090298119A1; US20120329162A1; IL195250A0; KR20090024706A; US7807411B2; US20080044886A1; RU2008145487A; WO2007139870A1; AU2007267950A1; MX2008014776A; US8192952B2; RU2473690C2; CA2652894A1

Abstract

AMINOáCIDOS DE CUMARINA FLUORESCENTE GENETICAMENTE CODIFICADOS. A invenção refere-se a pares ortogonais de tRNAs e aminoacil-tRNA sintetases que possam incorporar o aminoácido não-natural de cumarina de L-(7-hidroxicoumarin-4-il) etilglicina a proteínas produzidas em céjula hospedeiras eubacterianas, como E. coli. A invenção proporciona, mas sem limitar-se a, por exempio, sintetases ortogonais inusitadas, métodos para identificação e fabricação de sintetases inusitadas, métodos para produção de proteínas contendo o aminoácido não-natural de L-(7-hidroxicoumarin-4-il) etilglicina e sistemas de transiação relacionados.

Description

"AMINOÁCIDOS DE CUMARINA FLUORESCENTE GENETICAMENTE CODIFICADOS"

Referência Remissiva aos Pedidos de Depósito Correlatos

Este pedido reivindica a prioridade e benefícios do:

Pedido Provisório Norte-Americano número de série 60/808.099, depositado em 23 de maio de 2006; e

Pedido Provisório Norte-Americano número de série 60/813.856, depositado em 14 de junho de 2006, as descrições de ambos estão aqui incorporadas em sua totalidade a título de referência para todos os propósitos.

Declaração em Relação aos Direitos Concedidos às Invenções Criadas sob Pesquisa e Desenvolvimento Subsidiados pelo Governo Federal

A presente invenção foi criada com o apoio governamental junto ao Departamento de Energia sob a Concessão No. ER46051. O governo tem certos direitos sob esta invenção.

Campo da Invenção

A invenção situa-se no campo da bioquímica de translação. A invenção refere-se a composições e métodos para produzir e utilizar tRNAs ortogonais, aminoacil-tRNA sintetases ortogonais, e pares das mesmas, que incorporam aminoácidos não-naturais em proteínas. A invenção se refere, também, a métodos de produzir proteínas em células que utilizam esses pares e proteínas produzidas pelos métodos. Fundamentos da Invenção

A fluorescência se tornou um dos sinais de detecção mais importantes em biotecnologia devido à sua alta sensibilidade e segurança de manipulação. Os processos como a transferência ressonante de energia de fluorescência (FRET) ou polarização de fluorescência tornam possível as análises em tempo real de eventos de aglutinação biomolecular, movimentos ou alterações conformacionais. A capacidade de modificar seletivamente proteínas com sondas fluorescentes tem facilitado consideravelmente tanto estudos in vitro como estudos in vivo de estruturas e funções protéicas (Hermanson (1996) em Bioconjugate Techniques, Academic Press: San Diego; e Tsien (1998) Annu. Rev. Biochem., 67:509-544).

Freqüentemente, a metodologia fluorescente atual para estudar proteínas in vivo depende de construções de fusão com grandes proteínas fluorescentes, tais como, proteínas verde-fluorescentes (GFP). Muito embora esta sonda tenha se provado útil em estudos de expressão protéica, localização e interações bimoleculares, seu tamanho grande pode resultar em perturbações estruturais significativas. As fusões de GFP também são limitadas a terminações C- ou N- da proteína alvo, e são relativamente insensitivas ao seu ambiente (Tsien (1998) Annu. Rev. Biochem., 67:509-44). A GFP também requer muitas transcrições para alcançar um sinal adequado, e querer um tempo de latência para seu enrolamento e maturação de fluoróforo.

Podem-se utilizar, também, métodos químicos para modificar seletivamente as proteínas com uma variedade de pequenos fluoróforos sintéticos que minimizam a perturbação estrutural (Hermanson, in Bioconjugate Techniques, Academic Press: San Diego (1996); Martin et al, Nat. Biotech., 23:1308-1314 (2005); Keppler et al, Nat. Biotech., 21:86-89 (2003); Lin et al, J. Am. Chem. ScL, 128:4542-3 (2006)). No entanto, essas técnicas são, genericamente, limitadas a resíduos acessíveis por superfície exclusivamente reativa em proteínas isoladas (por exemplo, a modificação de cistina com derivados de maleimida; consulte Hermanson em Bioconjugate Techniques (1996) Academic Press: San Diego), exibem baixa regiosseletividade, são citotóxicas ou necessitam da introdução de motivos de ligação de proteína ao corante.

Os métodos de marcação biossintética que utilizam tRNAs quimicamente misacilados (Mendel et al., Annu. Rev. Biophys. Biomol. Struct. (1995) 24:435-462; Hohsaka et al, FEBS Lett. (2004) 560:173-177) têm sido demonstrados em caráter experimental, porém, fornecem rendimentos limitados de proteína e são realizados, tipicamente, apenas in vitro.

A incorporação de aminoácidos fluorescentes geneticamente codificados em sítios definidos diretamente em proteínas em organismos vivos superaria muitas das limitações no que diz respeito à marcação de fluorescência de proteínas (Wang and Schultz, Angew. Chem. Int. Ed. (2005) 44:34- 66; Wang et al, Annu. Rev. Biophys. Biomol Struct., (2006) 35:225-249). A incorporação sítio-específica de aminoácidos fluorescentes introduziria o mínimo de perturbação à proteína hospedeira e permitiria a medição de transferência ressonante de energia de fluorescência (FRET) com muito mais precisão (Truong and Ikura, Curr. Opin. Struct. Bio. 2001, 11:573-578). Além disso, o uso de um aminoácido fluorescente permitiria a sondagem do ambiente local de cada posição de aminoácido, e localizaria os resíduos que mediam a interação com outros componentes celulares variando-se a posição do aminoácido fluorescente na proteína. Isso seria, também, bastante útil para estudar o enrolamento de proteínas (Lakowicz, Principies of Fluorescence Spectroscopy Ed. 2; Kluwer Academic/Plenum Publishers: Nova York, 1999), especialmente em um sistema unimolecular (Lipman et al, Science (2003) 301:1233-1235), porque uma molécula protéica contém, normalmente, mais de um resíduo de triptófano, e a marcação química específica de proteínas com sondas fluorescentes é problemática.

A técnica querer novas estratégias para incorporação de aminoácidos não-naturais fluorescentes em proteínas com a intenção de estudar a estrutura e função protéica. Tem-se desenvolvido uma metodologia geral para a incorporação sítio-específica in vivo de aminoácidos não-naturais diversificados em proteínas tanto em organismos procarióticos como eucarióticos. Esses métodos dependem componentes de translação protéica ortogonal que reconhecem um códon seletor adequado para inserir um aminoácido não- natural desejado em uma posição definida durante a translação polipeptídica in vivo. Esses métodos utilizam um tRNA ortogonal (O-tRNA) que reconhece um códon seletor, e onde um aminoacil-tRNA sintetase ortogonal específico correspondente (uma O-RS) carrega o O- tRNA com o aminoácido não-natural. Esses componentes não reagem cruzadamente contra nenhum dos tRNAs endógenos, RSs1 aminoácidos ou códons no organismo hospedeiro (isto é, ele deve ser ortogonal). O uso desses pares de tRNA-RS ortogonais tornou possível codificar geneticamente um grande número de aminoácidos não-naturais estruturalmente diversificados.

A prática de utilização de sistemas de translação ortogonal, que são adequados para produção de proteínas que compreendam um ou mais aminoácidos não-naturais, é genericamente conhecida na técnica, assim como os métodos gerais para produção de sistemas de translação ortogonal. Por exemplo, consulte as Publicações Internacionais Números WO 2002/086075, intitulada "METHODS AND COMPOSITION FOR THE PRODUCTION OF ORTHOGONAL tRNA-AMINOACYL- tRNA SYNTHETASE PAIRS;" WO 2002/085923, intitulada "IN VIVO INCORPORATION OF UNNATURAL AMINO ACIDS;" WO 2004/094593, intitulada "EXPANDING THE EUKARYOTIC GENETIC CODE;" WO 2005/019415, depositada em 7 de julho de 2004; WO 2005/007870, depositada em 7 de julho de 2004; WO 2005/007624, depositada em 7 de julho de 2004 e WO 2006/110182, depositada em 27 de outubro de 2005, intitulada "ORTHOGONAL TRANSLATION COMPONENTS FOR THE IN VIVO INCORPORATION OF UNNATURAL AMINO ACIDS." Cada um desses pedidos encontra-se aqui incorporado em sua totalidade a título de referência. Para uma discussão adicional de sistemas de translação ortogonal que incorporam aminoácidos não-naturais, métodos para sua produção e uso, consulte, também, Wang and Schultz, "Expanding the Genetic Code," Chem. Commun. (Comb.) 1:1-11 (2002); Wang and Schultz "Expanding the Genetic Code," Angewandte Chemie Int. Ed., 44(l):34-66 (2005); Xie and Schultz, "An Expanding Genetic Code," Métodos 36(3):227-238 (2005); Xie and Schultz, "Adding Amino Acids to the Genetic Repertoire," Curr. Opinion in Chemical Biology 9(6):548-554 (2005); Wang et al., "Expanding the Genetic Code," Annu. Rev. Biophys. Biomol. Struct., 35:225-249 (2006); and Xie and Schultz, "A chemical tool kit for proteins - an expanded genetic code," Nat. Rev. Mol. Cell Biol, 7(10):775-782 (2006), sendo que os conteúdos destes estão aqui incorporados em sua totalidade a título de referência.

Há uma necessidade na técnica em desenvolver componentes de translação ortogonal que incorporem aminoácidos não-naturais fluorescentes em proteínas, onde os aminoácidos não-naturais fluorescentes podem ser incorporados em posições definidas. A invenção aqui descrita representa essas e outras necessidades, conforme se tornará aparente mediante a revisão da descrição a seguir.

Sumário da Invenção

A invenção proporciona composições e métodos para incorporação de aminoácido não-natural de cumarina de L-(7-hidroxicoumarin-4-il) etilglicina em uma cadeia polipeptídica em desenvolvimento em resposta a um códon seletor, por exemplo, um códon de parada âmbar, in vivo (por exemplo, em uma célula hospedeira). Essas composições incluem pares de tRNAs ortogonais (O-tRNAs) e aminoacil-tRNA sintetases ortogonais (O-RSs) que não interagem com o mecanismo de translação da célula hospedeira. Isto é, o O-tRNA não é carregado (ou não carregado até um nível significativo) com um aminoácido (natural ou não- natural) por um aminoacil-tRNA sintetase de célula hospedeira endógena. De maneira semelhante, as O-RSs proporcionadas pela invenção não carregam nenhum tRNA endógeno com um aminoácido (natural ou não-natural) até um nível significativo ou detectável. Essas composições inusitadas permitem a produção de grandes quantidades de proteínas dotadas de L-(7-hidroxicumarin-4-il) etilglicina transacionalmente incorporada. Essas proteínas fluorescentes marcadas encontram uma ampla gama de usos.

Em alguns aspectos, a invenção proporciona sistemas de translação. Esses sistemas compreendem uma primeira aminoacil-tRNA sintetase ortogonal (O-RS), um primeiro tRNA ortogonal (O-tRNA), e um primeiro aminoácido não-natural que seja L-(7- hidroxicumarin-4-il) etilglicina, onde a primeira O-RS aminoacila, de preferência, o primeiro O-tRNA com o primeiro aminoácido não-natural.

Os sistemas de translação podem utilizar componentes derivados a partir de uma variedade de fontes. Em uma modalidade, a primeira O-RS é derivada a partir de uma aminoacil-tRNA sintetase de Methanococcus jannaschii, por exemplo, uma tirosil-tRNA sintetase de Methanococcus jannaschii do tipo selvagem. A O-RS usada no sistema pode compreender a seqüência aminoacídica apresentadas na SEQ ID NO: 4, e as variantes conservativas desta seqüência. Em algumas modalidades, o O-tRNA é um tRNA supressor âmbar. Em algumas modalidades, o O-tRNA compreende ou é codificado por SEQ ID NO: 1.

Em alguns aspectos, o sistema da invenção compreende, ainda, um ácido nucléico que codifica uma proteína de interesse, onde o ácido nucléico tem ao menos um códon seletor que é reconhecido pelo O-tRNA.

Em alguns aspectos, o sistema de translação incorpora um segundo par ortogonal (ou seja, uma segunda O-RS e um segundo O-tRNA) que utiliza um segundo aminoácido não-natural, de tal modo que o sistema fique agora disponível para incorporar ao menos dois aminoácidos não-naturais diferentes em diferentes sítios selecionados em um polipeptídeo. Neste sistema de duas partes, a segunda O-RS aminoacila, de preferência, o segundo O-tRNA com um segundo aminoácido não-natural que seja diferente do primeiro aminoácido não-natural, e o segundo O-tRNA reconhece um códon seletor que seja diferente do códon seletor reconhecido pelo primeiro O-tRNA.

Em algumas modalidades, o sistema de translação reside em uma célula hospedeira (e inclui a célula hospedeira). A célula hospedeira usada não é particularmente limitada, enquanto a O-RS e o O-tRNA retiverem sua ortogonalidade em seu ambiente de célula hospedeira. A célula hospedeira pode ser uma célula eubacteriana, como a E. coli. A célula hospedeira pode compreender um ou mais polinucleotídeos que codificam componentes do sistema de translação, incluindo a O-RS ou O-tRNA. Em algumas modalidades, o polinucleotídeo que codifica a O-RS compreende uma seqüência nucleotídica de SEQ ID NO: 5.

A invenção proporciona, também, métodos para produção de proteínas dotadas de um ou mais aminoácidos não-naturais em posições selecionadas. Esses métodos utilizam os sistemas de translação descritos anteriormente. Em geral, esses métodos iniciam com a etapa de proporcionar um sistema de translação que compreende: (i) um primeiro aminoácido não-natural que consiste em um aminoácido de cumarina L-(7-hidroxicumarin-4- il) etilglicina; (ii) um primeiro aminoacil-tRNA sintetase ortogonal (O-RS); (iii) um primeiro tRNA ortogonal (O-tRNA), sendo que a O-RS aminoacila, de preferência, o O-tRNA com o aminoácido não-natural; e, (iv) um ácido nucléico que codifica a proteína, sendo que o ácido nucléico compreende ao menos um códon seletor que é reconhecido pelo primeiro O-tRNA. Então, o método incorpora o aminoácido não-natural na posição selecionada na proteína durante a translação da proteína em resposta ao códon seletor, produzindo, assim, a proteína que compreende o aminoácido não-natural na posição selecionada.

Esses métodos podem ser amplamente aplicados através do uso de uma variedade de reagentes e etapas. Em algumas modalidades, proporciona-se um polinucleotídeo que codifica a O-RS. Em algumas modalidades, proporciona-se uma O-RS derivada a partir de um aminoacil-tRNA sintetase de Methanococcus jannaschii, por exemplo, pode-se proporcionar uma tirosil-tRNA sintetase de Methanococcus jannaschii do tipo selvagem. Em algumas modalidades, a etapa de fornecimento inclui proporcionar uma O-RS que compreende uma seqüência aminoacídica de SEQ ID NO: 4, e as variantes conservativas desta.

Em algumas modalidades desses métodos, o fornecimento de uma etapa de sistema de translação compreende a mutação de um bolso de ligação aminoacídico de uma aminoacil-tRNA sintetase do tipo selvagem por mutagênese sítio-direcionada, e selecionar uma O-RS resultante que aminoacila, de preferência, o O-tRNA com o aminoácido não- natural. A etapa de seleção pode compreender selecionar positiva e negativamente para a O-RS a partir de um lago de moléculas de aminoacil-tRNA sintetase resultantes seguindo a mutagênese sítio-direcionada. Em algumas modalidades, a etapa de fornecimento fornece um polinucleotídeo que codifica o O-tRNA, por exemplo, um O-tRNA que seja um tRNA supressor âmbar, ou um O-tRNA que compreenda ou seja codificado por um polinucleotídeo de SEQ ID NO: 1. Nesses métodos, a etapa de fornecimento pode fornecer, também, um ácido nucléico que compreenda um códon seletor âmbar que seja utilizado pelo sistema de translação.

Esses métodos podem, também, ser modificados de modo a incorporar mais de um aminoácido não-natural em uma proteína. Nesses métodos, emprega-se um segundo sistema de translação em conjunto com o primeiro sistema de translação, sendo que o segundo sistema tem especificidades diferentes de aminoácido e códon seletor. Por exemplo, a etapa de fornecimento pode incluir proporcionar uma segunda O-RS e um segundo O-tRNA, sendo que a segunda O-RS aminoacila, de preferência, o segundo O- tRNA com um segundo aminoácido não-natural que seja diferente do primeiro aminoácido não-natural, e o segundo O-tRNA reconhece um códon seletor no ácido nucléico que seja diferente do códon seletor reconhecido pelo primeiro O-tRNA.

Os métodos para produção de uma proteína com um aminoácido não-natural podem, também, ser administrados no contexto de uma célula hospedeira. Nesses casos, proporciona-se uma célula hospedeira, sendo que a célula hospedeira compreende o aminoácido não-natural, a O-RS, o O-tRNA e o ácido nucléico com ao menos um códon seletor que codifica a proteína, e onde a cultura da célula hospedeira resulta na incorporação do aminoácido não-natural. Em algumas modalidades, a etapa de fornecimento compreende proporcionar uma célula hospedeira eubacteriana (por exemplo, E. coli). Em algumas modalidades, a etapa de fornecimento inclui proporcionar uma célula hospedeira que contenha um polinucleotídeo que codifique a O-RS. Por exemplo, o polinucleotídeo que codifica a O-RS pode compreender uma seqüência nucleotídica de SEQ ID NO: 5. Em algumas modalidades, a etapa de fornecimento de um sistema de translação é realizada mediante o fornecimento de um extrato celular.

A invenção proporciona, também, uma variedade de composições, incluindo ácidos nucléicos e proteínas. A natureza da composição não é particularmente limitada, a não ser a composição que compreende o ácido nucléico ou proteína específica. As composições da invenção podem compreender qualquer número de componentes adicionais de qualquer natureza.

Por exemplo, a invenção proporciona composições que compreendem polipeptídeos de O-RS1 sendo que os polipeptídeos compreendem a seqüência aminoacídica de SEQ ID NO: 4, ou uma variante conservativa da mesma, onde a variante conservativa aminoacila um tRNA ortogonal (O-tRNA) cognato com um aminoácido não- natural com uma eficiência que seja ao menos 50% da eficiência observada para um sistema de translação que compreende o O-tRNA, o aminoácido não-natural e uma aminoacil-tRNA sintetase que compreende a seqüência aminoacídica de SEQ ID NO: 4. A invenção proporciona, também, polinucleotídeos que codificam qualquer um dos polipeptídeos anteriores. Em algumas modalidades, esses polinucleotídeos podem compreender uma seqüência nucleotídica de SEQ ID NO: 5. Em algumas modalidades, os polipeptídeos encontram-se em uma célula.

A invenção proporciona, também, composições polinucleotídicas que compreendem uma seqüência nucleotídica de SEQ ID NO: 5. Em algumas modalidades, a invenção proporciona vetores que compreendem os polinucleotídeos, por exemplo, vetores de expressão. Em algumas modalidades, a invenção proporciona células que compreendem um vetor descrito anteriormente.

Definições

Antes de descrever a invenção em detalhes, deve-se compreender que esta invenção não se limita a sistemas biológicos particulares, que podem, naturalmente, variar. Deve-se compreender, também, que a terminologia aqui usada é destinada ao propósito de descrever apenas modalidades particulares, e não se destina a ser limitante. Conforme o uso em questão no relatório descritivo e nas reivindicações em anexo, as formas singulares "um", "uma", "o" e "a" incluem referentes plurais exceto onde claramente indicado em contrário. Portanto, por exemplo, a referência a uma "célula" inclui combinações de duas ou mais células; a referência a "um polinucleotídeo" inclui, como uma importância prática, muitas cópias deste polinucleotídeo.

Exceto onde definido no presente documento e mais adiante no restante do relatório descritivo, todas as técnicas e termos científicos apresentam o mesmo significado conforme comumente compreendido por um indivíduo versado na técnica a qual a invenção pertence.

Ortoqonal: Conforme o uso em questão, o termo "ortogonal" refere-se a uma molécula (por exemplo, um tRNA ortogonal (O-tRNA) e/ou uma aminoacil-tRNA sintetase ortogonal (O-RS)) que funcione com componentes endógenos de uma célula com eficiência reduzida quando comparada a uma molécula correspondente que seja endógena à célula ou sistema de translação, ou que fracasse em funcionar com componentes endógenos da célula. No contexto de tRNAs e aminoacil-tRNA sintetases, o termo ortogonal se refere a uma incapacidade ou eficiência reduzida, por exemplo, menor que 20 % de eficiência, menor que 10 % de eficiência, menor que 5 % de eficiência ou menor que 1% de eficiência, de um tRNA ortogonal para funcionar com um tRNA sintetase endógena comparado a um tRNA endógeno para funcionar com a tRNA sintetase endógena, ou de uma aminoacil-tRNA sintetase ortogonal para funcionar com um tRNA endógeno comparado a uma tRNA sintetase endógena para funcionar com o tRNA endógeno. A molécula ortogonal carece de uma molécula complementar endógena funcionalmente normal na célula. Por exemplo, um tRNA ortogonal em uma célula é aminoacilado por qualquer RS endógeno da célula com eficiência reduzida ou até mesmo igual a zero, quando comparada à aminoacilação de um tRNA endógeno pelo RS endógeno. Em outro exemplo, um RS ortogonal aminoacila qualquer tRNA endógeno de uma célula de interesse com eficiência reduzida ou até mesmo igual a zero, quando comparada à aminoacilação do tRNA endógeno por um RS endógeno. Pode-se introduzir uma segunda molécula ortogonal na célula que funcione junto à primeira molécula ortogonal. Por exemplo, um par de tRNA/RS ortogonal inclui componentes complementar introduzidos que funcionam juntos na célula com uma eficiência (por exemplo, 45 % de eficiência, 50% de eficiência, 60% de eficiência, 70% de eficiência, 75% de eficiência, 80% de eficiência, 90% de eficiência, 95% de eficiência ou 99% de eficiência ou mais eficiência) quando comparados a um componentes de controle, por exemplo, um par de tRNA/RS endógeno correspondente, ou um par ortogonal ativo (por exemplo, um par de tirosil tRNA/RS ortogonal).

Tirosil-tRNA ortogonal: Conforme o uso em questão, um tirosil-tRNA ortogonal (tirosil-O-tRNA) é um tRNA que é ortogonal a um sistema de translação de interesse, onde o tRNA é: (1) idêntico ou substancialmente similar a um tirosil-tRNA de ocorrência natural, (2) derivado a partir de um tirosil-tRNA de ocorrência natural por mutagênese natural ou artificial, (3) derivado por qualquer processo que leve uma seqüência de uma seqüência de tirosil-tRNA do tipo selvagem ou mutante de (1) ou (2) em consideração, (4) homólogo a um tirosil-tRNA do tipo selvagem ou mutante; (5) homólogo a qualquer exemplo de tRNA que seja designado como um substrato para uma tirosil-tRNA sintetase na FIGURA 9, ou (6) uma variante conservativa de qualquer exemplo de tRNA que seja designado como um substrato para uma tirosil-tRNA sintetase na FIGURA 9. O tirosil-tRNA pode existir carregado com um aminoácido, ou em um estado descarregado. Deve-se compreender, também, que um "tirosil-O-tRNA" é, opcionalmente, carregado (aminoacilado) por uma sintetase cognata com um aminoácido que não seja tirosina, respectivamente, por exemplo, com um aminoácido não-natural. De fato, avaliar-se-á que um tirosil-O-tRNA da invenção é vantajosamente usado para inserir essencialmente qualquer aminoácido, seja natural ou não-natural, em um polipeptídeo em desenvolvimento, durante a translação, em resposta a um códon seletor.

Sintetase aminoacídica de tirosil ortogonal: Conforme o uso em questão, uma sintetase aminoacídica de tirosil ortogonal (tirosil-O-RS) é uma enzima que aminoacila, de preferência, o tirosil-O-tRNA com um aminoácido em um sistema de translação de interesse. O aminoácido que o tirosil-O-RS carrega no tirosil-O-tRNA pode ser qualquer aminoácido, seja natural, não-natural ou artificial, e não é limitado no presente documento. A sintetase é opcionalmente igual ou homóloga a uma sintetase aminoacídica de tirosil de ocorrência natural, ou igual ou homóloga a uma sintetase designada como uma O-RS na FIGURA 9. Por exemplo, a O-RS pode ser uma variante conservativa de um tirosil-O-RS da FIGURA 9, e/ou pode ser ao menos 50%, 60%, 70%, 80%, 90%, 95%, 98%, 99% ou mais idêntica em seqüência a uma O-RS da FIGURA 9.

Cognato: O termo "cognato" refere-se a componentes que funciona junto, ou têm algum aspecto de especificidade entre si, por exemplo, a um tRNA ortogonal e uma aminoacil-tRNA sintetase ortogonal. Os componentes podem, também, ser denominados como sendo complementares.

Aminoacila. de preferência,: Conforme o uso em questão com referência a sistemas de translação ortogonal, uma O-RS "aminoacila, de preferência," um O-tRNA cognato quando a O-RS carrega o O-tRNA com um aminoácido com mais eficiência do que carrega qualquer tRNA endógeno em um sistema de expressão. O seja, quando o O-tRNA e qualquer tRNA endógeno dado estiverem presentes em um sistema de translação em razões molares aproximadamente iguais, a O-RS carregará o O-tRNA com mais freqüência do que ela carregará o tRNA endógeno. De preferência, a razão relativa entre o O-tRNA carregado pela O-RS e o tRNA endógeno carregado pela O-RS é alta, resultando preferencialmente na O-RS carregando exclusivamente o O-tRNA, ou quase exclusivamente, quando o O-tRNA e o tRNA endógeno estiverem presentes em concentrações molares iguais no sistema de translação. A razão relativa entre o O-tRNA e o tRNA endógeno que é carregado pela O-RS, quando o O-tRNA e a O-RS estiverem presentes em concentrações molares iguais, é maior que 1:1 ,de preferência, ao menos cerca de 2:1 , com mais preferência, 5:1, com mais preferência ainda, 10:1, com mais preferência ainda, 20:1, com mais preferência ainda, 50:1, com mais preferência ainda, 75:1, com mais preferência ainda, 95:1,98:1,99:1, 100:1,500:1, 1.000:1,5.000:1 ou maior.

O O-RS "aminoacila, de preferência, um O-tRNA com um aminoácido não-natural" quando (a) a O-RS aminoacila, de preferência, o O-tRNA comparado a um tRNA endógeno, e (b) onde esta aminoacilação for específica para o aminoácido não-naturaí, conforme comparado à aminoacilação do O-tRNA pela O-RS com qualquer aminoácido natural. Ou seja, quando os aminoácidos não-naturais e naturais estiverem presentes em quantidades molares iguais em um sistema de translação que compreende a O-RS e o O-tRNA, a O-RS carregará o O-tRNA com o aminoácido não-natural com mais freqüência do que com o aminoácido natural. De preferência, a razão relativa entre o O-tRNA carregado com o aminoácido não-natural e o O-tRNA carregado com o aminoácido natural é alta. Com mais preferência, a O-RS carrega exclusivamente o O-tRNA, ou quase exclusivamente, com o aminoácido não-natural. A razão relativa entre o carregamento do O-tRNA com o aminoácido não-natural e o carregamento do O-tRNA com o aminoácido natural, quando tanto aminoácidos natural como não-naturais estiverem presentes no sistema de translação em concentrações molares iguais, é maior do que 1:1, de preferência ao menos cerca de 2:1, com mais preferência, 5:1, com mais preferência ainda, 10:1, com mais preferência ainda, 20: 1, com mais preferência ainda, 50:1, com mais preferência ainda, 75:1, com mais preferência ainda, 95: 1. 98:1, 99:1, 100:1, 500:1, 1.000:1, 5.000:1 ou maior.

Códon seletor: O termo "códon seletor" refere-se a códons reconhecidos pelo O- tRNA no processo de translação e não-reconhecidos por um tRNA endógeno. A alça do anticódon O-tRNA reconhece o códon seletor no mRNA e incorpora seu aminoácido, por exemplo, um aminoácido não-natural, neste sítio no polipeptídeo. Os códons seletores podem incluir, por exemplo, códons sem-sentido, como, códons de parada, por exemplo, códons âmbar, ocre e opala; quatro ou mais códons de base; códons raros; códons derivados a partir de pares de base naturais ou não-naturais e/ou similares.

tRNA supressor: Um tRNA supressor é um tRNA que altera a leitura de um RNA mensageiro (mRNA) em um dado sistema de translação, permitindo-se, tipicamente, a incorporação de um aminoácido em resposta a um códon de parada (isto é, "transleitura") durante a translação de um polipeptídeo. Em alguns aspectos, um códon seletor da invenção consiste em um códon supressor, por exemplo, um códon de parada (por exemplo, um códon âmbar, ocre ou opala), um códon de quatro bases, um códon raro, etc.

Atividade de supressão: Conforme o uso em questão, o termo "atividade de supressão" refere-se, em geral, à capacidade de um tRNA (por exemplo, um tRNA supressor) em permitir uma transleitura translacional de um códon (por exemplo, um códon seletor que seja um códon âmbar ou um códon de 4 ou mais bases) que, por outro lado, resultaria na terminação de translação ou translação incorreta (por exemplo, deslocação do quadro de leitura). A atividade de supressão de um tRNA supressor pode ser expressa como uma porcentagem de atividade de transleitura translacional observada comparada a um segundo tRNA supressor, ou comparada a um sistema de controle, por exemplo, um sistema de controle desprovido de uma O-RS.

A presente invenção proporciona vários métodos através dos quais a atividade de supressão pode ser quantificada. A supressão percentual de um O-tRNA particular e O-RS contra um códon seletor (por exemplo, um códon âmbar) de interesse se refere à porcentagem de atividade de um dado marcador de teste expresso (por exemplo, LacZ), que inclui um códon seletor, em um ácido nucléico que codifica o marcador de teste expresso, em um sistema de translação de interesse, onde o sistema de translação de interesse inclui uma O-RS e um O-tRNA, comparado a uma construção positiva de controle, onde o controle positivo é desprovido de O-tRNA, e O-RS e o códon seletor. Portanto, por exemplo, se uma construção marcadora de controle positivo ativo desprovida de um códon seletor tiver uma atividade observada de X em um dado sistema de translação, em unidades relevantes ao ensaio do marcador em questão, então, a supressão percentual de uma construção de teste que compreende o códon seletor é a porcentagem de X que a construção de marcador de teste exibe sob essencialmente as mesmas condições ambientais em que o marcador de controle positivo foi expresso, exceto pelo fato de que a construção de marcador de teste é expressa em um sistema de translação que inclui, também, o O-tRNA e a O-RS. Tipicamente, o sistema de translação que expressa o marcador de teste inclui, também, um aminoácido que é reconhecido pela O-RS e O-tRNA. Opcionalmente, a medição de supressão percentual pode ser redefinida através da comparação do marcador de teste a uma construção de marcador de controle "antecedente" ou "negativo", que inclui o mesmo códon seletor do marcador de teste, porém, em um sistema que não inclua o O-tRNA, a O- RS e/ou aminoácido relevante reconhecido pelo O-tRNA e/ou pela O-RS. Este controle negativo é útil em normalizar medições de supressão percentual responsáveis por efeitos de sinal antecedente a partir do marcador no sistema de translação de interesse.

Pode-se determinar a eficiência de supressão através de uma série de ensaios conhecidos na técnica. Por exemplo, pode-se utilizar um ensaio de gene repórter β- galactosidase, por exemplo, introduz-se um plasmídeo lacZ derivado (onde a construção tem um códon seletor η na seqüência de ácido nucléico lacZ) nas células a partir de um organismo adequado (por exemplo, um organismo em que os componentes ortogonais possam ser usados) junto a um plasmídeo que compreende um O-tRNA da invenção. Pode- se introduzir, também, uma sintetase cognata (como um polipeptídeo ou como um polinucleotídeo que codificam a sintetase cognata quando expressa). As células são cultivadas em um meio até que uma densidade desejada seja obtida, por exemplo, até um OD60O de cerca de 0,5, e realizam-se ensaios de β-galactosidase, por exemplo, utilizando-se o Kit de Ensaio de β-Galactosidase BetaFluor™ (Novagen). A supressão percentual pode ser calculada como a porcentagem da atividade para uma amostra relativa a um controle comparável, por exemplo, o valor observado a partir da construção de lacZ derivada, onde a construção tem um códon com sentido correspondente em posição desejada ao invés de um códon seletor.

Sistema de translação: O termo "sistema de translação" refere-se aos componentes que incorporam um aminoácido em uma cadeia polipeptídica em desenvolvimento (proteína). Os componentes de um sistema de translação podem incluir, por exemplo, ribossomos, tRNAs, sintetases, mRNA e similares. O O-tRNA e/ou as O-RSs da invenção podem ser adicionados ou ser parte de um sistema de translação in vitro ou in vivo, por exemplo, em uma célula não-eucariótica, por exemplo, uma bactéria (como, E. coli), ou em uma célula eucariótica, por exemplo, uma célula de levedura, uma célula de mamífero, uma célula vegetal, uma célula de alga, uma célula de fungo, uma célula de inseto e/ou similares.

Aminoácido não-natural: Conforme o uso em questão, o termo "aminoácido não- natural" refere-se a qualquer aminoácido, aminoácido modificado e/ou aminoácido análogo, que não seja um dos 20 aminoácidos comuns de ocorrência natural, selenocisteína nem pirrolisina. Por exemplo, o aminoácido não-natural L-(7-hidroxicumarin-4-il) etilglicina (também escrito como 7-hidroxicumarina-etilglicina; consulte a FIGURA 1, estrutura 1) encontra uso junto à invenção.

Derivado a partir: Conforme o uso em questão, o termo "derivado a partir" refere-se a um componente que é isolado a partir de, ou produzido utilizando-se, uma molécula ou organismo específico, ou informações da molécula ou organismo específico. Por exemplo, um polipeptídeo que seja derivado a partir de um segundo polipeptídeo pode incluir uma seqüência aminoacídica que seja idêntica ou substancialmente similar à seqüência aminoacídica do segundo polipeptídeo. No caso de polipeptídeos, as espécies derivadas podem ser obtidas, por exemplo, através de mutagênese de ocorrência natural, mutagênese direcionada artificial ou mutagênese aleatória artificial. A mutagênese usada para derivar polipeptídeos pode ser intencionalmente direcionada ou intencionalmente aleatória, ou uma mistura de cada. A mutagênese de um polipeptídeo para criar um polipeptídeo diferente derivado a partir do primeiro pode ser um evento aleatório (por exemplo, causador por infidelidade de polimerase) e a identificação do polipeptídeo derivado pode ser feita por métodos de varredura apropriados, por exemplo, conforme aqui discutido. A mutagênese de um polipeptídeo envolve, tipicamente, a manipulação do polinucleotídeo que codifica o polipeptídeo.

Seleção positiva ou marcador de varredura: Conforme o uso em questão, o termo "seleção positiva ou marcador de varredura" refere-se a um marcador que, quando presente, por exemplo, expresso, ativado ou algo do gênero, resulta na identificação de uma célula, que compreende o traço, por exemplo, uma célula com o marcador de seleção positiva, a partir daquelas sem o traço.

Seleção negativa ou marcador de varredura: Conforme o uso em questão, o termo "seleção negativa ou marcador de varredura" refere-se a um marcador que, quando presente, por exemplo, expresso, ativado, ou algo do gênero, permite a identificação de uma célula que não compreende uma propriedade ou traço selecionado (por exemplo, conforme comparado a uma célula que não possua a propriedade ou traço)

Repórter: Conforme o uso em questão, o termo "repórter" refere-se a um componente que pode ser usado para identificar e/ou selecionar componentes alvo de um sistema de interesse. Por exemplo, um repórter pode incluir uma proteína, por exemplo, uma enzima, que confira resistência ou sensibilidade antibiótica (por exemplo, /?-lactamase, cloranfenicol acetiltransferase (CAT), e similares), um marcador de varredura fluorescente (por exemplo, proteína verde fluorescente (por exemplo, (GFP), YFP, EGFP, RFP, etc.), um marcador Iuminescente (por exemplo, uma proteína Iuciferase proveniente do vaga-lume), um marcador de varredura baseado em afinidade, ou genes marcadores selecionáveis positivos ou negativos, tais como IacZ1 /?-gal/lacZ (/?-galactosidase), ADH (desidrogenase alcoólica), his3, ura3, Ieu2, Iys2, ou similares.

Eucariota: Conforme o uso em questão, o termo "eucariota" refere-se a organismos pertencentes ao reino Eukarya. Os eucariotas são, em geral, distinguíveis dos procariotas por sua organização tipicamente multicelular (porém, não exclusivamente multicelular, por exemplo, levedura), a presença de uma membrana nuclear e outras organelas com membrana, material genética linear (isto é, cromossomos lineares), a ausência de óperons, a presença de íntrons, mRNA de terminação mensageira e poli-A, e outras características bioquímicas, como uma estrutura ribossômica diferenciada. Os organismos eucarióticos incluem, por exemplo, animais (por exemplo, mamíferos, insetos, répteis, aves, etc.), ciliados, vegetais (por exemplo, monocotiledôneas, dicotiledôneas, algas, etc.), fungos, leveduras, flagelados, microsporídios, protistas, etc.

Procariota: Conforme o uso em questão, o termo "procariota" refere-se a organismos pertencentes ao reino Monera (também denominado como Procarya). Os organismos procarióticos são genericamente distinguíveis dos eucariontes por sua organização unicelular, reprodução assexuada por germinação ou ramificação, pela ausência de uma membrana nuclear ou outras organelas dotadas de membrana, por um cromossomo circular, pela presença de óperons, ausência de íntrons, mRNA de terminação mensageira e poli-A, e por outras características bioquímicas, como uma estrutura ribossômica diferenciada. O reino Prokarya inclui os sub-reinos Eubacteria e Archaea (algumas vezes denominados como "Archaebacteria"). As cianobactérias (as algas verde- azuladas) e micoplasmas são, algumas vezes, fornecidas em classificações separadas sob o reino Monera.

Bactéria: Conforme o uso em questão, os termos "bactéria" e "eubactéria" referem- se a organismos procarióticos que são distinguíveis do Archaea. De maneira similar, Archaea se refere aos procariotas que são distinguíveis das eubactérias. As eubactérias e Archaea podem ser distinguíveis por uma série de critérios morfológicos e bioquímicos. Por exemplo, diferenças em seqüências de RNA ribossômico, estrutura de RNA polimerase, a presença ou ausência de íntrons, sensibilidade antibiótica, a presença ou ausência de peptidoglicanos em paredes celulares e outros componentes de parede celular, estruturas ramificadas versus não-ramificadas de lipídeos de membrana, e a presença/ausência de histonas e proteínas tipo histona são usados para atribuir um organismo aos reinos Eubactéria ou Archaea.

Exemplos de Eubactérias incluem Escherichia coli, Thermus thermophilics, Bacillus subtilis e Bacillus stearothermophilus. Exemplos de Archaeabactérias incluem Methanococcus jannasehii (Mj), Methanosareina mazei (Mm), Methanobaeterium thermoautotrophieum (Mt), Methanoeoceus maripaludis, Methanopyrus kandleri, Halobacterium, como as espécies Haloferax volcanii e Halobacterium NRC-I1 Archaeoglobus fulgidus (Af), Pyrococcus furiosus (Pf)1 Pyrococcus horikoshii (Ph), Pyrobaeulum aerophilum, Pyroeoeeus abyssi, Sulfolobus solfatarieus (Ss), Sulfolobus tokodaii, Aeuropyrum pernix (Ap), Thermoplasma aeidophilum e Thermoplasma voleanium.

Variante conservativa: Conforme o uso em questão, o termo "variante conservativa," no contexto de um componente de translação, refere-se a um componente de translação, por exemplo, um O-tRNA de variante conservativa ou uma O-RS de variante conservativa, que realiza funcionalmente de maneira similar a um componente de base que a variante conservativa é similar, por exemplo, um O-tRNA ou O-RS1 dotados de variações na seqüência comparados a um O-tRNA ou O-RS de referência. Por exemplo, uma O-RS, ou uma variante conservativa da mesma O-RS1 aminoacilará um O-tRNA cognato com um aminoácido não-natural, por exemplo, um aminoácido não-natural L-(7-hidroxicumarin-4-il) etilglicina. Neste exemplo, a O-RS e sua variante conservativa não têm as mesmas seqüências aminoacídicas. A variante conservativa pode ter, por exemplo, uma, duas, três, quatro, cinco ou mais variações na seqüência, enquanto a variante conservativa ainda permanece complementar (por exemplo, funciona junto) ao O-tRNA ou O-RS cognato correspondente.

Em algumas modalidades, uma O-RS de variante conservativa compreende uma ou mais substituições aminoacídicas conservativas comparadas à O-RS da qual ela é derivada. Em algumas modalidades, uma O-RS de variante conservativa compreende uma ou mais substituições aminoacídicas conservativas comparadas à O-RS da qual ela é derivada, e, além disso, retém uma atividade biológica de O-RS; por exemplo, uma O-RS de variante conservativa que retém ao menos 10% da atividade biológica da molécula controladora de O-RS a partir da qual ela foi derivada, ou, alternativamente, ao menos 20%, ao menos 30%, ou ao menos 40%. Em algumas modalidades preferenciais, a O-RS de variante conservativa retém ao menos 50% da atividade biológica da molécula controladora de O-RS a partir da qual ela foi variada. As substituições aminoacídicas conservativas de uma O-RS de variante conservativa podem ocorrer em qualquer domínio da O-RS, incluindo o bolso de ligação aminoacídico.

Agente de seleção ou varredura: Conforme o uso em questão, o termo "agente de seleção ou varredura" refere-se a um agente que, quando presente, permite uma seleção/varredura de certos componentes a partir de uma população. Por exemplo, um agente de seleção ou varredura pode ser, mas não se limita a, por exemplo, um nutriente, um antibiótico, um comprimento de onda de luz, um anticorpo, um polinucleotídeo expressado, ou similares. O agente de seleção pode ser variado, por exemplo, por concentração, intensidade, etc. Em resposta a: Conforme o uso em questão, o termo "em resposta a" refere-se ao processo em que um O-tRNA da invenção reconhece um códon seletor e media a incorporação do aminoácido não-natural, que é acoplado ao tRNA, na cadeia polipeptídica em desenvolvimento.

Codificar: Conforme o uso em questão, o termo "codificar" refere-se a qualquer processo pelo qual a informação em uma macromolécula polimérica ou cadeia de seqüência é usada para direcionar a produção de uma segunda molécula ou cadeia de seqüência que seja diferente da primeira molécula ou cadeia de seqüência. Conforme o uso em questão, o termo é amplamente usado, e pode ter uma variedade de aplicações. Em alguns aspectos, o termo "codificar" descreve o processo de replicação semiconservativa de DNA, onde uma fita de uma molécula de DNA de fita dupla é usada como um padrão para codificar uma fita gêmea complementar recentemente sintetizada por uma polimerase de DNA dependente de DNA.

Em outro aspecto, o termo "codificar" refere-se a qualquer processo pelo qual a informação em uma molécula é usada para direcionar a produção de uma segunda molécula que tenha uma natureza química diferente da primeira molécula. Por exemplo, uma molécula de DNA pode codificar uma molécula de RNA (por exemplo, pelo processo de transcrição que incorpora uma enzima de polimerase de RNA dependente de DNA). Da mesma forma, uma molécula de RNA pode codificar um polipeptídeo, de acordo com o processo de translação. Quando usado para descrever o processo de translação, o termo "codificar" também se estende ao códon terceto que codifica um aminoácido. Em alguns aspectos,uma molécula de RNA pode codificar uma molécula de DNA, por exemplo, pelo processo de transcrição reversa que incorpora uma polimerase de DNA dependente de RNA. Em outro aspecto, uma molécula de DNA pode codificar um polipeptídeo, onde se compreende que "codificar", conforme usado neste caso, incorpora tanto os processos de transcrição como os processos de translação.

Breve Descrição das Figuras

A FIGURA 1 proporciona um diagrama esquemático da síntese química L-(7- hidroxicumarin-4-il) etilglicina (estrutura 1).

A FIGURA 2 proporciona espectros de absorção e emissão de L-(7-hidroxicumarin- 4-il) etilglicina. Ambos os espectros foram gravados em pH igual a 7,4, tampão de fosfato de sódio de 100 mM. Neste pH, a L-(7-hidroxicumarin-4-il) etilglicina está presente tanto sob a forma de fenol como de fenolato (em uma razão de aproximadamente 2:1). A forma de fenolato tem um coeficiente de extinção de 17000 a 360 nM e um rendimento quântico de 0,63.

A FIGURA 3 proporciona a estrutura de mioglobina de esperma de baleia (código pdb 105M). Os grupos R- de resíduos Ser4 e His37 são indicados. A FIGURA 4 proporciona os resultados de uma análise de dicroísmo circular de desenrolamento induzido por uréia de formas do tipo selvagem e mutantes de holomioglobina. As formas mutantes analisadas foram ou holomioglobinas mutantes Ser4 —> 7-hidroxicumarina-etilglicina ou His37 —► 7-hidroxicumarina-etilglicina. O desenrolamento foi monitorado tanto por intensidade CD como fluorescente de 7-hidroxicumarina-etilglicina. Ambos os experimentos foram realizados em uma solução tampão de fosfato de sódio de 100 mM, pH 7,4, com várias concentrações de uréia conforme indicado. Na presença de 5 M de uréia, ambos os mutantes de mioglobina mostram um aumento de 30% no sinal de fluorescência comparado a 0 M de uréia. A "fração enrolada" é calculada normalizando-se o sinal de fluorescência ou a elipticidade molar em 5 M de uréia até o estado completamente desenrolado.

A FIGURA 5 proporciona foto-gráficos da análise SDS-PAGE de expressão de mioglobina mutante TAG4 (indicada pela seta preta). O painel central mostra a resolução por SDS-PAGE pintada em azul de coomassie de proteínas acumuladas na presença e ausência de 1 mM de L-(7-hidroxicumarin-4-il) etilglicina. O painel direito mostra uma imagem de fluorescência de mioglonina do tipo selvagem e TAG4 mutante seguindo a resolução por SDS-PAGE. O painel esquerdo mostra os marcadores de massa molecular pintados.

A FIGURA 6 proporciona um espectro de ESI-MS da mioglobina mutante TAG4. A inserção mostra o espectro desconvulcionado. Massa esperada: 18512 Da; Encontrado: 18511 Da.

A FIGURA 7 proporciona um espectro de absorção de aminoácido de cumarina L- (7-hidroxicumarin-4-il) etilglicina de 60 μΜ em uma solução tampão de fosfato de sódio de 100 mM.

A FIGURA 8 proporciona um modelo estrutural do sítio ativo de MyTyrRS (CouRS- D8) mutante. O modelo foi gerado utilizando-se a estrutura de MyTyrRS do tipo selvagem (código pdb 1J1U). O substrato de tirosina foi substituídos por L-(7-hidroxicumarin-4-il) etilglicina, e as seguintes mutações foram indicadas: Tyr32Glu, Leu65His, Ala67Gly, His70Gly, Phel08Tyr, Glnl09His, Aspl58Gly e Leul62Gly. A estrutura foi otimizada por minimização de energia pelo software InsightlI® (Accelrys Software, Inc. ®, San Diego, CA, EUA).

A FIGURA 9 proporciona várias seqüências nucleotídicas e aminoacídicas.

Descrição Detalhada da Invenção

O presente relatório descritivo proporciona pares de tRNA ortogonal/aminoacil- tRNA sintetase que permitem a introdução seletiva in vivo do aminoácido fluorescente L-(7- hidroxicumarin-4-il) etilglicina (consulte a FIGURA 1, estrutura 1) em proteínas na E. coli em resposta a um códon seletor, por exemplo, o códon de parada âmbar TAG. A invenção proporciona polipeptídeos inusitados de aminoacil-tRNA sintetase ortogonal (O-RS) que carregam, de maneira específica, um tRNA ortogonal (O-tRNA) cognato com o aminoácido não-natural L-(7- hidroxicumarin-4-il) etilglicina.

A porção de 7-hidroxicumarina foi inicialmente investigada devido a seu alto rendimento quântico de fluorescência, deslocamento de Stoke relativamente grande (consulte a FIGURA 2), pequeno tamanho, sensibilidade ao pH (consulte a FIGURA 7) e polaridade de solvente (Zinsli, J. Photochem (1974) 3:55-69).

Em alguns aspectos, de modo a demonstrar (porém, sem limitar-se a) a presente invenção, a descrição no presente documento demonstra que a porção de aminoácido não- natural pode ser incorporada em uma proteína modelo (consulte os EXEMPLOS 4 e 5). Não se pretende que a incorporação do aminoácido não-natural seja limitada a qualquer proteína particular. A partir da presente descrição, ficará claro que a incorporação do aminoácido não-natural fluorescente em uma proteína particular de interesse é vantajosa para uma ampla variedade de propósitos.

A presente revelação descreve a evolução de pares inusitados de tRNA ortogonal/aminoacil-tRNA sintetase que funcionam em eubactérias para incorporar especificamente em sítio um aminoácido não-natural fluorescente (por exemplo, o aminoácido não-natural L-(7- hidroxicumarin-4-il) etilglicina proporcionado na FIGURA 1, estrutura 1) em resposta aos códons seletores. Resumidamente, identificamos que mutantes inusitados da tirosil-tRNA sintetase de Methanococcus janaschii que carregam seletivamente um tRNA supressor com o aminoácido não-natural em células hospedeiras de E. coli.

Esses pares de tRNA-sintetase desenvolvidos podem ser usados para incorporar especificamente em sítio o aminoácido não-natural fluorescente em uma proteína. A incorporação do aminoácido não-natural na proteína pode ser programada de modo a ocorrer em qualquer posição desejada modificando-se por engenharia genética o polinucleotídeo que codifica a proteína de interesse para conter um códon seletor que sinaliza a incorporação do aminoácido não-natural.

A invenção aqui descrita proporciona pares ortogonais para codificação e incorporação genética de um aminoácido não-natural L-(7-hidroxicumarin-4-il) etilglicina em proteínas em uma eubactéria, por exemplo, uma célula E. coli, onde os componentes ortogonais não reagem cruzadamente com componentes endógenos E. coli do mecanismo translacional da célula hospedeira, porém, reconhecem o aminoácido não-natural desejado e o incorpora nas proteínas em resposta a um códon seletor (por exemplo, um códon sem- sentido âmbar, TAG). Os componentes ortogonais proporcionados pela invenção incluem aminoacil-tRNA sintetases ortogonais derivadas a partir de tirosil tRNA-sintetase de Methanococcus jannaschii, e o supressor âmbar tirosil íRNACua mutante, que funciona como um par ortogonal em uma célula hospedeira eubacteriana.

A presente invenção proporciona composições e métodos para identificar e produzir pares adicionais de tRNA ortogonal-amínoacil-tRNA sintetase, por exemplo, pares de O- tRNA/O-RS que podem ser usados para incorporar o aminoácido não-natural L-(7- hidroxicumarin-4-il) etil glicina em uma proteína. Um par de O-tRNA/O-RS da invenção é capaz de mediar a incorporação do 7-hidroxicumarina-etilglicina em uma proteína que seja codificada por um polinucleotídeo, onde o polinucleotídeo compreende um códon seletor que é reconhecido pelo O-tRNA. A alça de anticódon do O-tRNA reconhece o códon seletor em um mRNA e incorpora o aminoácido não-natural neste sítio no polipeptídeo. Em geral, uma aminoacil-tRNA sintetase ortogonal da invenção aminoacila, de preferência, (ou carrega) seu O-tRNA apenas com um aminoácido não-natural específico.

Tecnologia de tRNA ortoqonal/aminoacil-tRNA sintetase

Uma compreensão das composições e métodos inusitados da presente invenção requer uma compreensão das atividades associadas aos pares de tRNA ortogonal e aminoacil-tRNA sintetase ortogonal. Com a finalidade de adicionar aminoácidos não-naturais adicionais ao código genético, necessita-se de novos pares ortogonais que compreendam uma aminoacil-tRNA sintetase e um tRNA adequado que possam funcionar, de maneira eficaz, no mecanismo translacional hospedeiro, porém, que sejam "ortogonais" ao sistema de translação em debate, significando que ele funciona independentemente das sintetases e tRNAs endógenos ao sistema de translação. As características desejadas do par ortogonal incluem o tRNA que decodifica ou reconhece apenas um códon específico, por exemplo, um códon seletor, que não seja decodificado por nenhum tRNA endógeno, e aminoacil-tRNA sintetases que aminoacilam (ou "carregam"), de preferência, seu tRNA cognato apenas com um aminoácido não-natural específico. O O-tRNA também não é tipicamente aminoacilado (ou deficientemente aminoacilado, isto é, carregado) por sintetases endógenas. Por exemplo, em um sistema hospedeiro de E coli, um par ortogonal incluirá uma aminoacil- tRNA sintetase que não reaja cruzadamente com nenhum dos tRNAs endógenos, por exemplo, destes, existem 40 em E coli, e um tRNA ortogonal que não seja aminoacilado por qualquer uma das sintetases endógenas, por exemplo, destes, existem 21 em E coli.

Os princípios gerais de sistemas de translação ortogonais que são adequados para produzir proteínas que compreendem um ou mais aminoácidos não-naturais são conhecidos na técnica, assim como os métodos gerais para produção de sistemas de translação ortogonais. Por exemplo, consulte as Publicações Internacionais Números WO 2002/086075, intitulada "METHODS AND COMPOSITION FOR THE PRODUCTION OF tRNA ORTHOGONAL-AMINOACYL-tRNA SYNTHETASE PAIRS;" WO 2002/085923, intitulada "IN VIVO INCORPORATION OF UNNATURAL AMINO ACIDS;" WO 2004/094593, intitulada "EXPANDING THE EUKARYOTIC GENETIC CODE;" WO 2005/019415, depositada em 7 de julho de 2004; WO 2005/007870, depositada em 7 de julho de 2004; WO 2005/007624, depositada em 7 de julho de 2004; WO 2006/110182, depositada em 27 de outubro de 2005, intitulada "ORTHOGONAL TRANSLATION COMPONENTS FOR THE IN VIVO INCORPORATION OF UNNATURAL AMINO ACIDS," e o Pedido de Utilidade U.S. com número de série 11/715.672, intitulado "SYSTEMS FOR THE EXPRESSION OF ORTHOGONAL TRANSLATION COMPONENTS IN EUBACTERIAL HOST CELLS," depositado em 7 de março de 2007. Cada um desses pedidos está aqui incorporado em sua totalidade a título de referência. Para discussão de sistemas de translação ortogonais que incorporam aminoácidos não-naturais, e métodos para sua produção e uso, consulte, também, Wang and Schultz, "Expanding the Genetic Code," Chem. Commun. (Comb.) 1:1- 11 (2002); Wang and Schultz "Expanding the Genetic Code," Angewandte Chemie Int. Ed., 44(l):34-66 (2005); Xie and Schultz, "An Expanding Genetic Code," Métodos 36(3):227-238 (2005); Xie and Schultz, "Adding Amino Acids to the Genetic Repertoire," Curr. Opinion in Chemical Biology 9(6):548-554 (2005); Wang et al., "Expanding the Genetic Code," Annu. Rev. Biophys. Biomol. Struct., 35:225-249 (2006); e Xie and Schultz, "A chemical toolkit for proteins - an expanded genetic code," Nat. Rev. Mol. Cell Biol, 7(10):775-782 (2006), os conteúdos destes estão aqui incorporados em sua totalidade a título de referência.

Sistemas de Translação Ortoqonal

Os sistemas de translação ortogonais compreendem, em geral, células (que podem ser células procariotas, como E. coli) que incluem um tRNA ortogonal (O-tRNA), uma aminoacil-tRNA sintetase ortogonal (O-RS) e um aminoácido não-natural, onde a O-RS aminoacila o O-tRNA com o aminoácido não-natural. Um par ortogonal da invenção pode incluir um O-tRNA, por exemplo, um tRNA supressor, um tRNA de deslocação do quadro de leitura, ou similares, e um O-RS cognato. Os sistemas ortogonais da invenção podem compreender, tipicamente, pares de O-tRNA/O-RS, seja no contexto de uma célula hospedeira seja sem a célula hospedeira. Além dos sistemas de múltiplos componentes, a invenção proporciona, também, componentes individuais inusitados, por exemplo, polipeptídeos inusitados de aminoacil-tRNA sintetase ortogonal (por exemplo, SEQ ID NO: 4), e os polinucleotídeos que codificam esses polipeptídeos (por exemplo, SEQ ID NO: 5).

Em geral, quando um par ortogonal reconhecer um códon seletor e carregar um aminoácido em resposta ao códon seletor, o par ortogonal é conhecido por "suprimir" o códon seletor. Ou seja, um códon seletor que não seja reconhecido pelo mecanismo endógeno do sistema de translação (por exemplo, das células) não é normalmente carregado, o que resulta em produção de bloqueio de um polipeptídeo que, de outro modo, seria transladado a partir do ácido nucléico. Em um sistema de par ortogonal, o O-RS aminoacila o O-tRNA com um aminoácido não-natural específico. O O-tRNA carregado reconhece o códon seletor e suprime o bloqueio translacional causado pelo códon seletor.

Em alguns aspectos, um O-tRNA da invenção reconhece um códon seletor e inclui ao menos, por exemplo, uma eficiência de supressão de cerca de 45%, 50%, 60%, 75%, 80% ou 90% ou superior na presença de uma sintetase cognata em resposta a um códon seletor comparada à eficiência de supressão de um O-tRNA que compreende, ou codificado por, uma seqüência polinucleotídica conforme apresentado na listagem de seqüência do presente documento.

Em algumas modalidades, a eficiência de supressão da O-RS e do O-tRNA juntos é, por exemplo, cerca de 5, 10, 15, 20 ou 25 vezes ou superior que a eficiência de supressão do O-tRNA isento de O-RS. Em alguns aspectos, a eficiência de supressão da O- RS e do O-tRNA juntos é, por exemplo, de ao menos cerca de 35%, 40%, 45%, 50%, 60%, 75%, 80%, ou 90% ou maior da eficiência de supressão de um par de sintetase ortogonal conforme apresentado nas listagens de seqüência do presente documento.

A célula hospedeira usa o par de O-tRNA/O-RS para incorporar o aminoácido não- natural em uma cadeia polipeptídica em desenvolvimento, por exemplo, através de um ácido nucléico que compreende um polinucleotídeo que codifique um polipeptídeo de interesse, onde o polinucleotídeo compreende um códon seletor que seja reconhecido pelo O-tRNA. Em determinados aspectos preferenciais, a célula pode incluir um ou mais pares adicionais de O-tRNA/O-RS, onde o O-tRNA adicional é carregado pela O-RS adicional com um aminoácido não-natural diferente. Por exemplo, um dos O-tRNAs pode reconhecer um códon de quatro bases e o outro O-tRNA pode reconhecer um códon de parada. De maneira alternativa, múltiplos códons de parada diferentes ou múltiplos códons de quatro bases diferentes podem ser usados no mesmo ácido nucléico codificador.

Conforme notado, em algumas modalidades, existem múltiplos pares de O-tRNA/O- RS em uma célula ou em outro sistema de translação, o que permite a incorporação de mais de um aminoácido não-natural em um polipeptídeo. Por exemplo, a célula pode incluir, ainda, um par adicional diferente de O-tRNA/O-RS e um segundo aminoácido não-natural, onde este O-tRNA adicional reconhece um segundo códon seletor e esta O-RS adicional aminoacila, de preferência, o O-tRNA com o segundo aminoácido não-natural. Por exemplo, uma célula que inclua um par de O-tRNA/O-RS (onde o O-tRNA reconhece, por exemplo, um códon seletor âmbar) pode compreender, ainda, um segundo par ortogonal, onde o segundo O-tRNA reconhece um códon seletor diferente, por exemplo, um códon opala, um códon de quatro bases, ou similares. De maneira desejável, os diferentes pares ortogonais são derivados a partir de diferentes fontes, o que pode facilitar o reconhecimento de diferentes códons seletores. Em determinadas modalidades, os sistemas compreende uma célula, como uma célula E. coli, que inclui um tRNA ortogonal (O-tRNA), uma aminoacil-tRNA sintetase ortogonal (O-RS)1 um aminoácido não-natural e um ácido nucléico que compreende um polinucleotídeo que codifique um polipeptídeo de interesse, onde o polinucleotídeo compreende o códon seletor que é reconhecido pelo O-tRNA. O sistema de translação pode ser, também, um sistema isento de células, por exemplo, qualquer um entre uma variedade de sistemas de transcrição/translação "in vitro" comercialmente disponíveis em combinação com um par de O-tRNA/O-RS e um aminoácido não-natural conforme descrito no presente documento.

O O-tRNA e/ou a O-RS podem ocorrer naturalmente ou podem, por exemplo, ser derivados por mutação de um tRNA e/ou RS de ocorrência natural, por exemplo, gerando-se bibliotecas de tRNAs e/ou bibliotecas de RSs, a partir de uma variedade de organismos e/ou utilizando-se uma variedade de estratégias de mutação disponíveis. Por exemplo, uma estratégia para produção de um par de tRNA ortogonal/aminoacil-tRNA sintetase envolve a importação de um par de tRNA heterólogo (à célula hospedeira)/sintetase, por exemplo, a partir de uma fonte que não seja a célula hospedeira, ou múltiplas fontes, na célula hospedeira. As propriedades do candidato de sintetase heteróloga incluem, por exemplo, que ele não carregue nenhum tRNA de célula hospedeira, e as propriedades do candidato de tRNA heterólogo incluem, por exemplo, que ele não seja amionoacilado por nenhuma sintetase de célula hospedeira. Além disso, o tRNA heterólogo é ortogonal a todas as sintetases de hospedeira. Uma segunda estratégia para geração de um par ortogonal envolve a geração de bibliotecas de mutantes a partir da qual se varre/seleciona um O-tRNA ou O-RS. Essas estratégias também podem ser combinadas.

tRNA ortogonal (O-tRNA)

Um tRNA ortogonal (O-tRNA) da invenção media, de maneira desejável, a incorporação de um aminoácido não-natural em uma proteína que seja codificada por um polinucleotídeo que por sua vez compreenda um códon seletor que seja reconhecido pelo O-tRNA, por exemplo, in vivo ou in vitro. Em determinadas modalidades, um O-tRNA da invenção inclui ao menos, por exemplo, cerca de 45%, 50%, 60%, 75%, 80% ou 90% ou superior de eficiência de supressão na presença de uma sintetase cognata em resposta a um códon seletor quando comparado a um O-tRNA que compreende, ou codificado, por uma seqüência polinucleotídica conforme apresentado nas seqüências de O-tRNA na listagem de seqüências do presente documento.

A eficiência de supressão pode ser determinada por uma série de ensaios conhecidos na técnica. Por exemplo, um ensaio de gene repórter de /3-galactosidase pode ser usado, por exemplo, um plasmídeo de lacZ derivado (onde a construção tem um códon seletor η na seqüência de ácido nucléico lacZ) é introduzido nas células a partir de um organismo adequado (por exemplo, um organismo em que os componentes ortogonais possam ser usados) junto a um plasmídeo que compreende um O-tRNA da invenção. Pode- se introduzir, também, uma sintetase cognata (como um polipeptídeo ou como um polinucleotídeo que codificam a sintetase cognata quando expressa). As células são cultivadas em um meio até que uma densidade desejada seja obtida, por exemplo, até um OD600 de cerca de 0,5, e realizam-se ensaios de β-galactosidase, por exemplo, utilizando-se o Kit de Ensaio de β-Galactosidase BetaFluor™ (Novagen). A supressão percentual pode ser calculada como a porcentagem da atividade para uma amostra relativa a um controle comparável, por exemplo, o valor observado a partir da construção de lacZ derivada, onde a construção tem um códon com sentido correspondente em posição desejada ao invés de um códon seletor.

Exemplos de O-tRNAs da invenção são apresentados na listagem de seqüência, por exemplo, consulte a FIGURA 9 e a SEQ ID NO: 1. A descrição do presente documento proporciona, também, o projeto de espécies de O-tRNA equivalentes adicionais. Em uma molécula de RNA, como um mRNA O-RS, ou molécula de O-tRNA, a timina (T) é substituída por uracila (U) relativa a uma determinada seqüência (ou vice-versa para DNA codificador), ou complemento da mesma. As modificações adicionais às bases também podem estar presentes para gerar moléculas funcionalmente equivalentes em grandes medidas.

A invenção abrange, também, as variações conservativas de O-tRNAs correspondentes aos O-tRNAs particulares do presente documento. Por exemplo, as variações conservativas de O-tRNA incluem as moléculas que funcionam como os O-tRNAs particulares, por exemplo, conforme consta na listagem de seqüência do presente documento e que mantêm a estrutura do tRNA em formato de L em virtude de uma auto- complementaridade apropriada, porém, não têm uma seqüência idêntica a elas, por exemplo, na listagem de seqüência ou FIGURA 9, e, de maneira desejável, são outras que não as moléculas de tRNA do tipo selvagem.

A composição que compreende um O-tRNA pode incluir, ainda, uma aminoacil- tRNA sintetase ortogonal (O-RS), onde a O-RS aminoacila, de preferência, o O-tRNA com um aminoácido não-natural. Em determinadas modalidades, uma composição que inclui um O-tRNA pode incluir, ainda, um sistema de translação (por exemplo, in vitro ou in vivo). Um ácido nucléico que compreende um polinucleotídeo que codifica um polipeptídeo de interesse, onde o polinucleotídeo compreende um códon seletor que seja reconhecido pelo O-tRNA, ou uma combinação de um ou mais desses também pode estar presente na célula.

Os métodos de produção de um tRNA ortogonal (O-tRNA) também consistem em uma característica da invenção. Um O-tRNA produzido pelo método também consiste em uma característica da invenção. Em determinadas modalidades da invenção, os O-tRNAs podem ser produzidos gerando-se uma biblioteca de mutantes. A biblioteca de tRNAs mutantes pode ser gerada utilizando-se várias técnicas de mutagênese conhecidas na técnica. Por exemplo, os tRNAs mutantes podem ser gerados por mutações sítio- específicas, mutações em pontos aleatórios, recombinação homóloga, embaralhamento de DNA ou outros métodos recursivos de mutagênese, construção quimérica ou qualquer combinação destes, por exemplo, do O-tRNA da SEQ ID NO: 1.

Podem-se introduzir mutações adicionais em posição(ões) específica(s), por exemplo, em posição(ões) não-conservativa(s), ou em uma posição conservativa, em posição(ões) aleatória(s), ou uma combinação de ambas em uma alça ou região desejada de um tRNA, por exemplo, uma alça de anticódon, a haste aceptora, braço ou alça D, alça variável, braço ou alça TPC, outras regiões da molécula de tRNA, ou uma combinação destas. Tipicamente, as mutações em um tRNA incluem a mutação da alça de anticódon de cada membro da biblioteca de tRNAs mutantes de modo a permitir o reconhecimento de um códon seletor. O método pode incluir, ainda, adicionar seqüências adicionais ao O-tRNA. Tipicamente, um O-tRNA possui um aperfeiçoamento de ortogonalidade para um organismo desejado comparado ao material de partida, por exemplo, a pluralidade de seqüências de tRNA, enquanto preserva sua afinidade voltada a uma RS desejada.

Os métodos incluem, opcionalmente, analisar a similaridade (e/ou homologia inferida) de seqüências de tRNAs e/ou aminoacil-tRNA sintetases de modo a determinar os candidatos em potencial para um O-tRNA, O-RS e/ou pares dos mesmos, que aparentam ser ortogonais para um organismo específico. Podem-se utilizar programas computacionais conhecidos na técnica e aqui descritos para a análise, por exemplo, programas BLAST e PILEUP podem ser usados. Em um exemplo, para escolher os componentes translacionais ortogonais em potencial destinados ao uso em E. coli, escolhe-se uma sintetase e/ou um tRNA que não exibam uma similaridade próxima de seqüência aos organismos eubacterianos.

Tipicamente, um O-tRNA é obtido submetendo-se, por exemplo, à seleção negativa, uma população de células de uma primeira espécie, em que as células compreendem um membro da pluralidade de O-tRNAs em potencial. A seleção negativa elimina as células que compreendem um membro da biblioteca de O-tRNAs em potencial que é aminoacilada por uma aminoacil-tRNA sintetase (RS) que por sua vez é endógena à célula. Isso fornece um lago de tRNAs que são ortogonais à célula da primeira espécie.

Em determinadas modalidades, na seleção negativa, códon(s) seletor(es) é(são) introduzido(s) em um polinucleotídeo que codifica um marcador de seleção negativa, por exemplo, uma enzima que confira resistência antibiótica, por exemplo, yff-lactamase, uma enzima que confira um produto detectável, por exemplo, /?-galactosidase, cloranfenicol acetil transferase (CAT), por exemplo, um produto tóxico, tal como barnase, em uma posição não- essencial (por exemplo, ainda produzindo uma barnase funcional), etc. A varredura/seleção é opcionalmente realizada cultivando-se a população de células na presença de um agente seletivo (por exemplo, um antibiótico, como a ampicillina). Em uma modalidade, a concentração do agente de seleção é variada.

Por exemplo, para medir a atividade de tRNAs supressores, utiliza-se um sistema de seleção que seja baseado na supressão in vivo do códon seletor, por exemplo, mutações sem sentido (por exemplo, de parada) ou deslocação de quadro de leitura introduzidas em um polinucleotídeo que codifique um marcador de seleção negativa, por exemplo, um gene para /Hactamase (bla). Por exemplo, constroem-se variantes de polinucleotídeo, por exemplo, variantes de bla, com um códon seletor em uma determinada posição (por exemplo, A184). As células, por exemplo, bactérias, são transformadas com esses polinucleotídeos. No caso de um tRNA ortogonal, que pode ser eficazmente carregado por sintetases E. coli endógenas, a resistência antibiótica, por exemplo, a resistência à ampicillina, deveria ser cerca de ou menor que para uma bactéria transformada sem plasmídeos. Se o tRNA não for ortogonal, ou se uma sintetase heteróloga capaz de carregar o tRNA for co-expressa no sistema, um nível maior de resistência a antibióticos, por exemplo, ampicillina, será observado. As células, por exemplo, bactérias, escolhidas são as incapazes de crescer em placas de Agar LB com concentrações antibióticas quase iguais às células transformadas sem plasmídeos.

No caso de um produto tóxico (por exemplo, ribonuclease ou barnase), quando um membro da pluralidade de tRNAs em potencial for aminoacilado por um hospedeiro endógeno, por exemplo, Escherichia coli sintetases (isto é, não é ortogonal ao hospedeiro, por exemplo, Escherichia coli sintetases), o códon seletor é suprimido e o produto tóxico de polinucleotídeo produzido leva à morte celular. As células que se abrigam em tRNAs ortogonais ou tRNAs não-funcionais sobrevivem.

Em uma modalidade, o lago de tRNAs que são ortogonais a um organismo desejado são, então submetidas a uma seleção positiva em que um códon seletor é colocado em um marcador de seleção positiva, por exemplo, codificado por um gene resistente a drogas, como um gene de /Mactamase. A seleção positiva é realizada em uma célula que compreende um polinucleotídeo que codifica ou compreende um membro do lago de tRNAs que sejam ortogonais à célula, um polinucleotídeo que codifica um marcador de seleção positiva e um polinucleotídeo que codifica um RS cognato. Em determinadas modalidades, a segunda população de células compreende células que não foram eliminadas pela seleção negativa. Os polinucleotídeos são expressos em uma célula e a mesma é cultivada na presença de um agente de seleção, por exemplo, ampicillina. Os tRNAs são, então, selecionados por sua capacidade em serem aminoacilados pela sintetase cognata co-expressa e inserir um aminoácido em resposta a este códon seletor. Tipicamente, essas células mostram um aprimoramento em eficiência de supressão comparada às células que se abrigam em tRNA(s) não-funcionais, ou tRNAs que não possam ser reconhecidos, de maneira eficaz, pela sintetase de interesse. A célula que se abriga em tRNAs ou tRNAs não-funcionais que não são eficazmente reconhecidos pela sintetase de interesse, são sensíveis a antibióticos. Portanto, os tRNAs que: (i) não sejam substratos para hospedeiros endógenos, por exemplo, Escherichia coli. sintetases; (ii) possam ser aminoacilados pela sintetase de interesse; e (iii) sejam funcionais em translação, sobrevivem a ambas as seleções.

Conseqüentemente, o mesmo marcador pode ser um marcador positivo ou negativo, dependendo do contexto no qual ele é varrido. Ou seja, o marcador é um marcador positivo se ele for varrido, porém, um marcador negativo se varrido novamente.

O rigor da seleção, por exemplo, da seleção positiva, da seleção negativa ou de ambas, nos métodos descritos acima, inclui, opcionalmente, a variação do rigor de seleção. Por exemplo, pelo fato de a barnase ser uma proteína extremamente tóxica, o rigor da seleção negativa pode ser controlado introduzindo-se diferentes números de códons seletores no gene de barnase e/ou utilizando-se um promoter induzível. Em outro exemplo, a concentração do agente de seleção ou varredura é variada (por exemplo, concentração de ampicillina). Em alguns aspectos da invenção, o rigor é variado pelo fato de a atividade desejada poder ser baixa durante ciclos anteriores. Portanto, quanto menos critérios de seleção rigorosos forem aplicados em ciclos anteriores, mais critérios rigorosos são aplicados em ciclos posteriores de seleção. Em determinadas modalidades, a seleção negativa, a seleção positiva ou ambas podem ser repetidas múltiplas vezes. Podem-se utilizar múltiplos marcadores de seleção negativa diferentes, marcadores de seleção positiva ou ambos. Em determinadas modalidades, o marcador de seleção positiva e o marcador de seleção negativa podem ser iguais.

Outros tipos de seleções/varreduras podem ser usados na invenção com o intuito de produzir componentes translacionais ortogonais, por exemplo, um O-tRNA, uma O-RS e um par de O-tRNA/O-RS que carregam um aminoácido não-natural em resposta a um códon seletor. Por exemplo, o marcador de seleção negativa, o marcador de seleção positiva ou tanto o marcador de seleção positiva como o marcador de seleção negativa podem incluir um marcador que exiba fluorescência ou catalise uma reação Iuminescente na presença de um reagente adequado. Em outra modalidade, um produto do marcador é detectado por classificação celular ativada por fluorescência (FACS) ou por luminescência. Opcionalmente, o marcador inclui uma afinidade baseada em marcador de varredura. Consulte, também, Francisco et al., (1993) "Production and fluorescence-activated cell sorting of Escherichia coli expressing a functional antibody fragment on the externai surface," Proc Natl Acad Sd USA. 90:10444-10448. Podem-se encontrar métodos adicionais para produção de um tRNA recombinante ortogonal, por exemplo, nas Publicações Internacionais WO 2002/086075, intitulada "METHODS AND COMPOSITIONS FOR THE PRODUCTION OF ORTHOGONAL tRNA AMINOACYL-tRNA SYNTHETASE PAIRS;" WO 2004/094593, intitulada "EXPANDING THE EUKARYOTIC GENETIC CODE;" e WO 2005/019415, depositada em 7 de julho de 2004. Consulte, também, Forster et al., (2003) "Programming peptidomimetic synthetases by translating genetic codes designed de novo," PNAS 100(ll):6353-6357; e, Feng et al, (2003), "Expanding tRNA recognition of a tRNA synthetase by a single amino acid change," PNAS 100(10):5676-5681.

Aminoacil-tRNA sintetase ortogonal (O-RS)

Uma O-RS da invenção aminoacila, de preferência, um O-tRNA com um aminoácido não-natural, in vitro ou in vivo. Uma O-RS da invenção pode ser proporcionada ao sistema de translação, por exemplo, uma célula, por um polipeptídeo que inclua uma O- RS e/ou por um polinucleotídeo que codifique uma O-RS ou uma porção da mesma. Por exemplo, uma O-RS exemplar compreende uma seqüência aminoacídica conforme apresentado na SEQ ID NO: 4, ou uma variação conservativa da mesma. Em outro exemplo, uma O-RS, ou uma porção da mesma, é codificada por uma seqüência polinucleotídica que codifica um aminoácido que compreende uma seqüência na listagem de seqüência ou nos exemplos do presente documento, ou uma seqüência polinucleotídica complementar da mesma. Consulte, por exemplo, o polinucleotídeo da SEQ ID NO: 5.

Os métodos para identificação de uma aminoacil-tRNA sintetase ortogonal (O-RS), por exemplo, uma O-RS, para uso com um O-tRNA, também são uma característica da invenção. Por exemplo, um método inclui submeter à seleção, por exemplo, seleção positiva, uma população de células de uma primeira espécie, em que as células compreendem individualmente: 1) um membro de uma pluralidade de aminoacil-tRNA sintetases (RSs), (por exemplo, a pluralidade de RSs pode incluir RSS mutantes, RSs derivadas de uma espécie que não seja a primeira espécie ou tanto as RSs mutantes como as RSs derivadas de uma espécie que não seja a primeira espécie); 2) o tRNA ortogonal (O- tRNA) (por exemplo, a partir de uma ou mais espécies); e 3) um polinucleotídeo que codifica um marcador de seleção (por exemplo, positiva) e compreende ao menos um códon seletor. As células são selecionadas ou varridas para as que apresentam um aprimoramento em eficiência de supressão comparadas às células isentas ou com uma quantidade reduzida do membro da pluralidade de RSs. A eficiência de supressão pode ser medida por técnicas conhecidas na técnica e conforme aqui descrito. As células dotadas de um aprimoramento em eficiência de supressão compreendem uma RS ativa que aminoacila o O-tRNA. Um nível de aminoacilação (in vitro ou in vivo) pela RS ativa de um primeiro conjunto de tRNAs das primeiras espécies é comparado ao nível de aminoacilação (in vitro ou in vivo) pela RS ativa de um segundo conjunto de tRNAs da segunda espécie. O nível de aminoacilação pode ser determinado por uma substancia detectável (por exemplo, um aminoácido não-natural marcado). A RS ativa que aminoacila com mais eficiência o segundo conjunto de tRNAs comparado ao primeiro conjunto de tRNAs é tipicamente selecionada, proporcionando, assim, uma aminoacil-tRNA sintetase ortogonal eficiente (otimizada) para uso com o O- tRNA. Uma O-RS, identificada pelo método, também consiste em uma característica da invenção.

Pode-se utilizar uma série de ensaios para determinar a aminoacilação. Esses ensaios podem ser realizados in vitro ou in vivo. Por exemplo, os ensaios de aminoacilação in vitro são descritos, por exemplo, em Hoben and Soil (1985,) Methods Enzymol. 113:55-59. A aminoacilação também pode ser determinada utilizando-se um gene repórter junto aos componentes de translação ortogonal e detectando-se o gene repórter em uma célula que expressa um polinucleotídeo compreendendo ao menos um códon seletor que codifique uma proteína. Consulte, também, WO 2002/085923, intitulada "IN VIVO INCORPORATION OF UNNATURAL AMINO ACIDS;" e WO 2004/094593, intitulada "EXPANDING THE EUKARYOTIC GENETIC CODE."

A O-RS identificada pode ser adicionalmente manipulada com a finalidade de alterar a especificidade de substrato da sintetase, de tal modo que apenas um aminoácido não-natural desejado, porém nenhum dos 20 aminoácidos comuns, seja carregado ao O- tRNA. Os métodos para gerar uma aminoacil-tRNA sintetase ortogonal com uma especificidade de substrato para um aminoácido não-natural incluem a mutação da sintetase, por exemplo, no sítio ativo na sintetase, no sítio de mecanismo de edição na sintetase, em diferentes sítios combinando-se diferentes domínios de sintetases, ou similares, e aplicando-se um processo de seleção. Utiliza-se uma estratégia, que é baseada na combinação de uma seleção positiva seguida por uma seleção negativa. Na seleção positiva, a supressão do códon seletor introduzido em posição(ões) não-essencial(is) de um marcador positivo permite que as células sobrevivam sob uma pressão de seleção positiva. Tanto na presença de aminoácidos naturais como na presença de aminoácidos não- naturais, os sobreviventes codificam as sintetases ativas que carregam o tRNA supressor ortogonal com um aminoácido natural ou aminoácido não-natural. Na seleção negativa, a supressão de um códon seletor introduzido em posição(ões) não-essencial(is) de um marcador negativo remove as sintetases com especificidades de aminoácido natural. Os sobreviventes da seleção negativa e da seleção positiva codificam as sintetases que aminoacilam (carregam) o tRNA supressor ortogonal apenas com aminoácidos não-naturais. Essas sintetases podem, então, ser submetida à outra mutagênese, por exemplo, embaralhamento de DNA ou outros métodos recursivos de mutagênese. Pode-se gerar uma biblioteca de O-RSs mutantes através do uso de várias técnicas de mutagênese conhecidas na técnica. Por exemplo, as RSs mutantes podem ser geradas por mutações sítio-específicas, mutações em pontos aleatórios, recombinação homóloga, embaralhamento de DNA ou outros métodos recursivos de mutagênese, construção quimérica ou qualquer combinação dos mesmos. Por exemplo, uma biblioteca de RSs mutantes pode ser produzida a partir de duas ou mais outras, por exemplo, "sub-bibliotecas" menores e menos diversas. As bibliotecas quiméricas de RSs também estão inclusas na invenção. Deve-se notar que as bibliotecas de tRNA sintetases de vários organismos (por exemplo, microorganismo, como eubactérias ou archaebactérias) como as bibliotecas que compreendem diversidade natural (consulte, por exemplo, a Patente U.S. No. 6.238.884 por Short et al.\ a Patente U.S. No. 5.756.316 por Schallenberger et al.\ a Patente U.S. No. 5.783.431 por Petersen et al.\ a Patente U.S. No. 5.824.485 por Thompson et al.\ a Patente U.S. No. 5.958.672 por Short et al), são opcionalmente construídas e varridas para pares ortogonais.

Uma vez que as sintetases forem submetidas à estratégia de seleção positiva e negativa/varredura, essas sintetases podem, então, ser submetidas a uma mutagênese adicional. Por exemplo, um ácido nucléico que codifica a O-RS pode ser isolado; um conjunto de polinucleotídeos que codifica as O-RSs mutantes (por exemplo, por mutagênese aleatória, mutagênese sítio-específica, recombinação ou qualquer combinação dos mesmos) pode ser gerado a partir do ácido nucléico; e, essas etapas individuais ou uma combinação dessas etapas pode ser repetida até que uma O-RS mutante seja obtida que aminoacila, de preferência, o O-tRNA com o aminoácido não-natural. Em alguns aspectos da invenção, as etapas são realizadas múltiplas vezes, por exemplo, ao menos duas vezes.

Podem-se utilizar, também, níveis adicionais de rigor de seleção/varredura nos métodos da invenção, com a finalidade de produzir O-tRNA, O-RS1 ou pares dos mesmos. O rigor de seleção ou varredura pode ser variado em uma ou mais etapas do método para produzir uma O-RS. Este pode incluir, por exemplo, a variação da quantidade de agente de seleção/varredura que é utilizada, etc. Pode-se realizar, também ciclos adicionais de seleções positivas e/ou negativas. A seleção ou varredura podem compreender, também, uma alteração na permeabilidade de aminoácidos, uma alteração na eficiência de translação, uma alteração na fidelidade translacional, etc. Tipicamente, a uma ou mais alterações são baseadas em uma mutação em um ou mais genes em um organismo no qual um par de tRNA ortogonal-tRNA sintetase é usado para produzir proteínas.

Os detalhes gerais adicionais para produção de O-RS, e alterar a especificidade do substrato da sintetase podem ser encontrados na Publicação Interna Número WO 2002/086075, intitulada "METHODS AND COMPOSITIONS FOR THE PRODUCTION OF ORTHOGONAL tRNA AMINOACYL-tRNA SINTHETASE PAIRS; " e WO 2004/094593, intitulada "EXPANDING THE EUKARYOTIC GENETIC CODE." Consulte, também, Wang and Schultz "Expanding the Genetic Code," Angewandte Chemie Int. Ed., 44(1):34-66 (2005), sendo que os conteúdos destas estão aqui incorporados em sua totalidade a título de referência.

FONTE E ORGANISMOS HOSPEDEIROS

Os componentes translacionais ortogonais (O-tRNA e O-RS) da invenção podem ser derivados a partir de qualquer organismo (ou uma combinação de organismos) para uso em um sistema de translação hospedeiro a partir de quaisquer outras espécies, com a condição de que os componentes de O-tRNA/O-RS e o sistema hospedeiro trabalhem de maneira ortogonal. Isto não consiste em uma condição que o O-tRNA e a O-RS a partir de um par ortogonal seja derivado a partir do mesmo organismo. Em alguns aspectos, os componentes ortogonais são derivados a partir de genes Archaea (isto é, archaebactérias) para uso em um sistema hospedeiro eubacteriano.

Por exemplo, o O-tRNA ortogonal pode ser derivado a partir de um organismo Archae, por exemplo, uma archaebactéria, tal como Methanococcus jannaschii, Methanobacterium thermoautotrophieum, Halobacterium1 tal como Haloferax voleanii and Halobaeterium speeies NRC-I, Archaeoglobus fulgidus, Pyroeoecus furiosus, Pyroeoceus horikoshii, Aeuropyrum pernix, Methanoeoeeus maripaludis, Methanopyrus kandleri, Methanosareina mazei (Mm), Pyrobaeulum aerophilum, Pyroeoceus abyssi, Sulfolobus solfatarieus (Ss), Sulfolobus tokodaii, Thermoplasma aeidophilum, Thermoplasma voleanium, ou similares, ou uma eubaetéria, como Escherichia coli, Thermus thermophilics, Bacillus subtilis, Bacillus stearothermphilus, ou similares, enquanto a O-RS ortogonal pode ser derivada a partir de um organismo ou combinação de organismos, por exemplo, uma archaebactéria, tal como Methanoeoeeus jannaschii, Methanobacterium thermoautotrophieum, Halobacterium, tal como Haloferax voleanii e Halobacterium espécie NRC-1, Archaeoglobus fulgidus, Pyroeoceus furiosus, Pyroeoceus horikoshii, Aeuropyrum pernix, Methanoeoeeus maripaludis, Methanopyrus kandleri, Methanosarcina mazei, Pyrobaculum aerophilum, Pyroeoceus abyssi, Sulfolobus solfatarieus, Sulfolobus tokodaii, Thermoplasma aeidophilum, Thermoplasma voleanium, ou similares, ou uma eubaetéria, tal como Escherichia coli, Thermus thermophilus, Bacillus subtilis, Bacillus stearothermphilus, ou similares. Em uma modalidade, as fontes eucarióticas, por exemplo, vegetais, algas, protistas, fungos, leveduras, animais (por exemplo, mamíferos, insetos, artrópodes, etc.), ou similares, também podem ser usadas como fontes de O-tRNAs e O-RSs.

Os componentes individuais de um par de O-tRNA/O-RS podem ser derivados a partir do mesmo organismo ou a partir de organismos diferentes. Em uma modalidade, o par de O-tRNA/O-RS devida a partir do mesmo organismo. Alternativamente, o O-tRNA e a O- RS do par de O-tRNA/O-RS derivam a partir de organismos diferentes. O O-tRNA, a O-RS ou o par de O-tRNA/O-RS podem ser selecionados ou varridos in vivo ou in vitro e/ou usados em uma célula, por exemplo, uma célula eubacteriana, com a finalidade de produzir um polipeptídeo com um aminoácido não-natural. A célula eubacteriana usada não se limita, por exemplo, a Escherichia coli, Thermus thermophilus, Bacillus subtilis, Bacillus stearothermophilus, ou similares. As composições de células eubacterianas que compreendem componentes translacionais da invenção também consistem em uma característica da invenção.

Consulte, também, a Publicação Internacional Número WO 2004/094593, intitulada "EXPANDING THE EUKARYOTIC GENETIC CODE," depositada em 16 de abril de 2004, para varredura de O-tRNA e/ou O-RS em uma espécie para uso em outras espécies.

Muito embora os sistemas de translação ortogonais (por exemplo, que compreendem uma O-RS, um O-tRNA e um aminoácido não-natural) possam utilizar células hospedeiras cultivadas para produzir proteínas dotadas de aminoácidos não-naturais, não se pretende que um sistema de translação ortogonal da invenção necessite de uma célula hospedeira viável intacta. Por exemplo, um sistema de translação ortogonal pode utilizar um sistema isento de células na presença de um extrato celular. De fato, o uso de sistemas de transcrição in wíro/translação isentos de células para a produção de proteínas consiste em uma técnica bem estabelecida. A adaptação desses sistemas in vitro para produzir proteínas com aminoácidos não-naturais, que utilizam componentes de sistema de translação ortogonal aqui descrito, encontra-se no escopo da invenção.

CÓDONS SELETORES

Os códons seletores da invenção expandem a estrutura genética de códons do mecanismo biossintético de proteínas. Por exemplo, um códon seletor inclui, por exemplo, um único códon de três bases, um códon sem sentido, como um códon de parada, por exemplo, um códon âmbar (UAG), ou um códon opala (UGA), um códon não-natural, ao menos um códon de quatro bases, um códon raro, ou similares. Uma série de códons seletores pode ser introduzida em um gene desejado, por exemplo, um ou mais, dois ou mais, mais de três, etc. Utilizando-se diferentes códons seletores, múltiplos pares de mtRNA ortogonal/sintetase podem ser usados, permitindo uma incorporação sítio-específica simultânea de múltiplos aminoácidos não-naturais, por exemplo, incluindo um aminoácido não-natural, que utiliza diferentes códons seletores

Em uma modalidade, os métodos envolvem o uso de um códon seletor que seja um códon de parada para a incorporação de um aminoácido não-natural in vivo em uma célula. Por exemplo, produz-se um O-tRNA que reconheça o códon de parada e seja amionacilado por uma O-RS com um aminoácido não-natural. Este O-tRNA não é reconhecido pelas aminoacil-tRNA sintetases de hospedeiro de ocorrência natural. Pode-se utilizar a mutagênese sítio-direcionada convencional para introduzir o códon de parada no sítio de interesse em um polinucleotídeo que codifica um polipeptídeo de interesse. Consulte, por exemplo, Sayers et al. (1988), "5\3' Exonuclease in phosphorothioate-based oligonucleotide- directed mutagenesis," Nucleic Acids Res, 791-802. Quando a O-RS1 o O-tRNA e o ácido nucléico que codifica um polipeptídeo de interesse forem combinados, por exemplo, in vivo, o aminoácido não-natural é incorporado em resposta ao códon de parada de modo a fornecer um polipeptídeo contendo o aminoácido não-natural na posição específica. Em uma modalidade da invenção, o códon de parada usado como um códon seletor é um códon âmbar, UAG, e/ou um códon opala, UGA. Em um exemplo, um código genético, em que o UAG e UGA são utilizados como um códon seletor, pode codificar 22 aminoácidos enquanto preserva o códon sem sentido ocre, UAA, que é o sinal de terminação mais abundante.

A incorporação de aminoácidos não-naturais in vivo pode ser realizada sem perturbação significativa da célula hospedeira. Por exemplo, em células não-eucarióticas, como Escherichia coii, pelo fato de a eficiência de supressão para o códon UAG depender da competição entre o O-tRNA, por exemplo, o tRNA supressor âmbar, e o fator de liberação 1 (RFI) (que se liga ao códon UAG e inicia a liberação do peptídeo em desenvolvimento do ribossomo), a eficiência de supressão pode ser modulada, por exemplo, aumentando-se o nível de expressão de O-tRNA, por exemplo, o tRNA supressor, ou utilizando-se uma cepa deficiente RFI. Em células eucarióticas, pelo fato de a eficiência de supressão para o códon UAG depender da competição entre o O-tRNA, por exemplo, o tRNA supressor âmbar, e um fato de liberação eucariótico (por exemplo, eRF) (que se liga a um códon de parada e inicia a liberação do peptídeo em desenvolvimento do ribossomo), a eficiência de supressão pode ser modulada, por exemplo, aumentando-se o nível de expressão de O-tRNA, por exemplo, o tRNA supressor. Além disso, podem-se apresentar, também, compostos adicionais, por exemplo, agentes de redução, como ditiotreitol (DTT).

Os aminoácidos não-naturais também podem ser codificados com códons raros. Por exemplo, quando a concentração de arginina em uma reação de síntese de proteínas in vitro for reduzida, o códon de arginina raro, AGG, se provou eficaz para inserção de Ala por um tRNA sintético acilado com alanina. Consulte, por exemplo, Ma et al. (1993), Biochemistry 32:7939. Neste caso, o tRNA sintético compete com o tRNAArg de ocorrência natural, que existe como uma espécie secundária em Escherichia coli. Além disso, alguns organismos não usam todos os códons de terceto. Um códon AGA não-atribuído em Micrococcus Iuteus foi utilizado para inserção de aminoácidos em um extrato de transcrição/translação in vitro. Consulte, por exemplo, Kowal and Oliver (1997), Nucl. Acid. Res., 25:4685. Os componentes da invenção podem ser gerados para que utilizem esses códons raros in vivo.

Os códons seletores podem compreender, também, códons estendidos, códons de quatro ou mais bases, como, códons de quatro, cinco, seis ou mais bases. Os exemplos de códons de quatro bases incluem, por exemplo, AGGA, CUAG, UAGA, CCCU1 e similares. Exemplos de códons de cinco bases incluem, por exemplo, AGGAC, CCCCU, CGCUC, CUAGA, CUACU, UAGGC e similares. Os métodos da invenção incluem códons estendidos baseados em supressão de deslocação de quadro de leitura. Os códons de quatro ou mais bases podem inserir, por exemplo, um ou múltiplos aminoácidos não-naturais, na mesma proteína. Em outras modalidades, as alças de anticódon podem decodificar, por exemplo, ao menos um códon de quatro bases, ao menos um códon de cinco bases, ou ao menos um códon de seis bases ou mais. Visto que existem 256 códons de quatro bases possíveis, múltiplos aminoácidos não-naturais podem ser codificados na mesma célula utilizando-se um códon de quatro ou mais bases. Consulte, também, Anderson et al, (2002) "Exploring the Limits of Codon and Anticodon Size," Chemistry and Biology, 9:237-244; e, Magliery, (2001) "Expanding the Genetic Code: Selection of Efficient Suppressors of Four-base Codons and Identification of "Shifty" Four-base Codons with a Library Approach in Escherichia coli," J. Mol Biol, 307:755-769.

Por exemplo, os códons de quatro bases têm sido usados para incorporar aminoácidos não-naturais em proteínas utilizando-se métodos biossintéticos in vitro. Consulte, por exemplo, Ma et al., (1993) Biochemistry1 32:7939; and Hohsaka et al, (1999) J. Am. Chem. Soe, 121:34. Utilizaram-se CGGG e AGGU para incorporar simultaneamente 2- naftilalanina e um derivado de NBD de Iisina em estreptavidina in vitro com dois tRNAs supressores de deslocação de quadro de leitura quimicamente acilados. Consulte, por exemplo, Hohsaka et al, (1999) 7. Am. Chem. Soe, 121:12194. Em um estudo in vivo, Moore et al. examinou a capacidade de derivados de tRNALeu com anticódons de NCUA em suprimir códons de UAGN (N pode ser U1 A, G ou C), e descobriu que o UAGA quádruplo pode ser decodificado por um tRNALeu com um anticódon de UCUA com uma eficiência de 13 a 26% com pequena decodificação no quadro O ou -1. Consulte Moore et al, (2000) /. Mol Biol, 298:195. Em uma modalidade, os códons estendidos baseados em códons raros ou códons sem sentido podem ser usados na invenção, podendo reduzir a transleitura sem sentido e a supressão de deslocação de leitura de quadro em outros sítios indesejados. Utilizaram-se códons de quatro bases como códons seletores em uma variedade de sistemas ortogonais. Consulte, por exemplo, WO 2005/019415; WO 2005/007870 e WO 2005/07624. Consulte, também, Wang and Schultz "Expanding the Genetic Code," Angewandte Chemie Int. Ed., 44(l):34-66 (2005), o conteúdo deste encontra-se aqui incorporado em sua totalidade a título de referência. Embora os exemplos abaixo utilizem um códon seletor âmbar, podem-se utilizar, também códons de quatro ou mais bases, modifieando-se os exemplos de modo a incluir O-tRNAs de quatro bases e sintetases modificadas de modo a incluir mutações similares às descritas anteriormente para várias O- RSs de aminoácido não-natural. Para um determinado sistema, um códon seletor pode incluir, também, um dos códons naturais de três bases, onde o sistema endógeno não utiliza (ou usa raramente) o códon de base natural. Por exemplo, isto inclui um sistema que é isento de um tRNA que reconhece o códon natural de três bases, e/ou um sistema em que o códon de três bases é um códon raro.

Os códons seletores incluem, opcionalmente, pares de base não-natural. Esses pares de base não-natural expandem, ainda, o alfabeto genético existente. Um par de base extra aumenta o número de códons de terceto de 64 para 125. As propriedades de terceiros pares de base incluem pareamento de base estável e seletivo, incorporação enzimática eficaz em DNA com alta fidelidade por uma polimerase, e a eficiência continuou a extensão primária após a síntese do par de base não-natural inicial. As descrições dos pares de base não-natural que podem ser adaptados para métodos e composições incluem, por exemplo, Hirao et al, (2002) "An unnatural base pair for incorporating amino acid analogues into protein," Nature Biotechnology, 20:177-182. Consulte, também, Wu et al, (2002) J. Am. Chem. Soe. 124:14626-14630. Outras publicações relevantes são listadas abaixo.

Para uso in vivo, o nucleosídio não-natural tem uma membrana permeável e é fosforilado de modo a formar o trifosfato correspondente. Além disso, a informação genética crescente é estável e não destruída por enzimas celulares. As tentativas anteriores realizadas por Benner e outros se aproveitaram de padrões de ligação de hidrogênio que são diferentes dos padrões em pares canônicos de Watson-Crick, o exemplo mais digno de atenção é o par de iso-C:iso-G. Consulte, por exemplo, Switzer et al, (1989) J. Am. Chem. Soe, 111:8322; e Piccirilli et al, (1990) Nature, 343:33; Kool (2000) Curr. Opin. Chem. Bioll 4:602. Em geral, essas bases se desemparelham até certo grau com bases naturais e não podem ser enzimaticamente replicadas. Kool e parceiros demonstraram que as interações de empacotamento hidrofóbico entre as bases podem substituir a ligação de hidrogênio de modo a induzir a formação do par de base. Consulte, Kool (2000) Curr. Opin. Chem. Biol, 4:602; e Guckian and Kool, (1998) Angew. Chem. Int. Ed. Ingl, 36, 2825. Em uma tentativa em desenvolver um par de base não-natural que satisfaça todas as exigências anteriores, Schultz, Romesberg e parceiros sintetizaram e estudaram sistematicamente uma série de bases hidrofóbicas não-naturais. Descobriu-se que um auto-par de PICS:PICS é mais estável do que os pares de base natural, e podem ser eficazmente incorporados ao DNA por fragmento de Klenow de polimerase de DNA de Escherichia coli I (KF). Consulte, por exemplo, McMinn et al, (1999) J. Am. Chem. Soc1 121:11586; e Ogawa et al, (2000) J. Am. Chem. Soc1 122:3274. Um auto-par de 3MN:3MN pode ser sintetizado por KF com eficiência e seletividade suficiente para função biológica. Consulte, por exemplo, Ogawa et al, (2000) J. Am. Chem. Soe, 122:8803. No entanto, ambas as bases atuam como um terminador de cadeia para replicação adicional. Desenvolveu-se, recentemente, uma polimerase de DNA mutante que pode ser usada para replicar o auto-par de PICS. Além disso, um auto-par de 7AI pode ser replicado. Consulte, por exemplo, Tae et al, (2001) /. Am. Chem. Soe, 123:7439. Um par de metalobase inusitado, Dipic:Py, também foi desenvolvido, formando um par adequado mediante a ligação Cu(II). Consulte Meggers et al, (2000) /. Am. Chem.

Soe, 122:10714. Pelo fato de os códons estendidos e os códons não-naturais serem intrinsecamente ortogonais aos códons naturais, os métodos da invenção podem se aproveitar desta propriedade para gerar tRNA ortogonais para eles.

Pode-se utilizar, também, um sistema de contorno translacional para incorporar um aminoácido não-natural em um polipeptídeo desejado. Em um sistema de contorno translacional, uma grande seqüência é inserida em um gene, porém, não é transladado em proteína. A seqüência contém uma estrutura que serve como uma sugestão para induzir o ribossomo para saltar sobre a seqüência e resume a translação a jusante da inserção.

AMINOÁCIDOS NÃO-NATURAIS

Conforme o uso em questão, um aminoácido não-natural refere-se a qualquer aminoácido, aminoácido modificado, ou aminoácido análogo que não seja selenocisteina e/ou pirrolisina e os seguintes vinte alfa-aminoácidos geneticamente codificados: alanina, arginina, asparagina, ácido aspártico, cisteína, glutamina, ácido glutâmico, glicina, histidina, isoleucina, leucina, lisina, metionina, fenilalanina, prolina, serina, treonina, triptofano, tirosina, valina. A estrutura genética de um alfa-aminoácido é ilustrada pela Fórmula I:

<formula>formula see original document page 35</formula>

Tipicamente, um aminoácido não-natural consiste em qualquer estrutura tendo a Fórmula I, sendo que o grupo R é qualquer substituinte que não seja o usado nos vinte aminoácidos naturais. Consulte, por exemplo, Biochemistry por L. Stryer, 3a ed. 1988, Freeman and Company, Nova York, EUA para estruturas dos vinte aminoácidos naturais. Nota-se que os aminoácidos não-naturais da invenção podem ser compostos de ocorrência natural que não sejam os vinte alfa-aminoácidos anteriores.

Devido ao fato de os aminoácidos não-naturais da invenção serem tipicamente diferentes dos aminoácidos naturais na cadeia lateral, os aminoácidos não-naturais formam ligações de amida com outros aminoácidos, por exemplo, naturais ou não-naturais, da mesma maneira em que eles são formados em proteínas de ocorrência natural. No entanto, os aminoácidos não-naturais têm grupos de cadeia lateral que os distinguem dos aminoácidos naturais.

O aminoácido de interesse particular do presente documento é o aminoácido de cumarina não-natural L-(7-hidroxicumarin-4-il) etilglicina (também escrito como 7- hidroxicumarina-etilglicina; consulte a FIGURA 1, estrutura 1). Além do aminoácido não- natural7-hidroxicumarina-etilglicina, outros aminoácidos não-naturais podem ser simultaneamente incorporados a um polipeptídeo de interesse, por exemplo, utilizando-se um segundo par de O-RS/O-tRNA adequado com conjunto com um par ortogonal proporcionado pela presente invenção. Muitos desses aminoácidos não-naturais adicionais e pares ortogonais adequados são conhecidos. Consulte a presente descrição e as referências aqui citadas. Por exemplo, consulte Wang and Schultz "Expanding the Genetic Code," Angewandte Chemie Int. Ed., 44(l):34-66 (2005); Xie and Schultz, "An Expanding Genetic Code," Métodos 36(3):227-238 (2005); Xie and Schultz, "Adding Amino Acids to the Genetic Repertoire," Curr. Opinion in Chemical Biology 9(6):548~554 (2005); e Wang et al., "Expanding the Genetic Code," Ahnu. Rev. Biophys. Biomol. Struct., 35:225-249 (2006); sendo que os conteúdos destes encontram-se aqui incorporados em sua totalidade a título de referência.

Muito embora o aminoácido de cumarina não-natural L-(7-hidroxicumarin-4-il) etilglicina (mostrado na FIGURA 1, estrutura 1) seja de interesse primário nos exemplos aqui descritos, não se pretende que a invenção seja estritamente limitada a esta estrutura. De fato, pode-se produzir, prontamente, uma variedade de análogos estruturalmente relacionados e facilmente derivados que retenha a característica principal de fluorescência, e também sejam especificamente reconhecidos pelas aminoacil-tRNA sintetases da invenção (por exemplo, a O-RS da SEQ ID NO: 4). Pretende-se que esses análogos fluorescentes relacionados estejam no escopo da invenção.

Em outros aminoácidos não-naturais, por exemplo, R na Fórmula I compreende opcionalmente um alquil-, aril-, acil-, hidrazina, ciano-, halo-, hidrazida, alquenil, éter, borato, boronato, fosfo, fosfono, fosfina, enona, imina, éster, hidroxilamina, amina, e similares, ou qualquer combinação destes. Outros aminoácidos não-naturais de interesse incluem, mas não se limitam a, aminoácidos que compreendem um reticulador fotoativável, aminoácidos marcadores de spin, aminoácidos fluorescentes, aminoácidos de ligação metálica, aminoácidos contendo metal, aminoácidos radioativos, aminoácidos com grupos funcionais inusitados, aminoácidos que interagem covalente ou não-covalentemente com outras moléculas, aminoácidos foto-engaiolados e/ou fotoisomerizável, aminoácidos contendo biotina ou biotina análoga, aminoácidos contendo ceto, aminoácidos glicosilados, uma porção de sacarídeo ligada à cadeia lateral aminoacídica, aminoácidos que compreendem polietileno glicol ou poliéter, aminoácidos substituídos por átomo pesado, aminoácidos quimicamente clivável ou foto-clivável, aminoácidos com uma cadeia lateral alongada comparada aos aminoácidos naturais (por exemplo, poliéteres ou hidrocarbonetos de cadeia longa, por exemplo, maior que cerca de 5, maior que cerca de 10 carbonos, etc.), aminoácidos contendo açúcar ligado por carbono, aminoácidos contendo amino tioácidos e aminoácidos contendo uma ou mais porções tóxicas. Em outro aspecto, a invencao proporciona aminoacidos nao-naturais tendo a estrutura geral ilustrada pela Formula IV abaixo:

<formula>formula see original document page 37</formula>

Um aminoácido não-natural tendo esta estrutura é tipicamente qualquer estrutura onde R1 é um substituinte usado em um dos vinte aminoácidos naturais (por exemplo, tirosina ou fenilalanina) e R2 é um substituinte. Portanto, este tipo de aminoácido não-natural pode ser observado como um derivado de aminoácido natural.

Além dos aminoácidos não-naturais que contém a cadeia lateral de cumarina, como mostrado na FIGURA 1, estrutura 1, os aminoácidos não-naturais também podem opcionalmente compreender estruturas de cadeia principal modificada, por exemplo, conforme ilustrado pelas estruturas das Fórmulas II e III:

<formula>formula see original document page 37</formula>

onde Z compreende, tipicamente, OH1 NH2, SH1 NH-R', ou S-R'; XeY, que podem ser iguais ou diferentes, compreendem ,tipicamente, S ou O, e R e R', que são opcionalmente iguais ou diferentes, são tipicamente selecionados da mesma lista de constituintes para o grupo R descrito anteriormente para os aminoácidos não-naturais tendo a Fórmula I bem como hidrogênio. Por exemplo, os aminoácidos não-naturais da invenção compreendem, opcionalmente, substituições no grupo amino ou carboxila conforme ilustrado pelas Fórmulas II e III. Os aminoácidos não-naturais deste tipo incluem, mas não se limitam a, ácidos σ-hidróxi, σ-tioácidos σ-aminotiocarboxilatos, por exemplo, com cadeias laterais correspondentes aos vinte aminoácidos naturais ou cadeias laterais não-naturais. Além disso, as substituições no σ-carbono incluem, opcionalmente, aminoácidos L, D, ou a-a- dissubstituídos, como D-glutamato, D-alanina, D-metil-O-tirosina, ácido aminobutírico, e similares. Outras alternativas estruturais incluem aminoácidos cíclicos, como análogos de prolina, bem como, análogos de prolina de anel com 3,4,6,7,8 e 9 membros, aminoácidos β e γ, como B-alanina substituída e ácido γ-amino butírico. Em alguns aspectos, a invenção utiliza aminoácidos não-naturais na configuração L. No entanto, não se pretende que a invenção seja limitada ao uso de aminoácidos não- naturais de configuração L. Contempla-se que os D-enantiômeros destes aminoácidos não- naturais também encontram uso na invenção.

Os aminoácidos não-naturais que encontram uso na invenção não são estritamente limitados ao aminoácido de cumarina não-natural L-(7-hidroxicumarin-4-il) etilglicina. Um indivíduo versado na técnica reconhecerá que uma ampla variedade de análogos não- naturais de aminoácidos de ocorrência natural é facilmente derivada. Por exemplo, mas sem limitar-se a, os não-naturais derivados a partir de tirosina são prontamente produzidos. Os análogos de tirosina incluem, por exemplo, tirosinas para-substituídas, tirosinas orto- substituídas e tirozinas meta-substituídas, sendo que a tirosina substituída compreende um grupo alquinila, um grupo acetila, um grupo benzoíla, um grupo amino, uma hidrazina, uma hidroxiamina, um grupo tiol, um grupo carbóxi, um grupo isopropila, um grupo metila, um hidrocarboneto C6 a C2o de cadeia linear ou ramificada, um hidrocarboneto saturado ou insaturado, um grupo 0-metila, um grupo poliéter, um grupo nitro, ou similares. Além disso, contemplam-se, também, múltiplos anéis de arila substituída. Os análogos de glutamina da invenção incluem, mas não se limitam a, derivados de σ-hidróxi, derivados γ-substituídos, derivados cíclicos e derivados de glutamina substituídos de amina. Exemplos de análogos de fenilalanina incluem, mas não se limitam a, fenilalaninas para-substituídas, fenilalaninas orto-substituídas e fenilalaninas meta-substituídas, sendo que o substituinte compreende um grupo alquinila, um grupo hidróxi, um grupo metóxi, um grupo metila, um grupo alila, um aldeído, um nitro, um grupo tiol, ou grupo ceto, ou similares. Exemplos específicos de aminoácidos não-naturais incluem, mas não se limitam a, p-etiltiocarbonil-L-fenilalanina, p- (3- oxobutanoil)-L-fenilalanina, 1,5-dansil-alanina, aminoácido 7-amino-cumarina, aminoácido 7-hidróxi-cumarina, nitrobenzil-serina, 0-(2-nitrobenzil)-L-tirosina, p- carboximetil-L-fenilalanina, p-ciano-L-fenil alanina, m-ciano-L-fenilalanina, bifenilalanina, 3- amino-L-tirosina, bipiridil alanina, p-(2-amino-l-hidroxietil)-L- fenilalanina, p- isopropiltiocarbonil-L-fenilalanina, 3-nitro-L-tirosina e p-nitro-L-fenilalanina. Também, uma p- propargiloxifenilalanina, uma 3,4-diidróxi-L-fenialanina (DHP), uma 3, 4, 6-triidroxi-L- fenilalanina, uma 3,4,5-triidroxi-L-fenilalanina, 4-nitro- fenilalanina, uma p-acetil-L- fenilalanina, O-metil-L-tirosina, uma L-3-(2-naftil)alanina, uma 3-metil-fenilalanina, uma 0-4- alil-L-tirosina, uma 4-propil-L-tirosina, uma 3-nitro-tirosina, uma 3-tiol-tirosina, um tri-O-acetil- GlcNAc/?-serina, uma L-Dopa, uma fenilalanina fluorada, uma isopropil-L-fenilalanina, uma p-azido-L-fenilalanina, uma p-acil-L-fenilalanina, uma p-benzoil-L-fenilalanina, uma L- fosfoserina, uma fosfonoserina, uma fosfonotirosina, uma p-iodo-fenilalanina, uma p- bromofenilalanina, uma p-amino-L-fenilalanina e uma isopropil-L-fenilalanina, e similares. As estruturas de uma variedade de aminoácidos não-naturais são descritas nas referências aqui citadas. Consulte, também, as Publicações Internacionais WO 2004/094593, intitulada "EXPANDING THE EUKARYOTIC GENETIC CODE;" e WO 2006/110182, depositada em 27 de outubro de 2005, intitulada "ORTHOGONAL TRANSLATION COMPONENTS FOR THE IN VIVO INCORPORATION OF UNNATURAL AMINO ACIDS."

Síntese Química de Aminoácidos não-naturais

Muitos dos aminoácidos não-naturais proporcionados anteriormente encontram-se comercialmente disponíveis, por exemplo, junto à Sigma (EUA) ou Aldrich (Milwaukee, Wl, EUA). Os que não se encontram comercialmente disponíveis são opcionalmente sintetizados conforme proporcionado em várias publicações ou utilizando-se métodos padrão conhecidos aos versados na técnica. Para técnicas de síntese orgânica, consulte, por exemplo, Organic Chemistry por Fessendon and Fessendon, (1982, Segunda Edição, Willard Grant Press, Boston, Mass., EUA); Advanced Organic Chemistry por March (terceira edição, 1985, Wiley and Sons, Nova York, EUA); e Advanced Organic Chemistry por Carey and Sundberg (Terceira Edição, Partes AeB, 1990, Plenum Press, Nova York, EUA). As publicações adicionais que descrevem a síntese de aminoácidos não-naturais incluem, por exemplo, a WO 2002/085923 intitulada "IN VIVO INCORPORATION OF UNNATURAL AMINO ACIDS," Matsoukas et al, (1995) J. Med. Chem., 38:4660-4669; King and Kidd (1949) "A New Synthesis of Glutamine and of γ-Dipeptides of Glutamic Acid from Phthilated Intermediates," J. Chem. Soe, 3315-3319; Friedman and Chatterrji (1959) "Synthesis of Derivatives of Glutamine as Model Substrates for Anti-Tumor Agents," J. Am. Chem. Soe. 81:3750-3752; Craig et al (1988) "Absolute Configuration of the Enantiomers of 7-Chloro-4 [[4-(diethylamino)-l-methylbutyl]amino]quinoline (ChIoroquine)," J. Org. Chem. 53:1167-1170; Azoulay et al., (1991) "Glutamine analogues as Potential Antimalarials," Eur. J. Med. Chem. 26:201-205; Koskinen and Rapoport, (1989) "Synthesis of 4-Substituted Prolines as Conformation ally Constrained Amino Acid Analogues," J. Org. Chem. 54:1859-1866; Christie and Rapoport (1985) "Synthesis of Optieally Pure Pipecolates from L-Asparagine. Application to the Total Synthesis of (+)-Apovincamine through Amino Acid Decarbonilation and Iminium Ion Cyclization," J. Org. Chem. 1989:1859-1866; Barton et al, (1987) "Synthesis of Novel σ-Amino-Acids and Derivatives Using Radical Chemistry: Synthesis of L- and D- a- Amino-Adipic Acids1 L-o-aminopimelic Acid and Appropriate Unsaturated Derivatives," Tetrahedron Lett. 43:4297-4308; e, Subasinghe et al, (1992) "Quisqualic acid analogues: synthesis of beta-heterocyclic 2-aminopropanoic acid derivatives and their activity at a novel quisqualate-sensitized site," J. Med. Chem. 35:4602-7. Consulte, também, a Publicação Internacional WO 2004/058946, intitulada "PROTEIN ARRAYS," depositada em 22 de dezembro de 2003.

Absorção Celular de Aminoácidos Não-Naturais A absorção de aminoácido não-natural por uma célula é uma questão que é tipicamente considerada quando se projeta e seleciona aminoácidos não-naturais, por exemplo, para incorporação em uma proteína. Por exemplo, a densidade de alta carga de a- aminoácidos sugere que esses compostos improvavelmente penetrem nas células. Os aminoácidos naturais são recolhidos na célula através de uma coleção de sistemas de transporte baseados em proteínas exibindo, muitas vezes, graus variáveis de especificidade aminoacídica. Pode-se realizar uma rápida separação avaliando-se quais aminoácidos não- naturais, se existentes, são recolhidos pelas células. Consulte, por exemplo, os ensaios para determinação de toxidade, por exemplo, na Publicação Internacional WO 2004/058946, intitulada "PROTEIN ARRAYS," depositada em 22 de dezembro de 2003; e Liu and Schultz (1999) "Progress toward the evolution of an organism with an expanded genetic code," PNAS 96:4780-4785. Muito embora a absorção seja facilmente analisada por diversos ensaios, uma alternativa para projetar aminoácidos não-naturais, que sejam influenciáveis à absorção celular, consiste em proporcionar trajetórias biossintéticas com a finalidade de criar aminoácidos in vivo.

Biossíntese de Aminoácidos Não-Naturais

Já existem muitas trajetórias biossintéticas em células para a produção de aminoácidos e outros compostos. Embora um método biossintético para um aminoácido não-natural particular possa não existir na natureza, por exemplo, em uma célula, a invenção proporciona esses métodos. Por exemplo, as trajetórias biossintéticas para aminoácidos não-naturais são, opcionalmente, geradas na célula hospedeira mediante a adição de novas enzimas ou modificando-se as trajetórias existentes da célula hospedeira. As novas enzimas adicionais são, opcionalmente, enzimas de ocorrência natural ou enzimas artificialmente desenvolvidas. Por exemplo, a biossíntese de p-aminofenilalanina (conforme apresentado em um exemplo na WO 2002/085923) depende da adição de uma combinação de enzimas conhecidas a partir de outros organismos. Os genes para essas enzimas podem ser introduzidos em uma célula transformando-se a célula com um plasmídeo que compreenda os genes. Os genes, quando expressos na célula, proporcionam uma trajetória enzimática para sintetizar o composto desejado. Exemplos dos tipos de enzimas, que são opcionalmente adicionadas, são proporcionados nos exemplos abaixo. As seqüências enzimáticas adicionais são encontradas, por exemplo, nos banco de dados Genbank. As enzimas artificialmente desenvolvidas também são opcionalmente adicionadas em uma célula da mesma maneira. Desta forma, o mecanismo celular e as fontes de uma célula são manipulados de modo a produzir aminoácidos não-naturais.

De fato, pode-se utilizar uma variedade de métodos para produção de enzimas inusitadas destinadas ao uso em trajetórias biossintéticas, ou destinadas à avaliação de trajetórias existentes, para a produção de aminoácidos não-naturais, in vitro ou in vivo. Muitos métodos disponíveis e outros componentes de trajetória biossintética podem ser aplicados à presente invenção com a finalidade de produzir aminoácidos não-naturais (ou, de fato, desenvolver sintetases para que tenham novas especificidades de substratos ou outras atividades de interesse). Por exemplo, o embaralhamento de DNA é opcionalmente usado para desenvolver enzimas inusitadas e/ou trajetórias dessas enzimas para a produção de aminoácidos não-naturais (ou produção de novas sintetases), in vitro ou in vivo. Consulte, por exemplo, Stemmer (1994), "Rapid evolution of a protein in vitro by DNA shuffling," Nature 370(4):389-391; e, Stemmer, (1994) "DNA shuffling by random fragmentation and reassembly: In vitro recombination for molecular evolution," Proc. Natl. Acad. ScL USA., 91:10747-10751. Uma abordagem relacionada embaralha famílias de genes relacionados (por exemplo, homólogos) para desenvolver rapidamente as enzimas com características desejadas. Um exemplo desses métodos de "embaralhamento de gene familiar" é encontrado em Crameri et al. (1998) "DNA shuffling of a family of genes from diverse species accelerates directed evolution" Nature, 391(6664): 288-291. Podem-se gerar, também, novas enzimas (sejam componentes de trajetórias biossintéticas ou sintetases) através do uso de um procedimento de recombinação de DNA conhecido como "truncamento incrementai para a criação de enzimas híbridas" ("TTCHY"), por exemplo, conforme descrito em Ostermeier et al. (1999) "A combinatorial approach to hybrid enzymes independent of DNA homology" Nature Biotech 17:1205. Esta abordagem pode, também, ser usada para gerar uma biblioteca ou outras variantes de trajetória que possam servir como substratos para um ou mais métodos de recombinação in vitro ou in vivo. Consulte, também, Ostermeier et al. (1999) "Combinatorial Protein Engineering by Incrementai Truncation," Proc. Natl. Acad. Sei. USA, 96: 3562-67, e Ostermeier et al. (1999), "Incrementai Truncation as a Strategy in the Engineering of Novel Biocatalysts," Biological and Medicinal Chemistry, 7: 2139-44. Outra abordagem usa mutagênese de conjunto exponencial para produzir bibliotecas ou outras variantes de trajetória que, por exemplo, sejam selecionadas por uma capacidade em catalisar uma reação biossintética relevante para produzir um aminoácido não-natural (ou uma nova sintetase). Nesta abordagem, pequenos grupos de resíduos em uma seqüência de interesse são dispostos aleatoriamente em paralelo de modo a identificar, em cada posição modificada, os aminoácidos que conduzem às proteínas funcionais. Exemplos desses procedimentos, que podem ser adaptados à presente invenção, com a finalidade de produzir novas enzimas para produção de aminoácidos não-naturais (ou novas sintetases) são encontrados em Delegrave and Youvan (1993) Biotechnology Research 11:1548-1552. Ainda em outra abordagem, pode-se utilizar mutagênese aleatória ou semi-alheatória que utiliza oligonucleotídeos dopados ou degenerados para modificar geneticamente a enzima e/ou o componente de trajetória, por exemplo, utilizando-se os métodos gerais de mutagênese, por exemplo, de Arkin and Youvan (1992) "Optimizing nucleotide mixtures to encode specific subsets of amino acids for semi-random mutagenesis" Biotechnology 10:297-300; or Reidhaar-Olson et al. (1991) "Random mutagenesis of protein sequences using oligonucleotide cassettes" Methods Enzymol. 208:564-86. Pode-se utilizar ainda outra abordagem, geralmente, denominada como mutagênese "não-estocástica", que utiliza mutagênese de reunião de polinucleotídeos e mutagênese sítio-saturada, para produzir enzimas e/ou componentes de trajetória, que podem, então, ser classificados por uma capacidade de realizar uma ou mais sintetases ou funções de trajetória biossintética (por exemplo, para a produção de aminoácidos não- naturais in vivo). Consulte, por exemplo, Short "NON-STOCHASTIC GENERATION OF GENETIC VACCINES AND ENZYMES" WO 00/46344.

Uma alternativa a esses métodos mutacionais envolve a recombinação de todos os genomas de organismos e a seleção de progênie resultante para funções de trajetória particulares (geralmente denominada como "embaralhamento genômico completo"). Esta abordagem pode ser aplicada à presente invenção, por exemplo, por recombinação e seleção genômica de um organismo (por exemplo, uma E. coli ou outra célula) por uma capacidade em produzir um aminoácido não-natural (ou intermediário do mesmo). Por exemplo, os métodos ensinados nas seguintes publicações podem ser aplicados ao projeto de trajetória para a avaliação de trajetórias existentes e/ou novas em células com a finalidade de produzir aminoácidos não-naturais in vivo: Patnaik et al. (2002) "Genome shuffling of Iactobacillus for improved acid tolerance" Nature Biotechnology, 20(7): 707-712; and Zhang et al. (2002) "Genome shuffling leads to rapid phenotypic improvement in bactéria" Nature, 7 de fevereiro, 415(6872): 644-646.

Outras técnicas para modificar geneticamente organismos e trajetórias metabólicas, por exemplo, para a produção de compostos desejados também se encontram disponíveis e podem ser aplicadas à produção de aminoácidos não-naturais. Exemplos de publicações que ensinam as abordagens de modificação por engenharia genética de trajetórias incluem: Nakamura and White (2003) "Metabolic engineering for the microbial production of 1,3 propanediol" Curr. Opin. Biotechnol. 14(5):454-9; Berry et al. (2002) "Application of Metabolic Engineering to improve both the production and use of Biotech índigo" /. Industrial Microbiology and Biotechnology 28:127-133; Banta et al. (2002) "Optimizing an artificial metabolic pathway: Engineering the cofactor specificity of Corynebacterium 2,5-diketo-D- gluconic acid reductase for use in vitamin C biosynthesis" Biochemistry1 41(20), 6226-36; Selivonova et al. (2001) "Rapid Evolution of Novel Traits in Microorganisms" Applied and Environmental Microbiology, 67:3645, e muitos outros.

Independentemente do método usado, tipicamente, o aminoácido não-natural produzido por uma trajetória biossintética modificada por engenharia genética da invenção é produzido em uma concentração suficiente para biossíntese protéica eficaz, por exemplo, uma magnitude celular natural, porém, não até um grau para afetar significativamente a concentração de outros aminoácidos celulares ou esgotar as fontes celulares. As concentrações típicas produzidas in vivo desta maneira consistem em cerca de 10 a cerca de 0,05 mM. Visto que uma célula é modificada por engenharia genética com o intuito de produzir enzimas desejadas para uma trajetória específica e um aminoácido não-natural é gerado, as seleções in vivo são opcionalmente usadas para otimizar adicionalmente a produção do aminoácido não-natural tanto para síntese de proteína ribossômica como para o crescimento celular.

Componentes Ortoqonais para Incorporação de Aminoácidos Não-Naturais

A invenção proporciona composições e métodos para produção de componentes ortogonais que incorporem o aminoácido não-natural L-(7-hidroxicumarin-4-il) etilglicina (consulte a FIGURA 1, estrutura 1) em uma cadeia polipeptídica em desenvolvimento em resposta a um códon seletor, por exemplo, um códon de parada âmbar, um códon sem sentido, um códon com quatro ou mais bases, etc., por exemplo, in vivo. Por exemplo, a invenção proporciona tRNAs ortogonais (O-tRNAs), aminoacil-tRNA sintetases ortogonais (O-RSs) e pares dos mesmos. Esses pares podem ser usados para incorporar um an aminoácido não-natural em cadeias polipeptídicas em desenvolvimento.

Uma composição da invenção inclui uma aminoacil-tRNA sintetase ortogonal (O- RS), onde a O-RS aminoacila, de preferência, um O-tRNA com 7-hidroxicumarina-etilglicina. Em determinadas modalidades, a O-RS compreende uma seqüência aminoacídica que compreende a SEQ ID NO: 4, e variações conservativas desta. Em determinadas modalidades da invenção, a O-RS aminoacila, de preferência, o O-tRNA por qualquer tRNA endógeno com um aminoácido não-natural particular, onde a O-RS tem uma tendenciosidade para o O-tRNA, e onde a razão entre o O-tRNA carregado com o aminoácido não-natural e o tRNA endógeno carregado com o mesmo aminoácido não- natural é maior que 1:1, e, com mais preferência, onde a O-RS carrega o O-tRNA exclusivamente ou quase exclusivamente

Uma composição que inclua uma O-RS pode incluir opcionalmente, ainda, um tRNA ortogonal (O-tRNA), onde o O-tRNA reconhece um códon seletor. Tipicamente, um O-tRNA da invenção inclui ao menos cerca de, por exemplo, uma eficiência de supressão de 45%, 50%, 60%, 75%, 80%, 90% ou superior na presença de uma sintetase cognata em resposta a um códon seletor comparada à eficiência de supressão de um O-tRNA que compreende ou é codificada por uma seqüência polinucleotídica conforme apresentado nas listagens de seqüência (por exemplo, SEQ ID NO: 1) e nos exemplos do presente documento. Em uma modalidade, a eficiência de supressão da O-RS e do O-tRNA juntos é, por exemplo, de 5, 10, 15, 20, 25 vezes ou superior que a eficiência de supressão do O-tRNA na ausência de uma O-RS. Em alguns aspectos, a eficiência de supressão da O-RS e do O-tRNA juntos é de ao menos 45% da eficiência de supressão de um par de tirosil-tRNA sintetase ortogonal derivado a partir de Methanococcus jannaschii.

Uma composição que inclua um O-tRNA pode incluir, opcionalmente, uma célula (por exemplo, uma célula eubacteriana, como uma célula E coli e similares, ou uma célula eucariótica, como uma célula de levedura), e/ou um sistema de translação.

Proporciona-se, também, uma célula (por exemplo, uma célula eubacteriana ou uma célula de levedura) que compreenda um sistema de translação pela invenção, onde o sistema de translação inclui um tRNA ortogonal (O-tRNA); uma aminoacil-tRNA sintetase ortogonal (O-RS); e, um aminoácido não-natural 7-hidroxicumarina-etilglicina. Tipicamente, a O-RS aminoacila, de preferência, o O-tRNA por qualquer tRNA endógeno com o aminoácido não-natural, onde a O-RS tem uma tendenciosidade para o O-tRNA, e onde a razão entre o O-tRNA carregado com o aminoácido não-natural e o tRNA endógeno carregado com o aminoácido não-natural é maior que 1:1, e, com mais preferência, onde a O-RS carrega o O- tRNA exclusivamente ou quase exclusivamente. O O-tRNA reconhece o primeiro códon seletor, e a O-RS aminoacila, de preferência, o O-tRNA com um aminoácido não-natural. Em uma modalidade, o O-tRNA compreende ou é codificado por uma seqüência polinucleotídica conforme apresentado na SEQ ID NO: 1, ou uma seqüência polinucleotídica complementar da mesma. Em uma modalidade, a O-RS compreende uma seqüência aminoacídica conforme apresentado na SEQ ID NO: 4, e variações conservativas da mesma.

Uma célula da invenção pode, opcionalmente, compreende um par de O-tRNA/O- RS adicional diferente e um segundo aminoácido não-natural, por exemplo, onde este O- tRNA reconhece um segundo códon seletor e esta O-RS aminoacila, de preferência, o O- tRNA correspondente com o segundo aminoácido não-natural, onde o segundo aminoácido é diferente do primeiro aminoácido não-natural. Opcionalmente, uma célula da invenção inclui um ácido nucléico que compreende um polinucleotídeo que por sua vez codifica um polipeptídeo de interesse, onde o polinucleotídeo compreende um códon seletor que é reconhecido pelo O-tRNA.

Em determinadas modalidades, uma célula da invenção consiste em uma célula eubacteriana (como, E coli), que inclui um tRNA ortogonal (O-tRNA), uma aminoacil-tRNA sintetase ortogonal (O-RS), um aminoácido não-natural e um ácido nucléico que compreende um polinucleotídeo que por sua vez codifica um polipeptídeo de interesse, onde o polinucleotídeo compreende o códon seletor que é reconhecido pelo O-tRNA. Em determinadas modalidades da invenção, a O-RS aminoacila, de preferência, o O-tRNA com o aminoácido não-natural com uma eficiência que seja maior que a eficiência com a qual a O-RS aminoacila qualquer tRNA endógeno. Em determinadas modalidades da invenção, um O-tRNA da invenção compreende ou é codificado por uma seqüência polinucleotídica conforme apresentado nas listagens de seqüência (por exemplo, SEQ ID NO: 1) ou nos exemplos do presente documento, ou uma seqüência polinucleotídica complementar desta. Em determinadas modalidades da invenção, uma O-RS compreende uma seqüência aminoacídica conforme apresentado nas listagens de seqüência, ou uma variação conservativa desta. Em uma modalidade, a O-RS ou uma porção dela é codificada por uma seqüência polinucleotídica que por sua vez codifica um aminoácido conforme apresentado nas listagens de seqüência ou nos exemplos do presente documento, ou uma seqüência polinucleotídica complementar desta.

O O-tRNA e/ou a O-RS da invenção podem ser derivados a partir de uma variedade de organismos (por exemplo, organismos eucarióticos e/ou não-eucarióticos).

Os polinucleotídeos consistem, também, em uma característica da invenção. Um polinucleotídeo da invenção (por exemplo, SEQ ID NO: 5) inclui um polinucleotídeo an artificial (por exemplo, fabricado, e de ocorrência não-natural) que compreende uma seqüência nucleotídica que por sua vez codifica um polipeptídeo conforme apresentado nas listagens de seqüência do presente documento, e/ou é complementar à seqüência polinucleotídica. Um polinucleotídeo da invenção pode incluir, também, um ácido nucléico que se hibridiza a um polinucleotídeo descrito anteriormente, sob condições altamente rigorosas, por substancialmente todo o comprimento do ácido nucléico. Um polinucleotídeo da invenção inclui, ainda, um polinucleotídeo que, por exemplo, é ao menos 75%, ao menos 80%, ao menos 90%, ao menos 95%, ao menos 98% ou mais idêntico ao polinucleotídeo de um tRNA de ocorrência natural ou ácido nucléico codificador correspondente (porém, um polinucleotídeo da invenção que não seja de um tRNA de ocorrência natural nem de um ácido nucléico codificador correspondente), onde o tRNA reconhece um códon seletor, por exemplo, um códon de quatro bases. Os polinucleotídeos artificiais são, por exemplo, ao menos 80%, ao menos 90%, ao menos 95%, ao menos 98% ou mais idênticos a qualquer um dos anteriores e/ou um polinucleotídeo que compreenda uma variação conservativa de qualquer um dos anteriores, também se encontram inclusos nos polinucleotídeos da invenção.

Os vetores que compreende um polinucleotídeo da invenção também consistem em uma característica da invenção. Por exemplo, um vetor da invenção pode incluir um plasmídeo, um cosmídeo, um fago, um vírus, um vetor de expressão e/ou algo do gênero. Uma célula que compreende um vetor da invenção também consiste em uma característica da invenção.

Os métodos de produção de componentes de um par de O-tRNA/O-RS também consistem em características da invenção. Os componentes produzidos por esses métodos também consistem em uma característica da invenção. Por exemplo, os métodos de produção de ao menos um tRNA que seja ortogonal a uma célula (OtRNA) inclui a geração de uma biblioteca de tRNAs mutantes; sofrendo mutação de uma alça de anticódon de cada membro da biblioteca de tRNAs mutantes de modo a permitir o reconhecimento de um códon seletor, proporcionando, assim uma biblioteca de O-tRNAs em potencial, e submetendo-se à seleção negativa de uma primeira população de células de uma primeira espécie, onde as células compreendem um membro da biblioteca de O-tRNAs em potencial. A seleção negativa elimina as células que compreendem um membro da biblioteca de O- tRNAs em potencial que é aminoacilado por uma aminoacil-tRNA sintetase (RS) que é endógena à célula. Isso proporciona um lago de tRNAs que são ortogonais à célula da primeira espécie, proporcionando, assim, ao menos um O-tRNA. Proporciona-se, também, um O-tRNA produzido pelos métodos da invenção.

Em determinadas modalidades, os métodos compreende, ainda, submeter a uma seleção positiva uma segunda população de células da primeira espécie, onde as células compreendem um membro do lago de tRNAs que são ortogonais à célula da primeira espécie, uma aminoacil-tRNA sintetase cognata, e um marcador de seleção positiva. Mediante o uso da seleção positiva, as células são selecionadas e classificas para as células que compreendem um membro do lado de tRNAs que é aminoacilado pela aminoacil-tRNA sintetase cognata e que mostra uma resposta desejada na presença do marcador de seleção positiva, proporcionando, assim, um O-tRNA. Em determinadas modalidades, a segunda população de células compreende células que não foram eliminadas pela seleção negativa.

Proporcionam-se, também, métodos para identificar uma aminoacil-tRNA sintetase ortogonal que carrega um O-tRNA com um aminoácido não-natural. Por exemplo, os métodos incluem submeter uma população de células de uma primeira espécie a uma seleção, onde cada uma das células compreende: 1) um membro da pluralidade de aminoacil-tRNA sintetases (RSs), (por exemplo, a pluralidade de RSs pode incluir RSS mutantes, sendo que as RSs derivam a partir de uma espécie que não seja uma primeira espécie ou tanto as RSs mutantes como as RSs derivam a partir de uma espécie que não seja uma primeira espécie); 2) o tRNA ortogonal (O-tRNA) (por exemplo, a partir de uma ou mais espécies); e 3) um polinucleotídeo que codifica um marcador de seleção positiva e compreende ao menos um códon seletor.

As células (por exemplo , uma célula hospedeira) são selecionadas ou classificadas para aquelas que mostram um aperfeiçoamento na eficiência de supressão comparadas às células isentas ou que têm uma quantidade reduzida do membro da pluralidade de RSs. Essas células selecionadas/classificadas compreendem uma RS ativa que aminoacila o O- tRNA. Uma aminoacil-tRNA sintetase ortogonal identificada pelo também consiste em uma característica da invenção. Os métodos de produção de uma proteína em uma célula (por exemplo, em uma célula eubacteriana, como a célula E. coli ou similares, ou em uma célula de levedura) que têm o aminoácido não-natural em uma posição selecionada também consistem em uma característica da invenção. Por exemplo, um método inclui o desenvolvimento, em um meio apropriado, de uma célula, onde a célula compreende um ácido nucléico que por sua vez compreende ao menos um códon seletor e codifica uma proteína, fornecendo o aminoácido não-natural, e incorporando o aminoácido não-natural na posição específica na proteína durante a translação do ácido nucléico com o ao menos um códon seletor, produzindo, assim, a proteína. A célula compreende, ainda: um tRNA ortogonal (O-tRNA) que funciona na célula e reconhece o códon seletor; e, uma aminoacil-tRNA sintetase ortogonal (O- RS) que aminoacila, de preferência, o O-tRNA com o aminoácido não-natural. Uma proteína produzida por este método também consiste em uma característica da invenção.

A invenção proporciona, também, composições que incluem proteínas, onde as proteínas compreendem 7-hidroxicumarina-etilglicina. Em determinadas modalidades, a proteína compreende uma seqüência aminoacídica que seja ao menos 75% idêntica à seqüência aminoacídica de uma proteína conhecida, por exemplo, uma proteína terapêutica, uma proteína diagnostica, uma enzima industrial, ou uma porção destas. Opcionalmente, a composição compreende um veículo farmaceuticamente aceitável.

SEQÜÊNCIAS E VARIANTES ÁCIDO NUCLÉICAS E POLIPEPTÍDICAS

Conforme descrito no presente documento, a invenção proporciona seqüências polinucleotídicas que codificam, por exemplo, O-tRNAs e O-RSs, e seqüências aminoacídicas de polipeptídeo, por exemplo, O-RSs, e, por exemplo, composições, sistemas e métodos que compreendem as ditas seqüências polinucleotídicas ou polipeptídicas. Exemplos das ditas seqüências, por exemplo, seqüências aminoacídicas e nucleotídicas de O-tRNA e O-RS são descritos no presente documento (consulte a FIGURA 9, por exemplo, SEQ ID NOs: 4 e 5). No entanto, um indivíduo versado na técnica avaliará que a invenção não se limita a essas seqüências aqui descritas, por exemplo, nos Exemplos e na listagem de seqüência. Um indivíduo versado na técnica avaliará que a invenção proporciona, também, muitas seqüências relacionadas com as funções aqui descritas, por exemplo, polinucleotídeos e polipeptídeos que codificam variantes conservativas de uma O-RS descrita no presente documento.

A construção e análise das espécies de sintetase ortogonal (O-RS) que são capazes de aminoacilar um O-tRNA com um aminoácido não-natural 7-hidroxicumarina- etilglicina são descritas nos Exemplos 3 a 5. Esses Exemplos descrevem a construção e análise das espécies de O-RS que não são capazes de incorporar o aminoácido não-natural 7-hidroxicumarina-etilglicina. A invenção proporciona polipeptídeos (O-RSs) e polinucleotídeos, por exemplo, O- tRNA, polinucleotídeos que codificam O-RSs ou porções dos mesmos, oligonucleotídeos usados para isolar os clones de aminoacil-tRNA sintetase, etc. Os polinucleotídeos da invenção incluem os que codificam as proteínas ou polipeptídeos de interesse da invenção com um ou mais códons seletores. Além disso, os polinucleotídeos da invenção incluem, por exemplo, um polinucleotídeo que compreende uma seqüência nucleotídica conforme apresentado na SEQ ID NO: 5, e um polinucleotídeo que seja complementar ou que codifique uma seqüência polinucleotídica deste. Um polinucleotídeo da invenção inclui, também, qualquer polinucleotídeo que codifique uma seqüência aminoacídica de O-RS que compreende SEQ ID NO: 4. De maneira semelhante, um ácido nucléico artificial que se hibridiza a um polinucleotídeo indicado anteriormente sob condições altamente rigorosas por substancialmente todo o comprimento do ácido nucléico (e seja diferente de um polinucleotídeo de ocorrência natural) consiste em um polinucleotídeo da invenção. Em uma modalidade, uma composição inclui um polipeptídeo da invenção e um excipiente (por exemplo, tampão, água, excipiente farmaceuticamente aceitável, etc.) A invenção proporciona, também, um anticorpo ou anti-soro especificamente imunorreativo com um polipeptídeo da invenção. Um polinucleotídeo artificial consiste em um polinucleotídeo fabricado e não tem ocorrência natural.

Um polinucleotídeo da invenção inclui, também, um polinucleotídeo artificial que seja, por exemplo, ao menos 75%, ao menos 80%, ao menos 90%, ao menos 95%, ao menos 98% ou mais idêntico ao polinucleotídeo de um tRNA de ocorrência natural, (porém, que não seja um tRNA de ocorrência natural). Um polinucleotídeo inclui, também, um polinucleotídeo artificial que seja, por exemplo, ao menos 75%, ao menos 80%, ao menos 90%, ao menos 95%, ao menos 98% ou mais idêntico (porém não 100% idêntico) ao polinucleotídeo de um tRNA de ocorrência natural.

Em determinadas modalidades, um vetor (por exemplo, um plasmídeo, um cosmídeo, um fago, um vírus, etc.) compreende um polinucleotídeo da invenção. Em uma modalidade, o vetor é um vetor de expressão. Em outra modalidade, o vetor de expressão inclui um promotor ligado, de modo operacional, a um ou mais polinucleotídeos da invenção. Em outra modalidade, uma célula compreende um vetor que inclui um polinucleotídeo da invenção.

Um indivíduo versado na técnica avaliará, também, que muitas variantes das seqüências descritas se encontram inclusas na invenção. Por exemplo, as variações conservativas das seqüências descritas que rendem uma seqüência de funcionalidade idêntica se encontram inclusas na invenção. As variantes das seqüências polinucleotídicas de ácido nucléico, em que as variantes se hibridizam a ao menos uma seqüência descrita, são consideradas inclusas na invenção. As subseqüências exclusivas das seqüências aqui descritas, conforme determinado, por exemplo, através de técnicas de comparação de seqüência padrão, também se encontram inclusas na invenção.

Variações Conservativas

Devido à degeneração do código genético, as "substituições silenciosas" (isto é, substituições em uma seqüência de ácido nucléico que não resulta em uma alteração em um polipeptídeo codificado) consistem em uma característica implícita de toda seqüência de ácido nucléico que codifica uma seqüência aminoacídica. De maneira semelhante, as "substituições aminoacídicas conservativas," onde um ou um número limitados de aminoácidos em uma seqüência aminoacídica são substituídos por diferentes aminoácidos com propriedades altamente semelhantes, são, também, prontamente identificas como sendo altamente semelhantes a uma construção descrita. Essas variações conservativas de cada seqüência descrita consistem em uma característica da presente invenção.

As "variações conservativas" de uma seqüência de ácido nucléico particular referem-se aos ácidos nucléicos que codificam seqüência aminoacídicas idênticas ou essencialmente idênticas, ou, em que o ácido nucléico não codifica uma seqüência aminoacídica; em seqüências essencialmente idênticas. Um indivíduo versado na técnica reconhecerá que substituições, apagamentos ou adições individuais que alteram, adicionam ou apagam um único aminoácido ou uma pequena porcentagem dos aminoácidos (tipicamente menor que 5%, mais tipicamente menor que 4%, 2% ou 1%) em uma seqüência codificada consistem em "variações conservativamente modificadas" onde as alterações resultam no apagamento de um aminoácido, adição de um aminoácido, ou substituição de um aminoácido por um aminoácido quimicamente similar. Portanto, as "variações conservativas" de uma seqüência polipeptídica listada da presente invenção incluem substituições de uma pequena porcentagem, tipicamente menor que 5%, mais tipicamente menor que 2% ou 1%, dos aminoácidos da seqüência polipeptídica, por um aminoácido do mesmo grupo de substituição conservativa. Finalmente, a adição de seqüências que não alteram a atividade codificada de uma molécula de ácido nucléico, tal como a adição de uma seqüência não-funcional, consiste em uma variação conservativa do ácido nucléico básico.

As tabelas de substituição conservativa que proporcionam aminoácidos funcionalmente similares são bem conhecidas na técnica, onde um resíduo de aminoácido é substituído por outro resíduo de aminoácido com propriedades químicas semelhantes (por exemplo, cadeias laterais aromáticas ou cadeias laterais positivamente carregadas), e, portanto, não alteram substancialmente as propriedades funcionais da molécula de polipeptídeo. A seguir, apresentam-se grupos exemplares que contêm aminoácidos naturais com propriedades químicas semelhantes, onde as substituições em um grupo consistem em uma "substituição conservativa". Substituições Conservativas Aminoacídicas

<table>table see original document page 50</column></row><table>

Hibridizaoão de Ácido Nucléico

Pode-se utilizar a hibridização comparativa para identificar os ácidos nucléicos da invenção, incluindo variações conservativas de ácidos nucléicos da invenção, e este método de hibridização comparativa consiste em um método preferencial para distinguir os ácidos nucléicos da invenção. Além disso, os ácidos nucléicos alvos que se hibridizam em um ácido nucléico representado por SEQ ID NO: 5, sob condições rigorosamente altas, ultra- altas e ultra-ultra altas consistem em uma característica da invenção. Exemplos desses ácidos nucléicos incluem os com uma ou algumas substituições de ácido nucléico silenciosas ou conservativas comparadas a uma dada seqüência de ácido nucléico.

Um ácido nucléico de teste é conhecido por se hibridizar especificamente em um ácido nucléico de sonda quando ele hibridizar ao menos 50% tanto à sonda como ao alvo complementar perfeitamente adaptado, isto é, com uma razão sinal para ruído igual ao menos à metade tão alta quanto a hibridização da sonda ao alvo sob condições em que a sonda perfeitamente adaptada se liga ao alvo complementar perfeitamente adaptado com uma razão de sinal para ruído que seja ao menos cerca de 5x- 10x tão alta quanto a observada para hibridização de qualquer um dos ácidos nucléicos alvos não-adaptados.

Os ácido nucléicos "se hibridizam" quando eles se associam em solução. Os ácidos nucléicos se hibridizam devido a uma variedade de forças físico-químicas bem caracterizadas, como ligação de hidrogênio, exclusão de solvente, empilhamento de base e similares. Uma diretriz extensiva à hibridização de ácidos nucléicos é encontrada em Tijssen (1993) Laboratory Techniques in Biochemistry and Molecular Biology-Hybridization with Nucleic Acid Probes, Parte I, capítulo 2, "Overview of principies of hybridization and the strategy of nucleic acid probe assays," (Elsevier, Nova York, EUA), bem como em Current Protocols in Molecular Biology, Ausubel et at, eds., Current Protocols, um empreendimento comum entre Greene Publishing Associates, Inc. e John Wiley & Sons, Inc., (suplementado ao longo de 2006); Hames and Higgins (1995) Gene Probes 1, IRL Press at Oxford University Press, Oxford, Inglaterra, and Hames and Higgins (1995) Gene Probes 2, IRL Press at Oxford University Press, Oxford, Inglaterra, fornecem detalhes na síntese, rotulagem, detecção e quantificação de DNA e RNA, incluindo oligonucleotídeos. Um exemplo de condições rigorosas de hibridização para uma hibridização de ácidos nucléicos complementares que tem mais de 100 resíduos complementares em um filtro em uma técnica Southern ou Northern blot consiste em 50% de formalina com 1 mg de heparina a 42°C, sendo que a hibridização é realizada de um dia para o outro. Um exemplo de condições rigorosas de lavagem consiste em uma lavagem de 0,2x SSC a 65°C durante 15 minutos (consulte, Sambrook et al., Molecular Cloning - A Laboratory Manual (3a Ed.), Vol. 1-3, Cold Spring Harbor Laboratory, Cold Spring Harbor1 Nova York, EUA, 2001, para uma descrição de tampão SSC). Geralmente, uma lavagem de alto rigor é antecedida por uma lavagem de baixo rigor com a finalidade de remover o sinal de sonda de fundo. Um exemplo de lavagem de baixo rigor é 2x SSC a 40°C durante 15 minutos. Em geral, uma razão de sinal para ruído de 5x (ou maior) que a observada para uma sonda não- relacionada no ensaio de hibridização particular indica a detecção de uma hibridização específica.

As "condições rigorosas de lavagem de hibridização" no contexto de experimentos de hibridização de ácido nucléico, como hibridizações por Southern e Northern blot dependem da seqüência, e são diferentes sob diferentes parâmetros ambientais. Uma diretriz extensiva à hibridização de ácidos nucléicos é encontrada em Tijssen (1993) Laboratory Techniques in Biochemistry and Molecular Biology-Hybridization with Nucleic Acid Probes, Parte I, Capítulo 2, "Overview of principies of hybridization and the strategy of nucleic acid probe assays," (Elsevier, Nova York, EUA); e Hames and Higgins (1995) Gene Probes 1, IRL Press at Oxford University Press, Oxford, Inglaterra, e Hames and Higgins (1995) Gene Probes 2, IRL Press at Oxford University Press, Oxford, Inglaterra. As condições rigorosas de hibridização e lavagem podem facilmente ser determinadas de maneira empírica para qualquer ácido nucléico de teste. Por exemplo, na determinação de condições rigorosas de hibridização e lavagem, as condições de hibridização e lavagem são gradualmente aumentadas (por exemplo, aumentando-se a temperatura, diminuindo-se a concentração salina, aumentando-se a concentração detergente e/ou aumentando-se a concentração de solventes orgânicos, como formalina na hibridização ou lavagem), até que um conjunto selecionado de critérios seja satisfeito. Por exemplo, em condições altamente rigorosas de hibridização e lavagem, as condições de hibridização e lavagem são gradualmente aumentadas até que uma sonda se ligue a um alvo complementar perfeitamente adaptado com uma razão de sinal para ruído que seja de ao menos 5x tão alta quanto a observada para hibridização de uma sonda a um alvo não-adaptado.

As condições "muito rigorosas" são selecionadas de modo que sejam iguais ao ponto de fusão térmica (Tm) para uma sonda particular. O Tm é a temperatura (sob resistência e pH iônicos definidos) em que 50% da seqüência de teste se hibridiza em uma sonda perfeitamente adaptada. Por propósitos da presente invenção, em geral, as condições "altamente rigorosas" de hibridização e lavagem são selecionadas de modo que seja cerca de 5°C menor que o Tm para a seqüência específica em uma resistência e pH iônicos definidos.

As condições de hibridização e lavagem "ultra alta rigorosas" são aquelas em que o rigor das condições de hibridização e lavagem são aumentadas até que a razão de sinal para ruído para ligação da sonda ao ácido nucléico alvo complementar perfeitamente adaptado seja ao menos 10x maior que as condições observadas para qualquer um dos ácidos nucléicos alvo não-adaptados. Um ácido nucléico alvo que se hibridiza em uma sonda sob essas condições, com uma razão de sinal para ruído de ao menos /4 do ácido nucléico alvo complementar perfeitamente adaptado conhecida por se ligar à sonda sob condições ultra alta rigorosas.

De maneira semelhante, podem-se determinar até mesmo níveis maiores de rigor aumentando-se gradualmente as condições de hibridização e/ou lavagem do ensaio de hibridização relevante. Por exemplo, aqueles em que o rigor das condições de hibridização e lavagem são aumentadas até que a razão de sinal para ruído para ligação da sonda ao ácido nucléico alvo complementar perfeitamente adaptado seja ao menos 10x, 20X, 50X, 100X, ou 500X ou superior às condições observadas para hibridização de qualquer um dos ácidos nucléicos alvo não-adaptados. Um ácido nucléico alvo que se hibridiza em uma sonda sob essas condições, com uma razão de sinal para ruído de ao menos /4 do ácido nucléico alvo complementar perfeitamente adaptado conhecido por se ligar à sonda sob condições ultra-ultra-alta rigorosas.

Os ácidos nucléicos que não se hibridizam entre si sob condições rigorosas ainda são substancialmente idênticos se os polipeptídeos que eles codificam forem substancialmente idênticos. Isso ocorre, por exemplo, quando uma cópia de um ácido nucléico for criada utilizando-se a máxima degeneração de códon permitida pelo código genético.

Subseqüências Exclusivas

Em alguns aspectos, a invenção proporciona um ácido nucléico que compreende uma subseqüência exclusiva em um ácido nucléico selecionado a partir de seqüências de O-tRNAs e O-RSs aqui descritos. A subseqüência exclusiva é exclusiva quando comparada a um ácido nucléico correspondente a qualquer seqüência de ácido nucléico de O-tRNA ou O-RS conhecida. O alinhamento pode ser realizado utilizando-se, por exemplo, um conjunto BLAST para parâmetros predeterminados. Qualquer subseqüência exclusiva é útil, por exemplo, como uma sonda para identificar os ácidos nucléicos da invenção ou ácidos nucléicos relacionados.

De maneira semelhante, a invenção inclui um polipeptídeo que compreende uma subseqüência exclusiva em um polipeptídeo selecionado a partir de seqüências de O-RSs aqui descritas. No presente documento, a subseqüência exclusiva é exclusiva quando comparada a um polipeptídeo correspondente a qualquer seqüência polipeptídica conhecida.

A invenção proporciona, também, ácidos nucléicos alvos que se hibridizam sob condições rigorosas em um oligonucleotídeo de codificação exclusivo que codifica uma subseqüência exclusiva em um polipeptídeo selecionado partir de seqüências de O-RSs1 sendo que a subseqüência exclusiva é exclusiva quando comparada a um polipeptídeo correspondente a qualquer um dos polipeptídeos de controle (por exemplo, seqüências parentais a partir das quais as sintetases da invenção foram derivadas, por exemplo, por mutação). As seqüências exclusivas são determinadas conforme descrito anteriormente.

Comparação. Identidade e Homoloqia Seqüencial

Os termos "idêntico" ou "identidade percentual", no contexto de duas ou mais seqüências de ácido nucléico ou polipeptídicas, se referem a duas ou mais seqüências ou subseqüências que sejam iguais ou que tenham uma porcentagem específica de resíduos de aminoácidos ou nucleotídeos que sejam iguais, quando comparados e alinhados por máxima correspondência, conforme medido utilizando-se um dos algoritmos de comparação seqüencial descritos anteriormente (ou outros algoritmos disponíveis a indivíduos versados) ou por inspeção visual.

A frase "substancialmente idêntico", no contexto de dois ácidos nucléicos ou polipeptídeos (por exemplo, DNAs que codificam um O-tRNA ou O-RS1 ou a seqüência aminoacídica de uma O-RS) se refere a duas ou mais seqüências ou subseqüências que tenham ao menos cerca de 60%, cerca de 80%, cerca de 90 a 95%, cerca de 98%, cerca de 99% ou mais de identidade de resíduo de nuclèotídeo ou aminoácido, quando comparadas e alinhadas por máxima correspondência, conforme medido utilizando-se um algoritmo de comparação seqüencial ou por inspeção visual. Essas seqüências "substancialmente idênticas" são tipicamente consideradas como sendo "homólogas", sem referência à ancestralidade real. De preferência, o termo "identidade substancial" existe em uma região das seqüências que tenha ao menos cerca de 50 resíduos em comprimento, com mais preferência, em uma região que tenha menos cerca de 100 resíduos, e com a máxima preferência, as seqüências são substancialmente idênticas em uma região que tenha ao menos cerca de 150 resíduos, ou por todo o comprimento das suas seqüências a serem comparadas.

As proteínas e/ou seqüências protéicas são "homólogas" quando elas são derivadas, natural ou artificialmente, a partir de uma proteína ou seqüência protéica ancestral comum. De maneira semelhante, os ácidos nucléicos e/ou seqüências de ácido nucléico são homólogos quando eles são derivados, natural ou artificialmente, a partir de um ácido nucléico ou seqüência de ácido nucléico ancestral comum. Por exemplo, qualquer ácido nucléico de ocorrência natural pode ser modificado por qualquer método de mutagênese conhecido por incluir um ou mais códons seletores. Quando expresso, este ácido nucléico mutagenizado codifica um polipeptídeo que compreende um ou mais aminoácidos não-naturais. O processo de mutação pode, naturalmente, alterar adicionalmente um ou mais códons padrão, alterando, assim, um ou mais aminoácidos padrão também na proteína mutante resultante. A homologia é, em geral, deduzida a partir de similaridade seqüencial entre dois ou mais ácidos nucléicos ou proteínas (ou seqüências dos mesmos). A porcentagem precisa de similaridade entre as seqüências que é útil em estabelecer uma homologia varia em relação ao ácido nucléico e à proteína em questão, porém, apenas 25% de similaridade seqüencial é rotineiramente usada para estabelecer homologia. Podem-se utilizar, também, níveis maiores de similaridade seqüencial, por exemplo, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, ou 99% ou mais para estabelecer uma homologia. Os métodos para determinação porcentagens de similaridade seqüencial (por exemplo, BLASTP e BLASTN que utilizam parâmetros predeterminados) são descritos no presente documento e se encontram genericamente disponíveis.

Para determinação de comparação e homologia seqüencial, tipicamente, uma seqüência atua como uma seqüência de referência à qual as seqüências de teste são comparadas. Mediante o uso de um algoritmo de comparação seqüencial, as seqüências de teste e referência são lançadas em um computador, coordenadas subseqüenciais são designadas, se necessário, e os parâmetros de programa de algoritmo seqüencial são designados. Então, o algoritmo de comparação seqüencial calcula a identidade seqüencial percentual para a(s) seqüência(s) de teste relativa(s) à seqüência de referência, com base nos parâmetros de programa designados.

O alinhamento otimizado de seqüências para comparação pode ser conduzido, por exemplo, pelo algoritmo de homologia local de Smith e Waterman, Adv. Appl. Math. 2:482 (1981), pelo algoritmo de alinhamento de homologia de Needleman e Wunsch, J. Mol. Biol. 48:443 (1970), pela pesquisa por método de similaridade de Pearson e Lipman, Proc. Nat'1. Acad. ScL USA 85:2444 (1988), por implementações computadorizadas desses algoritmos (GAP, BESTFIT, FASTA, e TFASTA no Pacote de Software de Genéticas de Wisconsin, Genetics Computer Group, 575 Science Dr., Madison1 Wl, EUA), ou por inspeção visual (consulte, em geral, Current Protocols in Molecular Biology, Ausubel et al., eds., Current Protocols, um empreendimento conjunto entre Greene Publishing Associates, Inc. e John Wiley & Sons, Inc., suplementado ao longo de 2006).

Um exemplo de um algoritmo que é adequando para determinação de identidade seqüencial percentual e similaridade seqüencial é o algoritmo BLAST, que se encontra descrito em Altschul et al., J. Mol. Biol. 215:403-410 (1990). O software para realizar análises BLAST encontra-se publicamente disponível pelo Centro Nacional para Informações Biotecnológicas (consulte o site da Internet do NCBI). Este algoritmo envolve, primeiramente, a identificação de pares seqüenciais de alta classificação (HSPs) identificando-se pequenas palavras de comprimento W na seqüência de consulta, que se adapta ou satisfaz alguma classificação T de limite positivamente calculada quando alinhada a uma palavra de comprimento igual em uma seqüência de banco de dados. T é denominada como o limite de classificação de palavra vizinha Altschul et al (1990), J. Mol. Biol. 215:403-410. Essas palavras coincidentes de vizinhança inicial agem como origem para iniciar pesquisas para encontrar os HSPs mais longo que as contém. As palavras coincidentes são, então, estendidas em ambas as direções ao longo de cada seqüência até o ponto em que a classificação de alinhamento cumulativo possa ser aumentada. As classificações cumulativas são calculadas utilizando-se, para seqüências nucleotídicas, os parâmetros M (classificação de recompensa para um par de resíduos compatíveis; sempre > 0) e N (classificação de penalidade para resíduos não-compatíveis; sempre < 0). Para seqüências aminoacídicas, utiliza-se uma matriz de classificação para calcular a classificação cumulativa. A extensão das palavras coincidentes em cada direção é pausada quando: a classificação de alinhamento cumulativo diminui em relação à quantidade X a partir de seu máximo valor obtido; a classificação cumulativa tende a zero ou abaixo, devido ao acúmulo de um ou mais alinhamentos de resíduo com classificação negativa; ou se alcança o fim da seqüência. Os parâmetros do algoritmo BLAST W, T e X determinam a sensibilidade e velocidade do alinhamento. O programa BLASTN (para seqüências nucleotídicas) utiliza como parâmetros originais um comprimento de palavra (W) de 11, uma esperança (E) de 10, um limite de 100, M = 5, N = -4, e uma comparação de ambas as cepas. Para seqüências aminoacídicas, o programa BLASTP utiliza como parâmetros originais um comprimento de palavras (W) de 3, uma esperança (E) de 10, e a matriz de classificação BLOSUM62 (Consulte Henikoff and Henikoff (1989) Proc. Natl. Acad. Sei. USA 89:10915).

Além de calcular a identidade seqüencial percentual, o algoritmo BLAST também realiza uma análise estatística da similaridade entre as duas seqüências (consulte, por exemplo, Karlin and Altschul, Proc. Nat'l. Acad. ScL USA 90:5873-5787 (1993)). Uma medição de similaridade proporcionada pelo algoritmo BLAST é a probabilidade de menor soma (P(N))1 que proporciona uma indicação da probabilidade pela qual uma compatibilidade entre as duas seqüências nucleotídicas ou aminoacídicas ocorreriam ao acaso. Por exemplo, um ácido nucléico é considerado similar a uma seqüência de referência se a probabilidade menor soma em uma comparação do ácido nucléico de teste ao ácido nucléico de referência for menor que cerca de 0,1, com mais preferência, menor que cerca de 0,01, e, com a máxima preferência, menor que cerca de 0,001.

Mutaqênese e Outras Técnicas de Biologia Molecular Os polinucleotídeos e polipeptídeos da invenção e usados na invenção podem ser manipulados através do uso de técnicas biológicas moleculares. Os textos gerais que descrevem técnicas biológicas moleculares incluem Berger and Kimmel, "Guide to Molecular Cloning Techniques," Metods in Enzymology, volume 152, Academic Press, Inc., San Diego, CA, EUA; Sambrook et al., Molecular Cloning - A Laboratory Manual (3rd Ed.), Vol. 1-3, Cold Spring Harbor Laboratory, Cold Spring Harbor, Nova York, EUA, 2001 e Current Protocols in Molecular Biology, Ausubel et ah, eds., Current Protocols, um empreendimento conjunto entre Greene Publishing Associates, Inc. e John Wiley & Sons, Inc., (suplementado ao longo de 2006). Esses textos descrevem mutagênese, o uso de vetores, promotores e muitos outros tópicos relevantes relacionados, por exemplo, à geração de genes que incluem códons seletores para produção de proteínas que incluem aminoácidos não-naturais, tRNA ortogonais, sintetases ortogonais, e pares destes.

Vários tipos de mutagênese são usados na invenção, por exemplo, para modificar moléculas de tRNA, produzir bibliotecas de tRNAs, produzir bibliotecas de sintetases, inserir códons seletores que codificam aminoácidos não-naturais em uma proteína ou polipeptídeo de interesse. Eles incluem, mas não se limitam a, mutagênese sítio-direcionada, mutagênese em pontos aleatórios, recombinação homóloga, embaralhamento de DNA ou outros métodos recursivos de mutagênese, construção quimérica, mutagênese que utiliza modelos contendo uracila, mutagênese oligonucleotídeo-direcionada, mutagênese de DNA fosforotioato-modificada, mutagênese que utiliza DNA dúplex interrompido ou similares, ou qualquer combinação dos mesmos. Os métodos adequados adicionais incluem o reparo de incompatibilidade pontual, mutagênese que utiliza cepas hospedeiras deficientes para reparo, seleção por restrição e purificação por restrição, mutagênese por eliminação, mutagênese por síntese genética total, reparo de quebra de fitas duplas, e similares. Por exemplo, a mutagênese que envolve construções quiméricas também está inclusa na presente invenção. Em uma modalidade, a mutagênese pode ser guiada por informações conhecidas da molécula de ocorrência natural, molécula alterada ou molécula de ocorrência natural modificada, por exemplo, seqüências, comparações seqüenciais, propriedades físicas, estrutura cristalina ou similares.

As células hospedeiras são modificadas por engenharia genética (por exemplo, transformadas, transduzidas ou transfectadas) com os polinucleotídeos da invenção ou construções que incluem um polinucleotídeo da invenção, por exemplo, um vetor da invenção, que pode ser, por exemplo, um vetor de clonagem ou um vetor de expressão. Por exemplo, as regiões de codificação para o tRNA ortogonal, tRNA ortogonal sintetase e proteína a ser derivatizada são ligadas, de modo operacional, aos elementos de controle de expressão genética que são funcionais na célula hospedeira desejada. Os vetores típicos contêm terminadores de transcrição e translação, seqüências de iniciação de transcrição e translação, e promotores úteis da expressão do ácido nucléico alvo particular. Os vetores compreendem, opcionalmente, cassetes de expressão genética que contêm ao menos uma seqüência terminadora independente, seqüências que permitem a replicação do cassete em eucariontes, ou procariontes, ou ambos (por exemplo, vetores de transferência) e marcadores de seleção tanto para sistemas procarióticos como eucarióticos. Os vetores são adequados para replicação e/ou integração em procariontes, eucariontes, ou, de preferência, ambos. Consulte Giliman and Smith, Gene 8:81 (1979); Roberts, et al., Nature, 328:731 (1987); Schneider et al, Protein Expr. Purif. 6435: 10 (1995); Berger and Kimmel, "Guide to Molecular Cloning Techniques," Metods in Enzymology, volume 152, Academic Press, Inc., San Diego, CA, EUA; Sambrook et al, Molecular Cloning - A Laboratory Manual (3a Ed.), Vol. 1-3, Cold Spring Harbor Laboratory1 Cold Spring Harbor, Nova York, EUA, 2001; e Current Protocols in Molecular Biology, Ausubel et al, eds., Current Protocols, um empreendimento conjunto entre Greene Publishing Associates, Inc. e John Wiley & Sons, Inc., (suplementado ao longo de 2006). O vetor pode estar, por exemplo, sob a forma de um plasmídeo, uma bactéria, um vírus, um polinucleotídeo indefeso, ou um polinucleotídeo conjugado. Os vetores são introduzidos nas células e/ou microorganismos por métodos padrão que incluem eletroporação (From et al., Proc. Natl. Acad. ScL USA 82:5824 (1985), infecção por vetores virais, penetração balística de alta velocidade por pequenas partículas com o ácido nucléico dentro da matriz de pequenas contas ou partículas, ou sobre a superfície (Klein et al., (1987) Nature 327, 70-73), e/ou similares.

Desenvolveu-se um sistema plasmídico único altamente eficaz e versátil para incorporação sítio-específica de aminoácidos não-naturais em proteínas em resposta ao códon de parada âmbar (UAG) em E. coli. No novo sistema, o par de tRNAtyr(CUA) supressor de M. jannaschii e tirosil-tRNA sintetase é codificado em um único plasmídeo, que é compatível com a maioria dos vetores de expressão de E. coli. O operon monocistrônico de tRNA sob controle do promotor e terminador de proK foi construído para estrutura secundária otimizada e processamento de tRNA. A introdução de uma forma modificada do promotor glnS para a sintetase resultou em um aumento significativo tanto na eficiência de supressão como na fidelidade. Aumentos na eficiência de supressão também foram obtidos por múltiplas cópias de gene de tRNA bem como por uma mutação específica (D286R) na sintetase (Kobayashi et al. (2003), "Structural basis for tRNA orthogonal specificities of tyrosil-tRNA synthetases for genetic code expansion," Nat. Struct. Biol, 10(6):425-432). A generalidade do sistema otimizado também foi demonstrada por incorporação altamente eficaz e precisa de diversos aminoácidos não-naturais diferentes, cujas utilidades exclusivas no estudo de função e estrutura protéica foram previamente provadas.

Proporciona-se um catálogo de bactérias e bacteriófagos úteis para clonagem, por exemplo, pela ATCC, por exemplo, The ATCC Catalogue of Bactéria and Bacteriophage (1996) Gherna et al. (eds) publicado pela ATCC. Os procedimentos básicos adicionais para seqüenciamento, clonagem e outros aspectos de biologia molecular e sustentando considerações teóricas também são encontrados em Sambrook et al., Molecular Cloning - A Laboratory Manual (3rd Ed.), Vol. 1- 3, Cold Spring Harbor Laboratory, Cold Spring Harbor, Nova York, EUA, 2001; Current Protocols in Molecular Biology, Ausubel et al., eds., Current Protocols, um empreendimento conjunto entre Greene Publishing Associates, Inc. e John Wiley & Sons, Inc., (suplementado ao longo de 2006); e em Watson et al. (1992) Recombinant DNA Segunda Edição, Scientific American Books, NY, EUA. Além disso, essencialmente quaisquer ácidos nucléicos (e virtualmente qualquer ácido nucléico rotulado, seja padrão ou não) podem ser personalizados ou padrão encomendados a partir de uma variedade de fontes comerciais, como Midland Certified Reagent Company (Midland, TX1 EUA), The Great American Gene Company (Ramona, CA, EUA), ExpressGen Inc. (Chicago, IL1 EUA), Operon Technologies Inc. (Alameda, CA, EUA) e muitos outros.

As células hospedeiras modificadas por engenharia genética podem ser cultivadas em um meio de nutrientes convencional conforme adequado para essas atividades como, por exemplo, etapas de triagem, promotores de ativação ou transformadores de seleção. Essas células podem, opcionalmente, ser cultivadas em organismos transgênicos. Outras referências úteis, por exemplo, para um isolamento e cultura celular (por exemplo, para isolamento subseqüente de ácidos nucléicos) incluem Freshney (1994) Culture of Animal Cells, a Manual of Basic Technique, Terceira Edição, Wiley-Liss, Nova York, EUA, e as referências dele citadas; Payne et at. (1992) Plant Cell and Tissue Culture in Liquid Systems, John Wiley & Sons, Inc. Nova York, NY, EUA; Gamborg and Phillips (eds) (1995) Plant Cell1 Tissue and Organ Culture; Fundamental Metods, Springer Lab Manual, Springer- Verlag (Berlin Heidelberg Nova York, EUA) e Atlas and Parks (eds) The Handbook of Microbiological Media (1993) CRC Press, Boca Raton, FL, EUA.

PROTEÍNAS E POLIPEPTÍDEOS DE INTERESSE

Os métodos de produção de uma proteína em uma célula com um aminoácido não- natural em uma posição específica também consistem em uma característica da invenção. Por exemplo, um método inclui o desenvolvimento, em um meio adequado, da célula, onde a célula compreende um ácido nucléico que por sua vez compreende ao menos um códon seletor e codifica uma proteína; e, proporciona o aminoácido não-natural; onde a célula compreende, ainda: um tRNA ortogonal (O-tRNA) que funciona na célula e reconhece o códon seletor; e, uma aminoacil-tRNA sintetase ortogonal (O-RS) que aminoacila, de preferência, o O-tRNA com o aminoácido não-natural. Uma proteína produzida por este método também consiste em uma característica da invenção.

Em determinadas modalidades, a O-RS compreende um viés para a aminoacilação do O-tRNA cognato por qualquer tRNA endógeno em um sistema de expressão. A razão relativa entre o O-tRNA e o tRNA endógeno que é carregado pela O-RS, quando o O-tRNA e a O-RS estiverem presentes em concentrações molares iguais, é maior que 1:1, de preferência, ao menos cerca de 2:1, com mais preferência, 5:1, ainda com mais preferência, 10:1, ainda com mais preferência, 20:1, ainda com mais preferência, 50:1, ainda com mais preferência, 75:1, ainda com mais preferência, 95:1, 98:1, 99:1, 100:1, 500:1, 1.000:1, 5,000:1 ou maior.

A invenção proporciona, também, composições que incluem proteínas, onde as proteínas compreendem um aminoácido não-natural. Em determinadas modalidades, a proteína compreende uma seqüência aminoacídica que seja ao menos 75% idêntica a seqüência de uma proteína terapêutica, uma proteína diagnostica, uma enzima industrial ou uma porção destas.

As composições da invenção e as composições feitas pelos métodos da invenção se encontram, opcionalmente, em uma célula. Os pares de O-tRNA/O-RS ou componentes individuais podem, então, ser usados em um mecanismo de translação do sistema hospedeiro, o que resulta em um aminoácido não-natural sendo incorporado em uma proteína. As Publicações Internacionais Números WO 2004/094593, depositada em 16 de abril de 2004, intitulada "EXPANDING THE EUKARYOTIC GENETIC CODE," e WO 2002/085923, intitulada "IN VIVO INCORPORATION OF UNNATURAL AMINO ACIDS," descrevem este processo, e estão aqui incorporadas a título de referência. Por exemplo, quando um par de O-tRNA/O-RS é introduzido em um hospedeiro, por exemplo, uma célula Escherichia coli, os pares levam à incorporação in vivo de um aminoácido não-natural, como 7-hidroxicumarina-etilglicina em uma proteína em resposta a um códon seletor. O aminoácido não-natural que é adicionada ao sistema pode ser um aminoácido sintético, como o derivado de uma fenilalanina ou tirosina, que pode ser exogenicamente adicionado ao meio em desenvolvimento. Opcionalmente, as composições da presente invenção podem estar em um sistema de translação in vitro, ou em um sistema in vivo.

Uma célula da invenção proporciona a capacidade de sintetizar proteínas que compreendem aminoácidos não-naturais em grandes quantidades úteis. Em alguns aspectos, a composição inclui, opcionalmente, por exemplo, ao menos 10 microgramas, ao menos 50 microgramas, ao menos 75 microgramas, ao menos 100 microgramas, ao menos 200 microgramas, ao menos 250 microgramas, ao menos 500 microgramas, ao menos 1 miligrama, ao menos 10 miligramas ou mais da proteína que compreende um aminoácido não-natural, ou uma quantidade que possa ser obtida por métodos de produção de proteína in vivo (detalhes sobre a produção e purificação de proteínas recombinantes são proporcionados no presente documento). Em outro aspecto, a proteína está, opcionalmente, presente na composição em uma concentração, por exemplo, de ao menos 10 microgramas de proteína por litro, ao menos 50 microgramas de proteína por litro, ao menos 75 microgramas de proteína por litro, ao menos 100 microgramas de proteína por litro, ao menos 200 microgramas de proteína por litro, ao menos 250 microgramas de proteína por litro, ao menos 500 microgramas de proteína por litro, ao menos 1 miligrama de proteína por litro, ou ao menos 10 miligramas de proteína por litro ou mais, em, por exemplo, um Iisato celular, um tampão, um tampão farmacêutico, ou outra suspensão de liquido (por exemplo, em um volume, por exemplo, qualquer de cerca de 1 nL a cerca de 100 L). A produção de grandes quantidades (por exemplo, maiores que as tipicamente possíveis por outros métodos, por exemplo, translação in vitro) de uma proteína e, uma célula que incluem ao menos um aminoácido não-natural consiste em uma característica da invenção.

A incorporação de um aminoácido não-natural pode ser realizada, por exemplo, por alterações de adaptação na estrutura e/ou função protéica, por exemplo, para alterar o tamanho, acidez, nucleofilicidade, ligação de hidrogênio, hidrofobicidade, acessibilidade de sítios alvo de protease, alvo a uma porção (por exemplo, para uma matriz de proteínas), incorporação de rótulos ou grupos reativos, etc. As proteínas que incluem um aminoácido não-natural podem ter propriedades catalíticas ou físicas aprimoradas ou até mesmo totalmente novas. Por exemplo, as propriedades a seguir são opcionalmente modificadas por inclusão de um aminoácido não-natural em uma proteína: toxicidade, biodistribuição, propriedades estruturais, propriedades espectroscópicas, propriedades químicas e/ou fotoquímicas, capacidade catalítica, meia-vida (por exemplo, meia-vida de soro), capacidade para reagir com outras moléculas, por exemplo, covalente ou não-covalentemente, e similares. As composições que incluem proteínas que por sua vez incluem ao menos um aminoácido não-natural são úteis, por exemplo, para terapêutica inusitada, diagnósticos, enzimas catalíticas, enzimas industriais, proteínas de ligação (por exemplo, anticorpos), e, por exemplo, o estudo de estrutura e função protéica. Consulte, por exemplo, Dougherty, (2000) Unnatural Amino acids as Probes of Protein Structure and Function, Current Opinion in Chemical Biology, 4:645-652.

Em alguns aspectos da invenção, uma composição inclui ao menos uma proteína com ao menos um, por exemplo, ao menos dois, ao menos três, ao menos quatro, ao menos cinco, ao menos seis, ao menos sete, ao menos oito, ao menos nove, ou ao menos dez ou mais aminoácidos não-naturais. Os aminoácidos não-naturais podem ser iguais ou diferentes, por exemplo, podem existir 1, 2, 3, 4, 5, 6, 7, 8, 9, ou 10 ou mais sítios diferentes na proteína que compreendam 1, 2, 3, 4, 5, 6, 7, 8, 9, ou 10 ou mais aminoácidos não- naturais diferentes. Em outro aspecto, uma composição inclui uma proteína com ao menos um, porém menor que todos, aminoácido particular presente na proteína consiste em um aminoácido não-natural. Para uma determinada proteína com mais de um aminoácido não- natural, os aminoácidos não-naturais podem ser idênticos ou diferentes (por exemplo, a proteína pode incluir dois ou mais tipos diferentes de aminoácidos não-naturais, ou podem incluir dois do mesmo aminoácido não-natural). Para uma determinada proteína com mais de dois aminoácidos não-naturais, os aminoácidos não-naturais podem ser iguais, diferentes ou uma combinação de um aminoácido não-natural múltiplo do mesmo tipo com ao menos um aminoácido não-natural diferente.

Essencialmente, qualquer proteína (ou porção da mesma) que inclua um aminoácido não-natural (e qualquer ácido nucléico de codificação correspondente, por exemplo, que inclua um ou mais códons seletores) pode ser produzida através do uso de composições e métodos do presente documento. Não se realizou nenhuma tentativa para identificar as centenas de milhares de proteínas conhecidas, qualquer uma dessas pode ser modificada de modo a incluir um ou mais aminoácidos não-naturais, por exemplo, alterando- se quaisquer métodos de mutação disponíveis de modo a incluírem um ou mais códons seletores adequados em um sistema de translação relevante. Os repositórios de seqüencias comuns para proteínas conhecidas incluem GenBank EMBL, DDBJ e o NCBI. Outros repositórios podem ser facilmente identificados pesquisando-se na Internet.

Tipicamente, as proteínas são, por exemplo, ao menos 60%, ao menos 70%, ao menos 75%, ao menos 80%, ao menos 90%, ao menos 95%, or ao menos 99% ou mais idênticas a qualquer proteína disponível (por exemplo, uma proteína terapêutica, uma proteína diagnostica, uma enzima industrial, ou porções destas, e similares), e elas compreendem um ou mais aminoácidos não-naturais. Exemplos de proteínas terapêuticas, diagnosticas e outras que podem ser modificadas de modo a compreender um ou mais aminoácidos não-naturais podem ser encontrados, mas não se limitam a, nas Publicações Internacionais WO 2004/094593, depositada em 16 de abril de 2004, intitulada "EXPANDING THE EUKARYOTIC GENETIC CODE;" e WO 2002/085923, intitulada "IN VIVO INCORPORATION OF UNNATURAL AMINO ACIDS." Exemplos de proteínas terapêuticas, diagnosticas e outras que podem ser modificadas de modo a compreender um ou mais aminoácidos não-naturais incluem, mas não se limitam a, por exemplo, alfa-1 antitripsina, Angiostatina, fator Antiemolítico, anticorpos (outros detalhes de anticorpos são encontrados mais adiante), Apolipoproteína, Apoproteína, fator natriurético atrial, polipeptídeo natriurético atrial, peptídeos atriais, quemoquinas C-X-C (por exemplo, T39765, NAP-2, ENA-78, Gro-a, Gro-b, Gro-c, IP-10, GCP-2, NAP-4, SDF-I, PF4, MIG), Calcitonina, quemoquinas CC (por exemplo, proteína quimiotáxica de monócito 1, proteína quimiotáxica de monócito 2, proteína quimiotáxica de monócito 3, proteína inflamatória monócito alfa 1, proteína inflamatória monócito beta 1, RANTES1 1309, R83915, R91733, HCCI, T58847, D31065, T64262), Iigante CD40, Iigante kit-C, colágeno, fator estimulante de colônia (CSF), fator complementar 5a, inibidor complementar, receptor complementar 1, citoquinas, (por exemplo, peptídeo de ativação neutrófilo epitelial 78, GROa/MGSA, GRO0, GROy, MIP-1 a, MIP- 1 δ, MCP-I), fator de crescimento epidérmico (EGF), Eritropoietina ("EPO"), toxinas esfoliantes A e B, fator IX, fator VII, fator VHI, fator X, fator de crescimento de fibroblasto (FGF), Fibrinogênio, Fibronectina, G-CSF, GM-CSF, Glucocerebrosidase, Gonadotropina, fatores de crescimento, proteínas Hedgehog (por exemplo, Sônicas, Indianas, Desérticas), Hemoglobina, fator de crescimento hepatócito (HGF), Hirudina, Albumina Sérica Humana, Insulina, fator de crescimento tipo Insulina (IGF), interferonas (por exemplo, IFN-α, EFN-β, IFN-y), interleucinas (por exemplo, TL-I, TL-2, IL-3, IL-4, IL-5, TL-6, TL-I, IL-8, IL-9, IL-IO, IL- II, IL-12, etc.), fator de crescimento de queratinocita (KGF)1 Lactoferrina, fator inibitório de leucemia, Luciferase, Neurturina1 fator inibitório de neutrófilo (NIF), oncostatina M, proteína osteogênica, hormônio de paratireóide, PD-ECSF, PDGF, hormônios peptídicos (por exemplo, hormônio de crescimento humano), Pleiotropina1 Proteína A1 Proteína G1 exotoxinas pirogênicas, A1 B1 e C1 Relaxina1 Renina, SCF, receptor complementar solúvel I, solúvel I- CAM 1, receptores de interleucina solúveis (IL-I, 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 14, 15), receptor TNF solúvel, Somatomedina1 Somatostatina1 Somatotropina1 Estreptoquinase1 Superantigenos1 isto é, enterotoxinas estafilocócicas (SEA1 SEB1 SECI1 SEC2, SEC3, SED, SEE), superóxido dismutase (SOD), toxina da síndrome do choque tóxico (TSST-I), Timosina alfa 1, ativador de plasminogênio tecidual, fator de necrose tumoral (TNF beta), receptor de fator de necrose tumoral (TNFR), fator-alfa de necrose tumoral (TNF alfa), fator de crescimento endotelial vascular (VEGEF), Uroquinase e muitos outros.

Uma classe de proteínas, que pode ser constituída através do uso de composições e métodos para incorporação in vivo de aminoácidos não-naturais aqui descritos, inclui moduladores transcricionais ou uma porção destes. Exemplos de moduladores transcricionais incluem proteínas moduladoras de genes e transcricionais que modulam o crescimento, diferenciação, regulação celular ou algo do gênero. Os moduladores transcricionais são encontrados em procariontes, vírus e eucariontes, inclusive fungos, vegetais, leveduras, insetos e animais, incluindo mamíferos, proporcionando uma ampla gama de alvos terapêuticos. Avaliar-se-á que os ativadores de expressão e transcricionais regulam a transcrição através de muitos mecanismos, por exemplo, ligando-se a receptores, estimulando-se uma cascata de transdução de sinal, regulando-se a expressão de fatores de transcrição, ligando-se a promotores e acentuadores, ligando-se a proteínas que se ligam aos promotores e acentuadores, desenrolando-se o DNA, retirada de íntros do pré-mRNA, poliadenilando-se o RNA e degradando-se o RNA.

Uma classe de proteínas da invenção (por exemplo, com um ou mais aminoácidos não-naturais) inclui proteínas biologicamente ativas, como citocinas, moléculas inflamatórias, fatores de crescimento, seus receptores e produtos oncogênicos, por exemplo, interleucinas (por exemplo, JL-I, TL-2, TL-8, etc.), interferons, FGF, IGF-I, IGF-II, FGF, PDGF, TNF, TGF-σ, TGF-0, EGF, KGF, SCF/c-Kit, CD40L/CD40, VLA-4/VCAM-1, ICAM-l/LFA-1 e hialurina/CD44; moléculas de transdução de sinal e produtos oncogênicos correspondentes, por exemplo, Mos1 Ras, Raf e Met; e ativadores e supressores transcricionais, por exemplo, p53, Tat1 Fos, Myc1 Jun, Myb, Rei, e receptores de hormônio esteróide, como os de estrogênio, progesterona, testosterona, aldosterona e Iigante receptor de LDL e corticosterona.

As enzimas (por exemplo, enzimas industriais) ou porções destas com ao menos um aminoácido não-natural também são proporcionadas pela invenção. Exemplos de enzimas incluem, mas não se limitam a, por exemplo, amidases, racemases de aminoácido, acilases, dehalogenases, dioxigenases, diarilpropano peroxidases, epimerases, epóxido hidrolases, esterases, isomerases, quinases, glucose isomerases, glicosidases, glicosil transferases, haloperoxidases, monooxigenases (por exemplo, p450s), lipases, Iignina peroxidases, nitriia hidratases, nitrilases, proteases, fosfatases, subtilisinas, transaminase e nucleases.

Muitas dessas proteínas são comercialmente disponíveis (consulte, por exemplo, o catálogo Sigma BioSciences 2002 e lista de preços), e as seqüências protéicas e genes correspondentes e, tipicamente, muitas variantes destas, são bem conhecidas (consulte, por exemplo, Genbank). Qualquer uma dessas pode ser modificada pela inserção de um ou mais aminoácidos não-naturais de acordo com a invenção, por exemplo, com a finalidade de alterar a proteína em relação a um ou mais propriedades terapêutica, diagnosticas ou enzimáticas de interesse. Exemplos de propriedades terapeuticamente relevantes incluem meia vida de soro, estabilidade, imunogenicidade, atividade terapêutica, detectabilidade (por exemplo, pela inclusão de grupos repórteres (por exemplo, rótulos ou sítios de ligação de rótulo) nos aminoácidos não-naturais), redução de LD50 ou outros efeitos colaterais, capacidade em entrar no corpo através do trato gástrico (por exemplo, disponibilidade oral), ou similares. Exemplos de propriedades diagnosticas incluem vida útil, estabilidade, atividade diagnostica, detectabilidade, ou similares. Exemplos de propriedades enzimáticas incluem vida útil, estabilidade, atividade enzimática, capacidade de produção ou similares.

Uma variedade de outras proteínas também pode ser modificada de modo a incluir um ou mais aminoácidos não-naturais através do uso de composições e métodos da invenção. Por exemplo, a invenção pode incluir a substituição de um ou mais aminoácidos naturais em uma ou mais proteínas de vacina por um aminoácido não-natural, por exemplo, nas proteínas a partir de fungos infecciosos, por exemplo, Aspergillus, espécie Candida; bactérias, particularmente E. coli, que satisfaz um modelo para bactérias patogênicas, bem como bactérias medicamente importantes, como Staphilococci (por exemplo, aureus), ou Streptococci (por exemplo, pneumoniae); protozoários, como esporozoários (por exemplo, Plasmodia), rizópodes (por exemplo, Entamoeba) e flagelados (Trypanosoma, Leishmania, Trichomonas, Giardia, etc.); vírus, vírus de RNA ( + ) (exemplos incluem Poxvírus, por exemplo, varíola; Picornavírus, por exemplo pólio; Togavírus, por exemplo, rubéola; Flavivírus, por exemplo, HCV; e Coronavírus), vírus de RNA (-) (por exemplo, Rabdovírus, por exemplo, VSV; Paramixovírus, por exemplo, RSV; Ortomixovírus, por exemplo, influenza; Buniavírus; e Arenavírus), vírus de dsDNA (Reovírus, por exemplo), vírus de RNA para DNA, isto é, Retrovírus, por exemplo, HTV e HTLV, e certos vírus de DNA para RNA, como Hepatite B.

As proteínas agriculturalmente relacionadas, como proteínas resistentes a insetos (por exemplo, as proteínas Cry), enzimas de produção de amido e lipídeo, toxinas vegetais e inseto-toxinas, proteínas resistentes a toxinas, proteínas de desintoxicação de Micotoxina, enzimas de crescimento vegetal (por exemplo, Ribulose 1,5-Bisfosfato Carboxilase/Oxigenase, "RUBISCO"), Iipoxigenase (LOX) e fosfoenolpiruvato (PEP) carboxilase também consistem em alvos adequados para modificação de aminoácidos não- naturais.

Em determinadas modalidades, a proteína ou polipeptídeo de interesse (ou porção dos mesmos) nos métodos e/ou composições da invenção são codificados por um ácido nucléico. Tipicamente, o ácido nucléico compreende ao menos um códon seletor, ao menos dois códons seletores, ao menos três códons seletores, ao menos quatro códons seletores, ao menos cinco códons seletores, ao menos seis códons seletores, ao menos sete códons seletores, ao menos oito códons seletores, ao menos nove códons seletores, dez ou mais códons seletores.

Os genes par codificação de proteínas ou polipeptídeos de interesse podem ser mutagenizados utilizando-se métodos bem conhecidos na técnica e aqui descritos sob "Mutagenesis and Other Molecular Biology Techniques" de modo a incluir, por exemplo, um ou mais códons seletores para a incorporação de um aminoácido não-natural. Por exemplo, um ácido nucléico para uma proteína de interesse é mutagenizado de modo a incluir um ou mais códons seletores, permitindo a inserção dos um ou mais aminoácidos não-naturais. A invenção inclui qualquer variante, por exemplo, mutante, versões de qualquer proteína, por exemplo, incluindo ao menos um aminoácido não-natural. De maneira semelhante, a invenção inclui, também, ácidos nucléicos correspondentes, isto é, qualquer ácido nucléico com um ou mais códons seletores que codifiquem um ou mais aminoácido não-natural.

Para constituir uma proteína que inclua um aminoácido não-natural, um indivíduo pode usar células hospedeiras e organismos que sejam adaptados para a incorporação in vivo do aminoácido não-natural através de partes de tRNA ortogonal/RS. As células hospedeiras são modificadas por engenharia genética (por exemplo, transformadas, transduzidas ou transfectadas) com um ou mais vetores que expressem o tRNA ortogonal, a tRNA ortogonal sintetase, e um vetor que codifique a proteína a ser derivatizada. Cada um desses componentes pode estar no mesmo vetor, ou cada um pode estar em um vetor separado, ou dois componentes podem estar em um vetor e o terceiro componente em um segundo vetor. O vetor pode estar, por exemplo, sob a forma de um plasmídeo, uma bateria, um vírus, um polinucleotídeo indefeso, ou um polinucleotídeo conjugado.

Definição de Polipeptídeos por Imunorreatividade

Devido ao fato de os polipeptídeos da invenção proporcionarem uma variedade de novas seqüências polipeptídicas (por exemplo, polipeptídeos que compreendem aminoácidos não-naturais no caso de proteínas sintetizadas nos sistemas de translação da presente invenção, ou, por exemplo, no caso de sintetases inusitadas, seqüências inusitadas de aminoácidos padrão), os polipeptídeos proporcionam, também, novas características estruturais que podem ser reconhecidas, por exemplo, em ensaios imunológicos. A geração de anti-soros, que liga, de forma específica, os polipeptídeos da invenção, bem como os polipeptídeos que são ligados por esses anti-soros, consistem em uma característica da invenção. O termo "anticorpo," conforme o uso em questão, inclui, mas não se limita a, um polipeptídeo substancialmente codificado por um genes de imunoglobulina ou genes de imunoglobulina, ou fragmentos dos mesmos que ligam e reconhecem, de maneira específica, um analito (antígeno). Exemplos incluem anticorpos policlonais, monoclonais, quiméricos e de cadeia única, e similares. Os fragmentos de imunoglobulinas, que incluem fragmentos Fab e fragmentos produzidos por uma biblioteca de expressão, que inclui exibição de fago, também se encontram inclusos no termo "anticorpo" conforme o uso em questão. Consulte, por exemplo, Paul, Fundamental Immunology, 4a Ed., 1999, Raven Press, Nova York, EUA, para estrutura e terminologia de anticorpos.

Com a finalidade de produzir anti-soro para uso em um imunoensaio, um ou mais polipeptídeos imunogênicos são produzidos e purificados conforme descrito no presente documento. Por exemplo, a proteína recombinante pode ser produzida em uma icélula recombinante. Uma cepa natural de camundongos (usada neste ensaio porque os resultados são mais reproduzíveis devido à identidade genética virtual do camundongo) é imunizada com a(proteína(s) imunogênica(s) em combinação com um adjuvante padrão, como adjuvante de Freund, e um protocolo de imunização de ratos padrão (consulte, por exemplo, Harlow and Lane (1988) Antibodies, A Laboratory Manual, Cold Spring Harbor Publications, Nova York, EUA, para uma descrição padrão de geração de anticorpos, formatos de imunoensaio e condições que podem ser usadas para determinar imunorreatividade específica. Detalhes adicionais sobre proteínas, anticorpos, anti-soros, etc. podem ser encontrados nas Publicações Internacionais Números WO 2004/094593, intitulada "EXPANDING THE EUKARYOTIC GENETIC CODE;" WO 2002/085923, intitulada "IN VIVO INCORPORATION OF UNNNATURAL AMINO ACIDS;" WO 2004/035605, intitulada "GLYCOPROTEIN SYNTHESIS;" e WO 2004/058946, intitulada "PROTEIN ARRA YS."

USO DE O-tRNA E O-RS E PARES DE O-tRNA/O-RS

As composições da invenção e as composições constituídas pelos métodos da invenção encontram-se, opcionalmente, em uma célula. Os pares de O-tRNA/O-RS ou componentes individuais da invenção podem, então, ser usados em um mecanismo de translação do sistema hospedeiro, o que resulta em um aminoácido não-natural que é incorporado em uma proteína. A Publicação Internacional Número WO 2002/085923 por Schultz, et at, intitulada "IN VIVO INCORPORATION OF UNNATURAL AMINO ACIDS," descreve este processo e se encontra aqui incorporada a título de referência. Por exemplo, quando um par de O-tRNA/O-RS for introduzido em um hospedeiro, por exemplo, Escherichia coli ou levedura, o par conduz à incorporação in vivo de um aminoácido não- natural, que pode ser adicionado, de maneira exógena, ao meio de crescimento, em uma proteína, por exemplo, uma proteína de teste de mioglobina ou uma proteína terapêutica, em resposta a um códon seletor, por exemplo, um códon sem sentido âmbar. Opcionalmente, as composições da invenção podem estar em um sistema de translação in vitro, ou em um sistema celular in vivo. As proteínas com o aminoácido não-natural podem ser usadas em uma ampla gama de aplicações. Por exemplo, a porção não-natural incorporada em uma proteína pode servir como um alvo para uma ampla gama de modificações, por exemplo, reticulação com outras proteínas, com pequenas moléculas, como rótulos ou corantes e/ou biomoléculas. Com essas modificações, a incorporação do aminoácido não-natural pode resultar em proteínas terapêuticas aperfeiçoadas e podem ser usadas para alterar ou aperfeiçoar a função catalítica das enzimas. Em alguns aspectos, a incorporação e subseqüente modificação de um aminoácido não-natural em uma proteína pode facilitar os estudos sobre a estrutura protéica, interações com outras proteínas, e algo do gênero.

KITS

Os kits também consistem em uma característica da invenção. Por exemplo, proporciona-se um kit para produzir uma proteína que compreende ao menos um aminoácido não-natural em uma célula, onde o kit inclui ao menos um recipiente contendo uma seqüência polinucleotídica que codifica um O-tRNA, e/ou um O-tRNA, e/ou uma seqüência polinucleotídica que codifica uma O-RS, e/ou uma O-RS. Em uma modalidade, o kit inclui, ainda, o aminoácido não-natural 7-hidroxicumarina-etilglicina. Em outra modalidade, o kit compreende, ainda, materiais instrucionais para produção de proteína e/ou uma célula hospedeira.

EXEMPLOS Os exemplos a seguir são propostos para ilustrar, mas não para limitar a invenção reivindicada. Os versados na técnica reconhecerão uma variedade de parâmetros não- críticos que podem ser alterados sem divergir do escopo da invenção reivindicada. Compreende-se que os exemplos e modalidades aqui descritas servem apenas para propósitos ilustrativos e que várias modificações ou alterações considerando-se estes propósitos serão sugeridas aos versados na técnica e devem estar inclusos no espírito e escopo do presente pedido e escopo das reivindicações em anexo.

EXEMPLO 1

Metodologias Gerais

Todos os elementos químicos foram obtidos a partir de fontes comerciais e usados sem purificação adicional. Os espectros de 1H NMR foram gravados em um espectrômetro multinuclear Bruker AMX-400 (Bruker BioSpin GmbH, Rheinstetten/Karlsruhe, Alemanha) com trocas químicas informadas em relação ao tetrametilsilano. Os espectros de massa de proteínas foram adquiridos junto ao Scripps Center for Mass Spectrometry (La Jolla, CA, EUA).

PLASMÍDEOS E LINHAS CELULARES

O plasmídeo pBK-lib5 codifica uma biblioteca de mutantes de tirosil tRNA sintetase de M. jannaschii (M/TyrRS) em que os resíduos Tyr32, Leu65, Phel08, Glnl09, Aspl58 e Leu 162 são randomizados; além disso, o His70 sofreu mutação em Gly, e o Ala67 sofreu mutação em Ala ou Gly. O plasmídeo pREP(2)/YC codifica o MytRNAcuATyr, o gene de cloranfenicol acetiltransferase (CAT) com um códon de TAG no resíduo 112, o gene de GFP sob controle do promotor T7, ama polimerase T7 RNA mutante com um códon de TAG em resíduos 1 e 107, e um marcador Tetr. O plasmídeo pLWJ17B3 codifica o MytRNACuATyr sob o controle do promotor Ipp e do terminador rrnC, o gene de barnase (com três códons âmbar nos resíduos 2, 44 e 65) sob controle do promotor ara, e de um marcador Ampr. O plasmídeo pBAD/JYAMB-4TAG-Myo codifica o gene mutante de mioglobina de esperma de baleia com um promotor arabinose e um terminador rrnB, o MjtRNATyrCUA com um promotor Ipp e o terminador rrnC, e um marcador de resistência de tetraciclina. A cepa E. coli GeneHog®-Fis, F" mcrk A(mrr-hsdRMS-mcrBC) 80LacZΔM15 ΔlacX74 recA1 e/7dA1 araD139 A(ara-leu)7697 gaIU galK ArpsL(StrR) nupG, fis::Tn7 (DHFR) foi utilizada para estudos que expressaram proteínas contendo o aminoácido não-natural L-(7-hidroxicumarin- 4-il) etilglicina.

EXEMPLO 2

Síntese do Aminoácido Não-Natural L-(7-Hidroxicumarin-4-il) Etilglicina

O aminoácido não-natural de cumarina L-(7-hidroxicumarin-4-il) etilglicina (também escrito como 7-hidroxicumarina-etilglicina; consulte a FIGURA 1, estrutura 1) foi sintetizado convertendo-se, primeiramente, o ácido Ν-α-Cbz-L-glutâmico α-benzil éster em β-ceto éster de cadeia lateral, que foi, então, reagido com resorcinol em ácido metanossulfônico (reação de von Pechmann; Brun et al., Angew. Chem., Int. Ed., (2004) 43:3432-3436) para produzir o aminoácido L-(7-hidroxicumarin-4-il) etilglicina. Essas etapas são descritas em detalhes mais adiante.

ETAPA 1 - Síntese de Malonato de Etil Maqnésio

Adicionou-se a uma solução aquosa agitada de 1,5 M de cloreto de magnésio e 3 M de malonato de etil potássio cinco volumes de isopropanol. Após filtração, o malonato de etil magnésio foi seco a vácuo.

ETAPA 2 - Síntese do ácido (2S)-2-benziloxicarbonilamino-5-oxo-heptanodióico 1- benzil éster 7-etil éster (FIGURA 1. estrutura 3)

Dissolveu-se Z-Glu-Obzl (um Ν-α-Cbz-L-ácido glutâmico σ-benzil éster) (5g, 13,46 mmol) em 50 ml de THF seco à temperatura ambiente. Adicionou-se lentamente N,N'- carbonil diimidazola (1,1 eq) e a mistura foi, então, agitada durante 2 horas à temperatura ambiente. Adicionou-se malonato de etil magnésio (0,55 eq), e a mistura foi agitada à temperatura ambiente de um dia para o outro. O produto foi extraído com éter, e lavado com NaHCO3 a 10%, água e salmoura. O resíduo contendo 3 foi purificado por cromatografia instantânea em sílica gel (acetato de etila: hexanos 50:50) e concentrado em um evaporador giratório de modo a produzir um sólido branco em rendimento de 40%. 1H-NMR (400 MHz1 CDCI3): δ 1,26 (t, J = 7,2, 3H), 1,9 a 2,01 (m, 1H), 2,1 a 2,28 (m, 1H), 2,5 a 2,7 (m, 2H), 3,37 (s, 2H), 4,18 (q, J = 7,2, 2H), 4,41 (s, 1H), 5,11 (s, 2H), 5,18 (s, 2H), 5,44 (d, J = 8, 1H), 7,25 a 7,41 (m, 10H), LC-MS (ESI) calculado para C24H2NO7 (M+ H+) 442,18, observado 442,0.

ETAPA 3 - Síntese de L-(7-hidroxicoumarin-4-il) etilglicina (FIGURA 1. estrutura 1) Adicionou-se lentamente o ácido (2S)-2 Benziloxicarbonilamino-5-oxo- heptanodióico 1-benzil éster 7-etil éster da etapa anterior (2,35g, 5 mmol) a resorcinol (3g, 25 mmol) em ácido metanossulfônico (20 ml) e agitado durante duas horas à temperatura ambiente. Adicionaram-se, então, cinco volumes de éter à mistura e foi resfriada até -30°C. O precipitado foi lavado com éter frio, dissolvido em água, filtrado e liofilizado. Purificou-se a L-(7-hidroxicumarin-4-il) etilglicina por HPLC de fase reversa de modo a produzir um sólido marrom em rendimento de 50% (coluna YMC AA12S052503WT, taxa de vazão 12 ml/min, de 10% a 90% de CH3CN, 0,1% de TFA (p/v) em água, durante o curso de 12 min). 1H-NMR (DMSO): δ 2,06 (s, 2H), 2,70 a 2,90 (m, 2H), 3,82 a 4,0 (m, 1H), 6,06 (s, 1H), 6,75 (dd, J= 8,8, 2,4, 1H), 6,82 (d, J = 2,4, 1H), 7,62 (d, J = 8,8, 1H), 8,17 (s, 3H), LC-MS (ESI) calculado para Ci3H14NO5 (M+ H+) 264,08 Da, observado 264,0 Da.

EXEMPLO 3

Seleção Genética de Sintetase Mutante Específica para 7-Hidroxicumarina- Etilglicina Para incorporar seletivamente a 7-hidroxicumarina-etilglicina em sítios definidos em proteínas em E. coli, desenvolveu-se um par de tirosil tRNA supressor âmbar de Methanococcus jannaschii mutante (MytRNATyrCuA) / tirosil-tRNA sintetase (MyTyrRS) que especifica exclusivamente a 7-hidroxicumarina-etilglicina em resposta ao códon seletor de TAG.

CONSTRUÇÃO DA BIBLIOTECA

Com a finalidade de acomodar uma grande cadeia lateral de cumarina do aminoácido não-natural 7-hidroxicumarina-etilglicina, gerou-se uma biblioteca /WyTyrRS pBK- lib5, onde a tirosil-tRNA sintetase de Methanococcus jannaschii do tipo selvagem (FIGURA 9; SEQ ID NOs: 2 e 3) His70 passou por mutação para Gly1 e Ala67 foi fixada em Ala ou Gly de modo a aumentar o tamanho do sítio ativo. Randomizaram-se seis resíduos, Tyr-32, Leu- 65, Phe-108, Gln-109, Asp-158 e Leu-162, em posição próxima para ligar a tirosina (Kobayashi et al, Nat. Struct. Biol., (2003) 10:425-432; Zhang et al, Protein ScL, (2005) 14:1340-1349). A biblioteca pBK-lib5 consistiu em 2x109 TyrRS clones independentes e foi construída utilizando-se métodos padrão de PCR.

SELEÇÕES POSITIVAS/NEGATIVAS

Subseqüentemente, esta biblioteca foi submetida a seleções tanto positivas como negativas. Na seleção positiva, a sobrevivência da célula depende da supressão de um códon âmbar introduzido em um sítio permissivo no gene de cloranfenicol acetil transferase (CAT) quando as células co-transformadas com pBK-lib e MytRNATyrCuA forem cultivadas na presença de um 1 mM de aminoácido não-natural (UAA) e cloranfenicol (Xie and Schultz, Metods (2005) 36:227-238). Os clones positivamente selecionados são, então, transformados em células contendo MytRNATyrCuA e um gene que codifica a proteína de barnase tóxica com três mutações âmbar introduzidas em sítios permissivos. Essas células são cultivadas na ausência de UAA para remover quaisquer clones que utilizem aminoácidos endógenos (seleção negativa). Essas seleções positivas e negativas são descritas em maiores detalhes abaixo.

Seleção Positiva - Utilizou-se a DHIOB E. coli que hospeda o plasmídeo pREP(2)/YC como a cepa hospedeira para a seleção positiva. As células foram transformadas com a biblioteca pBK-lib5, recuperadas em SOC durante 1 hora, lavadas duas vezes com meio mínimo de glicerol com Ieucina (GMML) antes de ser colocada sobre placas de GMML-ágar suplementadas com canamicina, cloranfenicol, tetraciclina e 7- hidroxicumarina-etilglicina em 50//g/mL, 60 ywg/mL, 15/yg/mL e 1 mM respectivamente. As placas foram incubadas a 37°C durante 60 horas e as células sobreviventes foram removidos e o DNA de plasmídeo foi extraído e purificado por electroforese gel.

Seleção Negativa - O DNA pBK-lib5 foi, então, transformado em células eletro- competente que hospedam o plasmídeo pLWJ17B3 de seleção negativa, recuperado durante 1 hora em SOC e, então, colocado sobre placas de LB-ágar contendo arabinose a 0,2%, 50 μg/mL de ampicillina e 50 μg/mL de canamicina. As placas foram, então, incubadas a 37°C durante 8 a 12 horas, e o DNA pBK-lib5 dos clones sobreviventes foram extraídos conforme descrito anteriormente.

A biblioteca foi, então, conduzida através de uma rodada subseqüente de seleção positiva, seguida por uma seleção negativa e uma rodada final de seleção positiva (com cloranfenicol em 70 μg/mL). Neste estágio, 96 clones individuais foram selecionados e suspensos em 50 μL de GMML em uma placa com 96 poços, e identificados por réplicas em dois conjuntos de placas GMML. Um conjunto de placas de GMML-ágar foi suplementado com tetraciclina (15 μg/mL), canamicina (50 μg/mL) e cloranfenicol em concentrações de 60, 80, 100 e 120 μg/mL com 1 mM de 7-hidroxicumarina-etilglicina. O outro conjunto de placas foi idêntico, mas, não continha 7-hidroxicumarina-etilglicina, e as concentrações de cloranfenicol usadas foram de 0, 20, 40 e 60 μg/mL. Após 60 horas de incubação a 37°C, descobriu-se que um clone sobreviveu em 100 μg/mL de cloranfenicol na presença de 1 mM de 7-hidroxicumarina-etilglicina, mas apenas em 20 μg/mL de cloranfenicol na ausência de 7-hidroxicumarina-etilglicina. Portanto, após as três rodadas de seleção positiva e duas rodadas de seleção negativa, esta biblioteca gerou um único clone que se desenvolve em 100 μg/mL de cloranfenicol na presença de 7-hidroxicumarina-etilglicina, mas apenas em 20 μg/mL de cloranfenicol na ausência de 7-hidroxicumarina-etilglicina.

Este clone, denominado CouRS-D8, foi seqüenciado e descobriu-se que ele contém as seguintes oito mutações: Tyr32Glu, Leu65His, Ala67Gly, His70Gly, Phel08Tyr, GlnlO9His, Aspl58Gly e Leul62Gly (consulte a FIGURA 9 e a SEQ ID NOs: 4 e 5). A seqüência polipeptídica de sintetase mutante proporcionada na SEQ ID NO: 4 na FIGURA 9 indica as posições mutantes em negrito. A proteína de sintetase mutante é adicionalmente resumida na tabela abaixo.

<table>table see original document page 70</column></row><table>

Quatro resíduos sofreram mutação para glicina, provavelmente para criar espaço suficiente para acomodar o resíduo de 7-hidroxicumarina-etilglicina. A Tyr32 e a Aspl58, em que a ligação de hidrogênio se liga à tirosina na enzima do tipo selvagem, também sofrem mutação, em consonância com a perda de atividade em relação à tirosina (Kobayashi et at, Nat. Struct. Biol., (2003) 10:425-432; Zhang et al, Protein ScL, (2005) 14:1340-1349). A FIGURA 8 mostra um modelo estrutural previsto do sítio ativo de MjTyrRS (CouRS-D8) mutante. O modelo foi gerado utilizando-se a estrutura MjTyrRS do tipo selvagem (código pdb 1J1U). O substrato de tirosina foi substituído por L-(7- hidroxicumarina-4-il) etilglicina, e as seguintes mutações são apresentadas: Tyr32Glu, Leu65His, Ala67Gly, His70Gly, Phel08Tyr, GlnlO9His, Aspl58Gly e Leul62Gly. A estrutura foi, então, otimizada por minimização de energia pelo software Insightll® (Accelrys Software, Inc.®, San Diego, CA, EUA).

EXEMPLO 4

Expressão e Caracterização de uma Proteína de Modelo de Mioqlobina Mutante Contendo 7- Hidroxicumarina-Etilqlicina

Para determinar a eficiência e fidelidade de incorporação de 7-hidroxicumarina- etilglicina em proteínas, um códon seletor âmbar foi substituído na posição 4 (Ser-4) ou na posição 37 (His-37) em mioglobina de esperma de baleia (consulte a FIGURA 3) que contém um marcador de C-terminal His6. A expressão protéica foi realizada na presença da sintetase selecionada de CouRS-D8 e MjtRNATyrCUA em E coli desenvolvida em meio mínimo ou em meio suplementado com 1 mM de 7-hidroxicumarina-etilglicina. Como um controle negativo, a expressão protéica também foi realizada na ausência de 7- hidroxicumarina-etilglicina. Descreve-se esta produção e análise protéica em maiores detalhes abaixo.

PRODUÇÃO DE PROTEÍNA MUTANTE

Os plasmídeos pBAD/JYAMB-4TAG-Myo ou pB AD/JYAMB-37TAG-Myo foram independentemente co-transformados com vetor pBK que expressa CouRS-D8 em células GeneHogO-Fis E coli. As células foram amplificadas em meio 2YT (5 mL) suplementado com canamicina (50 [mu]g/mL) e tetraciclina (15 [mu]g/mL). Utilizou-se a cultura iniciadora (1 mL) para inocular 100 mL de GMML líquido ou 2YT suplementado com antibióticos adequados e 1 mM de 7-hidroxicumarina-etilglicina. As células foram, então, cultivadas a 37°C em um OD6oo de 0,5 e a expressão protéica foi induzida pela adição de arabinose a 0,2%. Após outras 4 a 12 horas, as células foram colhidas por centrifugação. Os mutantes de mioglobina TAG4 e TAG37 foram purificados por cromatografia de afinidade Ni-NTA sob condições naturais. As amostras foram, então, dessalinizadas. O rendimento das mioglobinas mutantes TAG4 e TAG37 no meio foi de 2 mg/L. A título de comparação, o rendimento de mioglobina do tipo selvagem sob condições similares foi de 5 mg/L.

ANÁLISE ESPECTROMÉTRICA DE MASSA PROTÉICA

Submeteu-se a proteína de mioglobina mutante TAG4 purificada à análise espectrométrica de massa ESI. As análises espectrométricas de massa ESI da mioglobina mutante forneceram uma massa média observada Mavg de 18511 Da, em acordo próximo com a massa calculada Mavg de 18512 Da (consulte a FIGURA 6). Visto que não foram encontradas espécies correspondentes à incorporação de aminoácido natural no espectro de massa ESI quando se utiliza um limite de convolução de 5%, uma pureza de incorporação mínima de 95% para 7-hidroxicumarina-etilglicina foi obtida a partir da razão de sinal para ruído do espectro de massa protéica. O limite de detecção é ajustado de tal modo que possa apenas detectar uma espécie se sua abundancia for maior que 5% do pico principal. Visto que apenas o pico principal é observado, a proteína mutante tem uma pureza > 95%.

ANÁLISE PROTÉICA POR RESOLUÇÃO EM SDS-PAGE

A análise da proteína purificada por SDS-PAGE apresentou que a proteína completa foi expressa apenas na presença de 7-hidroxicumarina-etilglicina (consulte a FIGURA 5). Além disso, a proteína de mioglobina mutante TAG4 que incorpora a 7- hidroxicumarina-etilglicina geneticamente codificada se mostra como uma tira fluorescente após a resolução em SDS-PAGE, onde a proteína de mioglobina do tipo selvagem desprovida de 7-hidroxicumarina-etilglicina geneticamente codificada não exibiu fluorescência. A formação de imagem de fluorescência utilizou um digitalizador de fluorescência STORM® (Molecular Dynamics/GE® Healthcare Life Sciences, Piscataway, NJ1 EUA).

EXEMPLO 5

Uso de uma 7-Hidroxicumarina-Etilglicina Geneticamente Codificada como uma Sonda para Configuração de Proteína

Para demonstrar um dos usos em potencial da 7-hidroxicumarina-etilglicina, utilizou-se este aminoácido como uma sonda da desnaturação dependente de uréia da holomioglobina. Pelo fato de a fluorescência de cumarina ser sensível à polaridade de solvente, sua intensidade de fluorescência deveria se correlacionar com o desenrolamento local da proteína em posição próxima à 7-hidroxicumarina-etilglicina. A estrutura de mioglobina consiste em oito espirais (A a H), conectadas por pequenos laços e voltas (Delli Castelli et al, Protein ScL, (2002) 11:2273-2276). O Ser4 na espiral A e His37 na espiral C (consulte a FIGURA 3; ambos os resíduos são amplamente expostos ao solvente e não interagem significativamente com outros resíduos próximos) foram independentemente modificados ao TAG de códon seletor, resultando em uma incorporação geneticamente programada in vivo de 7-hidroxicumarina-etilglicina na presença do par específico de O- tRNA ortogonal /O-RS.

Conforme indicado na FIGURA 4, as curvas de desenrolamento induzidas por uréia do tipo selvagem, as holomioglobinas Ser4 —► 7-hidroxicumarina-etilglicina e His37 —► 7- 35 hidroxicumarina-etilglicina conforme monitoradas por dicroísmo circular são virtualmente idênticas, sugerindo que a introdução de 7-hidroxicumarina-etilglicina na espiral A ou na espiral C não perturbe significativamente a estabilidade protéica. Em uma concentração de uréia de 2 M1 a intensidade de fluorescência de 7-hidroxicumarina-etilglicina na posição 4 em holomioglobina aumenta 30% (e permanece neste nível de 2 M a 5 M de uréia), sugerindo que esta região da proteína seja desordenada (Zhang et al, Protein ScL1 (2005) 14:1340-1349). Por outro lado, a mioglobina mutante com 7-hidroxicumarina-etilglicina no resíduo 37 mostra uma pequena alteração em sua intensidade de fluorescência em 2 M de uréia, porém, se submete a um aumento de fluorescência similar em 3 M de uréia. Em consonância com este resultado, um estudo por NMR anterior mostrou que quando a concentração de uréia for maior que 2,2 M, as espirais AeB são amplamente desorganizadas, conforme mostrado pelo desaparecimento de NOEs de faixa curta e média nesta região, enquanto que as espirais C, D e F se desenrolam depois, quando a concentração de uréia for maior que 3,0 M (Delli Castelli et al., Protein ScL, (2002) 11:2273- 2276). Portanto, parece que o aminoácido 7-hidroxicumarina-etilglicina consiste em uma sonda sítio-específica de alterações conformacionais protéicas, ao contrário do dicroísmo circular que relata alterações globais ponderadas por toda a estrutura.

A sensibilidade de 7-hidroxicumarina-etil glicina ao pH também foi testada, conforme mostrado na FIGURA 7. O espectro de absorção de 60 //M de aminoácido de cumarinil 7-hidroxicumarina-etilglicina foi medido em 100 nnM de solução tampão de fosfato de sódio. A absorbância de 360 nM aumentou enquanto o pH aumentou. Calculou-se um pKa de 7,8 a partir dessas medições.

A sensibilidade de 7-hidroxicumarina-etilglicina ao pH (consulte a FIGURA 7) e a polaridade de solvente (Zinsli, J. Photochem (1974) 3:55-69) a tornariam uma sonda útil para muitos estudos biológicos, tanto in vitro como in vivo (Brun et al, Angew. Chem., Int. Ed, (2004) 43:3432-3436). Por exemplo, pode-se utilizar o aminoácido 7-hidroxicumarina- etilglicina para monitorar as interações bimoleculares ou alterações conformacionais nas proteínas, ou a topologia de proteínas ligadas à membrana. Além disso, pelo fato de a 7- hidroxicumarina-etilglicina ter um pKa de 7,8, que pode ser sistematicamente alterado por substituição do anel de cumarina (Sun et al., Bioorg. Med. Chem. Lett., (1998) 8:3107-3110), ela pode ser uma sonda útil de pH organelar, e processos celulares dependentes de pH. Além disso, em seu estado excitado, a 7-hidroxicumarina é tanto um fotoácido forte (Cohen and Huppert, Phys. Chem. A (2001) 105:7157-7164) como pode facilitar o estudo de processos de transferência de prótons em proteínas.

Muito embora a invenção anterior tenha sido descrita em alguns detalhes por propósitos de clareza e compreensão, ficará claro aos versados na técnica a partir de uma leitura desta descrição que várias alterações na forma e detalhes podem ser feitas sem que se divirja do verdadeiro escopo da invenção. Todas as publicações, patentes, e pedidos de patente, e/ou outros documentos citados neste pedido estão incorporados em sua totalidade a título de referência para todos os propósitos com a mesma abrangência como se cada publicação, patente, pedido de patente, e/ou outros documentos individuais fossem individualmente indicados a serem incorporados a título de referência para todos os propósitos.

Claims

1. Sistema de translação, CARACTERIZADO pelo fato de que compreende: (a) um primeiro aminoácido não-natural que seja um aminoácido não-natural de L- (7-hidroxicoumarin-4-il) etilglicina; (b) uma primeira aminoacil-tRNA sintetase ortogonal (O-RS); e (c) um primeiro tRNA ortogonal (O-tRNA); sendo que a dita primeira O-RS aminoa- cila, de preferência, o dito primeiro O-tRNA com o dito primeiro aminoácido não-natural.

2. Sistema de translação, de acordo com a reivindicação 1, CARACTERIZADO pe- lo fato de que a dita primeira O-RS é derivada a partir de uma aminoacil-tRNA sintetase de Methanococcus jannaschii.

3. Sistema de translação, de acordo com a reivindicação 1, CARACTERIZADO pe- lo fato de que a dita primeira O-RS é derivada a partir de uma tirosil-tRNA sintetase de Me- thanococcus jannaschii do tipo selvagem.

4. Sistema de translação, de acordo com a reivindicação 1, CARACTERIZADO pe- lo fato de que a dita primeira O-RS compreende uma seqüência aminoacídica apresentada na SEQ. ID NO: 4, e variantes conservativas da mesma.

5. Sistema de translação, de acordo com a reivindicação 1, CARACTERIZADO pe- lo fato de que o dito primeiro O-tRNA é um tRNA supressor âmbar.

6. Sistema de translação, de acordo com a reivindicação 1, CARACTERIZADO pe- lo fato que o dito primeiro O-tRNA compreende, ou é codificado por uma, seqüência polinu- cleotídica apresentada na SEQ ID NO: 1.

7. Sistema de translação, de acordo com a reivindicação 1, CARACTERIZADO pe- lo fato que compreende, ainda, um ácido nucléico que codifica uma proteína de interesse, sendo que o dito ácido nucléico compreende ao menos um códon seletor, sendo que o có- don seletor é reconhecido pelo dito O-tRNA.

8. Sistema de translação, de acordo com a reivindicação 7, CARACTERIZADO pe- lo fato que compreende, ainda, uma segunda O-RS e um segundo O-tRNA, sendo que se- gunda O-RS aminoacila, de preferência, o segundo O-tRNA com um segundo aminoácido não-natural que seja diferente do primeiro aminoácido não-natural, e sendo que o segundo O-tRNA reconhece um códon seletor que seja diferente do códon seletor reconhecido pelo primeiro O-tRNA.

9. Sistema de translação, de acordo com a reivindicação 1, CARACTERIZADO pe- lo fato que o dito sistema compreende uma célula hospedeira que por sua vez compreende o dito primeiro aminoácido não-natural, a dita primeira O-RS e o dito primeiro O-tRNA.

10. Sistema de translação, de acordo com a reivindicação 9, CARACTERIZADO pelo fato que a célula hospedeira é uma célula eubacteriana.

11. Sistema de translação, de acordo com a reivindicação 10, CARACTERIZADO pelo fato que a dita célula eubacteriana é uma célula de E. coli.

12. Sistema de translação, de acordo com a reivindicação 9, CARACTERIZADO pelo fato que a dita célula hospedeira compreende um polinucleotídeo que codifica a dita primeira O-RS.

13. Sistema de translação, de acordo com a reivindicação 12, CARACTERIZADO pelo fato que o dito polinucleotídeo compreende uma seqüência nucleotídica apresentada na SEQ ID NO: 5.

14. Sistema de translação, de acordo com a reivindicação 9, CARACTERIZADO pelo fato que a dita célula hospedeira compreende um polinucleotídeo que codifica o dito primeiro O-tRNA.

15. Método para produção de uma proteína em um sistema de translação que com- preende um aminoácido não-natural em uma posição selecionada, CARACTERIZADO pelo fato que o método compreende: (a) proporcionar um sistema de translação que compreende: (i) um primeiro aminoácido não-natural que seja um aminoácido não-natural de L- (7-hidroxicoumarin-4-il) etilglicina; (ii) uma primeira aminoacil-tRNA sintetase ortogonal (O-RS); (iii) um primeiro tRNA ortogonal (O-tRNA), sendo que a dita primeira O-RS aminoa- cila, de preferência, o dito primeiro O-tRNA com o dito aminoácido não-natural; e, (iv) um ácido nucléico que codifica a dita proteína, sendo que o dito ácido nucléico compreende ao menos um códon seletor que seja reconhecido pelo dito primeiro O-tRNA; e, (b) incorporar o dito aminoácido não-natural na dita posição selecionada à dita pro- teína durante a translação da dita proteína em resposta ao dito códon seletor, produzindo, assim, a dita proteína que compreende o dito aminoácido não-natural na posição seleciona- da.

16. Método, de acordo com a reivindicação 15, CARACTERIZADO pelo fato de que o dito proporciona um sistema de translação que compreende proporcionar um polinucleotí- deo que codifica a dita O-RS.

17. Método, de acordo com a reivindicação 15, CARACTERIZADO pelo fato de que o dito proporciona um sistema de translação que compreende proporcionar uma O-RS deri- vada de uma aminoacil-tRNA sintetase Methanococcus jannaschii.

18. Método, de acordo com a reivindicação 15, CARACTERIZADO pelo fato de que o dito proporciona um sistema de translação que compreende proporcionar uma O-RS deri- vada de uma tirosil-tRNA sintetase Methanococcus jannaschii do tipo selvagem.

19. Método, de acordo com a reivindicação 15, CARACTERIZADO pelo fato de que o dito proporciona um sistema de translação que compreende proporcionar uma O-RS com- preendendo uma seqüência aminoacídica apresentada na SEQ ID NO: 4, e variantes con- servativas da mesma.

20. Método, de acordo com a reivindicação 15, CARACTERIZADO pelo fato de que o dito proporciona um sistema de translação que compreende modificar um bolso de ligação aminoacídico de uma aminoacil-tRNA sintetase do tipo selvagem por mutagênese sítio- direcionada, e selecionar uma O-RS resultante que aminoacile, de preferência, o dito O- tRNA com o dito aminoácido não-natural.

21. Método, de acordo com a reivindicação 20, CARACTERIZADO pelo fato de que a dita etapa de seleção compreende selecionar positiva e negativamente para dita O-RS a partir de um lago que compreende uma pluralidade de moléculas de aminoacil-tRNA sinteta- se resultantes seguindo a mutagênese sítio-direcionada.

22. Método, de acordo com a reivindicação 15, CARACTERIZADO pelo fato de que o dito proporciona um sistema de translação que compreende proporcionar um polinucleotí- deo que codifique o dito O-tRNA.

23. Método, de acordo com a reivindicação 15, CARACTERIZADO pelo fato de que o dito proporciona um sistema de translação que compreende proporcionar um O-tRNA que seja um tRNA supressor âmbar.

24. Método, de acordo com a reivindicação 15, CARACTERIZADO pelo fato de que o dito proporciona um sistema de translação que compreende proporcionar um O-tRNA que compreenda, ou seja codificado por, uma seqüência polinucleotídica apresentada na SEQ ID NO: 1.

25. Método, de acordo com a reivindicação 15, CARACTERIZADO pelo fato de que o dito proporciona um sistema de translação que compreende proporcionar um ácido nucléi- co que compreenda um códon seletor âmbar.

26. Método, de acordo com a reivindicação 15, CARACTERIZADO pelo fato de que a dita proteína compreende, ainda, um segundo aminoácido não-natural que seja diferente do primeiro aminoácido não-natural, sendo que o dito sistema de translação compreende, ainda, uma segunda O-RS e um segundo O-tRNA, sendo que a segunda O-RS aminoacila, de preferência, o segundo O-tRNA com um segundo aminoácido não-natural que seja dife- rente do primeiro aminoácido não-natural, sendo que o segundo O-tRNA reconhece um có- don seletor no ácido nucléico que seja diferente do códon seletor reconhecido pelo primeiro O-tRNA.

27. Método, de acordo com a reivindicação 15, CARACTERIZADO pelo fato de que o dito proporciona um sistema de translação que compreende proporcionar uma célula hos- pedeira, sendo que a dita célula hospedeira compreende o dito primeiro aminoácido não- natural, a dita primeira O-RS, o dito primeiro O-tRNA e o dito ácido nucléico, sendo que a dita etapa de incorporação compreende cultivar a dita célula hospedeira.

28. Método, de acordo com a reivindicação 27, CARACTERIZADO pelo fato de que o dito proporciona uma célula hospedeira que compreende proporcionar uma célula hospe- deira eubacteriana.

29. Método, de acordo com a reivindicação 28, CARACTERIZADO pelo fato de que o dito proporciona uma célula hospedeira eubacteriana que compreende proporcionar uma célula hospedeira de E. coli.

30. Método, de acordo com a reivindicação 27, CARACTERIZADO pelo fato de que o dito proporciona uma célula hospedeira que compreende proporcionar uma célula hospe- deira que compreende um polinucleotídeo que codifique a dita O-RS.

31. Método, de acordo com a reivindicação 30, CARACTERIZADO pelo fato de que o dito proporciona uma célula hospedeira compreendendo um polinucleotídeo que codifica a dita O-RS1 sendo que a etapa compreende proporcionar uma célula hospedeira compreen- dendo um polinucleotídeo que por sua vez compreende uma seqüência nucleotídica apre- sentada na SEQ ID NO: 5.

32. Método, de acordo com a reivindicação 15, CARACTERIZADO pelo fato de que o dito proporciona um sistema de translação que compreende proporcionar um extrato celu- lar.

33. Composição, CARACTERIZADA pelo fato de que compreende um polipeptídeo que por sua vez compreende uma seqüência aminoacídica apresentada na SEQ ID NO: 4, ou uma variante conservativa da mesma, sendo que o polipeptídeo de variante conservativa aminoacila um tRNA ortogonal (O-tRNA) cognato com um aminoácido não-natural em uma eficácia que seja de ao menos 50% da eficácia observada para um sistema de translação que compreende o dito O-tRNA, o dito aminoácido não-natural e uma aminoacil-tRNA sinte- tase que compreende a seqüência aminoacídica da SEQ ID NO: 4.

34. Polinucleotídeo, CARACTERIZADO pelo fato de que codifica o polipeptídeo de acordo com a reivindicação 33.

35. Polinucleotídeo, de acordo com a reivindicação 34, CARACTERIZADO pelo fa- to de que o dito polinucleotídeo compreende a seqüência nucleotídica da SEQ ID NO: 5.

36. Composição, de acordo com a reivindicação 33, CARACTERIZADA pelo fato de que a dita composição consiste em uma célula que compreende o polipeptídeo.

37. Composição, CARACTERIZADA pelo fato de que compreende um polinucleotí- deo que por sua vez compreende uma seqüência nucleotídica apresentada na SEQ ID NO: -5.

38. Vetor, CARACTERIZADO pelo fato de que compreende um polinucleotídeo de acordo com a reivindicação 37.

39. Vetor de expressão, CARACTERIZADO pelo fato de que compreende um poli- nucleotídeo de acordo com a reivindicação 37.

40. Célula compreendendo um vetor, sendo que o vetor é CARACTERIZADO pelo fato de que compreende um polinucleotídeo de acordo com a reivindicação 37.