BRPI0709603A2 - expressão de proteìnas geneticamente programada contendo o aminoácido não natural fenilselenocisteìna - Google Patents

expressão de proteìnas geneticamente programada contendo o aminoácido não natural fenilselenocisteìna Download PDF

Info

Publication number
BRPI0709603A2
BRPI0709603A2 BRPI0709603-8A BRPI0709603A BRPI0709603A2 BR PI0709603 A2 BRPI0709603 A2 BR PI0709603A2 BR PI0709603 A BRPI0709603 A BR PI0709603A BR PI0709603 A2 BRPI0709603 A2 BR PI0709603A2
Authority
BR
Brazil
Prior art keywords
trna
amino acid
protein
unnatural amino
phenylselenocysteine
Prior art date
Application number
BRPI0709603-8A
Other languages
English (en)
Inventor
Jiangyun Wang
Peter G Schultz
Original Assignee
Scripps Research Inst
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Scripps Research Inst filed Critical Scripps Research Inst
Publication of BRPI0709603A2 publication Critical patent/BRPI0709603A2/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1025Acyltransferases (2.3)
    • C12N9/104Aminoacyltransferases (2.3.2)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/67General methods for enhancing the expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/93Ligases (6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/02Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/06Preparation of peptides or proteins produced by the hydrolysis of a peptide bond, e.g. hydrolysate products

Abstract

EXPRESSãO DE PROTEìNAS GENETICAMENTE PROGRAMADA CONTENDO O AMINOáCIDO NãO NATURAL FENILSELENOCISTEìNA. A invenção diz respeito a pares ortogonais de RNAts e RNAt aminoacil sintetase que podem incorporar o aminoácido não natural fenilselenocisteina em proteínas produzidas em células hospedeiras eubactenanas, tal como E. coli. A invenção fornece, por exemplo, mas sem limitações, RNAt ortogonal aminoacil sintetase inédito, polinucleotídeos que codificam os sistemas de moléculas de sintetase inéditos, fenilselenocisteina e tradução. A invenção fornece adicionalmente métodos para produzir proteínas modificadas (por exemplo, proteínas lipidadas) por meio de modificação programada do resíduo de fenilselenocisteina em uma proteína.

Description

"EXPRESSÃO DE PROTEÍNAS GENETICAMENTE PROGRAMADA CONTENDOO AMINOÁCIDO NÃO NATURAL FENILSELENOCISTEÍNA"
REFERÊNCIA CRUZADA AO PEDIDO RELACIONADOEste pedido reivindica prioridade e benefício de:
Pedido de patente provisório dos Estados Unidos 60/783.272, depositado em 16 demarço de 2006, e pedido de patente provisório dos Estados Unidos 60/861.456, depositadoem 28 de novembro de 2006, cujos conteúdos estão ambos aqui incorporados nas suasíntegras pela referência com todos os propósitos.
DECLARAÇÃO DE DIREITOS A INVENÇÕES FEITAS COM PESQUISA E
DESENVOLVIMENTO PATROCINADO PELO GOVERNO FEDERAL
Esta invenção foi feita com suporte do governo do Instituto Nacional de Saúde comconcessão No. GM62159. O governo pode ter certos direitos nesta invenção.
CAMPO DA INVENÇÃO
A invenção é no campo de tradução bioquímica. A invenção diz respeito acomposições e métodos para preparar e usar RNAts ortogonais, aminoacil-RNAt sintetaseortogonal, e seus pares, que incorporam aminoácidos não naturais nas proteínas. Ainvenção também diz respeito a métodos de produzir proteínas nas células usando taispares e proteínas feitas pelos métodos.
ANTECEDENTES DA INVENÇÃO
O estudo de estrutura e função da proteína tem historicamente sido baseado naspropriedades e químicas de reações que são disponíveis usando os grupos reativos deaminoácidos de ocorrência natural. Infelizmente, diversos organismos conhecidos, debactéria até humanos, codificam os mesmos vinte aminoácidos comuns. Estes 20aminoácidos compreendem um número surpreendentemente limitado de grupos funcionais:bases de nitrogênio, ácidos carboxílicos e amidas, álcoois, e um grupo tiol. Esta seleçãolimitada de grupos R tem restringido o estudo da estrutura e função da proteína, onde osestudos são confinados pelas propriedades químicas dos aminoácidos de ocorrêncianatural. Por exemplo, o número limitado de grupos R reativos de ocorrência natural temlimitado a capacidade de fazer as modificações de proteína altamente visadas para aexclusão do outrosaminoácidos em uma proteína.
Reações de ligação quimiosseletivas envolvendo proteínas são extremamenteimportantes com uma variedade de propósitos, incluindo, mas sem limitações, estudo dainteração proteína-proteína e sinalização celular, e geração de terapêuticas de proteínainéditas. Reações de modificação de proteína mais seletivas atualmente usadas natecnologia envolvem formação de ligação covalente entre parceiros de reação nucleofílica eeletrofílica que visam resíduos nucleofílicos de ocorrência natural nas cadeias laterais deaminoácidos da proteína, por exemplo, a reação de cadeias laterais de σ-halo cetonas comhistidina ou cisteína. A seletividade nestes casos é determinada pelo número eacessibilidade dos resíduos de nucleofílicos na proteína. Infelizmente, proteínas deocorrência natural freqüentemente contêm sítios de reação ou múltiplos alvos de reação malposicionados (por exemplo, inacessíveis) (por exemplo, resíduos de lisina, histidina e cisteína), resultando em pouca seletividade nas reações de modificação, tornando amodificação da proteína altamente alvejada pelos reagentes nucleofílicos/eletrofílicos difícil.Além disso, os sítios de modificação são tipicamente limitados às cadeias laterais de lisina,histidina ou cisteína nucleofílicas de ocorrência natural. Modificação em outros sítios é difícilou impossível.
O que é necessário na tecnologia são novas estratégias para incorporação deaminoácidos não naturais nas proteínas com o propósito de modificar e estudar estrutura efunção da proteína, onde os aminoácidos não naturais têm químicas de reação inéditas ououtras propriedades, por exemplo, propriedades biológicas não encontradas nosaminoácidos de ocorrência natural. Existe uma necessidade considerável na tecnologia de criação de novas estratégias para reações de modificação de proteína que modificam asproteínas de uma maneira altamente seletiva e, além disso, modificam proteínas emcondições fisiológicas. O que é necessário na tecnologia são novos métodos para produzirmodificações de proteína, onde as modificações são altamente específicas, por exemplo,modificações onde nenhum dos aminoácidos de ocorrência natural passa por reações cruzadas ou reações laterais. Químicas inéditas para estratégias da modificação da proteínaaltamente específicas encontram uma ampla variedade de aplicações no estudo daestrutura e função da proteína e na produção de proteínas terapêuticas.
LIPIDACÂO DA PROTEÍNA
A lipidação da proteína é uma modificação pós-translacional chave que está envolvida na localização da proteína, no devido tráfego de proteína intracelular própria einterações proteína-proteína. A lipidação de proteínas é freqüentemente exigida para adevida atividade biológica. Esta característica é crítica para o desenvolvimento de algumasproteínas terapêuticas. Lipidação é também crítica em estudos de interações proteína-proteína e sinalização celular. Infelizmente, a ligação quimiosseletiva in vitro para produzir proteínas Iipidadas usando a forma não Iipidada nativa da proteína é extremamente difícil, eé de um modo geral limitada a modificação de resíduos de cisteína expostos a superfícieexclusiva.
As atividades biológicas de muitas proteínas celulares exigem associação com amembrana celular, que depende da modificação pós-tradução de cisteína por resíduos de lipídios tais como frações de farnesila, miristoíla e palmitoíla (Chemomordik and Kozlov(2003), Annual Review of Chemystres 72:175-207). Por exemplo, muitos receptoresacoplados de proteína G são palmitoilados, proteínas Ras são tanto famesiladas quantopalmitoiladas (Chernomordik and Kozlov (2003), Annual Review of Chemystres 72:175-207).Embora farnesilação de proteína seja uma modificação estável e irreversível, a palmitoilaçãoé reversível, resultando na regulação dinâmica de função de proteína, e alvejamentoespecífico das membranas celulares (Rocks et ai (2005), Science 307(5716): 1746-1752).
Além disso, ácido γ-carboxiglutâmico é uma modificação essencial que é importante paraadesão da membrana dependente de cálcio na cascata de coagulação (Davie et al. (1991),Chemystres 30(43): 10363-10370).
SISTEMAS DE TRADUÇÃO ORTOGONAL
Uma estratégia para superar as limitações de um código genético limitado éexpandir o código genético e adicionar aminoácidos que têm novas propriedades reativas aorepertório biológico. Uma metodologia geral foi desenvolvida para incorporação sítio-específico in vivo de diversos aminoácidos não naturais nas proteínas, tanto em organismosprocarióticos quanto eucarióticos. Estes métodos baseiam-se em componentes de traduçãode proteína ortogonal que reconhecem um códon seletor adequado para inserir umaminoácido não natural desejado em uma posição definida durante a tradução depolipeptídeo in vivo. Estes métodos utilizam um RNAt ortogonal (O-RNAt) que reconhece umcódon seletor, e onde um aminoacil-RNAt sintetase ortogonal específico correspondente(um O-RS) carrega o O-RNAt com o aminoácido não natural. Estes componentes nãosofrem reação cruzada com nenhum dos aminoácidos ou códons RNAts, RSs, endógenosno organismo hospedeiro (isto é, eles devem ser ortogonais). O uso de tais pares de RNAt-RS ortogonal tornou possível codificar geneticamente um grande número de aminoácidosnão naturais estruturalmente diferentes.
A prática de usar sistemas de tradução ortogonal que são adequados para prepararproteínas que compreendem um ou mais aminoácidos não naturais é de um modo geralconhecida na tecnologia, bem como os métodos gerais para produzir sistemas de traduçãoortogonal. Por exemplo, ver International Publication Numbers WO 2002/086075, intitulado"METHODS AND COMPOSITION FOR THE PRODUTION OF ORTOGONAL RNAt-AMINOACYL-RNAt SYNTHETASE PAIRS"; WO 2002/085923, intitulado "IN VIVOINCORPORATION OF UNNATURAL AMINO ACIDS"; WO 2004/094593, intitulado"EXPANDING THE EUKARYOTIC GENETIC CODE"; WO 2005/019415, depositado em 7de julho de 2004; WO 2005/007870, depositado em 7 de julho de 2004; WO 2005/007624,depositado em 7 de julho de 2004 e WO 2006/110182, depositado em 27 de outubro de2005, intitulado "ORTOGONAL TRANSLATION COMPONENTS FOR THE VIVOINCORPORATION OF UNNATURAL AMINO ACIDS". Cada um desses pedidos está aquiincorporado pela referência na sua íntegra. Para discussão adicional de sistemas detradução ortogonal que incorporam aminoácidos não naturais, e métodos para sua produçãoe uso, Ver também, Wang and Schultz1 "Expanding the Genetic Code," Chem. Commun.(Camb.) 1:1-11 (2002); Wang and Schultz "Expanding the Genetic Code", AngewandteChemie Int. Ed., 44(1):34-66 (2005); Xie e Sehultz, "A Expanding Genetic Code", Methods36(3):227-238 (2005); Xie and Sehultz, "Adding Amino acids to the Repertorie Genetic", Curr.Opinion in Chemical Biology 9(6):548-554 (2005); Wang et ai, "Expanding the GeneticCode", Annu. Rev. Biophys. Biomoi Struct., 35:225-249 (2006); and Xie and Sehultz, "AChemical Toolkit for Proteins - A Expanded Genetic Code," Nat. Rev. Mol. Cell Biol.,7(10):775-782 (2006).
Existe uma necessidade na tecnologia do desenvolvimento de componentes detradução ortogonal que incorporam aminoácidos não naturais nas proteínas, onde osaminoácidos não naturais podem ser incorporados em uma posição definida, e onde osaminoácidos não naturais têm propriedades químicas inéditas que permitem que oaminoácido sirva como um alvo para modificação específica (por exemplo, lipidação) para aexclusão de reações cruzadas ou reações laterais com outros sítios nas proteínas. Ainvenção preenche estas e outras necessidades, que ficarão aparentes mediante a revisão da revelação seguinte.
SUMÁRIO DA INVENÇÃO
A invenção fornece composições e métodos para incorporar o aminoácido nãonatural fenilselenocisteína em uma cadeia do polipeptídeo em crescimento em resposta aum códon seletor, por exemplo, um códon de parada âmbar, in vivo (por exemplo, em umacélula hospedeira). Estas composições incluem pares de RNAts-ortogonais (O-RNAts) eaminoacil-RNAt sintetases ortogonais (O-RSs) que não interagem com o maquinário detradução da célula hospedeira. Ou seja, o O-RNAt não é carregado (ou não carregado emum nível significativo) com um aminoácido (natural ou não natural) por um aminoacil-RNAtsintetase da célula hospedeira endógena. Similarmente, o O-RSs fornecido pela invençãonão carrega nenhum RNAt endógeno com um aminoácido (natural ou não natural) em umnível significativo ou, em alguns casos, detectável. Estas composições inéditas permitem aprodução de grandes quantidades de proteínas tendo aminoácidos não naturaistransacionalmente incorporados. As propriedades químicas do aminoácido não naturalfenilselenocisteína também permitem que a modificação alvejada daquele resíduo produza conjugações desejadas, por exemplo, mas sem limitações, conjugações de lipídio. Taispolipeptídeos especificamente modificados podem encontrar uso como produtosterapêuticos e em pesquisa biomédica.
Em alguns aspectos, a invenção fornece sistemas de tradução. Estes sistemascompreendem um primeiro aminoacil-RNAt sintetase ortogonal (O-RS), um primeiro RNAtortogonal (O-RNAt) e um primeiro aminoácido não natural que é fenilselenocisteína, onde oprimeiro O-RS preferencialmente aminoacila o primeiro O-RNAt com o primeiro aminoácidonão natural fenilselenocisteína. Em alguns aspectos, o O-RS preferencialmente aminoacila oO-RNAt com a dita fenilselenocisteína com uma eficiência que é pelo menos 50 % daeficiência observada para um sistema de tradução compreendendo esse mesmo O-RNAt1 afenilselenocisteína e um aminoacil-RNAt sintetase que compreende a seqüência deaminoácidos de SEQ ID NO: 4, 6 ou 8.
Os sistemas de tradução podem usar componentes derivados de uma variedade defontes. Em uma modalidade, o O-RS usado no sistema pode compreender a seqüência deaminoácidos de SEQ ID NOS: 4, 6 ou 8, e variantes conservativas desta seqüência. Emalgumas modalidades, o O-RNAt é um supressor âmbar. Em algumas modalidades, o O-RNAt compreende ou é codificado pela SEQ ID NO: 1.
Em alguns aspectos, o sistema de tradução compreende adicionalmente um ácidonucléico que codifica uma proteína de interesse, onde o ácido nucléico tem pelo menos umcódon seletor que é reconhecido pelo O-RNAt.
Em alguns aspectos, o sistema de tradução incorpora um segundo par ortogonal(ou seja, um segundo O-RS e um segundo O-RNAt) que utiliza um segundo aminoácido nãonatural, de maneira que o sistema é agora capaz de incorporar pelo menos doisaminoácidos não naturais diferentes em sítios diferentes selecionados em um polipeptídeo.Neste sistema duplo, o segundo O-RS preferencialmente aminoacila o segundo O-RNAtcom um segundo aminoácido não natural que é diferente do primeiro aminoácido nãonatural, e o segundo O-RNAt reconhece um códon seletor que é diferente do códon seletor reconhecido pelo primeiro O-RNAt.
Em algumas modalidades, o sistema de tradução reside em uma célula hospedeira(e inclui a célula hospedeira). A célula hospedeira usada particularmente não é limitada,desde que o O-RS e O-RNAt retenham sua ortogonalidade em seu ambiente da célulahospedeira. A célula hospedeira pode ser uma célula eubacteriana, tal como E. coli. A célula hospedeira pode compreender um ou mais polinucleotídeos que codificam componentes dosistema de tradução, incluindo o O-RS ou O-RNAt. Em algumas modalidades, opolinucleotídeo que codifica o O-RS compreende uma seqüência de nucleotídeos de SEQID NO:5,7 ou 9.
A invenção também fornece métodos para produzir proteínas com um ou mais aminoácidos não naturais em posições selecionadas. Estes métodos utilizam os sistemas detradução descritos anteriormente. De um modo geral, estes métodos começam com a etapade fornecer um sistema de tradução que compreende:
(i) um primeiro aminoácido não natural que é fenilselenocisteína;
(ii) um primeiro aminoacil-RNAt sintetase ortogonal (O-RS);
(iii) um primeiro RNAt ortogonal (O-RNAt), em que o O-RS preferencialmente o O-RNAt aminoacila com o aminoácido não natural; e,
(iv) um ácido nucléico que codifica a proteína, onde o ácido nucléico compreendepelo menos um códon seletor (opcionalmente um códon âmbar) que é reconhecido peloprimeiro O-RNAt. O método então incorpora o aminoácido não natural na posiçãoselecionada na proteína durante a tradução da proteína em resposta ao códon seletor,produzindo dessa maneira a proteína compreendendo o aminoácido não natural na posição selecionada. Em alguns aspectos destes métodos, o O-RS preferencialmente aminoacila oO-RNAt com a fenilselenocisteína com uma eficiência que é pelo menos 50 % da eficiênciaobservada para um sistema de tradução compreendendo esse mesmo O-RNAt, afenilselenocisteína, e um aminoacil-RNAt sintetase compreendendo a seqüência deaminoácidos de SEQ ID NO: 4, 6 ou 8. Em alguns aspectos, o sistema de tradução inclui umácido nucléico que codifica o O-RS.
Estes métodos podem ser amplamente aplicados usando uma variedade dereagentes. Em algumas modalidades, um polinucleotídeo que codifica o O-RS é fornecido.Em algumas modalidades, o O-RS compreende uma seqüência de aminoácidos de SEQ IDNO: 4, 6 ou 8, ou variantes conservativas destes. Opcionalmente, o sistema de tradução usado nos métodos inclui um ácido nucléico que codifica o O-RS1 por exemplo, um ácidonucléico de SEQ ID NO: 5, 7 ou 9.
Em algumas modalidades destes métodos, a provisão de uma etapa do sistema detradução compreende mutar uma bolsa de ligação de aminoácido de um aminoacil RNAtsintetase tipo selvagem por mutagênese de sítio dirigido, e selecionar um O-RS resultante que preferencialmente aminoacila o O-RNAt com o aminoácido não natural. A etapa deseleção pode compreender selecionar positiva ou negativamente o O-RS de umagrupamento de moléculas de aminoacil-RNAt sintetase resultantes depois da mutagênesede sítio dirigido. Em algumas modalidades, a etapa de prover fornece um polinucleotídeoque codifica o O-RNAt1 por exemplo, um O-RNAt que é um supressor âmbar de RNAt, ouum O-RNAt que compreende ou é codificado por um polinucleotídeo de SEQ ID NO: 1.Nestes métodos, a etapa de fornecimento pode também fornecer um ácido nucléicocompreendendo um códon seletor de âmbar que é utilizado pelo sistema de tradução.
Estes métodos podem também ser modificados para incorporar mais que umaminoácido não natural em uma proteína. Nestes métodos, é empregado um segundosistema de ORTOGONAL TRANSLATION em conjunto com o primeiro sistema de tradução,onde o segundo sistema tem diferentes especificidades de aminoácido e códon seletor. Porexemplo, a etapa de fornecimento pode incluir fornecer um segundo O-RS e um segundo O-RNAt, onde o segundo O-RS preferencialmente aminoacila o segundo O-RNAt com umsegundo aminoácido não natural que é diferente do primeiro aminoácido não natural, e onde o segundo O-RNAt reconhece um códon seletor no ácido nucléico que é diferente do códonseletor reconhecido pelo primeiro O-RNAt.
Os métodos para produzir uma proteína com um aminoácido não natural podem7também ser conduzidos no contexto de uma célula hospedeira. Nestes casos, é fornecidauma célula hospedeira, onde a célula hospedeira compreende o aminoácido não natural, oO-RS1 o O-RNAt e o ácido nucléico com pelo menos um códon seletor que codifica aproteína, e onde cultivar a célula hospedeira resulta na incorporação do aminoácido nãonatural. Em algumas modalidades, a etapa de fornecimento compreende fornecer umacélula eubacteriana hospedeira (por exemplo, E. coli). Em algumas modalidades, a etapa defornecimento inclui fornecer uma célula hospedeira contendo um polinucleotídeo quecodifica o O-RS. Por exemplo, o polinucleotídeo que codifica o O-RS pode compreenderuma seqüência de nucleotídeos de SEQ ID NO: 5, 7 ou 9.
Em algumas variações destes métodos, os procedimentos incluem adicionalmentemodificação da fenilselenocisteína após sua incorporação em um polipeptídeo. Por exemplo,a fenilselenocisteína pode reagir em certas condições que resultam na conversão paradeidroalanina na posição selecionada. Esta reação pode ser por eliminação oxidativa. Areação pode ser realizada expondo a fenilselenocisteína ao peróxido de hidrogênio.
A invenção também fornece métodos para produzir proteínas lipidadas, onde olipídio é conjugado em uma posição designada selecionada. Estes métodos utilizam ossistemas de tradução descritos anteriormente. De um modo geral, estes métodos começamcom a etapa de fornecer um sistema de tradução que compreende:
(i) um aminoácido não natural fenilselenocisteína;
(ii) um aminoacil-RNAt sintetase ortogonal (O-RS);
(iii) um RNAt ortogonal (O-RNAt), onde o O-RS preferencialmente aminoacila o O-RNAt com a fenilselenocisteína; e,
(iv) um ácido nucléico que codifica a proteína, onde o ácido nucléico compreendepelo menos um códon seletor (opcionalmente um códon âmbar) que é reconhecido pelo O-
RNAt. O método então incorpora a fenilselenocisteína na posição selecionada na proteínadurante a tradução da proteína em resposta ao códon seletor. Essa fenilselenocisteínareage em seguida para produzir deidroalanina na posição selecionada, que, por sua vez,reage com um lipídio para produzir uma fração de aminoácido lipidado, produzindo dessamaneira uma proteína com um lipídio na posição selecionada na proteína.
Em alguns aspectos destes métodos, a reação da fenilselenocisteína é poreliminação oxidativa ou exposição a peróxido de hidrogênio. Em alguns aspectos, o lipídioconjugado que reagiu com a deidroalanina pode ser ácido tiopalmítico, farnesilmercaptanoou 1-hexadecanetiol. Os aminoácidos Iipidados assim formados são palmitoilcisteína,farnesilcísteína e S-hexadecilcisteína. A modificação da deidroalanina é tipicamente por umareação de adição de Michael.
A invenção também fornece métodos para produzir uma proteína tendo um resíduode deidroalanina em uma posição selecionada. Estes métodos utilizam os sistemas detradução descritos anteriormente. De um modo geral, estes métodos começam com a etapade fornecer um sistema de tradução que compreende:
(i) um aminoácido não natural fenilselenocisteína
(ii) um aminoacil-RNAt sintetase ortogonal (O-RS);
(iii) um RNAt ortogonal (O-RNAt)1 onde o O-RS preferencialmente aminoacila o O-RNAt com a fenilselenocisteína; e,
(iv) um ácido nucléico que codifica a proteína, onde o ácido nucléico compreendepelo menos um códon seletor (opcionalmente um códon âmbar) que é reconhecido pelo O-RNAt. O método então incorpora a fenilselenocisteína na posição selecionada na proteínadurante a tradução da proteína em resposta ao códon seletor. Essa fenilselenocisteínareage em seguida para produzir deidroalanina na posição selecionada. Em alguns aspectosdestes métodos, a reação da fenilselenocisteína é por eliminação oxidativa ou exposição aoperóxido de hidrogênio.
A invenção também fornece uma variedade de composições, incluindo ácidosnucléicos e proteínas. A natureza da composição não é particularmente limitada, desde quea composição compreenda o ácido nucléico ou proteína especificados. As composições dainvenção podem compreender qualquer número de componentes adicionais de qualquernatureza.
Por exemplo, a invenção fornece composições que compreendem polipeptídeos, onde os polipeptídeos compreendem a seqüência de aminoácidos de SEQ ID NO: 4, 6 ou 8,ou uma variante conservativa deste. Em alguns aspectos, o polipeptídeo da varianteconservativa aminoacila um RNAt ortogonal cognato (O-RNAt) com um aminoácido nãonatural com uma eficiência que é pelo menos 50 % da eficiência observada para um sistemade tradução que compreende o O-RNAt1 o aminoácido não natural, e uma sintetaseaminoacil-RNAt compreendendo a seqüência de aminoácidos de SEQ ID NO: 4, 6, 8 ou 10.A invenção também fornece polinucleotídeos que codificam qualquer desses polipeptídeosanteriores. Em algumas modalidades, estes polinucleotídeos podem compreender umaseqüência de nucleotídeos de SEQ ID NO: 5, 7 ou 9. Em algumas modalidades, ospolipeptídeos estão em uma célula.
A invenção também fornece composições de polinucleotídeo que compreendemuma seqüência de nucleotídeos de SEQ ID NO: 5, 7 ou 9. Em algumas modalidades, ainvenção fornece vetores que compreendem os polinucleotídeos, por exemplo, vetores deexpressão. Em algumas modalidades, a invenção fornece células que compreendem umvetor descrito anteriormente.
DEFINIÇÕES
Antes de descrever a invenção em detalhes, deve-se entender que esta invençãonão está limitada a sistemas biológicos particulares, que podem, é claro, variar. Deve-setambém entender que a terminologia aqui usada tem o propósito de descrever apenasmodalidades particulares, e não deve ser limitante. Conforme usado nesta especificação enas reivindicações anexas, as formas singulares "um", "uma", "o" e "a" incluem referentesplurais, a menos que o conteúdo determine claramente de outra forma. Assim, por exemplo,referência a "uma célula" inclui combinações de duas ou mais células; referência a "umpolinucleotídeo" inclui, como uma questão prática, muitas cópias de que polinucleotídeo.
A menos que aqui definido e a seguir no resto da especificação, todos termostécnicos e científicos aqui usados têm o mesmo significado normalmente entendido pelosversados na tecnologia a qual a invenção diz respeito.
Ortoqonal: Da maneira aqui usada, o termo "ortogonal" refere-se a uma molécula(por exemplo, um RNAt ortogonal (O-RNAt) e/ou um aminoacil-RNAt sintetase ortogonal (O-RS)) que funciona com componentes endógenos de uma célula com baixa eficiência,comparada a uma molécula correspondente que é endógena para a célula ou sistema detradução, ou que não pode funcionar com componentes endógenos da célula. No contextode RNAts e aminoacil-RNAt sintetase, ortogonal refere-se a uma incapacidade ou baixaeficiência, por exemplo, menos que 20 % de eficiência, menos que 10 % de eficiência,menos que 5 % de eficiência, ou menos que 1% de eficiência, de um RNAt ortogonalfuncionar com um RNAt sintetase endógeno, comparado a de um RNAt endógeno funcionarcom o RNAt sintetase endógeno, ou de um aminoacil-RNAt sintetase ortogonal funcionarcom um RNAt endógeno, comparado a de um RNAt sintetase endógeno de funcionar com oendógeno RNAt. A molécula falta uma molécula complementar ortogonal endógenafuncionalmente normal na célula. Por exemplo, um RNAt ortogonal em uma célula éaminoacilado por qualquer RS endógeno da célula com eficiência baixa, ou mesmo zero,quando comparado a aminoacilação de um RNAt endógeno pelo RS endógeno. Em umoutro exemplo, um RS ortogonal aminoacila qualquer RNAt endógeno de uma célula deinteresse com eficiência baixa, ou mesmo zero, comparado a aminoacilação do RNAtendógeno por um RS endógeno. A segunda molécula ortogonal pode ser introduzida nacélula que funciona com a primeira molécula ortogonal. Por exemplo, um par de RNAtortogonal/RS inclui componentes complementares introduzidos que funcionam juntos nacélula com uma eficiência (por exemplo, 45 % de eficiência, 50 % de eficiência, 60 % deeficiência, 70 % de eficiência, 75 % de eficiência, 80 % de eficiência, 90 % de eficiência, 95% de eficiência, ou 99 % ou mais eficiência), comparado aquela de um controle, porexemplo, um par de RNAt/RS endógeno correspondente, ou um par ortogonal ativo (porexemplo, um par de tirosil RNAt ortogonal/RS).
TirosiI-RNAt Ortoqonal: Da maneira aqui usada, um tirosil-RNAt ortogonal (tirosil-O-RNAt) é um RNAt que é ortogonal para um sistema de tradução de interesse, onde o RNAté:(1) idêntico ou substancialmente similar a um tirosil-RNAt de ocorrência natural,
(2) derivado de um tirosil-RNAt de ocorrência natural por mutagênese natural ouartificial,
(3) derivado por qualquer processo que leva uma seqüência de um tipo selvagem ou seqüência de tirosil-RNAt mutante de (1) ou (2) em consideração, (4) homóloga a umtirosil-RNAt tipo selvagem ou mutante; (5) homóloga a qualquer exemplo RNAt que édesignado como um substrato para um tirosil-RNAt sintetase na figura 2, ou (6) uma varianteconservativa de qualquer exemplo RNAt que é designado como um substrato para umtirosil-RNAt sintetase na figura 2. O tirosil-RNAt pode existir carregado com um aminoácido ou em um estado descarregado. Deve-se também entender que um "tirosil-O-RNAt"opcionalmente é carregado (aminoacilado) por uma sintetase cognata com um aminoácido anão ser tirosina, respectivamente, por exemplo, com um aminoácido não natural.Realmente, percebe-se que um tirosil-O-RNAt da invenção é vantajosamente usado parainserir essencialmente qualquer aminoácido, quer natural ou não natural, em um polipeptídeo em crescimento, durante a tradução, em resposta a um códon seletor.
Aminoácido tirosil sintetase ortoqonal: Da maneira aqui usada, um aminoácidotirosil sintetase ortogonal (tirosil-O-RS) é uma enzima que preferencialmente aminoacila otirosil-O-RNAt com um aminoácido em um sistema de tradução de interesse. O aminoácidoque o tirosil-O-RS carrega no tirosil-O-RNAt pode ser qualquer aminoácido, quer natural,não natural ou artificial, e não está aqui limitado. A sintetase é opcionalmente a mesma ouhomóloga a uma sintetase de aminoácido tirosil de ocorrência natural, ou a mesma ouhomóloga a uma sintetase designada como um O-RS na figura 2. Por exemplo, o O-RSpode ser uma variante conservativa de um tirosil-O-RS da figura 2, e/ou pode ser pelomenos 50 %, 60 %, 70 %, 80 %, 90 %, 95 %, 98 %, 99 % ou mais idêntica em seqüência a um O-RS da figura 2.
Coqnato: O termo "Cognato" refere-se a componentes que funcionam juntos, outêm algum aspecto de especificidade um com o outro, por exemplo, um RNAt ortogonal eum aminoacil-RNAt ortogonal sintetase. Os componentes podem também ser referidoscomo complementares.
Preferencialmente aminoacila: Da maneira aqui usada em referência aos sistemasde tradução ortogonal, um O-RS "preferencialmente aminoacila" um O-RNAt cognatoquando o O-RS carrega o O-RNAt com um aminoácido mais eficientemente do que elecarrega qualquer RNAt endógeno em um sistema de expressão. Ou seja, quando o O-RNAte qualquer dado RNAt endógeno estão presentes em um sistema de tradução em razões molares aproximadamente iguais, o O-RS carregará o O-RNAt mais freqüentemente do queele carregará o RNAt endógeno. Preferivelmente, a razão relativa do O-RNAt carregado peloO-RS com o RNAt endógeno carregado pelo O-RS é alta, preferivelmente resultando no O-RS carregando o O-RNAt exclusivamente, ou quase exclusivamente, quando o O-RNAt eRNAt endógeno estão presentes em concentrações molares iguais no sistema de tradução.A razão relativa entre O-RNAt e RNAt endógeno que é carregado pelo O-RS1 quando o O-RNAt e O-RS estão presentes em concentrações molares iguais, é maior que 1:1, preferivelmente pelo menos cerca de 2:1, mais preferivelmente 5:1, ainda maispreferivelmente 10:1, acima de tudo mais preferivelmente 20:1, ainda mais preferivelmente50:1, acima de tudo mais preferivelmente 75:1, ainda mais preferivelmente 95:1, 98:1, 99:1,100:1, 500:1, 1.000:1, 5.000:1 ou mais.
O O-RS "preferencialmente aminoacila um O-RNAt com um aminoácido nãonatural" quando (a) o O-RS preferencialmente aminoacila o O-RNAt comparado a um RNAtendógeno, e (b) onde essa aminoacilação é específica para o aminoácido não natural,comparado a aminoacilação do O-RNAt pelo O-RS com qualquer aminoácido natural. Ouseja, quando os aminoácidos não naturais e naturais estão presentes em quantidadesmolares iguais em um sistema de tradução compreendendo o O-RS e O-RNAt, o O-RS carregará o O-RNAt com o aminoácido não natural mais freqüentemente do que com oácido natural. Preferivelmente, a razão relativa do O-RNAt carregado com o aminoácido nãonatural para O-RNAt carregado com o aminoácido natural é alta. Mais preferivelmente, O-RS carrega o O-RNAt exclusivamente, ou quase exclusivamente, com o aminoácido nãonatural. A razão relativa entre o carregamento do O-RNAt com o aminoácido não natural ecarregamento do O-RNAt com o aminoácido natural, quando ambos os aminoácidosnaturais e não naturais estão presentes no sistema de tradução em concentrações molaresiguais, é maior que 1:1, preferivelmente pelo menos cerca de 2:1, mais preferivelmente 5:1,ainda mais preferivelmente 10:1, acima de tudo mais preferivelmente 20:1, ainda maispreferivelmente 50:1, acima de tudo mais preferivelmente 75:1, ainda mais preferivelmente 95:1, 98:1, 99:1, 100:1, 500:1, 1,000:1, 5,000:1 ou mais.
Códon seletor: O termo "códon seletor" refere-se a códons reconhecidos pelo O-RNAt no processo de tradução e não reconhecidos por um RNAt endógeno. O laçoanticódon de O-RNAt reconhece o códon seletor no mRNA e incorpora seu aminoácido, porexemplo, um aminoácido não natural, neste sítio no polipeptídeo. Códons seletores podem incluir, por exemplo, códons não sentido, tais como, códons de parada, por exemplo, códonsâmbar, ocre e opala; códons de quatro ou mais bases; códons raros; códons derivados depares de base natural ou não natural e/ou similares.
RNAt supressor: Um RNAt supressor é um RNAt que altera a leitura de um RNAmensageiro (RNAm) em um dado sistema de tradução, tipicamente permitindo aincorporação de um aminoácido em resposta a um códon de parada (isto é, "leitura total")durante a tradução de um polipeptídeo. Em alguns aspectos, um códon seletor da invençãoé um códon supressor, por exemplo, um códon de parada (por exemplo, um códon âmbar,ocre ou opala), um códon de quatro bases, um códon raro, etc.
Atividade de supressão: Da maneira aqui usada, o termo "atividade de supressão"refere-se em geral à capacidade de um RNAt (por exemplo, um supressor RNAt) permitirleitura de um códon translacional (por exemplo, um códon seletor que é um códon âmbar ou um códon de 4 bases ou mais) que possa resultar de outra forma na terminação de traduçãoou não tradução (por exemplo, deslocamento de quadro). Atividade de supressão de umsupressor RNAt pode ser expressa como uma porcentagem de atividade de leituratranslacional observada, comparada a um segundo supressor RNAt, ou comparada a umsistema de controle, por exemplo, um sistema de controle faltando um O-RS.
A presente invenção fornece vários métodos pelos quais a atividade de supressãopode ser quantificada. A supressão percentual de um O-RNAt e O-RS particular em funçãode um códon seletor (por exemplo, um códon âmbar) de interesse refere-se à porcentagemde atividade de um dado marcador de teste expresso (por exemplo, LacZ), que inclui umcódon seletor, em um ácido nucléico que codifica o marcador de teste expresso, em um sistema de tradução de interesse, onde o sistema de tradução de interesse inclui um O-RS eum O-RNAt, comparado a uma construção de controle positivo, onde o controle positivo faltao O-RNAt, o O-RS e o códon seletor. Assim, por exemplo, se uma construção do marcadorde controle positivo ativo que falta um códon seletor tem uma atividade observada de X emum dado sistema de tradução, em unidades relevantes ao ensaio do marcador em questão, então a supressão da porcentagem de uma construção de teste compreendendo o códonseletor é a porcentagem de X que o marcador de construção de teste apresenta nasmesmas condições essencialmente ambientais que o marcador de controle positivo foiexpresso, exceto que o marcador de construção de teste é expresso em um sistema detradução que também inclui o O-RNAt e o O-RS. Tipicamente, o sistema de tradução que expressa o marcador de teste também inclui um aminoácido que é reconhecido pelo O-RS eO-RNAt. Opcionalmente, as medições de supressão percentual podem ser refinadas porcomparação do marcador de teste com uma construção de marcador de controle "de fundo"ou "negativa", que inclui o mesmo códon seletor como o marcador de teste, mas em umsistema que não inclui o O-RNAt, O-RS e/ou aminoácido relevante reconhecido pelo O-RNAt e/ou O-RS. Este controle negativo é usado na normalização das medições desupressão percentual para levar em conta os efeitos de sinal de fundo do marcador nosistema de tradução de interesse.
A eficiência de supressão pode ser determinada por qualquer dos diversos ensaiosconhecidos na tecnologia. Por exemplo, um ensaio reportador de fgalactosidase pode serusado, por exemplo, um plasmídeo IacZ derivatizado (onde a construção tem um códonseletor na seqüência de ácido nucléico IacZ) é introduzido nas células a partir de umorganismo apropriado (por exemplo, um organismo onde os componentes ortogonais podemser usados) junto com o plasmídeo compreendendo um O-RNAt da invenção. Uma sintetasecognata pode também ser introduzida (tanto como um polipeptídeo quanto como umpolinucleotídeo que codifica uma sintetase cognata quando expressa). As células crescemem meio a uma densidade desejada, por exemplo, com um OD600 de cerca de 0,5, e ensaiosB-galactosidase são realizados, por exemplo, usando o conjunto de ensaio /J-GalactosidaseBetaflúor™ (Novagen). A supressão percentual pode ser calculada como a porcentagem deatividade para uma amostra com relação a um controle comparável, por exemplo, o valorobservado da construção IacZ derivatizada, onde a construção tem um códon sentidocorrespondente na posição desejada em vez de um códon seletor.
Sistema de tradução: O termo "sistema de tradução" refere-se aos componentesque incorporaram um aminoácido em uma cadeia do polipeptídeo em crescimento(proteína). Componentes de um sistema de tradução podem incluir, por exemplo,ribossomos, RNAts1 sintetase, mRNA e similares. O O-RNAt e/ou o O-RSs^ da invençãopodem ser adicionados ou ser parte de um sistema de tradução in vitro ou in vivo, por exemplo, em uma célula não eucariótica, por exemplo, uma bactéria (tal como E. coli), ouem uma célula eucariótica, por exemplo, uma célula de levedura, uma célula de mamífero,uma célula de planta, uma célula de alga, uma célula de fungo, uma célula de inseto e/ousimilares.
Aminoácido não natural: Da maneira aqui usada, o termo "aminoácido não natural"refere-se a qualquer aminoácido, aminoácido modificado e/ouanálogo de aminoácido, quenão é um dos 20 aminoácidos de ocorrência natural comuns. Por exemplo, o aminoácidonão natural fenilselenocisteína (Ver figura 1, estrutura 1) encontra uso com a invenção.
Derivados de: Da maneira aqui usada, o termo "derivados de" refere-se a umcomponente que é isolado feito usando uma molécula ou organismo especificado, ouinformação da molécula ou organismo especificado. Por exemplo, um polipeptídeo que éderivado de um segundo polipeptídeo pode incluir uma seqüência de aminoácidos que éidêntica ou substancialmente similar à seqüência de aminoácidos do segundo polipeptídeo.No caso de polipeptídeos, as espécies derivadas podem ser obtidas, por exemplo, pormutagênese de ocorrência natural, mutagênese artificial dirigida ou mutagênese artificialaleatória. A mutagênese usada para derivar polipeptídeos pode ser intencionalmente dirigidaou intencionalmente aleatória, ou um mistura de cada. A mutagênese de um polipeptídeopara criar um polipeptídeo diferente derivado do primeiro pode ser um evento aleatório (porexemplo, causado por infidelidade de polimerase) e a identificação do polipeptídeo derivadopode ser feita por métodos de classificação apropriados, por exemplo, da maneira aquidiscutida. Mutagênese de um polipeptídeo tipicamente implica na manipulação dopolinucleotídeo que codifica o polipeptídeo.
Marcador de seleção ou classificação positiva: Da maneira aqui usada, o termo"marcador de seleção ou classificação positiva" refere-se a um marcador que, quandopresente, por exemplo, expresso, ativado ou similares, resulta na identificação de umacélula, que compreende o trato, por exemplo, uma célula com o marcador de seleçãopositiva, daquelas sem o traço.
Marcador de seleção ou classificação negativa: Da maneira aqui usada, o termo"marcador de seleção ou classificação negativa" refere-se a um marcador que, quandopresente, por exemplo, expresso, ativado, ou similares, permite a identificação de umacélula que não compreende uma propriedade ou traço selecionados (por exemplo,comparado a uma célula que não possui a propriedade ou trato).
Reportador: Da maneira aqui usada, o termo "reportador" refere-se a umcomponente que pode ser usado para identificar e/ou selecionar componentes alvos de umsistema de interesse. Por exemplo, um reportador pode incluir uma proteína, por exemplo,uma enzima, que confere resistência ou sensibilidade a antibiótico (por exemplo, D-lactamase, cloranfenicol acetiltransferase (CAT), e similares), um marcador de classificaçãofluorescente (por exemplo, proteína fluorescente verde (por exemplo, (GFP), YFP, EGFP,RFP, etc.), um marcador Iuminescente (por exemplo, uma proteína da Iuciferase devagalume), uma afinidade baseada no marcador de classificação, ou genes marcadoresselecionáveis positivos ou negativos tais como IacZ, yff-gal/lacZ (/?-galactosidase), ADH(álcool deidrogenase), his3, ura3, Ieu2, Iis2, ou similares.
Eucarioto: Da maneira aqui usada, o termo "eucarioto" refere-se a organismospertencentes ao reino Eucarya. Eucariotos são de um modo geral distinguíveis deprocariotos por sua organização tipicamente multicelular (mas não exclusivamentemulticelular, por exemplo, levedura), a presença de um núcleo ligado na membrana e outrosorganelos ligados na membrana, material genético linear (isto é, cromossomos lineares), aausência de operons, a presença de introns, capeamento da mensagem e poli-A mRNA, eoutras características bioquímicas, tais como uma estrutura ribossomal distinguível.Organismos eucarióticos incluem, por exemplo, animais (por exemplo, mamíferos, insetos,répteis, pássaros, etc.), ciliatos, plantas (por exemplo, monocots, dicots, algas, etc.), fungo,levedura, flagelados, microsporidia, protista, etc.
Procarioto: Da maneira aqui usada, o termo "procarioto" refere-se a organismospertencentes ao reino Monera (também denominado Procarya). Organismos procarióticossão de um modo geral distinguíveis dos eucariotos por sua organização unicelular,reprodução assexuda por brotamento ou fissão, a falta de um núcleo ligado a membrana ououtros organelos ligados na membrana, um cromossomo circular, a presença de operons, aausência de introns, capeamento da mensagem e poli-A mRNA, e outras característicasbioquímicas, tal como uma estrutura ribossomal distinguível. Os Procarias incluem sub-reinos Eubactéria e Archaea (algumas vezes denominadas "Archaebacteria"). Cianobactéria(as algas azuis esverdeadas) e micoplasma são algumas vezes dados classificaçõesseparadas no Reino Monera.
Bactéria: Da maneira aqui usada, os termos "bactéria" e "eubactéria" referem-se aorganismos procarióticos que são distinguíveis da Archaea. Similarmente, Archaea refere-sea procariotos que são distinguíveis da eubactéria. Eubactéria e Archaea podem serdistinguidas por um número de critério morfológico e bioquímico. Por exemplo, diferençasnas seqüências de RNA ribossomais, estrutura polimerase RNA1 a presença ou ausência deintrons, sensibilidade a antibiótico, a presença ou ausência da parede celularpeptidoglicanos e outros componentes da parede celular, as estruturas ramificadas versusnão ramificadas de lipídios da membrana, e a presença/ausência de histonas e proteínastipo histona são usadas para projetar um organismo para Eubactéria ou Archaea.
Exemplos de Eubactérias incluem Escherichia coli, Thermus thermophilus, Bacillussubtilis e Baciilus stearothermophilus. Exemplo de Archaea incluem Methanococcusjannasehii (Mj)1 Methanosareina mazei (Mm), Methanobaeterium thermoautotrophieum (Mt),Methanoeoeeus maripaludis, Methanopyrus kandleri, Halobaeterium tais como Haloferaxvoleanii e Halobaeterium species NRC-I, Archaeoglobus fulgidus (AD, Pyroeoeeus furiosus(PD, Pyroeoeeus horikoshii (Ph), Pyrobaeulum aerophilum, Pyroeoeeus abyssi, Sulfolobussolfatarieus (Ss), Sulfolobus tokodaii, Aeuropyrum pernix (Ap), Thermoplasma aeidophilum eThermoplasma voleanium.
Variante conservativa: Da maneira aqui usada, o termo "variante conservativa", nocontexto de um componente de tradução, refere-se a um componente de tradução, porexemplo, uma variante conservativa O-RNAt ou uma variante conservativa O-RS, quedesempenha funcionalidade similar a um componente de base que a variante conservativa ésimilar, por exemplo, a um O-RNAt ou O-RS1 tendo variações na seqüência comparada a uma referência O-RNAt ou O-RS. Por exemplo, um O-RS1 ou uma variante conservativa deO-RS, aminoacilará um O-RNAt cognato com um aminoácido não naturalfenilselenocisteína. Neste exemplo, o O-RS e a variante conservativa O-RS não tem asmesmas seqüências de aminoácidos. A variante conservativa pode ter, por exemplo, umavariação, duas variações, três variações, quatro variações, ou cinco ou mais variações na seqüência, desde que a variante conservativa seja ainda complementar ao (por exemplo,função) cognato correspondente O-RNAt ou O-RS.
Em algumas modalidades, uma variante conservativa O-RS compreende um oumais substituições de aminoácido conservativas comparada ao O-RS do qual ele foiderivado. Em algumas modalidades, uma variante conservativa O-RS compreende uma oumais substituições de aminoácido conservativas comparada ao O-RS da qual ele foiderivado e, além disso, retém atividade biológica de O-RS; por exemplo, uma varianteconservativa O-RS que retém pelo menos 10 % da atividade biológica da molécula O-RS paida qual ela foi derivada ou, alternativamente, pelo menos 20 %, pelo menos 30 %, ou pelomenos 40 %. Em algumas modalidades preferidas, a variante conservativa O-RS retém pelomenos 50 % da atividade biológica da molécula O-RS pai da qual ela foi derivada. Assubstituições de aminoácido conservativas de uma variante conservativa O-RS pode ocorrer em qualquer domínio do O-RS, incluindo a bolsa de ligação de aminoácido.
Agente de seleção ou classificação: Da maneira aqui usada, o termo "agente deseleção ou classificação" refere-se a um agente que, quando presente, permiteseleção/classificação de certos componentes de uma população. Por exemplo, um agentede seleção ou classificação pode ser, mas sem limitações, por exemplo, um nutriente, um antibiótico, um comprimento de onda da luz, um anticorpo, um polinucleotídeo expresso, ousimilares. O agente de seleção pode ser variado, por exemplo, por concentração,intensidade, etc.
Em resposta a: Da maneira aqui usada, o termo "em resposta a" refere-se aoprocesso em que um O-RNAt da invenção reconhece um códon seletor e media aincorporação do aminoácido não natural, que é acoplado ao RNAt, na cadeia dopolipeptídeo em crescimento.
Codificar: Da maneira aqui usada, o termo "codificar" refere-se a qualquer processopelo qual a informação em uma macromolécula polimérica ou cadeia de seqüência é usadapara direcionar a produção de uma segunda molécula ou cadeia de seqüência que é diferente da primeira molécula ou cadeia de seqüência. Da maneira aqui usada, o termo éusado de forma geral, e pode ter uma variedade de aplicações. Em alguns aspectos, otermo "codificar" descreve o processo de replicação de DNA semiconservativo, onde umafita de uma molécula de DNA de fita dupla é usada como um molde para codificar uma fitairmã complementar sintetizada por um DNA polimerase DNA-dependente.
Em um outro aspecto, o termo "codificar" refere-se a qualquer processo pelo qual ainformação em uma molécula é usada para direcionar a produção de uma segunda moléculaque tem uma natureza química diferente da primeira molécula. Por exemplo, uma moléculade DNA pode codificar uma molécula de RNA (por exemplo, incorporar pelo processo detranscrição uma enzima de RNA polimerase DNA-dependente). Também, uma molécula deRNA pode codificar um polipeptídeo, como no processo de tradução. Quando usado paradescrever o processo de tradução, o termo "codificar" também estende-se ao códon tripleteque codifica um aminoácido. Em alguns aspectos, uma molécula de RNA pode codificaruma molécula de DNA, por exemplo, pelo processo de transcrição reversa que incorpora umDNA polimerase RNA-dependente. Em um outro aspecto, uma molécula de DNA pode codificar um polipeptídeo, onde entende-se que "codifica" na forma usada nesse casoincorpora tanto os processos de transcrição quanto de tradução.
DESCRIÇÃO RESUMIDA DAS FIGURASA figura 1 fornece as estruturas químicas do aminoácido não naturalfenilselenocisteína (estrutura 1) bem como estruturas que podem ser derivadas defenilselenocisteína. Estas estruturas incluem deidroalanina (2), palmitoilcisteína (3),famesilcisteína (4), S-hexadecilcisteína (5) e ácido gama-carboxiglutâmico (6).
A figura 2 fornece vários nucleotídeo e seqüências de aminoácidos que encontramuso com a invenção.
DESCRIÇÃO DETALHADA DA INVENÇÃO
A invenção fornece soluções para as limitações inerentes ao usa de um sistema detradução confinado pelos 20 aminoácidos de ocorrência natural. As soluções incluemcomposições e métodos relacionados a incorporação bio-sintética de sítio-específicoprogramada e o aminoácido não natural fenilselenocisteína (figura 1, estrutura 1) nasproteínas usando sistemas de tradução ortogonal. A incorporação de fenilselenocisteína naproteína pode ser programada para ocorrer em qualquer posição desejada pela engenhariado polinucleotídeo que codifica a proteína de interesse para conter um códon seletor quesinaliza a incorporação do aminoácido não natural na cadeia do polipeptídeo emcrescimento.
A invenção fornece composições inéditas incluindo novos aminoacil-RNAt sintetase(O-RS) que têm a capacidade de carregar um Cognato supressor O-RNAt adequado (porexemplo, o O-RNAt de SEQ ID NO: 1) com fenilselenocisteína. Estes O-RS são novosmutantes do Methanococcus jannaschii tirosil-RNAt sintetase que carregam seletivamente oO-RNAt com o aminoácido não natural fenilselenocisteína em células hospedeirasbacterianas. Mais preferivelmente, os componentes ortogonais não apresentam reaçãocruzada com componentes hospedeiros endógenos do maquinário translacional da célulahospedeira (por exemplo, uma célula E. coli).
O O-RS da invenção pode incluir o O-RS de SEQ ID NOS: 4, 6 ou 8. A invençãotambém fornece polinucleotídeos que codificam estes polipeptídeos. O presente revelaçãotambém descreve o metodologia para evolução dos pares de O-RNAtIO-RS inéditos quefuncionam na eubactéria para incorporar especificamente no sítio um aminoácido nãonatural fenilselenocisteína em resposta a códons seletores.
A invenção também fornece métodos para a incorporação genética e sítio-específico altamente eficiente de fenilselenocisteína (figura 1, estrutura 1) nas proteínas(preferivelmente in vivo) em resposta a um códon seletor (por exemplo, o códon não sentidoâmbar, TAG). Estes métodos e composições inéditos podem ser usados, por exemplo, emum sistema hospedeiro bacteriano.
Em alguns casos, o aminoácido não natural fenilselenocisteína pode em seguidaser de modo específico e regio-seletivamente modificados após sua incorporação em umpolipeptídeo, da maneira descrita na presente revelação. Em virtude da reação química dogrupo fenilseleno, proteínas nas quais o aminoácido não natural é incorporado podem sermodificadas com seletividade extremamente alta. Em alguns casos, grupo reativo deaminoácido não natural fenilselenocisteína tem a vantagem de ser completamente alienadoaos sistemas in vivo, melhorando dessa maneira a seletividade da reação. Em algunsaspectos, as reações de modificação podem ser conduzidas usando condições de reaçãorelativamente brandas que permitem reações de conjugação tanto in vitro quanto in vivoenvolvendo proteínas, e preservando disponibilidade da célula hospedeira e/ou atividadebiológica da proteína.
Em alguns aspectos, a fração de fenilselenocisteína incorporada é modificada, cujo produto modificado é em seguida um a um novamente modificado, por exemplo, por umareação de conjugação.
A natureza do material que é ultimamente conjugado na posição selecionada naproteína (correspondente ao códon seletor no quadro de leitura que codifica a proteína) nãoé particularmente limitada, e pode ser qualquer entidade desejada, por exemplo, lipídios, corantes, fluorforos, agentes de reticulação, derivados de sacarídeo, polímeros (porexemplo, derivados de polietileno glicol), fotoreticuladores, compostos citotóxicos,marcadores de afinidade, derivados de biotina, resinas, microesferas, uma segunda proteínaou polipeptídeo (ou mais), polinucleotídeo(s) (por exemplo, DNA, RNA, etc.), quelantes demetais, cofatores, ácidos graxos, carboidratos, e similares.
Em alguns aspectos, para demonstrar (mas não limitar) a presente invenção, arevelação descreve aqui a fração de aminoácido não natural fenilselenocisteína incorporadaem uma proteína modelo, por exemplo, mioglobina, hormônio do crescimento humano eGFP. Não se pretende que a incorporação do aminoácido não natural fenilselenocisteínaseja limitada a qualquer particular proteína. Deve ficar claro que a incorporação deaminoácido não natural fenilselenocisteína em qualquer proteína de interesse desejadapode ser realizada usando as diretrizes da presente revelação. A geração de proteínas quecompreendem um ou mais aminoácidos não naturais fenilselenocisteína (tanto sozinhasquanto em combinação com outros aminoácidos não naturais diferentes) é vantajosa comuma variedade de propósitos, por exemplo, para o uso em proteínas terapêuticas e compropósitos de pesquisa.
MODIFICAÇÃO DE FENILSELENOCISTEÍNA
Em alguns aspectos, a invenção fornece métodos para a modificação do resíduo deaminoácido fenilselenocisteína após sua incorporação em um polipeptídeo. Umamodificação como essa, por exemplo, clivagem oxidativa, pode converter beneficamente oresíduo de aminoácido fenilselenocisteína no aminoácido de deidroalanina a,/?-insaturado(Ver figura 1, estrutura 2). Este aminoácido de deidroalanina não natural é também reativo epode ser subseqüentemente modificado.19Não pretende-se que a invenção seja limitada a nenhum mecanismo particular (porexemplo, eliminação oxidativa) ou condições de reação específicas (por exemplo, exposiçãoao peróxido de hidrogênio) para a conversão de fenilselenocisteína em deidroalanina.Versados na tecnologia reconhecerão uma variedade de mecanismos e condições dereação alternativos adequados que encontram igual uso com a invenção para a conversãode um resíduo de fenilselenocisteína em deidroalanina.
MODIFICAÇÃO DE DEIDROALANINA
Em alguns aspectos, a invenção fornece métodos para modificação adicional de umresíduo de aminoácido de deidroalanina não natural em um polipeptídeo. O resíduo dedeidroalanina é reativo e pode ser alvejado em reações de modificação altamenteespecíficas. Estes métodos são especialmente usados na formação de lipídio conjugadopara produzir proteínas lipidadas.
Da maneira aqui descrita, reações de adição de Michael de deidroalanina doaminoácido não natural resultam em proteínas com modificações pós-translacionais sítio-específico programadas. Por exemplo, reação de deidroalanina com um tio-lipídio podegerar uma proteína lipidada. Por exemplo, reação com ácido tiopalmítico resulta empalmitoilcisteína (Ver figura 1, estrutura 3), reação com farnesilmercaptano produzfarnesilcisteína (Ver figura 1, estrutura 4), e reação com malonato produz ácido γ-carboxiglutâmico (Ver figura 1, estrutura 6). Além disso, reação com 1-hexadecanetiolresulta em S-hexadecilcisteína (Ver figura 1, estrutura 5).
Embora a presente especificação forneça estes exemplos, não se pretende que ainvenção seja limitada a qualquer mecanismo particular (por exemplo, um caminho adiçãode Michael) ou reagentes específicos (tio-lipídios) na modificação (conjugação) dedeidroalanina. Versados na tecnologia percebem uma variedade de mecanismosalternativos, condições de reação e reagentes adequados que encontram igual uso com ainvenção para a modificação do resíduo de deidroalanina. Certamente, modificação doresíduo de deidroalanina não é limitada a conjugação de lipídio, e este mecanismo deconjugação pode ser usado para conjugar qualquer fração desejada com o polipeptídeo nosítio de deidroalanina.
TECNOLOGIA DE RNAt/AMINOACIL-RNAt SlNTETASE ORTOGONALUm entendimento das composições inéditas e métodos da presente invenção exigeum entendimento das atividades associadas com pares de RNAt ortogonal e aminoacil-RNAtsintetase ortogonal. A fim de adicionar mais aminoácidos não naturais ao código genético,são necessários novos pares ortogonais compreendendo um aminoacil-RNAt sintetase e umRNAt adequado que possam funcionar eficientemente no maquinário translacionalhospedeiro, mas que sejam "ortogonais" ao sistema de tradução em questão, significandoque eles funcionam independentemente da sintetase e RNAts endógenos ao sistema detradução. Características desejadas do par ortogonal incluem RNAt que codifica oureconhece apenas um códon específico, por exemplo, um códon seletor, que não édecodificado por nenhum RNAt endógeno, e aminoacil-RNAt sintetase quepreferencialmente aminoacila (ou "carrega") seu cognato RNAt com apenas um aminoácido não natural específico. O O-RNAt também não é tipicamente aminoacilado (ou é fracamenteaminoacilado, isto é, carregado) por sintetase endógena. Por exemplo, em um sistemahospedeiro E. coli, um par ortogonal incluirá um aminoacil-RNAt sintetase que não reage deforma cruzada com nenhum um RNAt endógeno, por exemplo, que existem 40 em E. coli, eum RNAt ortogonal que não é aminoacilado por nenhuma das sintetases endógenas, por exemplo, das quais existem 21 em E. coli.
Os princípios gerais de sistemas de tradução ortogonal que são adequados parapreparar proteínas que compreendem um ou mais aminoácidos não naturais são conhecidosna tecnologia, tais como: os métodos gerais para produzir sistemas de tradução ortogonal.Por exemplo, ver International Publication Numbers WO 2002/086075, intitulado "METHODSAND COMPOSITION FOR THE PRODUTION OF ORTOGONAL AMINOACIL-RNAt RNAt-SYNTHETASE PAIRS", WO 2002/085923, intitulado "IN VIVO INCORPORATION OFUN NATURAL AMINO ACIDS", WO 2004/094593, intitulado "EXPANDING THEEUKARYOTIC GENETIC CODE", WO 2005/019415, depositado em 7 de Julho de 2004;WO 2005/007870, depositado em 7 de Julho de 2004; WO 2005/007624, depositado em 7 de Julho de 2004; e WO 2006/110182, depositado em 27 de outubro de 2005, intitulado"COMPONENTS OF TRANSLATION ORTOGONAL FOR THE IN VIVO INCORPORATIONOF UNNATURAL AMINO ACIDS". Cada uma dessas publicações está aqui incorporadapela referência na sua íntegra. Para discussão de sistemas de tradução ortogonal queincorporam aminoácidos não naturais, e métodos para sua produção e uso, Ver também, Wang and Schultz "Expanding the Genetic Code," Angewandte Chemie Int. Ed., 44(1):34-66(2005), Xie and Schultz, "A Expanding Genetic Code", Methods 36(3):227-238 (2005); Xieand Schultz, "Adding Amino acids to the Genetic Repertoire", Curr. Opinion in ChemicalBiology 9(6):548-554 (2005); Wang et ai, "Expanding the Genetic Code", Annu. Rev.Biophys. Biomoi Struct., 35:225-249 (2006); and Ryu and Schultz, Efficient Incorporation of Unnatural Amino Acids in" Proteins Escherichia coli", Nat. Methods (4):263-265 (2006), cujosconteúdos estão cada qual incorporados pela referência na sua íntegra.
SISTEMAS DE TRADUÇÃO ORTOGONAL
Sistemas de tradução ortogonal de um modo geral compreendem células (quepodem ser células procarióticas tal como E. coli) que incluem um RNAt ortogonal (O-RNAt),um aminoacil RNAt sintetase ortogonal (O-RS), e um aminoácido não natural, onde o O-RSaminoacila o O-RNAt com o aminoácido não natural. Um par ortogonal da invenção podeincluir um O-RNAt, por exemplo, um supressor RNAt, um deslocamento de quadro RNAt, ousimilares, e um Cognato 0-RS. Os sistemas ortogonais da invenção podem tipicamentecompreender pares O-RNAt/O-RS, tanto no contexto de uma célula hospedeira quanto sema célula hospedeira. Além dos sistemas multicomponentes, a invenção também fornececomponentes individuais inédito, por exemplo, polipeptídeos aminoacil-RNAt sintetaseortogonal inéditos (por exemplo, SEQ ID NO: 4, 6 ou 8), e os polinucleotídeos que codificamaqueles polipeptídeos (por exemplo, SEQ ID NO: 5, 7 ou 9).
Em geral, quando um par ortogonal reconhece um códon seletor e carrega umaminoácido em resposta ao códon seletor, diz-se que o par ortogonal "suprime" o códonseletor. Ou seja, um códon seletor que não é reconhecido pelo sistema de tradução (porexemplo, as células) maquinário endógeno não é ordinariamente carregado, que resulta embloqueio da produção de um polipeptídeo que de outra forma será traduzido do ácidonucléico. Em um par ortogonal sistema, o O-RS aminoacila o O-RNAt com um aminoácidonão natural específico. O O-RNAt carregado reconhece o códon seletor e suprime obloqueio translacional causado pelo códon seletor.
Em alguns aspectos, um O-RNAt da invenção reconhece um códon seletor e incluipelo menos cerca de, por exemplo, 45 %, a 50 %, a 60 %, a 75 %, a 80 %, ou a 90 % oumais eficiência de supressão na presença de uma sintetase cognata em resposta a umcódon seletor, comparada à eficiência de supressão de um O-RNAt que compreende oucodifica uma seqüência de polinucleotídeo apresentada nas listagens de seqüência aqui.
Em algumas modalidades, a eficiência de supressão do O-RS e o O-RNAt juntos écerca de, por exemplo, 5 vezes, 10 vezes, 15 vezes, 20 vezes, ou 25 vezes ou mais que aeficiência de supressão do O-RNAt que falta no O-RS. Em alguns aspectos, a eficiência desupressão do O-RS e o O-RNAt juntos é pelo menos cerca de, por exemplo, 35 %, 40 %, 45%, 50 %, 60 %, 75 %, 80 %, ou 90 % ou mais da eficiência de supressão de um parsintetase ortogonal como apresentado nas listagens de seqüência aqui.
A célula hospedeira usa o par O-RNAt/O-RS para incorporar o aminoácido nãonatural em uma cadeia do polipeptídeo em crescimento, por exemplo, por meio de um ácidonucléico que compreende um polinucleotídeo que codifica um polipeptídeo de interesse,onde o polinucleotídeo compreende um códon seletor que é reconhecido pelo O-RNAt. Emcertos aspectos preferidos, a célula pode incluir um ou mais pares de O-RNAt/ O-RSadicionais, onde o O-RNAt adicional é carregado pelo O-RS adicional com um aminoácidonão natural diferente. Por exemplo, um dos O-RNAts podem reconhecer um códon dequatro bases e o outro O-RNAt pode reconhecer um códon de parada. Alternativamente,múltiplos códons de parada diferentes ou múltiplos códons de quatro bases diferentespodem ser usados no mesmo ácido nucléico de codificação.
Conforme notado, em algumas modalidades, existem múltiplos pares de O-A/O-RSem uma célula ou outro sistema de tradução que permitem a incorporação de mais que umaminoácido não natural em um polipeptídeo. Por exemplo, a célula pode incluiadicionalmenter um par de O-RNAt/O-R diferente adicional e um segundo aminoácido nãonatural, onde este O-RNAt adicional reconhece um segundo códon seletor e este O-RSadicional preferencialmente aminoacila o O-RNAt com o segundo aminoácido não natural.
Por exemplo, uma célula que inclui um par de O-RNAt/O-R (onde o O-RNAt reconhece, porexemplo, um códon seletor fr âmbar), pode compreender adicionalmente um segundo parortogonal, onde o segundo O-RNAt reconhece um códon seletor diferente, por exemplo, umcódon opala, um códon de quatro bases, ou similares. Desejavelmente, os pares ortogonaisdiferentes são derivados de diferentes fontes, que podem facilitar reconhecimento dediferentes códons seletores.
Em certas modalidades, os sistemas compreendem uma célula tal como uma célulaE. coli que inclui um RNAt ortogonal (O-RNAt), um aminoacil- RNAt sintetase ortogonal(O-RS), um aminoácido não natural e um ácido nucléico que compreende umpolinucleotídeo que codifica um polipeptídeo de interesse, onde o polinucleotídeo compreende o códon seletor que é reconhecido pelo O-RNAt. O sistema de tradução podetambém ser um sistema sem célula, por exemplo, qualquer um de uma variedade desistemas de transcrição/tradução "in vitro" comercialmente disponíveis em combinação comum par de O-RNAt/O-R e um aminoácido não natural da maneira aqui descrita.
O O-RNAt e/ou o O-RS podem ser de ocorrência natural ou podem ser, por exemplo, derivados por mutação de um RNAt e/ou RS de ocorrência natural, por exemplo,gerando bibliotecas de RNAts e/ou bibliotecas de RSs, a partir de qualquer uma de umavariedade de organismos e/ou usando qualquer uma de uma variedade de estratégias demutação disponível. Por exemplo, uma estratégia para produzir um par de RNAtortogonal/aminoacil-RNAt sintetase envolve importar um par de RNAt/ sintetase heterólogo(para a célula hospedeira), por exemplo, de uma fonte a não ser a célula hospedeira, oumúltiplas fontes, na célula hospedeira. As propriedades do candidato a sintetase heterólogaincluem, por exemplo, que ele não carrega nenhuma célula hospedeira RNAt, e aspropriedades do candidato a RNAt heterólogo incluem, por exemplo, que eles não sãoaminoacilado por nenhuma célula hospedeira sintetase. Além disso, o RNAt heterólogo é ortogonal a todas células hospedeiras sintetase. A segunda estratégia para gerar um parortogonal envolve gerar bibliotecas mutantes das quais se classifica e/ou seleciona um O-RNAt ou O-RS. Estas estratégias podem também ser combinadas.
RNAt ORTOGONAL (O-RNAt)
Um RNAt ortogonal (O-RNAt) da invenção desejavelmente media a incorporação deum aminoácido não natural em uma proteína que é codificada por um polinucleotídeo quecompreende um códon seletor que é reconhecido pelo O-RNAt, por exemplo, in vivo ou invitro. Em certas modalidades, um O-RNAt da invenção inclui pelo menos cerca de, porexemplo, um 45 %, a 50 %, a 60 %, a 75 %, a 80 %, ou a 90 % ou mais eficiência desupressão na presença de uma sintetase cognata em resposta a um códon seletorcomparado a um O-RNAt compreendendo ou codificado por uma seqüência depolinucleotídeos tal como apresentada nas seqüências O-RNAt nas listagens de seqüênciaaqui.
A eficiência de supressão pode ser determinada por qualquer dos diversos ensaiosconhecidos na tecnologia. Por exemplo, um ensaio reportador /?-galactosidase pode serusado, por exemplo, um plasmídeo IacZ derivatizado (onde a construção tem um códonseletor na seqüência de ácido nucléico IacZ) é introduzida nas células de um organismoapropriado (por exemplo, um organismo onde os componentes ortogonais podem serusados) junto com plasmídeo que compreende um O-RNAt da invenção. Uma sintetasecognata pode também ser introduzida (tanto como um polipeptídeo quanto como umpolinucleotídeo que codifica uma sintetase cognata quando expressa). As células crescemem meio até uma densidade desejada, por exemplo, até um OD6oo de cerca de 0,5, eensaios de /?-galactosidase são realizados, por exemplo, usando o estojo de ensaio BetaFluor™ /ff-Galactosidase (Novagen). Supressão percentual pode ser calculada como aporcentagem de atividade para uma amostra com relação a um controle comparável, porexemplo, o valor observado da construção IacZ derivatizada, onde a construção tem umcódon sentido correspondente na posição desejada em vez de um códon seletor.
Exemplos de O-RNAts da invenção são apresentados nas listagens de seqüênciaaqui, por exemplo, ver figura 2 e SEQ ID NO: 1. A revelação também fornece aquiorientação para o projeto de espécies O-RNAt equivalentes adicionais. Em uma molécula deRNA, tais como uma molécula O-RS mRNA, ou O-t RNA, timina (T) é substituída comuracila (U) com relação a uma dada seqüência (ou vice-versa para um DNA codificado), ou complemento destes. Modificações adicionais para as bases podem também estarpresentes para gerar moléculas equivalentes funcionalmente em grande medida.
A invenção também engloba variações conservativas de O-RNAts correspondentesaos O-RNAts particulares aqui. Por exemplo, variações conservativas de O-RNAt incluemaquelas moléculas que funcionam como os O-RNAts particulares, por exemplo, como naslistagens de seqüência aqui e que mantém a estrutura RNAt em forma de L em virtude daauto-complementaridade apropriada, mas que não tem uma seqüência idêntica a esta, porexemplo, na seqüência listada ou figura 2 e, desejavelmente, são moléculas sem ser asmoléculas de RNAt tipo selvagem.
A composição compreendendo um O-RNAt pode incluir adicionalmente umaminoacil-RNAt sintetase ortogonal (O-RS), onde o O-RS preferencialmente aminoacila o O-RNAt com um aminoácido não natural. Em certas modalidades, uma composição incluindoum O-RNAt pode inclui adicionalmenter um sistema de tradução (por exemplo, in vitro ou invivo). Um ácido nucléico que compreende um polinucleotídeo que codifica um polipeptídeode interesse, onde o polinucleotídeo compreende um códon seletor que é reconhecido peloO-RNAt1 ou uma combinação de um ou mais desses pode também estar presente na célula.
Métodos de produzir um RNAt ortogonal (O-RNAt) são também um recurso dainvenção. Um O-RNAt produzido pelo método é também uma recurso da invenção. Emcertas modalidades da invenção, os O-RNAts podem ser produzidos gerando uma bibliotecade mutantes. A biblioteca de RNAts mutantes pode ser gerada usando várias técnicas demutagênese conhecidas na tecnologia. Por exemplo, os RNAts mutantes podem sergerados pelas mutações de sítio-específico, mutações de ponto aleatório, recombinaçãohomóloga, embaralhamento de DNA ou outros métodos de mutagênese recursivos,construções quiméricas ou qualquer combinação destes, por exemplo, do O-RNAt de SEQID NO: 1.
Mutações adicionais podem ser introduzidas em posição(s) específica(s), porexemplo, em posição(s) não conservativa(s), ou em uma posição conservativa, em uma(s)posição(s) aleatória(s), ou uma combinação de ambos em um laço ou região desejada deum RNAt, por exemplo, um alça anticódon, o braço aceptor, braço ou alça D, alça variável,braço ou alça TPC, outras regiões da molécula de tRNA, ou uma combinação destes.Tipicamente, mutações em um RNAt incluem mutação do laço anticódon de cada membroda biblioteca de mutantes RNAts para permitir o reconhecimento de um códon seletor. Ométodo pode inclui adicionalmenter adicionar mais seqüências ao O-RNAt. Tipicamente, umO-RNAt possui uma melhoria de ortogonalidade para um organismo desejado comparado aomaterial de partida, por exemplo, a pluralidade de seqüências de RNAt, preservando aindasua afinidade no sentido de um RS desejado.
Os métodos opcionalmente incluem analisar a similaridade (e/ou homologiainferida) de seqüências de RNAts e/ou aminoacil-RNAt sintetase para determinar candidatospotenciais para um O-RNAt, O-RS e/ou seus pares, que parecem ser ortogonais a umorganismo específico. Programas computadorizados conhecidos na tecnologia e aquidescritos podem ser usados para a análise, por exemplo, programas BLAST e deempilhamento podem ser usados. Em um exemplo, para escolher componentestranslacionais ortogonais potenciais para o uso em E. coli, é escolhida uma sintetase e/ouum RNAt que não apresenta similaridade de seqüência próxima com os organismoseubacterianos.
Tipicamente, um O-RNAt é obtido submetendo, por exemplo, a seleção negativauma população de células de uma primeira espécie, onde as células compreendem ummembro da pluralidade de O-RNAts potenciais. A seleção negativa elimina células quecompreendem um membro de bibliotecas de O-RNAts potenciais que é aminoacilado por umaminoacil-RNAt sintetase (RS) que é endógeno à célula. Isto fornece um agrupamento deRNAts que são ortogonais à célula da primeira espécie.
Em certas modalidades, na seleção negativa, um(s) códon(s) seletor(s) é(são)introduzido(s) em um polinucleotídeo que codifica um marcador de seleção negativa, porexemplo, uma enzima que confere resistência a antibiótico, por exemplo, /Mactamase, umaenzima que confere um produto detectável, por exemplo, /?-galactosidase, cloranfenicolacetiltransferase (CAT), por exemplo, um produto tóxico, tal como barnase, em uma posiçãonão essencial (por exemplo, produzindo ainda um barnase funcional), etc.Classificação/seleção é opcionalmente feita crescendo a população de células na presençade um agente seletivo (por exemplo, um antibiótico, tal como ampicilina). Em uma modalidade, a concentração do agente de seleção é variada.
Por exemplo, para medir a atividade de RNAts supressores, é usado um sistema deseleção que é baseado na supressão in vivo de códon seletor, por exemplo, mutações nãosentido (por exemplo, parada) ou deslocamento de quadro introduzidas em umpolinucleotídeo que codifica um marcador de seleção negativa, por exemplo, um gene para /ff-lactamase (bla). Por exemplo, variantes de polinucleotídeo, por exemplo, variantes bla,com um códon seletor em uma certa posição (por exemplo, A184), são construídos. Células,por exemplo, bactérias, são transformadas com estes polinucleotídeos. No caso de umRNAt ortogonal, que não pode ser eficientemente carregado por sintetase de E. coliendógena, a resistência a antibiótico, por exemplo, resistência a ampicilina, deve ser aproximadamente igual ou menor que aquela para uma bactérias transformadas semplasmídeo. Se o RNAt não é ortogonal, ou se um sintetase heteróloga capaz de carregar oRNAt é co-expresso no sistema, um maior nível de antibiótico, por exemplo, resistência aampicilina, é observado. Células, por exemplo, bactérias, são escolhidas que são incapazesde crescer em placas ágar LB com concentrações de antibiótico aproximadamente iguais às das células transformadas sem plasmídeos.
No caso de um produto tóxico (por exemplo, ribonuclease ou barnase), quando ummembro da pluralidade de RNAts potenciais é aminoacilado pelo hospedeiro endógeno, porexemplo, sintetase de Escherichia coli (isto é, ele não é ortogonal ao hospedeiro, porexemplo, Escherichia coil sintetase), o códon seletor é suprido e o produto polinucleotídeo tóxico produzido leva à morte celular, células que abrigam RNAt ortogonais ou RNAts nãofuncionais sobrevivem.
Em uma modalidade, o agrupamento de RNAts que são ortogonais a um organismodesejado é em seguida submetido a uma seleção positiva na qual um códon seletor écolocado em um marcador de seleção positiva, por exemplo, codificado por um gene de resistência a medicamento, um gene jff-lactamase como esse. A seleção positiva é realizadaem uma célula compreendendo um polinucleotídeo que codifica ou que compreende ummembro de agrupamentos de RNAts que são ortogonais a célula, um polinucleotídeo quecodifica um marcador de seleção positiva, e um polinucleotídeo que codifica um RS cognato.Em certas modalidades, a segunda população de células compreende células que nãoforam eliminadas pela seleção negativa. Os polinucleotídeos são expressos na célula e acélula cresce na presença de um agente de seleção, por exemplo, ampicilina. RNAts são emseguida selecionados por sua capacidade de ser aminoacilado pela sintetase cognata co-expressa e de inserir um aminoácido em resposta a este códon seletor. Tipicamente, estascélulas mostram uma melhoria na eficiência de supressão, comparadas às células queabrigam RNAt(s), ou RNAts não funcionais que podem não ser eficientemente reconhecidospela sintetase de interesse. Uma célula que abrigam o RNAts ou RNAts não funcionais quenão são eficientemente reconhecidos pela sintetase de interesse, são sensíveis aoantibiótico. Portanto, RNAts que: (i) não são substratos para hospedeiro endógeno, porexemplo, Escherichia coli, sintetase; (ii) podem ser aminoacilados pela sintetase deinteresse; e (iii) são funcionais em tradução, sobrevivem a ambas seleções.
Conseqüentemente, o mesmo marcador pode ser tanto um marcador positivo quanto negativo, dependendo do contexto no qual ele é classificado. Isto é, o marcador éum marcador positivo se ele for classificado, mas um marcador negativo se desclassificado.
O rigor da seleção, por exemplo, a seleção positiva, a seleção negativa, ou tanto aseleção positiva quanto negativa, nos métodos supradescritos opcionalmente inclui variar origor da seleção. Por exemplo, em virtude da barnase ser uma proteína extremamentetóxica, o rigor da seleção negativa pode ser controlado introduzindo diferentes números decódons seletores no gene barnase e/ou usando um promotor indutível. Em um outroexemplo, a concentração do agente de seleção ou classificação é variada (por exemplo,concentração de ampicilina). Em alguns aspectos da invenção, o rigor varia em virtude de aatividade desejada poder ser baixa durante as etapas iniciais. Assim, critérios de seleçãomenos rigorosos são aplicados em etapas iniciais e critérios mais rigorosos são aplicadosem etapas finais de seleção. Em certas modalidades, a seleção negativa, a seleção positiva,ou tanto a seleção negativa quanto a positiva podem ser repetidas múltiplas vezes. Múltiplosdiferentes marcadores de seleção negativa, marcadores de seleção positiva, ou tantoseleção negativa quanto marcadores positivos podem ser usados. Em certas modalidades, omarcador de seleção positiva e negativa pode ser o mesmo.
Outros tipos de seleções/classificação podem ser usados na invenção para produzircomponentes translacionais ortogonais, por exemplo, um O-RNAt1 um O-RS, e um par de O-RNAt/O-R que carrega um aminoácido não natural em resposta a um códon seletor. Porexemplo, o marcador de seleção negativa, o marcador de seleção positiva, ou tanto os marcadores de positiva quanto negativa podem incluir um marcador que fluoresce oucatalisa um reação Iuminescente na presença de um reagente adequado. Em uma outramodalidade, um produto do marcador é detectado por avaliação da emissão defluorescência das células (FACS) ou por luminescência. Opcionalmente, o marcador incluiuma afinidade baseada no marcador de classificação. Ver também, Francisco, J. A., et ai,(1993) Prodution and fluorescence-activated cell sorting of Escherichia coli expressing afuncional antibody fragment on the externai surface. Proc Natl Acad Sci USA. 90:10444-8.
Métodos adicionais para produzir um RNAt ortogonal recombinante podem serencontrados, por exemplo, nas publicações de pedido de patente internacionais WO2002/086075, intitulado "METHODS AND COMPOSITIONS FOR THE PRODUTUION OFORTOGONAL RNAt SYNTHETASE AMINOACYL-RNAt PAIRS", WO 2004/094593,intitulado "EXPANDING THE EUKARYOTIC GENETIC CODE GENETIC" e WO2005/019415, depositado em 7 de julho de 2004. Ver também Forster et ai, (2003)Programming peptidomimetic sintetase by translating genetic codes designed de novo PNAS100(11 ):6353-6357, e, Feng et ai, (2003), Expanding RNAt recognition of a RNAt sintetasefor the single amino acid change, PNAS 100(10): 5676-5681.
AMINOACIL-RNAt SINTETASE ORTOGONAL (O-RS)
Um O-RS da invenção preferencialmente aminoacila um O-RNAt com umaminoácido não natural, in vitro ou in vivo. Um O-RS da invenção pode ser fornecido aosistema de tradução, por exemplo, uma célula, por um polipeptídeo que inclui um O-RS e/oupor um polinucleotídeo que codifica um O-RS ou uma porção destes. Por exemplo, umexemplo O-RS compreende uma seqüência de aminoácidos apresentada em SEQ ID NO: 4,6 ou 8, ou um variação conservativa destes. Em um outro exemplo, um O-RS1 ou umaporção deste, é codificado por uma seqüência de polinucleotídeos que codifica umaminoácido que compreende a seqüência na lista ou exemplos de seqüência aqui, ou umaseqüência de polinucleotídeos complementar desta. Ver, por exemplo, o polinucleotídeo deSEQ ID NO: 5, 7 ou 9.
Métodos para identificar um aminoacil-RNAt sintetase ortogonal (O-RS), porexemplo, um O-RS, para uso com um O-RNAt, são também um recurso da invenção. Porexemplo, um método inclui submeter à seleção, por exemplo, seleção positiva, umapopulação de células de uma primeira espécie, onde as células individualmentecompreendem: 1) um membro de pluralidade de aminoacil-RNAt sintetase (RSs), (porexemplo, a pluralidade de RSs pode incluir RSs mutante e RSs derivados de uma espécie anão ser a primeira espécie, ou tanto RSs mutantes quanto RSs derivados de uma espécie anão ser a primeira espécie); 2) o RNAt ortogonal (O-RNAt) (por exemplo, de uma ou maisespécies); e 3) um polinucleotídeo que codifica um marcador de seleção (por exemplo,positivo) e compreende pelo menos um códon seletor. Células são selecionadas ouclassificadas em relação àquelas que apresentam uma melhoria na eficiência de supressão,comparadas com células não têm, ou que têm uma quantidade reduzida do membro dapluralidade de RSs. A eficiência de supressão pode ser medida por técnicas conhecidas natecnologia e da maneira aqui descrita. Células tendo uma melhoria na eficiência desupressão compreendem um RS ativo que aminoacila o O-RNAt. Um nível de aminoacilação(in vitro ou in vivo) pelo RS ativo de um primeiro conjunto de RNAts da primeira espécie écomparado com o nível de aminoacilação (in vitro ou in vivo) pelo RS ativo de um segundoconjunto de RNAts da segunda espécie. O nível de aminoacilação pode ser determinado poruma substância detectável (por exemplo, um aminoácido marcado não natural). O RS ativoque aminoacila mais eficientemente o segundo conjunto de RNAts comparado ao primeiroconjunto de RNAts é tipicamente selecionado, fornecendo dessa maneira um aminoacil-RNAt sintetase ortogonal eficiente (otimizada) para uso com o O-RNAt. Um O-RS1 identificado pelo método, é também uma recurso da invenção.
Qualquer dos diversos ensaios pode ser usado para determinar aminoacilação.Estes ensaios podem ser realizados in vitro ou in vivo. Por exemplo, ensaios deaminoacilação in vitro são descritos, por exemplo, em Hoben and Soil (1985) MethodsEnzvmol. 113:55-59. Aminoacilação pode também ser determinada usando um reportadorjunto com componentes de tradução ortogonal e detectando o reportador em uma célula queexpressa um polinucleotídeo compreendendo pelo menos um códon seletor que codificauma proteína. Ver também, WO 2002/085923, intitulado "IN VIVO INCORPORATION OFUNNATURAL AMINO ACIDS", e WO 2004/094593, intitulado "EXPANDING THEEUKARYOTIC GENETIC CODE".
O O-RS identificado pode ser manipulado adicionalmente para alterar aespecificidade do substrato da sintetase, de maneira que apenas um aminoácido não naturaldesejado, mas não qualquer dos 20 aminoácidos comuns, seja carregado no O-RNAt.Métodos para gerar um aminoacil-RNAt sintetase ortogonal com uma especificidade desubstrato para um aminoácido não natural incluem na mutação da sintetase, por exemplo,no sítio ativo na sintetase, no sítio de mecanismo de edição na sintetase, nos diferentessítios combinando diferentes domínios de sintetase, ou similares, e na aplicação de umprocesso de seleção. Uma estratégia é usada, que é baseada na combinação de umaseleção positiva seguida por uma seleção negativa. Na seleção positiva, supressão docódon seletor introduzido em uma posição não essencial(s) de um marcador positivo permiteque a células sobreviva sob pressão de seleção positiva. Na presença tanto de aminoácidosnaturais quanto não naturais, sobreviventes assim codificam sintetase ativa carregando osupressor RNAt ortogonal tanto com um aminoácido natural quanto não natural. Na seleçãonegativa, supressão de um códon seletor introduzida em uma posição não essencial(s) deum marcador negativo remove especificidades de sintetase com aminoácido natural.Sobreviventes da seleção negativa e positiva codificam sintetase que aminoacila (carrega) oortogonal supressor RNAt seleção apenas com aminoácidos não naturais. Esta sintetasepode em seguida ser submetida a mutagênese adicional, por exemplo, embaralhamento deDNA ou outros métodos de mutagênese recursivos.
Uma biblioteca de O-RSs mutantes pode ser gerada usando várias técnicas demutagênese conhecidas na tecnologia. Por exemplo, os RSs mutantes podem ser geradospor mutações de sítio-específico, mutações de ponto aleatório, recombinação homóloga, embaralhamento de DNA ou outros métodos de mutagênese recursiva, construçõesquiméricas ou qualquer combinação destes. Por exemplo, uma biblioteca de RSs mutantespode ser produzida, por exemplo, de duas ou mais outras "sub-bibliotecas" menores, menosdiversas. Bibliotecas quiméricas de RSs estão também incluídas na invenção. Deve-se notarque bibliotecas de RNAt sintetase de vários organismos (por exemplo, microorganismos tais como eubactéria ou archaebacteria) tal como bibliotecas que compreendem diversidadenatural (Ver, por exemplo, patente U.S. No. 6.238.884 de Short et al, patente U.S. No.5.756.316 de Schallenberger et al; patente U.S. No. 5.783.431 de Petersen et al, patenteU.S. No. 5.824.485 de Thompson et al, patente U.S. No. 5.958.672 de Short et al), sãoopcionalmente construídas e classificadas pelos pares ortogonais.
Uma vez que a sintetase é submetida a estratégia de seleção/classificação positivae negativa, esta sintetase pode em seguida ser submetida a mutagênese adicional. Porexemplo, um ácido nucléico que codifica o O-RS pode ser isolado; um conjunto depolinucleotídeos que codifica O-RSs mutado (por exemplo, por mutagênese aleatória,mutagênese de sítio-específico, recombinação ou qualquer combinação destes) pode sergerado do ácido nucléico; e estas etapas individuais ou uma combinação destas etapas,podem ser repetidas até que um O-RS mutado seja obtido, que preferencialmenteaminoacila o O-RNAt com o aminoácido não natural. Em alguns aspectos da invenção, asetapas são realizadas múltiplas vezes, por exemplo, pelo menos duas vezes.
Níveis adicionais de rigor de seleção/classificação podem também ser usados nos métodos da invenção, para produzir O-RNAt1 O-RS, ou seus pares. O rigor de seleção ouclassificação pode variar em uma ou ambas etapas do método para produzir um O-RS. Istopode incluir, por exemplo, variar a quantidade de agente de seleção/classificação que éusada, etc. Etapas adicionais de seleções positivas e/ou negativas podem também serrealizadas. Seleção ou classificação pode também compreender uma ou mais de uma mudança na permeabilidade do aminoácido, uma mudança na eficiência de tradução, umamudança na fidelidade translacional, etc. Tipicamente, uma ou mais mudança é baseada emuma mutação em um ou mais gene em um organismo no qual um par de RNAt ortogonal-RNAt sintetase é usado para produzir proteína.
Detalhes gerais adicionais para produzir O-RS e alterar a especificidade do substrato da sintetase podem ser encontrados em Publicação internacional WO2002/086075, intitulado "METHODS AND COMPOSITIONS FOR THE PRODUTION OFORTOGONAL RNAt SINTETASE AMINOACIL-RNAt PARES", e WO 2004/094593, intitulado"EXPANDING THE EUKARYOTIC GENETIC CODE". Ver também, Wang and Schultz"Expanding the genetic Code", Angewandte Chemie Int. Ed., 44(1):34-66 (2005), cujosconteúdos estão aqui incorporados pela referência nas suas íntegras.
ORGANISMOS FONTES E HOSPEDEIROS
Os componentes translacionais ortogonais (O-RNAt e O-RS) da invenção podemser derivados de qualquer organismo (ou uma combinação de organismos) para uso em umsistema hospedeiro de tradução de qualquer outra espécie, com a condição de que oscomponentes O-RNAt/O-RS e o sistema hospedeiro funcionem de uma maneira ortogonal.Não é uma exigência que o O-RNAt e o O-RS de um par ortogonal sejam derivados do mesmo organismo. Em alguns aspectos, os componentes ortogonais são derivados degenes Archaea (isto é, archaebacteria) para uso em um sistema hospedeiro eubacteriano.
Por exemplo, o O-RNAt ortogonal pode ser derivado de um organismo Archae, porexemplo, um archaebacterium, tais como Methanococcus jannaschii, Methanobacteriumthermoautotrophieum, Halobaeterium tais como Haloferax voleanii e Halobaeterium espécieNRC-1, Archaeoglobus fulgidus, Pyroeoceus furiosus, Pyroeoeeus horikoshii, Aeuropyrumpernix, Methanoeoeeus maripaludis, Methanopyrus kandleri, Methanosareina mazei (Mm),Pyrobaeulum aerophilum, Pyroeoeeus abyssi, Sulfolobus solfatarieus (Ss), Sulfolobustokodaii, Thermoplasma aeidophilum, Thermoplasma voleanium, ou similares, ou umeubactéria, tais como Eseheriehia eoli, Thermus thermophilus, Bacillus subtilis, Bacillusstearothermphilus, ou similares, Enquanto o O-RS ortogonal pode ser derivado de umorganismo ou combinação de organismos, por exemplo, um archaebacterium, tais comoMethanoeoeeus jannaschii, Methanobaeterium thermoautotrophieum, Halobaeterium taiscomo Haloferax voleanii e Halobaeterium espécie NRC-1, Archaeoglobus fulgidus,Pyroeoeeus furiosus, Pyroeoeeus horikoshii, Aeuropyrum perniz, Methanoeoeeusmaripaludis, Methanopyrus kandleri, Methanosareina mazei, Pyrobaeulum aerophilum,Pyroeoeeus abyssi, Sulfolobus solfatarieus, Sulfolobus tokodaii, Thermoplasma aeidophilum,Thermoplasma voleanium, ou similares, ou uma eubactéria, tais como Eseheriehia eoli,Thermus thermophilus, Bacillus subtilis, Bacillus stearothermphilus, ou similares. Em umamodalidade, fontes eucarióticas, por exemplo, plantas, algas, protista, fungo, levedura,animais (por exemplo, mamíferos, insetos, arthropods, etc.), ou similares, podem tambémser usadas como fontes de O-RNAts e O-RSs.
Os componentes individuais de um par de O-RNAt/O-R podem ser derivados domesmo organismo ou de organismos diferentes. Em uma modalidade, o par de O-RNAt/O-Ré do mesmo organismo. Alternativamente, o O-RNAt e o O-RS do par de O-RNAt/O-R são de organismos diferentes.
O O-RNAt, O-RS ou o par O-RNAt/O-R podem ser selecionados ou classificados invivo ou in vitro e/ou usados em uma célula, por exemplo, uma célula eubacteriana, paraproduzir um polipeptídeo com um aminoácido não natural. Uma célula eubacteriana usadanão é limitada, por exemplo, Escherichia coli, Thermus thermophilus, Bacillus subtilis,Bacillus stearothermphilus, ou similares. Composições de células eubacterianas quecompreende componentes translacionais da invenção são também um recurso da invenção.
Ver também, publicação de pedido de patente internacional 2004/094593, intitulado"EXPANDING THE EUKARYOTIC GENETIC CODE", depositado em 16 de abril de 2004,para classificar O-RNAt e/ou O-RS em uma espécie para uso em uma outra espécie.
Embora sistemas de tradução ortogonal (por exemplo, compreendendo um O-RS,um O-RNAt e um aminoácido não natural) possam utilizar células hospedeiras cultivadaspara produzir proteínas tendo aminoácidos não naturais, não pretende-se que um sistemade ORTOGONAL TRANSLATION da invenção exija uma célula hospedeira intacta viável.Por exemplo, um sistema de ORTOGONAL TRANSLATION pode utilizar um sistema semcélula na presença de um extrato da célula. Realmente, o uso de transcrição/sistemas semcélula in vitro, de tradução para produção de proteína é uma técnica bem estabelecida. Aadaptação destes sistemas in vitro para produzir proteínas tendo aminoácidos não naturaisusando sistema de componente de translações ortogonais aqui descritos está bem noescopo da invenção.
CÓDONS SELETORES
Códons seletores da invenção expandem a estrutura do códon genético domaquinário bio-sintético da proteína. Por exemplo, um códon seletor inclui, por exemplo, umcódon de três bases exclusive, um códon não sentido, tal como um códon de parada, porexemplo, um códon âmbar (UAG), ou um códon opala (UGA), um códon não natural, pelomenos um códon de quatro bases, um códon raro, ou similares. Inúmeros códons seletorespodem ser introduzidos em um gene desejado, por exemplo, um ou mais, dois ou mais, mais que três, etc. Usando códons seletores diferentes, múltiplos pares RNAt ortogonal/sintetasepodem ser usado que permitem a incorporação sítio-específico simultânea de múltiplosaminoácidos não naturais por exemplo, incluindo pelo menos um aminoácido não natural,usando estes diferentes códons seletores.
Em uma modalidade, os métodos envolvem o uso de um códon seletor que é umcódon de parada para a incorporação de um aminoácido não natural in vivo em uma célula.Por exemplo, um O-RNAt é produzido que reconhece o códon de parada e é aminoaciladopor um O-RS com um aminoácido não natural. Este O-RNAt não é reconhecido pelaaminoacil-RNAt sintetase do hospedeiro de ocorrência natural. Mutagênese de sítio dirigidoconvencional pode ser usado para introduzir o códon de parada no sítio de interesse em um polinucleotídeo que codifica um polipeptídeo de interesse. Ver, por exemplo, Sayers, J.R., etal. (1988), 5',3' Exonuclease in phosphorotioate-based oligonucleotídeo-directedmutagenesise. Nucleic Acids Res. 791-802. Quando o O-RS, O-RNAt e o ácido nucléico quecodifica um polipeptídeo de interesse são combinados, por exemplo, in vivo, o aminoácidonão natural é incorporado em resposta ao códon de parada para dar um polipeptídeocontendo o aminoácido não natural na posição especificada. Em uma modalidade dainvenção, o códon de parada usado como um códon seletor é um códon âmbar, UAG, e/ouum códon opala, UGA. Em um exemplo, um código genético no qual UAG e UGA sãoambos usados como um códon seletor pode codificar 22 aminoácidos preservando ainda ocódon não sentido ocre, UAA, que é o sinal de terminação mais abundante.
A incorporação de aminoácidos não naturais in vivo pode ser feita sem perturbaçãosignificativa da célula hospedeira. Por exemplo, em células não eucarióticas, tal como Escherichia coli, em virtude da eficiência de supressão para o códon UAG depender dacompetição entre o O-RNAt, por exemplo, o supressor âmbar de RNAt, e do fator 1 deliberação (RF1) (que se liga ao códon UAG e inicia a liberação do peptídeo de crescimentodo ribossomo), a eficiência de supressão pode ser modulada, por exemplo, tantoaumentando o nível de expressão de O-RNAt1 por exemplo, o supressor RNAt, quantousando uma cepa deficiente em RF1. Em células eucarióticas, em virtude da eficiência desupressão com o códon UAG depender da competição entre o O-RNAt, por exemplo, osupressor âmbar de RNAt, e um fator de liberação eucariótica (por exemplo, eRF) (que ligaa um códon de parada e inicia a liberação do peptídeo de crescimento do ribossomo), aeficiência de supressão pode ser modulada, por exemplo, aumentando a nível de expressão de O-RNAt, por exemplo, o supressor RNAt. Além disso, compostos adicionais podemtambém estar presentes, por exemplo, agentes de redução tal como ditiotretiol (DTT).
Aminoácidos não naturais podem também ser codificados com códons raros. Porexemplo, quando a concentração de arginina em uma reação de síntese de proteína in vitroé reduzido, o códon de arginina raro, AGG, demonstrou ser eficiente para inserção de Ala por um RNAt sintético acilado com alanina. Ver, por exemplo, Ma et ai, Biochemistry.32:7939 (1993). Neste caso, o RNAt sintético compete com o RNAt*'9 de ocorrência natural,que existe como uma espécie secundária em Escherichia coli. Além disso, algunsorganismos não usam todos os códons triplete. Um códon AGA não projetado emMicrococcus Iuteus foi utilizado para inserção de aminoácidos em um extrato transcrição/tradução in vitro. Ver, por exemplo, Kowal e OIiVer1 Nucl. Ácido. Res., 25:4685(1997). Componentes da invenção podem ser gerados para usar esses códons raros in vivo.
Códons seletores podem também compreender códons estendidos, por exemplo,códons de quatro ou mais bases, tais como, códons de quatro, cinco, seis ou mais bases.Exemplos de códons de quatro bases incluem, por exemplo, AGGA, CUAG, UAGA, CCCU,e similares. Exemplos de códons de cinco bases incluem, por exemplo, AGGAC, CCCCU,CCCUC, CUAGA, CUACU, UAGGC e similares. Métodos da invenção incluem usar códonsestendidos baseado na supressão de deslocamento de quadro. Códons de quatro ou maisbases podem inserir, por exemplo, um ou múltiplos aminoácidos não naturais, na mesmaproteína. Em outras modalidades, as alças anticódon podem decodificar, por exemplo, pelomenos um códon de quatro bases, pelo menos um códon de cinco bases, ou pelo menosum códon de seis bases ou mais. Subseqüentemente, existem 256 códons de quatro basespossíveis, múltiplos aminoácidos não naturais podem ser codificados na mesma célulausando um códon de quatro ou mais bases. Ver também, Anderson et al., (2002) Exploringthe Limits of Codon and Anticodon Size, Chemistrv and Bioloqy, 9:237-244, e Magliery,(2001) Expanding the genetic Code: Seiection of Efficient Suppressors ofFour-base Codonsand Identifition of "Shifty" Four-base Codons whiht a Library Approach in Eseheriehia eoli, J.Mol. Biol. 307: 755-769.
Por exemplo, códons de quatro bases têm sido usados para incorporar aminoácidosnão naturais nas proteínas usando métodos bio-sintéticos in vitro. Ver, por exemplo, Ma etal., (1993) Biochemistrv. 32:7939; e Hohsaka et al., (1999) J. Am. Chem. Soc.. 121:34.CGGG e AGGU foram usados para incorporar simultaneamente 2-naftilalanina e um NBDderivado de Iisina em estreptavidina in vitro com dois supressores RNAts de deslocamentode quadro quimicamente adiados. Ver, por exemplo, Hohsaka et al., (1999) J. Am. Chem.Soc.. 121:12194. Em um estudo in vivo, Moore et al. examinou a capacidade de RNAtleuderivados com anticódons UCUA suprir códons UAGN (N pode ser U, A, G, ou C), edescobriu que o UAGA quadruplete pode ser decodificado por um RNAtleu com um anticódon UCUA com uma eficiência de 13 a 26 % com pequena decodificação no quadro 0ou -1. Ver Moore et al., (2000) J. Mol. Biol.. 298:195. Em uma modalidade, códonsestendidos baseados nos códons raros ou códons não sentido podem ser usados nainvenção, que podem reduzir leitura de sentido incorreto e supressão de deslocamento dequadro em outros sítios indesejados. Códons de quatro base têm sido usados como códonsseletores em uma variedade de sistemas ortogonais. Ver, por exemplo, WO 2005/019415;WO 2005/007870 and WO 2005/07624. Ver também, Wang and Schultz "Expanding thegenetic Code," Angewandte Chemie Int. Ed., 44(1):34-66 (2005), cujos conteúdos estão aquiincorporados nas suas íntegras pela referência. Embora os exemplos a seguir utilizem umcódon seletor fr âmbar, códons de quatro ou mais bases podem ser igualmente usados,modificando os exemplos aqui para incluir O-RNAts de quatro bases e sintetase modificadospara incluir mutações similares àquelas descritas anteriormente para vários O-RSs deaminoácido não natural:
Para um dado sistema, um códon seletor pode também incluir um dos códons detrês bases naturais, onde o sistema endógeno não usa (ou raramente usa) o códon de base natural. Por exemplo, isto inclui um sistema que falta um RNAt que reconhece o códon detrês bases natural e/ou um sistema onde o códon de três bases é um códon raro.
Códons seletores opcionalmente incluem pares de base não naturais. Estes paresde base não naturais expandem adicionalmente o alfabeto genético existente. Um par debase extra aumenta o número de códons triplete de 64 para 125. Propriedades dos terceirospares de base incluem pareamento de base estável e seletivo, incorporação enzimáticaeficiente no DNA com alta fidelidade por um polimerase, e a extensão do iniciador continuoueficiente depois da síntese do par de base não natural nascente. Descrições de pares debase não naturais que podem ser adaptadas para métodos e composições incluem, porexemplo, Hirao, et ai, (2002) Na unnatural base pair for incorporating amino acid analoguesinto protein, Nature Biotechnoloav. 20:177-182. Ver também Wu, Y., et ai, (2002) J. Am.Chem. Soe. 124:14626-14630. Outras publicações relevantes são listadas a seguir.
Para uso in vivo, o nucleosídeo não natural é permeável a membrana e éfosforilado para formar o trifosfato correspondente. Além disso, a maior informação genéticaé estável e não destruída pelas enzimas celulares. Esforços anteriores de Benner e outrostiram vantagem de padrões de ligação de hidrogênio que são diferentes daqueles em parescanônicos de Watson-Crick1 o mais notável exemplo de que é o par iso-C:iso-G. Ver, porexemplo, Switzer et al., (1989) J. Am. Chem. Soc.. 111:8322; and Piccirilli et ai, (1990)Nature. 343:33; Kool, (2000) Curr. Qpin. Chem. Biol.. 4:602. Essas bases em geral faltamaté um certo ponto de emparelhamento com bases naturais e não podem serenzimaticamente replicadas. Kool e colaboradores demonstram que interações eempacotamento hidrofóbico entre bases podem substituir ligação de hidrogênio paraconduzir a formação de par de base. Ver Kool, (2000) Curr. Qpin. Chem. Biol.. 4:602; andGuckian and Kool, (1998) Anqew. Chem. Int. Ed. Enql.. 36, 2825. Em um esforço paradesenvolver um par de base não natural satisfazendo todas as exigências anteriores,Schultz1 Romesberg e colaboradores têm sistematicamente sintetizado e estudado umasérie de bases hidrofóbicas não naturais. Um auto-par PICS:PICS deve ser mais estável doque pares de base naturais, e podem ser eficientemente incorporados no DNA porfragmento Klenow de Escherichia coli DNA polimerase I (KF). Ver, por exemplo, McMinn etai, (1999) J. Am. Chem. Soc.. 121:11586 e Ogawa et ai, (2000) J. Am. Chem. Soc..122:3274. Um auto-par 3MN:3MN pode ser sintetizado por KF com eficiência e seletividadesuficiente para função biológica. Ver, por exemplo, Ogawa et ai, (2000) J. Am. Chem. Soc..122:8803. Portanto, ambas bases agem como um terminador de cadeia para replicaçãoadicional. Foi recentemente desenvolvido um DNA polimerase mutante que pode ser usadopara replicar o auto-par PICS. Além disso, um auto-par 7AI pode ser replicado. Ver, porexemplo, Tae et ai, (2001) J. Am. Chem. Soc.. 123:7439. Tem também sido desenvolvidoum par de metalobase inédito, Dipic:Py, que forma um par estável mediante ligação Cu(II).Ver Meggers et ai, (2000) J. Am. Chem. Soc.. 122:10714. Em virtude de códons estendidose códons não naturais serem intrinsecamente ortogonais aos códons naturais, os métodosda invenção podem tirar vantagem desta propriedade para gerar RNAt ortogonais para eles.Um sistema de desvio translacional pode também ser usado para incorporar umaminoácido não natural em um polipeptídeo desejado. Em um sistema de desviotranslacional, uma grande seqüência é inserida em um gene, mas não é traduzida naproteína. A seqüência contém uma estrutura que serve como uma indicação para induzir o ribossomo a saltar a seqüência e retomar a tradução à jusante da inserção.
AMINOÁCIDOS NÃO NATURAIS
Da maneira aqui usada, um aminoácido não natural refere-se a qualqueraminoácido, aminoácido modificado, ou aminoácido análogo a não ser selenocisteína e/oupirrolisina e os vinte seguintes alfa-aminoácidos geneticamente codificados: alanina, arginina, asparagina, ácido aspártico, cisteína, glutamina, ácido glutâmico, glicina, histidina,isoleucina, leucina, lisina, metionina, fenilalanina, prolina, serina, treonina, triptofano,tirosina, valina. A estrutura genérica de um alfa-aminoácido é ilustrada pela Fórmula I:
Um aminoácido não natural é tipicamente qualquer estrutura tendo a Fórmula I emque o grupo R é qualquer substituinte a não ser um usado nos vinte aminoácidos naturais. Ver, por exemplo, Biochemistry por L. Stryer, P ed. 1988, Freeman and Company1 NewYork, para as estruturas dos vinte aminoácidos naturais. Note que os aminoácidos nãonaturais da invenção podem ser compostos de ocorrência natural sem ser os vinte alfa-aminoácidos anteriores.
Em virtude de os aminoácidos não naturais da invenção tipicamente diferirem dos aminoácidos naturais na cadeia lateral, os aminoácidos não naturais formam amida ligadacom outros aminoácidos, por exemplo, natural ou não natural, da mesma maneira da qualeles são formados em proteínas de ocorrência natural. Portanto, os aminoácidos nãonaturais têm grupos de cadeia lateral que os distingue dos aminoácidos naturais.
O aminoácido não natural fenilselenocisteína é de particular interesse aqui (Ver figura 1, estrutura 1). Além do aminoácido não natural fenilselenocisteína, outrosaminoácidos não naturais podem ser simultaneamente incorporados em um polipeptídeo deinteresse, por exemplo, usando um segundo par O-RS/O-RNAt apropriado em conjunto comum par ortogonal fornecido pela presente invenção. Muitos desses aminoácidos não naturaisadicionais e pares ortogonais adequados são conhecidos. Ver a presente revelação e asreferências aqui citadas. Por exemplo, ver Wang and Schultz "Expanding o Genetic Code",Angewandte Chemie Int. Ed., 44(1):34-66 (2005), Xie and Schultz, "A Expanding GeneticCode", Methods 36(3):227-238 (2005), Xie e Schultz1 "Adding Amino acids to the GeneticRepertoire", Curr. Opinion in Chemical Bioiogy 9(6):548-554 (2005) e Wang et ai,"Expanding the Genetic Code", Annu. Rev. Biophys. Biomol. Struct., 35:225-249 (2006);cujos conteúdos estão cada qual incorporados pela referência nas suas íntegras.
Embora o aminoácido não natural fenilselenocisteína mostrado na figura 1,estrutura 1, seja de interesse primário nos exemplos aqui descritos, não pretende-se que ainvenção seja estritamente limitada àquela estrutura. Realmente, uma variedade deanálogos estruturalmente relacionados facilmente derivados pode ser imediatamenteproduzida que retêm a característica principal da fenilselenocisteína mostrada na figura 1,estrutura 1, e também são especificamente reconhecidos pelo aminoacil-RNAt sintetase dainvenção (por exemplo, o O-RS de SEQ ID NOS: 4, 6 e 8). Pretende-se que estesaminoácidos análogos relacionados estejam no escopo da invenção.
Em outros aminoácidos não naturais, por exemplo, R na Fórmula I opcionalmentecompreende um alquil-, aril-, acil-, hidrazina, ciano-, halo-, hidrazida, alquenila, éter, borato,boronato, fosfo, fosfono, fosfina, enona, imina, éster, hidroxilamina, amina, e similares, ouqualquer combinação destes. Outros aminoácidos não naturais de interesse incluem, massem limitações, aminoácidos que compreendem um reticuladorfotoativável, aminoácido commarcador de spin, aminoácidos fluorescentes, aminoácidos de ligação de metal,aminoácidos contendo metal, aminoácidos radioativos, aminoácidos com grupos funcionaisinéditos, aminoácidos que interagem covalente ou não covalentemente com outrasmoléculas, aminoácidos fotoativados e/ou fotoisomerizáveis, biotina ou biotina-análogacontendo aminoácidos, ceto contendo aminoácidos, aminoácidos glicosilados, uma fraçãode sacarídeo anexada à cadeia lateral de aminoácido, aminoácidos compreendendopolietileno glicol ou poliéter, aminoácidos substituídos com átomo pesado, aminoácidos quimicamente cliváveis ou fotocliváveis, aminoácidos com uma cadeia lateral alongadacomparada com os ácidos naturais (por exemplo, poliéteres ou hidrocarbonetos de cadeialonga, por exemplo, maior que cerca de 5, maior que cerca de 10 carbonos, etc.),aminoácidos contendo açúcar ligados a carbono, amino tioácido contendo aminoácidos, eaminoácidos contendo uma ou mais frações tóxicas.
Em um outro aspecto, a invenção fornece aminoácidos não naturais tendo aestrutura geral ilustrada pela Fórmula IV a seguir:
<formula>formula see original document page 37</formula>Um aminoácido não natural tendo esta estrutura é tipicamente qualquer estruturaonde Ri é um substituinte usado em um dos vinte ácidos naturais (por exemplo, tirosina oufenilalanina) e R2 é um substituinte. Assim, este tipo de aminoácido não natural pode servisto como um aminoácido natural derivado.
Além dos aminoácidos não naturais que contêm a estrutura fenilselenocisteínamostrado na figura 1, estrutura 1, aminoácidos não naturais podem também compreenderopcionalmente estruturas da espinha dorsal modificadas, por exemplo, da maneira ilustradapelas estruturas das Fórmulas Il e III:
em que Z tipicamente compreende OH, NH2, SH, NH-R', ou S-R'; XeY, que podem ser os mesmos ou diferentes, tipicamente compreendem S ou O, e R e R', que sãoopcionalmente os mesmos ou diferentes, são tipicamente selecionados da mesma lista deconstituintes para o grupo R descrito anteriormente para os aminoácidos não naturais tendoFórmula I bem como hidrogênio. Por exemplo, aminoácidos não naturais da invenção,opcionalmente compreendem substituições no grupo amino ou carboxila da maneira ilustrada pelas Fórmulas Il e III. Aminoácidos não naturais deste tipo incluem, mas semlimitações, ácidos σ-hidróxi, σ-tioáciodo σ-aminotiocarboxilatos, por exemplo, com cadeiaslaterais correspondentes às cadeias laterais de vinte aminoácidos naturais ou não naturaiscomuns. Além disso, substituições no σ-carbono opcionalmente incluem L, D, ou a- a-aminoácidos di-substituídos tais como D-glutamato, D-alanina, D-metil-O-tirosina, ácidoaminobutírico, e similares. Outras alternativas estruturais incluem aminoácidos cíclicos, talcomo prolina análoga bem como prolina análoga de anel de 3, 4, 6, 7, 8 e 9 membros,aminoácidos e y tais como yff-alanina e ácido γ-amino butírico substituídos.
Em alguns aspectos, a invenção utiliza aminoácidos não naturais na configuraçãoL. Portanto, não pretende-se que a invenção seja limitada ao uso de aminoácidos nãonaturais de configuração L. Observou-se que o enantiômeros D destes aminoácidos nãonaturais também encontram uso na invenção.
Os aminoácidos não naturais que encontram uso na invenção não estão estritamente limitados ao aminoácido não natural fenilselenocisteína mostrado na figura 1,estrutura 1. Versados na tecnologia reconhecerão que uma ampla variedade de análogosnão naturais de aminoácidos de ocorrência natural é facilmente derivada. Por exemplo, massem limitações, derivados não naturais de tirosina são facilmente produzidos. Análogos detirosina incluem, por exemplo, tirosinas para-substituídas, tirosinas orto-substituídas, e tirosinas meta-substituídas, em que a tirosina substituída compreende um grupo alquinila,grupo acetila, um grupo benzoíla, um grupo amino, uma hidrazina, uma hidroxiamina, umgrupo tiol, um grupo carbóxi, um grupo isopropila, um grupo metila, uma cadeia ramificadaOg - C20 ou hidrocarboneto ramificado, um hidrocarboneto saturado ou insaturado, um grupo0-metila, um grupo poliéter, um grupo nitro, ou similares. Além disso, anéis arila multiplamente substituídos são também observados. Análogos glutamina da invençãoincluem, mas sem limitações, derivados de σ-hidróxi, derivados de y-substituído, derivadoscíclicos, e derivados de glutamina substituído por amida. Exemplos de análogos defenilalanina incluem, mas sem limitações, fenilalaninas para-substituídas, fenilalaninas orto-substituído, e fenilalaninas meta-substituído, em que o substituinte compreende um grupoalquinila, um grupo hidróxi, um grupo metóxi, um grupo metila, um grupo alila, um aldeído,um nitro, um grupo tiol, ou grupo ceto, ou similares. Exemplos específicos de aminoácidosnão naturais incluem, mas sem limitações, fenilselenocisteína, sulfotirosina, p-etiltiocarbonil-1-fenilalanina, p-(3-oxobutanoil)-1-fenilalanina, 1,5-dansil-alanina, aminoácido de 7-amino-cumarina, aminoácido de 7-hidróxi-cumarina, nitrobenzil-serina, 0-(2-nitrobenzil)-1-tirosina,p-carboximetil-1-fenilalanina, p-ciano-1-fenilalanina, m-ciano-1-fenilalanina, bifenilalanina, 3-amino-1 -tirosina, bipiridil alanina, p-(2-amino-1-hidroxietil)-1-fenilalanina, p-isopropiltiocarbonil-1-fenilalanina, 3-nitro-1-tirosina e p-nitro-1-fenilalanina. Também, um p-propargiloxifenilalanina, um 3,4-driidróxi-1-fenilalanina (DHP), um 3, 4, 6-triidróxi-1-fenilalanina, um 3,4,5-triidróxi-1-fenilalanina, 4-nitro-fenilalanina, ap-acetil-1-fenilalanina, O- metil-1-tirosina, um L-3-(2-naftil)alanina, um 3-metil-fenilalanina, um 0-4-alil-1-tirosina, um 4-propil-1-tirosina, um 3-nitro-tirosina, um 3-tiol-tirosina, um tri-0-acetil-GlcNAc/?-serina, um L-Dopa, um fenilalanina fluorado, um isopropil-1-fenilalanina, um p-azido-1-fenilalanina, um p-acil-1-fenilalanina, um p-benzoil-1-fenilalanina, um L-fosfoserina, um fosfonoserina, umfosfonotirosina, um p-iodo-fenilalanina, um p-bromofenilalanina, um p-amino-1 -fenilalanina, e um isopropil-1-fenilalanina, e similares. As estruturas de uma variedade de aminoácidos nãonaturais são reveladas nas referências aqui citadas. Ver também, pedidos de patenteinternacionais publicados WO 2004/094593, intitulado "EXPANDING THE EUKARYOTICAGENETIC CODE," e WO 2006/110182, intitulado" ORTOGONAL TRANSLATIONCOMPONENTS FOR THE IN VIVO INCORPORATION OF UNNATURAL AMINO ACIDS",depositado em 27 de outubro de 2005.
SÍNTESE QUÍMICA DE AMINOÁCIDOS NÃO NATURAIS
Muitos dos aminoácidos não naturais fornecidos anteriormente estãocomercialmente disponíveis, por exemplo, pela Sigma (USA) ou Aldrich (Milwaukee, Wl1USA). Aqueles que não estão comercialmente disponíveis são opcionalmente sintetizados,fornecidos em várias publicações ou usando métodos padrões conhecidos pelos versadosna tecnologia. Para técnicas de síntese orgânica, Ver, por exemplo, Orqanic Chemistrv de Fessendon e Fessendon, (1982, Second Edition, Willard Grant Press, Boston Mass.);Advanced Oraanic Chemistrv by March (Third Edition, 1985, Wiley and Sons, New York); eAdvanced Orqanic Chemistrv by Carey and Sundberg (Third Edition, Parts AeB, 1990,Plenum Press, New York). Publicações adicionais descrevendo a síntese de aminoácidosnão naturais incluem, por exemplo, WO 2002/085923 intitulado "In vivo incorporation of Unnatural Amino Acids", Matsoukas et ai, (1995) J. Med. Chem.. 38, 4660-4669; King andKidd (1949) A New Synthesis of Glutamine and the y-Dipeptides of Glutamic Acid fromPhthylated Intermediates. J. Chem. Soc.. 3315-3319; Friedman and Chatterrji (1959)Synthesis of Derivatives of Glutamine as Model Substrates for Anti-Tumor Agents. J. /\m.Chem. Soe. 81, 3750-3752; Craig et W. (1988) Absolute Configuration ofthe Enantiomeos of 7-Chloro-4 [[4-(diethylamino)-1-metilbutyl]amino]quinoline (Cloroquine). J. Orq. Chem. 53,1167-1170; Azoulay et al. (1991) Analogs glutamine as Potential Antimalarials,. Eur. J. Med.Chem. 26, 201-5; Koskinen, e Rapoport (1989) Synthesis of 4-Substituted Prolines asConformationally Constrained Amino Acid Analogs. J. Orq. Chem. 54, 1859-1866; Christie eRapoport (1985) Synthesis of Optically Pure Pipecolates from L-Asparagine. Application to the Total Synthesis of (+)-Apovincamine through Amino Acid Decarbonylation and IminiumIon Cyclization. J. Ora. Chem. 1989:1859-1866; Barton et al., (1987) Synthesis of Novel a-Amino-Acids and Derivatives Using RadicaI Chemistry: Synthesis of L- and D-aAmino-AdipicAcids, L-aaminopimelic Acid and Apropriado Unsaturad Derivatives. Tetrahedron Lett.43:4297-4308; and Subasinghe et ai, (1992) Quisqualic Acid analogs: synthesis of beta-heterocyclic 2-aminopropanoic acid derivatives and their activity at a novel quisqualate-sensitized site. J. Med. Chem. 35:4602-7. Ver também, International Publication WO2004/058946, intitulado "PROTEIN ARRAYS", depositado em 22 de dezembro de 2003.
Captação celular de aminoácidos não naturais
Captação de aminoácido não natural por uma célula é uma questão que étipicamente considerado quando se projeta e seleciona aminoácidos não naturais, porexemplo, para incorporação em uma proteína. Por exemplo, a densidade de carga alta de a-aminoácidos sugere que estes compostos são improvavelmente permeáveis para a célula.Ácido naturais são captados na célula por meio de uma coleção de sistemas de transportebaseados em proteína exibindo freqüentemente variação de graus de especificidade deaminoácido. Pode ser feita uma classificação rápida, que avalia quais aminoácidos nãonaturais, se houver, são captados pelas células. Ver, por exemplo, os ensaios de toxicidade,por exemplo, em International Publication WO 2004/058946, intitulado "PROTEIN ARRAYS",depositado em 22 de dezembro de 2003, e Liu and Schultz (1999) Progress toward theevolution of the organism whith expanded Genetic Code. PNAS 96:4780-4785. Embora acaptação seja facilmente analisada com vários ensaios, uma alternativa para projetaraminoácidos não naturais que são amenos a caminhos de capação celular, é fornecercaminhos bio-sintéticos para criar aminoácidos in vivo.
Bio-síntese de Aminoácidos não naturais
Muitos caminhos bio-sintéticos já existem em células para a produção deaminoácidos e outros compostos. Embora um método bio-sintético para um aminoácido nãonatural particular não possa existir na natureza, por exemplo, em uma célula, a invenção fornece tais métodos. Por exemplo, caminhos bio-sintéticos para aminoácidos não naturaissão opcionalmente gerados em célula hospedeira adicionando novas enzimas oumodificando caminhos de célula hospedeira existentes. Novas enzimas adicionais sãoopcionalmente enzimas de ocorrência natural ou artificialmente enzimas desenvolvidas. Porexemplo, a bio-síntese de p-aminofenilalanina (apresentado em um exemplo em WO2002/085923) conta com a adição de uma combinação de enzimas conhecidas de outrosorganismos. Os genes para estas enzimas podem ser introduzidos em uma célulatransformando a célula com um plasmídeo compreendendo os genes. Os genes, quandoexpressos na célula, fornecem um caminho enzimático para sintetizar o composto desejado.Exemplos dos tipos de enzimas que são opcionalmente adicionados são fornecidos nos exemplos a seguir. Seqüências de enzimas adicionais são encontradas, por exemplo, emGenbank. Enzimas desenvolvidas artificialmente são também opcionalmente adicionadasem uma célula da mesma maneira. Desta maneira, o maquinário celular e recursos de umacélula são manipulados para produzir aminoácidos não naturais.
Realmente, qualquer um de uma variedade de métodos pode ser usado para produzir enzimas inéditas para uso em caminhos bio-sintéticos, ou para evolução decaminhos existentes, para a produção de aminoácidos não naturais, in vitro ou in vivo.Muitos métodos disponíveis de desenvolver enzimas e outros componentes de caminho bio-sintético podem ser aplicados à presente invenção para produzir aminoácidos não naturais(ou, realmente, para desenvolver sintetase para ter novas especificidades de substrato ou outras atividades de interesse). Por exemplo, embaralhamento de DNA é opcionalmenteusado para desenvolver enzimas inéditas e/ou caminhos de tais enzimas para a produçãode aminoácidos não naturais in vitro ou in vivo (ou produção de nova sintetase). Ver, porexemplo, Stemmer (1994), Rapid evolution of a proteína in vitro by DNA shuffling, Nature370(4):389-391; and Stemmer, (1994), DNA shuffling by random fragmentation andreassembly: In vitro recombination for molecular evolution, Proc. Natl. Acad. Sei. USA..91:10747-10751. Uma abordagem relacionada embaralha famílias de genes relacionados(por exemplo, homóloga) que desenvolvem facilmente enzimas com característicasdesejadas. Um exemplo de tais métodos "embaralhamento de gene de família" é encontradoem Crameri et at. (1998) "DNA shuffling of a family of genes from diverse speciesaccelerates directed evolution" Nature. 391(6664): 288-291. Novas enzimas (quercomponentes por caminho bio-sintético quer sintetase) podem também ser geradas usandoum procedimento de recombinação de DNA conhecido como "truncação incrementai para acriação de enzimas híbridas" ("ITCHY"), por exemplo, da maneira descrita em Ostermeier etat. (1999) "A combinatorial approach to hybrid enzymes independent of DNA homology"Nature Biotech 17:1205. Esta abordagem pode também ser usada para gerar uma bibliotecade enzima ou outras variantes de caminhos que podem servir como substratos para um ou mais métodos de recombinação in vitro ou in vivo. Ver, também, Ostermeier et ai (1999)"Combinatorial Protein Engineering by Incrementai Truncation", Proc. Natl. Acad. Sei. USA.96: 3562-67, and Ostermeier et at. (1999), "Incrementai Truncation as a Estrategy in theEngineering of Novel Biocatalysts", Bioloqical and Medicinal Chemistry1 7: 2139-44. Umaoutra abordagem usa mutagênese de montagem exponencial para produzir bibliotecas deenzima ou outras variantes de caminho que são, por exemplo, selecionadas pelacapacidade de catalisar uma reação bio-sintética relevante para produzir um aminoácidonão natural (ou uma sintetase inédita). Nesta abordagem, pequenos grupos de resíduos emuma seqüência de interesse são randomizados em paralelo para identificar, em cadaposição alterada, aminoácidos que levam às proteínas funcionais. Exemplos de tais procedimentos, que podem ser adaptados para a presente invenção para produzir novasenzimas para a produção de aminoácidos não naturais (ou sintetase inédita) sãoencontrados em Delegrave and Youvan (1993) Biotechnoloqy Research 11:1548-1552.Ainda em uma outra abordagem, mutagênese aleatória ou semi-aleatória usandooligonucleotídeos dopados ou degenerados para enzima e/ou engenharia de componentede caminho pode ser usado, por exemplo, usando os métodos gerais de mutagênese porexemplo, de Arkin and Youvan (1992) "Optimizing nucleotide mixtures to encode specificsubsets of amino acids for semi-random mutagenesis" Biotechnoloqy 10:297-300; ouReidhaar-Olson et ai (1991) "Random mutagenesis of protein sequences usingoligonucleotide cassettes" Methods Enzvmol. 208:564-86. Ainda em uma outra abordagem, freqüentemente denominada mutagênese "não estocásticas", que usa mutagênese de ré-montagens de polinucleotídeo e saturação do sítio pode ser usada para produzir enzimase/ou componentes de caminho, que pode em seguida ser classificado pela capacidade derealizar uma ou mais funções de sintetase ou de caminho bio-sintético (por exemplo, para aprodução de aminoácidos não naturais in vivo). Ver, por exemplo, Short "NON-STOCHASTIC GENERATION OF GENETIC VACCINES AND ENZYMS" WO 00/46344.
Uma alternativa para tais métodos mutacionais envolve recombinar todos osgenomas de organismos e selecionar progênie resultante para funções de caminhoparticular (freqüentemente referido como "embaralhamento de genoma completo"). Estaabordagem pode ser aplicada à presente invenção, por exemplo, por recombinação eseleção genômica de um organismo (por exemplo, um E. coli ou outra célula) pelacapacidade de produzir um aminoácido não natural (ou intermediário deste). Por exemplo,métodos preceituados nas publicações seguintes podem ser aplicados para projetarcaminho para a evolução de caminhos existentes e/ou novos em células para produziraminoácidos não naturais in vivo: Patnaik et ai (2002) "Genome shuffling of Iactobacillus forimproved acid tolerance" Nature Biotechnology 20(7):707-712, e Zhang et ai (2002)"Genome shuffling Leads to Rapid Phenotypic Improvement in Bactéria" Nature415(6872):644-646.
Outras técnicas para engenharia de organismo e caminho metabólico, por exemplo,para a produção de compostos desejados estão também disponíveis e podem também seraplicados à produção de aminoácidos não naturais. Exemplos de publicações quepreceituam abordagens de engenharia de caminho usadas incluem: Nakamura and White(2003) "Metabolic engineering for the microbial prodution of 1,3 propanediol" Curr. Opin.Biotechnol. 14(5):454-9; Berry et at. (2002) "Application of Metabolic Engineering to improveboth the prodution and use of Biotech índigo" J. Industrial Microbioloqy and Biotechnoloqy28:127-133; Banta et ai. (2002) "Optimizing a artificial metabolic pathway: Engineering ocofactor especificity of Corynebacterium 2,5-diketo-D-gluconic acid reductase for use invitamin C biosynthesis Biochemistrv. 41(20), 6226-36; Selivonova et al. (2001) "RapidEvolution of Novel Traits in Microorganisms" Applied and Environmental Microbioloqy.67:3645, e muitos outros.
Independente do método usado, tipicamente, o aminoácido não natural produzidocom um caminho bio-sintético de engenharia da invenção é produzido em umaconcentração suficiente para bio-síntese de proteína eficiente, por exemplo, uma quantidadecelular natural, mas não ao ponto de afetar significativamente a concentração de outrosaminoácidos celulares ou exaurir os recursos celulares. Concentrações típicas produzidos invivo desta maneira são cerca de 10 mM a cerca de 0,05 mM. Uma vez que uma célula éprojetada por engenharia para produzir enzimas desejadas para um caminho específico eum aminoácido não natural é gerado, seleções in vivo são opcionalmente usadas paraotimizar ainda mais a produção do aminoácido não natural tanto para síntese de proteínaribossomal quanto crescimento celular.Componentes ortoqonais para Incorporar Aminoácidos não naturaisUma invenção fornece composições e métodos para produzir componentesortogonais para incorporar o aminoácido não natural fenilselenocisteína (Ver figura 1,estrutura 1) em uma cadeia do polipeptídeo em crescimento em resposta a um códonseletor, por exemplo, um códon de parada âmbar, um códon não sentido, um códon dequatro ou mais bases, etc., por exemplo, in vivo. Por exemplo, a invenção fornece ortogonal-RNAts (O-RNAts)1 aminoacil-RNAt sintetase ortogonal (O-RSs) e seus pares. Estes parespodem ser usados para incorporar um aminoácido não natural nas cadeias do polipeptídeoem crescimento.
Uma composição da invenção inclui um aminoacil-RNAt sintetase ortogonal (O-RS)1onde o O-RS preferencialmente aminoacila um O-RNAt com fenilselenocisteína. Em certasmodalidades, o O-RS compreende uma seqüência de aminoácidos compreendendo SEQ IDNO: 4, 6 ou 8, e variações conservativas destas. Em certas modalidades da invenção, o O-RS preferencialmente aminoacila o O-RNAt sobre qualquer RNAt endógeno com umaminoácido não natural particular, onde o O-RS tem uma predisposição para o O-RNAt1 eonde a razão de O-RNAt carregado com um aminoácido não natural para o RNAt endógenocarregado com o mesmo aminoácido não natural é maior que 1:1, e mais preferivelmenteonde o O-RS carrega o O-RNAt exclusivamente ou quase exclusivamente.
Uma composição que inclui um O-RS por opcionalmente incluir adicionalmente um RNAt ortogonal (O-RNAt)1 onde o O-RNAt reconhece um códon seletor. Tipicamente, um O-RNAt da invenção inclui eficiência de supressão de pelo menos cerca de, por exemplo, 45%, 50 %, 60 %, 75 %, 80 % ou 90 % ou mais na presença de uma sintetase cognata emresposta a um códon seletor comparado à eficiência de supressão de um O-RNAt quecompreende ou é codificado por uma seqüência de polinucleotídeo apresentada naseqüência listada e exemplos aqui (por exemplo, SEQ ID NO: 1). Em uma modalidade, aeficiência de supressão do O-RS e do O-RNAt juntos, por exemplo, é 5 vezes, 10 vezes, 15vezes, 20 vezes, 25 vezes ou mais, maior do que a eficiência de supressão do O-RNAt naausência de um O-RS. Em alguns aspectos, a eficiência de supressão do O-RS e do O-RNAt juntos é pelo menos 45 % da eficiência de supressão de um par de tirosil-RNAt ortogonal sintetase derivado de Methanococcus jannaschii.
Uma composição que inclui um O-RNAt pode opcionalmente incluir uma célula (porexemplo, uma célula eubacteriana, tal como uma célula E. coli e similares, ou uma célulaeucariótica tal como uma célula de levedura), e/ou um sistema de tradução.
Uma célula (por exemplo, uma célula eubacteriana ou uma célula de levedura) que compreende um sistema de tradução é também fornecida pela invenção, onde o sistema detradução inclui um RNAt (O-RNAt) ortogonal; um aminoacil-RNAt sintetase ortogonal (O-RS); e, um aminoácido não natural fenilselenocisteína. Tipicamente, o O-RSpreferencialmente aminoacila o O-RNAt sobre qualquer RNAt endógeno com o aminoácidonão natural, onde o O-RS tem uma predisposição for o O-RNAt1 e onde a razão de O-RNAtcarregado com o aminoácido não natural para o RNAt endógeno carregado com oaminoácido não natural é maior que 1:1, e mais preferivelmente onde o O-RS carrega o O- RNAt exclusivamente ou quase exclusivamente. O O-RNAt reconhece o primeiro códonseletor, e o O-RS preferencialmente aminoacila o O-RNAt com um aminoácido não natural.Em uma modalidade, o O-RNAt compreende ou é codificado por uma seqüência depolinucleotídeo apresentada em SEQ ID NO: 1, ou uma seqüência de polinucleotídeocomplementar destas. Em uma modalidade, o O-RS compreende uma seqüência deaminoácidos apresentada em SEQ ID NO: 4, 6, 8 ou 10, e variações conservativas destas.
Uma célula da invenção pode compreender opcionalmente mais um par de O-RNAt/O-R diferente adicional e um segundo aminoácido não natural, por exemplo, onde esteO-RNAt reconhece um segundo códon seletor e este O-RS preferencialmente aminoacila oO-RNAt correspondente com o segundo aminoácido não natural, onde o segundoamino ácido é diferente from o primeiro aminoácido não natural. Opcionalmente, uma célula dainvenção inclui um ácido nucléico que compreende um polinucleotídeo que codifica umpolipeptídeo de interesse, onde o polinucleotídeo compreende um códon seletor que éreconhecido pelo O-RNAt.
Em certas modalidades, uma célula da invenção é uma célula eubacteriana (taiscomo E. coli), que inclui um -RNAt ortogonal (O-RNAt), um aminoacil-RNAt sintetaseortogonal (O-RS), um aminoácido não natural, e um ácido nucléico que compreende umpolinucleotídeo que codifica um polipeptídeo de interesse, onde o polinucleotídeocompreende o códon seletor que é reconhecido pelo O-RNAt. Em certas modalidades dainvenção, o O-RS preferencialmente aminoacila o O-RNAt com o aminoácido não naturalcom uma eficiência que é maior que a eficiência com a qual o O-RS aminoacila qualquerRNAt endógeno.
Em certas modalidades da invenção, um O-RNAt da invenção compreende ou écodificado por uma seqüência de polinucleotídeo apresentada na listas de seqüência ouexemplos aqui (por exemplo, SEQ ID NO: 1), ou uma seqüência de polinucleotídeo complementar desta. Em certas modalidades da invenção, um O-RS compreende umaseqüência de aminoácidos apresentada nas listas de seqüência, ou uma variaçãoconservativa destas. Em uma modalidade, o O-RS ou uma porção deste é codificado poruma seqüência de polinucleotídeo que codifica um aminoácido apresentado nas listas deseqüência ou exemplos aqui, ou uma seqüência de polinucleotídeo complementar destas.
O O-RNAt e/ou o O-RS da invenção podem ser derivados de qualquer uma de umavariedade de organismos (por exemplo, organismos eucariótico e/ou não eucariótico).
Polinucleotídeos são também um recurso da invenção. Um polinucleotídeo dainvenção (por exemplo, SEQ ID NO: 5, 7 ou 9) inclui um polinucleotídeo artificial (porexemplo, feito pelo homem, e ocorrência não natural) que compreende uma seqüência denucleotídeos que codifica um polipeptídeo apresentado na listagens de seqüência aqui, e/oué complementar a seqüência de polinucleotídeo. Um polinucleotídeo da invenção podetambém incluir um ácido nucléico que hibridiza com um polinucleotídeo descritoanteriormente, em condições altamente rigorosas substancialmente por todo o comprimentodo ácido nucléico. Um polinucleotídeo da invenção também inclui um polinucleotídeo que é,por exemplo, pelo menos 75 %, pelo menos 80 %, pelo menos 90 %, pelo menos 95 %, pelomenos 98 % ou mais idêntico àquele de um RNAt de ocorrência natural ou ácido nucléico de codificação correspondente (mas um polinucleotídeo da invenção é sem ser um RNAt deocorrência natural ou ácido nucléico de codificação correspondente), onde o RNAtreconhece um códon seletor, por exemplo, um códon de quatro bases. Polinucleotídeosartificiais que são, por exemplo, pelo menos 80 %, pelo menos 90 %, pelo menos 95 %, pelomenos 98 % ou mais idêntico a qualquer dos anteriores e/ou um polinucleotídeo que compreende uma variação conservativa de qualquer da anterior, estão também incluídas empolinucleotídeos da invenção.
Vetores que compreendem um polinucleotídeo da invenção são também umarecurso da invenção. Por exemplo, um vetor da invenção pode incluir um plasmídeo, umcosmídeo, um fago, um vírus, um vetor de expressão, e/ou similares. Uma célula quecompreende um vetor da invenção é também um recurso da invenção.
Métodos de produzir componentes de um par de O-RNAt/O-R são também recursosda invenção. Componentes produzidos por estes métodos são também um recurso dainvenção. Por exemplo, métodos de produzir pelo menos um RNAt que é ortogonal a umacélula (O-RNAt) incluem gerar uma biblioteca de RNAts mutantes; mutar um laço anticódon de cada membro da biblioteca de RNAts mutantes para permitir o reconhecimento de umcódon seletor, fornecendo dessa maneira uma biblioteca de O-RNAts potencial, e submetera seleção negativa uma primeira população de células de uma primeira espécie, onde ascélulas compreendem um membro de biblioteca de O-RNAts potencial. A seleção negativaelimina as células que compreendem um membro de biblioteca de O-RNAts potencial que é aminoacilado por um aminoacil-RNAt sintetase (RS) que é endógena à célula. Isto forneceum agrupamento de RNAts que são ortogonais às célula da primeira espécie, fornecendodessa maneira pelo menos um O-RNAt. É também fornecido um O-RNAt produzido pelosmétodos da invenção.
Em certas modalidades, os métodos compreendem adicionalmente submeter aseleção positiva uma segunda população de células da primeira espécie, onde as célulascompreendem um membro de agrupamento de RNAts que são ortogonais às célula daprimeira espécie, um aminoacil-RNAt sintetase cognato, e um marcador de seleção positiva.Usando a seleção positiva, células são selecionadas ou classificadas por aquelas célulasque compreendem um membro de agrupamento de RNAts que é aminoacilado peloaminoacil-RNAt sintetase cognato e que mostra uma resposta desejada na presença domarcador de seleção positiva, fornecendo dessa maneira um O-RNAt. Em certasmodalidades, a segunda população de células compreende células que não forameliminadas pela seleção negativa.
Métodos para identificar um aminoacil-RNAt sintetase ortogonal que carrega um O-RNAt com um aminoácido não natural são também fornecidos. Por exemplo, métodosincluem submeter uma população de células de uma primeira espécie a uma seleção, onde cada uma das células compreende: 1) um membro da pluralidade de aminoacil-RNAtsintetase (RSs), (por exemplo, a pluralidade de RSs pode incluir RSs mutante e, RSsderivados de uma espécie sem ser uma primeira espécie ou tanto RSs mutante quanto RSsderivados de uma espécie sem ser uma primeira espécie); 2) o RNAt ortogonal (O-RNAt)(por exemplo, de uma ou mais espécie); e 3) um polinucleotídeo que codifica um marcador de seleção positiva e compreende pelo menos um códon seletor.
Células (por exemplo, uma célula hospedeira) são selecionadas ou classificadaspor aquelas que apresentam uma melhoria na eficiência de supressão comparadas àscélulas que não tem, ou têm uma quantidade reduzida de membros da pluralidade de RSs.Estas células selecionadas/classificadas compreendem um RS ativo que aminoacila o O- RNAt. Um aminoacil-RNAt sintetase ortogonal identificado pelo método é também umrecurso da invenção.
Métodos de produzir uma proteína em uma célula (por exemplo, em uma célulaeubacteriana tal como um célula E. coli ou similares, ou em uma célula de levedura) tendo oaminoácido não natural em uma posição selecionada são também um recurso da invenção.Por exemplo, um método inclui crescer uma célula em um meio apropriado onde a célulacompreende um ácido nucléico que compreende pelo menos um códon seletor e codificauma proteína, fornecer o aminoácido não natural, e incorporar o aminoácido não natural naposição especificada na proteína durante a tradução do ácido nucléico com o pelo menosum códon seletor, produzindo dessa maneira a proteína. Uma célula compreende adicionalmente: um RNAt ortogonal (O-RNAt) que funciona na célula e reconhece o códonseletor; e, um aminoacil-RNAt sintetase ortogonal (O-RS) que preferencialmente aminoacilao O-RNAt com o aminoácido não natural. Uma proteína produzida por este método étambém um recurso da invenção.
A invenção também fornece composições que incluem proteínas, onde as proteínas compreendem fenilselenocisteína. Em certas modalidades, a proteína compreende umaseqüência de aminoácidos que é pelo menos 75 % idêntico àquela de uma proteínaconhecida, por exemplo, hormônio do crescimento humano, uma proteína terapêutica, umaproteína de diagnóstico, uma enzima industrial, ou porção destes. Opcionalmente, acomposição compreende um veículo farmaceuticamente aceitável.
ÁCIDO NUCLÉICO E SEQÜÊNCIAS DE POLIPEPTÍDEO E VARIANTES
Da maneira aqui descrita, a invenção fornece seqüências de polinucleotídeo quecodificam, por exemplo, O-RNAts e O-RSs1 eseqüências de aminoácido de polipeptídeo, porexemplo, O-RSs, e, por exemplo, composições, sistemas e métodos que compreendem odito polinucleotídeo ou seqüências de polipeptídeo. Exemplos das ditas seqüências, porexemplo, O-RNAt e aminoácido de O-RS e seqüência de nucleotídeos são revelados aqui(Ver figura 2). Portanto, versados na tecnologia perceberão que a invenção não estálimitada àquelas seqüências especificamente aqui recitadas, por exemplo, nos Exemplos elistagem de seqüência. Versados na tecnologia perceberão que a invenção também fornecemuitas seqüências relacionadas com as funções aqui descritas, por exemplo,polinucleotídeos e polipeptídeos que codificam variantes conservativas de um O-RS aquirevelado.
As construções e análise de espécie de sintetase ortogonal (O-RS) que sãocapazes de aminoacilar um O-RNAt cognato com fenilselenocisteína são descritos noExemplo 1. Este exemplo descreve as construções e análise da espécie O-RS que sãocapazes de incorporar o aminoácido não natural fenilselenocisteína.
A invenção fornece polipeptídeos (O-RSs) e polinucleotídeos, por exemplo,polinucleotídeos O-RNAt, que codificam O-RSs ou porções destes, oligonucleotídeosusados para isolar clones de aminoacil-RNAt sintetase, etc. Polinucleotídeos da invençãoincluem aqueles que codificam proteínas ou polipeptídeos de interesse da invenção com umou mais códons seletores. Além disso, polinucleotídeos da invenção incluem, por exemplo,um polinucleotídeo compreendendo uma seqüência de nucleotídeos apresentada em SEQID NO: 5, 7 ou 9, e um polinucleotídeo que é complementar ou que codifica uma seqüênciade polinucleotídeo destes. Um polinucleotídeo da invenção também inclui qualquerpolinucleotídeo que codifica uma seqüência de aminoácidos O-RS compreendendo SEQ IDNO: 4, 6 ou 8. Similarmente, um ácido nucléico artificial que hibridiza para umpolinucleotídeo indicado anteriormente em condições altamente rigorosas substancialmentepor todo o comprimento do ácido nucléico (e é um sem ser um polinucleotídeo de ocorrêncianatural) é um polinucleotídeo da invenção. Em uma modalidade, uma composição inclui umpolipeptídeo da invenção e um excipiente (por exemplo, tampão, água, excipientefarmaceuticamente aceitável, etc.). A invenção também fornece um anticorpo ou anti-soroespecificamente imuno-reativo com um polipeptídeo da invenção. Um polinucleotídeoartificial é um polinucleotídeo que é feito pelo homem, e não é de ocorrência natural.
Um polinucleotídeo da invenção também inclui um polinucleotídeo artificial que é,por exemplo, pelo menos 75 %, pelo menos 80 %, pelo menos 90 %, pelo menos 95 %, pelomenos 98 % ou mais idêntico àquele de um RNAt de ocorrência natural (mas é um RNAtsem ser de ocorrência natural). Um polinucleotídeo também inclui um polinucleotídeoartificial que é, por exemplo, pelo menos 75 %, pelo menos 80 %, pelo menos 90 %, pelomenos 95 %, pelo menos 98 % ou mais idêntico (mas não 100 % idêntico) àquele de umRNAt de ocorrência natural.
Em certas modalidades, um vetor (por exemplo, um plasmídeo, um cosmídeo, umfago, um vírus, etc.) compreende um polinucleotídeo da invenção. Em uma modalidade, ovetor é um vetor de expressão. Em uma outra modalidade, o vetor de expressão inclui umpromotor operável ligado a um ou mais dos polinucleotídeos da invenção. Em uma outramodalidade, uma célula compreende um vetor que inclui um polinucleotídeo da invenção.
Versados na tecnologia também percebem que muitas variantes das seqüênciasreveladas são incluídas na invenção. Por exemplo, variações conservativas das seqüênciasreveladas que rendem uma seqüência funcionalmente idêntica são incluídas na invenção.Variantes da seqüência de ácido nucléico de polinucleotídeos, em que as varianteshibridizam com pelo menos uma seqüência revelada, são consideradas incluídas nainvenção. Subseqüências exclusivas das seqüências aqui reveladas, determinadas, porexemplo, por técnicas de comparação de seqüência padrão, estão também incluídas nainvenção.
Variações Conservativas
Por causa da degeneração do código genético, "substituições silenciosas" (isto é,substituições em uma seqüência de ácido nucléico que não resultam em uma alteração emum polipeptídeo codificado) são um recurso implícito de cada seqüência de ácido nucléicoque codifica uma seqüência de aminoácido. Similarmente, "substituições de aminoácidoconservativas", onde um ou um número limitado de aminoácidos em uma seqüência deaminoácidos é substituído com aminoácidos diferentes com propriedades altamentesimilares, é também imediatamente identificado como altamente similar a uma construçãorevelada. Tais variações conservativas de cada seqüência revelada são um recurso dapresente invenção.
"Variações conservativas" de uma seqüência de ácido nucléico particular referem-se àqueles ácidos nucléicos que codificam seqüências de aminoácido idênticas ouessencialmente idênticas, ou, onde o ácido nucléico não codifica uma seqüência deaminoácido, com seqüências essencialmente idênticas. Versados na tecnologiareconhecerão que substituições individuais, deleções ou adições que alteram, adicionam oudeletam um aminoácido simples ou uma pequena porcentagem de aminoácidos (tipicamentemenos que 5 %, mais tipicamente menos que 4 %, 2 % ou 1 %) em uma seqüênciacodificada são "variações conservativamente modificadas" onde a alterações resultam nadeleção de um aminoácido, adição de um aminoácido, ou substituição de um aminoácidocom um aminoácido quimicamente similar. Assim, "variações conservativas" de umaseqüência de polipeptídeo listada da presente invenção incluem substituições de umapequena porcentagem, tipicamente menos que 5 %, mais tipicamente menos que 2 % ou 1%, dosaminoácidos da seqüência de polipeptídeo, com um aminoácido do mesmo grupo de substituição conservativa. Finalmente, a adição de seqüências que não alteram a atividadecodificada de uma molécula de ácido nucléico, tal como a adição de uma seqüência nãofuncional, é uma variação conservativa do ácido nucléico básico.
Tabelas de substituição conservativa fornecendo aminoácidos funcionalmentesimilares são bem conhecidas na tecnologia, onde um resíduo de aminoácido é substituído por um outro resíduo de aminoácido tendo propriedades químicas similares (por exemplo,cadeias laterais aromáticas ou cadeias laterais positivamente carregadas), e portanto nãomuda substancialmente as propriedades funcionais da molécula de polipeptídeo. Osseguintes grupos de exemplo apresentados que contêm aminoácidos naturais depropriedades químicas similares, onde substituições dentro de um grupo é uma "substituição conservativa".
Substituições de aminoácido conservativas
<table>table see original document page 50</column></row><table>
HIBRIDIZACÃO DE ÁCIDO NUCLÉICO.
Hibridização comparativa pode ser usada para identificar ácidos nucléicos dainvenção, incluindo variações conservativas de ácidos nucléicos da invenção, e este método de hibridização comparativa é um método preferido de ácidos nucléicos distinguíveis dainvenção. Além disso, ácidos nucléicos alvos que hibridizam com um ácido nucléicorepresentado pela SEQ ID NO: 5, 7, 9 ou 11, em condições de alto, ultra alto e ultra ultra altorigor são um recurso da invenção. Exemplos de tais ácidos nucléicos incluem aqueles comuma ou umas poucas substituições de ácido nucléico silenciosas ou conservativas,comparadas a uma dada seqüência de ácido nucléico.
Acredita-se que um ácido nucléico teste hibridiza especificamente com um ácidonucléico sonda quando ele hibridiza pelo menos 50 %, bem como a sonda para o alvocomplementar perfeitamente pareado, isto é, com uma razão sinal para ruído alta de pelomenos a metade da hibridização da sonda para o alvo em condições nas quais a sondaperfeitamente pareada se liga ao alvo complementar perfeitamente pareado com uma razãosinal para ruído que é pelo menos cerca de 5x - 10x tão alta quanto aquela observada parahibridização com qualquer dos ácidos nucléicos alvos não pareados.
Ácidos nucléicos "hibridizam" quando eles associam, tipicamente em solução.Ácidos nucléicos hibridizam em virtude de uma variedade de forças físico-químicas bemcaracterizadas, tais como ligação de hidrogênio, exclusão de solvente, empilhamento debase e similares. Um guia abrangente para a hibridização de ácidos nucléicos é encontradoem Tijssen (1993) Laboratory Techniques in Biochemistry and Molecular Biology—Hibridization whith Acid nucieic Probes, Part I, Chapter 2, "Overview of Principies ofHibridization and the Estrategy of Acid nucieic Probes Assays," (Elsevier, New York), bemcomo em Current Protocols in Molecular Biology, Ausubel et ai, eds., Current Protocols, ajoint venture between Greene Publishing Associates, Inc. and John Wiley & Sons, Inc.,(suplementado em 2004); and Hames and Higgins (1995), Gene Probes 1 and Gene Probes2, ambos de IRL Press at Oxford University Press, Oxford, England, fornecem detalhes nassínteses, marcação, detecção e quantificação de DNA e RNA, incluindo oligonucleotídeos.
Um exemplo de condições de hibridização rigorosa para hibridização de ácidosnucléicos complementares que têm mais do que 100 resíduos complementares em um filtroem um Southern ou northern blot é 50 % formalina com 1 mg de heparina a 42 0C1 com ahibridização sendo realizada por toda a noite. Um exemplo de condições de lavagemrigorosa é uma lavagem 0,2 χ SSCat 65 0C por 15 minutos (Ver, Sambrook et al. para umadescrição de tampão SSC; Sambrook et ai, Molecular Cloning - A Laboratory Manual (3rdEd.), Vol. 1-3, Cold Spring Harbor Laboratory, Cold Spring Harbor1 New York, 2001).Freqüentemente a lavagem de alta rigorosidade é precedida por uma lavagem de baixarigorosidade para remover sinal de sonda de fundo. Um exemplo de lavagem de baixarigorosidade é 2 χ SSC a 40 cC por 15 minutos. Em geral, uma razão sinal para ruído de 5 χ(ou maior) do que aquela observada por uma sonda não relacionada na ensaio dehibridização particular indica detecção de uma hibridização específica.
"Condições de lavagem de hibridização rigorosa" no contexto de hibridização deÁcido nucléico experimentam tais como hibridizações Southern e northern são dependentesde seqüência, e são diferente em parâmetros ambientais diferentes. Um guia abrangentepara a hibridização de ácidos nucléicos é encontrado em Tijssen (1993) LaboratoryTechniques in Biochemistry and Molecular Biology—Hibridization whith Acid nucieic Probes,Part I1 Chapter 2, "Overview of Príncipes of Hibridization and the Estrategy of Acid nucleicProbe Assay," (Elsevier, New York); e em Hames and Higgins (1995), Gene Probes 1 eGene Probes 2, ambos de IRL Press at Oxford University Press, Oxford, England.Condições de hibridização e lavagem rigorosa podem facilmente ser determinadas empiricamente por qualquer ácido nucléico teste. Por exemplo, na determinação decondições de hibridização e lavagem rigorosa, as condições de hibridização e lavagem sãogradualmente aumentadas (por exemplo, aumentando a temperatura, diminuindo aconcentração de sal, aumentando concentração de detergente e/ou aumentando aconcentração de solventes orgânicos tal como formalina na hibridização ou lavagem), até que um conjunto selecionado de critérios seja alcançado. Por exemplo, em condições dehibridização e lavagem altamente rigorosas, as condições de hibridização e lavagem sãogradualmente aumentadas até que uma sonda se ligue a um alvo perfeitamentecomplementar pareado com uma razão sinal para ruído que é pelo menos 5x maior que aobservada para hibridização da sonda com um alvo não pareado.
Condições "muito rigorosas" são selecionadas iguais ao ponto de fusão (Tm) poruma sonda particular. A Tm é a temperatura (em concentração iônica e pH definidos) na qual50 % da seqüência teste hibridiza com uma sonda perfeitamente pareada. Com ospropósitos da presente invenção, de um modo geral, condições de hibridização e lavagem"altamente rigorosas" são selecionadas em cerca de 5 cC menor que a Tm para a seqüênciaespecífica a uma concentração iônica e pH definidos.
"Condições de ultra alta rigorosidade" de hibridização e lavagem são aquelas nasquais a rigorosidade das condições de hibridização e lavagem são aumentadas até que arazão sinal para ruído para ligação da sonda para o ácido nucléico alvo perfeitamentecomplementar pareado é pelo menos 10 χ maior do a observada para hibridização com qualquer dos ácidos nucléicos alvos não pareados. Um ácido nucléico alvo que hibridizacom uma sonda em tais condições, com uma razão sinal para ruído de pelo menos /4 quedo ácido nucléico alvo complementar perfeitamente pareado se liga à sonda em condiçõesde ultra-alta rigorosidade.
Similarmente, níveis de rigorosidade ainda maiores podem ser determinadosaumentando gradualmente as condições de hibridização e/ou lavagem do ensaio dehibridização relevante. Por exemplo, aqueles nos quais a rigorosidade das condições dehibridização e lavagem são aumentadas até que a razão sinal para ruído para ligação dasonda com o ácido nucléico alvo complementar perfeitamente pareado é pelo menos 10 x,20 X, 50 X, 100 X, ou 500 X ou mais maior que a observada para hibridização com qualquer dos ácidos nucléicos alvos não pareados. Um ácido nucléico alvo que hibridiza com umasonda em tais condições, com uma razão sinal para ruído de pelo menos 1/2 que do ácidonucléico alvo complementar perfeitamente pareado se liga a sonda em condições de ultra-ultra-alta rigorosidade.
Ácidos nucléicos que não hibridizam uns com os outros em condições rigorosas sãoainda substancialmente idênticas se os polipeptídeos com o qual eles codificam foremsubstancialmente idênticos. Isto ocorre, por exemplo, quando uma cópia de um ácido nucléico é criada usando a degeneração de códon máxima permitida pelo código genético.
Subseqüências Exclusivas
Em alguns aspectos, a invenção fornece um ácido nucléico que compreende umasubseqüência exclusiva em um ácido nucléico selecionado das seqüências de O-RNAts eO-RSs aqui reveladas. A subseqüência exclusiva é exclusiva comparada a um ácido nucléico correspondente a qualquer seqüência de ácido nucléico O-RNAt ou O-RSconhecida. O alinhamento pode ser realizado usando, por exemplo, o BLAST ajustado nosparâmetros padrões. Qualquer subseqüência exclusiva é usada, por exemplo, como umasonda para identificar os ácidos nucléicos da invenção ou ácidos nucléicos relacionados.
Similarmente, a invenção inclui um polipeptídeo que compreende uma subseqüência exclusiva em um polipeptídeo selecionado das seqüências de O-RSs aquireveladas. Aqui, a subseqüência exclusiva é exclusiva comparada a um polipeptídeocorrespondente a qualquer seqüência de polipeptídeo conhecida.
A invenção também fornece ácidos nucléicos alvos que hibridizam em condiçõesrigorosas com um oligonucleotídeo de codificação exclusiva que codifica uma subseqüência exclusiva em um polipeptídeo selecionado das seqüências do O-RSs nas quais asubseqüência exclusiva é exclusiva, comparada a um polipeptídeo correspondente aqualquer dos polipeptídeos controle (por exemplo, seqüências parentais das quais sintetaseda invenção foi derivada, por exemplo, por mutação). Seqüências exclusivas sãodeterminadas conforme notado anteriormente.
Comparação de seqüência, identidade e homoloqiaOs termos "idêntico" ou "porcentagem de identidade" no contexto de duas ou maisseqüências de ácidos nucléicos ou polipeptídeos refere-se a duas ou mais seqüências ousubseqüências que são as mesmas ou têm uma porcentagem especificada de resíduo deaminoácidos ou nucleotídeos que são os mesmos, quando comparados e alinhados paracorrespondência máxima, medidos usando um dos algoritmos de comparação de seqüênciadescritos a seguir (ou outros algoritmos disponíveis pelos versados na tecnologia), ou porinspeção visual.
A frase "substancialmente idêntico", no contexto de dois ácidos nucléicos oupolipeptídeos (por exemplo, DNAs que codificam um O-RNAt ou O-RS, ou a seqüência de aminoácidos de um O-RS) refere-se a duas ou mais seqüências ou subseqüências que têmpelo menos cerca de 60 %, cerca de 80 %, cerca de 90-95 %, cerca de 98 %, cerca de 99 %ou mais identidade de nucleotídeo ou resíduo de aminoácido, quando comparadas ealinhadas para correspondência máxima, medidas usando um algoritmo de comparação deseqüência ou por inspeção visual. Tais seqüências "substancialmente idênticas" sãotipicamente consideradas "homólogas," sem referência a origem real. Preferivelmente1 a"identidade substancial" existe em uma região das seqüências que é pelo menos cerca de50 resíduos em comprimento, mais preferivelmente em uma região de pelo menos cerca de100 resíduos, e mais preferivelmente, as seqüências são substancialmente idênticas empelo menos cerca de 150 resíduos, ou no comprimento total das duas seqüênciascomparadas.
Seqüências de proteínas e/ou proteína são "homólogas" quando elas sãoderivadas, naturalmente ou artificialmente, de uma seqüência de proteína ou proteínaancestral comum. Similarmente, ácidos nucléicos e/ou seqüência de ácidos nucléicos sãohomólogas quando elas são derivadas, naturalmente ou artificialmente, de um ácidonucléico ou seqüência de ácido nucléico ancestral comum. Por exemplo, qualquer ácidonucléico de ocorrência natural pode ser modificado por qualquer método de mutagênesedisponível para incluir um ou mais códon seletor. Quando expresso, este ácido nucléicomutagenizado codifica um polipeptídeo que compreende um ou mais aminoácidos nãonaturais. O processo de mutação pode, é claro, adicionalmente alterar um ou mais códonspadrões, carregando igualmente dessa maneira um ou mais aminoácidos padrões naproteína mutante resultante. Homologia é de um modo geral inferido da similaridade deseqüência entre dois ou mais ácidos nucléicos ou proteínas (ou seqüências destes). Aporcentagem precisa de similaridade entre seqüências que é usada no estabelecimento dahomologia varia com o ácido nucléico e proteína em questão, mas apenas 25 % desimilaridade de seqüência são rotineiramente usados para estabelecer a homologia. Níveisde similaridade de seqüência maiores, por exemplo, 30 %, 40 %, 50 %, 60 %, 70 %, 80 %,90 %, 95 %, ou 99 % ou mais, podem também ser usados para estabelecer a homologia.Métodos para determinar as porcentagens de similaridade de seqüência (por exemplo,BLASTP e BLASTN usando parâmetros padrões) são aqui descritos e estão de um modogeral disponíveis.
Para comparação de seqüência e determinação da homologia, uma seqüência age tipicamente como uma seqüência de referência na qual seqüências teste são comparadas.Durante o uso de um algoritmo de comparação de seqüência, teste e seqüência dereferências são alimentados em um computador, subseqüências coordenadas sãodesignadas, se necessário, e parâmetros do programa de algoritmo de seqüência sãodesignados. O algoritmo de comparação de seqüência em seguida calcula a porcentagemde identidade de seqüência para a(s) seqüência(s) teste(s) com relação a seqüência dereferência, baseado nos parâmetros de programa designados.
Alinhamento de seqüências ideal para comparação pode ser conduzido, porexemplo, pelo algoritmo de homologia local de Smith and Waterman1 Adv. Appl. Math. 2:482(1981), pelo algoritmo de alinhamento de homologia de Needleman and Wunsch, J. Mol.Biol. 48:443 (1970), pela pesquisa para método de similaridade de Pearson e Lipman, Proc.Nat'l. Acad. Sei. USA 85:2444 (1988), pelas implementações computadorizadas destes algoritmos (GAP, BESTFIT, FASTA, e TFASTA em Wisconsin Genetics Software Package,Genetics Computer Group, 575 Science Dr., Madison, Wl), ou por inspeção visual (Ver deum modo geral Current Protocols In Molecular Biology, Ausubel et ai, eds., CurrentProtocols, a joint venture da Greene Publishing Associates, Inc. and John Wiley & Sons,Inc., (suplementado em 2004).
Um exemplo de um algoritmo que é adequado para determinar a porcentagem deidentidade de seqüência e similaridade de seqüência é o algoritmo BLAST, que é descritoem Altschul et ai, J. Mol. Biol., 215:403-410 (1990). O software para realizar análise BLASTé publicamente disponível pela National Center for Biotechnology Information (Ver oendereço de rede NCBI). Este algoritmo envolve primeiro identificar pares de seqüência dealta pontuação (HSPs) identificando palavras pequenas de comprimento W na seqüênciaconsulta, que tanto pareia quanto satisfaz alguns pontuações limites de valor positivo Tquando alinhados com um palavra do mesmo comprimento em uma seqüência da base dedados. T é referido como o limite de pontuações de palavra vizinha (Altschul et al., (1990) J.Mol. Biol., 215:403-410). Estas colisões de palavra vizinha inicial agem como sementes parainiciar pesquisas para encontrar conteúdos de HSPs maiores contendo-as. As colisões depalavra são em seguida estendidas em ambas direções ao longo de cada seqüência até queas pontuações de alinhamento cumulativo possam ser aumentadas. As pontuaçõescumulativas são calculadas usando, para seqüência de nucleotídeos, os parâmetros M(pontuações para trás para um par de resíduos pareados; sempre > 0) e N (pontuações depenalidade para resíduos não pareados; sempre < 0). Para seqüências de aminoácidos,uma matriz de pontuação é usada para calcular as pontuações cumulativas. A extensão dascolisões de palavra em cada direção pára quando: as pontuações de alinhamentocumulativas caem em uma quantidade X de seu valor máximo obtido; a pontuaçãocumulativa vai de zero ou menos, em virtude do acúmulo de um ou mais alinhamentos deresíduo de pontuação negativa; ou a extremidade de qualquer seqüência é atingida. Osparâmetros e algoritmo BLAST W, T1 e X determinam a sensibilidade e velocidade doalinhamento. O programa BLASTN (para seqüência de nucleotídeos) usa como padrões umcomprimento de palavra (W) de 11, uma expectativa (E) de 10, um corte de 100, M=5, N=-4,e uma comparação de ambas fitas. Para seqüências de aminoácido, o programa BLASTPusa como padrões um comprimento de palavra (W) de 3, um expectativa (E) de 10, e amatriz de pontuação BLOSUM62 (Ver Henikoff and Henikoff (1989) Proc. Natl. Acad. Sei.USA 89:10915).Além de calcular a porcentagem de identidade de seqüência, o algoritmo BLASTtambém realiza uma análise estatística da similaridade entre duas seqüências (Ver, porexemplo, Karlin and Altschul, Proc. Nat'l. Acad. Sei. USA 90:5873-5787 (1993)). Umamedida de similaridade fornecida pelo algoritmo BLAST é a probabilidade da soma mínima(P(N))1 que fornece uma indicação da probabilidade pela qual um pareamento entre duasseqüências de nucleotídeo ou aminoácido ocorreria por chance. Por exemplo, um ácidonucléico é considerado similar a uma seqüência de referência se a probabilidade da somamínima em uma comparação do ácido nucléico teste com a ácido nucléico de referência formenos que cerca de 0,1, mais preferivelmente menos que cerca de 0,01, e mais preferivelmente menos que cerca de 0,001.
Mutaqênese e Outras Técnicas de Biologia Molecular
Polinucleotídeo e polipeptídeos da invenção usados na invenção podem sermanipulados usando técnicas biológicas moleculares. Textos gerais que descrevem técnicasbiológicas moleculares incluem Berger and Kimmel, Guide to Molecular Cloning Techniques, Methods in Enzymology, volume 152 (1987), Academic Press, Inc., San Diego, CA;Sambrook et ai, Molecular Cloning - A Laboratory Manual (3rd Ed.), Vol. 1-3, Cold SpringHarbor Laboratory, Cold Spring Harbor, New York, 2001 and Current Protocols In MolecularBiology, Ausubel et al., eds., Current Protocols, uma joint venture da Greene PublishingAssociates, Inc. and John Wiley & Sons, Inc., (suplementado em 2004)). Estes textos descrevem mutagênese, o uso de vetores, promotores e muitos outros tópicos relevantesrelacionados por exemplo a geração de genes que incluem códons seletores para produçãode proteínas que incluem aminoácidos não naturais, RNAts ortogonais, sintetase ortogonal,e seus pares.
Vários tipos de mutagênese são usados na invenção, por exemplo, para mutar moléculas de RNAts, para produzir bibliotecas de RNAts, para produzir bibliotecas desintetase, para inserir códons seletores que codificam aminoácidos não naturais em umaproteína ou polipeptídeo de interesse. Eles incluem, mas sem limitações, sítio-dirigido,mutagênese de ponto aleatório, recombinação homóloga, embaralhamento de DNA ououtros métodos de mutagênese recursivos, construções quiméricas, mutagênese usando uracila contendo gabaritos, mutagênese direcionado a oligonucleotídeo, mutagênese deDNA modificado por fosforotioato, mutagênese usando DNA duplo aberto ou similares, ouqualquer combinação destes. Métodos adequados adicionais incluem reparo não pareadodo ponto, mutagênese usando cepas hospedeiras deficientes de reparo, restrição-seleção erestrição-purificação, mutagênese de deleção, mutagênese por síntese de gene total, reparo de ruptura da fita dupla, e similares. Mutagênese, por exemplo, envolvendo construçõesquiméricas, é também incluída na presente invenção. Em uma modalidade, mutagênesepode ser guiada por informação conhecida da molécula de ocorrência natural ou moléculade ocorrência natural alterada ou mutada, por exemplo, seqüência, comparações deseqüências, propriedades físicas, estrutura cristalina ou similares.
Células hospedeiras são geneticamente projetadas por engenharia (por exemplo,transformadas, convertidas ou transfectadas) com os polinucleotídeos da invenção ou construções que incluem um polinucleotídeo da invenção, por exemplo, um vetor dainvenção, que pode ser, por exemplo, um vetor de clonagem ou um vetor de expressão. Porexemplo, as regiões que codificam o RNAt ortogonal, o RNAt sintetase ortogonal, e aproteína a ser derivatizada são operáveis ligados aos elementos de controle de expressãode gene que são funcionais na célula hospedeira desejada. Vetores típicos contêm terminadores de transcrição e tradução, seqüências de iniciação de transcrição e tradução,e promotores usados para regulação da expressão do ácido nucléico alvo particular. Osvetores opcionalmente compreendem cassetes de expressão genérica contendo pelo menosuma seqüência terminadora independente, replicação permitindo seqüências do cassete emeucariotos, ou procariotos, ou ambos (por exemplo, vetores de transferência) e marcador de seleções tanto para sistemas procarióticos quanto eucarióticos. Vetores são adequadospara replicação e/ou integração em procariotos, eucariotos, ou preferível mente em ambos.Ver GiIIman and Smith, Gene 8:81 (1979); Roberts et ai, Nature. 328:731 (1987); Schneideret ai, Protein Expr. Puff. 6435:10 (1995); Current Protocols In Molecular Biology, Ausubel etai, Eds., Current Protocols, a joint venture between Greene Publishing Associates, Inc. ans John Wiley & Sons, Inc., (suplementado em 2004); Sambrook et ai, Molecular Cloning - ALaboratory Manual (3rd Ed.), Vol. 1-3, Cold Spring Harbor Laboratory, Cold Spring Harbor,New York, 2001; e Berger and Kimmel, Guide to Molecular Cloning Technics, Methods inEnzymology, volume 152 (1987), Academic Press, Inc., San Diego, CA. O vetor pode ser,por exemplo, na forma de um plasmídeo, uma bactéria, um vírus, um polinucleotídeo descoberto, ou um polinucleotídeo conjugado. Os vetores são introduzidos nas células e/oumicroorganismos por métodos padrões incluindo eletroporação (Fromm et al., Proc. Natl.Acad. Sei. USA 82, 5824 (1985), infection by viral vectors, high velocity ballistic penetrationby small particles whith the acid nucleic either within the matrix of small beads or particles, oron the surface (Klein et ai, Nature 327, 70-73 (1987)), e/ou similares.
Um sistema de plasmídeo simples altamente eficiente e versátil foi desenvolvidopara incorporação de sítio-específico de aminoácidos não naturais nas proteínas emresposta ao códon de parada âmbar (UAG) em E. coli. No sistema inédito, o par desupressor M. jannaschii RNAttyr(CUA) e tirosil-RNAt sintetase são codificados em umplasmídeo simples, que é compatível com a maioria dos vetores de expressão E. coli.Operon RNAt monocistrônico sob o controle de promotor e terminador proK foi construídopor processamento de estrutura secundária e RNAt ideal. Introdução de uma forma mutadade promotor glnS para a sintetase resultou em um aumento significativo tanto na eficiênciade supressão quanto fidelidade. Aumento na eficiência de supressão foi também obtido pormúltiplas cópias de gene RNAt, bem como por uma mutação específica (D286R) em umasintetase (Kobayashi et al., "Structural basis for RNAt ortogonal especificities of tirosil-,RNAsynthetases for genetic code expansion," Nat. Struct. Biol., 10(6):425-432 [2003]). Ageneralidade do sistema otimizado foi também demonstrado por incorporação altamenteeficiente e precisa de diversos aminoácidos não naturais diferentes, cujas utilidadesexclusivas no estudo da estrutura e função de proteína foram previamente demonstradas.
Um catálogo de Bactérias e Bacteriófagos usados para clonagem é fornecido, porexemplo, pelo ATCC, por exemplo, The ATCC Catalogue of Bactéria and Bacteriophage(1996) Gherna et al. (eds) publicado pelo ATCC. Procedimentos básicos adicionais paraseqüenciamento, clonagem e outros aspectos de biologia molecular e consideraçõesteóricas fundamentais são também encontrados em Sambrook et al., Molecular Cloning - ALaboratory Manual (3rd Ed.), Vol. 1-3, Cold Spring Harbor Laboratory, Cold Spring Harbor,New York, 2001; Current Protocols In Molecular Biology, Ausubel et al., eds., CurrentProtocols, uma joint venture da Greene Publishing Associates, Inc. and John Wiley & Sons,Inc., (suplementado em 2004); e em Watson et al. (1992) Recombinant DNA Second EditionScientific American Books, NY. Além disso, essencialmente qualquer ácido nucléico (equalquer ácido nucléico virtualmente marcado, quer padrão ou não ou padrão) pode serordenado de forma customizada ou padrão a partir de qualquer uma de uma variedade defontes comerciais, tal como o Midland Certified Reagent Company (Midland, TX), The GreatAmerican Gene Company (Ramona, CA), ExpressGen Inc. (Chicago, IL), OperonTechnologies Inc. (Alameda, CA) e muitos outros.
As células hospedeiras projetadas por engenharia podem ser cultivadas em meionutriente convencional modificado da maneira apropriada para tais atividades, por exemplo,como classificar etapas, ativar promotores ou selecionar transformantes. Estas célulaspodem opcionalmente ser cultivadas em organismos transgênicos. Outras referênciasusadas, por exemplo, para isolamento e cultura de célula (por exemplo, para isolamento deácido nucléico subseqüente) incluem Freshney (1994) Culture of Animal Cells. a Manual ofBasic Technique. third edition, Wiley- Liss, New York e as referências aqui citadas; Payne etal. (1992) Cell of plant and Tissue Culture in Liguid Sistems John Wiley & Sons, Inc. NewYork, NY; Gamborg and Phillips (eds) (1995) Cell of plant. Tissue and Organ Culture:Fundamental Methods Springer Lab Manual, Springer-Verlag (Berlin Heidelberg New York) eAtlas and Parks (eds) The Handbook of Microbiological Media (1993) CRC Press, BocaRaton, FL.
PROTEÍNAS E POLIPEPTÍDEOS DE INTERESSE
Métodos de produzir uma proteína em uma célula com um aminoácido não naturalem um posição especificada são também um recurso da invenção. Por exemplo, um métodoinclui crescer, em um meio apropriado, a célula, onde a célula compreende um ácidonucléico que compreende pelo menos um códon seletor e codifica uma proteína; e fornecero aminoácido não natural, onde a célula compreende adicionalmente: um RNAt ortogonal(O-RNAt) que funciona na célula e reconhece o códon seletor; e, um aminoacil-RNAt sintetase ortogonal (O-RS) que preferencialmente aminoacila o O-RNAt com o aminoácidonão natural. Uma proteína produzida por este método é também um recurso da invenção.
Em certas modalidades, o O-RS compreende uma predisposição para aaminoacilação do O-RNAt cognato em qualquer RNAt endógeno em um sistema deexpressão. Uma razão relativa entre O-RNAt e RNAt endógeno que é carregado pelo O-RS1quando o O-RNAt e O-RS estão presentes em concentrações molares iguais, é maior que1:1, preferivelmente pelo menos cerca de 2:1, mais preferivelmente 5:1, ainda maispreferivelmente 10:1, acima de tudo mais preferivelmente 20:1, ainda mais preferivelmente50:1, acima de tudo mais preferivelmente 75:1, ainda mais preferivelmente 95:1, 98:1, 99:1,100:1, 500:1, 1,000:1, 5,000:1 ou maior.
A invenção também fornece composições que incluem proteínas, onde as proteínascompreendem um aminoácido não natural. Em certas modalidades, a proteína compreendeuma seqüência de aminoácidos que é pelo menos 75 % idêntica àquela de uma proteínaterapêutica, uma proteína de diagnóstico, uma enzima industrial, ou porção destas.
As composições da invenção e composições feitas pelos métodos da invençãoopcionalmente são em uma célula. Os pares de O-RNAt/O-RS ou componentes individuaisda invenção podem em seguida ser usados em um maquinário de tradução do sistemahospedeiro, que resulta em um aminoácido não natural sendo incorporado em uma proteína.Publicação Internacional 2004/094593, depositado em 16 de abril de 2004, intitulado"EXPANDING THE EUCARYOTIC GENETIC CODE", e WO 2002/085923, intitulado "INVIVO INCORPORATION OF UNNNATURAL AMINO ACIDS," descrevem este processo, eestão incorporados aqui pela referência. Por exemplo, quando um par de O-RNAt/O-R éintroduzido em um hospedeiro, por exemplo, uma célula Escherichia coli, o par leva aincorporação in vivo de um aminoácido não natural tal como fenilselenocisteína em umaproteína em resposta a um códon seletor. O aminoácido não natural que é adicionado ao sistema pode ser um aminoácido sintético, tal como um derivado de um fenilalanina outirosina, que pode ser exogenamente adicionado ao meio e crescimento. Opcionalmente, ascomposições da presente invenção podem ser em um sistema de tradução in vitro, ou emum sistema(s) in vivo.
Uma célula da invenção fornece a capacidade de sintetizar proteínas quecompreendem aminoácidos não naturais usados em grandes quantidades. Em algunsaspectos, a composição opcionalmente inclui, por exemplo, pelo menos 10 microgramas,pelo menos 50 microgramas, pelo menos 75 microgramas, pelo menos 100 microgramas,pelo menos 200 microgramas, pelo menos 250 microgramas, pelo menos 500 microgramas,pelo menos 1 miligrama, pelo menos 10 miligramas ou mais da proteína que compreendeum aminoácido não natural, ou uma quantidade que pode ser obtida com métodos deprodução de proteína in vivo (detalhes na produção e purificação da proteína recombinantesão fornecidos aqui). Em um outro aspecto, a proteína está opcionalmente presente nacomposição a uma concentração de, por exemplo, .pelo menos 10 microgramas de proteínapor litro, pelo menos 50 microgramas de proteína por litro, pelo menos 75 microgramas deproteína por litro, pelo menos 100 microgramas de proteína por litro, pelo menos 200microgramas de proteína por litro, pelo menos 250 microgramas de proteína por litro, pelo menos 500 microgramas de proteína por litro, pelo menos 1 miligrama de proteína por litro,ou pelo menos 10 miligramas de proteína por litro ou mais, por exemplo, em um Iisado decelular, um tampão, um tampão farmacêutico, ou outras suspensões líquidas (por exemplo,em um volume, por exemplo, de qualquer valor a partir de cerca de 1 nL a cerca de 100 L).A produção de grandes quantidades (por exemplo, maior que aquela tipicamente possívelcom outros métodos, por exemplo, tradução in vitro) de uma proteína em uma célulaincluindo pelo menos um aminoácido não natural é um recurso da invenção.
A incorporação de um aminoácido não natural pode ser feita, por exemplo, paraadequar mudanças em estrutura e/ou função da proteína, por exemplo, mudar o tamanho,acidez, nucleofilicidade, ligação de hidrogênio, hidrofobicidade, acessibilidade de sítios alvos de protease, alvejar uma fração (por exemplo, para um arranjo de proteína), incorporação demarcadores ou grupos reativos, etc. Proteínas que incluem um aminoácido não naturalpodem propriedades físicas ou catalíticas melhores ou ainda totalmente novas. Porexemplo, as propriedades seguintes são opcionalmente modificadas pela inclusão de umaminoácido não natural em uma proteína: toxicidade, biodistribuição, propriedadesestruturais, propriedades espectroscópicas, propriedades químicas e/ou fotoquímicas,capacidade catalítica, meia-vida (por exemplo, meia-vida do soro), capacidade de reagircom outras moléculas, por exemplo, covalente ou não covalentemente, e similares. Ascomposições incluindo proteínas que incluem pelo menos um aminoácido não natural sãousadas, por exemplo, para novas terapêuticas, diagnósticos, enzimas catalíticas, enzimasindustriais, proteínas de ligação (por exemplo, anticorpos), e por exemplo, o estudo deestrutura e função da proteína. Ver, por exemplo, Dougherty, (2000) Unnnaturals AminoAcids as Probes of Protein Estruture and Funtion, Current Opinion in Chemical Bioloqy.4:645-652.
Em alguns aspectos da invenção, uma composição inclui pelo menos uma proteína com pelo menos um, por exemplo, pelo menos dois, pelo menos três, pelo menos quatro,pelo menos cinco, pelo menos seis, pelo menos sete, pelo menos oito, pelo menos nove, oupelo menos dez ou mais aminoácidos não naturais. Os aminoácidos não naturais podem seros mesmos ou diferente, por exemplo, pode haver 1, 2, 3, 4, 5, 6, 7, 8, 9 ou 10 ou maisdiferentes sítios na proteína que compreendem 1, 2, 3, 4, 5, 6, 7, 8, 9 ou 10 ou maisaminoácidos não naturais diferentes. Em um outro aspecto, uma composição inclui umaproteína com pelo menos um, mas não todos, de um aminoácido particular presente naproteína é um aminoácido não natural. Para uma dada proteína com mais que umaminoácidos não naturais, os aminoácidos não naturais podem ser idênticos ou diferentes(por exemplo, a proteína pode incluir dois ou mais diferente tipos de aminoácidos nãonaturais, ou pode incluir dois do mesmo aminoácido não natural). Para uma dada proteínacom mais que dois aminoácidos não naturais, os aminoácidos não naturais podem ser osmesmos, diferentes, ou um combinação de um aminoácido não natural múltiplo do mesmotipo com pelo menos um aminoácido não natural diferente.
Essencialmente qualquer proteína (ou porção desta) que inclui um aminoácido nãonatural (e qualquer ácido nucléico de codificação correspondente, por exemplo, que incluium ou mais códons seletores) pode ser produzida usando as composições e métodos aqui.Nenhuma tentativa é feita para identificar as centenas de milhares de proteínas conhecidas,qualquer das quais pode ser modificada para incluir um ou mais aminoácidos não naturais,por exemplo, qualquer método de mutação adequando disponível para incluir um ou maiscódons seletores apropriados em um sistema de tradução relevante. Repositórios deseqüência comuns para proteínas conhecidas incluem GenBank EMBL, DDBJ e o NCBI.Outros repositórios podem facilmente ser identificados pesquisando na Internet.
Tipicamente, a proteínas são, por exemplo, pelo menos 60 %, pelo menos 70 %,pelo menos 75 %, pelo menos 80 %, pelo menos 90 %, pelo menos 95 %, ou pelo menos 99% ou mais idênticas a qualquer proteína disponível (por exemplo, uma proteína terapêutica,uma proteína de diagnóstico, uma enzima industrial, ou porção destas, e similares), e elascompreendem um ou mais aminoácidos não naturais. Exemplos de proteínas terapêuticas,de diagnóstico e outras proteínas que podem ser modificadas para compreender um oumais aminoácidos não naturais podem ser encontrados, mas sem limitações, emPublicações Internacionais 2004/094593, depositado em 16 de abril de 2004, intitulado"EXPANDING THE EUCARYOTIC GENETIC CODE", e WO 2002/085923, intitulado "INVIVO INCORPORATION OF UNNATURAL AMINO ACIDS". Exemplos de proteínasterapêuticas, de diagnóstico, e outras proteínas que podem ser modificados paracompreender um ou mais aminoácidos não naturais incluem, mas sem limitações, porexemplo, hirudina, hormônio do crescimento humano, RAS, alfa-1 antitripsina, Angiostatina,fator Antiemolítico, anticorpos (mais detalhes nos anticorpos são encontrados a seguir),Apolipoproteína, Apoproteína, fator Atrial natriurético, polipeptídeo natriurético Atrial,peptídeos Atriais, C-X-C quimiocinas (por exemplo, T39765, NAP-2, ENA-78, Gro-a, Gro-b,Gro-c, IP-10, GCP-2, NAP-4, SDF-1, PF4, MIG), Calcitonina, quimiocinas CC (por exemplo,proteína quimioatrativa do monócito-1, proteína quimioatrativa do monócito-2, Proteínaquimioatrativa do monócito-3, Proteína inflamatória do monócito-1 alfa, proteína inflamatóriado monócito-1 beta, RANTES, I309, R83915, R91733, HCC1, T58847, D31065, T64262),Iigante CD40, Ligante C-kit, Colágeno, fator estimulante de Colônia (CSF), fator do Complemento 5a, inibidor do Complemento, receptor do Complemento 1, citocinas, (porexemplo, Peptídeo-78 de ativação do Neutrófilo epitelial, GROa/MGSA, GRO0, GROy, MIP-1a, MIP-1Ó, MCP-1), Fator de crescimento epidérmico (EGF), Eritropoietina ("EPO"),Toxinas esfoliantes A e B, Fator IX, Fator VII, Fator VIII, Fator X, Fator do crescimentoFibroblasto (FGF)1 Fibrinogênio, Fibronectina, G-CSF, GM-CSF, Glucocerebrosidase,Gonadotropina, fatores do crescimento, proteínas Hedgehog (por exemplo, Sonic, Indian,Desert), Hemoglobina, Fator do crescimento Hepatócito (HGF), hirudina, Albumina séricahumana, Insulina, Fator do crescimento tipo Insulina (IGF), interferons (por exemplo, IFN-σ,IFN-/?, IFN-y), interleucinas (por exemplo, IL-1, IL-2, IL-3, IL-4, IL-5, IL-6, IL-7, IL-8, IL-9, IL-10, IL-11, IL-12, etc.), Fator do crescimento Queratinócito (KGF), Lactoferrina, fator inibitório de leucemia, Luciferase, Neurturina, fator inibitório de Neutrófilo (NIP)1 oncostatina M,proteína Osteogênica, Hormônio do paratireóide, PD-ECSF, PDGF1 hormônios do peptídeo(por exemplo, Hormônio do crescimento humano), Pleiotropino, Proteína A, Proteína G,exotoxinas Pirogênicas A, B1 e C1 Relaxina1 Renina1 SCF, receptor I do complementoSolúvel, I-CAM 1 Solúvel, receptores de interleucina Solúvel (IL-1, 2, 3, 4, 5, 6, 7, 9, 10, 11,12, 13, 14, 15), receptor de TNF Solúvel, Somatomedina, Somatostatina, Somatotropina,Estreptoquinase, Superantigenos1 isto é, enterotoxinas Estafilococais (SEA1 SEB, SEC1,SEC2, SEC3, SED, VER), superóxido de dismutase (SOD), toxina síndrome do choquetóxico (TSST-1), timosina alfa 1, ativador plasminogênio do Tecido, fator beta de necrosetumoral (TNF beta), receptor do fator de necrose tumoral (TNFR)1 fator-alfa de necrosetumoral (TNF alfa), Fator do crescimento endotelial vascular (VEGEF), uroquinase e muitosoutros.
Uma classe de proteínas que pode ser feita usando as composições e métodospara incorporação de aminoácidos não naturais iri vivo aqui descritos inclui moduladorestranscricionais ou uma porção destes. Exemplo de moduladores transcricionais inclui genese proteínas moduladoras transcricionais que modulam o crescimento, diferenciação eregulação celular, ou similares. Moduladores transcricionais são encontrados emprocariotos, vírus e eucariotos, incluindo fungo, plantas, levedura, insetos e animais,incluindo mamíferos, fornecendo uma ampla faixa de alvos terapêuticos. Percebe-se queativadores de expressão e transcricionais regulam transcrição por muitos mecanismos, por exemplo, ligando a receptores, estimulando uma cascata de transdução de sinal, regulandoexpressão de fatores de transcrição, ligando a promotores e melhoradores, ligando aproteínas que se ligam a promotores e melhoradores, desdobrando DNA, unindo pre-mRNA,poliadenilando RNA1 e degradando RNA.
Uma classe de proteínas da invenção (por exemplo, proteínas com um ou maisaminoácidos não naturais) inclui proteínas biologicamente ativas tais como citocinas,moléculas inflamatórias, fatores do crescimento, seus receptores, e produtos do oncogene,por exemplo, interleucinas (por exemplo, IL-1, IL-2, IL-8, etc.), interferons, FGF, IGF-I1IGF-II,FGF1 PDGF, TNF, TGF-σ, TGF-0, EGF, KGF, SCF/c-Kit, CD40L/CD40, VLA-4/VCAM-1,ICAM-1/LFA-1, e hialurina/CD44; moléculas de transdução de sinal e produtos do oncogenecorrespondentes, por exemplo, Mos, Ras1 Raf, e Met; e ativadores e supressorestranscricionais, por exemplo, p53, Tat, Fos, Myc1 Jun, Myb, Rei, e receptores do hormônioesteróide tal como aquele para estrogênio, progesterona, testosterona, aldosterona, oIigante do receptor de LDL e corticosterona.
Enzimas (por exemplo, enzimas industriais) ou porções destas com pelo menos umaminoácido não natural são também fornecidas pela invenção. Exemplos de enzimasincluem, mas sem limitações, por exemplo, amidases, racemases de aminoácido, acilases,dealogenases, dioxigenases, diarilpropano peroxidases, epimerases, epóxido hidrolases,esterases, isomerases, quinases, glicose isomerases, glicosidases, glicosil transferases,haloperoxidases, monooxigenases (por exemplo, p450s), lipases, Iignina peroxidases, nitrilahidratases, nitrilases, proteases, fosfatases, subtilisinas, transaminase, e nucleases.
Muitas destas proteínas estão comercialmente disponíveis (Ver, por exemplo,Sigma BioSciences), e as seqüências de proteína e genes correspondentes, e tipicamente,muitos variantes destes, são bem conhecidas (Ver, por exemplo, Genbank). Qualquer delaspode ser modificada pela inserção de um ou mais aminoácidos não naturais de acordo coma invenção, por exemplo, para alterar a proteína com relação a uma ou mais propriedadesterapêutica, de diagnóstico ou enzimática de interesse. Exemplos de propriedadesterapeuticamente relevantes incluem meia-vida sérica, meia-vida em prateleira, estabilidade,imunogenicidade, atividade terapêutica, detectabilidade (por exemplo, pela inclusão degrupos reportadores (por exemplo, marcadores ou sítios de ligação de marcador) nosaminoácidos não naturais), redução de LD50 ou outros efeitos colaterais, capacidade deentrar no corpo através do trato gástrico (por exemplo, disponibilidade oral), ou similares.
Exemplos de propriedades de diagnóstico incluem meia-vida em prateleira, estabilidade,atividade de diagnóstico, detectabilidade ou similares. Exemplos de propriedadesenzimáticas relevantes incluem meia-vida em prateleira, estabilidade, atividade enzimática,capacidade de produção, ou similares.
Uma variedade de outras proteínas pode também ser modificada para incluir um oumais aminoácidos não naturais usando composições e métodos da invenção. Por exemplo,a invenção pode incluir substituir um ou mais aminoácidos naturais em uma ou maisproteínas de vacina com um aminoácido não natural, por exemplo, em proteínas de fungosinfecciosos, por exemplo, Aspergillus, espécie de Candida; bactéria, particularmente E. coli,que serve de modelo para bactéria patogênica, bem como bactéria medicamente importantetais como Staphylococci (por exemplo, aureus), ou Streptococci Cpor exemplo, pneumoniae);protozoário tal como esporozoário (por exemplo, Plasmodia), rhizopods Cpor exemplo,Entamoeba) e flagelados (Trypanosome, Leishmania, Triehomonas, Giardia, etc.); vírus taiscomo vírus RNA (+) (exemplos incluem Poxvírus por exemplo, vaeeinia; Picornavírus, porexemplo, polio; Togavírus, por exemplo, rubella; Flavivírus, por exemplo, HCV; eCoronavírus), vírus RNA (-) (por exemplo, Rabdovírus, por exemplo, VSV; Paramixovírus,por exemplo, RSV; Ortomixovírus, por exemplo, influenza; Buniavírus; e Arenavírus), vírusdsDNA (Reowírus, por exemplo), vírus RNA a DNA, isto é, Retrovírus, por exemplo, HIV eHTLV, e certos vírus DNA a RNA tais como Hepatite B.
Proteínas agriculturalmente relacionados tais como proteínas de resistência ainseto (por exemplo, o Cri proteínas), enzimas de produção de amido e lipídio, toxinas deplanta e inseto, proteínas de resistência a toxina, proteínas de desintoxicação de Micotoxina,enzimas de crescimento de planta (por exemplo, Ribulose 1,5-bisfosfatoCarboxilase/Oxigenase, "RUBISCO"), Iipoxigenase (LOX), e Fosfoenolpiruvato (PEP)carboxilase são também alvos adequados para modificação de aminoácido não natural.
Em certas modalidades, a proteína ou polipeptídeo de interesse (ou porção destes)nos métodos e/ou composições da invenção é codificada por um ácido nucléico.Tipicamente, o ácido nucléico compreende pelo menos um códon seletor, pelo menos doiscódons seletores, pelo menos três códons seletores, pelo menos quatro códons seletores,pelo menos cinco códons seletores, pelo menos seis códons seletores, pelo menos setecódons seletores, pelo menos oito códons seletores, pelo menos nove códons seletores, dezou mais códons seletores.
Genes que codificam proteínas ou polipeptídeos de interesse podem sermutagenisados usando métodos bem conhecidos pelos versados na tecnologia e aquidescritos em "Mutagenesis and Other Molecular Biology Techniques" para incluir, porexemplo, um ou mais códons seletores para a incorporação de um aminoácido não natural.Por exemplo, um ácido nucléico para uma proteína de interesse é mutagenisado para incluir um ou mais códons seletores, fornecendo a inserção de um ou mais aminoácidos nãonaturais. A invenção inclui qualquer variante deste, por exemplo, mutante, versões dequalquer proteína, por exemplo, incluindo pelo menos um aminoácido não natural.Similarmente, a invenção também inclui ácidos nucléicos correspondentes, isto é, qualquerácido nucléico com um ou mais códons seletores que codificam um ou mais aminoácidosnão naturais.
Para preparar uma proteína que inclui um aminoácido não natural, pode-se usarcélulas hospedeiras e organismos que são adaptados para a incorporação in vivo doaminoácido não natural por meio de pares RNAt/RS ortogonais. Células hospedeiras sãogeneticamente projetadas por engenharia (por exemplo, transformadas, convertidas outransfectadas) com um ou mais vetores que expressam o RNAt ortogonal, o RNAt ortogonalsintetase, e um vetor que codifica a proteína a ser derivatizada. Cada um dessescomponentes pode estar no mesmo vetor, ou cada um pode estar em um vetor separado, oudois componentes podem estar em um vetor e o terceiro componente em um segundo vetor.O vetor pode ser, por exemplo, na forma de um plasmídeo, uma bactéria, um vírus, umpolinucleotídeo nu, ou um polinucleotídeo conjugado.
Definição de Polipeptídeos por Imunoreatividade
Em virtude de os polipeptídeos da invenção fornecerem uma variedade de novasseqüências de polipeptídeo (por exemplo, polipeptídeos que compreendem aminoácidosnão naturais no caso de proteínas sintetizadas nos sistemas de tradução aqui, ou, porexemplo, no caso das sintetases inéditas, seqüências inéditas de aminoácidos padrões), ospolipeptídeos também fornecem novos recursos estruturais que podem ser reconhecidos,por exemplo, em ensaios imunológicos. A geração de anti-soro, que liga especificamente ospolipeptídeos da invenção, bem como os polipeptídeos que são ligados por anti-soro comoesse, são um recurso da invenção. O termo "anticorpo", da maneira aqui usada, inclui, massem limitações, um polipeptídeo substancialmente codificado por um gene deimunoglobulina ou genes de imunoglobulina, ou fragmentos destes que ligamespecificamente e reconhecem um analito (antígeno). Exemplos incluem anticorpos decadeia policlonal, monoclonal, quimérica e simples, e similares. Fragmentos deimunoglobulinas, incluindo fragmentos Fab e fragmentos produzidos por uma biblioteca deexpressão, incluindo exibição de fago, são também incluídos no termo "anticorpo" damaneira aqui usada. Ver, por exemplo, Paul, Fundamental Immunoloqy. 4th Ed., 1999,Raven Press, New York, para estrutura e terminologia de anticorpo.
A fim de produzir anti-soro para uso em um imunoensaio, um ou mais dospolipeptídeos imunogênicos são produzidos e purificados da maneira aqui descrita. Porexemplo, proteína recombinante pode ser produzida em uma célula recombinante. Umacepa natural de camundongos (usada neste ensaio em virtude de os resultados serem maisreprodutíveis em virtude da identidade genética virtual dos camundongos) é imunizada coma(s) proteína(s) imunogênica(s) em combinação com um adjuvante padrão, tal comoadjuvante de Freund, e um protocolo de imunização de camundongo padrão (Ver, porexemplo, Harlow and Lane (1988) Antibodies. A Laboratorv Manual. Cold Spring HarborPublications, New York, para uma descrição padrão de geração de anticorpo, formatos econdições de imunoensaio que podem ser usados para determinar imunoreatividadeespecífica. Detalhes adicionais em proteínas, anticorpos, anti-soro, etc. podem serencontrados em International Publication Numbers WO 2004/094593, intitulado"EXPANDING THE EUCARYOTIC GENETIC CODE;" WO 2002/085923, intitulado "IN VIVOINCORPORATION OF UNNATURAL AMINO CIDS", WO 2004/035605, intitulado"GLYCOPROTEIN SYNTHESIS", e WO 2004/058946, intitulado "PROTEIN ARRAYS."
USE DE PARES O-RNA E O-RS E O-RNAt/O-RS
As composições da invenção e composições feitas pelos métodos da invençãoestão opcionalmente em uma célula. Os pares de O-RNAt/O-RS ou componentes individuaisda invenção podem em seguida ser usados em um maquinário de tradução do sistemahospedeiro, o que faz com que um aminoácido não natural seja incorporado em umaproteína. International Publication Number WO 2002/085923 by Schultz, et ai, intitulado "INVIVO INCORPORATION OF UNNATURAL AMINO CIDS", descreve este processo e estáincorporado aqui pela referência. Por exemplo, quando um par de O-RNAt/O-RS éintroduzido em um hospedeiro, por exemplo, Escherichia coil ou levedura, o par leva àincorporação in vivo de um aminoácido não natural, que pode ser exogenamente adicionadoao meio de crescimento, em uma proteína, por exemplo, uma proteína teste de mioglobinaou uma proteína terapêutica, em resposta a um códon seletor, por exemplo, um códon nãosentido âmbar. Opcionalmente, as composições da invenção podem ser em um sistema detradução in vitro, ou em um(s) sistema(s) celular(s) in vivo. Proteínas com o aminoácido nãonatural podem ser usadas em qualquer de uma ampla faixa de aplicação. Por exemplo, afração não natural incorporada em uma proteína pode servir como um alvo para qualquer deuma ampla faixa de modificações, por exemplo, reticulando com outras proteínas, compequenas moléculas tais como marcadores ou corantes e/ou biomoléculas. Com estasmodificações, a incorporação do aminoácido não natural pode resultar em melhoresproteínas terapêuticas e pode ser usada para alterar ou melhorar a função catalítica deenzimas. Em alguns aspectos, a incorporação e modificação subseqüente de umaminoácido não natural em uma proteína pode facilitar estudos na estrutura da proteína,interações com outras proteínas, e similares.
ESTOJOS
Estojos são também um recurso da invenção. Por exemplo, é fornecido um estojopara produzir uma proteína que compreende pelo menos um aminoácido não natural em uma célula, onde o estojo inclui pelo menos um recipiente contendo uma seqüência depolinucleotídeos que codifica um O-RNAt, e/ou um O-RNAt, e/ou uma seqüência depolinucleotídeos que codifica um O-RS, e/ou um O-RS. Em uma modalidade, o estojo incluiadicionalmente o aminoácido não natural fenilselenocisteína. Em uma outra modalidade, oestojo compreende adicionalmente materiais instrucionais para produzir a proteína e/ou umacélula hospedeira.
EXEMPLOS
Os exemplos seguintes são oferecidos para ilustrar, mas não para limitar, ainvenção reivindicada. Versados ná tecnologia reconhecerão uma variedade de parâmetrosnão críticos que podem ser alterados sem fugir do escopo da invenção reivindicada.Entende-se que os exemplos e modalidades aqui descritos têm propósitos apenasilustrativos e que várias modificações ou mudanças à luz desta serão sugeridos pelosversados na tecnologia e que deverão estar incluído no espírito e propósito deste pedido eescopo das reivindicações anexas.
EXEMPLO
Seleção genética de Sintetases Mutantes Específicas para Fenilselenocisteína
QUÍMICA REATIVA DE FENILSELENOCISTEÍNA
Selênio é um elemento essencial tanto em síntese orgânica quanto biologia.
Demonstrou-se que uma fração de fenilseleno pode ser oxidada em condições brandas, e aeliminação espontânea de syn do selenóxido resulta na formação de olefina. Esta estratégiatem sido usada extensivamente em síntese total.
A incorporação de um aminoácido não natural contendo selênio em proteínas criaráum alvo atrativo para modificação pós-translacional altamente seletiva de proteínas, porexemplo, para produzir proteínas seletivamente lipidadas. Um aminoácido seleno nãonatural como esse é fenilselenocisteína (CAS Registry Number 71128-82-0), sinonimamentedenominada fenilselenida ou Se-Fenil-L-selenocisteína. Esta estrutura é fornecida na figura1, estrutura 1. Este aminoácido não natural pode ser obtido, por exemplo, da Sigma®-Aldrich® Co., Inc., número de catálogo 50827.
Clivagem oxidativa de um resíduo de aminoácido fenilselenocisteína resulta noaminoácido deidroalanina σ,β-insaturado (Ver figura 1, estrutura 2). Deidroalanina éencontrada em inúmeros peptídeos de ocorrência natural (Chatterjee et al. (2005), ChemicalReviews 105(2):633-683). Deidropeptídeos contendo resíduos de cisteína não protegidossofrem adição de conjugado estereosseletivo intramolecular para produzir Iantioninascíclicas (Chatterjee et al. (2005), Chemical Reviews 105(2):633-683). Lantioninas sãoestruturas que são encontradas em !antibióticos, uma classe de antibióticos modificadospós-translacionalmente (Chatterjee et al. (2005), ChemicaIReviews 105(2):633-683).
Reações de adição de Michael do aminoácido não natural deidroalanina (Ver figura1, estrutura 2) podem resultar em proteínas com modificações pós-translacionais, porexemplo, por reação com um tio-lipídio para gerar uma proteína lipidada. Maisespecificamente, reação com ácido tiopalmítico resulta em palmitoilcisteína (Ver figura 1,estrutura 3), reação com farnesilmercaptano disponibiliza farnesilcisteína (Ver figura 1,estrutura 4), e reação com malonato produz ácido γ-carboxiglutâmico (Ver figura 1, estrutura6). Além disso, reação com 1-hexadecanetiol resulta em S-hexadecilcisteína (Ver figura 1,estrutura 5). Embora S-hexadecilcisteína não seja uma modificação pós-translacional nativa,a presença deste resíduo em proteína pode ter propriedades desejadas; por exemplo, elapode resultar em ligação de albumina sérica humana, e maior estabilidade in vivo daproteína.
A lipidação de polipeptídeos por modificação alvejada de resíduos defenilselenocisteína pode ter propriedades desejadas, tais como localização de membrana, melhor estabilidade in vivo (isto é, maior meia-vida) e solubilidade de lipídio. Além disso, asformas Iipidadas de algumas proteínas são as formas biologicamente ativas.
PRODUÇÃO DE PROTEÍNAS QUE COMPREENDE FENILSELENOCISTEÍNA
Metodologias que permitem a adição sistemática de aminoácidos não naturais aoscódigos genéticos de E coli, levedura e célula mamíferas foram descritas anteriormente. Tais métodos são baseados na evolução de um supressor RNAt não sentido um paraminoacil-RNAt sintetase (RS) que tem a propriedade de ortogonalidade, definida como acapacidade de incorporar seletivamente um dado aminoácido em resposta a um códonexclusivo sem passar por reação cruzada com RNAts do hospedeiro endógeno, aminoacil-RNAt sintetase, ou aminoácidos.
Uma presente invenção fornece composições e métodos para a geração depolipeptídeos in vivo contendo o aminoácido não natural fenilselenocisteína pela criação dereagentes ortogonais que permitem a incorporação translacional geneticamente programadadeste aminoácido não natural diretamente em uma cadeia do polipeptídeos em crescimento.Além disso, o uso destes sistemas ortogonais permite a produção de grandes quantidades de polipeptídeos contendo o aminoácido não natural (isto é, quantidades muito grandes dospolipeptídeos que seria possível usando outros métodos de síntese). Polipeptídeos quecompreendem fenilselenocisteína podem ser usados em reações de modificação alvejadas,por exemplo, mas sem limitações, a geração de polipeptídeos artificialmente Iipidados deacordo com as instruções da presente especificação. Tais proteínas modificadas encontram uma variedade de usos, incluindo, mas sem limitações, melhores agentes terapêuticos.
Para gerar um par de RNAt ortogonal/aaRS que insere exclusivamentefenilselenocisteína (figura 1, estrutura 1), uma biblioteca de mutantes de sítio ativo doMethanococcus jannaschii tirosil-RNAt sintetase (M)TyrRS), que especificamente carregaum supressor não sentido M. jannaschii projetado por engenharia (MjRNAtTyrcuA) não reconhecido pela E. coli sintetase, foi usado. Uma biblioteca de pBK-lib5 sintetase, damaneira descrita em Wang et ai. (2006), Annual Review of Biophysics and BiomolecularStruture 35:225-249, foi usada na classificação e submetida a uma série de seleçõespositiva e negativa. A sobrevivência na seleção positiva foi contingente mediante asupressão de uma mutação âmbar no gene cloranfenicol acetiltransferase (CAT) na presença de fenilselenocisteína; a sobrevivência na seleção negativa foi contingentemediante supressão inadequada de mutações âmbar em um gene que codifica a proteínabarnase tóxica na ausência de fenilselenocisteína. Clones sobrevivem tanto através deetapas positiva quanto negativa de seleção apenas se eles incorporarem exclusivamentefenilselenocisteína em resposta ao códon âmbar.
Após estas seleções, foram identificados candidatos a clone que permitiram que ascélulas abrigassem o gene CAT com um códon seletor de mutação âmbar em um sítiopermissivo para sobreviver na presença de cloranfenicol apenas na presença defenilselenocisteína. Na ausência de fenilselenocisteína, as mesmas células não crescem napresença de cloranfenicol, consistente com incorporação de fenilselenocisteína eficientecom pouca ou nenhuma sobrevivência de fundo da incorporação de aminoácidosendógenos.
Seqüenciamento dos clones sintetase mutante candidatos revelaram três diferentesintetase isoladas, cada uma das quais é capaz de funcionar em um sistema deORTOGONAL TRANSLATION
Clone 1 (PhSeRS-SD): Y32W, L65E, H70G, D158Q, L162SClone 2 (PhSeRS-K4): Y32W, L65H, H70G, F108N, Q109S, D158S, L162EClone 3 (PhSeRS-K5): Y32W, L65H, A67G, H70G, F108K, Q109S, D158E, L162E
Estes clones são sumarizados mais detalhadamente na tabela a seguir.
Seqüências de aminoácidos tirosil-RNAt sintetase de Methanococcus jannaschiiTipo selvagem e Mutantes
32 65 67 70 108 109 158 162 SEQID NO:Tipo selvagem r Leu Ala His Phe Gln Asp Leu 2Clone 1 Mutante (SD) Trp Glu Ala Gly Phe Gln Gln Ser 4Clone 2 Mutante (K4) Trp His Ala Gly Asn Ser Ser Glu 6Clone 3 Mutante (KS) Trp His Gly Gly Lys Ser Glu Glu 8
Das três sintetases mutantes isoladas, a sintetase do clone 2 (PhSeRSK4) teve amais alta atividade e especificidade. O nucleotídeo e seqüências de aminoácidos completosde cada um desses clones e a espécie tipo selvagem correspondente são fornecidos nafigura 2.
VALIDAÇÃO DA SINTETASE ORTOGONAL
Usando a sintetase mutante aqui descrita, uma proteína modelo mioglobinacontendo um códon seletor fr âmbar na posição 4 (TAG4) foi expressa com 1,5-2 mg/L de rendimento sem nenhuma expressão de fundo na ausência de fenilselenocisteína. Estaproteína modelo contendo fenilselenocisteína foi adicionalmente submetida a modificaçãopós-translacional para produzir ácido γ-carboxiglutâmico (figura 1 estrutura 6), que foiconfirmado usando espectrometria de massa de alta resolução.
Duas proteínas modelos adicionais compreendendo fenilselenocisteína foram também expressas com 3-5 mg/L de rendimento usando o sistema de produção de sintetasemutante e ortogonal in vivo aqui descrito. Hormônio do crescimento humano (hGH) foiproduzido contendo fenilselenocisteína. Após a produção da forma de fenilselenocisteína, aproteína foi submetida a modificação para produzir hGH que contém S-hexadecilcisteína. Aspropriedades de ligação da albumina sérica humana e a meia-vida in vivo do hGHmodificado em camundongos estão atualmente sendo testadas.
Os reagentes ortogonais aqui descritos foram também usados para produzirproteína fluorescente verde (GFP) contendo fenilselenocisteína. Essa forma da proteína foitambém subseqüentemente modificada para formar, alternativamente, S-hexadecilcisteína,farnesilcisteína e palmitoilcisteína de GFP. As propriedades de alvejando da membranadessas formas Iipidadas de GFP estão atualmente sendo testadas.
Assim, a presente invenção fornece composições e métodos para a produção deproteínas geneticamente programadas contendo o aminoácido não naturalfenilselenocisteína (Ver figura 1, estrutura 1). A subseqüente eliminação oxidativa porperóxido de hidrogênio produz deidroalanina (Ver figura 1, estrutura 2) na posição desejada.Esta fração de deidroalanina pode em seguida ser alvejada em várias reações secundáriasde modificação.
Embora a invenção apresentada tenha sido descrita com algum detalhe compropósitos de clareza e entendimento, fica claro aos versados na tecnologia, a partir daleitura dessa revelação, que várias mudanças nesta revelação na forma e detalhes podemser feitas sem fugir do espírito e escopo da invenção. Todas as publicações, patentes,pedidos de patente, e/ou outros documentos citados neste pedido estão incorporados pelareferência na sua íntegra com todos os propósitos, como se cada publicação, patente,pedido de patente individual e/ou outro documento estivessem individualmente indicadospara ser incorporados pela referência com todos os propósitos.LISTAGEM DE SEQÜÊNCIA<110> The Scripps Research InstituteWANG, JIANGYUNSCHULTZ, PETER G
<120> "EXPRESSÃO DE PROTEÍNAS GENETICAMENTE PROGRAMADA
CONTENDO O AMINOÁCIDO NÃO NATURAL FENILSELENOCISTEÍNA"
<130> 54-001820US
<140> US 11/724,039<141> 2007-03-13
<160> 9
<170> Patentln version 3.4
<210> 1
<211> 77
<212> RNA
<213> Artificial
<220>
<223> nonsense suppressor tyrosyl-tRNA CUA derived from Methanococcusjannaschii
<400> 1
ccggcgguag uucagcaggg cagaacggcg gacucuaaau ccgcauggcg cugguucaaa 60uccggcccgc cggacca 77
<210> 2<211> 306<212> PRT
<213> Methanococcus jannaschii<400> 2
Met Asp Glu Phe Glu Met Ile Lys Arg Asn Thr Ser Glu Ile Ile ser15 10 15
Glu Glu Glu Leu Arg Glu Val Leu Lys Lys Asp Glu Lys Ser Ala Tyr20 25 30
Ile Gly Phe Glu Pro Ser Gly Lys Ile His Leu Gly His Tyr Leu Gln35 40 45
Ile Lys Lys Met Ile Asp Leu Gln Asn Ala Gly Phe Asp Ile Ile Ile50 55 60
Leu Leu Ala Asp Leu His Ala Tyr Leu Asn Gln Lys Gly Glu Leu Asp65 70 75 80
Glu Ile Arg Lys Ile Gly Asp Tyr Asn Lys Lys Val Phe Glu Ala Met85 90 95
Gly Leu Lys Ala Lys Tyr Val Tyr Gly Ser Glu Phe Gln Leu Asp Lys100 105 110Asp Tyr Thr Leu Asn Val Tyr Arg Leu Ala Leu Lys Thr Thr Leu Lys
115 120 125
Arg Ala Arg Arg ser Met Glu Leu lie Ala Arg Glu Asp Glu Asn Pro130 135 140
Lys vai Ala Glu Val Ile Tyr Pro Ile Met Gln vai Asn Asp Ile His145 150 155 160
Tyr Leu Gly Val Asp Val Ala Val Gly Gly Met Glu Gln Arg Lys Ile165 170 175
His Met Leu Ala Arg Glu Leu Leu Pro Lys Lys vai vai cys He His180 185 190
Asn Pro vai Leu Thr Gly Leu Asp Gly Glu Gly Lys Met ser ser Ser195 200 205
Lys Gly Asn Phe Ile Ala Val Asp Asp Ser Pro Glu Glu Ile Arg Ala210 215 220
Lys Ile Lys Lys Ala Tyr Cys Pro Ala Gly Val vai Glu Gly Asn Pro225 230 235 240
Ile Met Glu lie Ala Lys Tyr Phe Leu Glu Tyr Pro Leu Thr Ile Lys245 250 255
Arg Pro Glu Lys Phe Gly Gly Asp Leu Thr Val Asn Ser Tyr Glu Glu260 265 270
Leu Glu ser Leu Phe Lys Asn Lys Glu Leu His Pro Met Asp Leu Lys275 280 285
Asn Ala Val Ala Glu Glu Leu Ile Lys Ile Leu Glu Pro Ile Arg Lys290 295 300
Arg Leu305
<210> 3
<211> 918
<212> DNA
<213> Methanococcus jannaschii
<400> 3
atggacgaat ttgaaatgat aaagagaaac acatctgaaa ttatcagcga ggaagagtta 60
agagaggttt taaaaaaaga tgaaaaatct gcttacatag gttttgaacc aagtggtaaa 120
atacatttag ggcattatct ccaaataaaa aagatgattg atttacaaaa tgctggattt 180
gatataatta tattgttggc tgatttacac gcctatttaa accagaaagg agagttggat 240
gagattagaa aaataggaga ttataacaaa aaagtttttg aagcaatggg gttaaaggca 300aaatatgttt atggaagtga attccagctt gataaggatt atacactgaa tgtctataga 360ttggctttaa aaactacctt aaaaagagca agaaggagta tggaacttat agcaagagag 420gatgaaaatc caaaggttgc tgaagttatc tatccaataa tgcaggttaa tgatattcat 480tatttaggcg ttgatgttgc agttggaggg atggagcaga gaaaaataca catgttagca 540agggagcttt taccaaaaaa ggttgtttgt attcacaacc ctgtcttaac gggtttggat 600ggagaaggaa agatgagttc ttcaaaaggg aattttatag ctgttgatga ctctccagaa 660gagattaggg ctaagataaa gaaagcatac tgcccagctg gagttgttga aggaaatcca 720ataatggaga tagctaaata cttccttgaa tatcctttaa ccataaaaag gccagaaaaa 780tttggtggag atttgacagt taatagctat gaggagttag agagtttatt taaaaataag 840gaattgcatc caatggattt aaaaaatgct gtagctgaag aacttataaa gattttagag 900ccaattagaa agagatta 918
<210> 4
<211> 306
<212> PRT
<213> Artificial
<220>
<223> Phenylselenocysteine anrinoacyl tRNA synthetase<400> 4
Met Asp Glu Phe GTu Met Ile Lys Arg Asn Thr Ser Glu Ile Ile ser1 5 10 15
Glu Glu Glu Leu Arg Glu Val Leu Lys Lys Asp Glu Lys Ser Ala Trp20 25 30
Ile Gly Phe Glu Pro Ser Gly Lys Ile His Leu Gly His Tyr Leu Gln35 40 45
Ile Lys Lys Met Ile Asp Leu Gln Asn Ala Gly Phe Asp Ile Ile Ile50 55 60
Glu Leu Ala Asp Leu Gly Ala Tyr Leu Asn Gln Lys Gly Glu Leu Asp65 70 75 80
Glu Ile Arg Lys Ile Gly Asp Tyr Asn Lys Lys vai Phe Glu Ala Met85 90 95
Gly Leu Lys Ala Lys Tyr Val Tyr Gly Ser Glu Phe Gln Leu Asp Lys100 105 110
Asp Tyr Thr Leu Asn vai Tyr Arg Leu Ala Leu Lys Thr Thr Leu Lys115 120 125
Arg Ala Arg Arg Ser Met Glu Leu Ile Ala Arg Glu Asp Glu Asn Pro130 135 140Lys Val Ala Glu Val Ile Tyr Pro lie Met Gln Val Asn Gln Ile His145 150 155 160
Tyr Ser Gly Val Asp vai Ala vai Gly Gly Met Glu Gln Arg Lys Ile165 170 175
His Met Leu Ala Arg Glu Leu Leu Pro Lys Lys Val vai cys Ile His180 185 190
Asn Pro vai Leu Thr Gly Leu Asp Gly Glu Gly Lys Met ser ser ser195 200 205
Lys Gly Asn Phe lie Ala Val Asp Asp Ser Pro Glu Glu lie Arg Ala210 215 220
Lys Ile Lys Lys Ala Tyr Cys Pro Ala Gly vai Val Glu Gly Asn Pro225 230 235 240
Ile Met Glu lie Ala Lys Tyr Phe Leu Glu Tyr Pro Leu Thr Ile Lys245 250 255
Arg Pro Glu Lys Phe Gly Gly Asp Leu Thr Val Asn Ser Tyr Glu Glu260 265 270
Leu Glu Ser Leu Phe Lys Asn Lys Glu Leu His Pro Met Asp Leu Lys275 280 285
Asn Ala vai Ala Glu Glu Leu Ile Lys Ile Leu Glu Pro Ile Arg Lys290 295 300
Arg Leu305
<210> 5
<211> 921
<212> DNA
<213> Artificial
<220>
<223> Phenylselenocysteine aminoacyl tRNA synthetase
<400> 5
atggacgaat ttgaaatgat aaagagaaac acatctgaaa ttatcagcga ggaagagtta 60agagaggttt taaaaaaaga tgaaaaatct gcttggatag gttttgaacc aagtggtaaa 120atacatttag ggcattatct ccaaataaaa aagatgattg atttacaaaa tgctggattt 180gatataatta tagagttggc tgatttaggg gcctatttaa accagaaagg agagttggat 240gagattagaa aaataggaga ttataacaaa aaagtttttg aagcaatggg gttaaaggca 300aaatatgttt atggaagtga attccagctt gataaggatt atacactgaa tgtctataga 360ttggctttaa aaactacctt aaaaagagca agaaggagta tggaacttat agcaagagag 420gatgaaaatc caaaggttgc tgaagttatc tatccaataa tgcaggttaa tcaaattcat 480tatagtggcg ttgatgttgc agttggaggg atggagcaga gaaaaataca catgttagca 540agggagcttt taccaaaaaa ggttgtttgt attcacaacc ctgtcttaac gggtttggat 600ggagaaggaa agatgagttc ttcaaaaggg aattttatag ctgttgatga ctctccagaa 660gagattaggg ctaagataaa gaaagcatac tgcccagctg gagttgttga aggaaatcca 720ataatggaga tagctaaata cttccttgaa tatcctttaa ccataaaaag gccagaaaaa 780tttggtggag atttgacagt taatagctat gaggagttag agagtttatt taaaaataag 840gaattgcatc caatggattt aaaaaatgct gtagctgaag aacttataaa gattttagag 900ccaattagaa agagattata a 921
<210> 6
<211> 306
<212> PRT
<213> Artificial
<220>
<223> Phenylselenocysteine aminoacyl tRNA synthetase<400> 6
Met Asp Glu Phe Glu Met Xle Lys Arg Asn Thr ser Glu Ile Ile ser15 10 15
Glu Glu Glu Leu Arg Glu vai Leu Lys Lys Asp Glu Lys ser Ala Trp20 25 30
lie Gly Phe Glu Pro ser Gly Lys Ile His Leu Gly His Tyr Leu Gln35 40 45
Ile Lys Lys Met Ile Asp Leu Gln Asn Ala Gly Phe Asp Ile Ile Ile50 55 60
His Leu Ala Asp Leu Gly Ala Tyr Leu Asn Gln Lys Gly Glu Leu Asp65 70 75 80
Glu Ile Arg Lys Ile Gly Asp Tyr Asn Lys Lys vai Phe Glu Ala Met85 90 95
Gly Leu Lys Ala Lys Tyr vai Tyr Gly ser Glu Asn ser Leu Asp Lys100 105 110
Asp Tyr Thr Leu Asn Val Tyr Arg Leu Ala Leu Lys Thr Thr Leu Lys115 120 125
Arg Ala Arg Arg ser Met Glu Leu Ile Ala Arg Glu Asp Glu Asn Pro130 135 140
Lys vai Ala Glu Val Ile Tyr Pro Ile Met Gln vai Asn ser Ile His145 150 155 160Tyr Glu Gly Val Asp Val Ala Val Gly Gly Met Glu Gln Arg Lys Ile165 170 175
His Met Leu Ala Arg Glu Leu Leu Pro Lys Lys Val Val Cys Ile His180 185 190
Asn Pro vai Leu Thr Gly Leu Asp Gly Glu Gly Lys Met ser ser ser195 200 205
Lys Gly Asn Phe lie Ala Val Asp Asp ser Pro Glu Glu Ile Arg Ala210 215 220
Lys Ile Lys Lys Ala Tyr Cys Pro Ala Gly Val Val Glu Gly Asn Pro225 230 235 240
Ile Met Glu lie Ala Lys Tyr Phe Leu Glu Tyr Pro Leu Thr Ile Lys245 250 255
Arg Pro Glu Lys Phe Gly Gly Asp Leu Thr Val Asn Ser Tyr Glu Glu260 265 270
Leu Glu ser Leu Phe Lys Asn Lys Glu Leu His Pro Met Asp Leu Lys275 280 285
Asn Ala Val Ala Glu Glu Leu Ile Lys Ile Leu Glu Pro Ile Arg Lys290 295 300
Arg Leu305
<210> 7<211> 921<212> DNA<213> Artificial
<220>
<223> Phenylselenocysteine aminoacyl tRNA synthetase<400> 7
atggacgaat ttgaaatgat aaagagaaac acatctgaaa ttatcagcga ggaagagtta 60
agagaggttt taaaaaaaga tgaaaaatct gcttggatag gttttgaacc aagtggtaaa 120
atacatttag ggcattatct ccaaataaaa aagatgattg atttacaaaa tgctggattt 180
gatataatta tacatttggc tgatttaggc gcctatttaa accagaaagg agagttggat 240
gagattagaa aaataggaga ttataacaaa aaagtttttg aagcaatggg gttaaaggca 300
aaatatgttt atggaagtga aaattctctt gataaggatt atacactgaa tgtctataga 360
ttggctttaa aaactacctt aaaaagagca agaaggagta tggaacttat agcaagagag 420
gatgaaaatc caaaggttgc tgaagttatc tatccaataa tgcaggttaa ttctattcat 480
tatgagggcg ttgatgttgc agttggaggg atggagcaga gaaaaataca catgttagca 540agggagcttt taccaaaaaa ggttgtttgt attcacaacc ctgtcttaac gggtttggat 600
ggagaaggaa agatgagttc ttcaaaaggg aattttatag ctgttgatga ctctccagaa 660
gagattaggg ctaagataaa gaaagcatac tgcccagctg gagttgttga aggaaatcca 720
ataatggaga tagctaaata cttccttgaa tatcctttaa ccataaaaag gccagaaaaa 780
tttggtggag atttgacagt taatagctat gaggagttag agagtttatt taaaaataag 840
gaattgcatc caatggattt aaaaaatgct gtagctgaag aacttataaa gattttagag 900
ccaattagaa agagattata a 921
<210> 8
<211> 306
<212> PRT
<213> Artificial
<220>
<223> Phenylselenocysteine aminoacyl tRNA synthetase<400> 8
Met Asp Glu Phe Glu Met Ile Lys Arg Asn Thr ser Glu Ile Ile Ser15 10 15
Glu Glu Glu Leu Arg Glu Val Leu Lys Lys Asp Glu Lys ser Ala Trp20 25 30
lie Gly Phe Glu Pro Ser Gly Lys Ile His Leu Gly His Tyr Leu Gln35 40 45
Ile Lys Lys Met Ile Asp Leu Gln Asn Ala Gly Phe Asp Ile Ile Ile50 55 60
His Leu Gly Asp Leu Gly Ala Tyr Leu Asn Gln Lys Gly Glu Leu Asp65 70 75 80
Glu Ile Arg Lys Ile Gly Asp Tyr Asn Lys Lys Val Phe Glu Ala Met85 90 95
Gly Leu Lys Ala Lys Tyr Val Tyr Gly ser Glu Lys Ser Leu Asp Lys100 105 110
Asp Tyr Thr Leu Asn vai Tyr Arg Leu Ala Leu Lys Thr Thr Leu Lys115 120 125
Arg Ala Arg Arg ser Met Glu Leu Ile Ala Arg Glu Asp Glu Asn Pro130 135 140
Lys Val Ala Glu vai Ile Tyr Pro Ile Met Gln Val Asn Glu Ile His145 150 155 160
Tyr Glu Gly Val Asp Val Ala Val Gly Gly Met Glu Gln Arg Lys lie165 170 175His Met Leu Ala Arg Glu Leu Leu Pro Lys Lys Val Val Cys Ile His180 185 190
Asn Pro vai Leu Thr Gly Leu Asp Gly Glu Gly Lys Met Ser Ser Ser195 200 205
Lys Gly Asn Phe Ile Ala Val Asp Asp Ser Pro Glu Glu Ile Arg Ala210 215 220
Lys Ile Lys Lys Ala Tyr Cys Pro Ala Gly Val Val Glu Gly Asn Pro225 230 235 240
Ile Met Glu Ile Ala Lys Tyr Phe Leu Glu Tyr Pro Leu Thr Ile Lys245 250 255
Arg Pro Glu Lys Phe Gly Gly Asp Leu Thr Val Asn Ser Tyr Glu Glu260 265 270
Leu Glu ser Leu Phe Lys Asn Lys Glu Leu His Pro Met Asp Leu Lys275 280 285
Asn Ala Val Ala Glu Glu Leu Ile Lys Ile Leu Glu Pro Ile Arg Lys290 295 300
Arg Leu305
<210> 9 <211> 921 <212> DNA <213> Artificial <220> <223> Phenylselenocysteine aminoacyl tRNA synthetase <400> 9 atggacgaat ttgaaatgat aaagagaaac acatctgaaa ttatcagcga ggaagagtta 60agagaggttt taaaaaaaga tgaaaaatct gcttggatag gttttgaacc aagtggtaaa 120atacatttag ggcattatct ccaaataaaa aagatgattg atttacaaaa tgctggattt 180gatataatta tacatttggg tgatttaggc gcctatttaa accagaaagg agagttggat 240gagattagaa aaataggaga ttataacaaa aaagtttttg aagcaatggg gttaaaggca 300aaatatgttt atggaagtga aaagtctctt gataaggatt atacactgaa tgtctataga 360ttggctttaa aaactacctt aaaaagagca agaaggagta tggaacttat agcaagagag 420gatgaaaatc caaaggttgc tgaagttatc tatccaataa tgcaggttaa tgagattcat 480tatgagggcg ttgatgttgc agttggaggg atggagcaga gaaaaataca catgttagca 540agggagcttt taccaaaaaa ggttgtttgt attcacaacc ctgtcttaac gggtttggat 600ggagaaggaa agatgagttc ttcaaaaggg aattttatag ctgttgatga ctctccagaa 660gagattaggg ctaagataaa gaaagcatac tgcccagctg gagttgttga aggaaatcca 720
ataatggaga tagctaaata cttccttgaa tatcctttaa ccataaaaag gccagaaaaa 780
tttggtggag atttgacagt taatagctat gaggagttag agagtttatt taaaaataag 840
gaattgcatc caatggattt aaaaaatgct gtagctgaag aacttataaa gattttagag 900
ccaattagaa agagattata a 921

Claims (51)

1. Sistema de tradução, CARACTERIZADO pelo fato de que compreende:um primeiro aminoácido não natural que é fenilselenocisteína;um primeiro RNAt ortogonal aminoacil sintetase (O-RS); eum primeiro RNAt ortogonal (O-RNAt);em que o dito primeiro O-RS preferencialmente aminoacila o dito primeiro O-RNAtcom a dita fenilselenocisteína.
2. Sistema de tradução, de acordo com a reivindicação 1, CARACTERIZADO pelofato de que o dito primeiro O-RS preferencialmente aminoacila o dito primeiro O-RNAt coma dita fenilselenocisteína com uma eficiência que é pelo menos 50 % da eficiência obser-vada para um sistema de tradução que compreende o dito O-RNAt, a dita fenilselenociste-ína, e uma RNAt aminoacil sintetase que compreende a seqüência de aminoácido de SEQID NO: 4, 6 ou 8.
3. Sistema de tradução, de acordo com a reivindicação 1, CARACTERIZADO pelofato de que o dito primeiro O-RS compreende uma seqüência de aminoácido selecionadado grupo que consiste em seqüências de aminoácido apresentadas em SEQ ID NOS: 4, 6,-8, e variantes conservadoras destes.
4. Sistema de tradução, de acordo com a reivindicação 1, CARACTERIZADO pelofato de que o dito primeiro O-RNAt é um RNAt supressor âmbar.
5. Sistema de tradução, de acordo com a reivindicação 1, CARACTERIZADO pelofato de que o dito primeiro O-RNAt compreende ou é codificado por uma seqüência depolinucleotídeo apresentada em SEQ ID NO: 1.
6. Sistema de tradução, de acordo com a reivindicação 1, CARACTERIZADO pelofato de que compreende adicionalmente um ácido nucléico que codifica uma proteína deinteresse, o dito ácido nucléico que compreende pelo menos um códon seletor, em que odito códon seletor é reconhecido pelo dito primeiro O-RNAt.
7. Sistema de tradução, de acordo com a reivindicação 6, CARACTERIZADO pelofato de que compreende adicionalmente um segundo O-RS e um segundo O-RNAt, emque o segundo O-RS preferencialmente aminoacila o segundo O-RNAt com um segundoaminoácido não natural que é diferente do primeiro aminoácido não natural, e em que osegundo O-RNAt reconhece um códon seletor que é diferente do códon seletor reconheci-do pelo primeiro O-RNAt.
8. Sistema de tradução, de acordo com a reivindicação 1, CARACTERIZADO pelofato de que o dito sistema compreende uma célula hospedeira que compreende o dito pri-meiro aminoácido não natural, o dito primeiro O-RS e o dito primeiro O-RNAt.
9. Sistema de tradução, de acordo còm a reivindicação 8, CARACTERIZADO pelofato de que a dita célula hospedeira é uma célula eubacteriana.
10. Sistema de tradução, de acordo com a reivindicação 9, CARACTERIZADOpelo fato de que a dita célula eubacteriana é uma célula E. coli.
11. Sistema de tradução, de acordo com a reivindicação 8, CARACTERIZADO pelofato de que a dita célula hospedeira compreende um polinucleotídeo que codifica o dito pri-meiro O-RS.
12. Sistema de tradução, de acordo com a reivindicação 11, CARACTERIZADOpelo fato de que o dito polinucleotídeo compreende uma seqüência de nucleotídeo apresen-tada em SEQ ID NO: 5, 7 ou 9.
13. Sistema de tradução, de acordo com a reivindicação 8, CARACTERIZADO pelofato de que a dita célula hospedeira compreende um polinucleotídeo que codifica o dito pri-meiro O-RNAt.
14. Método para produzir em um sistema de tradução uma proteína que compreen-de um aminoácido não natural em uma posição selecionada, CARACTERIZADO pelo fatode que o método compreende:(a) fornecer um sistema de tradução que compreende:um primeiro aminoácido não natural que é fenilselenocisteína;uma primeiro RNAt ortogonal aminoacil sintetase (O-RS);um primeiro RNAt ortogonal (O-RNAt), em que o dito primeiro O-RS preferencial-mente aminoacila o dito primeiro O-RNAt com a dita fenilselenocisteína; e,um ácido nucléico que codifica a dita proteína, em que o dito ácido nucléico com-preende pelo menos um códon seletor que é reconhecido pelo dito primeiro O-RNAt; e, (b) incorporar o dito aminoácido não natural na dita posição selecionada na ditaproteína durante a tradução da dita proteína em resposta ao dito códon seletor, produzindodessa maneira a dita proteína que compreende o dito aminoácido não natural na posiçãoselecionada.
15. Método, de acordo com a reivindicação 14, CARACTERIZADO pelo fato de queo dito primeiro O-RS preferencialmente aminoacila o dito primeiro O-RNAt com a dita fenil-selenocisteína com uma eficiência que é pelo menos 50 % da eficiência observada paraum sistema de tradução que compreende o dito O-RNAt, a dita fenilselenocisteína, e umRNAt aminoacil sintetase que compreende a seqüência de aminoácido de SEQ ID NO: 4, 6ou 8
16. Método, de acordo com a reivindicação 14, CARACTERIZADO pelo fato deque o dito sistema de tradução compreende um polinucleotídeo que codifica o dito O-RS.
17. Método, de acordo com a reivindicação 14, CARACTERIZADO pelo fato deque o dito fornecimento de um sistema de tradução compreende fornecer um O-RS quecompreende uma seqüência de aminoácido selecionada do grupo que consiste nas seqüên-cias de aminoácido apresentadas em SEQ ID NOS: 4, 6, 8, e variantes conservadorasdestes.
18. Método, de acordo com a reivindicação 14, CARACTERIZADO pelo fato deque o dito fornecimento de um primeiro RNAt ortogonal aminoacil sintetase compreendemutar um aminoácido ligando a cavidade de um RNAt aminoacil sintetase tipo selvagempor mutagênese direcionada ao sítio, e selecionar um O-RS resultante que preferencial-mente aminoacila o dito O-RNAt com o dito aminoácido não natural, fornecendo dessamaneira o dito primeiro RNAt ortogonal aminoacil sintetase.
19. Método, de acordo com a reivindicação 18, CARACTERIZADO pelo fato deque a dita etapa de seleção compreende selecionar positivamente e selecionar negativ-mente para o dito O-RS de um pool que compreende uma pluralidade de moléculas deRNAt aminoacil sintetase mutantes produzidas depois do dito said mutagênese direciona-do ao sítio.
20. Método, de acordo com a reivindicação 14, CARACTERIZADO pelo fato deque o dito fornecimento de um sistema de tradução compreende fornecer um polinucleotí-deo que codifica o dito O-RNAt.
21. Método, de acordo com a reivindicação 14, CARACTERIZADO pelo fato deque o dito fornecimento de um sistema de tradução compreende fornecer um O-RNAt queé um RNAt supressor âmbar.
22. Método, de acordo com a reivindicação 14, CARACTERIZADO pelo fato deque o dito fornecimento de um sistema de tradução compreende fornecer um ácido nucléi-co que codifica ou compreende o dito O-RNAt1 em que o dito ácido nucléicõ compreendeuma seqüência de polinucleotídeo apresentada em SEQ ID NO: 1.
23. Método, de acordo com a reivindicação 14, CARACTERIZADO pelo fato deque o dito fornecimento de um sistema de tradução compreende fornecer um ácido nucléi-co que codifica o dito O-RS, emque o dito ácido nucléicõ compreende uma seqüência depolinucleotídeo apresentada em SEQ ID NO: 5, 7 ou 9.
24. Método, de acordo com a reivindicação 14, CARACTERIZADO pelo fato deque o dito fornecimento de um sistema de tradução compreende fornecer um ácido nucléi-cõ que compreende um códon seletor de âmbar.
25. Método, de acordo com a reivindicação 14, CARACTERIZADO pelo fato deque a dita proteína compreende adicionalmente um segundo aminoácido não natural que édiferente do dito primeiro aminoácido não natural, e em que o dito sistema de traduçãocompreende adicionalmente um segundo O-RS e um segundo O-RNAt, em que o segundoO-RS preferencialmente aminoacila o segundo O-RNAt com um segundo aminoácido nãonatural que é diferente do primeiro aminoácido não natural, e em que o segundo O-RNAtreconhece um códon seletor no ácido nucléicõ que é diferente do códon seletor reconhecidopelo primeiro O-RNAt.
26. Método, de acordo com a reivindicação 14, CARACTERIZADO pelo fato deque o dito fornecimento de um sistema de tradução compreende fornecer uma célula hos-pedeira, em que a dita célula hospedeira compreende o dito primeiro aminoácido não natu-ral, o dito primeiro O-RS, o dito primeiro O-RNAt e o dito ácido nucléico, e em que a ditaetapa de incorporação compreende cultivar a dita célula hospedeira.
27. Método, de acordo com a reivindicação 26, CARACTERIZADO pelo fato deque a dita célula hospedeira é uma célula eubacteriana hospedeira.
28. Método, de acordo com a reivindicação 27, CARACTERIZADO pelo fato deque a dita célula eubacteriana hospedeira é uma célula hospedeira E. coli.
29. Método, de acordo com a reivindicação 26, CARACTERIZADO pelo fato deque a dita célula hospedeira compreende um ácido nucléico que codifica o dito O-RS.
30. Método, de acordo com a reivindicação 29, CARACTERIZADO pelo fato deque o dito ácido nucléico que codifica o dito O-RS compreende uma seqüência de nucleo-tídeo apresentada em SEQ ID NO: 5, 7 ou 9.
31. Método, de acordo com a reivindicação 14, CARACTERIZADO pelo fato deque o dito método compreende adicionalmente etapa (c) reagir a dita fenilselenocisteínana dita posição selecionada na dita proteína para produzir uma proteína que compreendedeidroalanina na dita posição selecionada.
32. Método, de acordo com a reivindicação 31, CARACTERIZADO pelo fato deque a dita reação é por eliminação oxidativa.
33. Método, de acordo com a reivindicação 31, CARACTERIZADO pelo fato deque a dita reação compreende expor a dita fenilselenocisteína ao peróxido de hidrogênio.
34. Método, para produzir em um sistema de tradução uma proteína que compre-ende uma fração de lipídio em uma posição selecionada, CARACTERIZADO pelo fato deque o método compreende:(a) fornecer um sistema de tradução que compreende:um aminoácido não natural de fenilselenocisteína;um RNAt ortogonal aminoacil sintetase (O-RS);um RNAt ortogonal (O-RNAt), em que o dito O-RS preferencialmente aminoacila odito O-RNAt com a dita fenilselenocisteína; e,um ácido nucléico que codifica a dita proteína, em que o dito ácido nucléico com-preende um códon seletor na dita posição selecionada que é reconhecido pelo dito O-RNAt;(b) incorporar fenilselenocisteína na dita posição selecionada na dita proteína du-rante tradução da dita proteína em resposta ao dito códon seletor;(c) reagir a dita fenilselenocisteína na posição selecionada na dita proteína paraproduzir uma proteína que compreende deidroalanina na posição selecionada; e,(d) reagir a dita deidroalanina na posição selecionada na dita proteína com umafração de lipídio para produzir uma proteína que compreende um lipídeo na fração do áci-do na posição selecionada na proteína.
35. Método, de acordo com a reivindicação 34, CARACTERIZADO pelo fato de que a dita reação da dita fenilselenocisteína na posição selecionada na dita proteína é poreliminação oxidativa.
36. Método, de acordo com a reivindicação 34, CARACTERIZADO pelo fato deque a dita reação da dita fenilselenocisteína na posição selecionada na dita proteína com-preende expor a dita fenilselenocisteína ao peróxido de hidrogênio.
37. Método, de acordo com a reivindicação 34, CARACTERIZADO pelo fato deque a dita fração de lipídio é selecionada do grupo que consiste em ácido tiopalmítico,famesilmercaptano e 1-hexadecanetiol.
38. Método, de acordo com a reivindicação 34, CARACTERIZADO pelo fato deque a dita fração de aminoácido Iipidado é selecionada do grupo que consiste em palmi- toilcisteína, farnesilcisteína e S-hexadecilcisteína.
39. Método, de acordo com a reivindicação 34, CARACTERIZADO pelo fato deque a dita reação da dita deidroalanina na posição selecionada na dita proteína é por umareação de adição de Michael.
40. Método para produzir em um sistema de tradução uma proteína que compre- ende um aminoácido de deidroalanina não natural em uma posição selecionada,CARACTERIZADO pelo fato de que o método compreende:(a) fornecer um sistema de tradução que compreende:um aminoácido não natural de fenilselenocisteína;um RNAt ortogonal aminoacil sintetase (O-RS);um RNAt ortogonal (O-RNAt), em que o dito O-RS preferencialmente aminoacila odito O-RNAt com a dita fenilselenocisteína; e,um ácido nucléico que codifica a dita proteína, em que o dito ácido nucléico com-preende um códon seletor na dita posição selecionada que é reconhecido pelo dito O-(b) incorporar o dita aminoácido não natural de fenilselenocisteína na dita posiçãoselecionada na dita proteína durante a tradução d a dita proteína em resposta ao dito códonseletor,(c) reagir a dita fenilselenocisteína na posição selecionada na dita proteína, pro-duzindo dessa maneira a dita proteína que compreende o dito aminoácido de deidroalaninanão natural na posição selecionada.
41. Método, de acordo com a reivindicação 40, CARACTERIZADO pelo fato deque a dita reação da dita fenilselenocisteína na posição selecionada na dita proteína é poreliminação oxidativa.
42. Método, de acordo com a reivindicação 40, CARACTERIZADO pelo fato deque a dita reação da dita fenilselenocisteína na posição selecionada na dita proteína com-preende expor a dita fenilselenocisteína ao peróxido de hidrogênio.
43. Composição, CARACTERIZADA pelo fato de que compreende um polipeptí-deo que compreende umseqüência de amino ácido selecionada do grupo que consiste nasseqüências de aminoácido apresentadas em SEQ ID NOS: 4, 6, 8, e variantes conservado-ras destes.
44. Composição, de acordo com a reivindicação 43, CARACTERIZADA pelo fatode que o dito polipeptídeo da variante conservadora aminoacila um RNAt ortogonal cogna-te (O-RNAt) com um aminoácido não natural com uma eficiência que é pelo menos 50 %da eficiência observada para um sistema de tradução que compreende o dito O-RNAt, o ditoaminoácido não natural, e um RNAt aminoacil sintetase que compreende a seqüência deaminoácido de SEQ ID NO: 4, 6 ou 8.
45. Composição, de acordo com a reivindicação 43, CARACTERIZADA pelo fatode que a dita composição compreende uma célula que compreende o polipeptídeo.
46. Polinucleotídeo, CARACTERIZADO pelo fato de que codifica o polipeptídeo,de acordo com a reivindicação 43.
47. Polinucleotídeo, de acordo com a reivindicação 46, CARACTERIZADO pelofato de que o dito polinucleotídeo compreende a seqüência de nucleotídeo de SEQ ID NO:-5, 7 ou 9.
48. Vetor, CARACTERIZADO pelo fato de que compreende um polinucleotídeo deacordo com a reivindicação 46.
49. Vetor de expressão, CARACTERIZADO pelo fato de que compreende um po-linucleotídeo de acordo com a reivindicação 46.
50. Célula, CARACTERIZADA pelo fato de que compreende um vetor, o vetorque compreende um polinucleotídeo de acordo com a reivindicação 46.
51. Composição, CARACTERIZADA pelo fato de que compreende um polinucleo-tídeo que compreende uma seqüência de nucleotídeo apresentadas em SEQ ID NO: 5, 7ou 9.
BRPI0709603-8A 2006-03-16 2007-03-13 expressão de proteìnas geneticamente programada contendo o aminoácido não natural fenilselenocisteìna BRPI0709603A2 (pt)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US78327206P 2006-03-16 2006-03-16
US60/783.272 2006-03-16
US86145606P 2006-11-28 2006-11-28
US60/861.456 2006-11-28
PCT/US2007/006382 WO2007109035A2 (en) 2006-03-16 2007-03-13 Genetically programmed expression of proteins containing the unnatural amino acid phenylselenocysteine

Publications (1)

Publication Number Publication Date
BRPI0709603A2 true BRPI0709603A2 (pt) 2011-07-19

Family

ID=38522926

Family Applications (1)

Application Number Title Priority Date Filing Date
BRPI0709603-8A BRPI0709603A2 (pt) 2006-03-16 2007-03-13 expressão de proteìnas geneticamente programada contendo o aminoácido não natural fenilselenocisteìna

Country Status (12)

Country Link
US (3) US7790847B2 (pt)
EP (1) EP1994165B1 (pt)
JP (1) JP5249194B2 (pt)
KR (1) KR20080113226A (pt)
CN (1) CN101405401B (pt)
AU (1) AU2007227592B2 (pt)
BR (1) BRPI0709603A2 (pt)
CA (1) CA2638772A1 (pt)
IL (1) IL193722A0 (pt)
MX (1) MX2008011669A (pt)
RU (1) RU2464315C2 (pt)
WO (1) WO2007109035A2 (pt)

Families Citing this family (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MXPA03009563A (es) * 2001-04-19 2004-12-06 Scripps Research Inst Incorporacion in vivo de aminoacidos no naturales.
KR20050073559A (ko) * 2002-10-16 2005-07-14 더 스크립스 리서치 인스티튜트 당단백질 합성
ATE542894T1 (de) 2003-04-17 2012-02-15 Scripps Research Inst Ausweitung des eukaryotischen genetischen codes
ATE386133T1 (de) 2003-07-07 2008-03-15 Scripps Research Inst Zusammensetzungen der orthogonalen lysyl-trna und aminoacyl-trna synthetase paaren und ihre verwendungen
AU2005330514B2 (en) 2004-10-27 2011-05-12 The Scripps Research Institute Orthogonal translation components for the in vivo incorporation of unnatural amino acids
EP1991680B1 (en) * 2006-03-09 2013-08-21 The Scripps Research Institute System for the expression of orthogonal translation components in eubacterial host cells
JP5249194B2 (ja) 2006-03-16 2013-07-31 ザ スクリプス リサーチ インスティチュート 非天然アミノ酸フェニルセレノシステインを含有するタンパク質の遺伝的にプログラムされた発現
RU2473690C2 (ru) * 2006-05-23 2013-01-27 Зе Скрипс Ресеч Инститьют Генетически кодируемые флюоресцентные кумариновые аминокислоты
PT2052083E (pt) 2006-09-21 2014-04-10 Scripps Research Inst Expressão geneticamente programada de proteínas seletivamente sulfatadas em eubactérias
EP2069481A4 (en) 2006-10-18 2010-01-06 Scripps Research Inst GENETIC ASSEMBLY OF UNNATURAL AMINO ACIDS IN PROTEINS IN MAMMALIAN CELLS
MX2010004464A (es) * 2007-10-25 2010-06-07 Scripps Research Inst Incorporacion genetica de 3-aminotirosina a reductasas.
EP2220218A4 (en) * 2007-11-02 2010-12-08 Scripps Research Inst BORONIC AMINO ACID GENETICALLY CODED
BRPI0819092A2 (pt) * 2007-11-02 2014-10-14 Scripps Research Inst Evolução direcionada usando proteínas que compreendem aminoácidos não naturais.
WO2009075847A2 (en) * 2007-12-11 2009-06-18 The Scripps Research Institute In vivo unnatural amino acid expression in the methylotrophic yeast pichia pastoris
US8592199B2 (en) 2007-12-28 2013-11-26 David H. Ardell Genetic encryption
JP5563990B2 (ja) 2008-01-03 2014-07-30 ヴェレニウム コーポレイション トランスフェラーゼおよびオキシドレダクターゼ、それらをコードする核酸並びにそれらを製造および使用する方法
AU2009210677A1 (en) * 2008-02-08 2009-08-13 The Scripps Research Institute Breaking immunological tolerance with a genetically encoded unnatural amino acid
US20090197339A1 (en) * 2008-12-10 2009-08-06 The Scripps Research Institute In vivo unnatural amino acid expression in the methylotrophic yeast pichia pastoris
WO2010068278A2 (en) 2008-12-10 2010-06-17 The Scripps Research Institute Production of carrier-peptide conjugates using chemically reactive unnatural amino acids
US8658394B2 (en) * 2011-02-02 2014-02-25 Waterstone Pharmaceuticals Methods, cells and systems for incorporating non-canonical amino acids into proteins
CN103215235B (zh) * 2012-01-18 2014-11-05 中国科学院生物物理研究所 3-咪唑基酪氨酸翻译系统及其应用
CN103571804B (zh) * 2012-08-10 2015-08-12 中国科学院生物物理研究所 3-吡唑基酪氨酸翻译系统及其应用
DK2906592T3 (en) * 2012-10-12 2018-12-10 Sutro Biopharma Inc Proteolytic inactivation of selected proteins in bacterial extracts for enhanced expression
CN103820410B (zh) * 2012-11-16 2016-03-30 中国科学院生物物理研究所 3-甲硫酪氨酸翻译系统及其应用
CN104004723B (zh) * 2013-02-22 2016-08-17 中国科学院生物物理研究所 3,5-二氟代酪氨酸翻译系统及其应用
CN106047846B (zh) * 2013-03-22 2020-02-04 中国科学院生物物理研究所 8-羟基喹啉丙氨酸翻译系统及其应用
AU2014318579A1 (en) 2013-09-13 2016-04-14 The California Institute For Biomedical Research Modified therapeutic agents and compositions thereof
US10039809B2 (en) 2013-12-18 2018-08-07 The California Institute For Biomedical Research Modified therapeutic agents, stapled peptide lipid conjugates, and compositions thereof
JP7312552B2 (ja) * 2016-05-16 2023-07-21 ザ ボード オブ リージェンツ オブ ザ ユニバーシティー オブ テキサス システム ナノ粒子としてのtRNA送達用組成物およびその使用方法
CN114644581A (zh) * 2021-01-04 2022-06-21 北京惠大生物科技有限公司 含芳基硫酚或芳基硒酚经修饰的氨基酸、重组蛋白及其生物合成方法及应用

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1994001131A1 (en) * 1992-07-13 1994-01-20 Eukarion, Inc. Transvascular and intracellular delivery of lipidized proteins
MXPA03009563A (es) 2001-04-19 2004-12-06 Scripps Research Inst Incorporacion in vivo de aminoacidos no naturales.
KR20050073559A (ko) 2002-10-16 2005-07-14 더 스크립스 리서치 인스티튜트 당단백질 합성
US7432092B2 (en) * 2002-10-16 2008-10-07 The Scripps Research Institute Site specific incorporation of keto amino acids into proteins
AU2003300389B2 (en) 2002-12-22 2009-10-08 The Scripps Research Institute Protein arrays
ATE542894T1 (de) * 2003-04-17 2012-02-15 Scripps Research Inst Ausweitung des eukaryotischen genetischen codes
EP2410331B1 (en) 2003-06-18 2015-09-23 The Scripps Research Institute Aminoacyl-tRNA synthetase for aminoacylation tRNA with unnatural amino acids
ATE386133T1 (de) 2003-07-07 2008-03-15 Scripps Research Inst Zusammensetzungen der orthogonalen lysyl-trna und aminoacyl-trna synthetase paaren und ihre verwendungen
US7527943B2 (en) 2003-07-07 2009-05-05 The Scripps Research Institute Compositions of orthogonal glutamyl-tRNA and aminoacyl-tRNA synthetase pairs and uses thereof
US20060160175A1 (en) 2003-07-07 2006-07-20 The Scripps Research Institute Compositions of orthogonal leucyl-trna and aminoacyl-trna synthetase pairs and uses thereof
EP1687401B1 (en) * 2003-10-14 2012-11-21 The Scripps Research Institute Site-specific incorporation of redox active amino acids into proteins
EP1725251A4 (en) * 2003-12-18 2009-07-01 Scripps Research Inst SELECTIVE INCORPORATION OF 5-HYDROXYTRYPTOPHANE IN PROTEINS IN MAMMALIAN CELLS
US20050287639A1 (en) 2004-05-17 2005-12-29 California Institute Of Technology Methods of incorporating amino acid analogs into proteins
JP2008500050A (ja) 2004-05-25 2008-01-10 ザ スクリップス リサーチ インスティテュート 結晶構造決定のための重原子含有非天然アミノ酸の部位特異的蛋白質組込み
US20060134746A1 (en) 2004-09-21 2006-06-22 The Scripps Research Institute Adding photoregulated amino acids to the genetic code
EP2770053B1 (en) 2004-09-21 2018-02-21 The Scripps Research Institute In vivo incorporation of alkynyl amino acids into proteins in eubacteria
WO2006036779A2 (en) 2004-09-22 2006-04-06 The Scripps Research Institute Site-specific labeling of proteins for nmr studies
JP2008516637A (ja) 2004-10-20 2008-05-22 ザ スクリップス リサーチ インスティテュート 真正細菌へのn−アセチルガラクトサミンアミノ酸のインビボ部位特異的組込み
AU2005330514B2 (en) 2004-10-27 2011-05-12 The Scripps Research Institute Orthogonal translation components for the in vivo incorporation of unnatural amino acids
EP1934343A4 (en) 2005-10-12 2009-09-16 Scripps Research Inst SELECTIVE MODIFICATION POST-TRANSLATION OF POLYPEPTIDES EXPRESSED ON THE SURFACE OF PHAGES
EP1991680B1 (en) 2006-03-09 2013-08-21 The Scripps Research Institute System for the expression of orthogonal translation components in eubacterial host cells
JP5249194B2 (ja) 2006-03-16 2013-07-31 ザ スクリプス リサーチ インスティチュート 非天然アミノ酸フェニルセレノシステインを含有するタンパク質の遺伝的にプログラムされた発現

Also Published As

Publication number Publication date
US20120282668A1 (en) 2012-11-08
US8394605B2 (en) 2013-03-12
AU2007227592A1 (en) 2007-09-27
US20090209000A1 (en) 2009-08-20
CN101405401B (zh) 2013-03-27
US8217145B2 (en) 2012-07-10
EP1994165B1 (en) 2014-11-05
JP5249194B2 (ja) 2013-07-31
KR20080113226A (ko) 2008-12-29
JP2009529877A (ja) 2009-08-27
IL193722A0 (en) 2011-08-01
EP1994165A2 (en) 2008-11-26
WO2007109035A3 (en) 2008-10-16
AU2007227592B2 (en) 2011-11-24
RU2008135114A (ru) 2010-04-27
CN101405401A (zh) 2009-04-08
US7790847B2 (en) 2010-09-07
RU2464315C2 (ru) 2012-10-20
WO2007109035A2 (en) 2007-09-27
EP1994165A4 (en) 2012-11-07
CA2638772A1 (en) 2007-09-27
MX2008011669A (es) 2008-09-22
US20070238152A1 (en) 2007-10-11

Similar Documents

Publication Publication Date Title
JP5249194B2 (ja) 非天然アミノ酸フェニルセレノシステインを含有するタンパク質の遺伝的にプログラムされた発現
JP5192150B2 (ja) 直交リシルtRNAとアミノアシルtRNAシンテターゼの対の組成物及びその使用
AU2005286722B2 (en) In vivo incorporation of alkynyl amino acids into proteins in eubacteria
US8114654B2 (en) Site-specific incorporation of redox active amino acids into proteins
AU2007267950B2 (en) Genetically encoded fluorescent coumarin amino acids

Legal Events

Date Code Title Description
B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B11E Dismissal acc. art. 34 of ipl - requirements for examination incomplete
B11T Dismissal of application maintained [chapter 11.20 patent gazette]