PT1914314E - Composições de pares ortogonais de lisil-arnt e aminoacil-arnt-sintetase e suas utilizações - Google Patents

Composições de pares ortogonais de lisil-arnt e aminoacil-arnt-sintetase e suas utilizações Download PDF

Info

Publication number
PT1914314E
PT1914314E PT08001573T PT08001573T PT1914314E PT 1914314 E PT1914314 E PT 1914314E PT 08001573 T PT08001573 T PT 08001573T PT 08001573 T PT08001573 T PT 08001573T PT 1914314 E PT1914314 E PT 1914314E
Authority
PT
Portugal
Prior art keywords
trna
quot
codon
orthogonal
synthetase
Prior art date
Application number
PT08001573T
Other languages
English (en)
Inventor
Christopher J Anderson
Ning Wu
Stephen Santoro
Original Assignee
Scripps Research Inst
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Scripps Research Inst filed Critical Scripps Research Inst
Publication of PT1914314E publication Critical patent/PT1914314E/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/02Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/93Ligases (6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Physics & Mathematics (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)
  • Saccharide Compounds (AREA)
  • Medicinal Preparation (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Description

ΕΡ 1 914 314/ΡΤ
DESCRIÇÃO "Composições de pares ortogonais de lisil-ARNt e aminoacil-ARNt-sintetase e suas utilizações"
CAMPO DO INVENTO 0 invento pertence ao campo da bioquímica da tradução. 0 invento refere-se a métodos de produção e a composições de ARNt ortogonais, de aminoacil-ARNt-sintetases ortogonais e de seus pares, que incorporam aminoácidos não naturais, por exemplo, homoglutaminas, nas proteínas, em resposta a codões de selecção como os codões de selecção com quatro bases e os codões de selecção stop. Tal inclui a incorporação de vários aminoácidos não naturais diferentes numa única cadeia proteica, em resposta a codões de selecção stop e com quatro bases. 0 invento refere-se também a métodos de produção de proteínas em células, utilizando estes pares, e a composições relacionadas.
ANTECEDENTES DO INVENTO
Embora, com poucas excepções, os códigos genéticos de todos os organismos conhecidos codifiquem os mesmos vinte aminoácidos, tudo o que é necessário para adicionar um novo aminoácido ao repertório de um organismo é um par ARNt/aminoacil-ARNt-sintetase único, uma fonte do aminoácido e um codão de selecção único que especifique o aminoácido (Furter (1998) Protein Sei., 7:419-426). Anteriormente, havíamos demonstrado que o codão sem sentido (nonsense) âmbar, TAG, juntamente com pares ortogonais ARNt/sintetase de M. jannaschii e de E. coli podem ser utilizados para codificar geneticamente uma variedade de aminoácidos com novas propriedades em E. coli (Wang et al. (2000) J. Am. Chem. Soc., 122:5010-5011; Wang et al. (2001) Science, 292:498-500; Wang et al. (2003) Proc. Natl. Acad. Sei. U.S.A., 100:56-61; Chin et al. (2002) Proc. Natl. Acad. Sei. U.S.A., 99:11020-11024) e em levedura (Chin & Schultz (2002) ChemBioChem, 3:1135-1137), respectivamente. O número limitado de codões tripleto não codificantes, contudo, restringe grandemente o número final de aminoácidos codificados por qualquer organismo. 2 ΕΡ 1 914 314/ΡΤ Há muitos exemplos de supressores de deslocamentos +1 do quadro de leitura existentes na natureza, incluindo os supressores derivados de Su7 dos codões UAGN que codificam a glutamina (Magliery et al. (2001) J. Mol. Biol., 307:755-769), os supressores derivados de sufJ dos codões ACCN que codificam a treonina (Anderson et al. (2002) Chem. Biol., 9:237-244) e os supressores dos codões CAAA derivados de ARNtLys e ARNtGln (Anderson & Schultz (2003) Biochemistry, 42(32):9598-608). Adicionalmente, têm sido utilizadas selecções genéticas para identificar ARNt supressores eficazes de codões com quatro e cinco bases a partir de grandes bibliotecas de ARNt mutantes, incluindo um supressor ARNtSeruccu de E. coli (Ibba et al. (1999) Proc. Natl. Acad. Scl. U.S.A., 96:418-423; Kwok & Wong (1980) Can. J. Biochem., 58:213-218). Este fenómeno natural tem sido estendido à mutagénese in vitro de aminoácidos não naturais, utilizando ARNt aminoacilados quimicamente. Vários aminoácidos, incluindo pares de fluoróforo/desactivador (Terada et al. (2002) Nat. Struct. Biol., 9:257-262), foram incorporados em proteínas em resposta a AGGU e CGGG (Hou et al. (1992) Biochemistry, 31:4157-4160; Yarus et al. (1986) J.
Mol. Biol., 192:235-255; Miller (1972) Experiments in molecular genetics, Cold Spring Harbor Laboratory, Cold Spring Harbor, N.Y). Para expandir adicionalmente o código genético, é necessário desenvolver componentes melhorados e/ou adicionais da maquinaria biossintética, por exemplo, ARNt ortogonais, aminoacil-ARNt-sintetases ortogonais e/ou codões únicos. O presente invento satisfaz estas e outras necessidades, como será evidente após a análise da descrição que se segue.
Sumário do invento O presente invento proporciona novos sistemas de tradução que produzem produtos proteicos, utilizando ARNt ortogonais e aminoacil-ARNt-sintetases ortogonais como estabelecido nas reivindicações. O invento refere-se ao sistema de tradução estabelecido, a métodos de utilização do sistema de tradução e aos produtos de tradução produzidos pelo sistema. Esta tecnologia encontra várias utilizações como aqui discutidas, incluindo, embora não lhes limitadas, a produção de produtos terapêuticos, de reagentes para diagnóstico e de enzimas industriais. 3 ΕΡ 1 914 314/ΡΤ
Num aspecto, ο presente invento proporciona um sistema de tradução compreendendo: um ARNt ortogonal (O-ARNt), que reconhece um codão selector; e, uma sintetase ortogonal (O-RS) derivada de uma lisil-ARNt-sintetase, O-RS esta que é capaz de carregar especificamente o O-ARNt com homoglutamina .
Em algumas concretizações do sistema de tradução, o lisil-O-ARNt, a variante do O-ARNt, a O-RS ou ambas as espécies, O-ARNt e O-RS, são derivados de Pyrococcus horikoshii (PhKRS) . Várias O-RS que são úteis no sistema de tradução incluem PhKRS, E444G, PhAAD e um mutante 141 e/ou S268 de PhAAD. Em algumas concretizações, a O-RS de Pyrococcus horikoshii, quando é expressa numa célula de E. coli, apresenta uma toxicidade que é idêntica ou inferior à toxicidade de um mutante 141 e/ou S268 de PhAAD. 0 lisil-O-ARNt ou a variante do O-ARNt incluem opcionalmente uma sequência de reconhecimento para um codão com quatro bases ou para um codão âmbar. Por exemplo, o lisil-O-ARNt ou sua variante podem incluir uma sequência de reconhecimento para AGGA. Em aspectos relacionados do sistema de tradução, o lisil-O-ARNt ou sua variante utilizam uma ansa anticodão com a sequência CU(X)nXXXAA. Em algumas concretizações deste aspecto, a sequência CU(X)nXXXAA pode ser CUCUAAA ou CUUCCUAA. Os exemplos incluem o lisil-O-ARNt ou suas variantes que compreendem as sequências encontradas na SEQ ID NO:24 ou SEQ ID NO:26.
Em algumas concretizações do invento, a O-RS, o lisil-O-ARNt ou as suas variantes são pelo menos 50% tão eficazes na supressão de um codão de selecção stop ou de deslocamento do quadro de leitura como E444G, PhAAD ou um mutante 141 e/ou S268 de PhAAD, em combinação com um O-ARNt de SEQ ID NO:24 ou SEQ ID NO:26. Em outras concretizações, o sistema de tradução utiliza uma O-RS adicional e um O-ARNt adicional, em que estes componentes adicionais suprimem um codão de selecção de deslocamento do quadro de leitura que é diferente do codão de selecção de deslocamento do quadro de leitura suprimido pelo 4 ΕΡ 1 914 314/ΡΤ lisil-O-ARNt, ou por uma das variantes do O-ARNt, e pela O-RS que carrega preferencialmente o lisil-O-ARNt, ou uma das variantes do O-ARNt. Em outras concretizações, o sistema de tradução suprime não só um codão de selecção com quatro bases como também um codão de selecção stop, num ácido nucleico-alvo que codifica um polipéptido-alvo. 0 codão de selecção com quatro bases utiliza opcionalmente a sequência AGGA, e o codão de selecção stop utiliza opcionalmente a sequência TAG ou UAG. Em algumas concretizações, o sistema de tradução inclui um ácido nucleico-alvo que compreende um codão de selecção com quatro bases. 0 sistema de tradução incorpora opcionalmente uma proteína codificada pelo ácido nucleico-alvo. Por exemplo, esta proteína pode incorporar um resíduo de homoglutamina. 0 sistema de tradução incorpora opcionalmente um ácido nucleico-alvo, que codifica um codão de selecção com quatro bases e um codão de selecção stop. Em alguns aspectos, o sistema de tradução incorpora uma proteína codificada pelo ácido nucleico-alvo, em que a proteína inclui pelo menos dois aminoácidos não naturais diferentes. 0 invento proporciona, por exemplo, um sistema de tradução que utiliza um primeiro ARNt ortogonal (O-ARNt) que reconhece um codão de selecção com quatro bases, uma primeira aminoacil-ARNt-sintetase (O-RS) que carrega preferencialmente o O-ARNt com um primeiro aminoácido não natural, um segundo O-ARNt que reconhece um codão de selecção stop e uma segunda O-RS que carrega preferencialmente o segundo O-ARNt com um segundo aminoácido não natural. Numa concretização, o codão de selecção com quatro bases é AGGA, e o codão stop é UAG. Opcionalmente, o sistema de tradução encontra-se numa célula.
Em algumas concretizações do sistema de tradução, o primeiro ou o segundo O-ARNt é um lisil-ARNt ortogonal (lisil-O-ARNt) ou uma das suas variantes modificadas. Opcionalmente, o primeiro O-ARNt é um lisil-ARNt ortogonal (lisil-O-ARNt) ou uma das suas variantes adequadas e o segundo O-ARNt é um tirosil-ARNt ortogonal (tirosil-O-ARNt) ou uma das suas variantes adequadas. Opcionalmente, o sistema de tradução incorpora um ácido nucleico que codifica pelo menos um codão de selecção com quatro bases e um codão de selecção stop. Nestas concretizações, o codão de selecção com quatro bases 5 ΕΡ 1 914 314/ΡΤ pode ser AGGA, o codão de selecção stop pode ser TAG ou UAG e o ácido nucleico que será traduzido é normalmente um ARN expresso. Em algumas concretizações, a proteína codificada pelo ácido nucleico incorpora pelo menos dois aminoácidos não naturais diferentes, por exemplo, uma homoglutamina e um segundo aminoácido não natural, como seja um aminoácido electrófilo. 0 sistema de tradução pode incluir qualquer um de vários aminoácidos não naturais, incluindo, por exemplo, a homoglutamina. Num exemplo, a proteína no sistema de tradução é homóloga da mioglobina, mas inclui um aminoácido não natural como a homoglutamina. 0 presente invento proporciona composições que incorporam, embora não exclusivamente, as sequências de aminoácidos de PhKRS, E444G, PhAAD, de um mutante 141 e/ou S268 de PhAAD ou de uma variante conservativa destas proteínas. De forma similar, o invento proporciona os ácidos nucleicos que codificam PhKRS, E444G, PhAAD, um mutante 141 e/ou S268 de PhAAD e/ou qualquer variante conservativa destas sequências. 0 invento proporciona ácidos nucleicos que incorporam em parte, ou consistem totalmente em, um ARNt que corresponde à SEQ ID NO: 24 ou SEQ ID NO: 26, ou a quaisquer variantes conservativas destas sequências.
Em outros aspectos, o invento proporciona composições que incorporam, embora não exclusivamente, uma aminoacil-ARNt-sintetase ortogonal (O-RS), em que a O-RS efectua preferencialmente a aminoacilação de um Ο-ARNt com uma homoglutamina. Esta O-RS pode incluir uma mutação correspondente a uma mutação 141 e/ou S268 de PhAAD, ou a qualquer variante conservativa desta proteína. Em algumas concretizações, a O-RS efectua preferencialmente a aminoacilação do Ο-ARNt com uma eficácia que é pelo menos 50% da eficácia de uma mutação 141 e/ou S268 de PhAAD. Em algumas concretizações, a O-RS é derivada de Pyrococcus horikoshii. Em algumas concretizações em que ambas as espécies O-RS e O-ARNt estão presentes na composição, o O-ARNt reconhece um codão de selecção com quatro bases, por exemplo, uma sequência AGGA.
Em algumas concretizações em que a composição acima inclui ou está presente numa célula, a O-RS pode ser codificada por um ou mais ácidos nucleicos presentes na 6 ΕΡ 1 914 314/ΡΤ célula, que pode ser, por exemplo, uma célula de E. coli. A composição pode incorporar um sistema de tradução. Em composições que incorporam uma célula e em que a O-RS é codificada por um ou mais ácidos nucleicos presentes na célula, esta pode incluir adicionalmente um ARNt ortogonal (O-ARNt) que reconhece um primeiro codão de selecção e uma homoglutamina, por exemplo, em que a O-RS efectua preferencialmente a aminoacilação do O-ARNt com a homoglutamina. Em algumas concretizações, a célula pode incluir um ácido nucleico-alvo que codifica um polipéptido de interesse, em que o ácido nucleico-alvo codifica um codão de selecção que é reconhecido pelo O-ARNt. 0 O-ARNt é opcionalmente codificado, total ou parcialmente, por uma sequência polinucleotídica como apresentada na SEQ ID NO: 24 ou SEQ ID NO: 26, ou por uma sequência polinucleotídica complementar destas, e a O-RS incorpora uma sequência de aminoácidos correspondente a E444G, PhAAD, um mutante 141 e/ou S268 de PhAAD ou qualquer variante conservativa dessa sequência. Compreender-se-á que qualquer sequência de ácido nucleico deste invento pode ser representada numa forma de ARN ou ADN. Assim, a menos que o contexto indique o contrário, as sequências como SEQ ID NO: 24 ou 25 incluem opcionalmente formas de ARN e/ou ADN, independentemente de estas estarem ou não expressamente ilustradas. Em algumas concretizações, a O-RS e o O-ARNt são pelo menos 50% tão eficazes na supressão de um codão de selecção stop ou de deslocamento do quadro de leitura como E444G, PhAAD ou um mutante 141 e/ou S268 de PhAAD, em combinação com um O-ARNt de SEQ ID NO: 24 ou SEQ ID NO: 26. Em concretizações em que a composição incorpora uma célula, a célula pode ser uma célula de E. coli. Uma célula desta composição pode ainda incluir um par O-ARNt/O-RS adicional diferente e um aminoácido não natural adicional diferente, em que o O-ARNt reconhece um segundo codão de selecção e a O-RS efectua preferencialmente a aminoacilação do O-ARNt com o segundo aminoácido não natural. A célula pode ainda incluir opcionalmente um ácido nucleico-alvo que codifica o primeiro e o segundo codões de selecção. Ainda além disso, uma célula desta composição pode incluir uma proteína codificada pelo ácido nucleico-alvo, em que a proteína incorpora pelo menos dois aminoácidos não naturais diferentes. 7 ΕΡ 1 914 314/ΡΤ Ο invento também proporciona uma proteína que inclui pelo menos uma homoglutamina. Em algumas concretizações, a proteína inclui uma sequência de aminoácidos que é pelo menos 75% idêntica a uma sequência de uma proteína terapêutica, de uma proteína de diagnóstico, de uma enzima industrial de tipo selvagem ou de qualquer porção destas proteínas. Opcionalmente, a proteína existe em conjunção com um veículo farmaceuticamente aceitável.
Em outro aspecto, o invento proporciona métodos para seleccionar uma aminoacil-ARNt-sintetase ortogonal (O-RS) activa que carrega uma homoglutamina num ARNt ortogonal (O-ARNt). Estes métodos utilizam um primeiro passo que consiste em submeter uma população de células a uma selecção, em que as células incluem colectivamente 1) o O-ARNt, em que o O-ARNt é ortogonal em relação aos membros da população de células que compreendem o O-ARNt; 2) uma pluralidade de O-RS que possuem um ou mais membros O-RS activos que carregam o O-ARNt com uma homoglutamina, em uma ou mais células da população; 3) um polinucleótido que codifica uma marca de selecção, em que o polinucleótido codifica pelo menos um codão de selecção que é reconhecido pelo O-ARNt; e 4) homoglutamina. Nesta selecção, a célula-alvo na população, que compreende a O-RS activa, é identificada através de uma eficácia de supressão melhorada da marca de selecção, em comparação com a eficácia de supressão de uma célula de controlo que não possui a pluralidade de RS, mas que compreende o O-ARNt. 0 segundo passo do método consiste no procedimento de selecção, que selecciona a célula-alvo que alberga uma O-RS activa. 0 invento proporciona adicionalmente a aminoacil-ARNt-sintetase ortogonal identificada através de qualquer um dos métodos de selecção.
Em algumas concretizações destes métodos, as células são adicionalmente seleccionadas para eliminar as células compreendendo uma O-RS-não-alvo que carrega o O-ARNt com um aminoácido diferente da homoglutamina. Em algumas concretizações, a selecção é uma selecção positiva, e a marca de selecção é uma marca de selecção positiva. 8 ΕΡ 1 914 314/ΡΤ
Em várias concretizações destes métodos, a pluralidade de RS pode provir de qualquer uma de várias fontes, incluindo, embora não estando limitadas a estas, RS mutantes, RS derivadas de uma ou mais espécies diferentes da primeira espécie ou ambas as RS mutantes e as RS derivadas de uma espécie diferente da primeira espécie. 0 invento também proporciona métodos para produzir uma proteína numa célula contendo uma homoglutamina numa posição especificada. 0 método inclui os passos de crescer, num meio apropriado, uma célula contendo um ácido nucleico que codifica pelo menos um codão de selecção e que codifica uma proteína; por exemplo, em que a célula inclui adicionalmente um ARNt ortogonal (Ο-ARNt) que reconhece o codão de selecção e uma aminoacil-ARNt-sintetase ortogonal (O-RS) que efectua preferencialmente a aminoacilação do Ο-ARNt com uma homoglutamina; proporcionar a homoglutamina; e incorporar a homoglutamina na posição especificada em resposta ao codão de selecção, produzindo, desta forma, a proteína. Numa concretização deste método, a sequência de aminoácidos da O-RS utiliza inteiramente, ou em parte, a sequência de aminoácidos de E444G, de PhAAD, de um mutante 141 e/ou S268 de PhAAD, ou uma sua variante conservativa.
DEFINIÇÕES
Antes de descrever o invento em pormenor, deverá entender-se que ele não está limitado a sistemas biológicos particulares que podem, naturalmente, variar. Deverá também entender-se que a terminologia aqui utilizada se destina apenas a descrever concretizações particulares, não se pretendendo que seja limitante. Tal como utilizadas nesta especificação e nas reivindicações anexas, as formas singulares "um/a" e "o/a" incluem referentes no plural, a menos que o conteúdo indique claramente o contrário. Assim, por exemplo, a referência a "uma célula" inclui uma combinação de duas ou mais células; a referência a "bactérias" inclui misturas de bactérias, etc.
Salvo definição aqui ou na restante parte do fascículo, todos os termos técnicos e científicos aqui utilizados têm o 9 ΕΡ 1 914 314/ΡΤ significado normalmente atribuído por um perito na arte à qual o invento pertence.
Lisil-ARNt ortogonal. Tal como o termo é aqui utilizado, um lisil-ARNt ortogonal (lisil-O-ARNt) é um ARNt que é ortogonal em relação a um sistema de tradução de interesse, em que o ARNt é (1) idêntico ou substancialmente similar a um lisil-ARNt existente na natureza; (2) derivado de um lisil-ARNt existente na natureza através de mutagénese natural ou artificial; (3) derivado por meio de qualquer processo que tenha em consideração uma sequência de um lisil-ARNt de tipo selvagem ou mutante das alíneas (1) ou (2); (4) homólogo de um lisil-ARNt de tipo selvagem ou mutante; (5) homólogo de qualquer exemplo de ARNt que seja designado como substrato para uma lisil-ARNt-sintetase na TABELA 1 ou (6) uma variante conservativa de qualquer exemplo de ARNt que seja designado como substrato para uma lisil-ARNt-sintetase na TABELA 1. 0 lisil-ARNt pode existir carregado com um aminoácido ou num estado não carregado. Deverá também entender-se que um "lisil-O-ARNt" é opcionalmente carregado (aminoacilado) por uma sintetase cognata com um aminoácido diferente de lisina, por exemplo, com o aminoácido homoglutamina. Na verdade, compreender-se-á que um lisil-O-ARNt do invento é vantajosamente utilizado para introduzir praticamente qualquer aminoácido, natural ou artificial, num polipéptido em crescimento durante a tradução, em resposta a um codão de selecção.
Lisil-aminoácido-sintetase ortogonal. Tal como o termo é aqui utilizado, uma lisil-aminoácido-sintetase ortogonal (lisil-O-RS) é uma enzima que efectua preferencialmente a aminoacilação do lisil-O-ARNt com um aminoácido, num sistema de tradução de interesse. 0 aminoácido que a lisil-O-RS carrega no lisil-O-ARNt pode ser qualquer aminoácido, seja ele natural ou artificial, e não está aqui limitado. A sintetase é opcionalmente uma lisil-aminoácido-sintetase existente na natureza, ou homóloga dela, ou uma sintetase designada por lisil-O-RS na TABELA 1, ou homóloga dela. Por exemplo, a lisil-O-RS pode ser uma variante conservativa de uma lisil-O-RS da TABELA 1 e/ou pode ser pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 98%, 99% ou mais idêntica, em termos de sequência, a uma lisil-O-RS da TABELA 1. 10 ΕΡ 1 914 314/ΡΤ
Ortogonal. Tal como aqui utilizado, o termo “ortogonal" refere-se a uma molécula (por exemplo, um ARNt ortogonal (O-ARNt) e/ou uma aminoacil-ARNt-sintetase ortogonal (O-RS)) que actua com uma eficácia reduzida com os componentes endógenos de uma célula, em comparação com uma molécula correspondente que é endógena à célula ou ao sistema de tradução, ou que não consegue actuar em conjunto com os componentes endógenos da célula. No contexto dos ARNt e das aminoacil-ARNt-sintetases, ortogonal refere-se a uma incapacidade ou uma eficácia reduzida, por exemplo, uma eficácia inferior a 20%, uma eficácia inferior a 10%, uma eficácia inferior a 5% ou uma eficácia inferior a 1% de um ARNt ortogonal para actuar em conjunto com uma ARNt-sintetase endógena, em comparação com a capacidade de um ARNt endógeno para actuar em conjunto com a ARNt-sintetase endógena; ou de uma aminoacil-ARNt-sintetase ortogonal para actuar em conjunto com um ARNt endógeno, em comparação com a capacidade de uma ARNt-sintetase endógena para actuar em conjunto com o ARNt endógeno. A molécula ortogonal não possui uma molécula complementar endógena, funcionalmente normal, na célula. Por exemplo, um ARNt ortogonal numa célula é aminoacilado por qualquer RS endógena à célula com uma eficácia reduzida ou mesmo indetectável, quando esta é comparada com a aminoacilação de um ARNt endógeno pela RS endógena. Noutro exemplo, uma RS ortogonal efectua a aminoacilação de qualquer ARNt endógeno numa célula de interesse com uma eficácia reduzida ou mesmo indetectável, em comparação com a aminoacilação do ARNt endógeno por uma RS endógena. É possível introduzir na célula uma segunda molécula ortogonal, que actua em conjunto com a primeira molécula ortogonal. Por exemplo, um par ARNt/RS ortogonal inclui componentes complementares introduzidos que funcionam em conjunto na célula com uma certa eficácia (por exemplo, uma eficácia de 45%, uma eficácia de 50%, uma eficácia de 60%, uma eficácia de 70%, uma eficácia de 75%, uma eficácia de 80%, uma eficácia de 90%, uma eficácia de 95% ou uma eficácia de 99% ou mais), em comparação com a eficácia de um controlo, por exemplo, um par endógeno ARNt/RS correspondente ou um par ortogonal activo (por exemplo, um par tirosil-ARNt/RS ortogonal). 11 ΕΡ 1 914 314/ΡΤ
Cognato. 0 termo "cognato" refere-se a componentes que actuam em conjunto; por exemplo, um ARNt ortogonal e uma aminoacil-ARNt-sintetase ortogonal que efectua de preferência a aminoacilação do ARNt ortogonal. Os componentes podem também ser referidos como sendo "complementares".
Efectua preferencialmente a aminoacilação. 0 termo "efectua preferencialmente a aminoacilação" indica que uma O-RS carrega um ARNt particular com um dado aminoácido mais eficientemente do que carrega outros ARNt. Por exemplo, a O-RS pode carregar um Ο-ARNt cognato com uma certa eficácia (por exemplo, uma eficácia de 70%, uma eficácia de 75%, uma eficácia de 85%, uma eficácia de 90%, uma eficácia de 95% ou uma eficácia de 99% ou mais) em comparação com esta O-RS a efectuar a aminoacilação de um ARNt não cognato (por exemplo, um ARNt utilizado como substrato para criar o Ο-ARNt cognato, por exemplo, via mutação).
Codão de selecção. O termo "codão de selecção" refere-se a um codão reconhecido por um Ο-ARNt num processo de tradução, que não é normalmente reconhecido por um ARNt endógeno. Os exemplos tipicos incluem codões stop, codões compreendendo 4 ou mais bases e/ou codões similares. A ansa do anticodão de um O-ARNt reconhece um codão de selecção, por exemplo, num ARN expresso, como seja um ARNm, e insere o seu aminoácido num polipéptido que está a ser traduzido pelos componentes do sistema de tradução. Numa concretização deste invento, o 0-ARNt reconhece um codão de selecção, por exemplo um codão com quatro bases, e adiciona um aminoácido não natural, como uma homoglutamina, a um polipéptido que está a ser produzido pelo processo de tradução. Os codões de selecção podem incluir, por exemplo, codões sem sentido tais como os codões stop, por exemplo, âmbar, ocre e opala; codões com quatro ou mais bases; codões raros; codões derivados de pares de bases naturais ou não naturais e/ou codões idênticos. ARNt supressor. Um ARNt supressor é um ARNt que altera a leitura de um ARN mensageiro (ARNm) num dado sistema de tradução, por exemplo, proporcionando um mecanismo para incorporar um aminoácido numa cadeia polipeptidica em resposta a um codão de selecção. Um ARNt supressor pode ler, por 12 ΕΡ 1 914 314/ΡΤ exemplo, através de um codão stop, de um codão com quatro bases, de um codão raro, etc.
Actividade de supressão: Tal como aqui utilizado, o termo "actividade de supressão" refere-se, em geral, à capacidade de um ARNt (por exemplo, um ARNt supressor) para permitir a tradução ininterrupta (read-through) de um codão (por exemplo, um codão de selecção que é um codão âmbar ou um codão com 4 ou mais bases) que, caso contrário, resultaria na terminação da tradução ou numa tradução incorrecta (por exemplo, em deslocamento do quadro de leitura). A actividade de supressão de um ARNt supressor pode ser expressa como uma percentagem da actividade de tradução ininterrupta observada, em comparação com um segundo ARNt supressor ou em comparação com um sistema de controlo; por exemplo, um sistema de controlo sem uma O-RS. 0 presente invento proporciona vários meios através dos quais a actividade de supressão pode ser quantificada. A percentagem de supressão de um Ο-ARNt e de uma O-RS particulares em relação a um codão de selecção de interesse (por exemplo, um codão âmbar) refere-se à percentagem de actividade de uma dada marca de teste expressa (por exemplo, LacZ), que inclui um codão de selecção, num ácido nucleico que codifica a marca de teste expressa, num sistema de tradução de interesse, em que o sistema de tradução de interesse inclui uma O-RS e um Ο-ARNt, em comparação com uma construção de controlo positivo, em que o controlo positivo não possui o Ο-ARNt, a O-RS e o codão de selecção. Assim, por exemplo, se uma construção da marca de controlo positivo activa, que não contém um codão de selecção, possuir uma actividade observada igual a X num dado sistema de tradução, em unidades relevantes para o ensaio da marca em questão, então a percentagem de supressão de uma construção de teste compreendendo o codão de selecção é a percentagem de X que a construção da marca de teste apresenta essencialmente nas mesmas condições ambientais em que a marca de controlo positivo foi expressa, com a excepção da construção da marca de teste ser expressa num sistema de tradução que também inclui o Ο-ARNt e a O-RS. Tipicamente, o sistema de tradução que expressa a marca de teste também inclui um aminoácido que é reconhecido pela O-RS e pelo O-ARNt. Opcionalmente, a medição da percentagem de supressão pode ser refinada através de comparação da marca de 13 ΕΡ 1 914 314/ΡΤ teste com uma construção da marca de controlo “negativo" ou de “fundo", que inclui o mesmo codão de selecção que a marca de teste, mas num sistema que não inclui o O-ARNt, a O-RS e/ou o aminoácido relevante reconhecido pelo O-ARNt e/ou a O-RS. Este controlo negativo é útil para normalizar as medições da percentagem de supressão, tendo em consideração os efeitos do sinal de fundo proveniente da marca no sistema de tradução de interesse. A eficácia da supressão pode ser determinada utilizando qualquer um dos vários ensaios conhecidos na arte. Por exemplo, é possível utilizar um ensaio com o gene repórter da β-galactosidase; um plasmídeo lacZ derivatizado (em que a construção possui um codão de selecção na sequência de ácido nucleico do gene lacZ) é introduzido em células de um organismo apropriado (como seja um organismo em que os componentes ortogonais podem ser utilizados), juntamente com um plasmídeo compreendendo um O-ARNt do invento. Uma sintetase cognata pode também ser introduzida (quer como um polipéptido ou como um polinucleótido que codifica a sintetase cognata quando expresso) . As células são crescidas em meio até uma densidade desejada, por exemplo, até uma D060o de cerca de 0,5; e os ensaios da β-galactosidase são efectuados utilizando, por exemplo, o conjunto de ensaio da β-galactosidase BetaFluor™ (Novagen). A percentagem de supressão pode ser calculada como a percentagem de actividade de uma amostra em relação a um controlo comparável; por exemplo, o valor observado a partir da construção lacZ derivatizada, em que a construção possui um codão com sentido (sense) correspondente na posição desejada em vez de um codão de selecção.
Sistema de tradução. O termo “sistema de tradução" refere-se aos componentes que incorporam um aminoácido numa cadeia polipeptídica (proteína) em crescimento. Os componentes de um sistema de tradução podem incluir, por exemplo, ribossomas, ARNt, sintetases, ARNm e espécies similares. Os O-ARNt e/ou as O-RS do invento podem ser adicionados ou fazer parte de um sistema de tradução in vitro ou in vivo, por exemplo, numa célula não eucariótica, como uma bactéria (tal como E. coli) ou numa célula eucariótica, como uma célula de levedura, uma célula de mamífero, uma célula de planta, uma 14 ΕΡ 1 914 314/ΡΤ célula de alga, uma célula de fungo, uma célula de insecto e/ou células semelhantes.
Aminoácido não natural. Tal como aqui utilizado, o termo "aminoácido não natural" refere-se a qualquer aminoácido, aminoácido modificado e/ou análogo de aminoácido, como seja uma homoglutamina, que não é um dos 20 aminoácidos comuns existentes na natureza ou um dos aminoácidos naturais raros selenocisteína ou pirrolisina.
Derivado de. Tal como aqui utilizado, o termo "derivado de" refere-se a um componente que é isolado a partir de uma molécula ou de um organismo específicos, ou preparado utilizando uma molécula ou um organismo específicos ou informação proveniente da molécula ou do organismo específicos.
Marca de selecção ou de rastreio positiva. Tal como aqui utilizado, o termo "marca de selecção ou de rastreio positiva" refere-se a uma marca que quando está presente, isto é, quando é expressa, activada ou similar, resulta na identificação de uma célula que compreende uma característica correspondente a essa marca, ou seja, as células com a marca de selecção positiva, relativamente às células que não possuem a caracteristica.
Marca de selecção ou de rastreio negativa. Tal como aqui utilizado, o termo "marca de selecção ou de rastreio negativa" refere-se a uma marca que quando está presente, isto é, quando é expressa, activada ou similar, permite a identificação de uma célula que não compreende uma característica ou propriedade seleccionada (por exemplo, em comparação com uma célula que possui efectivamente a propriedade ou a característica).
Repórter. Tal como aqui utilizado, o termo "repórter" refere-se a um componente que pode ser utilizado para identificar e/ou seleccionar os componentes-alvo de um sistema de interesse. Por exemplo, um repórter pode incluir uma proteína, como seja uma enzima, que confere resistência ou sensibilidade a um antibiótico (por exemplo, β-lactamase, cloranfenicol-acetiltransferase (CAT) e antibióticos 15 ΕΡ 1 914 314/ΡΤ similares), uma marca de rastreio fluorescente (como a proteína fluorescente verde (por exemplo, (GFP), YFP, EGFP, RFP, etc.)), uma marca luminescente (por exemplo, uma proteína luciferase de pirilampo), uma marca de rastreio baseada em afinidade ou os genes de marcas de selecção positivas ou negativas, como lacZ, β-gal/lacZ (β-galactosidase) , Adh (álcool-desidrogenase), his3, ura3, leu2, lys2 ou similares.
Eucariota. Tal como aqui utilizado, o termo "eucariota" refere-se a organismos pertencentes ao domínio filogenético Eucarya, tais como animais (por exemplo, mamíferos, insectos, répteis, pássaros, etc.), ciliados, plantas (por exemplo, monocotiledóneas, dicotiledóneas, algas, etc.), fungos, leveduras, flagelados, microsporídeos, protistas, etc. Não eucariota. Tal como aqui utilizado, o termo "não eucariota" refere-se a organismos não eucarióticos. Por exemplo, um organismo não eucariótico pode pertencer ao domínio filogenético Eubacteria (por exemplo, Escherichia coll, Thermus thermophilus, Bacillus stearothermophilus, etc.) ou aos domínios filogenéticos Archaea (por exemplo, Methanococcus jannaschii (Mj), Methanosarcina mazei (Mm), Methanobacterium thermoautotrophicum (Mt), Methanococcus maripaludis, Methanopyrus kandleri, Halobacterium como Haloferax volcanii e Halobacterium sp. NRC-1, Archaeoglobus fulgidus (Af), Pyrococcus furiosus (Pf), Pyrococcus horikoshii (Ph), Pyrobaculum aerophilum, Pyrococcus abyssi, Sulfolobus solfataricus (Ss), Sulfolobus tokodaii, Aeuropyrum pernix (Ap), Thermoplasma acidophilum, Thermoplasma volcanium, etc.).
Variante conservativa. Tal como aqui utilizado, o termo "variante conservativa", no contexto de um componente da tradução, refere-se a um componente da tradução, por exemplo, uma variante conservativa do O-ARNt ou uma variante conservativa da O-RS, que actua funcionalmente de uma forma idêntica a um componente de base ao qual a variante conservativa é similar, como um O-ARNt ou uma O-RS, e que possui variações de sequência em comparação com um O-ARNt ou uma O-RS de referência. Por exemplo, uma O-RS efectuará a aminoacilação de um O-ARNt complementar ou de uma variante conservativa do O-ARNt com um aminoácido não natural, por exemplo, uma homoglutamina, embora o O-ARNt e a variante 16 ΕΡ 1 914 314/ΡΤ conservativa do O-ARNt não tenham a mesma sequência. A variante conservativa pode ter, por exemplo, uma variação, duas variações, três variações, quatro variações ou cinco ou mais variações de sequência, desde que a variante conservativa seja complementar do O-ARNt ou da O-RS correspondentes.
Agente de selecção ou de rastreio. Tal como aqui utilizado, o termo "agente de selecção ou de rastreio" refere-se a um agente que, quando está presente, permite a selecção/rastreio de determinados componentes a partir de uma população. Por exemplo, um agente de selecção ou de rastreio pode ser, embora não se encontre limitado a estes exemplos, um nutriente, um antibiótico, um comprimento de onda de luz, um anticorpo, um polinucleótido expresso ou espécies similares. 0 agente de selecção pode ser variado, por exemplo, em termos de concentração, intensidade, etc.
Em resposta a. Tal como aqui utilizado, o termo "em resposta a" refere-se ao processo no qual um ARNt do invento reconhece um codão de selecção e incorpora um aminoácido relevante, por exemplo, um aminoácido não natural como a homoglutamina, que é transportado pelo ARNt, na cadeia polipeptidica em crescimento.
Codificar. Tal como aqui utilizado, o termo "codificar" refere-se a qualquer processo por meio do qual a informação contida numa macromolécula polimérica ou numa cadeia de sequência é utilizada para orientar a produção de uma segunda molécula ou cadeia de sequência que é diferente da primeira molécula ou cadeia de sequência. Tal como aqui utilizado, o termo é usado de uma forma ampla e pode ter uma variedade de aplicações. Num aspecto, o termo "codificar" descreve o processo de replicação semiconservativa do ADN, em que uma cadeia de uma molécula de ADN de cadeia dupla é utilizada como modelo para codificar uma cadeia-irmã complementar acabada de sintetizar por uma ADN-polimerase dependente de ADN.
Em outro aspecto, o termo "codificar" refere-se a qualquer processo por meio do qual a informação contida numa molécula é utilizada para orientar a produção de uma segunda molécula que possui uma natureza química diferente da primeira molécula. Uma molécula de ADN pode codificar uma molécula de 17 ΕΡ 1 914 314/ΡΤ ARN (por exemplo, pelo processo de transcrição que incorpora uma enzima ARN-polimerase dependente de ADN). Além disso, uma molécula de ARN pode codificar um polipéptido, tal como acontece no processo de tradução. Quando é utilizado para descrever o processo de tradução, o termo “codificar" também se estende ao codão tripleto que codifica um aminoácido. Em alguns aspectos, uma molécula de ARN pode codificar uma molécula de ADN, por exemplo, através do processo de transcrição reversa que incorpora uma ADN-polimerase dependente de ARN. Em outro aspecto, uma molécula de ADN pode codificar um polipéptido, onde se entende que "codificar", tal como utilizado neste caso, engloba ambos os processos de transcrição e de tradução.
BREVE DESCRIÇÃO DAS FIGURAS A Figura 1 proporciona um alinhamento de sequências das sequências de ARNtLys de arqueobactéria. As sequências genómicas derivadas de Pa, Pyrococcus abyssi; Pf, Pyrococcus furiosus; Ph, Pyrococcus horikoshii; Pya, Pyrobaculum aerophilum; Ta, Thermoplasma acidophilum; Tv, Thermoplasma volcanum; Af, Archaeoglobus fulgidus; Hh, Halobacterium sp. NRC-1; Mj, Methanococcus jannaschii; Mt, Methanobacterium thermoautotrophicum; Mm, Methanosarcina mazei; St, Sulfolobus tokodaii; Ss, Sulfolobus solfataricus; Ap, Aeropyrum pernix foram alinhadas com o programa Pileup de GCG e visualizadas com o programa Prettybox. A Figura 2, Painéis A e B, proporciona histogramas que ilustram a aminoacilação cruzada entre espécies in vitro. (A) Aminoacilação do ARNt total de E. coli ou do (B) ARNt total halobacteriano por EcKRS (□) , PhKRS () ou nenhuma sintetase (A). Os ensaios foram efectuados em reacções de 20 μΐ contendo Tris-Cl 50 mM, pH 7,5; KC1 30 mM; MgCl2 20 mM; glutationa 3 mM; BSA 0,1 mg/ml; ATP 10 mM; [3H]-lisina 1 μΜ (Amersham) ; sintetase 750 nM e ARNt total 0, 2, 10 ou 40 μΜ a 37°C durante 20 minutos. A Figura 3 ilustra esquematicamente um ARNt supressor do codão âmbar, derivado da sequência consenso. A sequência consenso para a família das sequências de ARNtLys de arqueobactéria está representada numa configuração em folha de 18 ΕΡ 1 914 314/ΡΤ trevo. A ansa do anticodao foi alterada da sequência consenso para CUCUAAA para gerar AKCUa· A Figura 4 proporciona um histograma que ilustra a actividade in vivo do par sintetase-ARNt ortogonal. A actividade de β-galactosidase foi determinada em quadruplicado para células GeneHog (Invitrogen) transformadas com os plasmideos ilustrados ou sem quaisquer plasmídeos. 0 mutante E444G de PhKRS foi expresso a partir do plasmideo pKQ. 0 plasmideo pKQ foi utilizado para as amostras que não continham qualquer sintetase. AKCtja foi expresso a partir do plasmideo pACGFP, e o plasmideo pACGFP foi utilizado para as amostras que não continham qualquer ARNt. Os genes repórter lacZ provieram do plasmideo pLASC-lacZ. As células foram crescidas em meio 2YT contendo os antibióticos apropriados até uma ϋΟεοο de 0,5 e depois foram analisadas pelos métodos de Miller (Miller (1972) Experiments in molecular genetics, Cold Spring Harbor Laboratory, Cold Spring Harbor, N.Y).
Figura 5. Construção de ARNt supressores do codão âmbar e de um codão com quatro bases. Um ARNt supressor do codão âmbar foi construído a partir dos alinhamentos multissequências de muitas sequências de ARNtLys. Um ARNt ortogonal supressor do codão AGGA foi identificado através de selecção a partir de uma biblioteca de hastes aceitadoras.
Figuras 6A e 6B. A Figura 6A ilustra a estrutura do local activo de PhKRS. Os resíduos E41 e Y268 têm contactos específicos com o substrato de lisina. Estes resíduos foram distribuídos simultaneamente de forma aleatória para a construção de bibliotecas de locais activos. A Figura 6B ilustra as estruturas de vários aminoácidos.
As Figuras 7A e 7B proporcionam imagens de quimiofluorescência que ilustram a expressão de mioglobina através da supressão de AGGA; Figura 7A, o gene da mioglobina com um codão AGGA na posição G24 foi expresso na presença do ARNt AKuccu e de PhAAD, uma variante específica para hGln, ou de JYRS. A expressão de mioglobina através da supressão do codão âmbar na posição S4 foi também tentada com ΡΙιΔΑΌ ou com JYRS. B, a hGln foi incorporada por supressão de AGGA na 19 ΕΡ 1 914 314/ΡΤ posição 24 e a AzPhe foi incorporada por supressão do codao âmbar na posição 75, num único polipéptido.
Figura 8. Análise MALDI-TOF de fragmentos tripticos contendo homoglutamina ou lisina.
Figura 9. Análise de espectrometria de massa de electropulverização da mioglobina completa contendo homoglutamina na posição 24 e O-metil-tirosina na posição 75.
DESCRIÇÃO DETALHADA
De forma a adicionar aminoácidos sintéticos adicionais, tal como uma homoglutamina, ao código genético in vivo, é necessário dispor de novos pares ortogonais de uma aminoacil-ARNt-sintetase e de um ARNt que possam funcionar eficazmente na maquinaria de tradução, mas que sejam "ortogonais" em relação ao sistema de tradução em questão, significando isto que os pares funcionam independentemente das sintetases e dos ARNt endógenos do sistema de tradução. As caracteristicas desejadas do par ortólogo incluem ARNt que descodificam ou reconhecem apenas um codão novo especifico, por exemplo, um codão de selecção, que não é descodificado por qualquer ARNt endógeno, e aminoacil-ARNt-sintetases que efectuam preferencialmente a aminoacilação (ou carregam) do seu ARNt cognato apenas com um aminoácido não natural especifico, por exemplo, uma homoglutamina. 0 Ο-ARNt também não é desejavelmente aminoacilado por sintetases endógenas. Por exemplo, em E. coli, um par ortogonal incluirá uma aminoacil-ARNt-sintetase que praticamente não efectua a aminoacilação de nenhum dos ARNt endógenos, dos quais existem 40 em E. coli, e um ARNt ortogonal que não é aminoacilado por nenhuma das sintetases endógenas, das quais existem 21 em E. coli.
Aqui, descrevemos a geração de um novo par sintetase/ARNt ortogonal derivado das sequências de ARNtLys de arqueobactéria, que incorpora eficaz e selectivamente o aminoácido homoglutamina (hGln) na mioglobina, em resposta ao codão de selecção com quatro bases AGGA. A supressão do deslocamento do quadro de leitura com hGln não afecta significativamente os rendimentos da proteína ou as taxas de crescimento celular e demonstrou ser mutuamente ortogonal com a supressão de TAG por 20 ΕΡ 1 914 314/ΡΤ um segundo par O-ARNt/O-RS. Este trabalho mostra que nem o número de codões tripleto disponíveis, nem a maquinaria de tradução em si representa uma barreira significativa a uma expansão adicional do código.
Para codificar aminoácidos não naturais com codões quadrupleto in vivo, é necessário gerar um ARNt ortogonal (0-ARNt) que reconheça unicamente este codão e uma sintetase correspondente que efectue a aminoacilação apenas deste 0-ARNt com um aminoácido não natural de interesse. Como a ansa do anticodão do ARNt ortogonal supressor do codão âmbar, derivado de M. jannaschii, previamente gerado é um elemento-chave de reconhecimento para a sintetase cognata, JYRS, foi difícil estender esta ansa para descodificar um codão com quatro bases. Embora pudesse ser exequível relaxar a especificidade de ligação do anticodão de JYRS, provavelmente seria difícil construir pares mutuamente ortogonais que distinguissem entre supressores do codão âmbar e supressores de codões com quatro bases utilizando exclusivamente a sequência do anticodão. Assim, um sistema que permite a incorporação simultânea de dois ou mais aminoácidos não naturais diferentes num polipéptido, em resposta a dois ou mais codões de selecção diferentes, é aqui concretizado utilizando pares ortogonais com diferentes origens.
Este invento proporciona composições e métodos para identificar e produzir pares ortogonais ARNt/aminoacil-ARNt-sintetase adicionais, por exemplo, pares O-ARNt/O-RS que podem ser utilizados para incorporar aminoácidos não naturais, por exemplo, uma homoglutamina. Um O-ARNt exemplificativo do invento é capaz de mediar a incorporação de uma homoglutamina numa proteína que é codificada por um polinucleótido, o qual compreende um codão de selecção que é reconhecido pelo O-ARNt, por exemplo, in vivo. A ansa do anticodão do 0-ARNt reconhece o codão de selecção num ARNm e incorpora o seu aminoácido, por exemplo, uma homoglutamina, neste local do polipéptido. Uma aminoacil-ARNt-sintetase ortogonal do invento efectua preferencialmente a aminoacilação (ou carrega) do seu O-ARNt apenas com um aminoácido não natural específico. 21 ΕΡ 1 914 314/ΡΤ
ARNt ORTOGONAIS/AMINOACIL-ARNt-SINTETASES ORTOGONAIS E SEUS PARES
Os sistemas de tradução que são adequados para produzir proteínas contendo um ou mais aminoácidos não naturais estão descritos nas publicações internacionais com os números WO 2002/086075, intitulada "METHODS AND COMPOSITION FOR THE PRODUCTION OF ORTHOGANOL tRNA-AMINOACYL-tRNA SYNTHETASE PAIRS" e WO 2002/085923, intitulada "IN VIVO INCORPORATION OF UNNATURAL AMINO ACIDS". Consultar adicionalmente WO 2004/094593, apresentado em 16 de Abril de 2004. Estes sistemas de tradução compreendem geralmente células (que podem ser células não eucarióticas como E. coli, ou células eucarióticas como levedura) que incluem um ARNt ortogonal (0-ARNt), uma aminoacil-ARNt-sintetase ortogonal (O-RS) e um aminoácido não natural (no presente invento, a homoglutamina é um exemplo de um aminoácido não natural deste tipo), em que a O-RS efectua a aminoacilação do Ο-ARNt com a homoglutamina. Um par ortogonal do invento inclui um O-ARNt, por exemplo, um ARNt supressor, um ARNt de deslocamento do quadro de leitura ou uma espécie similar, e uma O-RS. Os componentes individuais também são proporcionados no invento.
Em geral, quando um par ortogonal reconhece um codão de selecção e carrega um aminoácido em resposta ao codão de selecção, diz-se que o par ortogonal "suprime" o codão de selecção. Isto é, um codão de selecção que não é reconhecido pela maquinaria endógena do sistema de tradução (por exemplo, da célula) não é normalmente traduzido, o que pode resultar em bloqueio da produção de um polipéptido que, caso contrário, seria traduzido a partir do ácido nucleico. Um Ο-ARNt do invento reconhece um codão de selecção e inclui uma eficácia de supressão de pelo menos cerca de 45%, 50%, 60%, 75%, 80%, 90% ou mais, na presença de uma sintetase cognata e em resposta a um codão de selecção, em comparação com um O-ARNt que compreende ou é codificado por uma sequência polinucleotídica como apresentada na lista de sequências. A O-RS efectua a aminoacilação do O-ARNt com um aminoácido não natural de interesse, como seja uma homoglutamina. A célula utiliza o par O-ARNt/O-RS para incorporar o aminoácido não natural numa cadeia polipeptídica em crescimento, por exemplo, via um ácido nucleico compreendendo um polinucleótido que 22
ΕΡ 1 914 314/PT codifica um polipéptido de interesse, em que o polinucleótido compreende um codão de selecção que é reconhecido pelo O-ARNt. Em determinados aspectos desejáveis, a célula pode incluir um par O-ARNt/O-RS adicional, em que o O-ARNt adicional é carregado pela O-RS adicional com um aminoácido não natural diferente. Por exemplo, um dos O-ARNt pode reconhecer um codão com quatro bases e o outro pode reconhecer um codão stop. Em alternativa, múltiplos codões stop diferentes ou múltiplos codões com quatro bases diferentes podem reconhecer especificamente diferentes codões de selecção.
Em determinadas concretizações do invento, uma célula, tal como uma célula de E. coli, inclui um ARNt ortogonal (O-ARNt), uma aminoacil-ARNt-sintetase ortogonal (O-RS), uma homoglutamina e um ácido nucleico compreendendo um polinucleótido que codifica um polipéptido de interesse, em que o polinucleótido compreende o codão de selecção que é reconhecido pelo O-ARNt. 0 sistema de tradução também pode ser um sistema isento de células, por exemplo, qualquer um de vários sistemas de transcrição/tradução "in vitro" disponíveis comercialmente, em combinação com um par O-ARNt/O-RS e com um aminoácido não natural tal como aqui descrito.
Numa concretização, a eficácia de supressão da O-RS e do O-ARNt em conjunto é cerca de 5x, lOx, 15x, 20x, 25x, ou mais, superior à eficácia de supressão do O-ARNt sem a O-RS. Num aspecto, a eficácia de supressão da O-RS e do O-ARNt em conjunto é pelo menos cerca de 35%, 40%, 45%, 50%, 60%, 75%, 80%, 90% ou mais da eficácia de supressão de um par ortogonal de sintetase como apresentada na lista de sequências.
Como referido, o invento inclui opcionalmente múltiplos pares O-ARNt/O-RS numa célula ou em outro sistema de tradução, o que permite a incorporação de mais de um aminoácido não natural, por exemplo, uma homoglutamina e outro aminoácido não natural. Por exemplo, a célula pode ainda incluir um par O-ARNt/O-RS adicional diferente e um segundo aminoácido não natural, em que este O-ARNt adicional reconhece um segundo codão de selecção e esta O-RS adicional efectua preferencialmente a aminoacilação do O-ARNt com o segundo aminoácido não natural. Por exemplo, uma célula que inclui um par O-ARNt/O-RS (em que o O-ARNt reconhece, por exemplo, um 23 ΕΡ 1 914 314/ΡΤ codão de selecção âmbar) pode compreender adicionalmente um segundo par ortogonal, por exemplo, leucilo, lisilo, glutamilo, etc. (em que o segundo O-ARNt reconhece um codão de selecção diferente, por exemplo, um codão opala, um codão com quatro bases ou um codão semelhante). Desejavelmente, os diferentes pares ortogonais são derivados de diferentes origens, o que pode facilitar o reconhecimento de diferentes codões de selecção. 0 O-ARNt e/ou a O-RS podem existir na natureza ou podem ser derivados por mutação de um ARNt e/ou de uma RS existentes na natureza, por exemplo, criando bibliotecas de ARNt e/ou bibliotecas de RS, a partir de qualquer um de vários organismos e/ou utilizando uma de várias estratégias de mutação disponíveis. Por exemplo, uma estratégia para produzir um par ARNt/aminoacil-ARNt-sintetase ortogonal envolve a importação, para a célula hospedeira, de um par ARNt/sintetase heterólogo (em relação à célula hospedeira) a partir de uma fonte diferente da célula hospedeira ou de múltiplas fontes. As propriedades da candidata a sintetase heteróloga incluem, por exemplo, o facto de não carregar nenhum ARNt da célula hospedeira, enquanto as propriedades do candidato a ARNt heterólogo incluem, por exemplo, o facto de não ser aminoacilado por qualquer sintetase da célula hospedeira. Além disso, o ARNt heterólogo é ortogonal para todas as sintetases da célula hospedeira.
Uma segunda estratégia para criar um par ortogonal envolve a criação de bibliotecas de mutantes a partir das quais é possível rastrear e/ou seleccionar um O-ARNt ou uma O-RS. Estas estratégias também podem ser combinadas. ARNt ortogonal (O-ARNt)
Um ARNt ortogonal (O-ARNt) do invento medeia desejavelmente a incorporação de um aminoácido não natural, como a homoglutamina, numa proteína que é codificada por um polinucleótido que compreende um codão de selecção que é reconhecido pelo O-ARNt, por exemplo, in vivo ou in vitro. Em determinadas concretizações, o O-ARNt do invento inclui uma eficácia de supressão de pelo menos cerca de 45%, 50%, 60%, 75%, 80%, 90% ou mais, na presença de uma sintetase cognata e em resposta a um codão de selecção, em comparação com um 24 ΕΡ 1 914 314/ΡΤ O-ARNt que compreende ou é codificado por uma sequência polinucleotidica tal como apresentada nas sequências de O-ARNt da lista de sequências. A eficácia de supressão pode ser determinada através de um dos vários ensaios conhecidos na arte. Por exemplo, é possivel utilizar um ensaio com o gene repórter da β-galactosidase; um plasmídeo lacZ derivatizado (em que a construção possui um codão de selecção na sequência de ácido nucleico do gene lacZ) é introduzido em células de um organismo apropriado (por exemplo, um organismo em que os componentes ortogonais podem ser utilizados), juntamente com um plasmídeo compreendendo um O-ARNt do invento. Uma sintetase cognata pode também ser introduzida (quer como um polipéptido ou como um polinucleótido que codifica a sintetase cognata quando é expresso) . As células são crescidas em meio até uma densidade desejada, por exemplo, até uma ϋΟεοο de cerca de 0,5; e os ensaios da β-galactosidase são efectuados, por exemplo, utilizando o conjunto de ensaio da β-galactosidase BetaFluor™ (Novagen). A percentagem de supressão pode ser calculada como a percentagem de actividade de uma amostra em relação a um controlo comparável; por exemplo, o valor observado a partir da construção lacZ derivatizada, em que a construção possui um codão com sentido correspondente na posição desejada em vez de um codão de selecção.
Os exemplos de O-ARNt do invento estão apresentados na lista de sequências. Consultar também as tabelas, os exemplos e as figuras do invento para ver as sequências de moléculas de O-ARNt e de O-RS exemplificativas. Consultar igualmente a secção deste invento intitulada "Sequências de ácidos nucleicos e de polipéptidos e variantes". Numa molécula de ARN, como seja o ARNm da O-RS ou uma molécula de O-ARNt, a timina (T) é substituída por uracilo (U) em relação a uma dada sequência (ou vice versa para um ADN codificante) ou ao seu complemento. Modificações adicionais das bases também podem estar presentes. 0 invento também inclui as variações conservativas de O-ARNt correspondentes a O-ARNt particulares deste invento. Por exemplo, as variações conservativas de O-ARNt incluem aquelas moléculas que funcionam como os O-ARNt particulares, 25 ΕΡ 1 914 314/ΡΤ tal como constam na lista de sequências do invento, e que mantêm a estrutura em forma de L do ARNt em virtude de uma auto-complementaridade apropriada, mas que não possuem uma sequência idêntica às sequências da lista de sequências, das figuras ou dos exemplos do invento (e, desejavelmente, são diferentes das moléculas de ARNt de tipo selvagem). Ver também a secção aqui intitulada "Sequências de ácidos nucleicos e de polipéptidos e variantes". A composição compreendendo um Ο-ARNt pode ainda incluir uma aminoacil-ARNt-sintetase ortogonal (O-RS), em que a O-RS efectua preferencialmente a aminoacilação do Ο-ARNt com um aminoácido não natural, como a homoglutamina. Em determinadas concretizações, uma composição incluindo um Ο-ARNt pode ainda incluir um sistema de tradução (por exemplo, in vitro ou in vivo). Um ácido nucleico compreendendo um polinucleótido que codifica um polipéptido de interesse, em que o polinucleótido compreende um codão de selecção que é reconhecido pelo Ο-ARNt, ou uma combinação de um ou mais destes, também pode estar presente na célula. Consultar também a secção aqui intitulada "Aminoacil-ARNt-sintetases ortogonais".
Os métodos de produção de um ARNt ortogonal (O-ARNt) também são uma caracteristica do invento. Um O-ARNt produzido pelo método é também uma caracteristica do invento. Em determinadas concretizações do invento, os O-ARNt podem ser produzidos através da criação de uma biblioteca de mutantes. A biblioteca dos ARNt mutantes pode ser produzida utilizando várias técnicas de mutagénese conhecidas na arte. Por exemplo, os ARNt mutantes podem ser produzidos por mutações dirigidas, mutações pontuais aleatórias, recombinação homóloga, arranjo combinatório de ADN ("DNA shuffling") ou outros métodos de mutagénese recursiva, construção quimérica ou qualquer combinação destes. É possível introduzir mutações adicionais em posição(ões) específica(s), por exemplo, em posição(ões) não conservativa(s) ou numa posição conservativa, em posição(ões) aleatória(s) ou uma combinação de ambas, numa ansa ou região desejada de um ARNt, por exemplo, uma ansa do anticodão, a haste aceitadora, a ansa ou braço D, a ansa variável, a ansa 26 ΕΡ 1 914 314/ΡΤ ou braço TPC, outras regiões da molécula de ARNt ou uma combinação destas. Normalmente, as mutações num ARNt incluem mutar a ansa do anticodão de cada membro da biblioteca de ARNt mutantes, para permitir o reconhecimento de um codão de selecção. 0 método pode incluir adicionalmente a adição de uma sequência adicional (CCA) a uma região terminal do O-ARNt. Normalmente, um O-ARNt possui uma melhoria da ortogonalidade para um organismo desejado, em comparação com o material de partida, por exemplo, a pluralidade de sequências de ARNt, ao mesmo tempo que preserva a sua afinidade para uma RS desejada.
Os métodos incluem opcionalmente a análise da similaridade (e/ou da homologia inferida) das sequências dos ARNt e/ou das aminoacil-ARNt-sintetases para determinar potenciais candidatos para um O-ARNt, uma O-RS e/ou pares destes, que pareçam ser ortogonais face a um organismo especifico. Programas computacionais conhecidos na arte e aqui descritos podem ser utilizados para a análise; por exemplo, é possivel utilizar os programas BLAST e Pileup. Num exemplo, para escolher possíveis componentes da tradução ortogonais para utilizar em E. coli, um organismo procariótico, é seleccionada uma sintetase e/ou um ARNt que não apresenta uma similaridade de sequência próxima dos organismos procarióticos.
Tipicamente, um O-ARNt é obtido por sujeição de uma população de células de uma primeira espécie a uma selecção negativa, em que as células compreendem um membro da pluralidade de potenciais O-ARNt. A selecção negativa elimina as células que compreendem um membro da biblioteca de potenciais O-ARNt que é aminoacilado por uma aminoacil-ARNt-sintetase (RS) que é endógena da célula. Isto proporciona um conjunto de ARNt que são ortogonais em relação à célula da primeira espécie.
Em determinadas concretizações, na selecção negativa, são introduzidos num polinucleótido um ou mais codões de selecção que codificam uma marca de selecção negativa, por exemplo, uma enzima que confere resistência a um antibiótico, como a β-lactamase, uma enzima que origina um produto detectável, como a β-galactosidase ou a cloranfenicol-acetiltransferase (CAT), ou um produto tóxico, como a barnase, numa posição não 27 ΕΡ 1 914 314/ΡΤ essencial (por exemplo, produzindo ainda uma barnase funcional), etc. 0 rastreio/selecção é opcionalmente efectuado através do crescimento da população de células na presença de um agente selectivo (por exemplo, um antibiótico como a ampicilina). Numa concretização, a concentração do agente de selecção é variada.
Por exemplo, para medir a actividade dos ARNt supressores, é utilizado um sistema de selecção que é baseado na supressão in vivo do codão de selecção; por exemplo, mutações sem sentido (nonsense) ou de deslocamento do quadro de leitura introduzidas num polinucleótido que codifica uma marca de selecção negativa, como seja um gene para a β-lactamase (bla). Constroem-se variantes polinucleotidicas, por exemplo, variantes bla, com um codão de selecção numa determinada posição (por exemplo, A184). As células, tais como bactérias, são transformadas com estes polinucleótidos. No caso de um ARNt ortogonal, que não pode ser eficientemente carregado pelas sintetases endógenas de E. coli, a resistência ao antibiótico, por exemplo, a resistência a ampicilina, deve ser idêntica ou inferior à resistência de uma bactéria que não foi transformada com qualquer plasmídeo. Caso o ARNt não seja ortogonal, ou caso uma sintetase heteróloga capaz de carregar o ARNt seja co-expressa no sistema, deverá observar-se um nível mais elevado de resistência ao antibiótico, como seja a ampicilina. As células, tais como bactérias, que são incapazes de crescer em placas de gelose de LB com concentrações de antibiótico aproximadamente iguais às das células que não foram transformadas com qualquer plasmídeo são seleccionadas.
No caso de um produto tóxico (por exemplo, ribonuclease ou barnase), quando um membro da pluralidade de potenciais ARNt é aminoacilado por sintetases endógenas do hospedeiro, como Escherichia coli (isto é, não é ortogonal em relação ao hospedeiro; por exemplo, sintetases de Escherichia coli), o codão de selecção é suprimido, e o produto polinucleotídico tóxico produzido conduz à morte celular. As células que contêm ARNt ortogonais ou ARNt não funcionais sobrevivem.
Numa concretização, o conjunto de ARNt ortogonais em relação a um organismo desejado é depois submetido a uma selecção positiva, em que o codão de selecção é colocado numa 28 ΕΡ 1 914 314/ΡΤ marca de selecçao positiva; por exemplo, uma marca codificada por um gene de resistência a drogas, como seja o gene da β-lactamase. A selecção positiva é efectuada numa célula compreendendo um polinucleótido que codifica ou contém um membro do conjunto de ARNt ortogonais em relação à célula, um polinucleótido que codifica uma marca de selecção positiva e um polinucleótido que codifica uma RS cognata. Em determinadas concretizações, a segunda população de células compreende células que não foram eliminadas pela selecção negativa. Os polinucleótidos são expressos na célula, e a célula é crescida na presença de um agente de selecção, por exemplo, a ampicilina. Os ARNt são depois seleccionados quanto à sua capacidade para sofrer aminoacilação pela sintetase cognata co-expressa e para inserir um aminoácido em resposta a este codão de selecção. Tipicamente, estas células apresentam uma melhoria ao nivel da eficácia de supressão em comparação com as células que albergam ARNt não funcionais ou ARNt que não conseguem ser eficazmente reconhecidos pela sintetase de interesse. As células que contêm os ARNt não funcionais ou os ARNt que não são eficazmente reconhecidos pela sintetase de interesse são sensíveis ao antibiótico. Assim, os ARNt que (i) não são substratos para as sintetases endógenas do hospedeiro, por exemplo, Escherichia coli; (i i) podem ser aminoacilados pela sintetase de interesse; e (iii) são funcionais na tradução sobrevivem a ambas as selecções.
Em conformidade, a mesma marca pode ser uma marca positiva ou negativa, dependendo do contexto em que é rastreada. Isto é, a marca é uma marca positiva caso o rastreio seja efectuado a favor dela, mas é uma marca negativa caso o rastreio seja efectuado contra ela. A restringência da selecção, por exemplo, a selecção positiva, a selecção negativa ou ambas as selecções, positiva e negativa, nos métodos acima descritos, incluem opcionalmente variar a restringência da selecção. Por exemplo, como a barnase é uma proteína extremamente tóxica, a restringência da selecção negativa pode ser controlada através da introdução de um número diferente de codões de selecção no gene da barnase e/ou da utilização de um promotor indutível. Noutro exemplo, a concentração do agente de selecção ou de rastreio é variada (por exemplo, a concentração de ampicilina). Num aspecto do 29 ΕΡ 1 914 314/ΡΤ invento, a restringência é variada porque a actividade desejada pode ser baixa durante os ciclos iniciais. Assim, aplicam-se critérios de selecção menos restringentes nos ciclos iniciais e critérios mais restringentes em ciclos posteriores da selecção. Em determinadas concretizações, a selecção negativa, a selecção positiva ou ambas as selecções positiva e negativa podem ser repetidas múltiplas vezes. É possível utilizar várias marcas de selecção negativa diferentes, várias marcas de selecção positiva diferentes ou várias marcas de selecção tanto positivas como negativas diferentes. Em determinadas concretizações, a marca de selecção positiva e a marca de selecção negativa podem ser a mesma. É possível utilizar outros tipos de selecções/rastreios no invento para produzir componentes da tradução ortogonais, por exemplo, um O-ARNt, uma O-RS e um par O-ARNt/O-RS que carrega um aminoácido não natural, como seja a homoglutamina, em resposta a um codão de selecção. Por exemplo, a marca de selecção negativa, a marca de selecção positiva ou ambas as marcas de selecção positiva e negativa podem incluir uma marca que emite fluorescência ou catalisa uma reacção luminescente na presença de um reagente adequado. Noutra concretização, um produto da marca é detectado através de separação de células activadas por fluorescência (FACS) ou de luminescência. Opcionalmente, a marca inclui uma marca de rastreio baseada em afinidade. Consultar também Francisco, J. A. et al. (1993) Production and fluorescence-activated cell sorting of Escherichia coli expressing a functional antibody fragment on the externai surface. Proc Natl Acad Sei USA. 90:10444-8. Métodos adicionais de produção de um ARNt ortogonal recombinante podem ser encontrados, por exemplo, nos pedidos de patente internacional WO 2002/086075, intitulado "Methods and compositions for the production of orthogonal tRNA-aminoacyltRNA synthetase pairs;" e WO 2004/094593 intitulado "EXPANDING THE EUKARYOTIC GENETIC CODE". Ver também Forster et al. (2003) Programming peptidomimetic synthetases by translating genetic codes designed de novo, PNAS 100(11):6353-6357; e Feng et al. (2003), Expanding tRNA recognition of a tRNA synthetase by a single amino acid change, PNAS 100(10): 5676-5681. 30 ΕΡ 1 914 314/ΡΤ
Aminoacil-ARNt-sintetase ortogonal (O-RS)
Uma O-RS do invento efectua preferencialmente a aminoacilação de um O-ARNt com um aminoácido não natural, como a homoglutamina, in vitro ou in vivo. Uma O-RS do invento pode ser fornecida ao sistema de tradução, como seja uma célula, por um polipéptido que inclui uma O-RS e/ou por um polinucleótido que codifica uma O-RS ou uma sua porção. Por exemplo, uma O-RS exemplificativa compreende uma sequência de aminoácidos tal como apresentada na lista de sequências e nos exemplos aqui fornecidos, ou uma das suas variações conservativas. Noutro exemplo, uma O-RS, ou uma sua porção, é codificada por uma sequência polinucleotidica que codifica uma sequência de aminoácidos da lista de sequências ou dos exemplos aqui fornecidos, ou uma sua sequência polinucleotidica complementar. Consultar, por exemplo, as tabelas e os exemplos aqui fornecidos para ver as sequências de moléculas de O-RS exemplificativas. Ver também a secção intitulada "Sequências de ácidos nucleicos e de polipéptidos e variantes".
Os métodos de identificação de uma aminoacil-ARNt-sintetase ortogonal (O-RS), por exemplo, uma O-RS, para utilizar com um O-ARNt também são uma caracteristica do invento. Por exemplo, um método inclui submeter uma população de células de uma primeira espécie a uma selecção, por exemplo, uma selecção positiva, em que as células compreendem individualmente: 1) um membro de uma pluralidade de aminoacil-ARNt-sintetases (RS) (por exemplo, a pluralidade de RS pode incluir RS mutantes, RS derivadas de uma espécie diferente da primeira espécie ou ambas as RS mutantes e as RS derivadas de uma espécie diferente da primeira espécie); 2) o ARNt ortogonal (O-ARNt) (por exemplo, de uma ou mais espécies); e 3) um polinucleótido que codifica uma marca de selecção (por exemplo, positiva) e compreende pelo menos um codão de selecção. As células são seleccionadas ou rastreadas quanto aquelas que mostram uma melhoria da eficácia de supressão, em comparação com as células que não possuem ou possuem apenas uma quantidade reduzida do membro da pluralidade de RS. A eficácia de supressão pode ser medida por meio de técnicas conhecidas na arte e da forma aqui descrita. As células que 31 ΕΡ 1 914 314/ΡΤ apresentam uma melhoria da eficácia de supressão compreendem uma RS activa que efectua a aminoacilação do O-ARNt. 0 nivel de aminoacilação (in vitro ou in vivo) de um primeiro conjunto de ARNt provenientes da primeira espécie pela RS activa é comparado com o nivel de aminoacilação (in vitro ou in vivo) de um segundo conjunto de ARNt provenientes da segunda espécie pela RS activa. 0 nível de aminoacilação pode ser determinado através de uma substância detectável (por exemplo, um aminoácido ou um aminoácido não natural marcados, como seja uma homoglutamina marcada). A RS activa, que aminoacila mais eficazmente o segundo conjunto de ARNt em comparação com o primeiro conjunto de ARNt, é normalmente seleccionada, proporcionando, assim, uma aminoacil-ARNt-sintetase ortogonal eficaz (optimizada) para utilizar juntamente com o O-ARNt. Uma O-RS identificada pelo método é também uma caracteristica do invento. É possível utilizar um de vários ensaios para determinar a aminoacilação. Estes ensaios podem ser realizados in vitro ou in vivo. Os ensaios de aminoacilação in vitro estão descritos, por exemplo, em Hoben & Soll (1985) Methods Enzymol. 113:55-59. A aminoacilação também pode ser determinada através da utilização de um repórter, juntamente com os componentes de tradução ortogonais, e da detecção do repórter numa célula que expressa um polinucleótido compreendendo pelo menos um codão de selecção que codifica uma proteína. Consultar também WO 2002/085923, intitulado "IN VIVO INCORPORATION OF UNNATURAL AMINO ACIDS;" e WO 2004/094593, apresentado em 16 de Abril de 2004. A O-RS identificada pode ser adicionalmente manipulada para alterar a especificidade do substrato da sintetase, de modo que apenas o aminoácido não natural desejado, por exemplo, a homoglutamina, e não qualquer um dos 20 aminoácidos comuns, seja carregado no O-ARNt. Os métodos para gerar uma aminoacil-ARNt-sintetase ortogonal com uma especificidade de substrato para um aminoácido não natural incluem a mutação da sintetase, por exemplo, no local activo da sintetase, no local do mecanismo de montagem da sintetase, em diferentes locais através da combinação de diferentes domínios das sintetases ou em locais similares, e a aplicação de um processo de selecção. Utiliza-se uma estratégia que se baseia na combinação de uma 32 ΕΡ 1 914 314/ΡΤ selecção positiva, seguida de uma selecção negativa. Na selecção positiva, a supressão do codão de selecção introduzido numa ou mais posições não essenciais de uma marca positiva permite que as células sobrevivam sob uma pressão de selecção positiva. Na presença de ambos os aminoácidos naturais e não naturais, os sobreviventes codificam sintetases activas que carregam o ARNt supressor ortogonal com um aminoácido natural ou não natural. Na selecção negativa, a supressão de um codão de selecção introduzido numa ou mais posições não essenciais de uma marca negativa remove as sintetases com especificidades para os aminoácidos naturais. Os sobreviventes de ambas as selecções positiva e negativa codificam sintetases que efectuam a aminoacilação (carregam) do ARNt supressor ortogonal apenas com aminoácidos não naturais. Estas sintetases podem ser depois submetidas a uma mutagénese adicional, por exemplo, arranjo combinatório de ADN ou outros métodos de mutagénese recursiva.
Uma biblioteca de O-RS mutantes pode ser gerada utilizando várias técnicas de mutagénese conhecidas na arte. Por exemplo, as RS mutantes podem ser geradas por mutações dirigidas, mutações pontuais aleatórias, recombinação homóloga, arranjo combinatório de ADN ou outros métodos de mutagénese recursiva, construção quimérica ou qualquer combinação destes. Por exemplo, uma biblioteca de RS mutantes pode ser produzida a partir de duas ou mais "sub-bibliotecas", por exemplo, mais pequenas e menos diversas. As bibliotecas quiméricas de RS também estão incluídas no invento. É de salientar que as bibliotecas de ARNt-sintetases provenientes de vários organismos (por exemplo, microrganismos como eubactérias ou arqueobactérias), tais como as bibliotecas que compreendem uma diversidade natural (ver, por exemplo, Patente U.S. N.° 6,238,884, concedida a Short et al; Patente U.S. N.° 5,756,316, concedida a Schallenberger et al; Patente U.S. N.° 5, 783,431, concedida a Petersen et al; Patente U.S. N. 0 5, 824,485, concedida a Thompson et al; Patente U.S. N. 0 5, 958,672, concedida a Short et al sao opcionalmente construídas e rastreadas em termos de pares ortogonais.
Após a sujeição das sintetases à estratégia de rastreio/selecção positiva e negativa, estas sintetases podem seguidamente ser sujeitas a uma mutagénese adicional. Por 33 ΕΡ 1 914 314/ΡΤ exemplo, um ácido nucleico que codifica a O-RS pode ser isolado; um conjunto de polinucleótidos que codificam as O-RS mutadas (por exemplo, por mutagénese aleatória, mutagénese dirigida, recombinação ou qualquer combinação destas) pode ser gerado a partir do ácido nucleico; e estes passos individuais ou uma combinação destes passos pode ser repetida até à obtenção de uma O-RS mutada que efectua preferencialmente a aminoacilação do O-ARNt com o aminoácido não natural, por exemplo, uma homoglutamina. Num aspecto do invento, os passos são efectuados múltiplas vezes, por exemplo, pelo menos duas vezes. É igualmente possível utilizar níveis adicionais de restringência de selecção/rastreio nos métodos do invento, para produzir O-ARNt, O-RS ou pares deles. A restringência da selecção ou do rastreio pode ser variada num ou em ambos os passos do método para produzir uma O-RS. Isto pode incluir, por exemplo, variar a quantidade de agente de selecção/rastreio que é utilizada, etc. Ciclos adicionais de selecções positivas e/ou negativas também podem ser realizados. A selecção ou o rastreio também pode compreender uma ou mais das seguintes alterações: uma alteração da permeabilidade dos aminoácidos, uma alteração da eficácia da tradução, uma alteração da fidelidade da tradução, etc. Tipicamente, essa ou essas alterações são baseadas numa mutação num ou mais genes de um organismo, no qual um par ARNt/ARNt-sintetase ortogonal é utilizado para produzir a proteína.
Pormenores gerais adicionais para produzir O-RS e alterar a especificidade do substrato da sintetase podem ser encontrados em WO 2002/086075, intitulado "Methods and compositions for the production of orthogonal tRNA-aminoacyltRNA synthetase pairs", eWO 2004/094593, apresentado em 16 de Abril de 2004.
FONTE E ORGANISMOS HOSPEDEIROS
Os componentes traducionais do invento podem ser derivados de organismos não eucarióticos. Por exemplo, o ARNt ortogonal pode ser derivado de um organismo não eucariótico (ou de uma combinação de organismos), por exemplo, de uma 34 ΕΡ 1 914 314/ΡΤ arqueobactéria como Methanococcus jannaschii, Methanobacterium thermoautotrophicum, Halobacterium como Haloferax volcanii e Halobacterium sp. NRC-1, Archaeoglobus fulgidus, Pyrococcus furiosus, Pyrococcus horikoshii, Aeuropyrum pernix,
Methanococcus maripaludis, Methanopyrus kandleri,
Methanosarcina mazei (Mm), Pyrobaculum aerophilum, Pyrococcus abyssi, Sulfolobus solfataricus (Ss), Sulfolobus tokodaii, Thermoplasma acidophilum, Thermoplasma volcanium ou organismos similares, ou de uma eubactéria como Escherichia coli, Thermus thermophilus, Bacillus stearothermphilus ou similares, enquanto a O-RS ortogonal pode ser derivada de um organismo não eucariótico (ou de uma combinação de organismos), por exemplo, de uma arqueobactéria como Methanococcus jannaschii, Methanobacterium thermoautotrophicum, Halobacterium como Haloferax volcanii e Halobacterium sp. NRC-1, Archaeoglobus fulgidus, Pyrococcus furiosus, Pyrococcus horikoshii, Aeuropyrum pernix, Methanococcus maripaludis, Methanopyrus kandleri, Methanosarcina mazei, Pyrobaculum aerophilum, Pyrococcus abyssi, Sulfolobus solfataricus, Sulfolobus tokodaii, Thermoplasma acidophilum, Thermoplasma volcanium ou organismos similares, ou de uma eubactéria como Escherichia coli, Thermus thermophilus, Bacillus stearothermphilus ou similares. Numa concretização, fontes eucarióticas, por exemplo, plantas, algas, protistas, fungos, leveduras, animais (como mamíferos, insectos, artrópodes, etc.) ou similares, também podem ser utilizadas como fontes de O-ARNt e O-RS.
Os componentes individuais de um par O-ARNt/O-RS podem ser derivados do mesmo organismo ou de organismos diferentes. Numa concretização, o par O-ARNt/O-RS é proveniente do mesmo organismo. Em alternativa, o O-ARNt e a O-RS do par O-ARNt/O-RS provêm de diferentes organismos. Numa concretização exemplificativa preferida, o par lisil-sintetase/ARNt da arqueobactéria Pyrococcus horikoshii é utilizado como par ortogonal, por exemplo, num sistema de tradução baseado em E. coli. Tal como aqui descrito, este par pode ser modificado para reconhecer um codão de selecção com quatro bases e pode ser modificado para carregar o O-ARNt com um aminoácido não natural, como a homoglutamina. Este par ortogonal (ou as suas formas modificadas) pode também ser combinado com pares ortogonais previamente descritos, por exemplo, aqueles derivados de Methanococcus jannaschii, que 35 ΕΡ 1 914 314/ΡΤ são modificados para reconhecer codões de selecção stop. Isto permite a produção, num sistema de tradução de interesse, de proteínas que compreendem dois aminoácidos não naturais diferentes, ao incluir um ácido nucleico que codifica estas proteínas e que inclui dois ou mais codões de selecção, em que cada um deles é reconhecido por um par O-ARNt/O-RS. 0 O-ARNt, a O-RS ou o par O-ARNt/O-RS podem ser seleccionados ou rastreados in vivo ou in vitro e/ou utilizados numa célula, por exemplo, uma célula não eucariótica ou uma célula eucariótica, para produzir um polipéptido contendo uma homoqlutamina ou outro aminoácido não natural de interesse. Uma célula não eucariótica pode provir de uma de várias fontes, por exemplo, de uma eubactéria como Escherichia coli, Thermus thermophilus, Bacillus stearothermphilus ou similares, de uma arqueobactéria como Methanococcus jannaschii, Methanobacterium thermoautotrophicum, Halobacterium como Haloferax volcanii e Halobacterium sp. NRC-1, Archaeoglobus fulgidus, Pyrococcus furiosus, Pyrococcus horikoshii, Aeuropyrum pernix, Methanococcus maripaludis, Methanopyrus kandleri,
Methanosarcina mazei (Mm), Pyrobaculum aerophilum, Pyrococcus abyssi, Sulfolobus solfataricus (Ss), Sulfolobus tokodaii, Thermoplasma acidophilum, Thermoplasma volcanium ou de organismos similares. Uma célula eucariótica pode provir de uma de várias fontes, por exemplo, uma planta (por exemplo, uma planta complexa como as monocotiledóneas ou as dicotiledóneas), uma alga, um protista, um fungo, uma levedura (como Saccharomyces cerevisiae), um animal (por exemplo, um mamífero, um insecto, um artrópode, etc.) ou similares. As composições de células com os componentes da tradução do invento também são uma característica do invento.
Consultar igualmente WO 2004/094593, apresentado em 16 de Abril de 2004, para o rastreio de O-ARNt e/ou O-RS numa espécie com o objectivo de o(s) utilizar em outra espécie.
CODÕES DE SELECÇÃO
Os codões de selecção do invento expandem a moldura de codões genéticos da maquinaria biossintética das proteínas. Um codão de selecção inclui, por exemplo, um codão com três bases 36 ΕΡ 1 914 314/ΡΤ invulgar, um codão sem sentido (nonsense) como seja um codão stop, por exemplo, um codão âmbar (UAG) ou um codão opala (UGA), um codão não natural, pelo menos um codão com quatro bases (por exemplo, AGGA), um codão raro ou codões similares. É possível introduzir vários codões de selecção num gene desejado, por exemplo, um ou mais, dois ou mais, mais de três, etc. Ao utilizar diferentes codões de selecção, é possível utilizar múltiplos pares ARNt/sintetase ortogonais que permitem a incorporação simultânea e em locais específicos de vários aminoácidos não naturais diferentes, utilizando estes codões de selecção diferentes.
Numa concretização, os métodos envolvem a utilização de um codão de selecção que é um codão stop para a incorporação in vivo de uma homoglutamina numa célula. Por exemplo, é produzido um O-ARNt que reconhece um codão de selecção com quatro bases e que é aminoacilado por uma O-RS com uma homoglutamina. Este O-ARNt não é reconhecido pelas aminoacil-ARNt-sintetases endógenas do sistema de tradução. A mutagénese dirigida convencional pode ser utilizada para introduzir o codão de selecção no local de interesse, num polinucleótido-alvo que codifica um polipéptido de interesse. Consultar também, por exemplo, Sayers, J.R. et al. (1988), "5',3' Exonuclease in phosphorothioate-based oligonucleotide-directed mutagenesis." Nucleic Acids Res. 791-802. Quando a O-RS, o O-ARNt e o ácido nucleico que codifica um polipéptido de interesse são combinados, por exemplo, in vivo, a homoglutamina é incorporada em resposta ao codão de selecção para proporcionar um polipéptido contendo a homoglutamina na posição especificada. A incorporação de aminoácidos não naturais, como a homoglutamina, in vivo, pode ser efectuada sem uma perturbação significativa da célula hospedeira. Por exemplo, nas células não eucarióticas, como Escherichia coli, dado que a eficácia de supressão de um codão de selecção stop, o codão UAG, depende da competição entre o O-ARNt, por exemplo, o ARNt supressor do codão âmbar, e o factor de libertação 1 (RF1) (que se liga ao codão UAG e inicia a libertação do péptido em crescimento do ribossoma), a eficácia de supressão pode ser modulada através de um aumento do nível de expressão do O-ARNt, por exemplo, o ARNt supressor, ou da utilização de uma 37 ΕΡ 1 914 314/ΡΤ estirpe deficiente em RF1. Nas células eucarióticas, como a eficácia de supressão para um codão UAG depende da competição entre o O-ARNt, por exemplo, o ARNt supressor do codão âmbar, e um factor de libertação eucariótico (por exemplo, eRF) (que se liga a um codão stop e inicia a libertação do péptido em crescimento do ribossoma), a eficácia de supressão pode ser modulada através de um aumento do nível de expressão do O-ARNt, por exemplo, o ARNt supressor. Além disso, é possível que estejam também presentes componentes adicionais que modulam a acção do factor de libertação, por exemplo, agentes de redução como o ditiotreitol (DTT).
Os aminoácidos não naturais, incluindo, por exemplo, as homoglutaminas, também podem ser codificados por codões raros. Por exemplo, quando a concentração de arginina numa reacção de síntese proteica in vitro é reduzida, o codão raro de arginina, AGG, revelou-se eficiente para a inserção de Ala por um ARNt sintético acilado com alanina. Consultar, por exemplo, Ma et ai., Biochemistry, 32:7939 (1993). Neste caso, o ARNt sintético compete com o ARNtArg natural, que existe como uma espécie secundária em Escherichia coli. Além disso, alguns organismos não utilizam todos os codões tripleto. Um codão AGA não atribuído em Micrococcus luteus tem sido utilizado para a inserção de aminoácidos num extracto de transcrição/tradução in vitro. Ver, por exemplo, Kowal & Oliver, Nucl. Acid. Res. 25:4685 (1997). Os componentes do invento podem ser gerados para utilizar estes codões raro in vivo.
Os codões de selecção também podem compreender codões ampliados, por exemplo, codões com quatro ou mais bases, tais como codões com quatro, cinco, seis ou mais bases. Os exemplos de codões com quatro bases incluem AGGA, CUAG, UAGA, CCCU e codões similares. Os exemplos de codões com cinco bases incluem AGGAC, CCCCU, CCCUC, CUAGA, CUACU, UAGGC e codões semelhantes. Os métodos do invento incluem a utilização de codões ampliados baseada na supressão de deslocamentos do quadro de leitura. Os codões com quatro ou mais bases podem inserir, por exemplo, um ou vários aminoácidos não naturais, como uma homoglutamina, na mesma proteína. Noutras concretizações, as ansas do anticodão podem descodificar, por exemplo, pelo menos um codão com quatro bases, pelo menos um codão com cinco bases, pelo menos um codão com seis bases ou 38 ΕΡ 1 914 314/ΡΤ mais. Uma vez que há 256 codões possíveis com quatro bases, vários aminoácidos não naturais podem ser codificados na mesma célula, utilizando um codão com quatro ou mais bases. Consultar também Anderson et al. (2002) Exploring the Limits of Codon and Anticodon Size, Chemistry and Biology, 9:237-244; e Magliery (2001) Expanding the Genetic Code: Selection of
Efficient Suppressors of Four-base Codons and Identification of "Shifty" Four-base Codons with a Library Approach in Escherichia coli, J. Mol. Biol. 307:755-769.
Por exemplo, os codões com quatro bases têm sido utilizados para incorporar aminoácidos não naturais em proteínas, recorrendo a métodos biossintéticos in vitro.
Consultar, por exemplo, Ma et al. (1993) Biochemistry, 32:7939; e Hohsaka et al. (1999) J. Am. Chem. Soc., 121:34. CGGG e AGGU foram utilizados para incorporar simultaneamente 2-naftilalanina e um derivado NBD (nitrobenzoxadiazole) de lisina na estreptavidina, in vitro, com dois ARNt supressores do deslocamento do quadro de leitura acilados quimicamente. Ver, por exemplo, Hohsaka et al. (1999) J. Am. Chem. Soc., 121:12194. Num estudo in vivo, Moore et al. examinaram a capacidade de derivados de ARNtLeu com anticodões NCUA para suprimir codões UAGN (N pode ser U, A, G ou C) e verificaram que o quadrupleto UAGA pode ser descodificado por um ARNtLeu com um anticodão UCUA com uma eficácia de 13 a 26%, com pouca descodificação no quadro de leitura 0 ou -1. Consultar Moore et al. (2000) J. Mol. Biol., 298:195. Numa concretização, é possível utilizar no invento codões ampliados baseados em codões raros ou em codões sem sentido (nonsense) , o que pode reduzir a leitura ininterrupta de sentido errado (missense) e a supressão do deslocamento do quadro de leitura em outros locais indesejados. Nos exemplos aqui apresentados, é descrito um par ortogonal que reconhece um codão de selecção AGGA e que introduz uma homoglutamina durante a tradução da proteína.
Para um dado sistema, um codão de selecção pode também incluir um dos codões naturais com três bases, em que o sistema endógeno não utiliza (ou utiliza raramente) o codão natural. Por exemplo, isto inclui um sistema que não possui um ARNt que reconhece o codão natural com três bases e/ou um sistema em que o codão com três bases é um codão raro. 39 ΕΡ 1 914 314/ΡΤ
Os codões de selecção incluem opcionalmente pares de bases não naturais. Estes pares de bases não naturais expandem adicionalmente o alfabeto genético existente. Um par de bases adicional aumenta o número de codões tripleto de 64 para 125. As propriedades dos terceiros pares de bases incluem o emparelhamento estável e selectivo das bases, a incorporação enzimática eficiente no ADN com uma fidelidade elevada por uma polimerase e a extensão continua e eficiente de iniciadores após a síntese do par de bases não natural nascente. As descrições de pares de bases não naturais que podem ser adaptados para estes métodos e composições incluem, por exemplo, Hirao et al., (2002) An unnatural base pair for incorporating amino acid analogues into protein, Nature Biotechnology, 20:177-182. Ver também Wu, Y. et al. (2002) J. Am. Chem. Soc. 124:14626-14630. Outras publicações relevantes estão indicadas abaixo.
Para uma utilização in vivo, o nucleósido não natural é permeável através da membrana e é fosforilado para formar o trifosfato correspondente. Além disso, a informação genética acrescida é estável e não é destruída pelas enzimas celulares. Os esforços anteriores de Benner e de outros autores tiraram partido dos padrões das ligações de hidrogénio que são diferentes daqueles existentes nos pares canónicos de Watson-Crick, cujo exemplo mais digno de nota é o par iso-C:iso-G. Ver, por exemplo, Switzer et al. (1989) J. Am. Chem. Soc., 111:8322; e Piccirilli et al. (1990) Nature, 343:33; Kool (2000) Curr. Opin. Chem. Biol. , 4:602 . Em geral, estas bases emparelham incorrectamente, até certo ponto, com bases naturais e não podem ser replicadas enzimaticamente. Kool e colaboradores demonstraram que as interacções hidrófobas de empacotamento entre bases podem substituir as ligações de hidrogénio para impulsionar a formação de pares de bases. Consultar Kool (2000) Curr. Opin. Chem. Biol., 4:602; e Guckian & Kool, (1998) Angew. Chem. Int. Ed. Engl., 36, 2825. Numa tentativa para desenvolver um par de bases não natural que satisfaça todos os requisitos acima referidos, Schultz, Romesberg e colaboradores sintetizaram e estudaram sistematicamente uma série de bases hidrófobas não naturais. Verificou-se que um autopar PICS:PICS é mais estável que os pares de bases naturais e pode ser eficientemente incorporado no ADN pelo fragmento de Klenow da ADN-polimerase I de 40 ΕΡ 1 914 314/ΡΤ
Escherichia coli (FK) . Consultar, por exemplo, McMinn et al. (1999) J. Am. Chem. Soc., 121:11586; e Ogawa et al. (2000) J. Am. Chem. Soc., 122:3274. Um autopar 3MN:3MN pode ser sintetizado pelo FK com uma eficácia e uma select ividade suficientes para a função biológica. Ver, por exemplo, Ogawa et al. (2000) J. Am. Chem. Soc., 122:8803. Contudo, ambas as bases actuam como uma sequência de terminação da cadeia para a replicação adicional. Uma ADN-polimerase mutante recentemente desenvolvida pode ser utilizada para replicar o autopar PICS. Além disso, é possível replicar um autopar 7AI. Ver por exemplo, Tae et al. (2001) J. Am. Chem. Soc., 123:7439. Um novo par de metalobases, Dipic:Py, que forma um par estável ao ligar-se a Cu(II), também foi desenvolvido. Consultar Meggers et al. (2000) J. Am. Chem. Soc., 122:10714. Como os codões ampliados e os codões não naturais são intrinsecamente ortogonais em relação aos codões naturais, os métodos do invento podem tirar partido desta propriedade para gerar ARNt ortogonais para eles.
Um sistema de tradução de "bypass" pode também ser utilizado para incorporar uma homoglutamina ou outro aminoácido não natural, num polipéptido desejado. Num sistema de tradução de "bypass", uma sequência grande é inserida num gene, mas não é traduzida em proteína. A sequência contém uma estrutura que actua como estímulo para induzir o ribossoma a saltar por cima da sequência e a retomar a tradução a jusante da inserção.
AMINOÁCIDOS NÃO NATURAIS
Tal como aqui utilizado, o termo "aminoácido não natural" refere-se a qualquer aminoácido, aminoácido modificado ou análogo de aminoácido diferente de selenocisteína e/ou de pirrolisina e dos vinte alfa-aminoácidos seguintes codificados geneticamente: alanina, arginina, asparagina, ácido aspártico, cisteína, glutamina, ácido glutâmico, glicina, histidina, isoleucina, leucina, lisina, metionina, fenilalanina, prolina, serina, treonina, triptofano, tirosina e valina. A estrutura genérica de um alfa-aminoácido é ilustrada pela Fórmula I:
I 41 ΕΡ 1 914 314/ΡΤ R
Um aminoácido não natural é tipicamente qualquer estrutura possuindo a Fórmula I, em que o grupo R é qualquer substituinte diferente de um dos substituintes utilizados nos vinte aminoácidos naturais. Consultar, por exemplo, Biochemistry de L. Stryer, 3rd ed. 1988, Freeman and Company, New York, para ver as estruturas dos vinte aminoácidos naturais. Repare que os aminoácidos não naturais do invento podem ser compostos existentes na natureza diferentes dos vinte alfa-aminoácidos acima referidos (ou, evidentemente, compostos sintéticos produzidos artificialmente).
Como os aminoácidos não naturais do invento normalmente diferem dos aminoácidos naturais ao nivel da cadeia lateral, os aminoácidos não naturais formam ligações amida com outros aminoácidos, por exemplo, naturais ou não naturais, da mesma maneira que elas são formadas nas proteínas existentes na natureza. Contudo, os aminoácidos não naturais possuem grupos na cadeia lateral que os diferenciam dos aminoácidos naturais.
De particular interesse para a incorporação de aminoácidos não naturais nas proteínas é a capacidade de incorporar uma homoglutamina. Noutros aminoácidos não naturais, R na Fórmula I compreende opcionalmente um grupo alquilo, arilo, acilo, ceto, azido, hidroxilo, hidrazino, ciano, halo, hidrazido, alcenilo, alcinilo, éter, tiol, seleno, sulfonilo, borato, boronato, fosfo, fosfono, fosfino, heterocíclico, enono, imino, aldeído, éster, tioácido, hidroxilamino, amino e similares, ou qualquer combinação destes grupos. Outros aminoácidos não naturais de interesse incluem, embora não se encontrem limitados a estes, aminoácidos compreendendo um agente de reticulação fotoactivável, aminoácidos contendo marcadores de spin, aminoácidos fluorescentes, aminoácidos de ligação a metais, aminoácidos que contêm metais, aminoácidos radioactivos, aminoácidos com novos grupos funcionais, aminoácidos que interagem covalente ou não covalentemente com outras moléculas, aminoácidos contendo grupos fotoprotectores 42 ΕΡ 1 914 314/ΡΤ ("photocaged") e/ou fotoisomerizáveis, aminoácidos contendo biotina ou um análogo de biotina, aminoácidos contendo um grupo cetona, aminoácidos glicosilados, aminoácidos compreendendo polietilenoglicol ou poliéter, aminoácidos substituídos com átomos pesados, aminoácidos que podem sofrer clivagem química ou fotoclivagem, aminoácidos com uma cadeia lateral comprida em comparação com os aminoácidos naturais (por exemplo, poliéteres ou hidrocarbonetos de cadeia longa, ou seja, com mais de cerca de 5, mais de cerca de 10 carbonos, etc.), aminoácidos contendo açúcares ligados através de átomos de carbono, aminoácidos reactivos em reacções de oxirredução, aminoácidos contendo aminotioácido e aminoácidos contendo um ou mais grupos tóxicos. Em algumas concretizações, os aminoácidos não naturais possuem um agente de reticulação fotoactivável. Numa concretização, os aminoácidos não naturais possuem um grupo sacarídico ligado à cadeia lateral do aminoácido e/ou outra modificação com hidratos de carbono.
Além dos aminoácidos não naturais que contêm novas cadeias laterais, os aminoácidos não naturais compreendem também opcionalmente estruturas de base modificadas, por exemplo, como ilustradas pelas estruturas de Fórmula II e III: Π
R
em que Z normalmente compreende OH, NH2, SH, NH-R' ou S-R'; X e Y, que podem ser iguais ou diferentes, compreendem tipicamente S ou O; e R e R', que são opcionalmente iguais ou diferentes, são normalmente seleccionados entre a lista de constituintes do grupo R descrita acima para os aminoácidos não naturais com a Fórmula I, assim como hidrogénio. Por 43 ΕΡ 1 914 314/ΡΤ exemplo, os aminoácidos não naturais do invento compreendem opcionalmente substituições no grupo amino ou carboxílico, tal como ilustrado pelas Fórmulas II e III. Os aminoácidos não naturais deste tipo incluem, embora não se encontrem limitados a estes exemplos, α-hidroxiácidos, a-tioácidos, α-aminotiocarboxilatos, por exemplo, com cadeias laterais correspondentes aos vinte aminoácidos naturais comuns ou com cadeias laterais não naturais. Além disso, as substituições ao nivel do carbono α incluem opcionalmente L-aminoácidos, D-aminoácidos ou aminoácidos a,a-dissubstituídos, como D-glutamato, D-alanina, D-metil-O-tirosina, ácido aminobutirico e compostos similares. Outras alternativas estruturais incluem aminoácidos cíclicos, como análogos da prolina, bem como análogos da prolina com anéis de 3, 4, 6, 7, 8 e 9 membros, β- e γ-aminoácidos como a β-alanina substituída e o ácido γ-aminobutírico. As estruturas de aminoácidos não naturais adicionais do invento incluem estruturas do tipo homo-beta, por exemplo, nas quais existe um grupo metileno ou amino ensanduichado numa posição adjacente ao carbono alfa, por exemplo, isómeros da homo-beta-tirosina, alfa-hidrazino-tirosina. Ver, por exemplo
Muitos aminoácidos não naturais baseiam-se em aminoácidos naturais como a tirosina, a glutamina, a fenilalanina e aminoácidos similares. Por exemplo, os análogos de tirosina incluem tirosinas substituídas na posição para, tirosinas substituídas na posição orto e tirosinas substituídas na posição meta, em que a tirosina substituída compreende um grupo acetilo, um grupo benzoílo, um grupo amino, uma hidrazina, uma hidroxiamina, um grupo tiol, um grupo carboxilo, um grupo isopropilo, um grupo metilo, um hidrocarboneto C6-C20 de cadeia linear ou ramificada, um hidrocarboneto saturado ou insaturado, um grupo O-metilo, um grupo poliéter, um grupo nitro ou um grupo semelhante. 44 ΕΡ 1 914 314/ΡΤ
Adicionalmente, estão também contemplados múltiplos anéis arilo substituídos. Os análogos de glutamina do invento incluem, embora não se encontrem limitados a estes, derivados α-hidroxi, derivados γ-substituídos, derivados cíclicos e derivados de glutamina com substituintes amida. Os exemplos de análogos de fenilalanina incluem, embora não se encontrem limitados a estes, fenilalaninas substituídas na posição para, fenilalaninas substituídas na posição orto e fenilalaninas substituídas na posição meta, em que o substituinte compreende um grupo hidroxilo, um grupo metoxi, um grupo metilo, um grupo alilo, um grupo aldeído ou ceto ou grupos semelhantes. Os exemplos específicos de aminoácidos não naturais incluem, embora não se encontrem limitados a estes, homoglutamina, uma 3,4-di-hidroxi-L-fenilalanina, uma p-acetil-L-fenilalanina, uma p-propargiloxifenilalanina, O-metil-L-tirosina, uma L-3-(2-naftil)alanina, uma 3-metilfenilalanina, uma 0-4-alil-L-tirosina, uma 4-propil-L-tirosina, uma tri-O-acetil-GlcNAcp-serina, uma L-Dopa, uma fenilalanina fluorada, uma isopropil-L-fenilalanina, uma p-azido-L-fenilalanina, uma p-acil-L-fenilalanina, uma p-benzoíl-L-fenilalanina, uma L-fosfosserina, uma fosfonosserina, uma fosfonotirosina, uma p-iodofenilalanina, uma p-bromofenilalanina, uma p-amino-L-fenilalanina, uma isopropil-L-fenilalanina e compostos idênticos. As estruturas de uma variedade de aminoácidos não naturais são fornecidas, por exemplo, nas Figuras 16, 17, 18, 19, 26 e 29 de WO 2002/085923, intitulado "In vivo incorporation of unnatural amino acids." Síntese química de aminoácidos não naturais
Muitos dos aminoácidos não naturais referidos acima estão disponíveis comercialmente, por exemplo, através de Sigma (EUA) ou de Aldrich (Milwaukee, WI, EUA) . Aqueles que não estão disponíveis comercialmente são sintetizados da forma indicada em várias publicações ou utilizando métodos padrão conhecidos pelos peritos na arte. Para consultar técnicas de síntese orgânica, ver, por exemplo, Organic Chemistry de Fessendon & Fessendon (1982, Second Edition, Willard Grant Press, Boston Mass.); Advanced Organic Chemistry de March (Third Edition, 1985, Wiley and Sons, New York); e Advanced Organic Chemistry de Carey & Sundberg (Third Edition, Parts A and B, 1990, Plenum Press, New York). Publicações adicionais 45 ΕΡ 1 914 314/ΡΤ que descrevem a síntese de aminoácidos não naturais incluem, por exemplo, WO 2002/085923, intitulado "In vivo incorporation of unnatural amino acids"; Matsoukas et al. (1995) J. Med. Chem., 38,4660-4669; King, F.E. & Kidd, D.A.A. (1949) A New Synthesis of Glutamine and of γ-Dipeptides of Glutamic Acid from Phthylated Intermediates. J. Chem. Soc., 3315-3319; Friedman, O.M. & Chatterrji, R. (1959) Synthesis of
Derivatives of Glutamine as Model Substrates for Anti-Tumor Agents. J. Am. Chem. Soc. 81, 3750-3752; Craig, J.C. et al. (1988) Absolute Configuration of the Enantiomers of 7-Chloro-4-[[4(diethylamino)-1-methylbutyl]amino]quinoline (Chloroquine). J. Org. Chem. 53, 1167-1170; Azoulay, M., Vilmont, M. & Frappier, F. (1991) Glutamine analogues as Potential Antimalarials, Eur. J. Med. Chem. 26, 201-5; Koskinen, A.M.P. & Rapoport, H. (1989) Synthesis of 4-Substituted Prolines as Conformationally Constrained Amino Acid Analogues. J. Org. Chem. 54, 1859-1866; Christie, B.D. & Rapoport, H. (1985) Synthesis of Optically Pure Pipecolates from L-Asparagine. Application to the Total Synthesis of (+)-Apovincamine through Amino Acid Decarbonylation and Iminium Ion Cyclization. J. Org. Chem. 1989:1859-1866; Barton et al. (1987) Synthesis of Novel α-Amino-Acids and Derivatives Using Radical Chemistry: Synthesis of L- and D-cx-Amino-Adipic Acids, L-a-aminopimelic Acid and Appropriate Unsaturated Derivatives. Tetrahedron Lett. 43:4297-4308; e Subasinghe et al. (1992) Quisqualic acid analogues: synthesis of beta-heterocyclic 2-aminopropanoic acid derivatives and their activity at a novel quisqualate-sensitized site. J. Med. Chem. 35:4602-7. Consultar também WO 2004/058946, intitulado "Protein Arrays ".
Captação celular de aminoácidos não naturais A captação dos aminoácidos não naturais por parte de uma célula é um assunto que é normalmente considerado ao conceber e seleccionar aminoácidos não naturais para, por exemplo, incorporar numa proteína. A elevada densidade de carga dos α-aminoácidos sugere, por exemplo, que é pouco provável que estes compostos sejam permeáveis através da célula. Os aminoácidos naturais são captados para o interior da célula através de uma colecção de sistemas de transporte à base de proteínas, que apresentam frequentemente graus variáveis de especificidade para os aminoácidos. É possível efectuar um 46 ΕΡ 1 914 314/ΡΤ rastreio rápido que avalia quais os aminoácidos não naturais, caso existam, que são captados pelas células. Consultar, por exemplo, os ensaios de toxicidade no pedido internacional com o número PCT/US03/41346, intitulado "Protein Arrays", apresentado em 22 de Dezembro de 2003; e Liu, D.R. & Schultz, P.G. (1999) Progress toward the evolution of an organism with an expanded genetic code. PNAS United States 96:4780-4785. Embora a captação seja facilmente analisada por meio de vários ensaios, uma alternativa à concepção de aminoácidos não naturais compatíveis com as vias de captação celular consiste em proporcionar vias biossintéticas para produzir os aminoácidos in vivo.
Biossíntese de aminoácidos não naturais
Muitas vias biossintéticas já existem nas células para a produção de aminoácidos e de outros compostos. Embora um método biossintético para um aminoácido não natural particular possa não existir na natureza, por exemplo, numa célula, o invento proporciona métodos deste tipo. As vias biossintéticas para os aminoácidos não naturais são opcionalmente criadas na célula hospedeira através da adição de novas enzimas ou da modificação de vias já existentes na célula hospedeira. As novas enzimas adicionais são opcionalmente enzimas existentes na natureza ou enzimas desenvolvidas artificialmente. Por exemplo, a biossíntese de p-aminofenilalanina (como apresentada num exemplo em WO 2002/085923, acima) assenta na adição de uma combinação de enzimas conhecidas de outros organismos. Os genes para estas enzimas podem ser introduzidos numa célula através da transformação da célula com um plasmídeo que compreende os genes. Os genes, quando são expressos na célula, proporcionam uma via enzimática para sintetizar o composto desejado. Exemplos dos tipos de enzimas que são opcionalmente adicionadas são fornecidos nos exemplos abaixo. As sequências de enzimas adicionais são encontradas, por exemplo, no Genbank. As enzimas desenvolvidas artificialmente também são opcionalmente adicionadas a uma célula da mesma forma. Deste modo, a maquinaria celular e os recursos de uma célula são manipulados para produzir os aminoácidos não naturais. 47 ΕΡ 1 914 314/ΡΤ
De facto, é possível utilizar qualquer um de vários métodos para produzir novas enzimas destinadas a uma utilização em vias biossintéticas ou à evolução de vias já existentes, para a produção de aminoácidos não naturais, in vitro ou in vivo. Muitos métodos disponíveis de desenvolvimento de enzimas e de outros componentes das vias biossintéticas podem ser aplicados ao presente invento para produzir aminoácidos não naturais (ou, na verdade, para desenvolver sintetases de forma a ter novas especificidades de substratos ou outras actividades de interesse). Por exemplo, o arranjo combinatório de ADN é utilizado para desenvolver novas enzimas e/ou vias destas enzimas para a produção de aminoácidos não naturais (ou a produção de novas sintetases), in vitro ou in vivo. Consultar, por exemplo, Stemmer (1994), Rapid evolution of a protein in vitro by DNA shuffling, Nature 370(4):389-391; e Stemmer (1994), DNA shuffling by random fragmentation and reassembly: In vitro recombination for molecular evolution, Proc. Natl. Acad. Sei. USA., 91:10747-10751. Uma abordagem relacionada rearranja famílias de genes relacionados (por exemplo, homólogos) para desenvolver rapidamente enzimas com as características desejadas. Um exemplo destes métodos de "rearranjo de famílias de genes" é encontrado em Crameri et ai. (1998) "DNA shuffling of a family of genes from diverse species accelerates directed evolution" Nature, 391(6664): 288-291. Novas enzimas (sejam elas componentes de vias biossintéticas ou sintetases) também podem ser geradas utilizando um procedimento de recombinação de ADN conhecido por "truncamento incremental para a criação de enzimas híbridas" ("ITCHY" de "incremental truncation for the creation of hybrid enzymes"), tal como descrito em Ostermeier et al. (1999) "A combinatorial approach to hybrid enzymes independent of DNA homology" Nature Biotech 17:1205. Esta abordagem também pode ser utilizada para criar uma biblioteca de enzimas ou de outras variantes das vias que podem actuar como substratos para um ou mais métodos de recombinação in vitro ou in vivo. Ver também Ostermeier et al. (1999) "Combinatorial Protein Engineering by Incremental Truncation," Proc. Natl. Acad. Sei. USA, 96: 3562-67 e Ostermeier et al. (1999), "Incremental Truncation as a Strategy in the Engineering of Novel Biocatalysts," Biological and Medicinal Chemistry, 1: 2139-44. Outra abordagem utiliza a mutagénese exponencial de "ensemble" para produzir bibliotecas de enzimas 48 ΕΡ 1 914 314/ΡΤ ou de outras variantes das vias que são seleccionadas, por exemplo, quanto à capacidade de catalisarem uma reacção biossintética relevante para a produção de um aminoácido não natural (ou de uma nova sintetase). Nesta abordagem, pequenos grupos de resíduos numa sequência de interesse são aleatorizados em paralelo para identificar, em cada posição alterada, os aminoácidos que conduzem a proteínas funcionais. Exemplos destes procedimentos, que podem ser adaptados ao presente invento para produzir novas enzimas destinadas à produção de aminoácidos não naturais (ou de novas sintetases), são encontrados em Delegrave & Youvan (1993) Biotechnology Research 11:1548-1552. Ainda noutra abordagem, é possível utilizar a mutagénese aleatória ou semi-aleatória, usando oligonucleótidos dopados ou degenerados, para a manipulação de enzimas e/ou de componentes da via, por exemplo, utilizando os métodos gerais de mutagénese de Arkin & Youvan (1992) "Optimizing nucleotide mixtures to encode specific subsets of amino acids for semi-random mutagenesis" Biotechnology 10:297-300; ou Reidhaar-Olson et al. (1991) "Random mutagenesis of protein sequences using oligonucleotide cassettes" Methods Enzymol. 208:564-86. Outra abordagem ainda, frequentemente designada por uma mutagénese de tipo "não estocástico", que utiliza a reunião de polinucleótidos e a mutagénese de saturação, pode ser utilizada para produzir enzimas e/ou componentes da via, que podem depois ser rastreados quanto à capacidade de desempenharam uma ou mais funções de sintetase ou da via biossintética (por exemplo, para a produção de aminoácidos não naturais in vivo). Ver, por exemplo, Short, "Non-Stochastic Generation of Genetic Vaccines and Enzymes, WO 00/46344.
Uma alternativa a estes métodos mutacionais envolve a recombinação dos genomas completos dos organismos e a selecção da descendência resultante quanto a funções particulares da via (muitas vezes designado por "rearranjo do genoma completo"). Esta abordagem pode ser aplicada ao presente invento, por exemplo, através de recombinação genómica e da selecção de um organismo (por exemplo, E. coli ou outra célula) quanto à capacidade de produzir um aminoácido não natural (ou um seu intermediário). Por exemplo, os métodos descritos nas publicações seguintes podem ser aplicados à concepção de vias para o desenvolvimento de vias já existentes 49 ΕΡ 1 914 314/ΡΤ e/ou de novas vias em células para produzir aminoácidos não naturais in vivo: Patnaik et al. (2002) "Genome shuffling of lactobacillus for improved acid tolerance" Nature Biotechnology, 20 ( 7) : 707-712; e Zhang et al. (2002) "Genome shuffling leads to rapid phenotypic improvement in bactéria" Nature, February 7, 415(6872): 644-646.
Outras técnicas para a manipulação de organismos e de vias metabólicas, por exemplo, para a produção dos compostos desejados, estão também disponíveis e podem ser aplicadas à produção de aminoácidos não naturais. Os exemplos de publicações que referem abordagens úteis para a manipulação de vias incluem: Nakamura & White (2003) "Metabolic engineering for the microbial production of 1,3-propanediol" Curr. Opin. Biotechnol. 14 (5):454-9; Berry et al. (2002) "Application of Metabolic Engineering to improve both the production and use of Biotech índigo" J. Industrial Microbiology and Biotechnology 28:127-133; Banta et al. (2002) "Optimizing an artificial metabolic pathway: Engineering the cofactor specificity of Corynebacterium 2,5-diketo-D-gluconic acid reductase for use in vitamin C biosynthesis" Biochemistry, 41(20), 6226-36; Selivonova et al. (2001) "Rapid Evolution of Novel Traits in Microorganisms" Applied and Environmental Microbiology, 67:3645 e muitas outras.
Independentemente do método utilizado, o aminoácido não natural produzido por meio de uma via biossintética manipulada do invento é normalmente produzido numa concentração suficiente para permitir a biossíntese eficiente de uma proteína, por exemplo, uma quantidade celular natural, mas não numa quantidade tão grande que afecte de forma significativa a concentração de outros aminoácidos celulares ou esgote os recursos celulares. As concentrações típicas produzidas desta maneira in vivo estão compreendidas entre cerca de 10 mM e 0,05 mM. Uma vez uma célula manipulada para produzir as enzimas desejadas para uma via específica e um aminoácido não natural produzido, as selecções in vivo são opcionalmente utilizadas para optimizar adicionalmente a produção do aminoácido não natural tanto para a síntese proteica ribossómica como para o crescimento celular. 50 ΕΡ 1 914 314/ΡΤ
Componentes ortogonais para incorporar uma homoglutamina 0 invento proporciona composições e métodos de produção de componentes ortogonais para incorporar uma homoglutamina numa cadeia polipeptídica em crescimento, em resposta a um codão de selecção, por exemplo, um codão stop, um codão sem sentido, um codão com quatro ou mais bases, etc., in vivo. Por exemplo, o invento proporciona ARNt ortogonais (0-ARNt), aminoacil-ARNt-sintetases ortogonais (0-RS) e seus pares. Estes pares podem ser utilizados para incorporar homoglutaminas em cadeias polipeptídicas em crescimento.
Uma composição do invento inclui uma aminoacil-ARNt-sintetase ortogonal (0-RS), em que a 0-RS efectua preferencialmente a aminoacilação de um 0-ARNt com uma homoglutamina. Em determinadas concretizações, a 0-RS inclui uma sequência de aminoácidos que compreende a SEQ ID N0:1 ou uma sua variação conservativa. Em determinadas concretizações do invento, a 0-RS efectua preferencialmente a aminoacilação do 0-ARNt com uma eficácia que é pelo menos 50% da eficácia de um polipéptido que compreende uma sequência de aminoácidos de SEQ ID NO:1.
Uma composição que inclui uma 0-RS pode opcionalmente incluir ainda um ARNt ortogonal (0-ARNt), em que o 0-ARNt reconhece um codão de selecção. Tipicamente, um 0-ARNt do invento compreende uma eficácia de supressão de pelo menos cerca de 45%, 50%, 60%, 75%, 80%, 90% ou mais, na presença de uma sintetase cognata e em resposta a um codão de selecção, em comparação com o 0-ARNt que compreende ou é codificado por uma sequência polinucleotidica como apresentada nas listas de sequências e nos exemplos. Numa concretização, a eficácia de supressão da O-RS e do O-ARNt em conjunto é, por exemplo, 5x, lOx, 15x, 20x, 25x ou mais superior à eficácia de supressão do O-ARNt sem a O-RS. Num aspecto, a eficácia de supressão da 0-RS e do 0-ARNt em conjunto é pelo menos 45% da eficácia de supressão de um par tirosil-ARNt-sintetase ortogonal derivado de Methanococcus jannaschii.
Uma composição que inclui um O-ARNt pode opcionalmente incluir uma célula (por exemplo, uma célula não eucariótica 51 ΕΡ 1 914 314/ΡΤ como uma célula de E. coli e similares, ou uma célula eucariótica) e/ou um sistema de tradução.
Uma célula (por exemplo, uma célula não eucariótica ou uma célula eucariótica) compreendendo um sistema de tradução é também proporcionada pelo invento, em que o sistema de tradução inclui um ARNt ortogonal (O-ARNt), uma aminoacil-ARNt-sintetase ortogonal (O-RS) e uma homoglutamina. Normalmente, a O-RS efectua preferencialmente a aminoacilação do O-ARNt com uma eficácia que é pelo menos 50% da eficácia de um polipéptido que compreende uma sequência de aminoácidos da SEQ ID NO:l. O O-ARNt reconhece o primeiro codão de selecção, e a O-RS efectua preferencialmente a aminoacilação do O-ARNt com a homoglutamina. Numa concretização, o O-ARNt compreende ou é codificado por uma sequência polinucleotídica tal como apresentada na SEQ ID NO:2 ou por uma sequência polinucleotídica complementar desta. Numa concretização, a O-RS compreende uma sequência de aminoácidos como ilustrada em qualquer uma das SEQ ID NO:l ou uma sua variação conservativa.
Uma célula do invento pode opcionalmente compreender ainda um par O-ARNt/O-RS diferente adicional e um segundo aminoácido não natural, em que este O-ARNt reconhece um segundo codão de selecção e esta O-RS efectua preferencialmente a aminoacilação do O-ARNt com o segundo aminoácido não natural. Opcionalmente, uma célula do invento inclui um ácido nucleico compreendendo um polinucleótido que codifica um polipéptido de interesse, em que o polinucleótido compreende um codão de selecção que é reconhecido pelo O-ARNt.
Em determinadas concretizações, uma célula do invento inclui uma célula de E. coli que inclui um ARNt ortogonal (O-ARNt), uma aminoacil-ARNt-sintetase ortogonal (O-RS), uma homoglutamina e um ácido nucleico compreendendo um polinucleótido que codifica um polipéptido de interesse, em que o polinucleótido compreende o codão de selecção que é reconhecido pelo O-ARNt. Em determinadas concretizações do invento, a O-RS efectua preferencialmente a aminoacilação do O-ARNt com uma eficácia que é pelo menos 50% da eficácia de um polipéptido que compreende uma sequência de aminoácidos de qualquer sequência de O-RS aqui referida. 52 ΕΡ 1 914 314/ΡΤ
Em determinadas concretizações do invento, um O-ARNt do invento compreende ou é codificado por uma sequência polinucleotidica como ilustrada nas listas de sequências ou nos exemplos ou por uma sua sequência polinucleotidica complementar. Em determinadas concretizações do invento, uma O-RS compreende uma sequência de aminoácidos como apresentada nas listas de sequências ou uma sua variação conservativa. Numa concretização, a O-RS ou uma sua porção é codificada por uma sequência polinucleotídica que codifica um aminoácido, como apresentada nas listas de sequências ou nos exemplos, ou por uma sua sequência polinucleotídica complementar. 0 O-ARNt e/ou a O-RS do invento podem ser derivados de qualquer um de vários organismos (por exemplo, organismos eucarióticos e/ou não eucarióticos).
Os polinucleótidos também são uma característica do invento. Um polinucleótido do invento inclui um polinucleótido artificial (por exemplo, fabricado pelo homem e não natural) compreendendo uma sequência nucleotídica que codifica um polipéptido como ilustrado nas listas de sequências e/ou que é complementar dessa sequência polinucleotídica. Um polinucleótido do invento pode também incluir um ácido nucleico que híbrida com um polinucleótido descrito acima, sob condições extremamente restringentes, ao longo de praticamente todo o comprimento do ácido nucleico. Um polinucleótido do invento também inclui um polinucleótido que é pelo menos 75%, pelo menos 80%, pelo menos 90%, pelo menos 95%, pelo menos 98% ou mais idêntico a um ARNt natural ou ao correspondente ácido nucleico que o codifica (embora um polinucleótido do invento seja diferente de um ARNt natural ou do correspondente ácido nucleico que o codifica), em que o ARNt reconhece um codão de selecção, por exemplo, um codão com quatro bases. Os polinucleótidos artificiais que são pelo menos 80%, pelo menos 90%, pelo menos 95%, pelo menos 98% ou mais idênticos a qualquer um dos polinucleótidos acima e/ou a um polinucleótido que compreende uma variação conservativa de qualquer um dos polinucleótidos acima também estão incluídos nos polinucleótidos do invento.
Os vectores compreendendo um polinucleótido do invento também são uma característica do invento. Por exemplo, um 53 ΕΡ 1 914 314/ΡΤ vector do invento pode incluir um plasmídeo, um cosmídeo, um fago, um vírus, um vector de expressão e/ou espécies idênticas. Uma célula compreendendo um vector do invento é também uma característica do invento.
Os métodos de produção dos componentes de um par O-ARNt/O-RS também são características do invento. Os componentes produzidos por estes métodos também são uma característica do invento. Por exemplo, os métodos de produção de pelo menos um ARNt que é ortogonal em relação a uma célula (O-ARNt) incluem a criação de uma biblioteca de ARNt mutantes; a mutação da ansa do anticodão de cada membro da biblioteca de ARNt mutantes para permitir o reconhecimento de um codão de selecção e proporcionar, assim, uma biblioteca de potenciais O-ARNt; e a sujeição de uma primeira população de células de uma primeira espécie a selecção negativa, em que as células compreendem um membro da biblioteca de potenciais O-ARNt. A selecção negativa elimina as células que compreendem um membro da biblioteca de potenciais O-ARNt que é aminoacilado por uma aminoacil-ARNt-sintetase (RS) endógena da célula. Isto proporciona um conjunto de ARNt que são ortogonais em relação à célula da primeira espécie, proporcionando, assim, pelo menos um O-ARNt. Um O-ARNt produzido pelos métodos do invento é também proporcionado.
Em determinadas concretizações, os métodos compreendem ainda sujeitar uma segunda população de células da primeira espécie a selecção positiva, em que as células compreendem um membro do conjunto de ARNt que são ortogonais em relação à célula da primeira espécie, uma aminoacil-ARNt-sintetase cognata e uma marca de selecção positiva. Utilizando a selecção positiva, as células são seleccionadas ou rastreadas em relação aquelas células que compreendem um membro do conjunto de ARNt que é aminoacilado pela aminoacil-ARNt-sintetase cognata e que apresenta uma resposta desejada na presença da marca de selecção positiva, proporcionando, assim, um O-ARNt. Em determinadas concretizações, a segunda população de células compreende células que não foram eliminadas pela selecção negativa.
Os métodos de identificação de uma aminoacil-ARNt-sintetase ortogonal que carrega uma homoglutamina num O-ARNt 54 ΕΡ 1 914 314/ΡΤ são também proporcionados. Por exemplo, os métodos incluem a sujeição de uma população de células de uma primeira espécie a selecção, em que cada uma das células compreende: 1) um membro de uma pluralidade de aminoacil-ARNt-sintetases (RS) (por exemplo, a pluralidade de RS pode incluir RS mutantes, RS derivadas de uma espécie diferente da primeira espécie ou ambas as RS mutantes e as RS derivadas de uma espécie diferente da primeira espécie); 2) o ARNt ortogonal (O-ARNt) (por exemplo, de uma ou mais espécies); e 3) um polinucleótido que codifica uma marca de selecção positiva e compreende pelo menos um codão de selecção.
As células (por exemplo, uma célula hospedeira) são seleccionadas ou rastreadas em relação aquelas que apresentam uma melhoria da eficácia de supressão em comparação com as células que não possuem o membro da pluralidade de RS ou que possuem apenas uma quantidade reduzida deste. Estas células seleccionadas/rastreadas compreendem uma RS activa que efectua a aminoacilação do O-ARNt. Uma aminoacil-ARNt-sintetase ortogonal identificada pelo método é também uma característica do invento.
Os métodos de produção de uma proteína numa célula (por exemplo, uma célula não eucariótica, como seja uma célula de E. coli ou similar, ou uma célula eucariótica) com uma homoglutamina numa posição especificada também são uma característica do invento. Por exemplo, um método consiste em crescer uma célula num meio apropriado, em que a célula contém um ácido nucleico que compreende pelo menos um codão de selecção e que codifica uma proteína; proporcionar a homoglutamina; e incorporar a homoglutamina na posição especificada na proteína, durante a tradução do ácido nucleico que contém pelo menos aquele codão de selecção, produzindo assim a proteína. A célula compreende adicionalmente um ARNt ortogonal (O-ARNt), que funciona na célula e que reconhece o codão de selecção, e uma aminoacil-ARNt-sintetase ortogonal (O-RS) que efectua preferencialmente a aminoacilação do O-ARNt com a homoglutamina. Uma proteína produzida por este método é também uma característica do invento. 0 invento também proporciona composições que incluem proteínas, em que as proteínas compreendem, por exemplo, uma 55 ΕΡ 1 914 314/ΡΤ homoglutamina. Em determinadas concretizações, a proteína compreende uma sequência de aminoácidos que é pelo menos 75% idêntica à de uma proteína conhecida, por exemplo, uma proteína terapêutica, uma proteína de diagnóstico, uma enzima industrial ou uma porção destas. Opcionalmente, a composição compreende um veículo farmaceuticamente aceitável.
SEQUÊNCIAS DE ÁCIDOS NUCLEICOS E DE POLIPÉPTIDOS E VARIANTES
Tal como descrito acima e abaixo, o invento proporciona sequências polinucleotídicas de ácidos nucleicos, como O-ARNt e O-RS, sequências de aminoácidos de polipéptidos, por exemplo, O-RS, e composições, sistemas e métodos compreendendo as referidas sequências. Exemplos das referidas sequências, por exemplo, O-ARNt e O-RS, estão aqui descritos (consultar a lista de sequências e os exemplos aqui apresentados). Contudo, um perito na arte compreenderá que o invento não está limitado aquelas sequências exactas apresentadas nos exemplos e na lista. Um perito compreenderá que o invento também proporciona, por exemplo, muitas sequências relacionadas e não relacionadas com as funções aqui descritas, por exemplo, a codificação de um O-ARNt ou de uma O-RS apropriados. 0 invento proporciona polipéptidos (O-RS) e polinucleótidos, como O-ARNt, polinucleótidos que codificam O-RS ou suas porções, oligonucleótidos utilizados para isolar clones de aminoacil-ARNt-sintetases, etc. Os polinucleótidos do invento incluem aqueles que codificam proteínas ou polipéptidos de interesse do invento com um ou mais codões de selecção. Além disso, os polinucleótidos do invento incluem, por exemplo, um polinucleótido que compreende uma sequência nucleotídica tal como ilustrada nas listas de sequências e um polinucleótido que é complementar de, ou que codifica, uma sua sequência polinucleotídica. Um polinucleótido do invento também inclui um polinucleótido que codifica uma sequência de aminoácidos compreendendo qualquer uma das sequências incluídas nas listas de sequências ou nos exemplos. Um polinucleótido do invento também inclui um polinucleótido que codifica um polipéptido do invento. De forma similar, um ácido nucleico artificial que híbrida com um polinucleótido indicado acima, em condições de severidade elevada e ao longo de praticamente todo o comprimento do ácido nucleico (e que é 56 ΕΡ 1 914 314/ΡΤ diferente de um polinucleótido natural), é um polinucleótido do invento. Numa concretização, uma composição inclui um polipéptido do invento e um excipiente (por exemplo, tampão, água, excipiente farmaceuticamente aceitável, etc.). 0 invento também proporciona um anticorpo ou um anti-soro especificamente imunorreactivo com um polipéptido do invento. Um polinucleótido artificial é um polinucleótido que é produzido pelo homem e que não existe naturalmente.
Um polinucleótido do invento também inclui um polinucleótido artificial que é pelo menos 75%, pelo menos 80%, pelo menos 90%, pelo menos 95%, pelo menos 98% ou mais idêntico ao polinucleótido de um ARNt existente na natureza (mas que é diferente de um ARNt que existe naturalmente) ou ao polinucleótido de qualquer ARNt ou do seu ácido nucleico codificante que conste numa lista ou exemplo aqui apresentados. Um polinucleótido também inclui um polinucleótido artificial que é pelo menos 75%, pelo menos 80%, pelo menos 90%, pelo menos 95%, pelo menos 98% ou mais idêntico ao polinucleótido de um ARNt existente na natureza.
Em determinadas concretizações, um vector (por exemplo, um plasmideo, um cosmideo, um fago, um vírus, etc.) compreende um polinucleótido do invento. Numa concretização, o vector é um vector de expressão. Noutra concretização, o vector de expressão inclui um promotor ligado de forma operacional a um ou mais dos polinucleótidos do invento. Noutra concretização, uma célula compreende um vector que inclui um polinucleótido do invento.
Um perito compreenderá que muitas variantes das sequências descritas estão incluídas no invento. Por exemplo, as variações conservativas das sequências descritas que originam uma sequência funcionalmente similar estão incluídas no invento. Considera-se que as variantes das sequências polinucleotídicas dos ácidos nucleicos, em que as variantes hibridam com pelo menos uma sequência descrita e reconhecem um codão de selecção, estão incluídas no invento. Subsequências únicas das sequências aqui descritas, tal como determinadas, por exemplo, através de técnicas comuns de comparação de sequências, estão também incluídas no invento. 57 ΕΡ 1 914 314/ΡΤ
Variações conservativas
Devido à degenerescência do código genético, as "substituições silenciosas" (isto é, as substituições numa sequência de ácido nucleico que não resultam numa alteração num polipéptido codificado) são uma caracteristica implícita de todas as sequências de ácidos nucleicos que codificam um aminoácido. De forma similar, as "substituições conservativas de aminoácidos", em que um ou mais aminoácidos numa sequência de aminoácidos são substituídos por aminoácidos diferentes com propriedades extremamente similares, são também facilmente identificadas como sendo extremamente semelhantes a uma construção descrita. Estas variações conservativas de cada sequência descrita são uma caracteristica do presente invento. 0 termo "variações conservativas" de uma sequência de ácido nucleico particular refere-se aqueles ácidos nucleicos que codificam sequências de aminoácidos idênticas ou essencialmente idênticas ou, quando o ácido nucleico não codifica uma sequência de aminoácidos, a sequências essencialmente idênticas. Um perito reconhecerá que as substituições, as deleções ou as adições individuais que alteram, adicionam ou eliminam um único aminoácido ou uma pequena percentagem de aminoácidos (tipicamente menos de 5%, mais tipicamente menos de 4%, 2% ou 1%) , numa sequência codificada, são "variações modificadas de forma conservativa", em que as alterações resultam na deleção de um aminoácido, na adição de um aminoácido ou na substituição de um aminoácido por um aminoácido quimicamente similar. Assim, as "variações conservativas" de uma sequência polipeptídica indicada do presente invento incluem substituições de uma pequena percentagem, tipicamente menos de 5%, mais tipicamente menos de 2% ou 1%, dos aminoácidos da sequência polipeptídica por um aminoácido do mesmo grupo de substituição conservativa. Finalmente, a adição de sequências que não alteram a actividade codificada de uma molécula de ácido nucleico, como seja a adição de uma sequência não funcional, é uma variação conservativa do ácido nucleico básico.
As tabelas de substituições conservativas que proporcionam aminoácidos funcionalmente similares, nas quais um resíduo de aminoácido é substituído por outro resíduo de 58 ΕΡ 1 914 314/ΡΤ aminoácido possuindo propriedades químicas similares (por exemplo, cadeias laterais aromáticas ou cadeias laterais carregadas positivamente) e, desta forma, não altera substancialmente as propriedades funcionais da molécula do polipéptido, são bem conhecidas na arte. A tabela seguinte ilustra grupos exemplificativos que contêm aminoácidos naturais com propriedades químicas similares, em que uma substituição dentro de um grupo é uma "substituição conservativa". 58 ΕΡ 1 914 314/ΡΤ Cadeias laterais não polares e/ou alifáticas Glicina Alanina Valina Leucina Isoleucina Prolina
Cadeias laterais polares e não carregadas Serina Treonina Cisteína Metionina Asparagina Glutamina
Cadeiaslaterais aromáticas Fenilalanina Tirosina Triptofano
Cadeias laterais carregadas pos it ivamente Lisina Arginina Histidina
Cadeias laterais carregadas negat ivamente Aspartato Glutamato
Hibridaçao de ácidos nucleicos A hibridação comparativa pode ser utilizada para identificar os ácidos nucleicos do invento, como aqueles que constam das listas de sequências aqui apresentadas, incluindo as variações conservativas dos ácidos nucleicos do invento, e este método de hibridação comparativa é um método que permite distinguir os ácidos nucleicos do invento de ácidos nucleicos não relacionados. Além disso, os ácidos nucleicos-alvo que hibridam com um ácido nucleico representado por aqueles da lista de sequências, em condições de restringência elevada, ultra-elevada e ultra, ultra-elevada, são uma característica do invento. Os exemplos destes ácidos nucleicos incluem aqueles que apresentam uma ou algumas substituições silenciosas ou conservativas, em comparação com uma dada sequência de ácido nucleico.
Diz-se que um ácido nucleico de teste híbrida especificamente com um ácido nucleico que é uma sonda quando ele híbrida pelo menos V2 tão bem com a sonda como com o alvo complementar perfeitamente correspondente, isto é, com uma 59 ΕΡ 1 914 314/ΡΤ razão sinal-ruído de fundo pelo menos V2 tão elevada quanto a hibridação da sonda com o alvo, em condições em que a sonda perfeitamente correspondente se liga ao alvo complementar perfeitamente correspondente com uma razão sinal-ruído de fundo que é pelo menos cerca de 5x-10x aquela observada para a hibridação com qualquer um dos ácidos nucleicos-alvo não correspondentes.
Os ácidos nucleicos "hibridam" quando se associam, normalmente em solução. Os ácidos nucleicos hibridam devido a uma variedade de forças físico-químicas bem caracterizadas, tais como as ligações de hidrogénio, a exclusão de solvente, o empilhamento de bases e fenómenos similares. Um guia pormenorizado da hibridação de ácidos nucleicos pode ser encontrado em Tijssen (1993) Laboratory Techniques in Biochemistry and Molecular Biology-Hybridization with Nucleic Acid Probes part I chapter 2, "OverView of principies of hybridization and the strategy of nucleic acid probe assays," (Elsevier, New York), bem como em Ausubel, acima. Hames & Higgins (1995) Gene Probes 1 IRL Press at Oxford University Press, Oxford, England, (Hames and Higgins 1) e Hames & Higgins (1995) Gene Probes 2 IRL Press at Oxford University Press, Oxford, England (Hames and Higgins 2) proporcionam pormenores sobre a síntese, a marcação, a detecção e a quantificação de ADN e ARN, incluindo oligonucleótidos.
Um exemplo de condições de hibridação restringentes para a hibridação de ácidos nucleicos complementares que possuem mais de 100 resíduos complementares num filtro, numa transferência de Southern ou de Northern, consiste em formalina a 50% com 1 mg de heparina a 42°C, sendo a hibridação efectuada durante a noite. Um exemplo de condições de lavagem restringentes consiste numa lavagem com 0,2x SSC a 65°C, durante 15 minutos (consultar Sambrook, acima, para obter uma descrição do tampão SSC). Muitas vezes, a lavagem em condições de restringência elevada é precedida de uma lavagem em condições de baixa restringência para remover o sinal de fundo da sonda. Um exemplo de uma lavagem em condições de baixa restringência consiste em 2x SSC a 40°C, durante 15 minutos. Em geral, uma razão sinal-ruído de fundo igual a 5x (ou mais) aquela observada para uma sonda não relacionada, 60 ΕΡ 1 914 314/ΡΤ no ensaio de hibridação particular, indica a detecção de uma hibridação especifica.
As “condições restringentes de lavagem e de hibridação", no contexto das experiências de hibridação de ácidos nucleicos como as hibridações de Southern e de Northern, dependem da sequência e são diferentes sob diferentes parâmetros ambientais. Um guia pormenorizado da hibridação de ácidos nucleicos pode ser encontrado em Tijssen (1993), acima, e em Hames e Higgins, 1 e 2. As condições restringentes de hibridação e de lavagem podem ser facilmente determinadas empiricamente para qualquer ácido nucleico de teste. Por exemplo, na determinação de condições restringentes de hibridação e de lavagem, as condições de hibridação e de lavagem são gradualmente aumentadas (por exemplo, aumentando a temperatura, diminuindo a concentração de sal, aumentando a concentração de detergente e/ou aumentando a concentração de solventes orgânicos, como a formalina, na hibridação ou na lavagem) até à obtenção de um conjunto de critérios seleccionados. Por exemplo, em condições de hibridação e de lavagem extremamente restringentes, as condições de hibridação e de lavagem são gradualmente aumentadas até uma sonda se ligar a um alvo complementar perfeitamente correspondente, com uma razão sinal-ruido de fundo que é pelo menos 5x aquela observada para a hibridação da sonda com um alvo não correspondente.
As condições "muito restringentes" são seleccionadas para serem iguais ao ponto de fusão térmico (Tm) para uma sonda particular. A Tm é a temperatura (a uma força iónica e um pH definidos) à qual 50% da sequência de teste hibrida com uma sonda perfeitamente correspondente. Para os objectivos do presente invento, geralmente as condições de hibridação e de lavagem "extremamente restringentes" são seleccionadas para serem cerca de 5°C inferiores à Tm para a sequência especifica, a uma força iónica e um pH definidos.
As condições de hibridação e de lavagem de "restringência ultra-elevada" são aquelas em que a restringência das condições de hibridação e de lavagem é aumentada até a razão sinal-ruido de fundo para a ligação da sonda ao ácido nucleico-alvo complementar perfeitamente correspondente ser 61 ΕΡ 1 914 314/ΡΤ pelo menos 10χ aquela observada para a hibridação com qualquer um dos ácidos nucleicos-alvo não correspondentes. Diz-se que um ácido nucleico-alvo que hibrida com uma sonda nestas condições, com uma razão sinal-ruido de fundo que é pelo menos ^ daquela do ácido nucleico-alvo complementar perfeitamente correspondente, se liga à sonda em condições de restringência ultra-elevada.
De forma idêntica, é possível determinar níveis ainda mais elevados de restringência, aumentando gradualmente as condições de hibridação e/ou de lavagem do ensaio de hibridação relevante. Por exemplo, aqueles ensaios em que a restringência das condições de hibridação e de lavagem é aumentada até a razão sinal-ruído de fundo para a ligação da sonda ao ácido nucleico-alvo complementar perfeitamente correspondente ser pelo menos lOx, 20x, 50x, lOOx, 500x ou mais aquela observada para a hibridação com qualquer um dos ácidos nucleicos-alvo não correspondentes. Diz-se que um ácido nucleico-alvo que hibrida com uma sonda nestas condições, com uma razão sinal-ruído de fundo que é pelo menos Vè daquela do ácido nucleico-alvo complementar perfeitamente correspondente, se liga à sonda em condições de restringência ultra, ultra-elevada .
Os ácidos nucleicos que não hibridam uns com os outros em condições restringentes ainda são substancialmente idênticos se os polipéptidos que eles codificam forem substancialmente idênticos. Isto ocorre, por exemplo, quando é criada uma cópia de um ácido nucleico utilizando a máxima degenerescência de codões permitida pelo código genético.
Subseguências únicas
Num aspecto, o invento proporciona um ácido nucleico que compreende uma subsequência única num ácido nucleico seleccionado entre as sequências de O-ARNt e O-RS aqui descritas. A subsequência única é única quando é comparada com um ácido nucleico correspondente a qualquer sequência de ácido nucleico de ARNt ou RS previamente conhecida. 0 alinhamento pode ser efectuado utilizando, por exemplo, o programa BLAST configurado para os parâmetros predefinidos. Qualquer 62 ΕΡ 1 914 314/ΡΤ subsequência única é útil, por exemplo, como sonda para identificar os ácidos nucleicos do invento.
De forma idêntica, o invento inclui um polipéptido que compreende uma subsequência única num polipéptido seleccionado entre as sequências de O-RS aqui descritas. Aqui, a subsequência única é única em comparação com um polipéptido correspondente a qualquer sequência de RS previamente conhecida. 0 invento também proporciona ácidos nucleicos-alvo que hibridam em condições restringentes com um oligonucleótido codificante único, que codifica uma subsequência única num polipéptido seleccionado entre as sequências de O-RS, em que a subsequência única é única em comparação com um polipéptido correspondente a qualquer um dos polipéptidos de controlo (por exemplo, sequências parentais a partir das quais as sintetases do invento foram derivadas, por exemplo, por mutação). As sequências únicas são determinadas como referido acima.
Comparação, identidade e homologia de sequências
Os termos "idêntica" ou percentagem de "identidade", no contexto de duas ou mais sequências de ácido nucleico ou de polipéptido, referem-se a duas ou mais sequências ou subsequências que são as mesmas ou que possuem uma percentagem especifica de nucleótidos ou de resíduos de aminoácidos que é a mesma quando são comparadas e alinhadas para obter a máxima correspondência, tal como determinada utilizando um dos algoritmos de comparação de sequências descritos abaixo (ou outros algoritmos disponíveis para os peritos) ou através de inspecção visual. A frase "substancialmente idênticas", no contexto de dois ácidos nucleicos ou polipéptidos (por exemplo, os ADN que codificam um O-ARNt ou uma O-RS ou a sequência de aminoácidos de uma O-RS), refere-se a duas ou mais sequências ou subsequências que possuem uma identidade de nucleótidos ou de resíduos de aminoácidos de pelo menos cerca de 60%, cerca de 80%, cerca de 90-95%, cerca de 98%, cerca de 99% ou mais, quando são comparadas e alinhadas para obter a máxima correspondência, tal como determinada utilizando um algoritmo 63 ΕΡ 1 914 314/ΡΤ de comparação de sequências ou através de inspecção visual. Estas sequências "substancialmente idênticas" são normalmente consideradas "homólogas", sem referência à ascendência efectiva. Preferencialmente, a "identidade substancial" existe ao longo de uma região da sequência que possui pelo menos cerca de 50 resíduos de comprimento, mais preferencialmente ao longo de uma região com pelo menos cerca de 100 resíduos e, ainda mais preferencialmente, as sequências são substancialmente idênticas ao longo de pelo menos cerca de 150 resíduos ou ao longo do comprimento total das duas sequências que estão a ser comparadas.
As proteínas e/ou as sequências de proteínas são "homólogas" quando são derivadas, natural ou artificialmente, de uma proteína ou de uma sequência de proteína ancestral comum. De forma idêntica, os ácidos nucleicos e/ou as sequências de ácido nucleico são homólogos quando são derivados, natural ou artificialmente, de um ácido nucleico ou de uma sequência de ácido nucleico ancestral comum. Por exemplo, qualquer ácido nucleico existente na natureza pode ser modificado, via qualquer método de mutagénese disponível, para incluir um ou mais codões de selecção. Quando é expresso, este ácido nucleico mutado codifica um polipéptido compreendendo uma ou mais homoglutaminas, ou seja, um aminoácido não natural. O processo de mutação pode, naturalmente, alterar adicionalmente um ou mais codões comuns, modificando, assim, também um ou mais aminoácidos comuns na proteína mutante resultante. A homologia é normalmente inferida a partir da similaridade de sequência entre dois ou mais ácidos nucleicos ou proteínas (ou sequências destes). A percentagem precisa de similaridade entre sequências, que é útil no estabelecimento da homologia, varia com o ácido nucleico e com a proteína em questão, mas uma percentagem de similaridade de sequência tão pequena como 25% é rotineiramente utilizada para estabelecer a homologia. Níveis mais elevados de similaridade de sequência, por exemplo, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 99% ou mais, podem também ser utilizados para estabelecer a homologia. Os métodos para determinar as percentagens de similaridade de sequência (por exemplo, BLASTP e BLASTN utilizando parâmetros predefinidos) são aqui descritos e estão geralmente disponíveis. 64 ΕΡ 1 914 314/ΡΤ
Para a comparação de sequências e a determinação de homologia, uma sequência actua tipicamente como sequência de referência em relação à qual as sequências de teste são comparadas. Ao utilizar um algoritmo de comparação de sequências, as sequências de teste e de referência são introduzidas num computador; se necessário, as coordenadas para as subsequências são designadas; e os parâmetros do programa do algoritmo para as sequências são designados. 0 algoritmo de comparação das sequências calcula, em seguida, a percentagem de identidade de sequência da(s) sequência(s) de teste em relação à sequência de referência, com base nos parâmetros do programa designados. 0 alinhamento óptimo das sequências para efeitos de comparação pode ser realizado, por exemplo, pelo algoritmo de homologia local de Smith & Waterman, Adv. Appl. Math. 2:482 (1981), pelo algoritmo para alinhamento de homologia de Needleman & Wunsch, J. Mol. Biol. 48:443 (1970), pelo método de busca de similaridade de Pearson & Lipman, Proc. Nat'l. Acad. Sei. USA 85:2444 (1988), pelas implementações computadorizadas destes algoritmos (GAP, BESTFIT, FASTA e TFASTA no Wisconsin Genetics Software Package, Genetics Computer Group, 575 Science Dr., Madison, WI) ou por inspecção visual (consultar, de uma forma geral, Ausubel et al., abaixo).
Um exemplo de um algoritmo que é adequado para determinar a percentagem de identidade de sequência e de similaridade de sequência é o algoritmo BLAST, que está descrito em Altschul et al., J. Mol. Biol. 215:403-410 (1990). O software para realizar as análises BLAST está disponível ao público através do centro nacional para informação em biotecnologia (www.nebi.nlm.nih.gov/) . Este algoritmo envolve a identificação inicial de pares de sequências com uma pontuação alta (HSP de "high scoring pair") através da identificação de palavras curtas de comprimento W na sequência de busca, que correspondem ou satisfazem uma pontuação de limiar positiva T quando são alinhadas com uma palavra com o mesmo comprimento que está presente numa sequência da base de dados. T é designado por limiar de pontuação da palavra vizinha (Altschul et al., acima). Estas correspondências iniciais com a palavra vizinha actuam como sementes para iniciar buscas no sentido de 65 ΕΡ 1 914 314/ΡΤ encontrar HSP mais compridas que as contenham. As correspondências com a palavra são depois estendidas em ambas as direcções, ao longo de cada sequência, o mais longe que a pontuação cumulativa do alinhamento possa ser aumentada. As pontuações cumulativas são calculadas utilizando, para as sequências nucleotidicas, os parâmetros M (pontuação de recompensa para um par de resíduos idênticos; sempre > 0) e N (pontuação de penalização para resíduos não correspondentes; sempre < 0). Para as sequências de aminoácidos, utiliza-se uma matriz de pontuação para calcular a pontuação cumulativa. A extensão das correspondências com a palavra em ambas as direcções é interrompida quando: a pontuação de alinhamento cumulativa diminui do valor máximo alcançado na quantidade X; a pontuação cumulativa atinge zero ou um valor inferior devido à acumulação de um ou mais alinhamentos de resíduos com pontuação negativa; ou é atingido o final de qualquer uma das sequências. Os parâmetros do algoritmo BLAST W, T e X determinam a sensibilidade e a velocidade do alinhamento. O programa BLASTN (para sequências nucleotídicas) utiliza como valores predefinidos um comprimento de palavra (W) de 11, um valor de expectativa (E) de 10, uma exclusão de 100, M=5, N=-4 e uma comparação de ambas as cadeias. Para as sequências de aminoácidos, o programa BLASTP utiliza como valores predefinidos um comprimento de palavra (W) de 3, uma expectativa (E) de 10 e uma matriz de pontuação BLOSUM62 (ver Henikoff & Henikoff (1989) Proc. Natl. Acad. Sei. USA 89:10915).
Além de calcular a percentagem de identidade de sequência, o algoritmo BLAST também realiza uma análise estatística da similaridade entre duas sequências (consultar Karlin & Altschul, Proc. Nat'l. Acad. Sei. USA 90:5873-5787 (1993)). Uma medida da similaridade fornecida pelo algoritmo BLAST é a probabilidade mais pequena de soma (P(N)), que proporciona uma indicação da probabilidade com que uma correspondência entre duas sequências nucleotídicas ou de aminoácidos ocorreria por acaso. Por exemplo, um ácido nucleico é considerado similar a uma sequência de referência se a probabilidade mais pequena de soma, numa comparação do ácido nucleico de teste com o ácido nucleico de referência, for inferior a cerca de 0,1; mais preferencialmente inferior a 66 ΕΡ 1 914 314/ΡΤ cerca de 0,01; ainda mais preferencialmente inferior a cerca de 0,001.
Mutagénese e outras técnicas de biologia molecular
Os polinucleótidos e os polipéptidos do invento e utilizados no invento podem ser manipulados utilizando técnicas de biologia molecular. Os textos gerais que descrevem técnicas de biologia molecular incluem Berger & Kimmel, Guide to Molecular Cloning Techniques, Methods in Enzymology, volume 152 Academic Press, Inc., San Diego, CA (Berger); Sambrook et al., Molecular Cloning - A Laboratory Manual (3rd Ed.), Vol. 1-3, Cold Spring Harbor Laboratory, Cold Spring Harbor, New York, 2001 ("Sambrook") e Current Protocols in Molecular Biology, F.M. Ausubel et al., eds., Current Protocols, um empreendimento conjunto entre Greene Publishing Associates, Inc. e John Wiley & Sons, Inc., (suplementado durante 2003) ("Ausubel")). Estes textos descrevem a mutagénese, a utilização de vectores e de promotores e muitos outros tópicos relevantes relacionados, por exemplo, com a geração de genes que incluem codões de selecção para a produção de proteínas que incluem homoglutaminas, ARNt ortogonais, sintetases ortogonais e pares destes.
Utilizam-se vários tipos de mutagénese no invento, por exemplo, para mutar moléculas de ARNt, para produzir bibliotecas de ARNt, para produzir bibliotecas de sintetases e para inserir codões de selecção que codificam uma homoglutamina numa proteína ou polipéptido de interesse. Eles incluem, embora não se encontrem limitados a estes, a mutagénese dirigida, a mutagénese pontual aleatória, a recombinação homóloga, o arranjo combinatório de ADN ou outros métodos de mutagénese recursiva, a construção quimérica, a mutagénese utilizando modelos que contêm uracilo, a mutagénese dirigida por oligonucleótidos, a mutagénese de ADN modificado com fosforotioato, a mutagénese utilizando dúplices de ADN com lacunas, técnicas similares ou qualquer combinação destas. Os métodos adicionais adequados incluem a reparação de correspondências pontuais incorrectas, a mutagénese utilizando estirpes hospedeiras deficientes ao nível da reparação, a restrição-selecção e a restrição-purificação, a mutagénese por deleção, a mutagénese por síntese de genes totais, a reparação 67 ΕΡ 1 914 314/ΡΤ de quebras na cadeia dupla e técnicas similares. A mutagénese envolvendo, por exemplo, construções quiméricas também está incluída no presente invento. Numa concretização, a mutagénese pode ser orientada através de informações conhecidas da molécula existente naturalmente ou da molécula existente naturalmente alterada ou mutada, por exemplo, sequência, comparações de sequência, propriedades físicas, estrutura cristalina ou factores idênticos.
As células hospedeiras são geneticamente manipuladas (por exemplo, transformadas, transduzidas ou transfectadas) com os polinucleótidos do invento ou com construções que incluem um polinucleótido do invento, como seja um vector do invento, que pode ser um vector de clonagem ou um vector de expressão. Por exemplo, as regiões codificantes do ARNt ortogonal, da ARNt-sintetase ortogonal e da proteína que será derivatizada estão ligadas, de forma operacional, a elementos de controlo da expressão génica que são funcionais na célula hospedeira desejada. Os vectores típicos contêm sequências de terminação da transcrição e da tradução, sequências de iniciação da transcrição e da tradução e promotores úteis para a regulação da expressão do ácido nucleico-alvo particular. Os vectores compreendem opcionalmente cassetes de expressão genéricas contendo pelo menos uma sequência de terminação independente, sequências que permitem a replicação da cassete em eucariotas, procariotas ou ambos (por exemplo, vectores vaivém) e marcas de selecção para ambos os sistemas procarióticos e eucarióticos. Os vectores são adequados para replicação e/ou integração em procariotas, eucariotas ou preferencialmente em ambos. Ver Giliman & Smith, Gene 8:81 (1979); Roberts, et al.r Nature, 328:731 (1987); Schneider, B. et al., Protein Expr.
Purif. 6435:10 (1995); Ausubel, Sambrook, Berger (todos acima) . O vector pode estar, por exemplo, sob a forma de um plasmídeo, uma bactéria, um vírus, um polinucleótido nu ou um polinucleótido conjugado. Os vectores são introduzidos nas células e/ou microrganismos através de métodos comuns, incluindo a electroporação (From et al., Proc. Natl. Acad. Sei. USA 82, 5824 (1985)), a infecção por vectores virais e a penetração balística de alta velocidade por partículas pequenas contendo o ácido nucleico, quer no interior da matriz de pequenas esferas ou partículas quer à superfície (Klein et al., Nature 327, 70-73 (1987)), e/ou métodos similares. 68 ΕΡ 1 914 314/ΡΤ
Um catálogo de bactérias e de bacteriófagos úteis para a clonagem é fornecido, por exemplo, pela ATCC, por exemplo, The ATCC Catalogue of Bactéria and Bacteriophage (1996) Gherna et al. (eds) publicado por ATCC. Procedimentos básicos adicionais de sequenciação, clonagem, outros aspectos da biologia molecular e considerações teóricas subjacentes são também encontrados em Sambrook (acima), Ausubel (acima) e em Watson et al. (1992) Recombinant DNA, Second Edition Scientific American Books, NY. Além disso, praticamente todos os ácidos nucleicos (e virtualmente qualquer ácido nucleico marcado, seja ele comum ou não comum) podem ser encomendados na forma habitual ou sob uma forma personalizada a partir de uma variedade de fontes comerciais, tais como Midland Certified Reagent Company (Midland, TX; mcrc.com), The Great American Gene Company (Ramona, CA; disponível na World Wide Web em genco.com), ExpressGen Inc. (Chicago, IL; disponível na World Wide Web em expressgen.com), Operon Technologies Inc. (Alameda, CA) e muitas outras.
As células hospedeiras manipuladas podem ser cultivadas em meios nutrientes convencionais, modificados consoante apropriado para actividades como, por exemplo, passos de rastreio, a activação de promotores ou a selecção de transformantes. Estas células podem ser opcionalmente cultivadas em organismos transgénicos. Outras referências úteis, por exemplo, para o isolamento e a cultura de células (por exemplo, para isolamento subsequente dos ácidos nucleicos) incluem Freshney (1994) Culture of Animal Cells, a Manual of Basic Technique, third edition, Wiley-Liss, New York e as referências aí citadas; Payne et al. (1992) Plant Cell and Tissue Culture in Liquid Systems, John Wiley & Sons, Inc. New York, NY; Gamborg & Phillips (eds) (1995) Plant Cell, Tissue and Organ Culture; Fundamental Methods, Springer Lab Manual, Springer-Verlag (Berlin Heidelberg New York) e Atlas & Parks (eds) The Handbook of Microbiological Media (1993) CRC Press, Boca Raton, FL.
PROTEÍNAS E POLIPÉPTIDOS DE INTERESSE
As proteínas ou polipéptidos de interesse, por exemplo, possuindo pelo menos uma homoglutamina, são uma característica 69 ΕΡ 1 914 314/ΡΤ do invento, assim como o são os polipéptidos que compreendem dois ou mais aminoácidos não naturais diferentes. Um excipiente (por exemplo, um excipiente farmaceuticamente aceitável) também pode estar presente juntamente com a proteina. Opcionalmente, a proteína do invento incluirá uma modificação pós-tradução.
Os métodos para produzir uma proteína numa célula com uma homoglutamina ou outro aminoácido não natural numa posição especificada também são uma característica do invento. Por exemplo, um método consiste em crescer a célula num meio apropriado, em que a célula inclui um ácido nucleico que compreende pelo menos um codão de selecção e que codifica uma proteína; e proporcionar a homoglutamina ou outro aminoácido não natural; em que a célula compreende ainda um ARNt ortogonal (Ο-ARNt), que funciona na célula e que reconhece o codão de selecção, e uma aminoacil-ARNt-sintetase ortogonal (O-RS), que efectua preferencialmente a aminoacilação do Ο-ARNt com a homoglutamina ou o outro aminoácido não natural. Em determinadas concretizações, o Ο-ARNt compreende uma eficácia de supressão de pelo menos cerca de 45%, 50%, 60%, 75%, 80%, 90% ou mais, na presença de uma sintetase cognata e em resposta ao codão de selecção, em comparação com o O-ARNt que compreende ou é codificado por uma sequência polinucleotídica como ilustrada na lista de sequências e nos exemplos aqui apresentados. Uma proteína produzida por este método é também uma característica do invento. O invento também proporciona composições que incluem proteínas, em que as proteínas compreendem uma homoglutamina. Em determinadas concretizações, a proteína compreende uma sequência de aminoácidos que é pelo menos 75% idêntica à sequência de uma proteína-alvo, tal como uma proteína terapêutica, uma proteína de diagnóstico, uma enzima industrial ou uma porção destas, que difere da proteína-alvo, por exemplo, pela introdução de um ou mais aminoácidos não naturais como a homoglutamina.
As composições do invento e as composições preparadas pelos métodos do invento estão opcionalmente presentes numa célula. Os pares O-ARNt/O-RS ou os componentes individuais do invento podem depois ser utilizados na maquinaria de tradução 70 ΕΡ 1 914 314/ΡΤ de um sistema hospedeiro, o que resulta na incorporação de uma homoglutamina numa proteína. WO 2004/094593, intitulado "Expanding the Eukaryotic Genetic Code", e WO 2002/085923, intitulado ""IN VIVO INCORPORATION OF UNNATURAL AMINO ACIDS", descrevem este processo. Por exemplo, quando um par O-ARNt/O-RS é introduzido num hospedeiro, por exemplo, Escherichia coli, o par conduz à incorporação in vivo de homoglutamina, por exemplo, um aminoácido sintético tal como um derivado de um aminoácido tirosina ou fenilalanina, que pode ser adicionada exogenamente ao meio de crescimento, numa proteína, em resposta a um codão de selecção. Opcionalmente, as composições do presente invento podem estar presentes num sistema de tradução in vitro ou em sistema(s) in vivo.
Uma célula do invento proporciona a capacidade de sintetizar proteínas que compreendem aminoácidos não naturais, em quantidades grandes e úteis. Num aspecto, a composição inclui opcionalmente pelo menos 10 microgramas, pelo menos 50 microgramas, pelo menos 75 microgramas, pelo menos 100 microgramas, pelo menos 200 microgramas, pelo menos 250 microgramas, pelo menos 500 microgramas, pelo menos 1 miligrama, pelo menos 10 miligramas ou mais da proteína que compreende uma homoglutamina ou vários aminoácidos não naturais, ou uma quantidade que pode ser obtida com métodos de produção da proteína in vivo (pormenores sobre a produção e a purificação de proteínas recombinantes são aqui fornecidos). Noutro aspecto, a proteína está opcionalmente presente na composição numa concentração de pelo menos 10 microgramas de proteína por litro, pelo menos 50 microgramas de proteína por litro, pelo menos 75 microgramas de proteína por litro, pelo menos 100 microgramas de proteína por litro, pelo menos 200 microgramas de proteína por litro, pelo menos 250 microgramas de proteína por litro, pelo menos 500 microgramas de proteína por litro, pelo menos 1 miligrama de proteína por litro, pelo menos 10 miligramas de proteína por litro ou mais, por exemplo, num lisado celular, num tampão, num tampão farmacêutico ou noutra suspensão líquida (por exemplo, num volume compreendido entre cerca de 1 nl e 100 1). A produção de grandes quantidades (por exemplo, superiores ao que é normalmente possível com outros métodos, como seja a tradução in vitro) de uma proteína numa célula 71 ΕΡ 1 914 314/ΡΤ possuindo pelo menos uma homoglutamina é uma característica do invento. A incorporação de uma homoglutamina ou de outros aminoácidos não naturais pode ser efectuada, por exemplo, para proceder a alterações à medida na estrutura e/ou função da proteína, por exemplo, para alterar o tamanho, a acidez, a nucleofilicidade, as ligações de hidrogénio, a hidrofobicidade, a acessibilidade de locais-alvo das proteases, o alvo de um grupo (por exemplo, para um "array" de proteínas), etc. As proteínas que incluem uma homoglutamina podem ter propriedades físicas ou catalíticas melhoradas ou mesmo totalmente novas. Por exemplo, as propriedades seguintes são opcionalmente modificadas por inclusão de uma homoglutamina ou de outro aminoácido não natural numa proteína: toxicidade, biodistribuição, propriedades estruturais, propriedades espectroscópicas, propriedades químicas e/ou fotoquímicas, capacidade catalítica, semivida (por exemplo, semivida sérica), capacidade de reagir com outras moléculas, por exemplo, de forma covalente ou não covalente, e propriedades similares. As composições compreendendo proteínas que incluem pelo menos uma homoglutamina são úteis para, por exemplo, novas terapêuticas, diagnósticos, enzimas catalíticas, enzimas industriais, proteínas de ligação (por exemplo, anticorpos) e, por exemplo, o estudo da estrutura e da função das proteínas. Consultar Dougherty (2000) Unnatural Amino Acids as Probes of Protein Structure and Function, Current Opinion in Chemical Biology, 4:645-652. Além disso, um ou mais aminoácidos não naturais podem ser incorporados num polipéptido para proporcionar uma marca molecular, por exemplo, para fixar o polipéptido a um suporte sólido. Ver, por exemplo, "PROTEIN ARRAYS" de Wang & Schultz, apresentado em 22 de Dezembro de 2003, número de referência 54-000810PC, para consultar uma discussão alargada sobre os métodos de produção de "arrays" utilizando polipéptidos que compreendem aminoácidos não naturais.
Num aspecto do invento, uma composição inclui pelo menos uma proteína com pelo menos um, por exemplo, pelo menos dois, pelo menos três, pelo menos quatro, pelo menos cinco, pelo menos seis, pelo menos sete, pelo menos oito, pelo menos nove, pelo menos dez ou mais aminoácidos não naturais, por exemplo, 72 ΕΡ 1 914 314/ΡΤ homoglutaminas e/ou outros aminoácidos não naturais. Os aminoácidos não naturais podem ser iguais ou diferentes; podem existir 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 ou mais locais diferentes na proteína que compreendem 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 ou mais aminoácidos não naturais diferentes. Noutro aspecto, uma composição inclui uma proteína em que pelo menos um aminoácido, mas menos da totalidade, de um tipo de aminoácido particular presente na proteína está substituído pela homoglutamina. Para uma dada proteína com mais de um aminoácido não natural, os aminoácidos não naturais podem ser idênticos ou diferentes (por exemplo, a proteína pode incluir dois ou mais tipos diferentes de aminoácidos não naturais ou pode incluir dois dos mesmos aminoácidos não naturais). Para uma dada proteína com mais de dois aminoácidos não naturais, os aminoácidos não naturais podem ser iguais, diferentes ou uma combinação de vários aminoácidos não naturais do mesmo tipo com pelo menos um aminoácido não natural diferente.
Praticamente qualquer proteína (ou uma sua porção) que inclua um aminoácido não natural, como seja uma homoglutamina, ou que codifique múltiplos aminoácidos não naturais diferentes (e qualquer ácido nucleico codificante correspondente que inclua, por exemplo, um ou mais codões de selecção) pode ser produzida utilizando as composições e os métodos deste invento. Não é feita qualquer tentativa para identificar as centenas de milhar de proteínas conhecidas, em que qualquer uma delas pode ser modificada para incluir um ou mais aminoácidos não naturais, por exemplo, adaptando quaisquer métodos de mutação disponíveis para incluir um ou mais codões de selecção apropriados num sistema de tradução relevante. Os repositórios habituais de sequências para as proteínas conhecidas incluem GenBank EMBL, DDBJ e o NCBI. Outros repositórios podem ser facilmente identificados fazendo uma pesquisa na Internet.
Normalmente, as proteínas são pelo menos 60%, pelo menos 70%, pelo menos 75%, pelo menos 80%, pelo menos 90%, pelo menos 95%, pelo menos 99% ou mais idênticas a qualquer proteína disponível (por exemplo, uma proteína terapêutica, uma proteína de diagnóstico, uma enzima industrial, uma porção destas e proteínas similares) e compreendem um ou mais aminoácidos não naturais. Os exemplos de proteínas 73 ΕΡ 1 914 314/ΡΤ terapêuticas, de diagnóstico e outras que podem ser modificadas para compreender uma ou mais homoglutaminas podem ser encontrados, embora não se encontrem limitados a estes, em WO 2004/094593, e intitulado "Expanding the Eukaryotic Genetic Code", e em WO 2002/085923, intitulado "IN VIVO INCORPORATION OF UNNATURAL AMINO ACIDS". Os exemplos de proteínas terapêuticas, de diagnóstico e outras que podem ser modificadas para compreender uma ou mais homoglutaminas incluem, embora não estejam limitadas a estas, alfa-1-antitripsina, angiostatina, factor anti-hemolítico, anticorpos (pormenores adicionais sobre os anticorpos encontram-se abaixo), apolipoproteína, apoproteína, factor natriurético auricular, polipéptido natriurético auricular, péptidos auriculares, quimiocinas C-X-C (por exemplo, T39765, NAP-2, ENA-78, Gro-a, Gro-b, Gro-c, IP-10, GCP-2, NAP-4, SDF-1, PF4, MIG) , calcitonina, quimiocinas CC (por exemplo, proteína quimioatractora de monócitos 1, proteína quimioatractora de monócitos 2, proteína quimioatractora de monócitos 3, proteína-l-alfa inflamatória de monócitos, proteína-l-beta inflamatória de monócitos, RANTES, 1309, R83915, R91733, HCC1, T58847, D31065, T64262), ligando CD40, ligando C-kit, colagénio, factor estimulador de colónias (CSF), factor do complemento 5a, inibidor do complemento, receptor do complemento 1, citocinas, (por exemplo, o péptido activador de neutrófilos derivado de células epiteliais 78, GROa/MGSA, GRC^, GROy, MlP-la, MIP-Ιδ, MCP-1), factor de crescimento epidérmico (EGF), eritropoietina ("EPO")^ toxinas esfoliantes A e B, Factor IX, Factor VII, Factor VIII, Factor X, factor de crescimento de fibroblastos (FGF), fibrinogénio, fibronectina, G-CSF, GM-CSF, glucocerebrosidase, gonadotropina, factores de crescimento, proteínas Hedgehog (por exemplo, Sonic, Indian, Desert), hemoglobina, factor de crescimento de hepatócitos (HGF), hirudina, albumina sérica humana, insulina, factor de crescimento semelhante a insulina (IGF), interferões (por exemplo, IFN-a, IFN-β, IFN-γ), interleucinas (por exemplo, IL-1, IL-2, IL-3, IL-4, IL-5, IL-6, IL-7, IL-8, IL-9, IL-10, IL-11, IL-12, etc.), factor de crescimento dos queratinócitos (KGF), lactoferrina, factor inibidor das leucemias, luciferase, neurturina, factor inibidor dos neutrófilos (NIF), oncostatina M, proteína osteogénica, hormona paratiróide, PD-ECSF, PDGF, hormonas peptídicas (por exemplo, hormona de crescimento humana), pleiotropina, proteína A, proteína G, 74 ΕΡ 1 914 314/ΡΤ exotoxinas pirogénicas A, B e C, relaxina, renina, SCF, receptor solúvel do complemento I, ICAM-1 solúvel, receptores solúveis de interleucinas (IL-1, 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 14, 15), receptor para TNF solúvel, somat omedina, somatostatina, somatotropina, estreptoquinase, super-antigénios, isto é, enterotoxinas de estafilococos (SEA, SEB, SEC1, SEC2, SEC3, SED, SEE), superóxido-dismutase (SOD), toxina da síndrome de choque tóxico (TSST-1), timosina-alfa-1, activador do plasminogénio tecidual, factor de necrose tumoral beta (TNF-beta), receptor do factor de necrose tumoral (TNFR), factor de necrose tumoral alfa (TNF-alfa), factor de crescimento do endotélio vascular (VEGEF), uroquinase e muitas outras.
Uma classe de proteínas que pode ser preparada utilizando as composições e os métodos para incorporação de homoglutaminas in vivo aqui descritos inclui os moduladores da transcrição ou uma porção destes. Os exemplos de moduladores da transcrição incluem os genes e as proteínas moduladoras da transcrição que modulam o crescimento, a diferenciação e a regulação celular ou processos idênticos. Os moduladores da transcrição são encontrados em procariotas, vírus e eucariotas, incluindo fungos, plantas, leveduras, insectos e animais, incluindo os mamíferos, proporcionando uma gama ampla de alvos terapêuticos. Compreender-se-á que os activadores da expressão e da transcrição regulam a transcrição através de muitos mecanismos, por exemplo, através da ligação aos receptores, da estimulação de uma cascata de transdução de sinal, da regulação da expressão dos factores de transcrição, da ligação a promotores e amplificadores, da ligação a proteínas que se ligam a promotores e amplificadores, do desenrolamento do ADN, da excisão-reparação do pré-ARNm, da poliadenilação do ARN e da degradação do ARN.
Uma classe de proteínas do invento (por exemplo, proteínas com uma ou mais homoglutaminas) inclui os activadores de expressão como citocinas, moléculas inflamatórias, factores de crescimento, os seus receptores, produtos oncogénicos, por exemplo, interleucinas (por exemplo, IL-1, IL-2, IL-8, etc.), interferões, FGF, IGF-I, IGF-II, FGF, PDGF, TNF, TGF-a, TGF-β, EGF, KGF, SCF/c-Kit, CD40L/CD40, VLA-4/VCAM-1, ICAM-l/LFA-1 e hialurina/CD44; as moléculas de 75 ΕΡ 1 914 314/ΡΤ transdução de sinal e os produtos oncogénicos correspondentes, por exemplo, Mos, Ras, Raf e Met; e os activadores e supressores da transcrição, por exemplo, p53, Tat, Fos, Myc, Jun, Myb, Rei, receptores para as hormonas esteróides como sejam aqueles para o estrogénio, a progesterona, a testosterona, a aldosterona, o ligando do receptor LDL e a corticosterona.
As enzimas (por exemplo, as enzimas industriais) ou porções destas com pelo menos uma homoglutamina também são proporcionadas pelo invento. Os exemplos de enzimas incluem, embora não se encontrem limitados a estes, amidases, aminoácido-racemases, acilases, desalogenases, dioxigenases, diarilpropano-peroxidases, epimerases, epóxido-hidrolases, esterases, isomerases, quinases, glucose-isomerases, glicosidases, glicosil-transferases, haloperoxidases, mono-oxigenases (por exemplo, p450s), lipases, linhina-peroxidases, nitrilo-hidratases, nitrilases, proteases, fosfatases, subtilisinas, transaminase e nucleases.
Muitas destas proteínas estão disponíveis comercialmente (consultar, por exemplo, o catálogo de 2003 de Sigma BioSciences e a lista de preços), e as correspondentes sequências proteicas e genes e, normalmente, muitas variantes destes, são bem conhecidas (ver, por exemplo, Genbank). Qualquer uma delas pode ser modificada pela inserção de uma ou mais homoglutaminas ou de outros aminoácidos não naturais de acordo com o invento, por exemplo, para alterar a proteína em relação a uma ou mais propriedades terapêuticas, de diagnóstico ou enzimáticas de interesse. Os exemplos de propriedades terapeuticamente relevantes incluem a semivida sérica, a semivida de validade, a estabilidade, a imunogenicidade, a actividade terapêutica, a detectabilidade (por exemplo, através da inclusão de grupos repórter (por exemplo, marcas ou locais de ligação de marcas) nos aminoácidos não naturais, por exemplo, as homoglutaminas), redução do LD50 ou outros efeitos secundários, capacidade de entrar no corpo através do tracto gástrico (por exemplo, disponibilidade oral) ou propriedades similares. Os exemplos de propriedades de diagnóstico incluem a semivida de validade, a estabilidade, a actividade diagnóstica, a detectabilidade ou propriedades similares. Os exemplos de propriedades 76 ΕΡ 1 914 314/ΡΤ enzimáticas relevantes incluem a semivida de validade, a estabilidade, a actividade enzimática, a capacidade de produção ou propriedades idênticas. Várias outras proteínas podem também ser modificadas para incluir uma ou mais homoglutaminas ou outro aminoácido não natural do invento. Por exemplo, o invento pode incluir a substituição de um ou mais aminoácidos naturais, numa ou mais proteínas de vacinas, por uma homoglutamina, por exemplo, em proteínas de fungos infecciosos, tais como Aspergillus, espécies de Candida; bactérias, particularmente E. coli, que serve de modelo para as bactérias patogénicas, bem como bactérias medicamente importantes como Staphylococci (por exemplo, aureus) ou Streptococci (por exemplo, pneumoniae); protozoários como esporozoários (por exemplo, Plasmodia), rizópodes (por exemplo, Entamoeba) e flagelados (Trypanosoma, Leishmania, Trichomonas, Giardia, etc.); vírus como vírus de ARN (+) (os exemplos incluem poxvírus, por exemplo vaccinia; picomavírus, por exemplo polio; togavírus, por exemplo rubella; flavivírus, por exemplo HCV; e coronavírus), vírus de ARN(-) (por exemplo, rabdovírus como VSV; paramixovírus, por exemplo RSV; ortomixovírus, por exemplo influenza; buniavírus; e arenavírus), vírus de ADN de cadeia dupla (por exemplo reovírus), vírus de ARN para ADN, isto é, retrovírus, por exemplo VIH e HTLV, e determinados vírus de ADN para ARN como a hepatite B.
As proteínas relacionadas com a agricultura, como as proteínas de resistência a insectos (por exemplo, as proteínas Cry), as enzimas de produção de amido e de lípidos, as toxinas de plantas e de insectos, as proteínas de resistência a toxinas, as proteínas de desintoxicação de micotoxinas, as enzimas de crescimento das plantas (por exemplo, a ribulose-1,5-bifosfato-carboxilase/oxigenase, "RUBISCO"), a lipoxigenase (LOX) e a fosfoenolpiruvato(PEP)-carboxilase também são alvos adequados para a modificação com homoglutamina ou outros aminoácidos não naturais.
Em determinadas concretizações, a proteína ou o polipéptido de interesse (ou uma sua porção), nos métodos e/ou nas composições do invento, é codificado por um ácido nucleico. Tipicamente, o ácido nucleico compreende pelo menos 77 ΕΡ 1 914 314/ΡΤ um codão de selecção, pelo menos dois codões de selecção, pelo menos três codões de selecção, pelo menos quatro codões de selecção, pelo menos cinco codões de selecção, pelo menos seis codões de selecção, pelo menos sete codões de selecção, pelo menos oito codões de selecção, pelo menos nove codões de selecção, dez ou mais codões de selecção.
Os genes que codificam as proteínas ou os polipéptidos de interesse podem ser mutados, utilizando métodos bem conhecidos pelos peritos na arte e que estão aqui descritos na secção "Mutagénese e outras técnicas de biologia molecular", para incluir, por exemplo, um ou mais codões de selecção para a incorporação de uma homoglutamina. Por exemplo, um ácido nucleico para uma proteína de interesse é mutado para incluir um ou mais codões de selecção, permitindo a inserção de uma ou mais homoglutaminas. 0 invento inclui qualquer uma destas variantes, por exemplo, versões mutantes de qualquer proteína, por exemplo, incluindo pelo menos uma homoglutamina. De forma similar, o invento também inclui os ácidos nucleicos correspondentes, isto é, qualquer ácido nucleico com um ou mais codões de selecção que codificam um ou mais homoglutaminas.
Para produzir uma proteína que contém uma homoglutamina, é possível utilizar células hospedeiras e organismos que estão adaptados para a incorporação in vivo da homoglutamina via os pares ARNt/RS ortogonais. As células hospedeiras são geneticamente manipuladas (por exemplo, transformadas, transduzidas ou transfectadas) com um ou mais vectores que expressam o ARNt ortogonal, a ARNt-sintetase ortogonal e um vector que codifica a proteína que será derivatizada. Todos estes componentes podem estar no mesmo vector, cada um deles pode estar num vector separado ou dois componentes podem estar num vector e o terceiro componente num segundo vector. 0 vector pode estar, por exemplo, sob a forma de um plasmídeo, uma bactéria, um vírus, um polinucleótido nu ou um polinucleótido conjugado.
Definição de polipéptidos através da imunorreactividade
Como os polipéptidos do invento proporcionam uma variedade de novas sequências polipeptídicas (por exemplo, 78 ΕΡ 1 914 314/ΡΤ compreendendo homoglutaminas no caso das proteínas sintetizadas no sistema de tradução do invento ou, no caso das novas sintetases, novas sequências de aminoácidos comuns), os polipéptidos também proporcionam novas características estruturais que podem ser reconhecidas, por exemplo, em ensaios imunológicos. A geração de anti-soros que ligam especificamente os polipéptidos do invento, assim como os polipéptidos que são ligados por estes anti-soros são uma caracterí st ica do invento. 0 termo '"anticorpo", tal como aqui utilizado, inclui, embora não esteja limitado a ele, um polipéptido substancialmente codificado por um gene(s) de imunoglobulina, ou fragmentos deste(s), que se liga e reconhece especificamente um analito (antigénio). Os exemplos incluem anticorpos policlonais, monoclonais, quiméricos, de cadeia simples e espécies idênticas. Os fragmentos de imunoglobulinas, incluindo os fragmentos Fab e os fragmentos produzidos por uma biblioteca de expressão, incluindo uma biblioteca de apresentação em fagos, também estão incluídos no termo "anticorpo" tal como aqui utilizado. Consultar, por exemplo, Paul, Fundamental Immunology, 4th Ed., 1999, Raven Press, New York, para ver a estrutura e a terminologia dos anticorpos.
De forma a produzir anti-soros para utilizar num imunoensaio, um ou mais dos polipéptidos imunogénicos são produzidos e purificados como aqui descrito. Por exemplo, a proteína recombinante pode ser produzida numa célula recombinante. Uma estirpe consanguínea de ratinhos (utilizada neste ensaio porque os resultados são mais reprodutíveis devido à identidade genética virtual dos ratinhos) é imunizada com a(s) proteína(s) imunogénica (s), em combinação com um adjuvante comum, como seja o adjuvante de Freund, e um protocolo comum de imunização de ratinhos (ver, por exemplo, Harlow & Lane (1988) Antibodies, A Laboratory Manual, Cold Spring Harbor Publications, New York, para obter uma descrição comum da geração de anticorpos, dos formatos de imunoensaio e das condições que podem ser utilizadas para determinar a imunorreactividade específica). Pormenores adicionais sobre as proteínas, os anticorpos, os anti-soros, etc. podem ser encontrados em WO 2004/094593, intitulado "Expanding the Eukaryotic Genetic Code"; WO 2002/085923, intitulado "IN VIVO INCORPORATION OF UNNATURAL AMINO ACIDS;" WO 2004/035605, 79 ΕΡ 1 914 314/ΡΤ intitulado "Glycoprotein synthesis", apresentado em 16 de Janeiro de 2003.
UTILIZAÇÃO DE O-ARNt, Q-RS E PARES Q-ARNt/Q-RS
As composições do invento e as composições preparadas pelos métodos do invento estão opcionalmente numa célula. Os pares O-ARNt/O-RS ou os componentes individuais do invento podem depois ser utilizados na maquinaria de tradução de um sistema hospedeiro, o que resulta na incorporação de uma homoglutamina numa proteína. O pedido de patente "In vivo incorporation of unnatural amino acids", WO 2002/085923 de Schultz, et al., descreve este processo. Por exemplo, quando um par O-ARNt/O-RS é introduzido num hospedeiro, por exemplo, Escherichia coli, o par conduz à incorporação in vivo de uma homoglutamina, que pode ser adicionada exogenamente ao meio de crescimento, numa proteína, por exemplo, mioglobina ou uma proteína terapêutica, em resposta a um codão de selecção, por exemplo, um codão sem sentido âmbar. Opcionalmente, as composições do invento podem estar num sistema de tradução in vitro ou em sistema(s) in vivo. As proteínas contendo a homoglutamina podem ser utilizadas como proteínas terapêuticas e podem ser usadas para facilitar estudos sobre a estrutura das proteínas, as interacções com outras proteínas, os processos de transferência de electrões em proteínas e processos similares.
KITS
Os kits também são uma caracterí st ica do invento. Por exemplo, é proporcionado um kit para produzir uma proteína que compreende pelo menos uma homoglutamina numa célula, em que o kit inclui um recipiente contendo uma sequência polinucleotídica que codifica um O-ARNt e/ou um O-ARNt e/ou uma sequência polinucleotídica que codifica uma O-RS e/ou uma 0-RS. Numa concretização, o kit inclui adicionalmente uma homoglutamina. Noutra concretização, o kit inclui adicionalmente materiais com instruções para produzir a proteína. Qualquer composição, sistema ou dispositivo do invento pode também estar associado a materiais de acondicionamento apropriados (por exemplo, recipientes, etc.) para a produção sob a forma de kit. 80 ΕΡ 1 914 314/ΡΤ
EXEMPLOS
Os exemplos que se seguem são fornecidos para ilustrar, mas não limitar, o invento reivindicado. Um perito reconhecerá uma variedade de parâmetros não críticos, que poderão ser alterados sem um afastamento do âmbito do invento reivindicado.
EXEMPLO 1: PRODUÇÃO DE UM PAR SINTETASE/ARNt ORTOGONAL DERIVADO DO ARNtLYS DE ARQUEOBACTÉRIA
Um par sintetase-ARNt ortogonal foi construído a partir da lisil-ARNt-sintetase de Pyrococcus horikoshii. Utilizando um ARNt supressor do codão âmbar derivado da sequência consenso de um alinhamento multissequências de sequências de ARNtLys de arqueobactéria, observou-se uma supressão de 32% do codão âmbar em ensaios de β-galactosidase. Como tal, este par é um sistema extremamente eficiente para a incorporação selectiva de aminoácidos não naturais numa proteína, em E. coli. A expansão do código genético de um organismo de forma a incluir aminoácidos adicionais além dos vinte habituais requer um mínimo de dois genes novos: uma aminoacil-ARNt-sintetase que activa selectivamente o aminoácido não natural e não transfere o aminoácido para ARNt endógenos e um ARNt ortogonal cognato que aceita o aminoácido não natural e que não é carregado por sintetases endógenas (Furter (1998) Protein Sei., 7:419-426) . Além disso, os ARNt entregam o aminoácido em resposta a um codão não codificante, por exemplo, um codão sem sentido ou de deslocamento do quadro de leitura. Foram identificadas variantes de um par de tirosil-ARNt-sintetase de Methanococcus jannaschii e do ARNt supressor do codão âmbar cognato (Wang et al. (2000) J. Am. Chem. Soc., 122:5010-5011; Wang et al. (2001) Science, 292:498-500) que satisfazem estes critérios, e estas têm sido utilizadas para incorporar de forma eficiente uma variedade de aminoácidos não naturais, incluindo aminoácidos com grupos cetona (Wang et al. (2003) Proc. Natl. Acad. Sei. U.S.A., 100:56-61) e aminoácidos que sofrem fotorreticulação, em proteínas, em E. coli, com elevada fidelidade (Chin et al. (2002) Proc. Natl. Acad. Sei. U.S.A., 81 ΕΡ 1 914 314/ΡΤ 99:11020-11024; Chin & Schultz (2002) ChemBioChem, 3:1135-1137). O alargamento do âmbito e do número de aminoácidos não naturais que podem ser geneticamente codificados utilizará provavelmente novos pares sintetase-ARNt ortogonais e novos codões que os codificam (Magliery et ai. (2001) J. Mol. Biol., 307:755-769; Anderson et al. (2002) Chem. Biol., 9:237-244).
Recentemente, foi adoptada uma nova abordagem para construir um par ortogonal derivado da leucil-ARNt-sintetase de Methanobacterium thermoautotrophicum e dos ARNt supressores dos codões âmbar, opala e com quatro bases ortogonais, cognatos e derivados de Halobacterium sp. NRC-1 (Anderson & Schultz, (2003) Biochemistry, 42(32):9598-608). A concepção destes ARNt supressores a partir da sequência consenso de um alinhamento multissequências dos leucil-ARNt de arqueobactéria proporcionou supressores ortogonais e eficazes do codão opala e do codão de deslocamento do quadro de leitura. Os ARNt supressores ortogonais e robustos possuiam ansas do anticodão CU(X)XXXAA (em que (X)XXX é a sequência complementar inversa do codão) e nenhuma base incorrectamente emparelhada nas regiões de haste. Descrevemos agora a utilização desta estratégia do "supressor consenso" para a concepção racional de um par sintetase-ARNt ortogonal eficaz, derivado das sequências de ARNTLys de arqueobactéria e da lisil-ARNt-sintetase da arqueobactéria Pyrococcus horikoshii.
Este par ARNt/sintetase possui várias características atraentes para a construção de um par supressor ortogonal em E. coli. Um ARNt ortogonal para utilizar em E. coli não deverá reagir de forma cruzada com as aminoacil-ARNt-sintetases de E. coli. Apesar da semelhança entre as sequências de ARNtLys de procariotas e de arqueobactérias, a base discriminatória 73 é A nos procariotas e G nas arqueobactérias (Ibba et al. (1999) Proc. Natl. Acad. Sei. U.S.A., 96:418-423), o que impede que os ARNtLys das arqueobactérias sirvam de substrato para as sintetases de E. coli. De facto, verificou-se que os lisados de células totais de E. coli acilavam fracamente o ARNt da arqueobactéria Halobacterium cutirubrum (Kwok & Wong (1980) Can. J. Biochem., 58:213-218). Para construir ARNt supressores, são permitidas alterações da sequência do anticodão sem afectar negativamente a actividade de aminoacilação. Os estudos sobre o reconhecimento do ARNt pela 82 ΕΡ 1 914 314/ΡΤ lisil-ARNt-sintetase da arqueobactéria Pyrococcus horikoshii (PhKRS) (Terada et al. (2002) Nat. Struct. Biol., 9:257-262) revelaram que o anticodão pode ser alterado sem prejudicar o reconhecimento do ARNt. Assim, é provável que possam ser construídos ARNt supressores para codões como o codão sem sentido âmbar, UAG, a partir destes ARNt. Finalmente, a estrutura cristalina da lisil-ARNt-sintetase de tipo I de arqueobactéria, PhKRS, está disponível (Terada et al. (2002) Nat. Struct. Biol., 9:257-262) para facilitar alterações da especificidade de aminoácidos da aminoacil-ARNt-sintetase.
De forma a determinar se PhKRS é ortogonal em E. coli, foi útil demonstrar que a sintetase não carrega o ARNt de E. coli numa extensão significativa. O gene de PhKRS foi amplificado por PCR a partir de ADN genómico, inserido no plasmídeo pBAD-Myc/HisA (Invitrogen) e super-expresso. A proteína PhKRS resultante foi purificada até à homogeneidade. Os ensaios de aminoacilação foram efectuados no ARNt total de Halobacterium sp. NRC-1 ou de E. coli. As sequências dos ARNtLys de Halobacterium sp. NRC-1 e de Pyrococcus horikoshii são extremamente homólogas (Figura 1). Antecipou-se, assim, que o ARNt halobacteriano seria prontamente carregado por PhKRS. Na verdade, PhKRS carregou uma quantidade de ARNt total halobacteriano 14x superior ao ARNt total de E. coli carregado em 20 minutos (Figura 2; [ARNt] 10 μΜ) . Embora PhKRS seja capaz de carregar fracamente o ARNt de E. coli, a velocidade é 28x inferior à actividade da sintetase de E. coli em relação à mesma concentração de ARNt total de E. coli, e apenas 7x superior à carga de fundo. Além disso, a sintetase
extremamente homóloga de M. mariplaudis conseguiu complementar apenas fracamente um mutante duplo lysS/lysU deficiente na lisil-ARNt-sintetase de E. coli (Ibba et al. (1999) Proc. Natl. Acad. Sei. U.S.A., 96:418-423). Desta forma, PhKRS provavelmente competirá fracamente com as sintetases endógenas de E. coli para carregar os ARNt de E. coli in vivo.
Para caracterizar adicionalmente a ortogonalidade de PhKRS, procurámos inserir o gene PhKRS no vector de expressão constitutiva, pKQ. Este plasmídeo contém o local de ligação dos ribossomas, um local de clonagem múltipla e um terminador rrnB do plasmídeo pBAD-Myc/HisA (Invitrogen) sob controlo do promotor constitutivo da glutamina. O plasmídeo também contém 83 ΕΡ 1 914 314/ΡΤ uma origem de replicação ColEl e uma marca de selecção de resistência a canamicina para manutenção do plasmideo. Infelizmente, o gene PhKRS de tipo selvagem pareceu ser tóxico quando foi expresso constitutivamente. Contudo, foi identificado um mutante E444G inesperado (plasmideo pKQ-PhE444G) que apresentou uma toxicidade reduzida quando foi expresso em E. coli. 0 mecanismo pelo qual a mutação E444G alivia a toxicidade aparente neste sistema não foi estabelecido. Uma possibilidade é o facto de a mutação evitar a carga incorrecta, cruzada e de baixo nível do ARNt de E. coli observada in vitro. 0 passo seguinte envolveu a construção de um ARNt supressor do codão sem sentido que podia ser carregado por
PhKRS. Os fracos determinantes de ligação do anticodão observados para PhKRS sugerem que a enzima devia aceitar ARNt com uma variedade de sequências anticodão (Terada et al. (2002) Nat. Struct. Biol., 9:257-262). Como a supressão do codão âmbar é a forma mais bem caracterizada e mais eficaz de supressão em E. coli (Anderson et al. (2002) Chem. Biol., 9:237-244), construímos um ARNt supressor do codão âmbar ortogonal e de arqueobactéria, AKCua/· a partir da sequência consenso (Anderson & Schultz (2003) Biochemistry, 42(32):9598-608). Um alinhamento multissequências de todas as sequências de ARNtLys de arqueobactéria provenientes de sequências genómicas disponíveis foi efectuado utilizando o programa Pileup de GCG (Figura 1). A sequência consenso dos ARNt alinhados foi determinada, tendo sido gerada uma representação em folha de trevo (Figura 3). A sequência foi depois inspeccionada quanto a pares de bases não canónicos ou emparelhamentos incorrectos de bases nas regiões de haste, que se verificou reduzirem a eficácia do supressor (Hou et al. (1992) Biochemistry, 31:4157-4160). Nenhum destes pares incorrectos estava presente na sequência consenso de ARNtLys. A ansa do anticodão foi depois modificada para CUCUAAA, uma vez que se constatou que esta sequência era óptima para a supressão do codão âmbar (Yarus et al. (1986) J. Mol. Biol., 192:235-255). A sequência de ARNt concebida foi construída através da extensão com sobreposição de oligonucleótidos sintéticos (Genosys) e introduzida entre os locais de restrição EcoRI e PstI do plasmideo pACGFP (Magliery et al. (2001) J. Mol. Biol., 307:755-769), sob o controlo do promotor 84 ΕΡ 1 914 314/ΡΤ lpp constitutivo forte. 0 plasmídeo resultante, pAC-AKCUA, também contém a origem de replicação pl5A e uma marca de selecção de resistência ao cloranfenicol.
Para examinar a eficácia de supressão deste potencial par sintetase-ARNt ortogonal, células GeneHogs de E. coli (Invitrogen) foram co-transformadas com pKQ-PhE444G, pAC-AKCuA e um plasmídeo repórter lacZ pLASC-lacZ(TAG) (Anderson &
Schultz (2003) Biochemistry, 42(32):9598-608). Este plasmídeo, derivado de pSClOl, contém uma marca de selecção de resistência à ampicilina e o gene lacZ que codifica a β-galactosidase, sob o controlo do promotor lpp. Existe um codão âmbar num local permissivo, resíduo 25, do gene lacZ, que causa uma terminação prematura. Na ausência de um ARNt supressor do codão âmbar, as células que albergam o plasmídeo pLASC-lacZ(TAG) apresentam apenas 0,17% da actividade de β-gatactosidase observada para o plasmídeo pLASC-lacZ(Lys), que contém um codão com sentido AAA (lisina) na posição 25, e somente uma actividade 2x superior às células que não contêm quaisquer plasmídeos. Se AKCua for incapaz de ser carregado pelas sintetases endógenas de E. coli, deverá observar-se pouca supressão do codão âmbar quando o ARNt for co-expresso com o plasmídeo pLASC-lacZ(TAG). Observou-se apenas uma supressão de 1,7% (em relação à expressão de lacZ(lys)) para as células que albergam pAC-AKGuA e pLASC-lacZ (TAG) . Se PhKRS for capaz de carregar o ARNt ortogonal, então deverá observar-se um nível mais elevado de supressão do codão âmbar quando o plasmídeo pKQ-PhE444G for introduzido no sistema. De facto, observou-se uma supressão de 32%. Em comparação, o par ortogonal tirosil-sintetase-ARNt derivado de M. jannaschii, previamente descrito para E. coli, apresentou uma eficácia de supressão de 18,5% na presença da sintetase cognata e uma supressão de 0,2% na ausência da sintetase. O par ortogonal leucina-codão âmbar derivado de M. thermoautotrophicum proporcionou uma supressão de 33,2% e de 1,5% com e sem a sintetase cognata, respectivamente (Anderson & Schultz, (2003) Biochemistry, 42(32):9598-608).
Neste exemplo, identificámos a lisil-ARNt-sintetase de tipo I e um ARNt supressor do codão âmbar, derivado do alinhamento multissequências das sequências de ARNtLys de arqueobactéria, como um par sintetase-ARNt ortogonal destinado 85 ΕΡ 1 914 314/ΡΤ à incorporação, em locais específicos, de aminoácidos não naturais, em E. coli. A eficiência elevada (supressão de 32%) observada para o par PhKRS/AKCUA demonstrou a eficácia da estratégia da sequência consenso para a construção de ARNt supressores ortogonais eficazes.
EXEMPLO 2: SUPRESSÃO DO DESLOCAMENTO DO QUADRO DE LEITURA COM UM AMINOÁCIDO NÃO NATURAL, ELIMINANDO A TOXICIDADE DE PHKRS
Um par ARNt-sintetase ortogonal derivado da lisil-ARNt-sintetase de tipo I de Pyrococcus horikoshii foi desenvolvido para utilização em E. coli. A porção ARNt do sistema funcionou muito bem como um supressor ortogonal do codão âmbar. O plasmídeo de expressão da sintetase pKQ-PhE444G foi capaz de carregar este ARNt, embora ainda se tenham observado efeitos de toxicidade. Quando foram expressas isoladamente, as células que albergam o plasmídeo pKQ-PhE444G cresceram até 56% da densidade observada para as células que não continham qualquer plasmídeo. Os plasmídeos repórter pAC-AKCuA e pAC-AKCuA apresentaram também uma toxicidade moderada, crescendo até 71% e 52%. Quando o plasmídeo pKQ-PhE444G foi co-transformado com o plasmídeo pAC-AKGuA, a densidade celular sofreu uma diminuição para 17%. Além disso, as células atingiram uma densidade de apenas 5% quando foram co-expressas com o plasmídeo repórter da β-lactamase pAC-AKGuA (um derivado do plasmídeo pACKO-A184TAG). Assim, é evidente que há toxicidade com ambas as espécies ARNt e sintetase neste sistema. Adicionalmente, parece haver um efeito sinérgico, em que as células co-transformadas com ambos os plasmídeos são drasticamente reduzidas em termos de viabilidade. Para abordar esta questão, procurámos um mutante menos tóxico de PhKRS.
Antecipou-se que as mutações pontuais ou de outro tipo em PhKRS talvez reduzissem a toxicidade da sintetase, ao mesmo tempo que conservariam a sua actividade de carga. Assim, pKQ-PhE444G foi transformado em células XLl-Red quimicamente competentes (Stratagene) , e as células foram plaqueadas em placas de LB-gelose contendo canamicina 25 μρ/ιηΐ. Esta estirpe possui várias mutações genómicas que originam uma taxa elevada de mutagénese nos plasmídeos transformados. Aproximadamente 100 colónias foram raspadas desta placa e amplificadas em 25 ml de meio líquido LB suplementado com canamicina. 86 ΕΡ 1 914 314/ΡΤ
Antecipou-se que os mutantes não tóxicos de pKQ-PhE444G cresceriam mais rapidamente que o tipo selvagem, e a cultura em série das células conduziria à acumulação destes mutantes. Após 2 culturas em série com uma diluição de 1:10 000 em cada passo, as células foram sujeitas a miniprep, introduzidas em células Genehog contendo o plasmídeo pAC-AKGuA e plaqueadas em placas de LB-gelose contendo uma concentração de 25 μg/ml de cada um dos antibióticos canamicina e cloranfenicol e várias concentrações de ampicilina. Mais de 90% das células transformadas não apresentaram qualquer toxicidade aparente e foram capazes de sobreviver em placas de LB-gelose contendo ampicilina 100 μg/ml. Observaram-se colónias mais pequenas mesmo a uma concentração de ampicilina de 1500 μρ/πιΐ, indicando uma supressão eficiente do codão âmbar. Uma sintetase mutante, designada por pKQ-PhKep, foi isolada e caracterizada através do mapeamento de restrição e da sequenciação do quadro de leitura aberta de PhKRS. O gene mutante contém uma inserção de 778 pb após o resíduo S357, mas caso contrário é a mesma sequência que o plasmídeo pKQ-
PhE444G. Uma procura BLAST revelou que esta inserção é homóloga de uma sequência identificada como "insAcpl" proveniente do plasmídeo pl658/97, mas não foi encontrada qualquer outra referência a esta sequência na literatura e a sua origem é desconhecida. Quando foi traduzido a partir do codão de iniciação de PhKRS, o produto previsto deste gene apresentou-se truncado 6 aminoácidos a jusante de S357. De forma a testar se o truncamento de PhKRS foi responsável pela eliminação da toxicidade, sintetizou-se o iniciador CA510R com a sequência 5'-CAGTGGAATTCAGTAAGTTGGCAGCATCAC-3' para construir explicitamente o mutante truncado no plasmídeo pKQ. O plasmídeo pKQ-PhKep foi amplificado por PCR com CA279 e CA510R, e o produto foi subclonado nos locais NcoI e EJcoRI do plasmídeo pKQ. O plasmídeo resultante, pKQ-PhAAD (também conhecido como pKQ-Ph510), foi co-transformado com o plasmídeo pAC-AKcuA/· e constatou-se que as transformações resultantes possuíam uma CI50 similar às células transformadas com pKQ-PhKep e nenhuma toxicidade aparente. O truncamento após o resíduo S357 parece eliminar o domínio de ligação ao anticodão de PhKRS, e nós queríamos examinar a forma como esta deleção afecta as propriedades de reconhecimento do ARNt da sintetase. Desta forma, procedemos à 87 ΕΡ 1 914 314/ΡΤ
sobre-expressão da sintetase para realizar ensaios de aminoacilação in vitro. 0 gene foi amplificado por PCR a partir de pKQ-PhKep, com CA279 e CA511 (5'-CATTGGAATT CGAGTAAGTTGGCAGCATCAC-3') , e subclonado nos locais IVcol e EcoRI de pBAD-Myc/HisA, em fase com a marca Myc/His C-terminal. A proteína foi purificada por cromatografia de Ni-NTA.
EXEMPLO 3: EXPANSÃO DO CÓDIGO GENÉTICO COM CODÕES COM QUATRO BASES E COM AMINOÁCIDOS NÃO NATURAIS
Embora, com poucas excepções, os códigos genéticos de todos os organismos conhecidos codifiquem os mesmos vinte aminoácidos, tudo o que é necessário para adicionar um novo bloco de construção é um par ARNt/aminoacil-ARNt-sintetase invulgar, uma fonte do aminoácido e um codão invulgar que especifique o aminoácido (Wang et al. (2001) Expanding the genetic code. Science 292:498-500). Anteriormente, demonstrámos que o codão sem sentido âmbar, TAG, juntamente com pares ARNt/sintetase ortogonais de M. jannaschii e de E. coli podem ser utilizados para codificar geneticamente uma variedade de aminoácidos com novas propriedades, em E. coli (Wang et al. (2003) Addition of the keto functional group to the genetic code of Escherichia coli. Proc. Natl. Acad. Sei. U.S.A. 100:56-61; Santoro et al. (2002) An efficient system for the evolution of aminoacyl-tRNA synthetase specificity. Nat. Biotechnol. 20:1044-8; Chin et al. (2002) Addition of a photocrosslinking amino acid to the genetic code of Escherichia coli. Proc. Natl. Acad. Sei. U.S.A. 99:11020-11024; Mehl et al. (2003) Generation of a bacterium with a 21 amino acid genetic code. J. Am. Chem. Soc. 125:935-9) e em levedura (Chin et al. (2003) An expanded eukaryotic genetic code. Science 301:964-7), respectivamente. O número limitado de codões tripleto não codificantes, contudo, restringe fortemente o número final de aminoácidos codificados por qualquer organismo. Aqui, descrevemos a geração de um novo par sintetase/ARNt ortogonal, derivado de sequências de ARNtLys de arqueobactéria, que incorpora eficaz e selectivamente o aminoácido homoglutamina (hGln) na mioglobina, em resposta a um codão com quatro bases, AGGA. A supressão do deslocamento do quadro de leitura com hGln não afecta significativamente os rendimentos da proteína ou as taxas de crescimento celular, 88 ΕΡ 1 914 314/ΡΤ tendo-se demonstrado ser mutuamente ortogonal com a supressão de TAG. Este trabalho sugere gue nem o número de codões tripleto disponíveis, nem a maquinaria de tradução em si representam uma barreira significativa a uma expansão adicional do código. Há muitos exemplos de supressores naturais de deslocamentos +1 do quadro de leitura, incluindo os supressores derivados de Su7 dos codões UAGN (N = A, G, C ou T) que codificam a glutamina (Curran & Yarus (1987) Reading frame selection and transfer RNA anticodon loop stacking. Science 238:1545-50), os supressores derivados de sufJ dos codões ACCN que codificam a treonina (Bossi & Roth (1981) Four-base codons ACCA, ACCU and ACCC are recognized by frameshift suppressor sufJ. Cell 25:489-96) e os supressores dos codões CAAA derivados de ARNtLys e ARNtGln (0'Connor (2002) Insertions in the anticodon loop of tRNA(l) (Gin) (sufG) and tRNA(Lys) promote quadruplet decoding of CAAA. Nucleic Acids Res. 30:1985-1990). Adicionalmente, as selecções genéticas têm sido utilizadas para identificar ARNt supressores de codões com quatro e cinco bases, que sejam eficazes, a partir de grandes bibliotecas de ARNt mutantes, incluindo um supressor ARNtSeruccu de E. coli (Magliery et al. (2001) "Expanding the genetic code: selection of efficient suppressors of four-base codons and Identification of "shifty" four-base codons with a library approach in Escherichia coli". J. Mol. Biol. 307:755-769; Anderson et al. (2002) Exploring the limits of codon and anticodon size. Chem. Biol. 9:237-244; Hohsaka et al. (1999) Incorporation of two nonnatural amino acids into proteins through extension of the genetic code. Nucleic Acids Symp. Ser. 42:79-80; Hohsaka et al. (2001) Five-base codons for incorporation of nonnatural amino acids into proteins. Nucleic Acids Res. 29:3646-51; Hohsaka & Sisido (2002) Incorporation of non-natural amino acids into proteins. Curr. Opin. Chem. Biol. 6:809-15) .
De forma a codificar aminoácidos não naturais com codões quadrupleto in vivo, é necessário criar um ARNt que reconheça de forma única este codão e uma sintetase correspondente que efectue a aminoacilação apenas deste ARNt com o aminoácido não natural de interesse. Como a ansa do anticodão do ARNt supressor do codão âmbar ortogonal, derivado de M. jannaschii 89 ΕΡ 1 914 314/ΡΤ e previamente gerado é um elemento de reconhecimento chave para a sintetase cognata, JYRS, foi difícil manipular este ARNt para descodificar um codão com quatro bases. Embora possa ser possível relaxar a especificidade de ligação do anticodão de JYRS, provavelmente seria difícil construir pares mutuamente ortogonais que distinguissem entre supressores do codão âmbar e supressores de codões com quatro bases utilizando exclusivamente a sequência do anticodão. Assim, um sistema que permitisse a incorporação simultânea de dois aminoácidos não naturais num polipéptido seria obtido com maior probabilidade utilizando dois pares ortogonais de origem distinta, o que requer o desenvolvimento de um novo par ARNt-sintetase ortogonal.
Inicialmente, centrámos a atenção no par lisil-sintetase/ARNt da arqueobactéria Pyrococcus horikoshii (PhKRS) como um possível candidato a par ortogonal pois 1) este par é provavelmente ortogonal devido à conservação de A73 nos procariotas e de G73 nas arqueobactérias (Ibba et al. (1999) Substrate recognition by class I lysyl-tRNA synthetases: a molecular basis for gene displacement. Proc. Natl. Acad. Sei. U.S.A. 96:418-423); 2) PhKRS tolera substituições na ansa do anticodão do ARNt, o que permite a carga dos ARNt supressores (Terada et al. (2002) Functional convergence of two lysyl-tRNA synthetases with unrelated topologies. Nat. Struct. Biol. 9:257-262); e 3) a estrutura cristalina de PhKRS está disponível (Terada et al. (2002) Functional convergence of two lysyl-tRNA synthetases with unrelated topologies. Nat. Struct. Biol. 9:257-262) para facilitar alterações da especificidade dos aminoácidos. Infelizmente, verificámos que PhKRS é tóxica para as células de E. coli quando é expressa constitutivamente. Contudo, a cultura em série na estirpe mutante XLl-Red conduziu ao isolamento de uma variante não tóxica, PhAAD, que está truncada 6 aminoácidos a jusante do resíduo S357, devido a um elemento de inserção de 778 pb identificado como insAcpl. Como tal, o domínio de ligação à ansa do anticodão foi eliminado, minimizando adicionalmente qualquer perda de actividade que pudesse resultar de uma substituição na ansa do anticodão.
Como referido no Exemplo 1 em maior detalhe, para determinar se este mutante truncado é funcional e ortogonal em 90 ΕΡ 1 914 314/ΡΤ Ε. coli, foi útil demonstrar que a sintetase não consegue carregar o ARNt de E. coli numa proporção significativa, mas conserva a actividade para o ARNt cognato de arqueobactéria. Os genes para PhAAD e EcKRS foram clonados e super-expressos, e a proteína foi purificada até à homogeneidade. A aminoacilação do ARNt total de uma arqueobactéria,
Halobacterium sp. NRC-1, ou de E. coli foi analisada. PhAAD carregou uma quantidade maior do ARNt total halobacteriano que do ARNt total de E. coli em 20 minutos (Figura 2; [ARNt] 10 μΜ). Embora PhAAD seja capaz de carregar fracamente o ARNt de E. coli, a velocidade foi 28x inferior à actividade da sintetase de E. coli em relação à mesma concentração de ARNt total de E. coli, e apenas 7x superior à carga de fundo. Além disso, PhAAD foi incapaz de complementar o crescimento a 43°C da estirpe PALASAUTR(pMAKlysU) (Chen et al. (1994) Properties of the lysyl-tRNA synthetase gene and product from the extreme thermophile Thermus thermophilus. J. Bacteriol. 176:2699-705), um mutante duplo lysS/lysU deficiente na lisil-ARNt-sintetase de E. coli. Contudo, EcKRS (clonado a partir do locus lysU da estirpe de E. coli HB101) permitiu um crescimento normal. Assim, PhAAD é incapaz de substituir EcKRS e provavelmente competiria fracamente com as sintetases endógenas de E. coli para carregar os ARNt de E. coli in vivo.
Para demonstrar que PhAAD é funcional em E. coli, utilizámos um ensaio de supressão com β-lactamase, recorrendo a um ARNt supressor do codão âmbar ortogonal para PhAAD. Esta abordagem também permitiu utilizar os esquemas de selecção previamente desenvolvidos para o par ortogonal de M. jannaschii. Concebeu-se um ARNt cua supressor (AKcua) utilizando uma estratégia consenso-supressor recentemente descrita (Anderson & Schultz, P. G. (2003) Adaptation of an Orthogonal Archaeal Leucyl-tRNA and Synthetase Pair for Four-base, Amber, and Opal Suppression. Biochemistry 42:9598-608). Efectuou-se um alinhamento multissequências de todas as sequências de ARNtLys de arqueobactéria provenientes de sequências genómicas disponíveis e determinou-se uma sequência consenso. A sequência da ansa do anticodão foi alterada para CUCUAAA para proporcionar um ARNt supressor do codão âmbar (Figura 1). O gene de AKCua foi sintetizado e introduzido no plasmídeo pACKO-A184TAG (Anderson & Schultz, P.G. (2003) Adaptation of an Orthogonal Archaeal Leucyl-tRNA and 91 ΕΡ 1 914 314/ΡΤ
Synthetase Pair for Four-base, Amber, and Opal Suppression. Biochemistry 42:9598-608) para analisar a eficácia da supressão do codão âmbar. Este plasmideo contém um gene da β-lactamase (bla) com um codão TAG no local permissivo A184. Sem ARNt, a tradução não proporciona qualquer β-lactamase completa observável e há sensibilidade a uma concentração de ampicilina de 5 μρ/ιηΐ. Quando foi expresso com AKCua, não se observou qualquer aumento da resistência à ampicilina, indicando que o ARNt não foi carregado pelas sintetases de E. coli. Quando foi co-expresso juntamente com PhAAD, o ARNt ortogonal foi carregado, conduzindo a uma supressão eficiente do codão âmbar e a uma resistência a uma concentração de ampicilina de 1000 μρ/ιηΐ. O par ortogonal PhAAD/AKCua é, assim, um sistema ortogonal e eficaz de supressão do codão âmbar.
Anteriormente, foi demonstrado que o codão com quatro bases AGGA pode ser suprimido eficientemente por um ARNtSeruccu de E. coli. Neste caso, a supressão do codão com quatro bases está a competir com o codão raro AGG, o que poderá contribuir para a eficácia e a falta de toxicidade do ARNt supressor. Um ARNt supressor de AGGA foi concebido a partir de AKCua, alterando a ansa do anticodão para CUUCCUAA, e foi introduzido no plasmideo pACKO-A184AGGA. Como pACKO-A184TAG, este plasmideo contém um codão AGGA na posição A184, resultando numa tradução abortada e em resistência a uma concentração de ampicilina de apenas 5 μρ/ιηΐ. Infelizmente, este ARNt já não é ortogonal em relação às sintetases de E. coli. As células que contêm o ARNt designado sobrevivem até uma concentração de ampicilina 200 μρ/ιηΐ, tanto na ausência como na presença de PhAAD.
De forma a identificar variantes ortogonais, construímos uma biblioteca em que os últimos quatro pares de bases da haste aceitadora, posições 1-4 e 69-72, foram simultaneamente aleatorizados (Anderson & Schultz, P. G. (2003) Adaptation of an Orthogonal Archaeal Leucyl-tRNA and Synthetase Pair for Four-base, Amber, and Opal Suppression. Biochemistry 42:9598— 608) . Estes ARNt foram co-expressos com PhAAD, e as células foram sujeitas a dois ciclos de selecção em ampicilina 200 μρ/ιηΐ, resultando num conjunto de ARNt supressores de AGGA activos. Para identificar as variantes ortogonais, isolaram-se plasmídeos com o ARNt, e 384 clones individuais foram 92 ΕΡ 1 914 314/ΡΤ rastreados em relação à sensibilidade a ampicilina na ausência de PhAAD. Destes, o clone mais eficaz e ortogonal é resistente a uma concentração de ampicilina de 700 μρ/ιηΐ na presença de PhAAD, mas sobrevive apenas a 5 μρ/ιηΐ na sua ausência. Este ARNt, AKuccuf contém múltiplas substituições na haste aceitadora e uma mutação A37C inesperada de importância desconhecida (Figura 5).
Para incorporar a homoglutamina em resposta a AGGA, foi, em seguida, útil alterar a especificidade de PhAAD. A homoglutamina foi escolhida como alvo inicial para testar a fidelidade de uma sintetase modificada, uma vez que é semelhante à lisina em termos de tamanho e possui ambas as propriedades de doação e aceitação de ligações de hidrogénio. Ao examinar a estrutura cristalina de PhKRS, apenas dois resíduos reconhecem especificamente o grupo ε-amino da lisina, E41 e Y268. Eles foram simultaneamente aleatorizados através de mutagénese de saturação, na construção de uma pequena biblioteca de locais activos derivada de PhAAD. Para efectuar o rastreio de sintetases específicas para hGln, utilizámos um plasmídeo repórter GFP, pREP2-AKCuA (Santoro et al. (2002) An em efficient system for the evolution of aminoacyl-tRNA synthetase specificity. Nat. Biotechnol. 20:1044-8), que codifica o gene de AKCua»· um gene da ARN-polimerase de T7 com dois codões TAG nas posições Ml e Q107, e GFPUV sob o controlo de um promotor T7. Quando co-transformado com pREP2-AKCUA e PhAAD, os codões âmbar em T7RNAP são suprimidos, resultando na expressão de GFPUV e em fluorescência verde. Na ausência da sintetase, as células são brancas. Como tal, as células que albergam sintetases activas podem ser identificadas através da observação de fluorescência. As células foram co-transformadas com pREP2-AKCuA, e a biblioteca foi depois espalhada em placas contendo hGln. As colónias verdes individuais foram isoladas e crescidas com e sem o aminoácido não natural, de forma a identificar os clones cuja fluorescência necessitou de hGln. Das 15 colónias rastreadas, 5 apresentaram uma fluorescência mais elevada nas placas contendo hGln. Destas, todas menos uma conservaram uma substituição Y268S; a mais selectiva destas sintetases, hGlnRS, possui 141 e S268 e foi adicionalmente caracterizada. Os 5 mutantes correspondentes às 5 colónias apresentaram as seguintes alterações de sequência comparação com PhAAD: 93 ΕΡ 1 914 314/ΡΤ 93 ΕΡ 1 914 314/ΡΤ Clone Y268(codao) E41(codão)
Clone 2
Clone 3
Clone 4
Clone 5
Clone 6
Ser(TCT) Val(GTT) Ser(TCG) Thr(ACG) Ser(AGT) Ser(AGT) Ser(TCG) Ile(ATT) Gly(GGT) Pro(CCG) A proteína mioglobina com uma mutação Gly24 ->· AGGA foi depois expressa utilizando o par hGlnRS/AKTCcT ortogonal, para determinar se o fenótipo dependente de hGln observado resultou da incorporação específica do aminoácido não natural. Ao dar-se a expressão do gene da mioglobina mutante na ausência de hGlnRS, não foi produzida proteína detectável. Quando co-expresso juntamente com hGlnRS, isolou-se mioglobina numa concentração de 1,8 mg/ml. Em comparação, obteve-se uma concentração de mioglobina de 3,8 mg/ml com a expressão do plasmídeo pBAD-JYAM, que contém o gene da mioglobina de tipo selvagem. A análise MALDI-TOF dos fragmentos triptícos da proteína purificada revelou um péptido de massa 1676,85 Da, consistente com a massa prevista de 1676,88 Da. Não foi observada qualquer evidência de péptidos contendo lisina ou glutamina na posição 24. Além disso, observámos pouca toxicidade durante a incorporação de hGln em resposta a AGGA. Durante o crescimento a meio da fase logarítmica, nas condições utilizadas para a expressão da mioglobina sem indução pela arabinose, o tempo de duplicação para as células GeneHogs foi o dobro do tempo das células que incorporam hGln. Esta redução da taxa de crescimento foi observada tanto na presença como na ausência de hGln, indicando que a toxicidade ligeira é o resultado da expressão da sintetase e do ARNt, e não da supressão de AGGA. Assim, a reactividade cruzada do supressor de AGGA com os codões AGG raros não limita a aplicação prática da supressão do deslocamento do quadro de leitura. A expressão da mioglobina através de supressão de AGGA para incorporar um resíduo de hGln está demonstrada na Figura 7A. Esta figura proporciona uma transferência de Western pesquisada com um anticorpo anti-His C-terminal. A proteína foi produzida a partir do gene da mioglobina com um codão AGGA na posição G24 (Myo24AGGA) apenas na presença da 94 ΕΡ 1 914 314/ΡΤ totalidade dos três componentes: ARNt AK514, hGlnRS (uma variante específica para hGln de PhKRSA) e hGln (colunas 2-5). A expressão da mioglobina por supressão do codão âmbar na posição 75 (Myo75TAG) só foi possível com JYRS e o seu ARNt âmbar cognato, demonstrando a ortogonalidade mútua dos pares lisilo e tirosilo (colunas 6-9).
Também investigámos a possibilidade de utilizar o par PhAAD/AKuccu em combinação com a tirosina-sintetase de M. jannaschii (JYRS) para a supressão simultânea de TAG e AGGA num único polipéptido. Quando co-expresso juntamente com JYRS no plasmídeo pBK-JYRS, pMyo-AKuccu não proporcionou qualquer mioglobina detectável. Assim, JYRS é incapaz de carregar AKuccu· Reciprocamente, procurámos expressar a mioglobina a partir do plasmídeo pBAD/JYAMB-4TAG através de carregamento com PhAAD. Este plasmídeo de expressão contém o gene da mioglobina com um codão TAG na posição 4 e um ARNtTyr ortogonal, J17 (Mehl et al. (2003) Generation of a bacterium with a 21 amino acid genetic code. J. Am. Chem. Soc. 125:935-9). A co-expressão com JYRS proporcionou mioglobina numa concentração de 3,8 mg/ml, mas não se observou qualquer proteína com PhAAD. Desta forma, PhAAD é incapaz de carregar J17. Como tal, estes pares sintetase/ARNt são mutuamente ortogonais e poderiam ser utilizados em combinação sem reacções cruzadas.
Para a incorporação de dois aminoácidos não naturais na mioglobina, AKuccu e J17 foram combinados num único plasmídeo que expressa uma mioglobina mutante com Gly24 -► AGGA e Ala75^TAG. Uma sintetase específica para a O-metil-L-tirosina (OMeYRS) (Chin et al. (2002) Addition of a photocrosslinking amino acid to the genetic code of Escherichia coli. Proc. Natl. Acad. Scl. U.S.A. 99:11020-11024), derivada de JYRS, e hGlnRS foram combinadas num segundo plasmídeo. Quando as células co-transformadas com ambos os plasmídeos foram crescidas na presença de ambos os aminoácidos, produziu-se uma concentração de mioglobina de 1,7 mg/1. Não foi produzida qualquer proteína quando qualquer um dos dois aminoácidos não naturais ou qualquer uma das duas sintetases foram excluídos. A utilização simultânea de dois sistemas de ARNt ortogonais para incorporar dois aminoácidos não naturais 95 ΕΡ 1 914 314/ΡΤ diferentes, utilizando ο sistema da mioglobina como modelo, está demonstrada na Figura 7B. Esta figura proporciona uma transferência de Western pesquisada com um anticorpo anti-His C-terminal. A proteína foi expressa a partir de um gene da mioglobina contendo um codão AGGA na posição 24 e um codão TAG na posição 75 (Myo24AGGA/75TAG), na presença de ambos os pares ortogonais lisilo e tirosilo. A hGln foi incorporada por supressão de AGGA na posição 24 e a O-metil-tirosina (OMeTyr) foi incorporada por supressão do codão âmbar na posição 75 num único polipéptido, utilizando hGlnRS e OMeTyrRS. Como ilustrado na figura, só é produzido um polipéptido quando ambos os aminoácidos não naturais estão presentes e, adicionalmente, quando ambos os sistemas ortogonais lisilo e tirosilo estão presentes.
Os resultados observados nas transferências de Western das Figuras 7A e 7B são adicionalmente confirmados nas análises fornecidas nas Figuras 8 e 9. A Figura 8 proporciona uma análise do tempo de voo de ionização/dessorção por laser assistida pela matriz dos fragmentos trípticos da mioglobina de tipo selvagem (MyoWT; presumivelmente contendo lisina na posição 24) e de uma mioglobina mutante (24AGGA; presumivelmente contendo hGln) tal como produzida na
Figura 7A. As análises destas espécies de mioglobina estão apresentadas nos painéis superior e inferior, respectivamente. A análise revelou fragmentos peptídicos trípticos da proteína purificada e revelou um péptido de massa 1 676,85 Da, consistente com a massa prevista de 1 676, 88 Da. Não foi observada qualquer evidência de péptidos contendo lisina (massa observada de 950,46 Da, a partir da proteína expressa com PhKRSA, para o péptido clivado com tripsina e massa calculada de 950,53; ou 1.661,91 Da para o péptido completo) ou glutamina na posição 24 (massa calculada igual a 1 661,87 Da). A Figura 9 proporciona uma análise de espectrometria de massa (EM) de electropulverização da proteína completa mutante dupla (produzida na Figura 7B) . A análise de EM revelou uma massa de 18 546, 40 Da (DP 0,11), consistente com a massa prevista de 18 546,60 (DP 0,81) para a mioglobina contendo ambos os aminoácidos não naturais, em comparação com a massa calculada de 18 518,3 Da para a mioglobina com as substituições G24K e A75Y. 96 ΕΡ 1 914 314/ΡΤ
Em resumo, demonstrámos a utilização da supressão do deslocamento do quadro de leitura para a incorporação em locais específicos de um aminoácido não natural in vivo. Além disso, demonstrámos a ortogonalidade mútua desta lisil-ARNt-sintetase derivada de P. horikoshii e de um par ortogonal derivado da tirosil-ARNt-sintetase de M. jannaschii e mostrámos que é possível incorporar simultaneamente dois aminoácidos não naturais num único polipéptido. Deverá ser possível identificar variantes de sintetases que permitam a incorporação de asas reactivas mutuamente ortogonais, ou mesmo de aminoácidos fluoróforos. Com estes materiais, é possível incorporar um par fluoróforo num polipéptido para estudos FRET in vivo. De forma similar, é possível incorporar grupos diferentes de aminoácidos, tais como α-hidroxiácidos, para a produção ribossómica de polímeros não naturais. Codões adicionais como CCCU ou CUAG, os quais são eficientemente suprimidos em E. coli, podem ser utilizados. Em alternativa, o genoma de E. coli poderia ser novamente sintetizado com uma degenerescência limitada dos codões, constituindo, desta forma, 43 codões disponíveis para a nova codificação.
MATERIAIS E MÉTODOS
Clonagem e expressão dos genes de sintetases. 0 ADN genómico foi preparado a partir de P. horikoshii obtido de American Type Culture Collection (ATCC; #700860). PhKRS foi amplificado por PCR e clonado nos locais IVcol e EcoRI do plasmídeo pBAD/Myc-HisA (Invitrogen) para super-expressão. Para a expressão constitutiva, os genes das sintetases foram clonados em pGLN e pKQ (Anderson & Schultz (2003) Adaptation of an Orthogonal Archaeal Leucyl-tRNA and Synthetase Pair for Four-base, Amber, and Opal Suppression. Biochemistry 42:9598-608) sob o controlo do promotor da glutamina. Estes plasmídeos derivados de pBAD/Myc-HisA conferem resistência a ampicilina e a canamicina, respectivamente. De forma idêntica, EcKRS foi clonado a partir do locus lysU da estirpe de E. coli HB101. A proteína foi super-expressa em meio 2YT pelo protocolo descrito para o conjunto QIAexpressionist de Qiagen e depois foi dialisada contra Tris-HCl 100 mM, pH 7,5; NaCl 100 mM e glicerol a 10%. 97 ΕΡ 1 914 314/ΡΤ
Ensaios de aminoacilação in vitro. 0 ARNt total de E. coli foi adquirido de Roche e o ARNt halobacteriano foi extraído de culturas de Halobacterium sp. NRC-1 (ATCC; #700922) com o conjunto de extracção de ARN/ADN /Qiagen). Os ensaios foram efectuados em reacções de 20 μΐ contendo Tris-HC1 50 mM, pH 7,5; KC1 30 mM, MgCl2 20 mM, glutationa 3 mM, BSA 0,1 mg/ml, ATP 10 mM, [3H]-lisina 1 μΜ (Amersham) , sintetase 750 nM e ARNt total 0, 2, 10 ou 40 mM a 37°C durante 20 minutos.
Análise de complementação. Células PALASAUTR(pMAKlysU) foram transformadas com derivados de pGLN para a expressão de PhAAD, EcKRS ou de nenhuma sintetase e recuperadas em placas de LB-gelose contendo ampicilina 50 μg/ml, a 30°C. A complementação a 43°C do defeito de crescimento da estirpe PALASAUTR deficiente em sintetases foi efectuada em placas de LB-gelose ou em meio líquido sem antibióticos. O crescimento em GeneHogs foi utilizado como controlo positivo para eliminar a possibilidade de efeitos tóxicos provenientes da expressão da sintetase. No caso dos meios líquidos, as culturas saturadas foram diluídas 1:10.000 em meio fresco, e o crescimento foi monitorizado a 600 nm durante 8 horas.
Construção de bibliotecas. Os genes para os ARNt foram construídos através da extensão com sobreposição de oligonucleótidos sintéticos (Genosys) e subclonados nos locais EcoRI e Pst I de pACKO-A184TAG ou de pACKO-A184AGGA. Estes plasmídeos repórteres derivados de pACYC184 contêm a origem de replicação pl5A, um gene de resistência a cloranfenicol e um promotor constitutivo forte que controla a expressão dos genes dos ARNt. A biblioteca derivada de PhAAD foi construída no plasmídeo pKQ por EIPCR (Stemmer & Morris S.K. (1992) Enzymatic inverse PCR: a restriction site independent, single-fragment method for high-efficiency, site-directed mutagenesis. Biotechniques 13:214-20). Utilizaram-se fosforamiditos previamente misturadas durante a síntese dos oligonucleótidos para a construção da biblioteca. A diversidade da biblioteca foi 900x mais elevada que a diversidade teórica, tendo-se demonstrado que estava isenta de parcialidades de sequência através de sequenciação. 98 ΕΡ 1 914 314/ΡΤ
Determinação da eficácia de supressão. A eficácia de supressão foi determinada através de plaqueamento em meio LB-gelose suplementando com canamicina 25 μρ/πιΐ e cloranfenicol 25 μρ/ιηΐ e várias concentrações de ampicilina compreendidas entre 5 e 1000 μρ/πιΐ. As células foram plaqueadas a densidades inferiores a 100 células por placa. A eficácia foi identificada como sendo a concentração mais elevada à qual as células sobreviveram para formar colónias, entre uma série de placas para as quais as concentrações mais elevada e mais baixa seguintes estariam a 20% do valor referido.
Expressão e caracterização da mioglobina contendo hGln. Para as experiências de incorporação num único local, pMyo-AKuccu foi construído com uma origem de replicação pl5A e genes para a cloranfenicol-acetiltransferase, o AKUCcu e a mioglobina de esperma de baleia. O gene da mioglobina foi colocado sob o controlo do promotor da arabinose e contém um codão AGGA na posição G24. Para a incorporação em dois locais, construiu-se outro plasmídeo através da introdução de um codão TAG na posição A7 4 do gene da mioglobina em pMyo-AKUCcu· O ARNtTyr ortogonal, J17, foi adicionado sob o controlo de um segundo promotor lpp. As sintetases hGlnRS e AzPheRS foram expressas a partir do plasmídeo pKQ sob o controlo dos promotores independentes da glutamina. As células GeneHogs contendo os plasmídeos de expressão adequados das sintetases e da mioglobina foram crescidas a 37°C até uma D060o=0,7, em meio GMML suplementado com os 19 aminoácidos, excepto a lisina, numa concentração de 0,4 mg/ml cada, vitaminas e hGln 1 mg/ml (Sigma), induzidas com arabinose a 0,02% e depois crescidas até à saturação. As células foram lisadas por sujeição a ultra-sons, e a mioglobina foi purificada com o conjunto QIAexpressionist de Qiagen. A análise por espectrometria de massa MALDI dos fragmentos trípticos foi efectuada nas instalações de proteómica de TSRI.
EXEMPLO 4: LISIL-O-RS E LISIL-Q-ARNt EXEMPLIFICATIVOS
Os O-ARNt exemplificativos são encontrados nos exemplos e/ou na Tabela 1. As 0-RS exemplif icativas também são encontradas nos exemplos e/ou na Tabela 1. Os polinucleótidos exemplificativos que codificam as O-RS ou porções destas incluem aqueles encontrados nos exemplos e/ou na Tabela 1. 99 ΕΡ 1 914 314/ΡΤ
Pormenores adicionais do invento, em particular pormenores experimentais, podem ser encontrados em Anderson, John Christopher, "Pathway Engineering of the Expanding Genetic Code," Ph.D. Dissertation, The Scripps Research Institute [2003].
Entende-se que os exemplos e as concretizações aqui descritos têm apenas fins ilustrativos e que, à luz destes, várias modificações ou alterações ocorrerão aos peritos na arte, as quais estão incluídas no espírito e no campo de acção deste pedido e no âmbito das reivindicações anexas.
Embora o invento precedente tenha sido descrito com algum detalhe para efeitos de clareza e compreensão, será evidente para um perito na arte, a partir da leitura desta descrição, que é possível efectuar várias modificações de forma e pormenor. Por exemplo, todas as técnicas e equipamentos descritos acima podem ser utilizados em várias combinações. TABELA 1
SEQ ID: Marca SEQUÊNCIA SEQ ID: 1 Pal5 GGGCCGGUAGCUUAGCCUGGUUAGAGCGGCGOACUCUUAAUC CX3CAGGUCGGGGGUUCAAAUCCCCCCCXjGCCCGCCA SEQ ID: 2 Pf 32 GGGCXXSGUAGCUUAGCCUGGUUAGAGOGGCGGACUCUUAAUC CGCAGGUCGGGGGUUCAAAUCCCCCCCGGCCCGCCA SEQ ID: 3 Ph36 GGGCCGGUAGCUUAGOCUGGUUAGAGCGGCGGACUCUUAAUC CGCAGGUCGGGGGUUCAAAUCCCCCCCGGCCCGCCA SEQ ID: 4 Pa34 GGGCCGGUAGCUCAGCCUGGUCAGAGCACCGGGCUUUUAACC CGGUGGUCGCGGGUTJCAAAUCCCGCCCXjGCCCGCCA SEQ ID: 5 Ph9 GGGCCGGUAGCUCAGCCUGGUCAGAGCACCGGGCUUUUAACC CGGUGGUCGCGGGUUCAAAUCCCGCCCGGCCCGCCA SEQ ID: 6 Pf 4 GGGCCGGUAGCUCAGCCUGGUUAGAGCACCGGGCUUUUAACC CGGUGGUCGCGGGUUCAAAUCCCGCCCGGOCCGCCA SEQ ID: 7 Pya26 GGGCCCGUAGCUCAGCGOGGUUAGAGCGGCGGGCUUtJUAACC CGUAGGUCGUGGGUU CGAAUCCCACCGGGCCCGCCA 100 ΕΡ 1 914 314/ΡΤ
SEQ ID: 8 Tal GGGUCCGEAGCUUAGOJAGGUAGAGCGAUGGACUCUUAAUCC AUAGGUCAGGGGUCCAAAUCCCCUCGGACCCGCCA SEQ ID: 9 Tv4 0 GGGUCCGUAGCUUAGCUAGGUAGAGCGAUGOACUCUUAAUCC AUAGGUCAGGGGUCCAAAUCCCCUCGGACCCGCCA SEQ ID: 10 Af 18 GGGCCGGUAGCUUAGCCAGGCAGAGCGCGGGACUCUUAAUCC CGCAGUCGGGGGUUCAAAUCCCUCCCGGCCCGCCA SEQ ID: 11 Hhl GGGCCGGUAGCUCAGUCUGGCAGAGCGACGGACUCUUAAUCC GUCGGUCGCGUGUUCAAAUCGCGCCCGGCCCGCCA SEQ ID: 12 Ta5 GGGCCCGUAGCUCAGCCAGGUAGAGCAUCUGGCUUUUAACCA GGUGGUCAGOGGUUCGAACCCCCXJCGGGCCCGCCA SEQ ID: 13 Tv2 4 GGGCCCGUAGCTCAGCCAGGUAGAGCAUCUGGCUUUUAACCA GGUGGUCAGGGGUUCGAACCCCCUCGGGCXrCGCCA SEQ ID: 14 Mj 21 GGGCCCGUAGCUCAGUCUGGCAGAGCGCCUGGCUUUUAAOCA GGUGGUCGAGGGUUCAAAUCCCUUCGGGCCCGCCA SEQ ID: 15 Mt 15 GGGCCCGUAGCUCAGUCUGGCAGAGCGCUUGGCUUUUAACCA AGUGGUCGCGGGUUCAAUUCCCGUCGGGCCCGCCA SEQ ID: 16 Mm 4 GGGCCCGUAGCUUAGUCUGGUAGAGCGCCUGACUUUUAAUCA GGCGGUCGAGGGUUCGAAUCCCUUCGGGCCCGCCA SEQ ID: 17 Stl GGGCCCGUAGCUCAGCCAGGUAGAGCGGCGGGCUCUUAACCC GUAGGUCCCGGGUUCAAAUCCCGGCGGGCCCGCCA SEQ ID: 18 St 43 GGGCCCXJUAGCUCAGCCAGGUAGAGCGGCGGGCUUUUAACCC GUAGGUCCXXjGGUUCAAAUCOCGGCGGGCCCGCCA SEQ ID: 19 Pyal3 GGGCCCGUAGCUCAGCCUGGUAGAGCGGCGGÍjCUCUUAACCC GUAGGUCGUGGGUUCGAAUCCCACCGGGCCCGCCA SEQ ID: 20 Af 15 GGGCUCGUAGCUCAGCCAGGCAGAGCGACGGGCUUUGAACCC gucggucgcggguucaaaucccgucgagcccgcca SEQ ID: 21 Ss43 gggcccguagcuuagccagguagagcgacgggcucuuaaccc guagucccggguucgaaucccggcgggcccgcca SEQ ID: 22 Ap4 7 gggcccguagcucagccxjgguagagcggcgggcucuuacccc gcggaagucccggguucaaaucccggcgggcccgcca SEQ ID: 23 Consenso GGGCCX7GUAGCUCAGCCUGGUUAGAGCGGCGGGCU-UUAACC- CGGAGGUCGCGGGUUCAAAUCCCGCCGGGCCCGCCA SEQ ID: 24 AKqua GGGCCCGUAGCUCAGCCDGGUAGAGCGGCGGGCUCUAAACCCGCA GGUCGCGGGUUCAAAUCCCGCCGGGCCCGCCA 101 ΕΡ 1 914 314/ΡΤ SEQ ID: 25
AK stemlibrary
nnnnccguagcucagccugguagagcggcgggcuuccuaacccgcAGGUCGCGGGUUCAAAUCCCGCCGGNNNNGCCA SEQ ID: 2 6 AKuccu
UGGUCCGUAGCUCAGCCUGGUAGAGCGGCGGGCUUCCUCACCCGCAGGUCGCGGGUUCAAAUCCCGCCGGACUAGCCA SEQ ID:
27 PhAAD atggttcatt ggagaaggag ttcacgttgg gccctaaggg ttatgataga attacctggg gagagttatg attagggatc gggaatattc atggagatac agagaactgg cagagatcat gaaggtcacg gtggcgtgtt aacctgctgg aaggagatta gtatgagttt agggaaatgt ctcgttagàt agatctaggt agagaatata aggaggactt GGGCCGATTA aagtacgctg gaactttaggataaggggta tttaggaagg aatgcccatt ctgaacacttgaagccgacc tgaggagata taaacaagta tggcccgcaa tgaatgggat agggatgggtgattggccca aaaggatcat taaaggaagt gttggaatta cattttactc ttatctacge cttggcattc cttcggggtt acgagctttc
TATTGctgat ttgagagtgg gagcttttta tgaggttagg ttccaaggaa agtgaagttc catgagaaag ttctttatgc aggttagcct tagggaaatt tggtttactg gggggctgga tgatataagg tgcgttggtc cttgtggctg ttatggaaag aggggcagaa agcgatctgt tcggcatagg taaacctcta gagggtggta gGTGATGCTG
aaaataatta aataacgcca cagcttatat cacatccaca cgttccccag ctgatccctg ttcgaggagg gagtgaactc ttgagaaaag gcgaaacaac ccctgagcat aggttaagta agtgggaacg tcactttggc gttcaagcta gaagctccgt ggggaagatg atgaggttct ccaaacaagg cgatgagttc aaggtgatga CCAACTTACT
gagagagggg agtggttacg tgtgggccat tgtgggatga gaatggaaag gggatgccat aggtagaaaa tacaagagag ggataagata ctccccttcc aggagggaag taagtgcccc tgaaactgaggttgacttcg cgatacggga tatctttaat agtggtagta tgagccaggt agataaagat gataaagttg tgaagaatta GA SEQ ID: 28
PhAAD. pep MVHWADYIAD KIIREKGEKE KYWESGITP SGYVHVGNFR ELFTAYTVGH ALRDKGYEVR HIHMWDDYDR FRKVPRNVPQ EWKDYLGMPI SEVPDPWGCH ESYAEHFMRK FEEEVEKLGI EVDFLYASEL· YKRGEYSEEI RLAFEKRDKI MEILNKYREX AKQPPLPENW WPAMVYCPEH RREAEIIEWD GGWKVKYKCP EGHEGWVDIR SGNVKLRWRV DWPMRWSHFG VDFEPAGKDH LVAGSSYDTG KEIIKEVYGK EAPLSLMYEF VGIKGQKGKM SGSKGNVILL SDLYEVLEPG IíVRPIYARHR PNKEIKIDLG LGIIÍNLYDEF DKVERIYFGV EGGKGDDEEL RRTYELSVML PTY* SEQ ID: 29
PhE444G
também conhecido por PhKRS atggttcatt ggagaaggag ttcacgttgg gccctaagggttatgataga attacctggg gagagttatg attagggatc gggaatattc atggagatac agagaactgg cagagatcat gaaggtcacg gtggcgtgtt aacctgctgg aaggagatta gtatgagttt agggaaatgt ctcgttagat agatctaggt agagaatata aggaggactt gggccgatta aagtacgttg gaactttagg ataaggggtatttaggaagg aatgcccatt ctgaacactt gaagttgact tgaggagata taaacaagta tggcccgcaa tgaatgggat agggatgggt gattggccca aaaggatcat taaaggaagt gttggaatta tattttactc ttatctacge cttggcattccttcggggtt acgagctttc tattgctgat ttgagagtgg gagcttttta tgaggttaggttccaaggaa agtgaagttc catgagaaag ttctttatgc aggttagcct tagggaaatt tggtttactg gggggctgga tgatataagg tgcgttggtc cttgtggctg ttatggaaag aggggcagaa agcgatctgt tcggcatagg taaacctcta gagggtggta aatgcctaag aaaataatta aataacgcca cagcttatat cacatccacacgttccccag ctgatccctg ttcgaggagg gagtgaactc ttgagaaaag gcgaaacaac ccctgagcat aggttaagta agtgggaacg tcactttggc gttcaagcta gaagctccgt ggggaagatg atgaggttct ccaaacaagg cgatgagttc aaggtgatga aagcctgaga gagagagggg agtggttacg tgtgggccat tgtgggatga gaatggaaag gggatgccat aggtagaaaa tacaagagag ggataagata ctccccttcc aggagggaag taagtgcccc tgaaactgag gttgacttcg cgatacggga tatctttaat agtggtagta tgagccaggt agataaagat gataaagttg tgaagaatta gattagtcgc 102 ΕΡ 1 914 314/ΡΤ tcaagctcct ccgaagaaga gatctatcca taggaattgg Ctgagaaacc aatgaggttg gtttaataac gggagtggtt ccgagattgg acgacttaga tttaggttcc cacaataaat aggaggacgt gttaaaaagt tccagaagtt ctgagtggct attctattcg ttcgacgctc ccagtttcct cttgagggat tagcggtgtt gttctaatca tgagagggtt atgcccctga gaggtaagtg tgagaatcat aagttgccaa tacagattat ggcatctctt ag ggttcagtta aacagggaca aaacttagga ggatgttaaa Gagatgttag gaggaattta gaggaggggg ttattggaaa gataggagtt ccgcatttaa tattcccagg taaaccttgc ttctcaatac ggaggccatg gcgttgaaga atatccagta ggaaagggga tcgtcattaa
SEQ ID 30
PhE4 4 4G.p ep também conhecido por PhKRS
MVHWADYIAD KIXRERGEKE ALRDKGYEVR HIHMWDDYDR ESYAEHFMRK FEEEVEKLGX MEILNKYREI AKQPPLPENW EGHEGWVDIR SGNVKLRWRV KEIIKEVYGK EAPLSIjMYEF LVRFIYARHR PNKEIKIDLG RRTYELSMPK KPERLVAQAP DLSKEDVSRV KLRINLARNW NEVAEWLENH EEFSVEEFNN PRLASFliASX. DRSFVIKELR KYWESGITP FRKVPRNVPQ EVDFLYASEIi WPAMVYCPEH DWPMRWSHFG VGIKGQKGKM LGILNLYDEF FRFIiAVLVQL VKKYAPEDVK XLFEVAKRRG LEG*
SGYVHVGNFR EWKDYLGMPI YKRGEYSEEI RREAEIXEWD VDFEPAGRDH SGSKGNVXLIi DKVERIYFGV PHLTEEDIIN FSILEKPPEV ISSREWFSTL
ELFTAYXVGH SEVPDPKGCH RLAFEKRDKI GGWKVKYKCP I>VAGSSYDTG SDLYEVLEPG EGGKGDDEEL VLIKQGH1PR EVSGDVREAM YRLFIGKERG
SEQ ID 31
pACKO-A184TAG gaactccgga tgagcattca gataaaactt gtgcttattt tccagctgaa cggtctggtt ctcaaaatgt tctttacgat cagtgatttt tttetccatt tcaggcgggc aagaatgtga ataaaggccg ttctttacgg tctttaaaaa ggccgtaata ataggtacat tgagcaactg actgaaatgc gccateggga tatatcaacg gtggtatatc ttagcttcct tagctcctga aaatctcgat aactcaaaaa atacgcccgg tagtgatctt atttcattat ggtgaaagtt ggaacctctt acgtgccgát caacgtctca ttttcgccaa aagttggccc agggcttccc ggtatcaaca gggacaccag gatttattta ttctgcgaag tgatcttccg tcacaggtat ttattcggcg caaagtgcgt cgggtgatgc tgccaactta ctgatttagt gtatgatggt gtttttgagg tgctccagrtg gcttctgttt ctatcagctg tccctcctgt tcagctactg acggggtggt gcgtaacggc aaaagcaccg ccggacatca gcgctagcgg agtgtatact ggcetactat gttggcactg atgagggtgt cagtgaagtg cttcatgtgg caggagaaaa aaggctgcac cggtgcgtca gcagaatatg tgatacagga tatattccgc ttcctcgcfcc actgactcgc tacgctcggt cgttcgactg cggcgagegg aaatggctta cgaacggggc ggagatttcc tggaagatgc caggaagata ctCaacaggg aagtgagagg gccgcggcaa agccgttttt ccataggcfcc egcccccctg acaagcatca cgaaatctga cgctcaaatc agcggtggcg aaacccgaca ggactataaa gataccaggc gtttccccct ggcggctccc tcgtgcgctc tcctgttcct gcctttcggt ttaccggtgt cattccgctg ttatggccgc gtttgtctca ttccacgcct gacactcagt tccgggtagg cagttcgctc caagctggac tgtatgcacg aaccccccgt tcagtccgac cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc cggaaagaca tgcaaaagca ccactggcag cagccactgg taatcgattt agaggagtta gtcttgaagt catgcgccgg ttaaggctaa actgaaagga caagttttgg tgactgcgct cctccaagcc' agttacctcg gttcaaagag ttggtagctc agagaacctt cgaaaaaccg ccctgcaagg cggttttttc gttttcagag caagagatta cgcgcagacc aaaacgatct caagaagatc atcttattaa tcagataaaa t&tttctaga tttcagtgca atttatctct tcaaatgtag cacctgaagt cagccccata cgatataagc tgtaattctc atgtttgaca gcttatcatc gataagcttt aatgcggtag ttCatcacag ttaaattgct aacgcagtca ggcaccgtgt atgaaatcta acaatgcgct catcgtcatc ctcggcaccg tcaccctgga tgctgtaggc ataggcttgg ttatgccggt actgccgggc ctcttgcggg atatcGGTTT CTTAGACGTC AGGTGGCACT TPtcggggaa atgtgcgcgg aacccctatt tgtttatttt tctaaataca ttcaaatatg tatccgctca tgágacaata accctgataa 103 ΕΡ 1 914 314/ΡΤ atgcttcaat aatattgaaa aaggaagagt acgagtattc aacatttccg tgtcgccctt attccctttt ttgcggcatt ttgccttcct gtttttgctc acccagaaac gctggtgaaa gtaaaagatg ctgaagatca gttgggtgca cgagtgggtt acatcgaact ggatctcaac agcggtaaga tccttgagag ttttcgcccc gaagaacgtt ttccaatgat gagcactttt aaagttctgc tatgtggcgc ggtattatcc cgtgttgacg ccgggcaaga gcaactcggt cgccgcatac actattctca gaatgacttg gttgagtact caccagtcac agaaaagcat cttacggacg gcatgacagt aagagaatta Cgcagtgctg ccataaccat gagtgataac actgcggcca acttacttct gacaacgatc ggaggaccga aggagctàac cgcttttttg cacaacatgg gggatcatgt aactcgcctt gatcgttggg aaccggagct gaatgaagcc ataccaaacg acgagcgtga caccacgatg cctTAGgcaa tggcaacaac gttgcgcaaa ctattaactg gcgaactact tactctagct tcccggcaac aattaataga ctggatggag gcggataaag ttgcaggacc acttctgcgc tcggcccttc rggctggctg gtttattçct gataaâtctg gâgccggtça gcgt590tct cgcggtatca ttgcagcact ggggccagat ggtaagccct cccgtatcgt agttatctac acgacgggga gtcaggcaac tatggatgaa cgaaatagac agatcgctga gataggtgcc tcactgatta agcattggca ccaccaccac caccactaaC CCGGGACCAA GTTTACTCAT ATATACttta gattgattta aaacttcatt tttaatttaa aaggatctag gtgaagatcc tttttgataa tCTCATGACC AAAATCCCTT AACGgcatgc accattcctt gcggcggcgg tgctcaacgg cctcaaccfca ctactGGGCT GCTTCCTAAT GCAGGAGTCG CATAAGGGAG AGCGTCTGGC GAAAGGGGGA TGTGCTGCAA GGCGATTAAG TTGGGTAACG CCAGGGTTTT CCCAGTCACG ACGTTGTAAA ACGACGGCCA GTGCCAAGCT TAAAAAaaac ccttagctct cgctaaggac CTGCAGTTAT AATCTCTTTC TAATTGGCTC TAAAATCTTT ATAAGTTCTT CAGCTACAGC ATTTTTTAAA TCCATTGGAT GCAATTCCTT ATTTTTAAAT AAACTCTCTA actcctcata gctattaact gtcaaatctc caccaáattt ttctggcctt TTTATGGTTA AAGGATATTC AAGGAAGTAT TTAGCTATCT CCATTATTGG ATTTCCTTCA ACAACTCCAG CTGGGCAGTA TGCTTTCTTT ATCTTAGCCC TAATCTCTTC TGGAGAGTCA TCAACAGCTA TAAAATTCCC TTTTGAAGAA CTCATCTTTC CTTCTCCATC CAAACCCGTT AAGACAGGGT TGTGAATACA AACAACCTTT TTTGGTAAAA GCTCCCTTGC TAACATGTGT ATTTTTCTCT GCTCCATCCC TCCAACTGCA ACATCAACGC CTAAATAATG AATATCATTA ACCTGCATTA TTGGATAGAT AACTTCAGCA ACCTTTGGAT TTTCATCCTC TCTTGCTATA AGTTCCATAC TCCTTCTTGC TCTTTTTAAG GTAGTTTTTA AAGCCAATCT ATAGACATTC AGTGTATAAT CCTTATCAAG CTGGAATTCa gcgttacaag Cattacacaa agttttttat gttgagaata tctttccgat ggggcgccac ttatttttga tcgttcgctc aaagAAGCGG CGCCAGGGNT GTTTTTCTTT TCACCAGTKA GACGGGCAAC AGAACGCCAT Gagcggcctc atttcttatt ctgagttaca acagtccgca ccgctgtccg gtagctcctt ccggtgggcg cggggcatga ctatcgtcgc cgcacttatg actgtcttct ttatcatgca actcgtagga caggtgccgg cagcgcccaa cagtcccccg gccacggggc ctgccaccat' acccacgccg aaacaagcgc cctgcaccat tacgttcegg atcugcatcg caggabgcbg cbggctaccc tgbggaacac ctacatctgt attaacgaag cgctaaccgt ttttatcagg ctctgggagg cagaataaat gatcatatcg tcaattatta cctccacggg gagagcctga gcaaactggc ctcaggcatt tgagaagcac acggtcacac tgcttccggt agtcaataaa ccggtaaacc agcaatagac ataagcggct atttaacgac cctgccctga accgacgacc gggtcgaatt tgctttcgaa tttctgccat tcatccgctt attatcactt attcaggcgt agcaccaggc gtttaagggc accaataact gccttaaaaa aattacgccc cgccctgcca ctcatcgcag tactgttgta attcattaag cattctgccg acafcggaagc catcacagac ggcatgatga acctgaatcg ccagcggcat cagcaccttg tcgccttgcg tataatattt gcccacggtg aaaacggggg cgaagaagtt gtccatattg gccacgttta aatcaaaact ggtgaaactc acccagggat tggctgagac gaaaaacata ttctcaataa accctctagg gaaataggcc aggttttcac cgtaacacgc cacatcttgc gaatatatgt gtagaaactg ccggaaatcg tcgtggtatt cactccagag cgatgaaaac gtttcagttt gctcatggaa aacggtgtaa câagggtgaa cactatccca tatcaccagc tcaccgtctt tcattgccac acg 104 ΕΡ 1 914 314/ΡΤ SEQ ID: 32
pACKO- A184AGGA gaactccgga gaCaaaactt tccagctgaa ctcaaaatgt cagtgatttt aactcaaaaa ggaacctctt agggcttccc tgatcttccg tgccaactta gcttctgttt gcgtaacggc ggcttactat caggagaaaa tatattccgc cggcgagcgg caggaagata ccataggctc agtggtggcg ggcggctccc cattccgctg tccgggtagg tcagtccgac cggaaagaca agaggagtta caagttttgg ttggtagctc gttttcagag atcttattaa tcaaatgtag atgtttgaca ttaaattgct catcgtcatc ttatgccggt AGGTGGCACT tctaaataca atgcttcaat tgtcgccctt acccagaaac cgagtgggtt ttttcgcccc tatgtggcgc cgccgcatac agaaaagcat ccataaccat ggaggaccga aactcgcctt acgagcgtga actattaact actggatgga ccggctggct tcgcggtatc tagttaecta cagatcgctg ccaccactaa aaaacttcat tgagcattca gtgcttattt cggtctggtt tctttacgat tttctccatt atacgcccgg acgtgccgat ggtatcaaca tcacaggtat ctgatttagt ctatcagctg aaaagcaccg gttggcactg aaggctgcac ttcctcgctc aaatggctta cttaacaggg cgcccccctg aaacccgaca tcgtgcgctc ttatggccgc cagttcgctc cgctgcgcct tgcaaaagca gtcttgaagt' tgactgcgct agagaacctt caagagatta tcagataaaa cacctgaagt gcttatcatc aacgcagtca ctcggcaccg actgccgggc TTtcggggaa ttcaaatatg aatattgaaa attccctttt gctggtgaaa acatcgaact gaagaacgCt ggtattatcc actattctca cttacggatg gagtgataac aggagctaac gatcgttggg caccacgatg ggcgaactac ggcggataaa ggtttattgc attgcagcac cacgacgggg agataggtgc CCCGGGACCA ttttaattta tcaggcgggc ttctttacgg ataggtacat gccattggga ttagcttcct tagtgatctt caacgtctca gggaçaccag ttattcggcg gtatgatggt tccctcctgt ccggacatca atgagggtgt cggtgcgtca actgactcgc cgaacggggc aagtgagagg acaagcatca ggacnataaa tcctgttcct gtttgtctca caagctggac tatccggtaa ccactggcag catgcgccgg çctccaagcc cgaaaaaccg cgcgcagacc cacttctaga cagccccata gataagcttt ggcaccgtgt tcaccctgga ctcttgcggg atgtgcgcgg tatccgctca aaggaagagt ttgcggcatt gtaaaagatg ggatctcaac ttccaatgat cgtgttgacg gaatgacttg gcatgacagt actgcggcca cgcttttttg aaccggagct cctAGGAgca ttactctagc gttgcaggac tgataaatct tggggccaga agtcaggcaa ctcactgatt AGTTTACTCA aaaggatcta aagaatgtga tctttaaaaa tgagcaactg tatatcaacg tagctcctga atttcattat ttttcgccaa gatttatcta caaagtgcgt gtttttgagg tcagctactg gcgctagcgg cagtgaagtg gcagaatatg tacgctcggt ggagatttcc gccgcggcaa cgaaatctga gataccaggc gcctttcggt ttccacgcct tgtatgcacg ctatcgtctt cagccactgg ttaaggctaa agttacctcg ccctgcaagg aaaacgatct tttcagtgca cgatataagt aatgcggtag atgaaatcta tgctgtaggc atatcGGTTT aacccctatt tgagacaata atgagtattc ttgccttcct ctgaagatca agcggtaaga gagcactttt ccgggcaaga gttgagtact aagagaatta acttacttct cacaacatgg gaatgaagcc atggcaacaa ttcccggcaa cacttctgcg ggagccggtg tggtaagccc ctatggatga aagcattggc TATATACttt ggtgaagatc ataaaggccg ggccgtaata actgaaatgc gtggtatatc aaatctcgat ggtgaaagtt aagttggccc ttctgcgaag cgggtgatgc tgctccagtg acggggtggt agtgtatact cttcatgtgg tgatacagga cgttcgactg tggaagatgc agccgttttt cgctcaaatc gtttccccct ttaccggtgt gacactcagt aaccccccgt gagtccaacc taattgattt actgaaaggagttcaaagag cggttttttc caagaagatc atttatctct tgtaattctc tttatcacag acaatgcgct ataggcttgg CTTAGACGTC tgtttatttt accctgataa aacatttccg gtttttgctc gttgggtgca tccttgagag aaagttctgc gcaactcggt caccagtcac tgcagtgctg gacaacgatc gggatcatgt ataccaaacg cgttgogcaa caattaatag ctcggccctt agcgtgggtc tcccgtatcg acgaaataga accaccacca agattgattt ctttttgata 105 ΕΡ 1 914 314/ΡΤ atCTCATGAC CAAAATCCCT TAACGgcabg caccattcct tgcggcggcg gtgctcaacg gcctcaacct actactGGGC TGCTTCCTAA TGCAGGAGTC GCATAAGGGA GAGCGTCTGG CGAAAGGGGG ATGTGCTGCA AGGCGATTAA GTTGGGTAAC GCCAGGGTTT TCCCAGTCAC GACGTTGTAA AACGACGGCC AGTGCCAAGC TTAAAAAaaa tccttagctt tcgctaagga tCTGCAGTTA TAATCTCTTT CTAATTGGCT CTAAAATCTT TATAAGTTCT TCAGCTACAG CATTTTTTAA ATCCATTGGA TGCAATTCCT TATTTTTAAA TAAACTCTCT AACTCCTCAT AGCTATTAAC TGTCAAATCT CCACCAAATT TTTCTGGCCT TTTTATGGTT AAAGGATATT CAAGGAAGTA TTTAGCTATC TCCATTATTG GATTTCCTTC AACAACTCCA GCTGGGCAGT ATGCTTTCTT TATCTTAGCC CTAATCTCTT CTGGAGAGTC ATCAACAGCT ATAAAATTCC CTTTTGAAGA ACTCATCTTT CCTTCTCCAT CCAAACCCGT TAAGACAGGG TTGTGAATAC AAACAACCTT TTTTGGTAAA AGCTCCCTTG CTAACATGTG TATTTTTCTC TGCTCCATCC CTCCAACTGC AACATCAACG CCTAAATAAT GAATATCATT AACCTGCATT ATTGGATAGA TAACTTCAGC AACCTTTGGA TTTTCATCCT CTCTTGCTAT AAGTTCCATA CTCCTTCTTG CTCTTTTTAA GGTAGTTTTT AAAGCCAATC TATAGACATT CAGTGTATAA TCCTTATCAA GCTGGAATTC agcgttacaa gtattacaca aagtttttta tgttgagaat atbbbbbbga tggggcgcca cttatttttg atcgttcgct caaagAAGCG GCGCCAGGGN TGTTTTTCTT TTCACCAGTN AGACGGGCAA CAGAACGCCA TGAgcggccb cabbbcbbab tctgagttac aacagbccge accgctgtcc ggtagcbccb tccggtgggç gcggggcatg actatcgtcg ccgcacbbab gactgbcbbc bbbabcabgc aactcgtagg acaggtgccg gcagcgccca acagtccccc ggccacgggg cctgccacca tacccacgcc gaaacaagcg ccctgcacca btabgtbccg gatccgcatc gcaggatgct gctggctacc ctgcggaaca cctacatctg tattaacgaa gcgctaaccg bbtttábcag gctctgggag gcagaataaa tgatcatatc gtcaattatt acctccacgg ggagagcctg agcaaactgg cctcaggcat ttgagaagca cacggtcaca ctgcttccgg tagtcaataa accggtaaac cagcaataga cataagcggc tatttaacga ccctgccctg aaccgacgac cgggtcgaat ttgctttcga atttctgcca ttcatccgct tattatcact tattcaggcg tagcaccagg cgtttaaggg caccaataac tgccttaaaa aaattacgcc ccgccctgcc actcatcgca gtactgttgt aattcattaa gcattctgcc gacatggaag ccatcacaga cggcatgatg aacctgaatc gccagcggca tcagcacctt gtcgccttgc gtabaatatb bgcecabggb gaaaacgggg gcgaagaagb bgbccababb ggccacgttt aaatcaaaac tggtgaaact cacccaggga bbggcbgaga cgaaaaacat abbctcaaba aacccbbbag ggaaabaggc caggbtttca ccgbaacacg ccacabcbtg cgaabababg bgtagaaacb gccggaaatc gtcgbggbab bcacbccaga gcgabgaaaa cgbbbcagbt bgcbcabgga aaacggbgba acaagggbga acacbabccc ababcaccag cbcaccgbcb bbcattgcca bacg
SEQ ID 33 pACKO-Bla gaactccgga gataaaactb bccagcbgaa cbcaaaabgbcagbgatttb aacbcaaaaa ggaaccbcbb agggcbbccc bgabcbbccg bgccaacbba gcbbcbgbbb gcgbaacggc ggcbbacbab caggagaaaa tatabbccgc cggcgagcgg caggaagaba bgagcabbcagtgcbbabbb cggbcbggbb bcbbbacgattttctccatt abacgcccggacgbgccgat ggtatcaaca bcacaggtab ctgabtbagt cbatcagctg aaaagcaccg gbbggcacbg aaggcbgcac tbccbcgctc aaatggctta cbbaacaggg bcaggcgggcbbcbbtacgg ataggtacat gccabbgggattagcbbcct tagbgabcbb caacgbcbca gggacaccag bbabtcggcg gbabgabggt bcccbccbgt ccggacabca atgagggtgt cggbgcgtca acbgacbcgc cgaacggggc aagbgagagg aagaabgbga bctbbaaaaa bgagcaacbg babatcaacg tagcbcctga abbbcabbab btbbcgccaa gabbbatbba caaagbgcgb gttbtbgagg bcagcbactg gcgcbagcgg cagbgaagbg gcagaababg bacgcbcggb ggagattbcc gccgcggcaa abaaaggccg ggccgbaaba acbgaaabgc gbggbababc aaabcbcgab ggbgaaagbb aagbbggccc tbctgcgaag cgggbgabgc bgcbccagbg acggggtggb agtgtatacb cbbcabgbgg bgabacagga cgbtcgacbg bggaagabgc agccgbbbbb 106 ΕΡ 1 914 314/ΡΤ ccataggctc cgcccccctg acaagcatca cgaaatctga cgctcaaatc agtggtggcg aaacccgaca ggactataaa gataccaggc gtttccccct ggcggctccc tcgtgcgctc tcctgttcct gcctttcggt ttaccggtgt cattccgctg ttatggccgc gtttgtctca.ttccacgcct gacactcagt tccgggtagg cagttcgctc caagctggac tgtatgcacg aaccccccgt tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc cggaaagaca tgcaaaagca ccactggcag cagccactgg taattgattt agaggagtta gtcttgaagt catgcgccgg ttaaggctaa actgaaagga caagttttgg tgactgcgct cctccaagcc agttacctcg gttcaaagag ttggtagctc agagaacctt cgaaaaaccg ccctgcaagg cggttttttc gttttcagag caagagatta cgcgcagacc aaaacgatct caagaagatc atcttattaa tcagataaaa tatttctaga tttcagtgca atttatctct tcaaatgtag cacctgaagt cagccccata cgatataagt tgtaattctc atgtttgaca gcttatcatc gataagcttt aatgcggtag tttatcacag ► ►aaaH·/»/·*· aa^^a^f· a af naaafa^aafrtr/tí**· -3-3-- catcgtcatc ctcggcaccg tcaccctgga tgctgtaggc ataggcttgg ttatgccggt actgccgggc ctçttgcggg atatcGGTTT CTTAGACGTC AGGTGGCact tttcggggaa atgtgcgcgg aacccctatt tgtttatttt tctaaataca ctcaaatatg catccgctca tgagacaata accctgataa atgcttcaat aataCtgaaa aaggaagagt atgagtattc aacatttccg tgtcgccctt attccctttt ttgcggcatt ttgccttCCT GTTTTTGCTC ACCCAGAAAC ACTAGtgcag caatggcaac aacgttgcgc aaactattaa ctggcgaact acttactcta gcttcccggc aacaattaat agactggatg gaggcggata aagttgcagg accacttctg cgctcggccc ttccggctgg ctggtttatt gctgataaat ctggagccgg tgagcgtggg tctcgcggta tcattgcagc actggggcca gatggtaagc cctcccgtat cgtagttatc tacacgacgg ggagtcaggc aactatggat gaacgaaata gacagatcgc tgagataggt gcctCACTGA TTAAGCATTG GTAACCCGGG ACCAAGTTTA CTCATATATA CtttagaCtg atetaaaact tcatttttaa tttaaaagga tctaggtgaa gatccttttt gataatCTCA TGACCAAAAT CCCTTAACGg catgcaccat tccttgcggc ggcggtgctc aacggcctca acctactact GGGCTGCTTC CTAATGCAGG AGTCGCATAA GGGAGAGCGT CTGGCGAAAG GGGGATGTGC TGCAAGGCGA TTAAGTTGGG TAACGCCAGG GTTTTCCCAG TCACGACGTT GTAAAACGAC GGCCAGTGCC AAGCTTAAAA AaaatCCtta gctttcgcta aggatCTGCA GTTATAATCT CTTTCTAATT GGCTCTAAAA TCTTTATAAG TTCTTCAGCT ACAGCATTTT TTAAATCCAT TGGATGCAAT TCCTTATTTT TAAATAAACT CTCTAAC TCG TCATAGCTAT TAACTGTCAA ATCTCCACCA AATTTTTCTG GCCTTTTTAT GGTTAAAGGA TATTCAAGGA AGTATTTAGC TATCTCCATT ATTGGATTTC CTTCAACAAC TCCAGCTGGG CAGTATGCTT TCTTTATCTT AGCCCTAATC TCTTCTGGAG AGTCATCAAC AGCTATAAAA TTCCCTTTTG AAGAACTCAT CTTTCCTTCT CCATCCAAAC CCGTTAAGAC AGGGTTGTGA ATACAAACAA CCTTTTTTGG TAAAAGCTCC CTTGCTAACA TGTGTATTTT TCTCTGCTCC ATCCCTCCAA CTGCAACATC AACGCCTAAA TAATGAATAT CATTAACCTG CATTATTGGA TAGATAACTT CAGCAACCTT TGGATTTTCA TCCTCTCTTG CTATAAGTTC CATACTCCTT CTTGCTCTTT TTAAGGTAGT TTTTAAAGCC AATCTATAGA CATTCAGTGT ATAATCCTTA TCAAGCTGGA ATTCagcgtt acaagtatta cacaaagttt tttatgttga gaatattttt ttgatggggc gccacttatt tttgatcgtt cgctcaaagA AGCGGCGCCA GGGNTGTTTT TCTTTTCACC AGTNAGACGG GCAACAGAAC GCCATGAgcg gcctcatttc ttattctgag ttacaacagt ccgcaccgct gtccggtagc tccttccggt gggcgcgggg catgactatc gtcgccgcac ttatgactgt cttctttatc atgcaactcg taggacaggt gccggcagcg cccaacagtc ccccggccac ggggcctgcc accataccca cgccgaaaca agcgccctgc accattatgt tccggatctg catcgcagga tgctgctggc taccctgtgg aacacctaca tctgtattaa cgaagcgcta accgttttta tcaggctctg ggaggcagaa taaatgatca tatcgtcaat tattacctcc acggggagag cctgagcaaa ctggcctcag gcatttgaga agcacacggt cacactgctt ccggtagtca ataaaccggt aaaccagcaa tagacataag cggctattta acgaccctgc cctgaaccga.cgaccgggtc gaatetgctt tcgaatttct gccattcatc cgcttattat cacttaCtca ggcgtagcac caggcgttta agggcaccaa taactgcctt aaaaaaatta cgccccgccc tgccactcat cgcagtactg ttgtaattca ttaagcattc tgccgacatg gaagccatca cagacggcat gatgaacctg aatcgccagc ggcatcagca ccttgtcgcc tCgcgCataa Catttgccca tggtgaaaac gggggcgaag aagttgtcca tattggccac gtttaaatca aaactggtga aactcaccca gggattggct gagacgaaaa acatattctc aataaaccct ttagggaaat aggccaggtt ttcaccgtaa cacgccacat cttgcgaata tatgtgtaga aactgccgga aatcgtcgtg gtattcactc cagagcgatg aaaacgtttc agtttgctca tggaaaacgg tgtaacaagg gtgaacacta tcccatatca ccagctcacc gtctttcatt gccatacg 107 ΕΡ 1 914 314/ΡΤ SEQ ID: 34
pKQ
ATGGATCCGA TTGGGCCCGA GACCATCATC TTTGGCGGAT CAGAAGCGGT TCCCACCTGA GGTAGTGTGG TAAAACGAAA TTGTCGGTGA ACATGTgagc ttgctggcgt tcgacgctca aggcgtttcc ccgcttaccg ttctcatagc ccaagctggg ttatccggta gccactggca gcggtgctac aggacagtat aagagttggt gtttttttgt gaagatcctt ctcacgttaa tacatcgcac ttacataaac cgtcttgctc gggtataaat tcgattgtat aaggtagcgt. ctgacggaat tgatgatgca aggtattaga gcagtgttcc taacagcgat acggtttggt gttgaacaag ttcagtcgtc aggggaaatt cgataccagg ttcattacag tgaataaatt ttggttaatt cggcggcttt GGagttgtca TTACGCTTTG
GCTCGAGATC ACAAAAACTC ATCATCATCA GAGAGAAGAT CTGATAAAAC CCCCATGCCG GGTCTCCCCA GGCTCAGTCG ACGATATCTG aaaaggccag ttttccatag agtcagaggt ccctggaagc gatacctgtc tcacgctgta Ctgtgtgcac actatcgtct gcagccactg agagttcttg ttggtatctg agctcttgat ttgcaagcag tgatcttttc gggattttgg aagataaaaa agtaatacaa gággccgcga gggctcgcga gggaagcccg tgccaatgat ttatgcctct tggttactca agaatatcct tgcgccggtt cgcgtatttc tgatgcgagt tctggaaaga actcatggtg aataggttgt atcttgccat aaacggcttt gcagcttcat ggttgtaaca gttgaataaa gcctgtcccg AGGAATTAAC
TGCAGCTGGT ATCTCAGAAG TTGAGTTTAA TTTCAGCCTG AGAATTTGCC AACTCAGAAG TGCGAGAGTA AAAGACTGGG CTTTTCTTCG caaaaggcca gctcçgcccc ggcgaaaccc tccctcgtgc cgcctttctc ggtatctcag gaaccccccg tgagtccaac gtaacaggat aagtggtggc cgctctgctg ccggcaaaca cagattacgc tacggggtct TCATGAgttg taCatcatca ggggtgttat ttaaattcca taatgtcggg atgcgccaga gttacagatg tccgaccatc ccactgcgat gattcaggtg gcattcgatt gtctcgctca gattttgatg aatgcataag atttctcact attgatgttg cctatggaac ttcaaaaata ttgatgctcg ctggcagagc tcgaactttt cttataagat C ACCATATGGG AGGATCTGAA ACGGTCTCCA ATACAGATTA TGGCGGCAGT TGAAACGCCG GGGAACTGCC CCTTTCGTTT CGAATtaatt ggaaccgtaa cctgacgagc gacaggacta gctctcctgt ccttcgggaa ttcggtgtag ttcagcccga ccggtaagac tagcagagcg ctaactacgg aagccagtta aaccaccgct gcagaaaaaa gacgctcagt tgtctcaaaa tgaacaataa gagccatatt acatggatgc caatcaggtg gttgtttctg agatggtcag aagcatttta ccccgggaaa aaaatattgt cctgtttgta ggcgcaatca acgagcgtaa cttttgccat tgataacctt gacgagtcgg tgcctcggtg tggtattgat atgagttttt attacgctga gctgagttga catacgccgt
AATTCGAAGC TAGCGCCGTC GCTTGGCTGT AATCAGAACG AGCGCGGTGG TAGCGCCGAT AGGCATCAAA TATCTGTTGT ccgcttcgca aaaggccgcg atcacaaaaa taaagatacc tccgaccctg gcgtggcgct gtcgttcgct ccgctgcgcc acgacttatc aggtatgtag ctacactaga ccttcggaaa ggcagcggtg aggatcCcaa ggaacgaaaa tctctgatgt aactgtctgc caacgggaaa tgatttatat cgacaatcta aaacatggca actaaactgg tccgtactcc acagcattcc tgatgcgctg atCgtccttt cgaatgaata tggctggcct tctcaccgga atttttgacg aatcgcagac agttttctcc aatcctgata ctaatcagaa cttgacggga aggatcCTCG tatacGTTGT 108 ΕΡ 1 914 314/ΡΤ SEQ ID: 35 pKQ-PhKep atgsttcatt ggagaaggag ttcacgttgg gccctaaggg ttatgataga attacctggg gagagttatg attagggatc gggaatattc atggagatac agagaactgg cagagatcat gaaggtcacg gtggcgtgtt aacctgctgg aaggagatta gtatgagttt agggaaatgt ctcgttagat agatctaggt agagaatata aggaggactt atgatggtgt cctcctgttc ggacatcagc gttcacttac tggccatgaa ggcctcaaca acctcgcgca cgaacagtgg acgcgtatga cgcactatgg cgtggtgata agggaaagct cataacctga gtcgttctca tgaacataaa tgcctaagaa gcggtgttgg tctaatcaaa agagggttaa gcccctgagg ggtaagtgaa agaatcatga gttaccaaga cagattattt catctcttga GAATTCGAAG ATAGCGCCGT AGCTTGGCTG AAATCAGAAC TAGCGCGGTG GTAGCGCCGA CAGGCATCAA TTATCTGTTG tccgcttcgc aaaaggccgc catcacaaaa ataaagatac GGGCCGATTA aagtacgttg gaactttagg ataaggggta tttaggaagg aatgcccatt ctgaacactt gaagttgact tgaggagata taaacaagta tggcccgcaa tgaatgggat agggatgggt gattggccca aaaggatcat taaaggaagt gttggaatta tattttactc ttatctacgc cttggcattc cttcggggtt acgagctttc ttttgaggtg agctactgac gctatctctg accgcttctc tggcgttgga cgattttccg tacagccggg ggatacgtcg caggctccgg cgacgctggg tggatgacgg gcacgtaatc atctgaggca aaatcggtgg acactatcaa gcctgagaga ttcagttacc cagggacata acttaggata atgttaaatt gatgtcaggg ggaatttagc ggagaaggat attggaaagg taggagtttc CTTGGGCCCG CGACCATCAT TTTTGGCGGA GCAGAAGCGG GTCCCACCTG TGGTAGTGTG ATAAAACGAA TTTGTCGGTG aACATGTgag gttgotggcg atcgacgctc caggcgtttc TATTGctgat ttgagagtgg gagcttctta tgaggttagg ttccaaggaa agtgaagttc catgagaaag ttctttatgc aggttagcct tagggaaatt tggtttactg gggggctgga tgatataagg tgcgttggtc cttgtggctg ttatggaaag aggggcagaa agcgatctgt tcggcatagg taaacctcta gagggtggta ggtgatgctg ctccagtggc ggggtggtgc ctctcactgc aacccggtac tgccgggcaa ccatttaaaa cagtgacgtc gtgctaaatc aagacggttg gcgtcttatg atggctggcc agcaagcgat gcacctggca agctgcatga taagttggag ttagtcgctç gcatttaacc ttcccaggga aaccttgcta ctcaatactt aggccatgaa gttgaagagt a bccaghagn aaaggggacc gttattAAAC AACAAAAACT CATCATCATC TGAGAGAAGA TCTGATAAAA ACCCCATGCC GGGTCTCCCC AGGCTCAGTC AACGATATCT caaaaggcca tttttccata aagtcagagg cccctggaag aaaataatta aataacgcca cagcttatat cacatccaca cgttccccag ctgatccctg ttcgaggagg gagtgaactc ttgagaaaag gcgaaacaac ccctgagcat aggttaagta agbgggaacg tcactttggc gttcaagcta gaagctccgt ggggaagatg atgaggttct ccaaacaagg cgatgagttc aaggtgatga ccaacttact ttctgtttct gtaacggcaa cgtaaaacat gcaccagaaa ccgcccgcat aactcaggcc atcgtctgcg gcgccagcgc ttgcgcacgt agcctgctgt gctgtatgaa atacgcagcg cggctgggac caaagtcatc tcattacccc aagctccttt gaagaagaca tctatccaag ggaattgggt gagaaacctc tgaggttgct ttaataacat gagtggtttt gagattggcc GACTTAGACT CATCTCAGAA ATTGAGTTTA TTTTCAGCCT CAGAATTTGC GAACTCAGAA ATGCGAGAGT GAAAGACTGG GCTTTTCTTC gcaaaaggcc ggctccgccc tggcgaaacc ctccctcgtg gagagagggg agtggttacg tgtgggccat tgtgggatga gaatggaaag gggatgccat aggtagaaaa tacaagagag ggataagata ctccccttcc aggagggaag taagtgcccc tgaaactgag gttgacttcg cgatacggga tatctttaat agtggtagta tgagccaggt agataaagat gataaagttg tgaagaatta gatttagtgt atcagctgtc aagcaccgcc ggcaactgca atcattgata tatgggcgtt gcagtcggta cggaaatgga tggctgtttt attcggtgaa caccctttga tcccgcctga aattgagcgg ggaagtcgct gggcattatc gagctttcaa taggttccta taataaatgt gaggacgttg Caaaaagtat cagaagttga gagtggcttg tctattcgaa c«acgctcta agtttcctgg TGAGGGATAA GAGGATCTGA AACGGTCTCC GATACAGATT CTGGCGGCAG GTGAAACGCC AGGGAACTGC GCCTTTCGTT GCGAATtaat aggaaccgta ccctgacgag cgacaggact cgctctcctg 109 ΕΡ 1 914 314/ΡΤ
ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga agcgtggcgc tttctcatag ctcacgctgC aggtatctca gtccggtgta ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatceggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgctá cagagttctt gaagtggtgg cctaactacg gctacactag aaggacagta tttggtatct gcgctctgct gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt ggtttttttg tttgcaagca gcagatcacg cgcagaaaaa aaggatctca agaagatcct ttgatctttt ctacggggto tgacgctcag tggaacgaaa acCcacgtta agggatttcg gTCATGAgtt gtgtctcaaa atctctgatg ttacattgca caagataaaa atatatcatc atgaacaata aaactgtctg cttacataaa cagtaataca aggggtgtta tgagccatat tcaacgggaa acgtcttgct cgaggccgcg áttaaattcc aacatggatg ctgatttáta tgggtataaa tgggctcgcg ataatgtcgg gcaatcaggt gcgacaatct atcgatfcgta tgggaagccc gatgcgccag agttgtttct gaaacatggc aaaggtagcg ttgccaatga tgttacagat gagatggtca gactaaactg gctgacggaa tttatgcctc ttccgaccat caagcatttt atccgtactc ctgatgatgc atggttacte accactgcga tccccgggaa aacagcãttc caggtattag aagaatatcc tgattcaggt gaaaatattg ttgatgcgct ggcagtgttc ctgcgccggt tgcattcgat tcctgtttgt aattgtcctt ttaacagcga tcgcgtattt cgtctcgctc aggcgcaatc acgaatgaat aacggtttgg ttgatgcgag tgattttgat gacgagcgta atggctggcc tgttgaacaa gtctggaaag aaatgcataa gcttttgcca ttctcaccgg attcagtcgt cactcatggt gatttctcac ttgataacct tatttttgac gaggggaaat taataggttg tattgatgtt ggacgagtcg gaatcgcaga ccgataccag gatcfctgcca tcctatggaa ctgcctcggc gagttttctc cttcattaca gaaacggctt tttcaaaaat atggtattga taatcctgat atgaataaat tgcagtttca tttgatgctc gatgagtttt tctaatcaga attggttaat tggttgtaac actggcagag cattacgctg acttgacggg acggcggctt tgttgaacaa atcgaacttt tgctgagttg aaggatcCTC GGGagttgtc agcctgtccc gcttataaga tcatacgccg ttatacGTTG TTTACGCTTT GAGGAATTAA CC
LISTAGEM DE SEQUÊNCIAS <110> The Scripps Research Institute
<120> COMPOSIÇÕES DE PARES DE LISIL-ARNt E AMINOACIL-ARNt-SINTETASE
ORTOGONAIS E SUAS UTILIZAÇÕES
LISTAGEM DE SEQUÊNCIAS <110> The Scripps Research Institute
<120> COMPOSIÇÕES DE PARES ORTOGONAIS LISIL-ARNt E AMINOACIL-ARNt-SINTETASE E SUAS UTILIZAÇÕES <130> SJK/FP6523278 <140> EP ainda desconhecido <141> 2004-07-07 <150> EP 06002989.9 <151> 2004-07-07 <150> EP 04777951.7 <151> 2004-07-07 <150> PCT/US 04/022187 <151> 2004-07-07 <150> US 60/485,451 <151> 2004-07-07 110 ΕΡ 1 914 314/ΡΤ Λ O LO \—1 V US 60/528, 815 <151> 2003-12-10 <150> US 60/537, 149 <151> 2003-01-15 <160> 37 <170> Patentln version 3.2 <210> 1 <211> 78 <212> ARN <213> Pyrococcus abyssi <400> 1 gggccgguag cuuagccugg uuagagcggc ggacucuuaa uccgcagguc ggggguucaa 60 aucccccccg gcccgcca 78
<210> 2 <211> 78 <212> ARN <213> Pyrococcus furiosus <400> 2 gggccgguag cuuagccugg uuagagcggc ggacucuuaa uccgcagguc ggggguucaa 60 aucccccccg gcccgcca 78
<210> 3 <211> 78 <212> ARN <213> Pyrococcus horikoshii <400> 3 gggccgguag cuuagccugg uuagagcggc ggacucuuaa uccgcagguc ggggguucaa '60 aucccccccg gcccgcca 78
<210> 4 <211> 78 <212> ARN <213> Pyrococcus abyssi <400> 4 gggccgguag cucagccugg ucagagcacc gggcuuuuaa cccggugguc gcggguucaa 60 aucccgcccg gcccgcca 78
<210> 5 <211> 78 <212> ARN <213> Pyrococcus horikoshii <400> 5 gggccgguag cucagccugg ucagagcacc gggcuuuuaa cccggugguc gcggguucaa 60 78 aucccgcccg gcccgcca 111 ΕΡ 1 914 314/ΡΤ
<210> 6 <211> 78 <212> ARN <213> Pyrococcus furiosus <400> 6 gggccgguag cucagccugg uuagagcacc gggcuuuuaa cccggugguc gcggguucaa 60 aucccgcccg gcccgcca 78
<210> 7 <211> 78 <212> ARN <213> Pyrobaculum aerophilum <400> 7 gggcccguag cucagcccgg uuagagcggc gggcuuuuaa cccguagguc guggguucga 60 aucccaccgg gcccgcca 78
<210> 8 <211> 77 <212> ARN <213> Thermoplasma acidophilum <400> 8 ggguccguag cuuagcuagg uagagcgaug gacucuuaau ccauagguca gggguccaaa 60 uccccucgga cccgcca 77
<210> 9 <211> 77 <212> ARN <213> Thermoplasma volcanium <400> 9 ggguccguag cuuagcuagg uagagcgaug gacucuuaau ccauagguca gggguccaaa 60 uccccucgga cccgcca 77
<210> 10 <211> 77 <212> ARN <213> Archaeoglobus fulgidus <400> 10 gggccgguag cuuagccagg cagagcgcgg gacucuuaau cccgcagucg gggguucaaa 60 ucccucccgg cccgcca 77
<210> 11 <211> 77 <212> ARN <213> Halobacterium sp. NRC-1 <400> 11 gggccgguag cucagucugg cagagcgacg gacucuuaau ccgucggucg cguguucaaa 60 77 ucgcgcccgg cccgcca ΕΡ 1 914 314/ΡΤ 112 <210> <211> <212> <213> 12 77 ARN Thermoplasma acídophilum <400> 12 gggcccguag cucagccagg uagagcaucu ggcuuuuaac caggugguca gggguucgaa 60 cccccucggg cccgcca 77 <210> <211> <212> <213> 13 77 ARN Thermoplasma volcanium <400> 13 gggcccguag cucagccagg uagagcaucu ggcuuuuaac caggugguca gggguucgaa 60 cccccucggg cccgcca 77 <210> <211> <212> <213> 14 77 ARN Methanococcus jannaschii <400> 14 gggcccguag cucagucugg cagagcgccu ggcuuuuaac cagguggucg aggguucaaa 6o ucccuucggg cccgcca 77 <210> <211> <212> <213> 15 77 ARN Methanobacterium thermoautotrophicum <400> 15 gggcccguag cucagucugg cagagcgcuu ggcuuuuaac caaguggucg cggguucaau 60 ucccgucggg cccgcca 77 <210> <211> <212> <213> 16 77 ARN Methanosarcina mazeii <400> 16 gggcccguag cuuagucugg uagagcgccu gacuuuuaau caggcggucg aggguucgaa 60 ucccuucggg cccgcca 77 <210> <211> <212> <213> 17 77 ARN Sulfolobus tokodaíí <400> 17 gggcccguag cucagccagg uagagcggcg ggcucuuaac ccguaggucc cggguucaaa 60 77 ucccggcggg cccgcca ΕΡ 1 914 314/ΡΤ 113 <210> <211> <212> <213> 18 77 ARN Sulfolobus tokodaii <400> 18 gggcccguag cucagccagg uagagcggcg ggcuuuuaac ccguaggucc cggguucaaa ucccggcggg cccgcca <210> <211> <212> <213> 19 77 ARN Pyrobaculum aerophílum <400> 19 gggcccguag cucagccugg uagagcggcg ggcucuuaac ccguaggucg uggguucgaa ucccaccggg cccgcca <210> <211> <212> <213> 20 77 ARN Archaeoglobus fulgidus <400> 20 gggcucguag cucagccagg cagagcgacg ggcuuuuaac ccgucggucg cggguucaaa ucccgucgag cccgcca <210> <211> <212> <213> 21 76 ARN Sulfolobus solfataricus <400> 21 gggcccguag cuuagccagg uagagcgacg ggcucuuaac ccguaguccç ggguucgaau cccggcgggc ccgcca <210> <211> <212> <213> 22 79 ARN Aeropyrum pernix <400> 22 gggcccguag cucagccugg uagagcggcg ggcucuuacc ccgcggaagu cccggguuca aaucccggcg ggcccgcca <210> <211> <212> <213> 23 80 ARN Artificial <220> <223> ARNt de consenso <220> <221> misc_feature <222> (36)..(36) <223> η indica ausência de consenso (u ou c) <220> <221> misc_feature <222> (43)..(43) <223> n indica ausência de consenso (gap ou c) <220> <221> misc_feature <222> (44)..(44) <223> n indica ausência de consenso (gap ou g) <400> 23 gggcccguag cucagccugg uuagagcggc gggcunuuaa ccnncggagg ucgcggguuc aaaucccgcc gggcccgcca <210> 24 <211> 77 <212> ARN <213> Artificial <220> <223> ARNt derivado de consenso AKCUA <400> 24 gggcccguag cucagccugg uagagcggcg ggcucuaaac ccgcaggucg cggguucaaa ucccgccggg cccgcca <210> 25 <211> 78 <212> ARN <213> Artificial <220> <223> biblioteca de ARNt derivada de consenso <220> <221> misc_feature <222> (1)..(4) <223> n é a, c, g ou u <220> <221> misc_feature <222> (71)..(74) <223> n é a, c, g ou u <400> 25 nnnnccguag cucagccugg uagagcggcg ggcuuccuaa cccgcagguc gcggguucaa aucccgccgg nnnngcca <210> 26 <211> 78 <212> ARN <213> Artificial 60 115 ΕΡ 1 914 314/ΡΤ <2 2 Ο > <223> ARNt mutante <4 Ο Ο > 26 ugguccguag cucagccugg uagagcggcg ggcuuccuca cccgcagguc gcggguucaa aucccgccgg acuagcca <210> 27 <211> 1092 <212> ADN <213> Artificial <220> <223> ARNt-sintetase mutante <400> 27 atggCtcatt gggccgatta tattgcCgat aaaataatta gagagagggg ggagaaggag aagtacgttg ttgagagtgg aataacgcca agtggttacg ctcacgttgg gaactttagg' gagcttttta cagcttatat tgtgggccat gccctaaggg ataaggggta tgaggttagg cacatccaca tgtgggatga ttatgataga tttaggaagg ctccaaggaa cgttccccag gaatggaaag attacctggg aatgcccatt agtgaagttc ctgatccctg gggatgccat gagagttatg ctgaacactt catgagaaag ttcgaggagg aggtagaaaa attagggatc gaagttgact ttctttatgc gagtgaactc tacaagagag gggaatattc tgaggagata aggttagcct ttgagaaaag ggataagata atggagatac taaacaagta tagggaaatt gcgaaacaac ctccccttcc agagaactgg tggcccgcaa tggtttactg ccctgagcat aggagggaag cagagatcat tgaatgggat gggggctgga aggttaagca taagtgcccc gaaggtcacg agggatgggt tgatataagg agtgggaacg tgaaactgag gtggcgtgtt gattggccca tgcgttggtc tcactttggc gttgacttcg aacctgctgg aaaggatcat cttgcggctg gctcaagcta cgatacggga aaggagatta taaaggaagt ttatggaaag gaagctccgt tatctttaat gtatgagttt gttggaatta aggggcagaa ggggaagatg agtggtagta agggaaatgt tatcttactc agcgatctgt atgaggttct tgagccaggc ctcgttagat ttatctacgc tcggcatagg ccaaacaagg agataaagat agatccaggt cttggcattc caaacctcta cgatgagttc gataaagttg agagaatata cttcggggtt gagggtggta aaggtgatga tgaagaatta aggaggactt acgagctttc ggtgatgctg ccaacttact ga <210> 28 <211> 363 <212> PRT <213> Artificial <220> <223> ARNt-sintetase mutante 78 60 120 1B0 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1092 116 ΕΡ 1 914 314/ΡΤ <400> 28
Met Val His Trp Ala Asp Tyr Ile Ala Asp Lys Ile Ile Arg Glu Arg 1 5 10 15
Gly Glu Lys Glu Lys Tyr Val Val Glu Ser Gly Ile Thr Pro Ser Gly 20 25 30
Tyr Val His Val Gly Asn Phe Arg Glu Leu Phe Thr Ala Tyr Ile Val 35 40 45
Gly His Ala Leu Arg Asp Lys Gly Tyr Glu Val Arg His Ile His Met 50 55 60
Trp Asp Asp Tyr Asp Arg Phe Arg Lys Val Pro Arg Asn Val Pro Gin 65 70 75 80
Glu Trp Lys Asp Tyr Leu Gly Met Pro Ile Ser Glu Val Pro Asp Pro B5 90 95
Trp Gly Cys His Glu Ser Tyr Ala Glu His Phe Met Arg Lys Phe Glu 100 105 110
Glu Glu Val Glu Lys Leu Gly Ile Glu Val Asp Phe Leu Tyr Ala Ser 115 120 125
Glu Leu Tyr Lys Arg Gly Glu Tyr Ser Glu Glu Ile Arg Leu Ala Phe 130 135 140
Glu Lys Arg Asp Lys Ile Met Glu ile Leu Asn Lys Tyr Arg Glu Ile 145 150 155 160
Ala Lys Gin Pro Pro Leu Pro Glu Asn Trp Trp Pro Ala Met Val Tyr 165 170 175
Cys Pro Glu His Arg Arg Glu Ala Glu Ile Ile Glu Trp Asp Gly Gly 180 185 190
Trp Lys val Lys Tyr Lys Cys Pro Glu Gly His Glu Gly Trp Val Asp 195 200 205
Ile Arg Ser Gly Asn Val Lys Leu Arg Trp Arg Val Asp Trp Pro Met 210 .215 220
Arg Trp Ser His Phe Gly Val Asp Phe Glu Pro Ala Gly Lys Asp His 225 230 235 240
Leu Val Ala Gly Ser Ser Tyr Asp Thr Gly Lys Glu Ile Ile Lys Glu 245 250 255
Val Tyr Gly Lys Glu Ala Pro Leu Ser Leu Met Tyr Glu Phe Val Gly 260 265 270
Ile Lys Gly Gin Lys Gly Lys Met Ser Gly Ser Lys Gly Asn Val Ile 275 280 285 117 ΕΡ 1 914 314/ΡΤ
Leu Leu Ser Asp Leu Tyr Glu Vai Leu Glu Pro Gly Leu Vai Arg Phe 290 295 300 Ile Tyr Ala Arg His Arg Pro Asn Lys Glu Ile Lys Ile Asp Leu Gly 30S 310 315 320 Leu Gly Ile Leu Asn Leu Tyr Asp Glu Phe Asp Lys Vai Glu Arg Ile 325 330 335 Tyr' Phe Gly Vai Glu Gly Gly Lys Gly Asp Asp Glu Glu Leu Arg Arg 340 345 3S0 Thr Tyr Glu Leu Ser Vai Met Leu Pro' Thr Tyr 3S5 360 <210> 29 <211> 1572 <212> ADN <213> Artificial <220> <223> ARNt-sintetase mutante <400> 29 atggttcatt gggccgatta tattgctgat aaaataatta gagagagggg ggagaaggag 60 aagtacgttg ttgagagtgg aataacgcca agtggttacg ttcacgttgg gaactttagg 120 gagcttttta cagcttatat tgtgggccat gccctaaggg ataaggggta tgaggttagg 180 cacatccaea tgtgggatga ttatgataga tttaggaagg ttccaaggaa cgttccccag 240 gaatggaaag attacctggg aatgcccatt agtgaagttc ctgatccctg gggatgccat 300 gagagtEatg ctgaacactt catgagaaag ttcgaggagg aggtagaaaa attagggatc 360 gaagttgact ttctttatgc gagtgaactc tacaagagag gggaatattc tgaggagata 420 aggttagcct ttgagaaaag ggacaagata aeggagatac taaacaagta tagggaaatt 480 gcgaaacaac ctccccttcc agagaactgg tggcccgcaa tggtctactg ccctgagcat 540 aggagggaag « cagagatcat tgaatgggat gggggctgga aggttaagta taagtgcccc 600 gaaggtcacg agggatgggt tgatataagg agtgggaacg tgaaactgag gtggcgtgtt 660 gattggccca tgcgttggtc tcactttggc gttgactecg aacctgctgg aaaggatcat 720 cttgtggctg gttcaagcta cgatacggga aaggagatta taaaggaagt ttatggaaag 780 gaagccccgt tatctctaat gtatgagttt gttggaatta aggggcagaa ggggaagatg 840 agtggtagta agggaaatgt tattttactc agcgatctgt atgaggttct tgagccaggt 900 ctcgttagat ttatctacgc tcggcatagg ccaaacaagg agataaagat agatctaggt 960 118 ΕΡ 1 914 314/ΡΤ cttggcattc taaacctcta cgatgagttc gataaagttg agagaatata cttcggggtt 1020 gagggtggta aaggtgatga tgaagaatta aggaggactt acgagctttc aatgcctaag 1080 aagcctgsga gattagtcgc tcaagctcct tttaggttcc tagcggtgtt ggttcagtta 1140 ccgcatttaa ccgaagaaga cataataaat gttctaatca aacagggaca tattcccagg 1200 gatctatcca aggaggacgt tgagagggtt aaacttagga taaaccttgc taggaattgg . 1260 gttaaaaagt atgcccctga ggatgttaaa ttctcaatac ttgagaaacc tccagaagtt 1320 gaggtaagtg gagatgttag ggaggccatg aatgaggttg ctgagtggct tgagaatcat 1380 gaggaattta gcgttgaaga gtttaataac attctattcg aagttgccaa gaggaggggg 1440 atatccagta gggagtggtt ttcgacgctc tacagattat ttattggaaa ggaaagggga 1500 ccgagattgg ccagtttcct ggcatctctt gataggagtt tcgttattaa acgacttaga . 1560 cttgagggat ag 1572 <210> 30 <211> 523 <212> PRT <213> Artificial <220> <223> ARNt sintetase mutante <400> 30
Met Vai His Trp Ala Asp Tyr Ile Ala Asp Lya Ile Ile Arg Glu Arg 1 5 10 15
Gly Glu Lys Glu Lys Tyr Vai Vai Glu Ser Gly Ile Thr Pro Ser Gly 20 25 30
Tyr Vai His Vai Gly Asn Phe Arg Glu Leu Phe Thr Ala Tyr Ile Vai 35 40 45
Gly His Ala Lêu Arg Asp Lys Gly Tyr Glu Vai Arg His Ile His Met 50 55 60
Trp Asp Asp Tyr Asp Arg Phe Arg.Lys Vai Pro Arg Asn Vai Pro Gin 65 70 75 80
Glu Trp Lys Asp Tyr Leu Gly Met Pro Ile Ser Glu Vai Pro Asp Pro 85 90 95 -
Trp Gly Cys His Glu Ser Tyr Ala Glu His Phe Met Arg Lys Phe Glu. 10Q 105 110 119 ΕΡ 1 914 314/ΡΤ
Glu Glu Vai Glu Lys Leu Gly Ile Glu Vai Asp Phe Leu Tyr Ala Ser 115 120 125
Glu Leu Tyr Lys Àrg Gly Glu Tyr Ser Glu Glu Ile Arg Leu Ala Phe 130 135 140
Glu Lys Arg Asp Lys Ile Met Glu Ile Leu Asn Lys Tyr Arg Glu Ile 145 150 155 160
Ala Lys Gin Pro Pro Leu Pro Glu Asn Trp Trp Pro Ala Met Vai Tyr 165 170 17S
Cys Pro Glu His Arg Arg Glu Ala Glu Ile Ile Glu Trp Asp Gly Gly 180 185 190
Trp Lys Vai Lys Tyr Lys Cys Pro Glu Gly His Glu Gly Trp Vai Asp 195 200 205
Ile Arg Ser Gly Asn Vai Lys Leu Arg Trp Arg Vai Asp Trp Pro Met 210 215 220
Arg Trp Ser His Phe Gly Vai Asp Phe Glu Pro Ala Gly Lys Asp His 225 230 235 240
Leu val Ala Gly Ser Ser Tyr Asp Thr Gly Lys Glu Ile Ile Lys Glu 245 250 255
Val Tyr Gly Lys Glu Ala Pro Leu Ser Leu Met Tyr Glu Phe Val Gly 260 265 270
Ile Lys Gly Gin Lys Gly Lys Met Ser Gly Ser Lys Gly Asn val Ile 275 280 285
Leu Leu Ser Asp Leu Tyr Glu Val Leu Glu Pro Gly Leu Val Arg Phe 290 295 300
Ile Tyr Ala Arg His Arg Pro Asn Lys Glu Ile Lys Ile Asp Leu Gly 305 310 315 320
Leu Gly Ile Leu Asn Leu Tyr Asp Glu Phe Asp Lys Val Glu Arg Ile 325 330 335
Tyr Phe Gly Val Glu Gly Gly Lys Gly Asp Asp Glu Glu Leu Arg Arg 340 345 350 120 ΕΡ 1 914 314/ΡΤ
Thr Tyr Glu Leu Ser Met Pro Lys Lys Pro Glu Arg Leu Vai Ala Gin 355 360 365
Ala Pro Phe Arg phe Leu Ala Vai Leu Vai Gin Leu Pro His Leu Thr 370 375 380
Glu Glu Asp lie Ile Asn Vai Leu Ile Lys Gin Gly His Ile Pro Arg 385 390 395 400
Asp Leu Ser Lys Glu Asp Vai Glu Arg Vai Lys Leu Arg Ile Asn Leu 405 410 415
Ala Arg Asn Trp vai Lys Lys Tyr Ala Pro Glu Asp Vai Lys Phe Ser 420 425 430
Ile Leu Glu Lys Pro Pro Glu Vai Glu Vai Ser Gly Asp Vai Arg Glu 435 440 445
Ala Met Asn Glu Vai Ala Glu Trp Leu Glu Asn His Glu Glu Phe Ser 450 455 460
Vai Glu Glu Phe Asn Asn Ile Leu Phe Glu Vai Ala Lys Arg Arg Gly 465 470 475 480
Ile Ser Ser Arg Glu Trp Phe Ser Thr Leu Tyr Arg Leu Phe Ile Gly 485 490 495
Lys Glu Arg Gly Pro Arg Leu Ala Ser Phe Leu Ala Ser Leu Asp Arg 500 505 510
Ser Phe Vai Ile Lys Arg Leu Arg Leu Glu Gly . 515 520 <210> 31 <211> 4813 <212> ADN <213> Artificial <220> <223> plasmideo pACKO-A184TAG <220> <221> misc_feature <222> (3749)..(3749) <223> n é a, c, g, ou t <220> <221> misc_feature <222> (3769)..(3769) <223> n é a, c, g, ou t 121 ΕΡ 1 914 314/ΡΤ 400> 31 gaactccgga tgagcattca tcaggcgggc aagaatgtga ataaaggccg gataaaactt 60 gtgcttattt ttctttacgg tctttaaaaa ggccgcaata tccagctgaa cggtctggtt 120 ataggtacat tgagcaactg actgaaatgc ctcaaaatgt tctttacgat gccattggga 180 tatatcaacg gtggtatatc cagtgatttt tttctccatt ttagcttcct tagctcctga 240 aaatctcgat aactcaaaaa atacgcccgg tagtgatctt atttcattat ggtgaaagtt 300 ggaacctctt acgtgccgat caacgtctca ttttcgccaa aagttggccc agggcttccc 360 ggtatcaaca gggacaccag gatttattta ctctgcgaag tgatcttccg tcacaggtat 420 ttattcggcg caaagtgcgt cgggtgatgc tgccaactta ctgatttagt gtatgatggt 480 gtttttgagg tgctccagtg gcttctgttt ctatcagctg tccctcctgt tcagccactg 540 acggggtggt gcgtaacggc aaaagcaccg ccggacacca gcgctagcgg agtgtatact 600 ggcttactat gttggcactg atgagggtgt cagtgaagtg cttcatgtgg caggagaaaa 660 aaggctgcac cggtgcgtca gcagaatatg tgatacagga tatattccgc ttcctcgctc 720 actgactcgc tacgctcggt cgttcgactg cggcgagcgg aaatggctta cgaacggggc 780 ggagatttcc tggaagatgc caggaagata cttaacaggg aagtgagagg gccgcggcaa 840 agccgttttt ccataggctc cgcccccctg acaagcatca cgaaatctga cgctcaaatc 900 agtggtggcg aaacccgaca ggactataaa gataccaggc gttfcccccct ggcggctccc 960 tcgtgcgctc tcctgttcçt gcctttcggt ttaccggtgt cattccgctg ttatggccgc 1020 gtttgtctca ttccacgcct gacactcagt tccgggtagg cagttcgctc caagctggac 1080 tgtatgcacg aaccccccgt tcagtccgac cgctgcgcct tatccggtaa ctatcgtctt 1140 gagtccaacc cggaaagaca tgcaaaagca ccactggcag cagccactgg caattgattc 1200 agaggagtta gtcttgaagt catgcgccgg ttaaggccaa actgaaagga caagttttgg 1260 tgactgcgct cctccaagcc agttacctcg gttcaaagag ttggtagctc agagaacctt 1320 cgaaaaaccg ccctgcaagg cggttttttc gttttcagag caagagatta cgcgcagacc 1380 aaaacgatct caagaagatc atcttattaa tcagataaaa tatttctaga tttcagtgca 1440 atttatctct tcaaatgcag cacctgaagt cagccccaca cgatataagt tgtaattctc 1S00 atgtttgaca gcttatcatc gataagcttt aatgcggtag tttatcacag ttaaattgct 1560 aacgcagcca ggcaccgtgt atgaaatcta acaatgcgct catcgtcatc ctcggcaccg 1620 tcaccctgga tgctgtaggc ataggcttgg ttatgccggt actgccgggc ctcttgcggg 1680 atatcggttt cttagacgtc aggtggcact tttcggggaa atgtgcgcgg aacccctatt 1740 122 ΕΡ 1 914 314/ΡΤ tgettatttt tctaaataca ttcaaatatg tatccgctca tgagacaata accctgataa 1800 atgcttcaat aatattgaaa aaggaagagt atgagtattc aacatttccg tgtcgccctt ' 1860 attccctttt ttgcggcatt ttgccttcct gtttttgctc acccagaaac gctggtgaaa 1.92.0 gtaaaagatg ccgaagatca gttgggtgca cgagtgggtt acatcgaact ggatctcaac 1980 agcggtaaga tecttgagag ttttcgcccc gaagaacgct ttccaatgat gagcactttt 2040 aaagttctgc tatgtggcgc ggtattatcc cgtgttgacg' ccgggcaaga gcaactcggt 2100 cgccgcatac actattctca gaaegacttg gttgagtact caccagtcac agaaaagcat 2160 cttacggatg gcatgacagt aagagaatta tgcagtgctg ccataaccat gagtgataac 2220 actgcggcca acctacttct gacaacgatc ggaggaccga. aggagctaac- cgcttttttg 2280 cacaacatgg gggatcatgt aactcgcctt gatcgttggg aaccggagct gaatgaagcc 2340 ataccaaacg acgagcgtga caccácgatg ccttaggcaa tggcaacaac gttgcgcaaa 2400 ctattaactg gcgaactact tactctagct tcccggcaac aattaataga ctggatggag 2460 gcggacaaag ttgcaggacc acttctgcgc ccggccctcc cggccggctg gtccactgct 2S20 gataaatctg gagccggtga gcgtgggtct cgcggtatca ttgcagcact ggggccagat 2580 ggtaagceet cccgtatcgt agttatctac acgacgggga gtcaggcaac tatggatgaa 2640 cgaaatagac agatcgctga gataggtgcc tcactgatta agcattggca ccaccaccac 2700 caccactaac ccgggaccaa gtttactcat atatacttta gattgattta aaacttcatt 2760 tttaatttaa aaggatctag gtgaagatcc tttttgataa tctcatgacc aaaatccctt 2820 aacggcatgc accattcctt gcggcggcgg tgctcaacgg cctcaaccta ctactgggct 2880 gctccctaae gcaggagtcg cataagggag agcgtctggc gaaaggggga tgtgctgcaa 2940 ggcgattaag ttgggtaacg ccagggtttt cccagtcacg acgttgtaaa acgacggcca 3000 gtgccaagct taaaaaaaat ccttagcctt cgctaaggat ctgcagttat aatctctttc 3060 taattggctc taaaatcttt ataagttctt cagctacagc attttttaaa tccattggat 3120 gcaattcctt atttttaaat aaactctcta actcctcata gctattaact gtcaaatctc 3180 caccaaattt ttctggcctt tttatggtta aaggatattc aaggaagtat ttagctatct 3240 ccattattgg atttccttca acaactccag ctgggcagta tgctttcttt atcttagccc 3300 taatctcttc tggagagtca tcaacageta taaaattccc ttttgaagaa ctcatctttc 3360 cttctccatc caaacccgtt aagacagggt tgtgaataca aacaaccttt tttggtaaaa 3420 gctcccttgc taacatgtgt atttttctct gctccatccc tccaactgca acatcaacgc 3480 ctaaataatg aatatcatCa acctgcatta ttggatagat aacttcagca acctttggac 3540 tttcatcctc tettgctáta agttccatac tccttcttgc tctttttaag gtagttttta 3600 123 ΕΡ 1 914 314/ΡΤ aagccaatet atagacattc agtgtataat ccttatcaag ctggaattca gcgttacaag . 3660 tattacacaa agttttttat gttgagaaca tttttttgat ggggcgccac ttatttttga 3720 tcgttcgctc aaagaagcgg cgccagggnt gtttttcttt tcaccagtna gacgggcaac 3780 agaacgccat gagcggcctc atttcttatt ctgagttaca acagtccgca ccgctgtccg 3840 gtagctcctt ccggtgggcg cggggcatga ctatcgtcgc cgcacttatg actgtcttct 3900 ttatcatgca actcgtagga caggtgccgg cagcgcccaa cagtcccccg gccacggggc 3960 ctgccaccat acccacgccg aaacaagcgc cctgcaccat tatgttccgg atctgcatcg 4020 caggatgctg ctggctaccc tgtggaacac ctacatctgt attaacgaag cgctaaccgt 4080 ttttatcagg ctctgggagg cagaataaat gatcatatcg tcaatcatta cctccacggg 4140 gagagcctga gcaaactggc ctcaggcatt tgagaagcac acggtcacac tgcttccggt 4200 agtcaataaa ccggtaaacc agcaatagac ataagcggct atttaacgac cctgccctga 4260 accgacgacc gggtcgaatt tgctttcgaa tttctgccat tcatccgctt attatcactt 4320 attcaggcgt agcaccaggc gtttaagggc accaataact gccttaaaaa aattacgccc 4380 cgccctgcca ctcatcgcag tactgttgta attcattaag cattctgccg acatggaagc 4440 catcacagac ggcatgatga acctgaatcg ccagcggcat cagcaccttg tcgccttgcg 4500 tataatattt gcccatggtg aaaacggggg cgaagaagtt gtccatattg gccacgttta 4S60 aatcaaaact ggtgaaactc. acccagggat tggctgagac gaaaaacata ttctcaataa 4620 accctttagg gaaataggcc aggttttcac cgtaacacgc cacatcttgc gaatatatgt 4680 gtagaaactg ccggaaatcg tc.gtggtatt cactccagag cgatgaaaac gtttcagttt 474 0 gctcatggaa aacggtgtaa caagggtgaa cactatccca tatcaccagc tcaccgtctt 4800 tcattgccat acg 4813 <210> 32 <211> 4814 <212> ADN <213> Artificial <220> <223> plasmídeo pACKO-A184AGGA <220> <221> misc_feature <222> (3750)..(3750) <223> η é a, c, g, ou t <220> <221> misc_feature <222> (3770)..(3770) <223> n é a, c, g, ou t 124 ΕΡ 1 914 314/ΡΤ <400> 32 gaactccgga gtgcttattt ataggcacac tatatcaacg aaatctcgat ggaacctctt ggtatcaaca ttattcggcg gtttttgagg acggggtggt ggcttactat aaggctgçac actgactcgc ggagatttcc agccgttttt agtggtggcg tcgtgcgctc gtttgtctca tgtatgcacg gagtccaacc agaggagtta tgactgcgct cgaaaaaccg aaaacgatct atttatctct atgtttgaca aacgcagtca tcaccctgga atatcggttt tgagcattca ttctttacgg
Cgagcaactg gtggtatatc aactcaaaaa acgtgccgat gggacaccag caaagtgcgt tgctccagtg gcgtaacggc gttggcactg cggtgcgtca tacgctcggt tggaagatgc ccataggctc aaacccgaca tcctgttcct ttccacgcct aaccccccgt cggaaagaca gtcttgaagt cctccaagcc ccctgcaagg caagaagatc tcaaatgtag gcttatcatc ggcaccgtgt tgctgtaggc cttagacgtc tcaggcgggc tctttaaaaa actgaaatgc cagtgatttt atacgcccgg caacgtctca gatttattta cgggtgatgc gcttctgttt aaaagcaccg atgagggtgt gcagaatatg cgttcgactg caggaagata cgcccccctg ggactataaa gcctttcggt gacactcagt tcagtccgac tgcaaaagca catgcgccgg agttacctcg cggttttttc auL·!» ^αοι,αα cacctgaagt gataagcttt atgaaatcta ataggcttgg aggtggcact aagaatgtga ggccgtaata cccaaaa.tgc tttctccatt tagtgatctt ttttcgccaa' ttcCgcgaag tgccaactta ctatcagctg ccggacatca cagtgaagtg tgatacagga cggcgagcgg ctCaacaggg acaagcatca gataccaggc ttaccggtgt tccgggtagg cgctgcgcct ccactggcag ttaaggctaa gttcaaagag gttttcagag tcagataaaa cagccccata aatgcggtag acaatgcgct ttatgccggt tttcggggaa ataaaggccg tccagctgaa tctttacgac ttagcttcct atttcattat aagttggccc tgatcttccg ctgatttagt tccctcctgt gcgctagcgg cttcatgtgg tatattccgc aaatggctca aagtgagagg cgaaatctga gtttçcccct cattccgctg cagttcgctc tatccggtaa cagccactgg actgaaagga ttggtagctc caagagatta tatttctaga cgatataagt tttatcacag catcgtcatc actgccgggc aCgtgcgcgg gataaaactt cggtctggtt gccattggga tagctcctga ggtgaaagtt agggcttcec tcacaggtat gtatgatggt tcagctactg agtgtatact caggagaaaa ttcctcgctc cgaacggggc gccgcggcaa cgctcaaatc ggcggctccc ttatggccgc caagctggac ctatcgtctt taattgatCt caagttttgg agagaacctt cgcgcagacc tttcagtgca tgtaactctc ttaaattgct ctcggcaccg ctcttgcggg aacccctatt 60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 1200 1260 1320 1380 λ λ λ r\ 1.11 \β 1500 1560 1620 1680 1740 125 ΕΡ 1 914 314/ΡΤ tgtttaCttt Cctaaataca ttcaaatatg catccgctca tgagacaata accctgataa 1800 atgcttcaat aatattgaaa aaggaagagt atgagtactc aacatttccg tgtcgccctt 1860 attccctttt ttgcggcatc ttgcccccct gtctttgctc acccagaaac gctggtgaaa 1920 gtaaaagatg ctgaagatca gttgggtgca cgagtgggtt acatcgaact ggacctcaac 1980 agcggtaaga tccttgagag ttttcgcccc gaagaacgtt CCccaatgat gagcactttt 2040 aaagttccgc tatgcggcgc ggtattatcc cgtgttgacg ccgggcaaga gcaactcggt 2100 cgccgcatac actattctca gaatgacttg gctgagtact caccagtcac agaaaagcat 2160 cttacggatg gcatgacagt aagagaatta tgcagtgctg ccataaccat gagtgataac 2220 actgcggcca acttacttct gacaacgaCc ggaggaccga aggagccaac cgcttttttg 2280 cacaacatgg gggatcatgt aactcgcctt gatcgttggg aaccggagct gaatgaagcc 2340 ataccaaacg acgagcgtga caccacgatg cctaggagca atggcaacaa cgttgcgcaa 2400 actattaact ggcgaactac ttactctagc ttcccggcaa caattaatag actggatgga 2460 ggcggataaa gttgcaggac cacctctgcg ctcggccctt ccggctggct ggtttattgc 2520 tgataaacct ggagccggtg agcgtgggtc tcgcggtatc actgcagcac tggggccaga 2580 tggtaagccc tcccgtatcg tagttatcta cacgacgggg agtcaggcaa ctatggatga 2640 acgaaataga cagatcgctg agataggtgc ctcactgatt aagcattggc accaccacca 2700 ccaccactaa cccgggacca agtttactca tatatacttt agattgattt aaaacttcat 2760 ttttaattta aaaggatcta ggCgaagatc ctttttgata atctcatgac caaaatccct 2820 taacggcatg caccattcct tgcggcggcg gtgctcaacg gcctcaacct actactgggc 2380 tgcttcctaa tgcaggagtc gcataaggga gagcgtctgg cgaaaggggg atgtgctgca 2940 aggcgattaa gctgggtaac gccagggttt tcccagtcac gacgttgtaa aacgacggcc 3000 agtgccaagc ttaaaaaaaa tccttagctt tcgctaagga tctgcagtta taatctcttt 3060 ctaattggct ctaaaatctt tataagttct tcagctacag cattttttaa atccattgga 3120 cgcaactcct tacctccaaa taaactctct aactcctcat agctattaac tgtcaaatct 3180 ccaccaaatt tttctggcct ttttatggtt aaaggatatt caaggaagta tttagctatc 3240 tccattattg gatttccttc aacaactcca gctgggcagt atgctttctt tatcttagcc 3300 ctaatctctt ctggagagtc atcaacagct ataaaattcc cttttgaaga actcatcttt 3360 ccttctccat ccaaacccgt taagacaggg ttgtgaatac aaacaacccc ttctggtaaa 3420 agctcccttg ctaacatgtg tatttttctc tgctccatcc ctccaactgç aacatcaacg 3480 cctaaacaat gaatatcatt aacctgcatt attggataga taacttcagc aacctCtgga 3540 ttttcatcct ctcttgctat aagccccata ctcctccttg ctcttcttaa ggtagctttt 3600 126 ΕΡ 1 914 314/ΡΤ aaagccaatc tatagacatt cagcgtataa tccttatcaa gctggaattc agcgttacaa 3660 gtattacaca aagtttttta tgttgagaat attttttcga tggggcgcca cttatttttg 3720 atcgttcgct caaagaagcg gcgccagggn tgtttttctt. ttcaccagtn agacgggcaa 3780 cagaacgcca tgagcggcct catttcttat tctgagttac aacagtccgc accgctgtcc 3840 ggtagctcct tccggtgggc gcggggeatg actatcgtcg ccgcacttat gactgtcttc 3900 tttatcatgc aaetcgtagg acaggtgccg gcagcgccca acagtccccc ggccacgggg 3960 cctgccacca tacccacgcc gaaacaagcg ccctgcacca ttatgttccg gatctgcatc 4020 gcaggatgct gctggctacc ctgtggaaca cctacatctg tattaacgaa gcgctaaccg 4080 tttttatcag gctctgggag gcagaataaa tgatcatatc gtcaattatt acctccacgg 4140 ggagagcctg agcaaactgg cctcaggcat ttgagaagca cacggtcaca ctgcttccgg 4200 tagtcaataa accggtaaac cagcaataga cataagcggc tatttaacga ccctgccctg 4260 aaccgacgac cgggtcgaat ttgctttcga atttctgcca ttcatccgct tattatcact 4320 tattcaggcg tagcaccagg cgtteaaggg caccaataac tgccttaaaa aaattacgcc 4380 ccgccctgcc actcatcgca gtactgttgt aattcattaa gcattctgcc gacatggaag 4440 ccatcacaga cggcatgatg aacctgaatc gccagcggca tcagcacctt gtcgccttgc 4500 gtataatatt tgcccatggt gaaaacgggg gcgaagaagt tgtccatatt ggccácgttt 4560 aaaccaaaac tggtgaaact cacccaggga ttggctgaga cgaaaaacat attctcaata 4620 aaccctttag ggaaataggc caggttttca ccgtaacacg ccacatcttg cgaatatatg 46B0 tgtagaaact gccggaaatc gtcgtggtat tcactccaga gcgatgaaaa cgtttcagtt 4740 tgctcatgga aaacggtgta acaagggtga acactatccc atatcaccag ctcaccgtct 4800 ttcattgcca tacg 4814 <210> 33 <211> 4338 <212> ADN <213> Artificial <220> <223> plasmídeo pACkO-Bla <220> <221> misc_feature <222> (3274) .. (3274) <223> η é a, c, g, ou t <220> <221> misc_feature <222> (3294)..(3294) <223> n é a, c, g, ou t 127 ΕΡ 1 914 314/ΡΤ <400> 33 gaactccgga tgagcaCtca tcaggcgggc aagaacgtga aCaaaggccg gataaaactt. 60 gtgcttattt ttctttacgg tctttaaaaa ggccgtaata cccagctgaa cggtctggtt 120 ataggtacat tgagcaactg actgaaatgc ctcaaaatgt tctttacgat gccatCggga 180 tatatcaacg gtggtatatc cagtgatttt tttctccatt ttagcttcct tagctcccga 240 aaatctcgat aactcaaaaa atacgcccgg tagtgatctt attccattat ggtgaaagtt 300 ggaacctctt acgtgccgat caacgtctca ttttcgccaa aagttggccc agggctcccc - 360 ggtatcaaca gggacaccag gatttattta ttctgcgaag tgatcttccg tcacaggtat 420 ttattcggcg caaagtgcgt cgggtgatgc tgccaactta ctgatttagt gtatgatggt 480 gttcccgagg tgctccagtg gcttctgttt ctaccagctg tccctcctgc tcagccactg 540 acggggtggc gcgtaacggc aaaagcaccg ccggacatca gcgctagcgg agtgtatact 600 ggcttactat gttggcactg atgagggtgt cagtgaagtg cttcatgtgg caggagaaaa 660 aaggctgcac cggtgcgtca gcagaatatg tgatacagga tatattccgc ttcetcgctc 720 actgactcgc tacgctcggt cgttcgactg cggcgagcgg aaatggctta cgaacggggc 780 ggagatttcc tggaagatgc caggaagata cttaacaggg aagtgagagg gccgcggcaa 840 agccgttttt ccataggctc cgcccccctg acaagcatca cgaaatctga cgctcaaatc 900 agtggtggcg aaacccgaca ggactataaa gataccaggc gtttccccct ggcggctccc 960 tcgtgcgctc tcctgttcct gcctttcggt ttaccggtgt catcccgctg ttatggccgc 1020 gtttgtctca ttccacgcct gacactcagt tccgggtagg cagttcgctc caagctggac 1080 tgtatgcacg aaccccccgt tcagtccgac cgctgcgcct tatccggtaa ctatcgtctt 1140 gagtccaacc cggaaagaca tgcaaaagca ccactggcag'cagccactgg taattgattt 1200 agaggagtta gtcttgaagt catgcgccgg ttaaggctaa acCgaaagga caagttttgg 1260 tgactgcgct cctccaagcc agttacctcg gttcaaagag ttggtagctc agagaacctt 1320 cgaaaaaccg ccctgcaagg cggttttttc gttttcagag caagagatta cgcgcagacc 1380 aaaacgatct caagaagatc atcttattaa tcagataaaa tatttctaga Cttcagtgca 1440 atttatctct tcaaatgtag cacctgaagt cagccccata cgatataagt tgtaattctc 1500 atgtttgaca gcctatcaCc gataagcttt aatgcggtag tttatcacag ttaaatcgct 1S60 aacgcagtca ggcaccgtgt atgaaatcta acaatgcgcc catcgtcatc ctcggcaccg 1620 tcaccctgga tgctgtaggc ataggcttgg ttatgccggt actgccgggc ctcttgcggg 1680 1740 atatcggttt cttagacgtc aggtggcact tttcggggaa atgtgcgcgg aacccctatt 128 ΕΡ 1 914 314/ΡΤ tgtttatttt tctaaataca ttcaaatatg atgcttcaat aatattgaaa aaggaagagt attccctttt ttgcggcatt ttgçcttcct caacggcaac aacgttgcgc aaactattaa aacaattaaC agactggatg gaggcggata ttccggctgg ctggtttatt gctgataaat tcattgcagc actggggcca gatggtaagc ggagtcaggc aactatggat gaacgaaata ttaagcattg gtaacccggg accaagttta tcatttttaa tttaaaagga tctaggtgaa cccttaacgg catgcaccat tccttgcggc gggctgcttc ctaatgcagg agtcgcataa tgcaaggcga teaagttggg taacgccagg ggccagtgcc aagcttaaaa aaaatcctta ctttctaatt ggctctaaaa tctttataag tggatgcaat tccttatttt taaataaact atctccacca aatttttctg gcctttttat tatctccatt attggatttc cttcaacaac agccctaatc tcttctggag agtcatcaac ctttccttct ccatccaaac ccgttaagac taaaagctcc cttgctaaca tgtgtatttt aacgcctaaa taatgaatat cattaacctg tggattttca tcctctcttg ctataagttc ttttaaagcc aaCctataga catccagtgt açaagtatta cacaaagttt tttatgttga tttgatcgtt cgctcaaaga agcggcgcca gcaacagaac gccatgagcg gcctcatttc gtccggtagc tccttccggt gggcgcgggg cttctttatc atgcaactcg taggacaggt ggggcctgcc accataccca ogccgaaaca catcgcagga tgctgctggc taccctgtgg tatccgctca tgagacaata accctgataa atgagtattc aacatttccg egtcgccctt gtttttgctc acccagaaac actagtgcag ctggcgaact acttactcta gcttcccggc aagttgcagg accacttctg· cgctcggccc ctggagccgg tgagcgtggg tctcgcggta cctcccgtat cgtagttatc tacacgacgg gacagatcgc tgagataggt gcct.cactga ctcatatata ccttagattg atttaaaact gatccttttt gataatctca tgaccaaaat ggcggtgctc aacggcctca acctaccact gggagagcgt ctggcgaaag ggggatgtgc gttttcccag tcacgacgtt gtaaaacgac gcttt.cgcta aggatctgca gecataatct ttcttcagct acagcatttt ttaaatccat ctctaactcc tcatagctat Caactgtcaa ggccaaagga tattcaagga agtatttagc tccagctggg cagtatgctt tctttatctt agctataaaa ttccctttcg aagaactcat agggttgtga atacaaacaa ccttttttgg tctctgctcc atccctccaa ctgcaacatc cattattgga tagataactt cagcaaccCC catactcctt cttgctcttt ttaaggtagt ataatcctta tcaagctgga attcagcgtt gaatattttt Ctgatggggc gccacttatt gggntgtttt tcttttcacc agtnagacgg ttattctgag ttacaacagt ccgcaccgct catgactatc gtcgccgcac ttatgacegt gccggcageg cccaacagtc ccccggccac agcgccctgc accattatgt tccggatctg aacacctaca ccttgtattaa egaagcgcta 1800 1860 1920 1980 2040 2100 2160 2220 2280 2340 2400 2460 2520 2580 2640 2700 2760 2820 2880 2940 3000 3060 3120 3180 3240 3300 3360 3420 3480 3540 3600 129 ΕΡ 1 914 314/ΡΤ accgctttta tcaggctctg ggaggcagaa taaatgatca eatcgtcaat tattacctcc 3660 acggggagag cctgagcaaa ctggcctcag gcatttgaga agcacacggt cacactgctt 3720 ccggtagtca ataaaccggt aaaccagcaa tagacataag cggctattta acgaccctgc 3780 cctgaaccga cgaccgggtc gaatttgctt tcgaatttct gccattcatc cgcttattat. 3840 cacttattca ggcgcagcac caggcgtcta agggcaccaa taaccgcctc aaaaaaatta 3900 cgccccgccc tgccacCcat cgcagtactg ttgtaattca ttaagcattc tgccgacatg 3960 gaagccatca cagacggcat gatgaacctg aatcgccagc ggcatcagca ccttgtcgcc 4020 ttgcgtataa tatttgccca tggtgaaaac gggggcgaag aagttgtcca tattggccac 4080 gtttaaatca aaactggCga aactcaccca gggattggct gagacgaaaa acacattctc 4140 aataaaccct ttagggaaat aggccaggtt ttcaccgtaa cacgccacat cttgcgaata 4200 tatgtgtaga aactgccgga aatcgtcgtg gtattcactc cagagcgatg aaaacgtCtc 4260 agtttgctca tggaaaacgg tgtaacaagg gtgaacacta tcccatatca ccagctcacc 4320 gtctttcatt gccatacg 4338 <210> 34 <211> 2271 <212> ADN <213> Artificial <2 2 0 > <223> plasmideo pKQ <400> 34 atggatccga gctcgagatc tgcagctggt accatatggg aattcgaagc ttgggcccga 60 acaaaaactc atctcagaag aggatctgaa tagcgccgtc gaccatcatc atcatcatca 120 ttgagtttaa acggtctcca gcttggctgt tttggcggat gagagaagat tttcagcctg 180 atacagatta aatcagaacg cagaagcggt ctgataaaac agaatttgcc tggcggcagt 240 agcgcggtgg tcccacctga ccccatgccg aactcagaag tgaaacgccg tagcgccgat 300 ggtagtgtgg ggtctcccca tgcgagagta gggaactgcc aggcatcaaa taaaacgaaa 360 ggctcagtcg aaagactggg cctttcgttt tatctgttgt ttgtcggtga acgatatcCg 420 cttttcttcg cgaattaatt ccgcttcgca acatgtgagc aaaaggccag caaaaggcca 480 ggaaccgtaa aaaggccgcg ttgctggcgt ttttccatag gctccgcccc cctgacgagc 540 atcacaaaaa tcgacgctca agtcagaggt ggcgaaaccc gacaggacta taaagatacc 600 aggcgtttcc ccctggaagc tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg 660 gataccCgtc cgcctttctc cctccgggaa gcgtggcgct ttctcatagc tcacgctgta 720 130 ΕΡ 1 914 314/ΡΤ ggtatctcag ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg 7 80. ttcagcccga ccgctgcgcc ttatccggta actatcgtct tgagtccaac ccggtaagac 840 acgacttatc gccactggca gcagccactg gtaacaggat tagcagagcg aggtatgtag . 900 gcggtgcCac agagttcttg aagtggtggc ctaactacgg ctacactaga aggacagtat 960 ctggtatctg cgctccgccg aagccagcta ccttcggaaa aagagccggt agctc.ttgat 1020 ccggcaaaca aaccaccgct ggtagcggtg gtttctttgt ttgcaagcag cagattacgc 1080 gcagaaaaaa aggatctcaa gaagatcctt tgatcttttc tacggggtct gacgctcagt 1140 ggaacgaaaa ctcacgttaa gggattttgg tcatgagttg tgtctcaaaa tctctgatgt 1200 tacattgcac aagataaaaa tatatcatca tgaacaataa aactgtctgc ttacataaac 1260 agtaacacaa ggggtgttat gagccatatt caacgggaaa cgtcttgctc gaggccgcga 1320 ttaaattcca acatggatgc tgatttatat gggtataaat gggctcgcga taatgtcggg 1380 caatcaggtg cgacaatcta tcgattgtat gggaagcccg atgcgccaga gttgtttctg 1440 aaacatggca aaggtagcgt Cgccaatgat gttacagatg agatggtcag actaaactgg 1500 ctgacggaat ttatgcctct tccgaccatc aagcatttta tccgtactcc tgatgatgca 1560 tggttaccca ccactgcgat ccccgggaaa acagcattcc aggtattaga agaatatcct 1620 gattcaggtg aaaatattgt tgatgcgctg gcagtgttcc tgcgceggtt gcattcgatt 1680 cctgtttgta attgtccttt taacagcgat cgcgtatttc gtctcgccca ggcgcaatca 1740 cgaaCgaata acggtttggt tgatgcgagt gattttgatg acgagcgtaa tggctggcct 1800 gttgaacaag tctggaaaga aatgcataag cttttgccat tctcaccgga Ctcagtcgtc 1860 actcatggtg atttctcact tgataacctt attttCgacg aggggaaatt aataggttgt 1920 attgatgCtg gacgagtcgg aatcgcagac cgataccagg atcttgccat cctatggaac 1980 tgcctcggtg agttttctcc ttcattacag aaacggcttt ttcaaaaata tggtattgat 2040 aatcctgata tgaataaatt gcagtttcat ttgatgctcg atgagttttt ctaatcagaa 2100 ttggttaatt ggttgtaaca ctggcagagc attacgctga cctgacggga cggcggcttt 2160 gttgaataaa ccgaaccttc gctgagctga aggaccctcg ggagccgcca gcccgtcccg 2220 cttataagat catacgccgt tatacgttgt tcacgcttcg aggaattaac c 2271 <210> 35 <211> 4582 <212> ADN <213> Artificial <220> <223> plasmídeo pKQ-PhKep 131 ΕΡ 1 914 314/ΡΤ <400> 35 atggttcatt gggccgatta tattgctgat aaaataatta gagagagggg ggagaaggag. 60 aagtacgttg ttgagagtgg aataacgccà agtggttacg ttcacgttgg gaactttagg . 120 gagcttttta cagcttatat tgtgggccat gccctaaggg ataaggggta tgaggttagg 180 cacatccaca tgtgggatga ttaCgataga tttaggaagg ttccaaggaa cgttccccag 240 gaatggaaag attacctggg aatgcccatt agtgaagttc ctgatccctg gggatgccat 300‘ gagagttatg ctgaacactt catgagaaag ttcgaggagg aggtagaaaa attagggatc ' 360 gaagCtgact ttctttatgc gagtgaactc tacaagagag gggaatattc tgaggagata . 420 aggttagcct ttgagaaaag ggataagata atggagatac taaaeaagta tagggaaatt 480 gcgaaacaac ctccccttcc agagaacCgg tggcccgcaa tggtttactg ccctgagcat 540 aggagggaag cagagatcat tgaatgggat gggggctgga aggttaagta Caagtgcccc 600 gaaggtcacg agggatgggt tgatataagg agtgggaacg tgaaactgag gtggcgtgtt 660 gattggccca tgcgttggtc tcactttggc gttgacttcg aacctgctgg aaaggatcat 720 cttgtggctg gttcaagcta cgatacggga aaggagatta taaaggaagt ttatggaaag 780 gaagçtccgt tatctttaat gtatgagttt gttggaatta ággggcagaa ggggaagatg 840 agtggtagta agggaaatgt tattttactc agcgacctgt atgaggttct tgagccaggt 900 ctcgttagat ttatctacgc tcggcatagg ccaaacaagg agataaagat agatctaggt 960 cttggcattc taaacctcta cgatgagttc gataaagttg agagaatata cttcggggtt 1020 gagggtggta aaggtgatga tgaagaatta aggaggactt acgagctttc ggtgatgctg 1080 ccaacttact gatttagtgt atgatggtgt ttttgaggtg ctccagtggc ttctgtttct 1140 atcagctgtc cctcctgttc agctactgac ggggtggtgc gtaacggcaa aagcaccgcc 1200 ggacatcagc gctatctctg ctctcactgc cgtaaaacat ggcaactgca gttcacttac 1260 accgcttctc aacccggtac gcaccagaaa atcattgata tggccatgaa tggcgctgga 1320 tgccgggcaa ccgcccgcat tatgggcgcc ggcctcaaca cgatttcccg ccatttaaaa 1380 aactcaggcc gcagtcggta acctcgcgca tacagccggg cagtgacgtc atcgtctgcg 1440 cggaaatgga cgaacagtgg ggatacgtcg gCgctaaatc gcgccagcgc tggctgtttt 1500 acgcgtatga caggctccgg aagacggttg ttgcgcacgt attcggtgaa cgcactatgg 1560 cgacgctggg gcgtctfatg agcctgctgt caccctttga cgtggtgata tggatgacgg 1620 atggctggcc gctgtaCgaa tcccgcctga agggaaagct gcacgtaatc agcaagcgat 1680 atacgcagcg aattgagcgg cataacctga atctgaggca gcacctggca cggctgggac 1740 1800 ggaagtcgct gtcgttctca aaatcggtgg agctgcatga caaagtcatc gggcattatc 132 ΕΡ 1 914 314/ΡΤ 3660 tgaaeataaa acactatcaa taagttggag tcattacccc gagctttcaa tgcctaagaa 1060 gcctgagaga ttagtcgctc aagctcctte taggttccta gcggtgttgg ctcagttacc 1920 gcatttaacc gaagaagaca taataaatgt CcCaatcaaa cagggacata ttcccaggga 1980 tctatccaag gaggacgttg agagggttaa acttaggata aaccttgcta ggaatcgggt 2040 Caaaaagtat gcccctgagg atgttaaatt ctcaatactt gagaaacctc cagaagttga 2100 ggtaagcgaa gatgttaggg aggccatgaa tgaggttgct gagtggcetg agaatcacga ' 2160 ggaatttagc gttgaagagt ttaataacat tctattcgaa gttgccaaga ggagggggat 2220 atccagtagg gagtggtttt cgacgctcta cagaccactc attggaaagg aaaggggacc 22S0 gagattggcc agtttcctgg catctcttga taggagtttc gttattaaac gacttagact 2340 tgagggataa gaactcgaag cttgggeccg aacaaaaact catctcagaa gaggatctga 2400 atagcgccgt cgaccatcat catcatcatc attgagttta aacggtctcc agcttggctg 2460 ttttggcgga tgagagaaga ttttcagcct gatacagatt aaatcagaac gcagaagcgg 2520 cccgacaaaa cagaacctgc ctggcggcag tagcgcggtg gccccacctg accccatgcc 2580 gaactcagaa gCgaaacgcc gtagcgccga tggtagtgtg gggtctcccc atgcgagagC 2640 agggaactgc caggcatcaa.ataaaacgaa aggctcagtc gaaagactgg gcctttcgtt 2700 ttatctgttg tttgtcggtg aacgatatct gcttttcttc gcgaattaat tccgcttcgc 2760 aacacgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc gctgccggcg 2820 tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg 2880 tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg 2940 cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga 3000 agcgtggcgc tttctcatag ctcacgctgc aggtatctca gttcggtgta ggtcgttcgc 3060 tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt 3120 aactatcgtc ttgagtccaa cçcggtaaga cacgacttat cgccactggc agcagccact 3180 ggtaacagga ttagcagagc gaggtacgca ggcggtgcta cagagttctt gaagtggtgg 3240 cctaactacg gctacactag aaggacagta tttggtatct gcgctccgct gaagccagtt 3300 accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt 3360 ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatccca agaagatccC 3420 ttgacctttt ctacggggtc tgacgctcag tggaacgaaa actcacgCCa agggattttg 3480 gtcatgagtt gtgtctcaaa atctctgatg ttacattgca caagataaaa atacatcatc '3540 atgaacaata aaactgtccg cccacacaaa cagtaataca aggggcgcca cgagccatac 3600 tcaacgggaa acgtcttgct cgaggccgcg attaaattcc aacatggatg ctgatttata 133 ΕΡ 1 914 314/ΡΤ tgggtataaa tgggetcgeg ataatgtcgg gcaaccaggt gcgacaatct atcgaccgca 3720 tgggaagccc gatgcgccag agttgtttct gaaacatggc aaaggtagcg ttgccaatga 3780 tgttacagat gagatggeca gactaaactg gctgacggaa tttatgcctc ttccgaccat 3840 caagcatttt atccgtacfcc ctgatgatgc atggttactc accactgcga tccccgggaa 3900 aacagcattc caggtattag aagaatatcc tgattcaggt gaaaatattg ttgatgcgct 3960 ggcagtgttc ctgcgccggt tgcattcgat tcctgtttgt aactgtcctt ttaacagcga 4020 tcgcgtattt cgtctcgctc aggcgcaatc acgaatgaat aacggtttgg ttgatgcgag 4080 tgattttgat gacgagcgta atggctggcc tgttgaacaa gtctggaaag aaatgcataa 4140 gcttctgcca ttctcaccgg attcagtcgt cactcatggt gatttctcac ttgataacct 4200 tatttttgac gaggggaaac taataggttg tattgatgtt ggacgagtcg gaatcgcaga 4260 ccgataccaq gatcttgcca tcctatggaa ctgcctcggt gagttttctc cttcattaca 4320 gaaacggctt tttcaaaaat atggtattga taatcctgat atgaataaat tgcagtttca 4380 tttgatgctc gatgagtttt tctaatcaga attggttaat tggttgtaac actggcagag 4440 cattacgctg acttgacggg acggcggctt tgttgaataa atcgaacttt tgctgagttg 4500 aaggatcctc gggagttgtc agcctgtccc gcttataaga tcatacgccg ttatacgttg 4560 tttacgcttt gaggaattaa cc 4582 <210> 36 <211> 30 <212> ADN <213> Artificial <220> <223> iniciador oligonucleotídico <400> 36 cagtggaatt cagtaagttg gcagcatcac 30 <210> 37 <211> 31 <212> ADN <213> Artificial <220> <223> iniciador oligonucleotídico <400> 37 cattggaatt cgagtaagtt ggcagcatca c 31
LISTAGEM DE SEQUÊNCIAS <110> The Scripps Research Institute
<120> COMPOSIÇÕES DE PARES ORTOGONAIS LISIL-ARNt E AMINOACIL-ARNt-SINTETASE E SUAS UTILIZAÇÕES <130> SJK/FP6523278 134 ΕΡ 1 914 314/ΡΤ <140> EP ainda desconhecido <141> 2004-07-07 <150> EP 0600298 9.9 <151> 2004-07-07 <150> EP 04777951.7 <151> 2004-07-07 <150> PCT/US 04/ 022187 <151> 2004-07-07 <150> US 60/485, 451 <151> 2004-07-07 <150> US 60/528, 815 <151> 2003-12-10 <150> US 60/537, 149 <151> 2003-01-15 <160> 37 <170> Patent In version 3.2 <210> 1 <211> 78 <212> ARN Λ 00 \—1 CM V Pyrococcus abyssi <400> 1 gggccgguag cuuagccugg uuagagcggc ggacucuuaa uccgcagguc ggggguucaa 60 aucccccccg gcccgcca 78
<210> 2 <211> 78 <212> ARN <213> Pyrococcus furiosus <400> 2 gggccgguag cuuagccugg uuagagcggc ggacucuuaa uccgcagguc ggggguucaa 60 aucccccccg gcccgcca 78 <210> 3
<211> 78 <212> ARN <213> Pyrococcus horikoshii <400> 3 gggccgguag cuuagccugg uuagagcggc ggacucuuaa uccgcagguc ggggguucaa 60 aucccccccg gcccgcca 78
<210> 4 <211> 78 <212> ARN <213> Pyrococcus abyssi 135 ΕΡ 1 914 314/ΡΤ <400> 4 gggccgguag cucagccugg ucagagcacc gggcuuuuaa cccggugguc gcggguucaa aucccgcccg gcccgcca
<210> 5 <211> 78 <212> ARN <213> Pyrococcus horikoshii <400> 5 gggccgguag cucagccugg ucagagcacc gggcuuuuaa cccggugguc gcggguucaa aucccgcccg gcccgcca
<210> 6 <211> 78 <212> ARN <213> Pyrococcus furiosus <400> 6 gggccgguag cucagccugg uuagagcacc gggcuuuuaa cccggugguc gcggguucaa aucccgcccg gcccgcca
<210> 7 <211> 78 <212> ARN <213> Pyrobaculum aerophilum <400> 7 gggcccguag cucagcccgg uuagagcggc gggcuuuuaa cccguagguc guggguucga aucccaccgg gcccgcca
<210> 8 <211> 77 <212> ARN <213> Thermoplasma acidophilum <400> 8 ggguccguag cuuagcuagg uagagcgaug gacucuuaau ccauagguca gggguccaaa uccccucgga cccgcca
<210> 9 <211> 77 <212> ARN <213> Thermoplasma volcaníum <400> 9 ggguccguag cuuagcuagg uagagcgaug gacucuuaau ccauagguca gggguccaaa 77 uccccucgga cccgcca ΕΡ 1 914 314/ΡΤ 136 <210> <211> <212> <213> 10 77 ARN Archaeoglobus fulgidus <400> 10 gggccgguag cuuagccagg cagagcgcgg gacucuuaau cccgcagucg gggguucaaa 60 ucccucccgg cccgcca 77 <210> <211 > <212> <213> 11 77 ARN Halobacterium sp. NRC-1 <400> 11 gggccgguag cucagucugg cagagcgacg gacucuuaau ccgucggucg cguguucaaa 60 ucgcgcccgg cccgcca 77 <210> <211> <212> <213> 12 77 ARN Thermoplasma acídophilum <400> 12 gggcccguag cucagccagg uagagcaucu ggcuuuuaac caggugguca gggguucgaa 60 cccccucggg cccgcca 77 <210> <211> <212> <213> 13 77 ARN Thermoplasma volcanium <400> 13 gggcccguag cucagccagg uagagcaucu ggcuuuuaac caggugguca gggguucgaa 60 cccccucggg cccgcca 77 <210> <211> <212> <213> 14 77 ARN Methanococcus jannaschii <400> 14 gggcccguag cucagucugg cagagcgccu ggcuuuuaac cagguggucg aggguucaaa 60 ucccuucggg cccgcca 77 <210> <211> <212> <213> 15 77 ARN Methanobacteríum thermoautotrophicum 137 ΕΡ 1 914 314/ΡΤ <4 Ο Ο > 15 gggcccguag cucagucugg cagagcgcuu ggcuuuuaac caaguggucg cggguucaau ucccgucggg cccgcca <210> <211> <212> <213> 16 77 ARN Methanosarcina mazeii <400> 16 gggcccguag cuuagucugg uagagcgccu gacuuuuaau caggcggucg aggguucgaa ucccuucggg cccgcca <210> <211> <212> <213> 17 77 ARN Sulfolobus tokodaii <400> 17 gggcccguag cucagccagg uagagcggcg ggcucuuaac ccguaggucc cggguucaaa ucccggcggg cccgcca <210> <211> <212> <213> 18 77 ARN Sulfolobus tokodaii <400> 18 gggcccguag cucagccagg uagagcggcg ggcuuuuaac ccguaggucc cggguucaaa ucccggcggg cccgcca <210> <211> 19 77 <212> <213> ARN Pyrobaculum aerophilum <400> 19 gggcccguag cucagccugg uagagcggcg ggcucuuaac ccguaggucg uggguucgaa ucccaccggg cccgcca <210> <211> 20 77 <212> <213> ARN Archaeoglobus fulgidus <400> 20 gggcucguag cucagccagg cagagcgacg ggcuuuuaac ccgucggucg cggguucaaa ucccgucgag cccgcca <210> <211> <212> <213> 21 76 ARN Sulfolobus solfataricus 138 ΕΡ 1 914 314/ΡΤ <400> 21 gggcccguag cuuagccagg uagagcgacg ggcucuuaac ccguaguccc ggguucgaau 60 cccggcgggc ccgcca 76
<210> 22 <211> 79 <212> ARN <213> Aeropyrum pernix <400> 22 gggcccguag cucagccugg uagagcggcg ggcucuuacc ccgcggaagu cccggguuca 60 aaucccggcg ggcccgcca 79 <210> 23 <211> 80 <212> ARN <213> Artificial <220> <223> ARNt de consenso <220> <221> misc_feature <222> (36) . . (36) <223> n indica ausência de consenso (u ou c) <220> <221> misc_feature <222> (43)..(43) <223> n indica ausência de consenso (gap ou c) <220> <221> misc_feature <222> (44) .. (44) <223> n indica ausência de consenso (gap ou g) <400> 23 gggcccguag cucagccugg uuagagcggc gggcunuuaa ccnncggagg ucgcggguuc 60 aaaucccgcc gggcccgcca 80 <210> 24 <211> 77 <212> ARN <213> Artificial <220> <223> ARNt derivado de consenso AKCUA <400> 24 gggcccguag cucagccugg uagagcggcg ggcucuaaac ccgcaggucg cggguucaaa 60 ucccgccggg cccgcca 77 <210> 25 <211> 78 <212> ARN <213> Artificial 139 ΕΡ 1 914 314/ΡΤ <2 2 Ο > <223> biblioteca de ARNt derivado de consenso <220> <221> misc_feature <222> (1)..(4) <223> n é a, c, g ou u <220> <221> misc_feature <222> (71)..(74) <223> n é a, c, g ou u <400> 25 nnnnccguag cucagccugg uagagcggcg ggcuuccuaa cccgcagguc gcggguucaa 60 aucccgccgg nnnngcca 78 <210> 26 <211 > 78 <212> ARN <213> Artificial <220> <223> ARNt mutante <400> 26 ugguccguag cucagccugg uagagcggcg ggcuuccuca cccgcagguc gcggguucaa 60 aucccgccgg acuagcca 78 <210> 27 <211> 1092 <212> ADN <213> Artificial <2 2 0 > <223> ARNt-sintetase mutante 140 ΕΡ 1 914 314/ΡΤ <400> 27 atggttcatt gggccgatta tattgctgat aaaataatta gagagagggg ggagaaggag 60 aagtacgttg ttgagagtgg aataacgcca agtggttacg ttcacgttgg gaactttagg 120 gagcttttta cagcttatat tgtgggccat gccctaaggg ataaggggta tgaggttagg 180 cacatccaca tgtgggatga ttatgataga tttaggaagg ttccaaggaa cgttccccag 240 gaatggaaag attacctggg aatgcccatt agtgaagttc ctgatccctg gggatgccat 300 gagagttatg ctgaacactt catgagaaag ttcgaggagg aggtagaaaa attagggatc 360 gaagttgact ttctttatgc gagtgaactc tacaagagag gggaatattc tgaggagata. 420 aggttagcct ttgagaaaag ggataagata atggagatac taaacaagta tagggaaatt 480 gcgaaacaac ctccccttcc agagaactgg tggcccgcaa tggtttactg ccctgagcat 540 aggagggaag cagagatcat tgaatgggat gggggctgga aggttaagta taagtgcccc 600 gaaggtcacg agggatgggt tgatataagg agtgggaacg tgaaactgag gtggcgtgtt 660 gattggccca tgcgttggtc tcactttggc gttgacttcg aacctgctgg aaaggatcat 720 cttgtggctg gttcaagcta cgatacggga aaggagatta taaaggaagt ttatggaaag 780 gaagctccgt tatctttaat gtatgagttt gttggaatta aggggcagaa ggggaagatg 840 agtggtagta agggaaatgt tattttactc agcgatctgt atgaggttct tgagccaggt 900 ctcgttagat ttatctacgc tcggcatagg ccaaacaagg agataaagat agatctaggt 960 cttggcattc taaacctcta cgatgagttc gataaagttg agagaatata cttcggggtt 1020 gagggtggta aaggtgatga tgaagaatta aggaggactt acgagctttc ggtgatgctg 1080 ccaacttact ga 1092 <210> 28 <211> 363 <212> PRT <213> Artificial <220> <223> ARNt-sintetase mutante <400> 28
Met Vai His Trp Ala Asp Tyr Ile Ala Asp Lys Ile Ile Arg Glu Arg 15 10 15
Gly Glu Lys Glu Lys Tyr Vai Vai Glu Ser Gly Ile Thr Pro Ser Gly 20 25 30
Tyr Vai His Vai Gly Asn Phe Arg Glu Leu Phe Thr Ala Tyr Ile Vai 35 40 45 141 ΕΡ 1 914 314/ΡΤ
Gly His Ala Leu Arg Asp Lys Gly Tyr Glu Vai Arg His Ile His Met 50 55 60
Trp Asp Asp Tyr Asp Arg Phe Arg Lys Vai Pro Arg Asn vai Pro Gin 65 70 75 80
Glu Trp Lys Asp Tyr Leu Gly Met Pro Ile Ser Glu Vai Pro Asp Pro 85 90 95
Trp Gly Cys His Glu Ser Tyr Ala Glu His Phe Met Arg Lys Phe Glu 100 105 110
Glu Glu Vai Glu Lys Leu Gly Ile Glu Vai Asp Phe Leu Tyr Ala Ser 115 120 125
Glu Leu Tyr Lys Arg Gly Glu Tyr Ser Glu Glu Ile Arg Leu Ala Phe 130 135 140
Glu Lys Arg Asp Lys Ile Met Glu Ile Leu Asn Lys Tyr Arg Glu Ile 145 150 155 160
Ala Lys Gin Pro Pro Leu Pro Glu Asn Trp Trp Pro Ala Met Vai Tyr 165 170 175
Cys Pro Glu His Arg Arg Glu Ala Glu Ile Ile Glu Trp Asp Gly Gly 180 185 190
Trp Lys Vai Lys Tyr Lys Cys Pro Glu Gly His Glu Gly Trp Vai Asp 195 200 205
Ile Arg Ser Gly Asn Vai Lys Leu Arg Trp Arg Vai Asp Trp Pro Met 210 215 220
Arg Trp Ser His Phe Gly Vai Asp Phe Glu Pro Ala Gly Lys Asp His 225 230 235 240
Leu Vai Ala Gly Ser Ser Tyr Asp Thr Gly Lys Glu Ile Ile Lys Glu 245 250 255
Vai Tyr Gly Lys Glu Ala Pro Leu Ser Leu Met Tyr Glu Phe Vai Gly 260 265 270
Ile Lys Gly Gin Lys Gly Lys Met Ser Gly Ser Lys Gly Asn Vai Ile 275 280 285 142 ΕΡ 1 914 314/ΡΤ
Leu Leu Ser Asp Leu Tyr Glu Vai Leu Glu Pro Gly Leu Vai Arg Phe 290 295 300
Ile Tyr Ala Arg His Arg Pro Asn Lys Glu Ile Lys Ile Asp Leu Gly 305 310 315 320
Leu Gly Ile Leu Asn Leu Tyr Asp Glu Phe Asp Lys Vai Glu Arg Ile 325 330 335
Tyr Phe Gly Vai Glu Gly Gly Lys Gly Asp Asp Glu Glu Leu Arg Arg 340 345 350
Thr Tyr Glu Leu Ser Vai Met Leu Pro Thr Tyr 355 360 <210> 29 <211> 1572 <212> ADN <213> Artificial <220> <223> ARNt-sintetase mutante <400> 29 atggttcatt gggccgatta tattgctgat aaaataatta gagagagggg ggagaaggag 60 aagtacgttg ttgagagtgg aataacgcca agtggttacg ttcacgttgg gaactttagg 120 gagcttttta cagcttatat tgtgggccat gccctaaggg ataaggggta tgaggttagg 180 cacatccaca tgtgggatga ttatgataga tttaggaagg ttccaaggaa cgttccccag 240 gaatggaaag attacctggg aatgcccatt agtgaagttc ctgatccctg gggatgccat 300 gagagttatg ctgaacactt catgagaaag ttcgaggagg aggtagaaaa attagggatc 360 gaagttgact ttctttatgc gagtgaactc tacaagagag gggaatattc tgaggagata 420 aggttagcct ttgagaaaag ggataagata atggagatac taaacaagta tagggaaatt 480 gcgaaacaac ctccccttcc agagaactgg tggcccgcaa tggtttactg ccctgagcat 540 aggagggaag cagagatcat tgaatgggat gggggctgga aggttaagta taagtgcccc 600 gaaggtcacg agggatgggt tgatataagg agtgggaacg tgaaactgag gtggcgtgtt 660 gattggccca tgcgttggtc tcactttggc gttgacttcg aacctgctgg aaaggatcat 720 cttgtggctg gttcaagcta cgatacggga aaggagatta taaaggaagt ttatggaaag 780 gaagctccgt tatctttaat gtatgagttt gttggaatta aggggcagaa ggggaagatg 840 agtggtagta agggaaatgt tattttactc agcgatctgt atgaggttct tgagccaggt 900 960 ctcgttagat ttatctacgc tcggcatagg ccaaacaagg agataaagat agatctaggt 143 ΕΡ 1 914 314/ΡΤ cttggcattc taaacctcta cgatgagttc gataaagttg agagaatata cttcggggtt 1020 gagggtggta aaggtgatga tgaagaatta aggaggactt acgagctttc aatgcctaag 1080 aagcctgaga gattagtcgc tcaagctcct tttaggttcc tagcggtgtt ggttcagtta 1140 ccgcatttaa ccgaagaaga cataataaat gttctaatca aacagggaca tattcccagg 1200 gatctatcca aggaggacgt tgagagggtt aaacttagga taaaccttgc taggaattgg 1260 gttaaaaagt atgcccctga ggatgttaaa ttctcaatac ttgagaaacc tccagaagtt 1320 gaggtaagtg gagatgttag ggaggccatg aatgaggttg ctgagtggct tgagaatcat 1380 gaggaattta gcgttgaaga gtttaataac attctattcg aagttgccaa gaggaggggg 1440 atatccagta gggagtggtt ttcgacgctc tacagattat ttattggaaa ggaaagggga 1500 ccgagattgg ccagtttcct ggcatctctt gataggagtt tcgttattaa acgacttaga . 1560 cttgagggat ag 1572 <210> 30 <211> 523 <212> PRT <213> Artificial <220> <223> ARNt-sintetase mutante <400> 30
Met Vai His Trp Ala Asp Tyr Ile Ala Asp Lys Ile Ile Arg Glu Arg 15 10 15
Gly Glu Lys Glu Lys Tyr Vai Vai Glu Ser Gly Ile Thr Pro Ser Gly 20 25 30
Tyr Vai His Vai Gly Asn Phe Arg Glu Leu Phe Thr Ala Tyr Ile Vai 35 40 45
Gly His Ala Leu Arg Asp Lys Gly Tyr Glu Vai Arg His Ile His Met 50 55 50
Trp Asp Asp Tyr Asp Arg Phe Arg Lys Vai Pro Arg Asn Vai Pro Gin 65 70 75 80
Glu Trp Lys Asp Tyr Leu Gly Met Pro Ile Ser Glu Vai Pro Asp Pro 85 90 95
Trp Gly Cys His Glu Ser Tyr Ala Glu His Phe Met Arg Lys Phe Glu 100 105 110 144 ΕΡ 1 914 314/ΡΤ
Glu Glu Vai Glu Lys Leu Gly Ile Glu Vai Asp Phe Leu Tyr Ala Ser 115 120 125
Glu Leu Tyr Lys Arg Gly Glu Tyr Ser Glu Glu Ile Arg Leu Ala Phe 130 135 140
Glu Lys Arg Asp Lys Ile Met Glu Ile Leu Asn Lys Tyr Arg Glu Ile 145 150 155 160
Ala Lys Gin Pro Pro Leu Pro Glu Asn Trp Trp Pro Ala Met Vai Tyr 165 170 175
Cys Pro Glu His Arg Arg Glu Ala Glu Ile Ile Glu Trp Asp Gly Gly 180 185 190
Trp Lys Vai Lys Tyr Lys Cys Pro Glu Gly His Glu Gly Trp Vai Asp 195 200 205
Ile Arg Ser Gly Asn Vai Lys Leu Arg Trp Arg Vai Asp Trp Pro Met 210 215 220
Arg Trp Ser His Phe Gly Vai Asp Phe Glu Pro Ala Gly Lys Asp His 225 230 235 240
Leu Vai Ala Gly Ser Ser Tyr Asp Thr Gly Lys Glu Ile Ile Lys Glu 245 250 255
Vai Tyr Gly Lys Glu Ala Pro Leu Ser Leu Met Tyr Glu Phe Vai Gly 260 265 270
Ile Lys Gly Gin Lys Gly Lys Met Ser Gly Ser Lys Gly Asn Vai Ile 275 280 285
Leu Leu Ser Asp Leu Tyr Glu Vai Leu Glu Pro Gly Leu Vai Arg Phe 290 295 300
Ile Tyr Ala Arg His Arg Pro Asn Lys Glu Ile Lys Ile Asp Leu Gly 305 310 315 320
Leu Gly lie Leu Asn Leu Tyr Asp Glu Phe Asp Lys Vai Glu Arg Ile 325 330 335
Tyr Phe Gly Vai Glu Gly Gly Lys Gly Asp Asp Glu Glu Leu Arg Arg 340 345 350 145 ΕΡ 1 914 314/ΡΤ
Thr Tyr Glu Leu Ser Met Pro Lys Lys Pro Glu Arg Leu Vai Ala Gin 355 360 365
Ala Pro Phe Arg Phe Leu Ala Vai Leu Vai Gin Leu Pro His Leu Thr 370 375 380
Glu Glu Asp Xle Ile Asn Vai Leu Ile Lys Gin Gly His Ile Pro Arg 385 390 395 400
Asp Leu Ser Lys Glu Asp Vai Glu Arg Vai Lys Leu Arg Ile Asn Leu 405 410 415
Ala Arg Asn Trp Vai Lys Lys Tyr Ala Pro Glu Asp Vai Lys Phe Ser 420 425 430
Ile Leu Glu Lys Pro Pro Glu Vai Glu Vai Ser Gly Asp Vai Arg Glu 435 440 445
Ala Met Asn Glu Vai Ala Glu Trp Leu Glu Asn His Glu Glu Phe Ser 450 455 460
Vai Glu Glu Phe Asn Asn Ile Leu Phe Glu Vai Ala Lys Arg Arg Gly 465 470 475 480
Ile Ser Ser Arg Glu Trp Phe Ser Thr Leu Tyr Arg Leu Phe Ile Gly 485 490 495
Lys Glu Arg Gly Pro Arg Leu Ala Ser Phe Leu Ala Ser Leu Asp Arg 500 505 510
Ser Phe Vai Ile Lys Arg Leu Arg Leu Glu Gly 515 520 <210> 31 <211> 4813 <212> ADN <213> Artificial <220> Λ 00 Oxl Oxl V plasmideo pACKO-A184TAG <220> <221> misc_feature <222> (3749)..(3749) <223> n é a, c, g, ou t <220> <221> misc_feature <222> (3769)..(3769) <223> n é a, c, g, ou t 146 ΕΡ 1 914 314/ΡΤ <400> 31 gaactccgga tgagcattca tcaggcgggc aagaatgtga ataaaggccg gataaaactt 60 gtgcttattt ttctttacgg tctttaaaaa ggccgtaata tccagctgaa cggtctggtt 120 ataggtacat tgagcaactg actgaaatgc ctcaaaatgt tctttacgat gccattggga 180 tatatcaacg gtggtatatc cagtgatttt tttctccatt ttagcttcct tagctcctga 240 aaatctcgat aactcaaaaa atacgcccgg tagtgatctt atttcattat ggtgaaagtt 300 ggaacctctt acgtgccgat caacgtctca ttttcgccaa aagttggccc agggcttccc 360 ggtatcaaca gggacaccag gatttattta ttctgcgaag tgatcttccg tcacaggtat 420 ttattcggcg caaagtgcgt cgggtgatgc tgccaactta ctgatttagt gtatgatggt 480 gtttttgagg tgctccagtg gcttctgttt ctatcagctg tccctcctgt tcagctactg 540 acggggtggt gcgtaacggc aaaagcaccg ccggacatca gcgctagcgg agtgtatact 600 ggcttactat gttggcactg atgagggtgt cagtgaagtg cttcatgtgg caggagaaaa 660 aaggctgcac cggtgcgtca gcagaatatg tgatacagga tatattccgc ttcctcgctc 720 actgactcgc tacgctcggt cgttcgactg cggcgagcgg aaatggctta cgaacggggc 780 ggagatttcc tggaagatgc caggaagata cttaacaggg aagtgagagg gccgcggcaa 840 agccgttttt ccataggctc cgcccccctg acaagcatca cgaaatctga cgctcaaatc 900 agtggtggcg aaacccgaca ggactataaa gataccaggc gtttccccct ggcggctccc 960 tcgtgcgctc tcctgttcct gcctttcggt ttaccggtgt cattccgctg ttatggccgc 1020 gtttgtctca ttccacgcct gacactcagt tccgggtagg cagttcgctc caagctggac 1080 tgtatgcacg aaccccccgt tcagtccgac cgctgcgcct tatccggtaa ctatcgtctt 1140 gagtcCââCC CçjgaâcLgciCcL tgcaaaagca ccactggcag cagccactgg taattgattt 1200 agaggagtta gtcttgaagt catgcgccgg ttaaggctaa actgaaagga caagttttgg 1260 tgactgcgct cctccaagcc agttacctcg gttcaaagag ttggtagctc agagaacctt 1320 cgaaaaaccg ccctgcaagg cggttttttc gttttcagag caagagatta cgcgcagacc 1380 aaaacgatct caagaagatc atcttattaa tcagataaaa tatttctaga tttcagtgca 1440 atttatctct tcaaatgtag cacctgaagt cagccccata cgatataagt tgtaattctc 1500 atgtttgaca gcttatcatc gataagcttt aatgcggtag tttatcacag ttaaattgct 1560 aacgcagtca ggcaccgtgt atgaaatcta acaatgcgct catcgtcatc ctcggcaccg 1620 tcaccctgga tgctgtaggc ataggcttgg ttatgccggt actgccgggc ctcttgcggg 1680 atatcggttt cttagacgtc aggtggcact tttcggggaa atgtgcgcgg aacccctatt 1740 147 ΕΡ 1 914 314/ΡΤ tgtttatttt tctaaataca ttcaaatatg tatccgctca tgagacaata accctgataa 1800 atgcttcaat aatattgaaa aaggaagagt atgagtattc aacatttccg tgtcgccctt 1860 attccctttt ttgcggcatt ttgccttcct gtttttgctc acccagaaac gctggtgaaa 192.0 gtaaaagatg ctgaagatca gttgggtgca cgagtgggtt acatcgaact ggatctcaac 1980 agcggtaaga tccttgagag ttttcgcccc gaagaacgtt ttccaatgat gagcactttt 2040 aaagttctgc tatgtggcgc ggtattatcc cgtgttgacg ccgggcaaga gcaactcggt 2100 cgccgcatac actattctca gaatgacttg gttgagtact caccagtcac agaaaagcat . 2160 cttacggatg gcatgacagt aagagaatta tgcagtgctg ccataaccaC gagtgataac 2220 actgcggcca acttacttct gacaacgatc ggaggaccga aggagctaac cgcttttttg 2280 cacaacatgg gggatcatgt aactcgcctt gatcgttggg aaccggagct gaatgaagcc 2340 ataccaaacg acgagcgtga caccacgatg ccttaggcaa tggcaacaac gttgcgcaaa 2400 ctattaactg gcgaactact tactctagct tcccggcaac aattaataga ctggatggag 2460 gcggataaag ttgcaggacc acttctgcgc tcggcccttc cggctggctg gtttattgct 2520 gataaatctg gagccggtga gcgtgggtct cgcggtatca ttgcagcact ggggccagat 2580 ggtaagccct cccgtatcgt agttatctac acgacgggga gtcaggcaac tatggatgaa 2640 cgaaatagac agatcgctga gataggtgcc tcactgatta agcattggca ccaccaccac 2700 caccactaac ccgggaccaa gtttactcat atatacttta gattgattta aaacttcatt 2760 tttaatttaa aaggatctag gtgaagatcc tctttgataa cctcatgacc aaaatccctt 2820 aacggcatgc accattcctt qcqqcqqcqq tgctcaacgg cctcaaccta ctactggqct 2880 gcttcctaat gcaggagtcg cataagggag agcgtctggc gaaaggggga tgtgctgcaa 2940 ggcgattaag ttgggtaacg ccagggtttt cccagtcacg acgttgtaaa acgacggcca 3000 gtgccaagct taaaaaaaat ccttagcttt cgctaaggat ctgcagttat aatctctttc 3060 taattggctc taaaatcttt ataagttctt cagctacagc attttttaaa tccattggat 3120 gcaattcctt atttttaaat aaactctcta actcctcata gctattaact gtcaaatctc 3180 caccaaattt ttctggoctt tttatggtta aaggatattc aaggaagtat ttagctatct 3240 ccattattgg atttccttca acaactccag ctgggcagta tgctttcttt atcttagccc 3300 taatctcttc tggagagtca tcaacagcta taaaattccc ttttgaagaa ctcatctttc 3360 cttctccatc caaacccgtt aagacagggt tgtgaataca aacaaccttt tttggtaaaa 3420 gctcccttgc taacatgtgt atttttctct gctccatccc tccaactgca acatcaacgc 3480 otaaataatg aatatcatta acctgcatta ttggatagat aacttcagca acctttggat 3540 tttcatcctc tcttgctata agttccatac tccttcttgc tctttttaag gtagttttta 3600 148 ΕΡ 1 914 314/ΡΤ aagccaatct atagacattc agtgtataat ccttatcaag ctggaattca gcgttacaag 3660 tattacacaa agttttttat gttgagaata tttttttgat ggggcgccac ttatttttga 3720 tcgttcgctc aaagaagcgg cgccagggnt gtttttcttt tcaccagtna gacgggcaac 3780 agaacgccat gagcggcctc atttcttatt ctgagttaca acagtccgca ccgctgtccg 3840 gtagctcctt ccggtgggcg cggggcatga ctatcgtcgc cgcacttatg actgtcttct 3900 ttatcatgca actcgtagga caggtgccgg cagcgcccaa cagtcccccg gccacggggc 3960 ctgccaccat acccacgccg aaacaagcgc cctgcaccat tatgttccgg atctgcatcg 4020 caggatgctg ctggc:taccc tgtggaacao ctacatctgt attaacgaag cgctaaccgt 4080 ttttatcagg ctctgggagg cagaataaat gatcatatcg tcaattatta cctccacggg 4140 gagagcctga gcaaactggc ctcaggcatt tgagaagcac acggtcacac tgcttccggt 4200 3. yt C cl 3 t cl cl 3. ccggtaaacc agcaatagac atttaacgac cctgccctga a o λ accgacgacc gggtcgaatt tgctttcgaa tttctgccat tcatccgctt attatcactt 4320 attcaggcgt agcaccaggc gtttaagggc accaataact gccttaaaaa aattacgccc 4380 cgccctgcca ctcatcgcag tactgttgta attcattaag cattctgccg acatggaagc 4440 catcacagac ggcatgatga acctgaatcg ccagcggcat cagcaccttg tcgccttgcg 4500 tataatattt gcccatggtg aaaacggggg cgaagaagtt gtccatattg gccacgttta 4560 aatcaaaact ggtgaaactc acccagggat tggctgagac gaaaaacata ttctcaataa 4620 accctttagg gaaataggcc aggttttcac cgtaacacgc cacatcttgc gaatatatgt 4680 gtagaaactg ccggaaatcg tc.gtggtatt cactccagag cgatgaaaac gtttcagttt 4740 gctcatggaa aacggtgtaa caagggtgaa cactatccca tatcaccagc tcaccgtctt 4800 tcattgccat acg 4813 <210> 32 <211> 4814 <212> ADN <213> Artificial <220> <223> plasmídeo pACKO-A184AGGA <220> <221> misc_feature <222> (3750)..(3750) <223> η é a, c, g, ou t <220> <221> misc_feature <222> (3770)..(3770) <223> n é a, c, g, ou t 149 ΕΡ 1 914 314/ΡΤ <4 Ο Ο > 32 gaactccgga tgagcattca tcaggcgggc aagaatgtga ataaaggccg gataaaactt 60 gtgcttattt ttctttacgg tctttaaaaa ggccgtaata tccagctgaa cggtctggtt 120 ataggtacat tgagcaactg actgaaatgc ctcaaaatgt tctttacgat gccattggga 180 tatatcaacg gtggtatatc cagtgatttt tttctccatt ttagcttcct tagctcotga 240 aaatctcgat aactcaaaaa atacgcccgg tagtgatctt atttcattat ggtgaaagtt 300 ggaacctctt acgtgccgat caacgtctca ttttcgccaa aagttggccc agggcttccc 360 ggtatcaaca gggacaccag gatttattta ttctgcgaag tgatcttccg tcacaggtat 420 ttattcggcg caaagtgcgt cgggtgatgc tgccaactta ctgatttagt gtatgatggt 480 gtttttgagg tgctccagtg gcttctgttt ctatcagctg tccctcctgt tcagctactg 540 acggggtggt gcgtaacggc aaaagcaccg ccggacatca gcgctagcgg agtgtatact 600 ggcttactat gttggcactg atgagggtgt cagtgaagtg cttcatgtgg caggagaaaa 660 aaggctgcac cggtgcgtca gcagaatatg tgatacagga tatattccgc ttcctcgctc 720 actgactcgc tacgctcggt cgttcgactg cggcgagcgg aaatggctta cgaacggggc 780 ggagatttcc tggaagatgc caggaagata cttaacaggg aagtgagagg gccgcggcaa 840 agccgttttt ccataggctc cgcccccctg acaagcatca cgaaatctga cgctcaaatc 900 agtggtggcg aaacccgaca ggactataaa gataccaggc gtttccccct ggcggctccc 960 tcgtgcgctc tcctgttcct gcctttcggt ttaccggtgt cattccgctg ttatggccgc 1020 gtttgtctca ttccacgcct gacactcagt tccgggtagg cagttcgctc caagctggac 1080 tgtatgcacg aaccccccgt tcagtccgac cgctgcgcct tatccggtaa ctatcgtctt 1140 gagtccaacc cggaaagaca tgcaaaagca ccactggcag cagccactgg taattgattt 1200 agaggagtta gtcttgaagt catgcgccgg ttaaggctaa actgaaagga caagttttgg 1260 tgactgcgct cctccaagcc agttacctcg gttcaaagag ttggtagctc agagaacctt 1320 cgaaaaaccg ccctgcaagg cggttttttc gttttcagag caagagatta cgcgcagacc 1380 aaaacgatct caagaagatc atcttattaa tcagataaaa tatttctaga tttcagtgca 1440 atttatctct tcaaatgtag cacctgaagt cagccccata cgatataagt tgtaattctc 1500 atgtttgaca gcttatcatc gataagcttt aatgcggtag tttatcacag ttaaattgct 1560 aacgcagtca ggcaccgtgt atgaaatcta acaatgcgct catcgtcatc ctcggcaccg 1620 tcaccctgga tgctgtaggc ataggcttgg ttatgccggt actgccgggc ctcttgcggg 1680 1740 atatcggttt cttagacgtc aggtggcact tttcggggaa atgtgcgcgg aacccctatt 150 ΕΡ 1 914 314/ΡΤ tgtetatttt tctaaataca ttcaaatatg tatccgctca tgagacaata accctgataa 1800 atgcttcaat aataccgaaa aaggaagagt atgagtattc aacatttccg tgtcgccctt 1860 attccctttt ttgcggcatt ttgccttcct gtttttgctc acccagaaac gctggtgaaa 1920 gtaaaagatg ctgaagatca gttgggtgca cgagtgggtt acatcgaact ggatctcaac 1980 agcggtaaga tccttgagag ttttcgcccc gaagaacgtt ttccaatgat gagcactttt 2040 aaagttctgc tatgtggcgc ggtattatcc cgtgttgacg ccgggcaaga gcaactcggt 2100 cgccgcatac actattctca gaatgacttg gttgagtact caccagtcac agaaaagcat 2160 cttacggatg gcatgacagt aagagaatta tgcagtgctg ccataaccat gagtgataac 2220 actgcggcca acttacttct gacaacgatc ggaggaccga aggagctaac cgcttttttg 22 80 cacaacatgg gggatcatgt aactcgcctt gatcgttggg aaccggagct gaatgaagcc 2340 ataccaaacg acgagcgtga caccacgatg cctaggagca atggcaacaa cgttgcgcaa 2400 actattaact ggcgaactac ttactctagc ttcccggcaa caattaatag actggatgga 2460 ggccgataaa gttgcaggac cacttctgcg ctcggccctt ccggctggct ggtttattgc 2520 tgataaatct ggagccggtg agcgtgggtc tcgcggtatc attgcagcac tggggccaga 2580 tggtaagccc tcccgtatcg tagttatcta cacgacgggg agtcaggcaa ctatggatga 2640 acgaaataga cagatcgctg agataggtgc ctcactgatt aagcattggc accaccacca 2700 ccaccactaa cccgggacca agtttactca tatatacttt agattgattt aaaacttcat 2760 ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct 2820 taacggcatg caccattcct tgcggcggcg gtgctcaacg gcctcaacct actactgggc 2880 tgcttcctaa tgcaggagtc gcataaggga gagcgtctgg cgaaaggggg atgtgctgca 2940 aggcgattaa gttgggtaac gccagggttt tcccagtcac gacgttgtaa aacgacggcc 3000 agtgccaagc ttaaaaaaaa tccttagctt tcgctaagga tctgcagtta taatctcttt 3060 ctaattggct ctaaaatctt tataagttct tcagctacag cattttttaa atccattgga 3120 tgcaattcct tatttttaaa taaactctct aactcctcat agctattaac tgtcaaatct 3180 ccaccaaatt tttctggcct ttttatggtt aaaggatatt caaggaagta tttagctatc 3240 tccattattg gatttccttc aacaactcca gctgggcagt atgctttctt tatcttagcc 3300 ctaatctctt ctggagagtc atcaacagct ataaaattcc cttttgaaga actcatcttt 3360 ccttctccat ccaaacccgt taagacaggg ttgtgaatac aaacaacctt ttttggtaaa 3420 agctcccttg ctaacatgtg tatttttctc tgctccatcc ctccaactgc aacatcaacg 3480 cctaaataat gaatatcatt aacctgcatt attggataga taacttcagc aacctttgga 3540 ttttcatcct ctcttgctat aagttccata ctccttcttg ctctttttaa ggtagttttt 3600 151 ΕΡ 1 914 314/ΡΤ aaagccaatc tatagacatt cagtgtataa tccttatcaa gctggaattc agcgttacaa 3660 gtattacaca aagtttttta tgttgagaat atttttttga tggggcgcca cttatttttg 3720 atcgttcgct caaagaagcg gcgccagggn tgtttttctt ttcaçcagtn agacgggcaa 3780 cagaacgcca tgagcggcct catttcttat tctgagttac aacagtccgc accgctgtcc 3840 ggtagctcct tccggtgggc gcggggcatg actatcgtcg ccgcacttat gactgtcttc 3900 tttatcatgc aactcgtagg acaggtgccg gcagcgccca acagtccccc ggccacgggg 3960 cctgccacca tacccacgcc gaaacaagcg ccctgcacca ttatgttccg gatctgcatc 4020 gcaggatgct gctggctacc ctgtggaaca cctacatctg tattaacgaa gcgctaaccg 4080 tttttatcag gctctgggag gcagaataaa tgatcatatc gtcaattatt acctccacgg 4140 ggagagcctg agcaaactgg cctcaggcat ttgagaagca cacggtcaca ctgcttccgg 4200 tagtcaataa accggtaaac cagcaataga cataagcggc tatttaacga ccctgccctg 4260 aaccgacgac cgggtcgaat ttgctttcga atttctgcca ttcatccgct tattatcact 4320 tattcaggcg tagcaccagg cgtttaaggg caccaataac tgccttaaaa aaattacgcc 4380 ccgccctgcc actcatcgca gtactgttgt aattcattaa gcattctgcc gacatggaag 4440 ccatcacaga cggcatgatg aacctgaatc gccagcggca tcagcacctt gtcgccttgc 4500 gtataatatt tgcccatggt gaaaacgggg gcgaagaagt tgtccatatt ggccacgttt 4560 aaatcaaaac tggtgaaact cacccaggga ttggctgaga cgaaaaacat attctcaata 4620 aaccctttag ggaaataggc caggttttca ccgtaacacg ccacatcttg cgaatatatg 4680 tgtagaaact gccggaaatc gtcgtggtat tcactccaga gcgatgaaaa cgtttcagtt 4740 tgctcatgga aaacggtgta acaagggtga acactatccc atatcaccag ctcaccgtct 4800 ttcattgcca tacg 4814 <210> 33 <211> 4338 <212> ADN <213> Artificial <220> <223> plasmídeo pACKO-Bla <220> <221> misc_feature <222> (3274)..(3274) <223> η é a, c, g, ou t <220> <221> misc_feature <222> (3294)..(3294) <223> n é a, c, g, ou t 152 ΕΡ 1 914 314/ΡΤ <400> 33 gaactccgga tgagcattca tcaggcgggc aagaatgtga ataaaggccg gataaaactt 60 gtgcttattt ttctttacgg tctttaaaaa ggccgtaata tccagctgaa cggtctggtt 120 ataggtacat tgagcaactg actgaaatgc ctcaaaatgt tctttacgat gccattggga 180 tatatcaacg gtggtatatc cagtgatttt tttctccatt ttagcttcct tagctcctga 240 aaatctcgat aactcaaaaa atacgcccgg tagtgatctt atttcattat ggtgaaagtt 300 ggaacctctt acgtgccgat caacgtctca ttttcgccaa aagttggccc agggcttccc 360 ggtatcaaca gggacaccag gatttattta ttctgcgaag tgatcttccg tcacaggtat 420 ttattcggcg caaagtgcgt cgggtgatgc tgccaactta ctgatttagt gtatgatggt 480 gtttttgagg tgctccagtg gcttctgttt ctatcagctg tccctcctgt tcagctactg 540 acggggtggt gcgtaacggc aaaagcaccg ccggacatca gcgctagcgg agtgtatact .600 ggcttactat gttggcactg atgagggtgt cagtgaagtg cttcatgtgg caggagaaaa 660 aaggctgcac cggtgcgtca gcagaatatg tgatacagga tatattccgc ttcctcgctc 720 actgactcgc tacgctcggt cgttcgactg cggcgagcgg aaatggctta cgaacggggc 780 ggagatttcc tggaagatgc caggaagata cttaacaggg aagtgagagg gccgcggcaa 840 agccgttttt ccataggctc cgcccccctg acaagcatca cgaaatctga cgctcaaatc 900 agtggtggcg aaacccgaca ggactataaa gataccaggc gtttccccct ggcggctccc 960 tcgtgcgctc tcctgttcct gcctttcggt ttaccggtgt cattccgctg ttatggccgc 1020 gtttgtctca ttccacgcct gacactcagt tccgggtagg cagttcgctc caagctggac 1080 tgtatgcacg aaccccccgt tcagtccgac cgctgcgcct tatccggtaa ctatcgtctt 1140 gagtccaacc cggaaagaca tgcaaaagca ccactggcag cagccactgg taattgattt 1200 agaggagtta gtcttgaagt catgcgccgg ttaaggctaa actgaaagga caagttttgg 1260 tgactgcgct cctccaagcc agttacctcg gttcaaagag ttggtagctc agagaacctt 1320 cgaaaaaccg ccctgcaagg cggttttttc gttttcagag caagagatta cgcgcagacc 1380 aaaacgatct caagaagatc atcttattaa tcagataaaa tatttctaga tttcagtgca 1440 atttatctct tcaaatgtag cacctgaagt cagccccata cgatataagt tgtaattctc 1500 atgtttgaca gcttatcatc gataagcttt aatgcggtag tttatcacag ttaaattgct 1560 aacgcagtca ggcaccgtgt atgaaatcta acaatgcgct catcgtcatc ctcggcaccg 1620 tcaccctgga tgctgtaggc ataggcttgg ttatgccggt actgccgggc ctcttgcggg 1680 atatcggttt cttagacgtc aggtggcact tttcggggaa atgtgcgcgg aacccctatt 1740 153 ΕΡ 1 914 314/ΡΤ tgtttatttt tctaaataca ttcaaatatg tatccgctca tgagacaata accctgataa íaoo atgcttcaat aatattgaaa aaggaagagt atgagtattc aacatttccg tgtcgccctt 1860 attccctttt ttgcggcatt ttgçcttcct gtttttgctc acccagaaac actagtgcag 1920 caatggcaac aacgttgcgc aaactattaa ctggcgaact acttactcta gcttcccggc 1980 aacaattaat agactggatg gaggcggata aagttgcagg accacttctg cgctcggccc 2040 ttccggctgg ctggtttatt gctgataaat ctggagccgg tgagcgtggg tctcgcggta 2100 tcattgcagc actggggcca gatggtaagc cctcccgtat cgtagttatc tacacgacgg 2160 ggagtcaggc aactatggat gaacgaaata gacagatcgc tgagataggt gcctcactga 2220 ttaagcattg gtaacccggg accaagttta ctcatatata ctttagattg atttaaaact 2280 tcatttttaa Cttaaaagga tctaggtgaa gatccttttt gataatctca tgaccaaaat 2340 cccttaacgg catgcaccat tccttgcggc ggcggtgctc aacggcctca acctactact 2400 gggctgcttc ctaatgcagg agtcgcataa gggagagcgt ctggcgaaag ggggatgtgc 2460 tgcaaggcga ttaagttggg taacgccagg gttttcccag tcacgacgtt gtaaaacgac 2520 ggccagtgcc aagcttaaaa aaaatcctta gctttcgcta aggatctgca gttataatct 2580 ctttctaatt ggctctaaaa tctttataag ttcttcagct acagcatttt ttaaatccat 2640 tggatgcaat tccttatttt taaataaact ctctaactcc tcatagctat taactgtcaa 2700 atctccacca aatttttctg gcctttttat ggttaaagga tattcaagga agtatttagc 2760 tatctccatt attggatttc cttcaacaac tccagctggg cagtatgctt tctttatctt 2820 agccctaatc tcttctggag agtcatcaac agctataaaa ttcccttttg aagaactcat 2880 ctttccttct ccatccaaac ccgttaagac agggttgtga atacaaacaa ccttttttgg 2940 taaaagctcc cttgctaaca tgtgtatttt tctctgctcc atccctccaa ctgcaacatc 3000 aacgcctaaa taatgaatat cattaacctg cattattgga tagataactt cagcaacctt 3060 tggattttca tcctctcttg ctataagttc catactcctt cttgctcttt ttaaggtagt 3120 ttttaaagcc aatctataga cattcagtgt ataatcctta tcaagctgga attcagcgtt 3180 acaagtatta cacaaagttt tttatgttga gaatattttt ttgatggggc gccacttatt 3240 tttgatcgtt cgctcaaaga agcggcgcca gggntgtttt tcttttcacc agtnagacgg 3300 gcaacagaac gccatgagcg gcctcatttc ttattctgag ttacaacagt ccgcaccgct 3360 gtccggtagc tccttccggt gggcgcgggg catgactatc gtcgccgcac ttatgactgt 3420 cttctttatc atgcaactcg taggacaggt gccggcagcg cccaacagtc ccccggccac 3480 ggggcctgcc accataccca cgccgaaaca agcgccctgc accattatgt tccggatctg 3540 catcgcagga tgctgctggc taccctgtgg aacacctaca tctgtattaa cgaagcgcta 3600 154 ΕΡ 1 914 314/ΡΤ accgttttta tcaggctctg ggaggcagaa taaatgatca tatcgtcaat tattacctcc 3660 acggggagag cctgagcaaa ctggcctcag gcatttgaga agcacacggt cacactgctt 3720 ccggtagtca ataaaccggt aaaccagcaa tagacataag cggctattta acgaccctgc 3780 cctgaaccga cgaccgggtc gaatttgctt tcgaatttct gccattcatc cgcttattat. 3840 cacttattca ggcgtagcac caggcgttta agggcaccaa taactgcctt aaaaaaatta 3900 cgccccgccc tgccactcat cgcagtactg ttgtaattca ttaagcattc tgccgacatg 3960 gaagccatca cagacggcat gatgaacctg aatcgccagc ggcatcagca ccttgtcgcc 4020 ttgcgtataa tatttgccca tggtgaaaac gggggcgaag aagttgtcca tattggccac 4080 gtttaaatca aaactggtga aactcaccca gggattggct gagacgaaaa acatattctc 4140 aataaaccct ttagggaaat aggccaggtt ttcaccgtaa cacgccacat cttgcgaata 4200 tatgtgtaga aactgccgga aatcgtcgtg gtattcactc cagagcgatg aaaacgtttc 4260 agtttgctca tggaaaacgg tgtaacaagg gtgaacacta tcccatatca ccagctcacc 4320 gtctttcatt gccatacg 4338 <210> 34 <211> 2271 <212> ADN <213> Artificial <220> <223> plasmídeo pKQ <400> 34 atggatccga gctcgagatc tgcagctggt accatatggg aattcgaagc ttgggcccga 60 acaaaaactc atctcagaag aggatctgaa tagcgccgtc gaccatcatc atcatcatca 120 ttgagtttaa acggtctcca gcttggctgt tttggcggat gagagaagat tttcagcctg 180 atacagatta aatcagaacg cagaagcggt ctgataaaac agaatttgcc tggcggcagt 240 agcgcggtgg tcccacctga ccccatgccg aactcagaag tgaaacgccg tagcgccgat 300 ggtagtgtgg ggtctcccca tgcgagagta gggaactgcc aggcatcaaa taaaacgaaa 360 ggctcagtcg aaagactggg cctttcgttt tatctgttgt ttgtcggtga acgatatctg 420 cttttcttcg cgaattaatt ccgcttcgca acatgtgagc aaaaggccag caaaaggcca 480 ggaaccgtaa aaaggccgcg ttgctggcgt ttttccatag gctccgcccc cctgacgagc 540 atcacaaaaa tcgacgctca agtcagaggt ggcgaaaccc gacaggacta taaagatacc 600 aggcgtttcc ccctggaagc tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg 660 gatacctgtc cgcctttctc ccttcgggaa gcgtggcgct ttctcatagc tcacgctgta 720 155 ΕΡ 1 914 314/ΡΤ ggtatctcag ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg 780 ttcagcccga ccgctgcgcc ttatccggta actatcgtct tgagtccaac ccggtaagac 840 acgacttatc gccactggca gcagccactg gtaacaggat tagcagagcg aggtatgtag 900 gcggtgctac agagttcttg aagtggtggc ctaactacgg ctacactaga aggacagtat 960 ttggtatctg cgctctgctg aagccagtta ccttcggaaa aagagttggt agctcttgat 1020 ccggcaaaca aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag cagattacgc 1080 gcagaaaaaa aggatctcaa gaagatcctt tgatcttttc tacggggtct gacgctcagt 1140 ggaacgaaaa ctcacgttaa gggattttgg tcatgagttg tgtctcaaaa tctctgatgt 1200 tacattgcac aagataaaaa tatatcatca tgaacaataa aactgtctgc ttacataaac 1260 agtaatacaa ggggtgttat gagccatatt caacgggaaa cgtcttgctc gaggccgcga 1320 ttaaattcca acatggatgc tgatttatat gggtataaat gggctcgcga taatgtcggg 1380 caatcaggtg cgacaatcta tcgattgtat gggaagcccg atgcgccaga gttgtttctg 1440 aaacatggca aaggtagcgt tgccaatgat gttacagatg agatggtcag actaaactgg 1500 ctgacggaat ttatgcctct tccgaccatc aagcatttta tccgtactcc tgatgatgca 1560 tggttactca ccactgcgat ccccgggaaa acagcattcc aggtattaga agaatatcct 1620 gattcaggtg aaaatattgt tgatgcgctg gcagtgttcc tgcgccggtt gcattcgatt 1680 cctgtttgta attgtccttt taacagcgat cgcgtatttc gtctcgctca ggcgcaatca 1740 cgaatgaata acggtttggt tgatgcgagt gattttgatg acgagcgtaa tggctggcct 1800 gttgaacaag tctggaaaga aatgcataag cttttgccat tctcaccgga ttcagtcgtc 1860 actcatggtg atttctcact tgataacctt atttttgacg aggggaaatt aataggttgt 1920 attgatgttg gacgagtcgg aatcgcagac cgataccagg atcttgccat cctatggaac 1980 tgcctcggtg agttttctcc ttcattacag aaacggcttt ttcaaaaata tggtattgat 2040 aatcctgata tgaataaatt gcagtttcat ttgatgctcg atgagttttt ctaatcagaa 2100 ttggttaatt ggttgtaaca ctggcagagc attacgctga cttgacggga cggcggcttt 2160 gttgaataaa tcgaactttt gctgagttga aggatcctcg ggagttgtca gcctgtcccg 2220 cttataagat catacgccgt tatacgttgt ttacgctttg aggaattaac c 2271 <210> 35 <211> 4582 <212> ADN <213> Artificial <220> <223> plasmídeo pKQ-PhKep 156 ΕΡ 1 914 314/ΡΤ <400> 35 atggttcatt gggccgatta tattgctgat aaaataatta gagagagggg ggagaaggag. 60 aagtacgttg ttgagagtgg aataacgcca agtggttacg ttcacgttgg gaactttagg 120 gagcttttta cagcttatat tgtgggccat gccctaaggg ataaggggta tgaggttagg 180 cacatccaca tgtgggatga ttatgataga tttaggaagg ttccaaggaa cgttccccag 240 gaatggaaag attacctggg aatgcccatt agtgaagttc ctgatccctg gggatgccat 300 gagagttatg ctgaacactt catgagaaag ttcgaggagg aggtagaaaa attagggatc 360 gaagttgact ttctttatgc gagtgaactc tacaagagag gggaatattc tgaggagata 420 aggttagcct ttgagaaaag ggataagata atggagatac taaacaagta tagggaaatt 480 gcgaaacaac ctccccttcc agagaactgg tggcccgcaa tggtttactg ccctgagcat 540 aggagggaag cagagatcat tgaatgggat gggggctgga aggttaagta taagtgcccc 600 gaaggtcacg agggatgggt tgatataagg agtgggaacg tgaaactgag gtggcgtgtt 660 gattggccca tgcgttggtc tcactttggc gttgacttcg aacctgctgg aaaggatcat 720 cttgtggctg gttcaagcta cgatacggga aaggagatta taaaggaagt ttatggaaag 780 gaagçtccgt tatctttaat gtatgagttt gttggaatta aggggcagaa ggggaagatg 840 agtggtagta agggaaatgt tattttactc agcgatctgt atgaggttct tgagccaggt 900 ctcgttagat ttatctacgc tcggcatagg ccaaacaagg agataaagat agatctaggt 960 cttggcattc taaacctcta cgatgagttc gataaagttg agagaatata cttcggggtt 1020 gagggtggta aaggtgatga tgaagaatta aggaggactt acgagctttc ggtgatgctg 1080 ccaacttact gatttagtgt atgatggtgt ttttgaggtg ctccagtggc ttctgtttct 1140 atcagctgtc cctcctgttc agctactgac ggggtggtgc gtaacggcaa aagcaccgcc 1200 ggacatcagc gctatctctg ctctcactgc cgtaaaacat ggcaactgca gttcacttac 1260 accgcttctc aacccggtac gcaccagaaa atcattgata tggccatgaa tggcgttgga 1320 tgccgggcaa ccgcccgcat tatgggcgtt ggcctcaaca cgattttccg ccatttaaaa 1380 aactcaggcc gcagtcggta acctcgcgca tacagccggg cagtgacgtc atcgtctgcg 1440 cggaaatgga cgaacagtgg ggatacgtcg gtgctaaatc gcgccagcgc tggctgtttt 1500 acgcgtatga caggctccgg aagacggttg ttgcgcacgt attcggtgaa cgcactatgg 1560 cgacgctggg gcgtcttatg agcctgctgt caccctttga cgtggtgata tggatgacgg 1620 atggctggcc gctgtatgaa tcccgcctga agggaaagct gcacgtaatc agcaagcgat 1680 atacgcagcg aattgagcgg cataacctga atctgaggca gcacctggca cggctgggac 1740 ggaagtcgct gtcgttctca aaatcggtgg agctgcatga caaagtcatc gggcattatc 1800 157 ΕΡ 1 914 314/ΡΤ tgaacataaa acactatcaa taagttggag tcattacccc gagctttcaa tgcctaagaa 1860 gcctgagaga ttagtcgctc aagctccttt taggttccta gcggtgttgg ttcagttacc 1920 gcatttaacc gaagaagaca taataaatgt tctaatcaaa cagggacata ttcccaggga 1980 tctatccaag gaggacgttg agagggttaa acttaggata aaccttgcta ggaattgggt 2040 taaaaagtat gcccctgagg atgttaaatt ctcaatactt gagaaacctc cagaagttga 2100 ggtaagtgaa gatgttaggg aggccatgaa tgaggttgct gagtggcttg agaatcatga 2150 ggaatttagc gttgaagagt ttaataacat tctattcgaa gttgccaaga ggagggggat 2220 atccagtagg gagtggtttt cgacgctcta cagattattt attggaaagg aaaggggacc 2280 gagattggcc agtttcctgg catctcttga taggagtttc gttatCaaac gacttagact 2340 tgagggataa gaattcgaag cttgggcccg aacaaaaact catctcagaa gaggatctga 2400 atagcgccgt cgaccatcat catcatcatc attgagttta aacggtctcc agcttggctg 2450 ttttggcgga tgagagaaga ttttcagcct gatacagatt aaatcagaac gcagaagcgg 2520 tctgataaaa cagaatttgc ctggcggcag tagcgcggtg gtcccacctg accccatgcc 2580 gaactcagaa gtgaaacgcc gtagcgccga tggtagtgtg gggtctcccc atgcgagagt 2540 agggaactgc caggcatcaa ataaaacgaa aggctcagtc gaaagactgg gcctttcgtt 2700 ttatctgttg tttgtcggtg aacgatatct gcttttcttc gcgaattaat tccgcttcgc 2760 aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg 2820 tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg 2880 tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg 2940 cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga 3000 agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc 3060 tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt 3120 aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact 3180 ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg 3240 cctaactacg gctacactag aaggacagca tttggtatct gcgctctgct gaagccagtt 3300 accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt 3360 ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct 3420 ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg 3480 gtcatgagtt gtgtctcaaa atctctgatg ttacattgca caagataaaa atatatcatc 3540 atgaacaata aaactgtctg cttacataaa cagtaataca aggggtgtta tgagccatat 3600 tcaacgggaa acgtcttgct cgaggccgcg attaaattcc aacatggatg ctgatttata 3650 158 ΕΡ 1 914 314/ΡΤ tgggtataaa tgggctcgcg ataatgtcgg gcaatcaggt gcgacaatct atcgattgta 3720 tgggaagccc gatgcgccag agttgtttct gaaacatggc aaaggtagcg ttgccaatga 3780 tgttacagat gagatggtca gactaaactg gctgacggaa tttatgcctc ttccgaccat 3840 caagcatttt atccgtactc ctgatgatgc atggttactc accactgcga tccccgggaa 3900 aacagcattc caggtattag aagaatatcc tgattcaggt gaaaatattg ttgatgcgct 3960 ggcagtgttc ctgcgccggt tgcattcgat tcctgtttgt aattgtcctt ttaacagcga 4020 tcgcgtattt cgtctcgctc aggcgcaatc acgaatgaat aacggtttgg ttgatgcgag 4080 tgattttgat gacgagcgta atggctggcc tgttgaacaa gtctggaaag aaatgcataa 4140 gcttttgcca ttctcaccgg attcagtcgt cactcatggt gatttctcac ttgataacct 4200 tatttttgac gaggggaaat taataggttg tattgatgtt ggacgagtcg gaatcgcaga 4260 ccgataccag gatcttgcca tcctatggaa ctgcctcggt gagttttctc cttcattaca 4320 gaaacggctt tttcaaaaat atggtattga taatcctgat atgaataaat tgcagtttca 4380 tttgatgctc gatgagtttt tctaatcaga attggttaat tggttgtaac actggcagag 4440 cattacgctg acttgacggg acggcggctt tgttgaataa atcgaacttt tgctgagttg 4500 aaggatcctc gggagttgtc agcctgtccc gcttataaga tcatacgccg ttatacgttg 4560 tttacgcttt gaggaattaa cc 4582 <210> 36 <211> 30 <212> ADN <213> Artificial <220> <223> iniciador oligonucleotídico <400> 36 cagtggaatt cagtaagttg gcagcatcac 30 <210> 37 <211> 31 <212> ADN <213> Artificial <220> <223> iniciador oligonucleotídico <400> 37 cattggaatt cgagtaagtt ggcagcatca c 31
Lisboa, 2010-09-01

Claims (16)

  1. ΕΡ 1 914 314/ΡΤ 1/2 REIVINDICAÇÕES 1. Sistema de tradução compreendendo: um ARNt ortogonal (O-ARNt) que reconhece um codão selector; e, uma sintetase ortogonal (O-RS) derivada de uma lisil-ARNt-sintetase, O-RS esta que é capaz de carregar especificamente o O-ARNt com homoglutamina;
  2. 2. Sistema de tradução de acordo com a reivindicação 1, compreendendo homoglutamina e um ácido nucleico de interesse compreendendo um codão selector, em que a O-RS aminoacila o O-ARNt com a homoglutamina, em que o O-ARNt reconhece o codão selector e proporciona a incorporação especifica da homoglutamina num polipéptido codificado pelo ácido nucleico de interesse.
  3. 3. Sistema de tradução de acordo com a reivindicação 1, em que a O-RS é um mutante 141 e/ou S268 da aminoacil-ARNt-sintetase de SEQ ID NO:28 (PhAAD).
  4. 4. Sistema de tradução de acordo com a reivindicação 1, em que o sistema de tradução compreende uma célula procariota e a O-RS é derivada de uma célula de arqueobactéria.
  5. 5. Sistema de tradução de acordo com a reivindicação 4 em que o sistema de tradução compreende uma célula de E. coli e a O-RS é derivada de uma O-RS de Pyrococcus horikoshii.
  6. 6. Composição compreendendo a aminoacil-ARNt-sintetase de SEQ ID NO:28 (PhAAD).
  7. 7. Aminoacil-ARNt-sintetase artificial derivada da aminoacil-ARNt-sintetase de SEQ ID NO:28 (PhAAD) capaz de carregar um ARNt com homoglutamina.
  8. 8. Aminoacil-ARNt-sintetase artificial de acordo com a reivindicação 7, em que a sintetase é uma variante homóloga de PHAAD, compreendendo resíduos variantes em posições correspondentes a Y268 e E41 de PhAAD. ΕΡ 1 914 314/ΡΤ 2/2
  9. 9. Aminoacil-ARNt-sintetase artificial de acordo com a reivindicação 7, compreendendo uma serina ou glicina numa posição correspondente a Y268 de PhAAD.
  10. 10. Aminoacil-ARNt-sintetase artificial de acordo com a reivindicação 7, compreendendo uma valina, treonina, serina, isoleucina ou prolina numa position correspondente a E41 de PhAAD.
  11. 11. Aminoacil-ARNt-sintetase artificial de acordo com a reivindicação 7, compreendendo uma serina numa posição correspondente a Y268 e uma isoleucina na posição correspondente a E41 de PHAAD.
  12. 12. Aminoacil-ARNt-sintetase artificial de acordo com a reivindicação 7, em que a sintetase é capaz de carregar o ARNt de SEQ ID NO:26 com homoglutamina.
  13. 13. Ácido nucleico que codifica a aminoacil-ARNt- sintetase artificial de acordo com qualquer uma das reivindicações 7 a 12.
  14. 14. Vector de ácido nucleico que compreende o ácido nucleico de acordo com a reivindicação 13.
  15. 15. ARNt de SEQ ID NO: 26.
  16. 16. ADN que codifica o ARNt de acordo com a reivindicação 15. Lisboa, 2010-09-01
PT08001573T 2003-07-07 2004-07-07 Composições de pares ortogonais de lisil-arnt e aminoacil-arnt-sintetase e suas utilizações PT1914314E (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US48545103P 2003-07-07 2003-07-07
US52881503P 2003-12-10 2003-12-10
US53714904P 2004-01-15 2004-01-15

Publications (1)

Publication Number Publication Date
PT1914314E true PT1914314E (pt) 2010-09-08

Family

ID=34222340

Family Applications (2)

Application Number Title Priority Date Filing Date
PT06002989T PT1666604E (pt) 2003-07-07 2004-07-07 Composições de pares ortogonais de lisil-arnt e aminoacil-arnt-sintetase e suas utilizações
PT08001573T PT1914314E (pt) 2003-07-07 2004-07-07 Composições de pares ortogonais de lisil-arnt e aminoacil-arnt-sintetase e suas utilizações

Family Applications Before (1)

Application Number Title Priority Date Filing Date
PT06002989T PT1666604E (pt) 2003-07-07 2004-07-07 Composições de pares ortogonais de lisil-arnt e aminoacil-arnt-sintetase e suas utilizações

Country Status (14)

Country Link
US (4) US7638297B2 (pt)
EP (2) EP1649004A4 (pt)
JP (2) JP5192150B2 (pt)
CN (1) CN101076598B (pt)
AT (2) ATE471385T1 (pt)
AU (1) AU2004267359B2 (pt)
BR (1) BRPI0412272A (pt)
CA (1) CA2531146A1 (pt)
DE (2) DE602004011789T2 (pt)
ES (1) ES2301099T3 (pt)
MX (1) MXPA06000242A (pt)
PT (2) PT1666604E (pt)
SI (1) SI1666604T1 (pt)
WO (1) WO2005019415A2 (pt)

Families Citing this family (137)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1456360B1 (en) * 2001-04-19 2015-06-03 The Scripps Research Institute Methods and composition for the production of orthoganal trna-aminoacyltrna synthetase pairs
AU2003286436B2 (en) * 2002-10-16 2010-08-19 The Scripps Research Institute Glycoprotein synthesis
CN103289960B (zh) 2003-04-17 2017-04-26 斯克利普斯研究院 扩展真核生物遗传密码
EP2378288B1 (en) * 2003-06-18 2015-09-09 The Scripps Research Institute Unnatural reactive amino acid genetic code additions
ES2301099T3 (es) 2003-07-07 2008-06-16 The Scripps Research Institute Composiciones de parejas ortogonales lisil-arnt y aminoacil-arnt sintetasa y usos de las mismas.
AU2004282577B2 (en) 2003-10-14 2009-10-29 The Scripps Research Institute Site-specific incorporation of redox active amino acids into proteins
BRPI0507118A (pt) 2004-02-02 2007-06-19 Ambrix Inc polipeptìdeos de interferon humano modificado e seus usos
AU2005319099B2 (en) 2004-02-02 2010-09-16 Ambrx, Inc. Modified human growth hormone
MXPA06013586A (es) 2004-05-25 2007-11-09 Scripss Res Inst Incorporacion especifica del sitio de aminoacidos no naturales que contienen atomos pesados en proteinas para la determinacion de la estructura cristalina.
WO2006009901A2 (en) 2004-06-18 2006-01-26 Ambrx, Inc. Novel antigen-binding polypeptides and their uses
WO2009100255A2 (en) 2008-02-08 2009-08-13 Ambrx, Inc. Modified leptin polypeptides and their uses
EP2770053B1 (en) 2004-09-21 2018-02-21 The Scripps Research Institute In vivo incorporation of alkynyl amino acids into proteins in eubacteria
WO2006036779A2 (en) * 2004-09-22 2006-04-06 The Scripps Research Institute Site-specific labeling of proteins for nmr studies
US7378263B2 (en) 2004-10-20 2008-05-27 The Scripps Research Institute In vivo site-specific incorporation of N-acetyl-galactosamine amino acids in eubacteria
WO2006110182A2 (en) * 2004-10-27 2006-10-19 The Scripps Research Institute Orthogonal translation components for the in vivo incorporation of unnatural amino acids
CA2594561C (en) 2004-12-22 2014-12-23 Ambrx, Inc. Formulations of human growth hormone comprising a non-naturally encoded amino acid
KR20070100299A (ko) 2004-12-22 2007-10-10 암브룩스, 인코포레이티드 재조합 인간 성장 호르몬의 발현 및 정제 방법
EP1836298B1 (en) 2004-12-22 2012-01-18 Ambrx, Inc. COMPOSITIONS OF AMINOACYL-tRNA SYNTHETASE AND USES THEREOF
WO2006133089A2 (en) 2005-06-03 2006-12-14 Ambrx, Inc. Improved human interferon molecules and their uses
US8367588B2 (en) 2005-10-12 2013-02-05 The Scripps Research Institute Selective posttranslational modification of phage-displayed polypeptides
KR20080079643A (ko) 2005-11-16 2008-09-01 암브룩스, 인코포레이티드 비-천연 아미노산을 포함하는 방법 및 조성물
ES2648313T3 (es) 2005-12-22 2017-12-29 Pacific Biosciences Of California, Inc. Polimerasas para la incorporación de análogos nucleotídicos
PL1991680T3 (pl) * 2006-03-09 2014-01-31 Scripps Research Inst Układ do ekspresji ortogonalnych składników translacji w eubakteryjnych komórkach gospodarza
JP5249194B2 (ja) 2006-03-16 2013-07-31 ザ スクリプス リサーチ インスティチュート 非天然アミノ酸フェニルセレノシステインを含有するタンパク質の遺伝的にプログラムされた発現
CA2652894A1 (en) * 2006-05-23 2007-12-06 The Scripps Research Institute Genetically encoded fluorescent coumarin amino acids
WO2008030614A2 (en) 2006-09-08 2008-03-13 Ambrx, Inc. Suppressor trna transcription in vertebrate cells
DK2615108T3 (en) 2006-09-08 2017-01-30 Ambrx Inc Modified human plasma polypeptide or fc scaffolds and their applications
ES2456331T3 (es) * 2006-09-21 2014-04-22 The Scripps Research Institute Expresión genéticamente programada de proteínas sulfatadas selectivamente en eubacterias
US20080166766A1 (en) 2006-10-18 2008-07-10 The Scripps Research Institute Genetic incorporation of unnatural amino acids into proteins in mammalian cells
KR101476472B1 (ko) 2007-03-30 2015-01-05 암브룩스, 인코포레이티드 변형된 fgf-21 폴리펩티드 및 그 용도
AU2008247815B2 (en) 2007-05-02 2012-09-06 Ambrx, Inc. Modified interferon beta polypeptides and their uses
US20090208994A1 (en) * 2007-10-25 2009-08-20 The Scripps Research Institute Genetic incorporation of 3-aminotyrosine into reductases
CN101878303B (zh) 2007-11-02 2014-04-30 斯克利普斯研究院 使用包含非天然氨基酸的蛋白质进行定向进化
EP2220218A4 (en) * 2007-11-02 2010-12-08 Scripps Research Inst GENETICALLY ENCODED BORONATE AMINO ACID
CN101918026B (zh) 2007-11-20 2016-03-02 Ambrx公司 经修饰胰岛素多肽和其用途
CN101939410A (zh) 2007-12-11 2011-01-05 斯克利普斯研究院 甲基营养酵母菌巴斯德毕赤酵母中的体内非天然氨基酸表达
AU2009210677A1 (en) * 2008-02-08 2009-08-13 The Scripps Research Institute Breaking immunological tolerance with a genetically encoded unnatural amino acid
US20110076718A1 (en) * 2008-02-27 2011-03-31 The Scripps Research Institute In vivo incorporation of an unnatural amino acid comprising a 1,2-aminothiol group
US8257954B2 (en) 2008-03-31 2012-09-04 Pacific Biosciences Of California, Inc. Generation of modified polymerases for improved accuracy in single molecule sequencing
NZ591235A (en) 2008-07-23 2012-07-27 Ambrx Inc Modified bovine g-csf polypeptides comprising non natural amino acid and their uses treating infections such as mastitis
UA106731C2 (uk) 2008-09-26 2014-10-10 Амбркс, Інк. Модифіковані поліпептиди еритропоетину тварин та їх застосування
MX343802B (es) 2008-09-26 2016-11-23 Ambrx Inc Microorganismos y vacunas dependientes de replicacion de aminoacidos no naturales.
EP2370473B1 (en) 2008-12-10 2016-05-11 The Scripps Research Institute Production of carrier-peptide conjugates using chemically reactive unnatural amino acids
US20090197339A1 (en) * 2008-12-10 2009-08-06 The Scripps Research Institute In vivo unnatural amino acid expression in the methylotrophic yeast pichia pastoris
JP2013515080A (ja) 2009-12-21 2013-05-02 アンブルックス,インコーポレイテッド 修飾されているウシのソマトトロピンポリペプチドおよびそれらの使用
CA2784800A1 (en) 2009-12-21 2011-07-21 Ambrx, Inc. Modified porcine somatotropin polypeptides and their uses
CN103118692A (zh) 2010-04-26 2013-05-22 Atyr医药公司 与半胱氨酰-tRNA合成酶的蛋白片段相关的治疗、诊断和抗体组合物的创新发现
CN103096910A (zh) 2010-04-27 2013-05-08 Atyr医药公司 与苏氨酰-tRNA合成酶的蛋白片段相关的治疗、诊断和抗体组合物的创新发现
CA2797362C (en) 2010-04-27 2020-12-08 Atyr Pharma, Inc. Innovative discovery of therapeutic, diagnostic, and antibody compositions related to protein fragments of isoleucyl trna synthetases
JP6008837B2 (ja) 2010-04-28 2016-10-19 エータイアー ファーマ, インコーポレイテッド アラニルtRNA合成酵素のタンパク質フラグメントに関連した治療用、診断用および抗体組成物の革新的発見
CA2797374C (en) 2010-04-29 2021-02-16 Pangu Biopharma Limited Innovative discovery of therapeutic, diagnostic, and antibody compositions related to protein fragments of asparaginyl trna synthetases
CN103118693B (zh) 2010-04-29 2017-05-03 Atyr 医药公司 与缬氨酰‑tRNA合成酶的蛋白片段相关的治疗、诊断和抗体组合物的创新发现
EP2566516B1 (en) 2010-05-03 2019-07-03 aTyr Pharma, Inc. Innovative discovery of therapeutic, diagnostic, and antibody compositions related to protein fragments of seryl-trna synthetases
US8961961B2 (en) 2010-05-03 2015-02-24 a Tyr Pharma, Inc. Innovative discovery of therapeutic, diagnostic, and antibody compositions related protein fragments of arginyl-tRNA synthetases
AU2011248227B2 (en) 2010-05-03 2016-12-01 Pangu Biopharma Limited Innovative discovery of therapeutic, diagnostic, and antibody compositions related to protein fragments of phenylalanyl-alpha-tRNA synthetases
EP2566496B1 (en) 2010-05-03 2018-02-28 aTyr Pharma, Inc. Innovative discovery of therapeutic, diagnostic, and antibody compositions related to protein fragments of methionyl-trna synthetases
CN103096909A (zh) 2010-05-04 2013-05-08 Atyr医药公司 与谷氨酰-脯氨酰-tRNA合成酶的蛋白片段相关的治疗、诊断和抗体组合物的创新发现
US9062302B2 (en) 2010-05-04 2015-06-23 Atyr Pharma, Inc. Innovative discovery of therapeutic, diagnostic, and antibody compositions related to protein fragments of p38 multi-tRNA synthetase complex
WO2011143482A2 (en) 2010-05-14 2011-11-17 Atyr Pharma, Inc. Innovative discovery of therapeutic, diagnostic, and antibody compositions related to protein fragments of phenylalanyl-beta-trna synthetases
WO2011146410A2 (en) 2010-05-17 2011-11-24 Atyr Pharma, Inc. Innovative discovery of therapeutic, diagnostic, and antibody compositions related to protein fragments of leucyl-trna synthetases
JP6046607B2 (ja) 2010-05-27 2016-12-21 エータイアー ファーマ, インコーポレイテッド グルタミニルtRNA合成酵素のタンパク質フラグメントに関連した治療用、診断用および抗体組成物の革新的発見
WO2011153277A2 (en) * 2010-06-01 2011-12-08 Atyr Pharma, Inc. Innovative discovery of therapeutic, diagnostic, and antibody compositions related to protein fragments of lysyl-trna synthetases
EP2593124B1 (en) 2010-07-12 2017-04-26 aTyr Pharma, Inc. Innovative discovery of therapeutic, diagnostic, and antibody compositions related to protein fragments of aspartyl-trna synthetases
JP6177129B2 (ja) 2010-07-12 2017-08-09 エータイアー ファーマ, インコーポレイテッド ヒスチジルtRNA合成酵素のタンパク質フラグメントに関連した治療用、診断用および抗体組成物の革新的発見
CA2804416C (en) 2010-07-12 2020-04-28 Atyr Pharma, Inc. Innovative discovery of therapeutic, diagnostic, and antibody compositions related to protein fragments of glycyl-trna synthetases
US8999321B2 (en) 2010-07-12 2015-04-07 Atyr Pharma, Inc. Innovative discovery of therapeutic, diagnostic, and antibody compositions related to protein fragments of glycyl-tRNA synthetases
AU2011291943B2 (en) 2010-08-17 2015-01-22 Ambrx, Inc. Modified relaxin polypeptides and their uses
US9567386B2 (en) 2010-08-17 2017-02-14 Ambrx, Inc. Therapeutic uses of modified relaxin polypeptides
US9029506B2 (en) 2010-08-25 2015-05-12 Atyr Pharma, Inc. Innovative discovery of therapeutic, diagnostic, and antibody compositions related to protein fragments of tyrosyl-tRNA synthetases
AR083006A1 (es) 2010-09-23 2013-01-23 Lilly Co Eli Formulaciones para el factor estimulante de colonias de granulocitos (g-csf) bovino y variantes de las mismas
JP6039566B2 (ja) 2010-10-06 2016-12-07 エータイアー ファーマ, インコーポレイテッド 治療用、診断用および抗体組成物に関連したトリプトファニルtRNA合成酵素のタンパク質フラグメントの革新的発見
US20130078671A1 (en) * 2011-03-25 2013-03-28 The Texas A&M University System Incorporation of two different noncanonical amino acids into a single protein
WO2013066438A2 (en) 2011-07-22 2013-05-10 President And Fellows Of Harvard College Evaluation and improvement of nuclease cleavage specificity
US9714419B2 (en) 2011-08-09 2017-07-25 Atyr Pharma, Inc. PEGylated tyrosyl-tRNA synthetase polypeptides
WO2013086228A1 (en) 2011-12-06 2013-06-13 Atyr Pharma, Inc. Pegylated aspartyl-trna synthetase polypeptides
US9816084B2 (en) 2011-12-06 2017-11-14 Atyr Pharma, Inc. Aspartyl-tRNA synthetases
CN102517241B (zh) * 2011-12-19 2013-06-19 中国药科大学 一种含有d型氨基酸的双羰基还原酶的突变体的制备方法
EP2797959A4 (en) 2011-12-29 2015-08-26 Atyr Pharma Inc ASPARTYL-tRNA synthetase FC CONJUGATES
CN108410827B (zh) * 2012-05-18 2023-05-09 英国研究与创新署 整合包含bcn基团的氨基酸到多肽中的方法
JO3564B1 (ar) 2013-03-08 2020-07-05 Novartis Ag ببتيدات وتركيبات لعلاج ضرر المفاصل
JP6397479B2 (ja) 2013-03-15 2018-09-26 エータイアー ファーマ, インコーポレイテッド ヒスチジル−tRNAシンテターゼFcコンジュゲート
CN104099360A (zh) * 2013-04-12 2014-10-15 北京大学 非天然氨基酸标记的目的蛋白或肽的制备
WO2015009948A1 (en) 2013-07-19 2015-01-22 Regents Of The University Of California Milk fat globule epidermal growth factor 8 regulates fatty acid uptake
US20150044192A1 (en) 2013-08-09 2015-02-12 President And Fellows Of Harvard College Methods for identifying a target site of a cas9 nuclease
US9359599B2 (en) 2013-08-22 2016-06-07 President And Fellows Of Harvard College Engineered transcription activator-like effector (TALE) domains and uses thereof
US9228207B2 (en) 2013-09-06 2016-01-05 President And Fellows Of Harvard College Switchable gRNAs comprising aptamers
US9737604B2 (en) 2013-09-06 2017-08-22 President And Fellows Of Harvard College Use of cationic lipids to deliver CAS9
US9388430B2 (en) 2013-09-06 2016-07-12 President And Fellows Of Harvard College Cas9-recombinase fusion proteins and uses thereof
US11053481B2 (en) 2013-12-12 2021-07-06 President And Fellows Of Harvard College Fusions of Cas9 domains and nucleic acid-editing domains
EP3177718B1 (en) 2014-07-30 2022-03-16 President and Fellows of Harvard College Cas9 proteins including ligand-dependent inteins
CN114805532A (zh) 2014-10-24 2022-07-29 百时美施贵宝公司 修饰的fgf-21多肽及其用途
LT3981792T (lt) 2015-07-30 2024-11-11 Macrogenics, Inc. Pd-1 surišančios molekulės ir jų panaudojimo būdai
CA3002827A1 (en) 2015-10-23 2017-04-27 President And Fellows Of Harvard College Nucleobase editors and uses thereof
TW202208440A (zh) 2015-12-14 2022-03-01 美商宏觀基因股份有限公司 對於pd-1和ctla-4具有免疫反應性的雙特異性分子及其使用方法
CA3032699A1 (en) 2016-08-03 2018-02-08 President And Fellows Of Harvard College Adenosine nucleobase editors and uses thereof
AU2017308889B2 (en) 2016-08-09 2023-11-09 President And Fellows Of Harvard College Programmable Cas9-recombinase fusion proteins and uses thereof
US11542509B2 (en) 2016-08-24 2023-01-03 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
WO2018071868A1 (en) 2016-10-14 2018-04-19 President And Fellows Of Harvard College Aav delivery of nucleobase editors
WO2018087727A1 (en) 2016-11-14 2018-05-17 Novartis Ag Methods and compositions for treatment of cartilage damage and arthritis
WO2018119359A1 (en) 2016-12-23 2018-06-28 President And Fellows Of Harvard College Editing of ccr5 receptor gene to protect against hiv infection
KR102670432B1 (ko) 2017-02-08 2024-05-28 브리스톨-마이어스 스큅 컴퍼니 약동학적 인핸서를 포함하는 변형된 렐락신 폴리펩티드 및 그의 용도
WO2018165504A1 (en) 2017-03-09 2018-09-13 President And Fellows Of Harvard College Suppression of pain by gene editing
JP2020510439A (ja) 2017-03-10 2020-04-09 プレジデント アンド フェローズ オブ ハーバード カレッジ シトシンからグアニンへの塩基編集因子
BR112019019655A2 (pt) 2017-03-23 2020-04-22 Harvard College editores de nucleobase que compreendem proteínas de ligação a dna programáveis por ácido nucleico
CA3060514A1 (en) 2017-04-20 2018-10-25 Atyr Pharma, Inc. Compositions and methods for treating lung inflammation
US11560566B2 (en) 2017-05-12 2023-01-24 President And Fellows Of Harvard College Aptazyme-embedded guide RNAs for use with CRISPR-Cas9 in genome editing and transcriptional activation
US11732274B2 (en) 2017-07-28 2023-08-22 President And Fellows Of Harvard College Methods and compositions for evolving base editors using phage-assisted continuous evolution (PACE)
WO2019139645A2 (en) 2017-08-30 2019-07-18 President And Fellows Of Harvard College High efficiency base editors comprising gam
JP2021500036A (ja) 2017-10-16 2021-01-07 ザ ブロード インスティテュート, インコーポレーテッドThe Broad Institute, Inc. アデノシン塩基編集因子の使用
CA3094010A1 (en) 2018-03-15 2019-09-19 Universitat Hamburg Synthetic transfer rna with extended anticodon loop
LU100734B1 (en) 2018-03-15 2019-10-01 Univ Hamburg Synthetic transfer RNA with extended anticodon loop
KR20200143691A (ko) 2018-03-27 2020-12-24 에스씨피 홀딩스 언 어숨드 비지니스 네임 오브 나이트라이드 이그나이터스 엘엘씨 쿡탑용 고온 표면 점화기
CN112313336B (zh) 2018-05-01 2024-12-03 Ambrx公司 一种用于优化抗体表达的方法
EP3797160A1 (en) 2018-05-23 2021-03-31 The Broad Institute Inc. Base editors and uses thereof
SMT202400087T1 (it) 2018-09-11 2024-03-13 Ambrx Inc Coniugati polipeptidici di interleuchina-2 e loro usi
WO2020082057A1 (en) 2018-10-19 2020-04-23 Ambrx, Inc. Interleukin-10 polypeptide conjugates, dimers thereof, and their uses
CN111718920B (zh) * 2019-03-19 2021-05-07 宁波鲲鹏生物科技有限公司 在蛋白中高效引入赖氨酸衍生物的氨酰基-tRNA合成酶
BR112021018606A2 (pt) 2019-03-19 2021-11-23 Harvard College Métodos e composições para editar sequências de nucleotídeos
JP2022528696A (ja) 2019-04-11 2022-06-15 アークタラス テラピュウティクス、インク アンチコドンループを延長した合成転移rna
LU101182B1 (en) * 2019-04-11 2020-10-12 Univ Hamburg Synthetic transfer RNA with extended anticodon loop
CN110172467B (zh) * 2019-05-24 2021-03-16 浙江大学 一种利用嵌合设计方法构建正交的氨酰-tRNA合成酶/tRNA体系
CN115243726A (zh) 2020-03-11 2022-10-25 北京泰德制药股份有限公司 白介素-2多肽偶联物及其使用方法
KR20230019843A (ko) 2020-05-08 2023-02-09 더 브로드 인스티튜트, 인코퍼레이티드 표적 이중 가닥 뉴클레오티드 서열의 두 가닥의 동시 편집을 위한 방법 및 조성물
CN114250243B (zh) * 2020-09-24 2024-05-03 深圳华大生命科学研究院 一种检测极端嗜盐生物中氨酰-tRNA合成酶和tRNA活性的系统及方法
US20230181754A1 (en) 2021-07-09 2023-06-15 Bright Peak Therapeutics Ag Modified checkpoint inhibitors and uses thereof
WO2023281485A1 (en) 2021-07-09 2023-01-12 Bright Peak Therapeutics Ag Modified il-2 polypeptides for treatment of inflammatory and autoimmune diseases
US20230201365A1 (en) 2021-07-09 2023-06-29 Bright Peak Therapeutics Ag Modified cd20 antibodies and uses thereof
JP2024526298A (ja) 2021-07-09 2024-07-17 ブライト ピーク セラピューティクス エージー チェックポイント阻害剤とil-2とのコンジュゲート、およびその使用
EP4366778A1 (en) 2021-07-09 2024-05-15 Bright Peak Therapeutics AG Antibody conjugates and manufacture thereof
US20240384267A1 (en) 2021-09-20 2024-11-21 The Broad Institute, Inc. Compositions and methods for multiplex decoding of quadruplet codons
EP4482531A1 (en) 2022-02-23 2025-01-01 Bright Peak Therapeutics AG Immune antigen specific il-18 immunocytokines and uses thereof
WO2023161857A1 (en) 2022-02-23 2023-08-31 Bright Peak Therapeutics Ag Bifunctional cytokine compositions
CN114908066B (zh) * 2022-05-17 2024-01-23 杭州嵌化合生医药科技有限公司 一种正交翻译系统及其在再分配密码子恢复ptc疾病中功能蛋白表达方面的应用
WO2024091824A1 (en) 2022-10-26 2024-05-02 Ada Forsyth Institute, Inc. Differentiation and reprogramming of chondrocyte
US20240376170A1 (en) 2023-01-11 2024-11-14 Bright Peak Therapeutics Ag Conditionally activated proteins and methods of use
CN115975978B (zh) * 2023-02-01 2023-08-01 珠海宝锐生物科技有限公司 Bst DNA聚合酶大片段突变体及其应用
WO2024241086A1 (en) 2023-05-24 2024-11-28 Ambrx, Inc. Pegylated bovine interferon lambda and methods of use thereof

Family Cites Families (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001515361A (ja) * 1997-05-06 2001-09-18 ザイモジェネティクス,インコーポレイティド 新規な腫瘍抗原
US20030008820A1 (en) * 2001-03-27 2003-01-09 Massachusetts Institute Of Technology Methods and products related to FGF dimerization
EP1456360B1 (en) * 2001-04-19 2015-06-03 The Scripps Research Institute Methods and composition for the production of orthoganal trna-aminoacyltrna synthetase pairs
EP1578907A2 (en) * 2001-10-17 2005-09-28 ZymoGenetics, Inc. Secreted protein, ztnf9
AU2003286436B2 (en) * 2002-10-16 2010-08-19 The Scripps Research Institute Glycoprotein synthesis
KR20050072441A (ko) * 2002-10-16 2005-07-11 더 스크립스 리서치 인스티튜트 케토 아미노산의 단백질로의 부위 특이적 도입
KR20050088134A (ko) * 2002-12-22 2005-09-01 더 스크립스 리서치 인스티튜트 단백질 어레이
CN103289960B (zh) * 2003-04-17 2017-04-26 斯克利普斯研究院 扩展真核生物遗传密码
EP2378288B1 (en) * 2003-06-18 2015-09-09 The Scripps Research Institute Unnatural reactive amino acid genetic code additions
WO2005007624A2 (en) * 2003-07-07 2005-01-27 The Scripps Research Institute Compositions of orthogonal glutamyl-trna and aminoacyl trna synthetase pairs and uses thereof
WO2005007870A2 (en) * 2003-07-07 2005-01-27 The Scripps Research Institute COMPOSITIONS OF ORTHOGONAL LEUCYL-tRNA AND AMINOACYL-tRNA SYNTHETASE PAIRS AND USES THEREOF
ES2301099T3 (es) * 2003-07-07 2008-06-16 The Scripps Research Institute Composiciones de parejas ortogonales lisil-arnt y aminoacil-arnt sintetasa y usos de las mismas.
AU2004282577B2 (en) * 2003-10-14 2009-10-29 The Scripps Research Institute Site-specific incorporation of redox active amino acids into proteins
EP1725251A4 (en) * 2003-12-18 2009-07-01 Scripps Research Inst SELECTIVE PROCESSING OF 5-HYDROXYTRYPTOPHANE IN PROTEINS IN MAMMALIAN CELLS
MXPA06013586A (es) * 2004-05-25 2007-11-09 Scripss Res Inst Incorporacion especifica del sitio de aminoacidos no naturales que contienen atomos pesados en proteinas para la determinacion de la estructura cristalina.
US20060134746A1 (en) * 2004-09-21 2006-06-22 The Scripps Research Institute Adding photoregulated amino acids to the genetic code
EP2770053B1 (en) * 2004-09-21 2018-02-21 The Scripps Research Institute In vivo incorporation of alkynyl amino acids into proteins in eubacteria
WO2006036779A2 (en) * 2004-09-22 2006-04-06 The Scripps Research Institute Site-specific labeling of proteins for nmr studies
US7378263B2 (en) * 2004-10-20 2008-05-27 The Scripps Research Institute In vivo site-specific incorporation of N-acetyl-galactosamine amino acids in eubacteria
WO2006110182A2 (en) * 2004-10-27 2006-10-19 The Scripps Research Institute Orthogonal translation components for the in vivo incorporation of unnatural amino acids
FR2888097B1 (fr) * 2005-07-06 2007-10-05 Oreal Dispositif de conditionnement et d'application comportant un organe d'essorage
US8367588B2 (en) * 2005-10-12 2013-02-05 The Scripps Research Institute Selective posttranslational modification of phage-displayed polypeptides
PL1991680T3 (pl) * 2006-03-09 2014-01-31 Scripps Research Inst Układ do ekspresji ortogonalnych składników translacji w eubakteryjnych komórkach gospodarza
JP5249194B2 (ja) * 2006-03-16 2013-07-31 ザ スクリプス リサーチ インスティチュート 非天然アミノ酸フェニルセレノシステインを含有するタンパク質の遺伝的にプログラムされた発現
CA2652894A1 (en) * 2006-05-23 2007-12-06 The Scripps Research Institute Genetically encoded fluorescent coumarin amino acids
ES2456331T3 (es) 2006-09-21 2014-04-22 The Scripps Research Institute Expresión genéticamente programada de proteínas sulfatadas selectivamente en eubacterias
US20080166766A1 (en) * 2006-10-18 2008-07-10 The Scripps Research Institute Genetic incorporation of unnatural amino acids into proteins in mammalian cells
TWI334126B (en) * 2007-07-17 2010-12-01 Au Optronics Corp Voltage adjusting circuit, method, and display apparatus having the same
US20090208994A1 (en) * 2007-10-25 2009-08-20 The Scripps Research Institute Genetic incorporation of 3-aminotyrosine into reductases
CN101878303B (zh) * 2007-11-02 2014-04-30 斯克利普斯研究院 使用包含非天然氨基酸的蛋白质进行定向进化
EP2220218A4 (en) * 2007-11-02 2010-12-08 Scripps Research Inst GENETICALLY ENCODED BORONATE AMINO ACID
WO2009064416A2 (en) 2007-11-15 2009-05-22 The Scripps Research Institute Genetic incorporation of an alpha-hydroxy acid into proteins to generate ester backbone linkages at defined sites
AU2009210677A1 (en) * 2008-02-08 2009-08-13 The Scripps Research Institute Breaking immunological tolerance with a genetically encoded unnatural amino acid
US20110076718A1 (en) 2008-02-27 2011-03-31 The Scripps Research Institute In vivo incorporation of an unnatural amino acid comprising a 1,2-aminothiol group
US20090197339A1 (en) * 2008-12-10 2009-08-06 The Scripps Research Institute In vivo unnatural amino acid expression in the methylotrophic yeast pichia pastoris

Also Published As

Publication number Publication date
EP1649004A4 (en) 2008-04-09
JP5192150B2 (ja) 2013-05-08
AU2004267359A1 (en) 2005-03-03
SI1666604T1 (sl) 2008-08-31
US20100291559A1 (en) 2010-11-18
US7575895B2 (en) 2009-08-18
ATE471385T1 (de) 2010-07-15
MXPA06000242A (es) 2006-04-07
BRPI0412272A (pt) 2006-09-05
ATE386133T1 (de) 2008-03-15
US8030028B2 (en) 2011-10-04
DE602004027770D1 (de) 2010-07-29
DE602004011789T2 (de) 2009-02-12
EP1649004A2 (en) 2006-04-26
US20120129215A1 (en) 2012-05-24
JP2011101656A (ja) 2011-05-26
US7638297B2 (en) 2009-12-29
US8669073B2 (en) 2014-03-11
CN101076598B (zh) 2012-07-25
ES2301099T3 (es) 2008-06-16
CA2531146A1 (en) 2005-03-03
EP1666604B1 (en) 2008-02-13
EP1666604A1 (en) 2006-06-07
CN101076598A (zh) 2007-11-21
JP2007529998A (ja) 2007-11-01
PT1666604E (pt) 2008-05-19
DE602004011789D1 (de) 2008-03-27
AU2004267359B2 (en) 2010-09-09
WO2005019415A3 (en) 2007-01-25
US20070042461A1 (en) 2007-02-22
WO2005019415A2 (en) 2005-03-03
US20060177900A1 (en) 2006-08-10

Similar Documents

Publication Publication Date Title
US7638297B2 (en) Compositions of orthogonal lysyl-tRNA and aminoacyl-tRNA synthetase pairs and uses thereof
US7527943B2 (en) Compositions of orthogonal glutamyl-tRNA and aminoacyl-tRNA synthetase pairs and uses thereof
US20060160175A1 (en) Compositions of orthogonal leucyl-trna and aminoacyl-trna synthetase pairs and uses thereof
JP4444113B2 (ja) ケトアミノ酸の部位特異的蛋白質組込み方法
CN101400796B (zh) 在真细菌宿主细胞内表达正交翻译组分的系统
JP5657850B2 (ja) 酸化還元機能性アミノ酸のタンパク質への部位特異的組み入れ
EP1914314B1 (en) Compositions of orthogonal lysyl-tRNA and aminoacyl-tRNA synthetase pairs and uses thereof