PT1794323E - Incorporação in vivo de aminoácidos alquinilo em proteínas em eubactérias - Google Patents

Incorporação in vivo de aminoácidos alquinilo em proteínas em eubactérias Download PDF

Info

Publication number
PT1794323E
PT1794323E PT58120080T PT05812008T PT1794323E PT 1794323 E PT1794323 E PT 1794323E PT 58120080 T PT58120080 T PT 58120080T PT 05812008 T PT05812008 T PT 05812008T PT 1794323 E PT1794323 E PT 1794323E
Authority
PT
Portugal
Prior art keywords
trna
amino acid
seq
alkynyl
cell
Prior art date
Application number
PT58120080T
Other languages
English (en)
Inventor
Alexander Deiters
Peter Schultz
Original Assignee
Scripps Research Inst
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Scripps Research Inst filed Critical Scripps Research Inst
Publication of PT1794323E publication Critical patent/PT1794323E/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K47/00Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient
    • A61K47/50Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates
    • A61K47/51Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent
    • A61K47/62Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent the modifying agent being a protein, peptide or polyamino acid
    • A61K47/64Drug-peptide, drug-protein or drug-polyamino acid conjugates, i.e. the modifying agent being a peptide, protein or polyamino acid which is covalently bonded or complexed to a therapeutically active agent
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H21/00Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids
    • C07H21/04Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids with deoxyribosyl as saccharide radical
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/67General methods for enhancing the expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/93Ligases (6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/02Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biophysics (AREA)
  • Medicinal Chemistry (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Epidemiology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)
  • Enzymes And Modification Thereof (AREA)

Description

ΕΡ1794323Β1
DESCRIÇÃO
"INCORPORAÇÃO IN VIVO DE AMINOÁCIDOS ALQUINILO EM PROTEÍNAS EM EUBACTÉRIAS"
Campo da invenção A invenção está no campo da bioquímica de tradução. A invenção refere-se a composições e a métodos para produzir e utilizar os tARN ortogonais, sintetases ortogonais de aminoacil-tARN, e pares dos mesmos, que incorporam aminoácidos alquinilo em proteínas. A invenção também se refere a métodos de produção de proteínas em células utilizando tais pares e composições relacionadas.
Antecedentes da invenção A capacidade de modificar quimicamente, numa forma específica do local, proteínas com moléculas não peptídicas, tais como sondas espectroscópicas, auxiliares catalíticos, ou polímeros, ou a ligação cruzada de forma covalente de uma proteína a outra proteína ou a qualquer outra porção, proporciona um meio poderoso tanto para investigar como para manipular as propriedades químicas e biológicas das proteínas. Uma abordagem comum envolve a bioconjugação de resíduos nucleofílicos de superfície da proteína, por exemplo, as cadeias laterais de lisina, histidina, ou de cisteina, com grupos electrofílicos sobre uma molécula exógena, tais como aldeídos, carboxamidas a-halo, e succinimidas N-hidroxi (Lemineux, G. A.; Bertozzi, C. R. TIBTECH 1996, 16, 506) .
Infelizmente, um desafio na utilização dos alvos nucleofílicos que ocorrem naturalmente numa proteína para direcionar modificações é a seletividade modesta destas reações, e as ocorrências múltiplas de aminoácidos 1 ΕΡ1794323Β1 nucleofílicos em proteínas, levando à formação de misturas heterogéneas de proteínas marcadas. Para além disso, as reações de modificação direcionadas para o nucleófilo requerem frequentemente condições não fisiológicas, que podem permitir estratégias de modificação in vivo e/ou resultar numa perda de atividade biológica da proteína. Há uma necessidade na tecnologia de criar novos alvos e novas estratégias para a modificação específica e direcionada de proteínas. Infelizmente, todos os organismos conhecidos, de bactérias a humanos, codificam os mesmos vinte aminoácidos comuns (com raras exceções de selenocisteína (veja-se, por exemplo, A. Bock et al., (1991), Molecular Microbiology 5: 515-20) e pirrolisina (veja-se, por exemplo, G. Srinivasan et al., (2002), Science 296: 1459-1462)). Esta característica limita a utilização de aminoácidos que ocorrem naturalmente no desenvolvimento de novos produtos químicos para a modificação de proteínas alvo.
Uma estratégia para superar esta limitação é expandir o código genético, e adicionar ao repertório biológico aminoácidos que possuem propriedades químicas distintas. Esta abordagem tem provado ser possível pela utilização de tARN "ortogonais", e novas sintetases "ortogonais" de aminoacil-tARN correspondentes, para adicionar aminoácidos não naturais a proteínas, utilizando a maquinaria biossintética de proteína in vivo da eubactéria Escherichia coli (E. coli) e de outros organismos (por exemplo, Wang et al., (2001), Science 292: 498-500; Chin et al., (2002) Journal of the American Chemical Society 124: 9026-9027; Chin e Schultz, (2002), ChemBioChem 11: 1135-1137; Chin, et al., (2002), PNAS United States of America 99: 11020-11024, e Wang e Schultz, (2002), Chem. Comm., 1-10). Vejam-se também as publicações internacionais WO 2002/086075 intitulada "Methods and compositions for the production of orthogonal tRNA aminoacyl-tRNA synthetase pairs"; WO 2 ΕΡ1794323Β1 2002/085923 intitulada "In vivo incorporation of unnatural amino acids"; WO 2004/094593 intitulada "Expanding the eukaryotic genetic code"; WO 2005/019415 apresentada a 7 de julho de 2004; WO 2005/007870 apresentada a 7 de julho de 2004; e WO 2005/007624 apresentada a 7 de julho de 2004.
Existe uma necessidade na tecnologia de novos métodos para realizar modificações altamente especificas e direcionadas de proteínas. Existe uma necessidade na tecnologia para o desenvolvimento de componentes ortogonais de tradução que incorporam in vivo em E. coli aminoácidos não naturais em proteínas, onde os aminoácidos não naturais podem ser incorporados numa posição definida, e em que o aminoácido não natural tem propriedades químicas distintivas que permitem que sirva como um alvo para uma modificação específica da exclusão de reações cruzadas ou de reações secundárias com outras partes das proteínas. Esta necessidade na tecnologia é especialmente aplicável a E. coli, uma vez que os sistemas de expressão de proteínas eubacterianas pode produzir grandes quantidades de material de proteína recombinante, para o estudo científico ou para aplicações terapêuticas. A presente invenção preenche estas e outras necessidades, como será evidente após a revisão da divulgação que se segue. O documento US 2003/108885 AI descreve composições e métodos para gerar componentes da maquinaria biossintética de proteína, incluindo tARN ortogonais, sintetases ortogonais de aminoacil-tARN, e pares ortogonais de tARN / sintetases.
Wang et al., 2001, Science, vol. 292, pág. 498-500, descreve um método para expandir o código genético de E. coli.
Kobayashi et al., 2003, Nature Structural Biology, vol. 10, n°. 6, pág. 425-432, descreve uma base estrutural para as especificidades de tARN ortogonais de sintetases de tirosil-tARN para a expansão do código genético. 3 ΕΡ1794323Β1 0 documento WO 02/085923 descreve métodos e composições para a incorporação in vivo de aminoácidos não naturais.
Sumário da invenção
Num aspeto, a presente invenção proporciona uma célula eubacteriana que compreende uma primeira sintetase ortogonal de aminoacil-tARN (O-RS) que funciona na célula, em que a O-RS aminoacila preferencialmente um primeiro tARN ortogonal (Ο-tARN) com um primeiro aminoácido não natural que é um aminoácido alquinilo; em que o aminoácido alquinilo é uma tirosina substituída em para ou uma fenilalanina substituída em para, em que a tirosina ou a fenilalanina está substituída na posição para com um grupo etinilo ou propinilo; e em que a O-RS aminoacila o Ο-tARN com o primeiro aminoácido não natural com uma eficiência de supressão de pelo menos 50 % da eficiência de supressão de um par sintetase ortogonal, em que o par é o Ο-tARN com a SEQ ID NO: 1 e um polipéptido de sintetase que compreende uma sequência de aminoácidos selecionada a partir de qualquer uma das SEQ ID NO: 4, 6, 8, 10, 12, 14, 16, 18, 21, 22, 23, 24 e 25.
Num outro aspeto, a presente invenção proporciona um método de produção de uma proteína que compreende um aminoácido não natural alquinilo numa célula eubacteriana, em que o aminoácido alquinilo está numa posição especificada, compreendendo o método: (a) proporcionar uma célula eubacteriana que compreende: (i) uma sintetase ortogonal de aminoacil-tARN (O-RS); 4 ΕΡ1794323Β1 (ii) um tARN ortogonal (O-tARN), em que a O-RS referida aminoacila preferencialmente o O-tARN referido com o aminoácido alquinilo referido, com uma eficiência de supressão de pelo menos 50 % da eficiência de supressão de um par sintetase ortogonal, em que o dito par é o O-tARN com a SEQ ID NO: 1 e um polipéptido de sintetase que compreende uma sequência de aminoácidos selecionada a partir de qualquer uma das SEQ ID NO: 4, 6, 8, 10, 12, 14, 16, 18, 21, 22, 23, 24 e 25; (iii) um ácido nucleico que codifica para a proteína referida, em que o ácido nucleico compreende pelo menos um codão seletor que é reconhecido pelo O-tARN; e, (iv) o aminoácido alquinilo referido, em que o aminoácido alquinilo é uma tirosina substituída em para ou uma fenilalanina substituída em para, em que a tirosina ou a fenilalanina está substituída na posição para com um grupo etinilo ou propinilo; e, (b) o crescimento da célula referida; (c) a incorporação do aminoácido alquinilo referido na posição especificada referida na proteína codificada pelo ácido nucleico durante a tradução da proteína, em que a posição especificada na proteína corresponde à posição do codão seletor no ácido nucleico referido, produzindo assim a proteína referida, que compreende o aminoácido alquinilo referido na posição especificada.
De acordo com a presente invenção, a célula eubacteriana pode ser uma célula de E. coli.
De acordo com a presente invenção: (i) a O-RS pode ser pelo menos 95 % idêntica a uma sintetase de aminoacil-tARN de Methanococcus 5 ΕΡ1794323Β1 jannaschii; ou (ii) a O-RS pode ser pelo menos 95 % idêntica a uma sintetase de tirosil-tARN de Methanococcus jannaschii; ou % idêntica à selvagem de sequência de % idêntica à selvagem de sequência de (iii) a O-RS pode ser pelo menos 95 sintetase de tirosil-tARN do tipo Methanococcus jannaschii, possuindo a aminoácidos da SEQ ID NO: 2; ou (iv) a O-RS pode ser pelo menos 95 sintetase de tirosil-tARN do tipo Methanococcus jannaschii, que possui a aminoácidos da SEQ ID NO: 2, em que a O-RS compreende uma sequência de aminoácidos que compreende: (a) alanina, histidina, serina ou treonina numa posição que corresponde à posição de aminoácido 32 da SEQ ID NO: 21; (b) prolina, glutamina, lisina, arginina, serina ou alanina numa posição que corresponde à posição de aminoácido 107 da SEQ ID NO: 21; (c) alanina, leucina, prolina ou serina numa posição que corresponde à posição de aminoácido 158 da SEQ ID NO: 21; e (d) alanina, histidina, treonina ou prolina numa posição que corresponde à posição de aminoácido 162 da SEQ ID NO: 21; ou (v) a O-RS pode ser pelo menos 95 % idêntica à sintetase de tirosil-tARN do tipo selvagem de Methanococcus jannaschii, que possui a sequência de aminoácidos da SEQ ID NO: 2, em que a O-RS compreende uma sequência de aminoácidos que compreende: (a) a alanina numa posição que corresponde à posição de aminoácido 32 da SEQ ID NO: 21; (b) a prolina ou a glutamina numa posição que 6 ΕΡ1794323Β1 corresponde à posição de aminoácido 107 da SEQ ID NO: 21; (c) a alanina numa posição que corresponde à posição de aminoácido 158 da SEQ ID NO 21; e (d) a alanina ou a prolina numa posição que corresponde à posição de aminoácido 162 da SEQ ID NO 21; ou (vi) a O-RS pode compreender uma sequência de aminoácidos selecionada a partir da SEQ ID NO: 4, 6, 8, 10, 12, 14, 16, 18, e variantes conservadoras da mesma.
De acordo com a presente invenção, a célula pode compreender um polinucleótido que codifica para a O-RS, em que a O-RS compreende uma sequência de aminoácidos selecionada a partir da SEQ ID NO: 4, 6, 8, 10, 12, 14, 16, 18, e variantes conservadoras da mesma.
De acordo com a presente invenção, o polinucleótido pode ser selecionado a partir das sequências de nucleótidos da SEQ ID NO: 5, 7, 9, 11, 13, 15, 17 ou 19.
De acordo com a presente invenção: (a) o O-tARN pode ser um tARN supressor âmbar; ou (b) o Ο-tARN pode compreender ou pode ser codificado por uma sequência polinucleotídica estabelecida na SEQ ID NO: 1.
De acordo com a presente invenção, o aminoácido alquinilo referido pode ser a para- proparqiloxifenilalanina.
De acordo com a presente invenção, o ácido nucleico pode compreender pelo menos um codão seletor, em que o dito codão seletor é reconhecido pelo primeiro Ο-tARN referido.
De acordo com a presente invenção, a célula ou o método podem compreender uma segunda O-RS e um segundo 0-tARN, em que a segunda O-RS aminoacila preferencialmente o segundo Ο-tARN com um segundo aminoácido não natural que é 7 ΕΡ1794323Β1 diferente do primeiro aminoácido não natural, e em que o segundo O-tARN reconhece um codão seletor que é diferente do codão seletor reconhecido pelo primeiro O-tARN.
De acordo com a presente invenção, a célula pode compreender o dito aminoácido alquinilo. 0 aminoácido alquinilo referido pode ser a para-propargiloxifenilalanina.
De acordo com a presente invenção, a célula pode compreender um sistema de tradução. 0 sistema de tradução referido pode compreender: (a) a O-RS referida; (b) o O-tARN referido; (c) um ácido nucleico que codifica para um polipéptido de interesse, em que o ácido nucleico compreende pelo menos um codão seletor, em que o codão seletor é reconhecido pelo O-tARN referido; e, (d) um aminoácido alquinilo, em que a O-RS referida é capaz de carregar o O-tARN referido com o aminoácido alquinilo referido.
Em conformidade com o método da presente invenção, a proteína referida pode compreender uma proteína terapêutica do tipo selvagem, uma proteína de diagnóstico, uma enzima industrial ou uma porção da mesma.
Em conformidade com o método da presente invenção, depois de se ter obtido a proteína referida, a proteína pode ser formulada numa composição com um transportador farmaceuticamente aceitável.
Em conformidade com o método da presente invenção, a proteína referida pode ser modificada na posição especificada referida. A proteína referida pode compreender uma ligação de triazol na posição especificada referida.
Num outro aspeto, a presente invenção proporciona um polipéptido que é pelo menos 90 % idêntico à sintetase de tirosil aminoacil-tARN de Methanococcus jannaschii com a SEQ ID NO: 2, em que o polipéptido tem uma sequência de 8 ΕΡ1794323Β1 aminoácidos que compreende:
(a) alanina, histidina, serina ou treonina numa posição que corresponde à posição de aminoácido 32 da SEQ ID NO: 21; (b) prolina, glutamina, lisina, arginina, serina ou alanina numa posição que corresponde à posição de aminoácido 107 da SEQ ID NO: 21; (c) alanina, leucina, prolina ou serina numa posição que corresponde à posição de aminoácido 158 da SEQ ID NO: 21; e (d) alanina, histidina, treonina ou prolina numa posição que corresponde à posição de aminoácido 162 da SEQ ID NO: 21; e em que o polipéptido é uma sintetase de aminoacil-tARN capaz de aminoacilar preferencialmente um tARN ortogonal (O-tARN) com um aminoácido alquinilo, em que o aminoácido alquinilo é uma tirosina substituída em para ou uma fenilalanina substituída em para, em que a tirosina ou a fenilalanina está substituída na posição para com um grupo etinilo ou propinilo; e em que a O-RS aminoacila o Ο-tARN com o primeiro aminoácido não natural com uma eficiência de supressão de pelo menos 50 % da eficiência de supressão de um par sintetase ortogonal, em que o par é o Ο-tARN da SEQ ID NO: 1 e um polipéptido de sintetase que compreende uma sequência de aminoácidos selecionada a partir de qualquer uma das SEQ ID NO: 4, 6, 8, 10, 12, 14, 16, 18, 21, 22, 23, 24 e 25. O polipéptido da presente invenção pode ter uma sequência de aminoácidos que compreende: (a) a alanina numa posição que corresponde à posição de aminoácido 32 da SEQ ID NO: 21; (b) a prolina ou a glutamina numa posição que corresponde à posição de aminoácido 107 da SEQ ID NO: 21; (c) a alanina numa posição que corresponde à posição de 9 ΕΡ1794323Β1 aminoácido 158 da SEQ ID NO: 21; e (d) a alanina numa posição que corresponde à posição de aminoácido 162 da SEQ ID NO: 21.
Num outro aspeto, a presente invenção proporciona um polipéptido que compreende uma sequência de aminoácidos apresentada na SEQ ID NO: 4, 6, 8, 10, 12, 14, 16, 18, ou uma variante conservativa da mesma, em que o polipéptido referido é uma sintetase de aminoacil-tARN capaz de aminoacilar preferencialmente um tARN ortogonal (O-tARN) numa célula eubacteriana com um aminoácido alquinilo, em que o aminoácido alquinilo é uma tirosina que está substituída na posição para com um grupo etinilo ou propinilo, ou o aminoácido alquinilo é uma fenilalanina que está substituída na posição para com um grupo etinilo ou propinilo; e em que a 0-RS aminoacila o Ο-tARN com o primeiro aminoácido não natural com uma eficiência de supressão de pelo menos 50 % da eficiência de supressão de um par sintetase ortogonal, em que o par é o O-tARNt da SEQ ID NO: 1 e um polipéptido de sintetase, que compreende uma sequência de aminoácidos selecionada a partir de qualquer uma das SEQ ID NO: 4, 6, 8, 10, 12, 14, 16, 18, 21, 22, 23, 24 e 25.
Num outro aspeto, a presente invenção proporciona um polinucleótido que codifica para um polipéptido da invenção. O polinucleótido pode ser selecionado a partir da SEQ ID NO: 5, 7, 9, 11, 13, 15, 17 e 19.
Num outro aspeto, a presente invenção fornece um vetor que compreende um polinucleótido da invenção. O vetor pode ser um vetor de expressão.
Num outro aspeto, a presente invenção proporciona uma célula que compreende um vetor da invenção.
Definições
Antes de descrever a invenção em pormenor, é para ser entendido que esta invenção não está limitada a sistemas 10 ΕΡ1794323Β1 biológicos específicos, os quais podem, é claro, variar. É também para ser compreendido que a terminologia utilizada aqui é para o propósito de descrever apenas realizações específicas, e não se destina a ser limitativa. Tal como utilizado nesta especificação e nas reivindicações anexas, as formas singulares "um", "uma" e "o", "a" incluem os referentes plurais a menos que o contexto indique claramente o contrário. Assim, por exemplo, a referência a "uma célula" inclui combinações de duas ou mais células; a referência a "um polinucleótido" inclui, como uma questão prática, muitas cópias desse polinucleótido. A menos que aqui definido abaixo e na parte restante da especificação, todos os termos técnicos e científicos aqui utilizados têm o mesmo significado que o normalmente entendido por um vulgar perito na tecnologia à qual pertence a invenção.
Ortogonal: Tal como aqui utilizado, o termo "ortogonal" refere-se a uma molécula (por exemplo, um tARN ortogonal (Ο-tARN) e/ou uma aminoacil-tARN sintetase ortogonal (O-RS)) que funciona com eficácia reduzida com componentes endógenos de uma célula, em comparação com uma molécula correspondente que é endógena para a célula ou para o sistema de tradução, ou que não funciona com os componentes endógenos da célula. No contexto de tARN e aminoacil-tARN sintetases, ortogonal refere-se a uma incapacidade ou a uma eficiência reduzida, por exemplo, menos de 20 % de eficiência, menos de 10 % de eficiência, menos de 5 % de eficiência, ou menos de 1 % de eficiência, de um tARN ortogonal para funcionar com uma tARN sintetase endógena em comparação com um tARN endógeno a funcionar com a tARN sintetase endógena, ou de uma aminoacil-tARN sintetase ortogonal a funcionar com um tARN endógeno em comparação com uma tARN sintetase endógena a funcionar com o tARN endógeno. A molécula ortogonal não tem uma molécula complementar endógena funcionalmente normal na célula. Por 11 ΕΡ1794323Β1 exemplo, um tARN ortogonal numa célula é aminoacilado por qualquer RS endógena da célula com eficácia reduzida, ou mesmo nula, quando em comparação com a aminoacilação de um tARN endógeno pela RS endógena. Em outro exemplo, uma RS ortogonal aminoacila qualquer tARN endógeno de uma célula de interesse com eficácia reduzida, ou mesmo nula, em comparação com a aminoacilação do tARN endógeno por uma RS endógena. Pode ser introduzida na célula uma segunda molécula ortogonal, que funciona com a primeira molécula ortogonal. Por exemplo, um par ortogonal tARN / RS inclui componentes complementares introduzidos que funcionam em conjunto na célula com uma eficiência (por exemplo, eficiência de 45 %, eficiência de 50 %, eficiência de 60 o o f eficiência de 70 %, eficiência de 75 %, eficiência de 80 o, O r eficiência de 90 %, eficiência de 95 %, ou eficiência de 99 % ou mais), em comparação com a de um controlo por exemplo, um par endógeno tARN / RS correspondente, ou um par ortogonal ativo (por exemplo, um par tirosil tARN ortogonal / RS).
Tirosil tARN ortogonal: Tal como aqui utilizado, um tirosil tARN ortogonal (t irosil-O-tARN) é um tARN que é ortogonal a um sistema de tradução de interesse, em que o tARN é: (1) idêntico ou substancialmente semelhante a um tirosil tARN que ocorre naturalmente, (2) um derivado de um tirosil tARN que ocorre naturalmente, por mutagénese natural ou artificial, (3) um derivado por qualquer processo que toma uma sequência de tirosil tARN do tipo selvagem ou mutante de (1) ou (2) em conta, (4) um homólogo de tirosil tARN do tipo selvagem ou mutante, (5) um homólogo a qualquer exemplo de tARN que seja designado como um substrato para uma tirosil tARN sintetase na tabela 4, ou (6) uma variante conservativa de qualquer exemplo de tARN que seja designado como um substrato para uma tirosil tARN sintetase na tabela 4. 0 tirosil tARN pode existir
carregado com um aminoácido, ou num estado não carregado. E 12 ΕΡ1794323Β1 também para ser entendido que um "tirosil-O-tARN" é opcionalmente carregado (aminoacilado) por uma sintetase cognata com um aminoácido diferente de tirosina, por exemplo, com o aminoácido não natural para-propargiloxifenilalanina. De facto, será apreciado que um tirosil-O-tARN da invenção é utilizado vantajosamente para introduzir praticamente qualquer aminoácido, quer natural ou artificial, num polipéptido em crescimento, durante a tradução, em resposta a um codão seletor.
Tirosil aminoácido sintetase ortogonal: Tal como aqui utilizado, uma tirosil amino ácido sintetase ortogonal (tirosil-O-RS) é uma enzima que aminoacila preferencialmente o tirosil-O-tARN com um aminoácido num sistema de tradução de interesse. 0 aminoácido que a tirosil-O-RS carrega no tirosil-O-tARN pode ser qualquer aminoácido, quer de ocorrência natural, não natural ou artificial, e não é aqui limitado. A sintetase é facultativamente a mesma ou homóloga a uma tirosil aminoácido sintetase que ocorre naturalmente, ou a mesma ou homóloga a uma sintetase designada como uma O-RS na tabela 4. Por exemplo, a O-RS pode ser uma variante conservativa de uma tirosil-O-RS da tabela 4, e/ou pode ser, pelo menos, 50 %, 60 %, 70 %, 80 %, 90 %, 95 %, 98 %, 99 % ou mais idêntica em sequência a uma O-RS da tabela 4.
Cognato: 0 termo "cognato" refere-se a componentes que funcionam em conjunto, por exemplo, um tARN ortogonal e uma aminoacil tARN sintetase ortogonal. Os componentes também podem ser referidos como sendo complementares.
Aminoacila preferencialmente: Tal como é aqui usado em referência a sistemas de tradução ortogonais, uma O-RS "aminoacila preferencialmente" um Ο-tARN cognato quando a O-RS carrega o Ο-tARN com um aminoácido mais eficientemente do que carrega qualquer tARN endógeno num sistema de expressão. Ou seja, quando o Ο-tARN e quaisquer tARN endógenos dados estão presentes num sistema de tradução em 13 ΕΡ1794323Β1 razões molares aproximadamente iguais, a O-RS irá carregar o O-tARN com mais frequência do que irá carregar o tARN endógeno. De preferência, a razão relativa de O-tARN carregado pela O-RS para o tARN endógeno carregado pela 0-RS é elevada, de preferência, resultando na O-RS a carregar o O-tARN exclusivamente, ou quase exclusivamente, quando o O-tARN e o tARN endógeno estão presentes em concentrações molares iguais no sistema de tradução. A razão relativa entre o O-tARN e o tARN endógeno que é carregado pela O-RS, quando o O-tARN e a O-RS estão presentes em concentrações molares iguais, é maior do que 1:1, de preferência pelo menos cerca de 2:1, mais de preferência de 5:1, ainda mais preferivelmente de 10:1, ainda mais preferivelmente de 20:1, ainda mais preferivelmente de 50:1, ainda mais preferivelmente de 75:1, ainda mais preferivelmente de 95:1, 98:1, 99:1, 100:1, 500:1, 1000:1, 5000:1 ou superior. A O-RS "aminoacila preferencialmente um O-tARN com um aminoácido não natural" quando (a) a O-RS aminoacila preferencialmente o O-tARN em comparação com um tARN endógeno, e (b) em que essa aminoacilação é especifica para o aminoácido não natural, em comparação com a aminoacilação do O-tARN pela O-RS com qualquer aminoácido natural. Isto é, quando os aminoácidos não naturais e naturais estão presentes em quantidades molares iguais num sistema de tradução que compreende a O-RS e o O-tARN, a O-RS irá carregar o O-tARN com o aminoácido não natural mais frequentemente do que com o aminoácido natural. De preferência, a razão relativa de O-tARN carregado com o aminoácido não natural para o O-tARN carregado com o aminoácido natural é alta. Mais preferencialmente, a O-RS carrega o O-tARN exclusivamente, ou quase exclusivamente, com o aminoácido não natural. A razão relativa entre o carregamento do O-tARN com o aminoácido não natural e o carregamento do O-tARN com o aminoácido natural, quando ambos os aminoácidos natural e não natural estão presentes 14 ΕΡ1794323Β1 no sistema de tradução em concentrações molares iguais, é maior do que 1:1, de preferência pelo menos cerca de 2:1, mais de preferência de 5:1, ainda mais preferivelmente de 10:1, ainda mais preferivelmente de 20:1, ainda mais preferivelmente de 50:1, ainda mais preferivelmente de 75:1, ainda mais preferivelmente de 95:1, 98:1, 99:1, 100:1, 500:1, 1000:1, 5000:1 ou superior.
Codão seletor: O termo "codão seletor" refere-se a codões reconhecidos pelo O-tARN no processo de tradução, e não reconhecidos por um tARN endógeno. O laço anticodão 0-tARN reconhece o codão seletor no mARN e incorpora o seu aminoácido, por exemplo, um aminoácido não natural, tal como um aminoácido alquinilo, neste local no polipéptido. Os codões seletores podem incluir, por exemplo, codões sem sentido, tais como, codões de terminação, por exemplo, codões âmbar, ocre, e opala; quatro ou mais codões de base; codões raros; codões derivados de pares de bases naturais ou não naturais, e/ou semelhantes. tARN supressor: Um tARN supressor é um tARN que altera a leitura de um ARN mensageiro (mARN) num dado sistema de tradução, por exemplo, proporcionando um mecanismo para incorporar um aminoácido numa cadeia polipeptídica em resposta a um codão seletor. Por exemplo, um tARN supressor pode ler através de, por exemplo, um codão de terminação (por exemplo, um codão âmbar, ocre ou opala), um codão de quatro bases, um codão raro, etc.
Atividade de supressão: Tal como aqui utilizado, o termo "atividade de supressão" refere-se, em geral, à capacidade de um tARN (por exemplo, um tARN supressor) para permitir a leitura através da tradução de um codão (por exemplo, um codão seletor que é um codão âmbar ou um codão de 4 ou mais bases) que, caso contrário, resulta na terminação da tradução ou erro de tradução (por exemplo, deslocamento de quadro). A atividade de supressão de um tARN supressor pode ser expressa como uma percentagem de 15 ΕΡ1794323Β1 atividade de leitura através da tradução observada, em comparação com um segundo tARN supressor, ou em comparação a um sistema de controlo, por exemplo, um sistema de controlo sem uma O-RS. A presente invenção proporciona vários meios através dos quais a atividade de supressão pode ser quantificada. A percentagem de supressão de um determinado Ο-tARN e O-RS contra um codão seletor (por exemplo, um codão âmbar) de interesse, refere-se à percentagem de atividade de um dado marcador de teste expresso (por exemplo, LacZ), que inclui um codão seletor, num ácido nucleico que codifica para o marcador de teste expresso, num sistema de tradução de interesse, em que o sistema de tradução de interesse inclui uma O-RS e um Ο-tARN, em comparação com uma construção de controlo positivo, em que o controlo positivo não possui o Ο-tARN, a O-RS e o codão seletor. Assim, por exemplo, se uma construção de marcador de controlo positivo ativa, que não possui um codão seletor, tem uma atividade observada de X num dado sistema de tradução, em unidades relevantes para o ensaio do marcador em questão, então a percentagem de supressão de uma construção de teste que compreende o codão seletor é a percentagem de X que a construção do marcador de teste exibe praticamente sob as mesmas condições ambientais como o marcador de controlo positivo foi expresso, exceto que a construção de marcador de teste é expressa num sistema de tradução que também inclui o O-tARN e a O-RS. Tipicamente, o sistema de tradução que expressa o marcador de teste inclui também um aminoácido que é reconhecido pela O-RS e pelo Ο-tARN. Opcionalmente, a medição da percentagem de supressão pode ser refinada por comparação do marcador de teste com uma construção de marcador de controlo de "fundo" ou "negativa", que inclui o mesmo codão seletor como o marcador de teste, mas num sistema que não inclui o Ο-tARN, a O-RS e/ou um aminoácido relevante reconhecido pelo Ο-tARN e/ou pela O-RS. Este 16 ΕΡ1794323Β1 controlo negativo é útil para normalizar as medições de percentagem de supressão, para contabilizar os efeitos de sinal de fundo do marcador no sistema de tradução de interesse. A eficácia de supressão pode ser determinada por qualquer um de uma série de ensaios conhecidos na tecnologia. Por exemplo, pode ser utilizado um ensaio de repórter β-galactosidase, por exemplo, um plasmideo derivado de lacZ (em que a construção tem um codão seletor na sequência de ácido nucleico de lacZ) é introduzido nas células de um organismo apropriado (por exemplo, um organismo em que os componentes ortogonais podem ser utilizados), juntamente com o plasmideo que compreende um O-tARN da invenção. Também pode ser introduzida uma sintetase cognata (quer como um polipéptido ou um polinucleótido que codifica a sintetase cognata quando expresso). As células são cultivadas em meio até uma densidade desejada, por exemplo, para uma OD60o de cerca de 0,5, e são realizados ensaios de β-galactosidase, por exemplo, utilizando o BetaFluor™ β-galactosidase Assay Kit (Novagen). A percentagem de supressão pode ser calculada como a percentagem de atividade de uma amostra em relação a um controlo comparável, por exemplo, o valor observado da contrução derivada de lacZ, em que a construção tem um codão de sentido correspondente na posição desejada, em vez de um codão seletor.
Sistema de tradução: O termo "sistema de tradução" refere-se aos componentes que incorporam um aminoácido numa cadeia polipeptídica em crescimento (proteínas). Os componentes de um sistema de tradução podem incluir, por exemplo, ribossomas, tARN, sintetase, mARN e semelhantes. O O-tARN e/ou a O-RS da invenção podem ser adicionados ou fazer parte de um sistema de tradução in vitro ou in vivo, por exemplo, numa célula eucariótica, por exemplo, uma bactéria (tal como E. coli) , ou numa célula eucariótica, 17 ΕΡ1794323Β1 por exemplo, uma célula de levedura, uma célula de mamífero, uma célula de planta, uma célula de alga, uma célula de fungo, uma célula de inseto, e/ou semelhantes.
Aminoácido não natural: Tal como aqui utilizado, o termo "aminoácido não natural" refere-se a qualquer aminoácido, aminoácido modificado, e/ou análogo de aminoácido, tal como um aminoácido alquinilo, que não é um dos 20 aminoácidos comuns que ocorrem naturalmente ou seleno cisteína ou pirrolisina.
Derivado de: Tal como aqui utilizado, o termo "derivado de" refere-se a um componente que é isolado a partir de, ou feito utilizando uma molécula especificada ou organismo, ou a informação a partir da molécula especificada ou organismo. Por exemplo, um polipéptido que é derivado a partir de um segundo polipéptido, compreende uma sequência de aminoácidos que é idêntica ou substancialmente semelhante à sequência de aminoácidos do segundo polipéptido. No caso de polipéptidos, as espécies derivadas podem ser obtidas, por exemplo, por mutagénese que ocorre naturalmente, mutagénese dirigida artificial ou mutagénese aleatória artificial. A mutagénese usada para derivar polipéptidos pode ser intencionalmente dirigida ou intencionalmente aleatória. A mutagénese de um polipéptido para criar um polipéptido diferente, derivado do primeiro, pode ser um acontecimento aleatório (por exemplo, causada pela infidelidade da polimerase), e a identificação do polipéptido derivado pode ser fortuita. A mutagénese de um polipéptido implica tipicamente a manipulação do polinucleótido que codifica para o polipéptido.
Seleção positiva ou marcador de rastreio: Tal como aqui utilizado, o termo "seleção positiva ou marcador de rastreio" refere-se a um marcador que quando presente, por exemplo, expresso, ativado ou semelhante, resulta na identificação de uma célula que compreende o traço, por exemplo, células com o marcador de seleção positiva, 18 ΕΡ1794323Β1 daquelas sem o traço.
Seleção negativa ou marcador de rastreio: Tal como aqui utilizado, o termo "seleção negativa ou marcador de rastreio" refere-se a um marcador que quando presente, por exemplo, expresso, ativado ou semelhante, permite a identificação de uma célula que não compreende uma propriedade ou traço selecionado (por exemplo, em comparação com uma célula que possui a propriedade ou o traço).
Repórter: Tal como aqui utilizado, o termo "repórter" refere-se a um componente que pode ser utilizado para identificar e/ou selecionar os componentes alvo de um sistema de interesse. Por exemplo, um repórter pode incluir uma proteína, por exemplo, uma enzima, que confere resistência ou sensibilidade a antibióticos (por exemplo, β-lactamase, cloranfenicol acetiltransferase (CAT), e similares), um marcador de rastreio fluorescente (por exemplo, a proteína fluorescente verde (por exemplo, (GFP)), YFP, EGFP, RFP, etc.), um marcador luminescente (por exemplo, uma proteína luciferase de pirilampo), um marcador de rastreio baseado na afinidade, ou genes marcadores selecionáveis positivamente ou negativamente, tal como lacZ, β-gal/lacZ (β-galactosidase), ADH (álcool desidrogenase), his3, ura3, leu2, lys2, ou semelhantes.
Eucariota: Tal como aqui utilizado, o termo "eucariota" refere-se a organismos pertencentes ao reino Eucarya. Os eucariotas são geralmente distinguíveis dos procariotas pela sua organização multicelular específica (mas não exclusivamente multicelular, por exemplo, a levedura), ou a presença de um núcleo ligado à membrana e de outros organelos ligados à membrana, o material genético linear (isto é, cromossomas lineares), a ausência de operões, a presença de intrões, o isolamento de mensagem e o mARN poli-A, e outras características bioquímicas, tais como uma estrutura ribossomal distintiva. Os organismos 19 ΕΡ1794323Β1 eucarióticos incluem, por exemplo, os animais (por exemplo, mamíferos, insetos, répteis, aves, etc.)/ os ciliados, as plantas (por exemplo, monocotiledóneas, dicotiledóneas, algas, etc.), os fungos, as leveduras, os flagelados, a microsporidia, os protistas, etc.
Procariota: Tal como aqui utilizado, o termo "procariota" refere-se a organismos pertencentes ao reino Monera (também denominado Procarya). Os organismos procarióticos são geralmente distinguíveis dos eucariotas pela sua organização unicelular, a reprodução assexuada por germinação ou cisão, a ausência de um núcleo ligado à membrana ou de outros organelos ligados à membrana, um cromossoma circular, a presença de operões, a ausência de intrões, o isolamento de mensagem e o mARN poli-A, e outras características bioquímicas, tais como uma estrutura ribossomal distintiva. 0 reino Prokarya inclui os sub-reinos Eubacteria e Archaea (às vezes chamado de "Archaebacteria"). As cianobactérias (as algas azul verde) e o micoplasma são por vezes dados classificações separadas sob o reino Monera.
Bactérias: Tal como aqui utilizados, os termos "bactérias" e "eubactérias" referem-se a organismos procariotas que são distinguíveis de Archaea. Da mesma forma, Archaea refere-se a procariotas que são distinguíveis das eubactérias. As Eubacteria e Archaea podem ser distinguidas por um número de critérios morfológicos e bioquímicos. Por exemplo, as diferenças nas sequências de ARN ribossomal, a estrutura da polimerase de ARN, a presença ou a ausência de intrões, a sensibilidade aos antibióticos, a presença ou a ausência de peptidoglicanos da parede celular e de outros componentes da parede celular, as estruturas ramificadas versus as não ramificadas de lípidos da membrana, e a presença / ausência de histonas e proteínas semelhantes a histona, são utilizadas para atribuir um organismo a Eubacteria ou 20 ΕΡ1794323Β1
Archaea.
Os exemplos de Eubacteria incluem a Escherichia coli, Thermus thermophilus e Bacillus stearothermophilus. Os exemplos de Archaea incluem o Methanococcus jannaschii (Mj), Methanosarcina mazei (Mm), Methanobacterium thermoautotrophicum (Mt), Methanococcus maripaludis, Methanopyrus kandleri, Halobacterium tal como Haloferax volcanii e espécies NRC-1 de Halobacteriuin, Archaeoglobus fulgidus (Af), Pyrococcus furiosus (Pf), Pyrococcus horikoshii (Ph), Pyrobaculum aerophilum, Pyrococcus abyssi, Sulfolobus solfataricus (Ss), Sulfolobus tokodaii, Aeuropyrum pernix (Ap), Thermoplasma acidophilum e Thermoplasma volcanium.
Variante conservadora: Tal como aqui utilizado, o termo "variante conservadora", no contexto de um componente de tradução, refere-se a um componente de tradução, por exemplo, uma variante conservadora de O-tARN ou uma variante conservadora de O-RS, que atua funcionalmente semelhante a um componente de base de que a variante conservadora é semelhante, por exemplo, um O-tARN ou uma 0-RS, possuindo variações na sequência em comparação com uma referência de O-tARN ou de O-RS. Por exemplo, uma O-RS irá aminoacilar um O-tARN complementar ou uma variante conservadora de O-tARN com um aminoácido não natural, por exemplo, um aminoácido alquinilo tal como a para-propargiloxifenilalanina, embora o O-tARN e a variante conservadora de O-tARN não tenham a mesma sequência. A variante conservadora pode ter, por exemplo, uma variação, duas variações, três variações, quatro variações, ou cinco ou mais variações na sequência, desde que a variante conservadora seja complementar do O-tARN ou da O-RS correspondente.
Agente de seleção ou de rastreio: Tal como aqui utilizado, o termo "agente de seleção ou de rastreio" refere-se a um agente que, quando presente, permite a 21 ΕΡ1794323Β1 seleção / rastreio de determinados componentes de uma população. Por exemplo, um agente de seleção ou de rastreio pode ser, mas não está limitado a, por exemplo, um nutriente, um antibiótico, um comprimento de onda de luz, um anticorpo, um polinucleótido expresso, ou semelhantes. 0 agente de seleção pode ser alterado, por exemplo, por concentração, intensidade, etc.
Em resposta a: Tal como aqui utilizado, o termo "em resposta a" refere-se ao processo no qual um O-tARN da invenção reconhece um codão seletor e medeia a incorporação do aminoácido alquinilo, o qual está acoplado ao tARN, para a cadeia polipeptidica em crescimento.
Codificar: Tal como aqui utilizado, o termo "codificar" refere-se a qualquer processo através do qual a informação de uma macromolécula polimérica ou sequência de cadeia é utilizada para dirigir a produção de uma segunda molécula ou sequência de cadeia, que é diferente da primeira molécula ou sequência de cadeia. Tal como aqui utilizado, o termo é utilizado amplamente, e pode ter uma variedade de aplicações. Num aspeto, o termo "codificar" descreve o processo de replicação de ADN semiconservadora, em que uma cadeia de uma molécula de ADN de cadeia dupla é usada como um modelo para codificar uma cadeia irmã complementar recém-sintetizada por uma ADN polimerase dependente de ADN.
Em outro aspeto, o termo "codificar" refere-se a qualquer processo através do qual a informação numa única molécula é utilizada para dirigir a produção de uma segunda molécula, que tem uma natureza química diferente da primeira molécula. Por exemplo, uma molécula de ADN pode codificar um molécula de ARN (por exemplo, pelo processo de transcrição que incorpora uma enzima ARN polimerase dependente de ADN) . Para além disso, uma molécula de ARN pode codificar um polipéptido, tal como no processo de tradução. Quando utilizado para descrever o processo de 22 ΕΡ1794323Β1 tradução, o termo "codifica" também se estende para o codão tripleto que codifica para um aminoácido. Em alguns aspetos, uma molécula de ARN pode codificar para uma molécula de ADN, por exemplo, pelo processo de transcrição reversa, que incorpora uma ADN polimerase dependente de ARN. Em outro aspeto, uma molécula de ADN pode codificar para um polipéptido, onde se entende que "codifica" tal como utilizado neste caso, inclui ambos os processos de transcrição e de tradução.
Alcino: Tal como aqui utilizado, o termo "alcino" (também por vezes referido como "acetileno") refere-se a estruturas químicas que contêm uma ligação tripla entre dois átomos de carbono (tal como mostrado na figura 1B) , com a estrutura geral:
=- R em que R é qualquer átomo ou estrutura. Quando usado como um substituinte, a porção alcino é denominado um grupo "alquinilo". Os átomos de carbono alquinilo são hibridados sp2 e apenas formam ligações a dois outros átomos; uma destas ligações irá ser uma ligação simples, enquanto a segunda ligação é uma ligação tripla. Por exemplo, um aminoácido alquinilo é um aminoácido que contém uma ligação tripla entre dois centros de carbono. Porque os substituintes alquinilo não aparecem em aminoácidos na natureza, qualquer aminoácido alquinilo é um aminoácido não natural.
Azido: Tal como aqui utilizado, o termo "azido" refere-se ao grupo químico -N3, que possui a estrutura geral:
R—N=N+=N 0 grupo azido está ligado tipicamente a um átomo de 23 ΕΡ1794323Β1 carbono .
Por exemplo, um corante azido é uma molécula de corante com um grupo azido substituinte (veja-se, por exemplo, os corantes azido 2 e 3, nas figuras 6A e 6B) . 0 termo "azido" refere-se a um composto químico que contém o grupo azido (por exemplo, benzilo azido, azida de sódio, etc.) .
Breve descrição das figuras A figura IA proporciona a estrutura química (1) do aminoácido alquinilo para-propargiloxifenilalanina não natural (também conhecido como ácido 2-amino-3-[4-(prop-2-iniloxi) fenil]-propiónico de acordo com a nomenclatura IUPAC). A figura 1B proporciona a reação química generalizada da formação irreversível de triazóis por reação de cicloadição [3+2] de uma azida e um alcino na presença de cobre à temperatura ambiente. A figura 2 proporciona as sequências de nucleótidos e de aminoácidos da sintetase de tirosil-tARN do tipo selvagem de Methanococcus jannaschii (MjTyrRS). Estão dentro de caixas as posições de aminoácidos (e os codões tripleto correspondentes) direcionadas na mutagénese dirigida ou mutadas de outra forma na sintetase de tARN para-propargiloxifenilalanina (pPRO-Phe) . A figura 3 proporciona uma tabela que descreve as oito (8) espécies de sintetase de tARN para-propargiloxifenilalanina (pPRO-Phe) identificadas e isoladas após a mutagénese de um polinucleótido que codifica para a sintetase tirosil-tARN do tipo selvagem de Methanococcus jannaschii. Estão indicados os aminoácidos codificados pelos codões indicados na sintetase tirosil-tARN do tipo selvagem de
Methanococcus jannaschii e nas sintetases de para- 24 ΕΡ1794323Β1 propargiloxifenilalanina (pPRO-Phe). Está também indicado o codão nas posições mutantes. A numeração da posição de aminoácidos dos mutantes está de acordo com a numeração de aminoácidos da sintetase tirosil-tARN do tipo selvagem de Methanococcus jannasch.il, tal como mostrado na figura 2. A figura 4 proporciona um gel SDS-PAGE marcado com Gelcode® Blue (Pierce Biotechnology, Inc.) da mioglobina mutante Ser4 -> pPR0-Phe4 purificada. 0 poço 1 contém a proteína expressa em E. coll cultivada num meio mínimo na presença de para-propargiloxifenilalanina (pPRO-Phe); 0 poço 2 contém uma amostra de proteína gerada na ausência de pPRO-Phe. 0 painel inferior mostra um western blot dos mesmos materiais de amostra usando um anticorpo anti-His6 para detetar o marcador de hexa-histidina no terminal C da mioglobina. A figura 5 proporciona um espectro de massa em tandem do péptido tríptico HGVTVLTALGY*ILK gue contém o aminoácido alquinilo não natural (denominado Y*), mostrado com as suas massas de fragmento de ião esperadas. As setas indicam as séries de iões b e y observadas para o péptido.
As figuras 6A e 6B proporcionam as estruturas químicas (2 e 3, respetivamente) dos marcadores azido funcionalizados. 0 marcador 2 na figura 6A contém um fluoróforo dansilo, e o marcador 3 na figura 6B contém um fluoróforo fluoresceína. A figura 7A proporciona a reação química generalizada da formação irreversível de um triazol da reação de cicloadição [3+2] entre a mioglobina mutante que contém um aminoácido alquinilo no local do codão âmbar concebido (4TAG) e um marcador azido funcionalizado (tal como proporcionado nas figuras 6A e 6B). A figura 7B proporciona uma imagem de fluorescência de gel sob 25 ΕΡ1794323Β1 irradiação UV da mioglobina marcada resolvida, em que a reação de cicloadição [3+2] ligou covalentemente quer o marcador 2 ou o marcador 3.
As figuras 8A e 8B proporcionam as estruturas e os nomes dos exemplos dos aminoácidos alquinilo não naturais. A figura 8A proporciona aminoácidos alquinilo não naturais que podem ser sintetizados quimicamente a partir de precursores não naturais. A figura 8B proporciona aminoácidos alquinilo não naturais que podem ser potencialmente sintetizados a partir de substratos de aminoácidos pré-existentes que ocorrem naturalmente.
Descrição detalhada da invenção
Existe uma necessidade considerável de reações químicas que modifiquem proteínas em condições fisiológicas de forma altamente seletiva (Lemineux e Bertozzi (1996) TIBTECH, 16: 506). A maioria das reações atualmente utilizadas na tecnologia para a modificação seletiva de proteínas envolve a formação de uma ligação covalente entre os parceiros de reação nucleofílicos e electrofílicos, que que têm como alvo resíduos nucleofílicos que ocorrem naturalmente nas cadeias laterais de aminoácidos da proteína, por exemplo, a reação de cetonas α-halo com cadeias laterais de histidina ou de cisteína. A seletividade nestes casos é determinada pelo número e acessibilidade dos resíduos nucleofÍlicos da proteína. Infelizmente, as proteínas que ocorrem naturalmente contêm frequentemente locais de reação fracamente posicionados (ou seja, inacessíveis), ou múltiplos alvos de reação (por exemplo, resíduos de lisina, histidina e de cisteína), resultando em baixa seletividade nas reações de modificação, tornando difícil a modificação de proteínas altamente direcionadas por reagentes nucleofílicos / 26 ΕΡ1794323Β1 electrofílicos. Para além disso, os locais de modificação são normalmente limitados às cadeias laterais nucleofilicas que ocorrem naturalmente, de lisina, histidina ou de cisteina. A modificação em outros locais é difícil ou impossível.
Uma solução para este problema é a incorporação biossintética específica do local programada de aminoácidos não naturais com reatividades novas em proteínas, utilizando os componentes de tradução ortogonais (Wang e Schultz (2002) Chem. Commun., 1: 1, e van Maarseveen e Back (2003) Angew. Chem., 115: 6106). Descrevemos aqui um novo método altamente eficiente para a modificação seletiva de proteínas, que envolve a incorporação genética de aminoácidos não naturais contendo alquinilo em proteínas produzidas em bactérias (por exemplo, E. coli) , em resposta ao codão sem sentido âmbar, TAG. Estas cadeias laterais de aminoácidos alquinilo podem então ser modificadas especificamente e regiosselectivamente. Devido à reação química única do grupo alquinilo, as proteínas podem ser modificadas com seletividade extremamente elevada.
Para introduzir seletivamente o grupo funcional alquinilo em locais exclusivos (por exemplo, num local desejado) em proteínas produzidas num sistema de expressão bacteriano, nós temos pares evoluídos de tARN ortogonal / aminoacil-tARN sintetase, que funcionam em eubactérias que codificam geneticamente o aminoácido alquinilo, para-propargiloxifenilalanina (pPRO-Phe; veja-se a figura IA) . Resumidamente, nós identificámos novos mutantes da tirosil tARN sintetase de Methanococcus janaschii que carrega seletivamente um tARN supressor âmbar com para-propargiloxifenilalanina (pPRO-Phe) em células de Escherichia coli. Estes pares evoluídos de tARN sintetase podem ser utilizados para incorporar de forma específica do local um grupo alquinilo numa proteína. 27 ΕΡ1794323Β1
MODIFICAÇÃO DIRECIONADA DE PROTEÍNAS
Descrevemos aqui um método altamente eficiente para a modificação seletiva de proteínas, que envolve a incorporação genética de aminoácidos não naturais contendo alquinilo em proteínas produzidas em eubactérias (por exemplo, E. coli), em resposta ao codão sem sentido âmbar, TAG. As novas composições e métodos aqui descritos empregam um sistema de tARN ortogonal / aminoacil-tARN sintetase, em que o sistema ortogonal utiliza componentes derivados de Methanococcus janaschii, e em que estes componentes são utilizados num sistema hospedeiro de eubactérias para produzir a proteína de interesse. A incorporação do aminoácido alquinilo na proteína pode ser programada para ocorrer em qualquer posição desejada, por desenho do polinucleótido que codifica para a proteína de interesse para conter um codão seletor que sinaliza a incorporação do aminoácido alquinilo.
Estas cadeias laterais de aminoácidos alquinilo na proteína de interesse podem então ser modificadas especificamente e regiosselectivamente, por uma reação de cicloadição Huisgen [3+2] com derivados azido (veja-se, figura lb) (Padwa, em Comprehensive Organic Synthesis; [Trost, B. M., ed.] Pergamon: Oxford, 1991, vol. 4, p. 1069-1109; Huisgen, em 1,3-Dipolar Cycloaddition Chemistry, [Padwa, A., ed.] Wiley: Nova Iorque, 1984; p. 1-176). Uma vez que este método envolve uma cicloadição, em vez de uma substituição nucleofílica, as proteínas podem ser modificadas com seletividade extremamente elevada. Esta reação tem os benefícios de que pode ser levada a cabo à temperatura ambiente, sob condições aquosas, com excelente regiosselectividade (1,4 > 1,5), pela adição de quantidades catalíticas de sais de Cu(I) à mistura de reação (Tornoe et al. , (2002) J. Org. Chem., 67: 3057-3064; Rostovtsev et al. , (2002) Angew. Chem., Int. Ed., 41: 2596-2599) .
Um alvo reativo alquinilo tem as vantagens de ser 28 ΕΡ1794323Β1 completamente estranho para os sistemas in vivo, é altamente seletivo nas suas reações químicas (por exemplo, altamente reativo com porções contendo azido), e pode ser conjugado usando condições de reação relativamente suaves que permitem reações de conjugação tanto in vitro como in vivo envolvendo proteínas, e que preservam a atividade biológica da proteína. Para demonstrar (mas não limitar) a presente invenção, a porção alquinilo é incorporada num modelo de proteína mioglobina, e em seguida a proteína é bioconjugada com corantes fluorescentes azido (veja-se, figura 6A e 6B) por uma reação de cicloadição [3 + 2], por formação de uma ligação triazol estável (veja-se, figura lb) .
Embora os exemplos usem dois corantes fluorescentes azido para ilustrar a cicloadição [3+2] entre as porções do aminoácido alquinilo e azido (veja-se, exemplo 4) , não se pretende que a invenção seja limitada à utilização destes dois corantes azido, ou qualquer corante ou marcador, ou mesmo qualquer tipo de material único conjugável. Uma porção que contém azido da invenção pode ser virtualmente qualquer molécula que é um derivado de azido. Essas moléculas incluem, mas não estão limitadas a, corantes, fluoróforos, agentes de reticulação, derivados sacarídeos, polímeros (por exemplo, derivados de polietileno glicol), agentes de fotorreticulação, compostos citotóxicos, marcadores de afinidade, derivados de biotina, resinas, grânulos, uma segunda proteína ou polipéptido (ou mais), polinucleótido(s) (por exemplo, ADN, ARN, etc.), quelantes de metais, cofatores, ácidos gordos, hidratos de carbono, e semelhantes. Estas moléculas de azido podem ser conjugadas a um aminoácido não natural com um grupo alquinilo, por exemplo, para-propargiloxifenilalanina (veja-se, figura IA) . É fornecida aqui uma descrição detalhada para a sintese dos corantes azido mostrados nas figuras 6A e 6B. 29 ΕΡ1794323Β1
Vejam-se, exemplos 6 e 7, respetivamente. No entanto, está bem dentro dos meios de um perito na tecnologia sintetizar um derivado de azido de qualquer molécula específica de interesse. Por exemplo, estão disponíveis muitos textos e protocolos que descrevem como sintetizar compostos de azido. Para uma referência geral, veja-se: Patai, Saul, "The chemistry of the azido group" em The Chemistry of Functional Groups, Londres, Nova Iorque, Interscience Publishers, 1971.
Em outro aspeto, a invenção proporciona composições e métodos para a geração de polipéptidos PEGilados usando derivados de azido de polietileno glicol (azido-PEG), para utilização em reações de conjugação com polipéptidos que contêm alquinilo. A estrutura generalizada de um polietileno glicol de azido é:
N3-CH2- (CH2-0-CH2) n-CH2OR em que R é H ou CH3, e onde n é um número inteiro entre, por exemplo, 50 e 10.000, 75 e 5000, 100 e 2000, 100 e 1000, etc. Em várias realizações da invenção, o polietileno glicol de azido tem um peso molecular de, por exemplo, cerca de 5000 até cerca de 100.000 Da (por exemplo, cerca de 5 kDa até cerca de 100 kDa) , cerca de 20.000 até cerca de 50,000 Da, cerca de 20.000 até cerca de 10.000 Da (por exemplo, 20.000 Da), etc. As técnicas para a síntese de um polietileno glicol de azido são bem conhecidas de um perito na tecnologia. Por exemplo, uma molécula de polietileno glicol que contém um grupo electrofílico (por exemplo, um brometo ou um éster de N-hidroxissuccinimida) pode ser feita reagir com uma molécula nucleofilica que contém um grupo azido (por exemplo, azida de sódio ou 3-azidopropilamina), para gerar um polietileno glicol de azido. O azido-PEG encontra utilização com a invenção quando 30 ΕΡ1794323Β1 bioconjugado a uma proteína que contém alquinilo através de uma ligação de triazol. A derivação de terapias à base de proteínas com polietileno glicol (PEGilação), muitas vezes pode melhorar as propriedades farmacocinéticas e farmacodinâmicas das proteínas e, assim, melhorar a eficácia e minimizar a frequência de administração. As várias vantagens da PEGilação de proteínas terapêuticas são discutidas e ilustradas em, por exemplo, Deiters et al., "Site-specific PEGylation of proteins containing unnatural amino acids", Bioorganic & Medicinal Chemistry Letters 14: 5743-5745 (2004).
Para além disso, são contempladas outras vantagens associadas com a produção de polipéptidos que compreendem os aminoácidos não naturais alquinilo, que contenham igualmente uma ligação éster. Por exemplo, um polipéptido PEGuilado criado por meio de um aminoácido alquinilo com uma ligação éster, pode permitir a libertação lenta do polipéptido por saponificação das ligações éster in vivo ou in vitro. Para além disso, utilizar um suporte polimérico (uma resina de azido) em lugar de uma molécula de azido-PEG permite uma purificação por afinidade da proteína. A ligação covalente de triazol permite etapas de lavagem muito fortes, e a utilização do éster de aminoácidos de alquinilo permite a libertação da proteína por tratamento com uma base. Significativamente, dito esquema de purificação por afinidade não requer a presença de um marcador artificial (por exemplo, hexahistidina) ou epítopo na proteína de interesse para a purificação. Dependendo do aminoácido não natural usado, pode ser libertado um polipéptido essencialmente do tipo selvagem (nativo) a partir da resina de afinidade, após a etapa de clivagem.
Podem ser sintetizados e incorporados em proteínas aminoácidos não naturais alquinilo com ligações éster, por exemplo, o ácido 3-[(prop-2-iniloxi) carbonil]-2-aminopropanóico e o ácido 4-[ (prop-2-iniloxi) carbonil]-2- 31 ΕΡ1794323Β1 aminobutanóico (veja-se, figura 8B) . Depois da bioconjugação através da cicloadição [3+2], as ligações éster podem ser clivadas por saponificação in vivo ou in vitro; uma aplicação seria, por exemplo, a libertação lenta da parte do péptido de uma proteína PEGuilada.
Os polipéptidos podem incluir polipéptidos que contêm alquinilo, e, para além disso, incluir as formas conjugadas desses polipéptidos. Por exemplo, um polipéptido que compreende uma ligação de triazol e um corante fluorescente de azido covalentemente acoplado (por exemplo, veja-se figuras 6A, 6B e 7A) , em que o polipéptido compreendia anteriormente um grupo alquinilo e o corante compreendia anteriormente um grupo azido, e os dois foram conjugados através de uma cicloadição [3+2] para formar a ligação triazol. Alternativamente, uma proteína que contém alquinilo pode compreender um polietileno glicol de azido (veja-se estrutura química 6).
TECNOLOGIA DE tARN ORTOGONAL / AMINOACIL-tARN SINTETASE
Uma compreensão das novas composições e métodos da presente invenção é facilitada por uma compreensão das atividades associadas com pares de tARN ortogonal e aminoacil-tARN sintetase ortogonal. Discussões de tecnologias de tARN ortogonal e aminoacil-tARN sintetase podem ser encontradas, por exemplo, nas publicações internacionais WO 2002/085923, WO 2002/086075, WO 204/09459, WO 2005/019415, WO 2005/007870 e WO 2005/007624. A fim de adicionar aminoácidos não naturais reativos suplementares, tais como os aminoácidos alquinilo, ao código genético, são necessários os novos pares ortogonais que compreendem uma aminoacil-tARN sintetase e um tARN adequado, que possam funcionar eficazmente na maquinaria de tradução do hospedeiro, mas que são "ortogonais" para o sistema de tradução em questão, o que significa que funcionam independentemente das sintetases e do tARN endógenos para o sistema de tradução. As características 32 ΕΡ1794323Β1 desejadas do par ortólogo incluem o tARN que descodifica ou reconhece apenas um codão especifico, por exemplo, um codão seletor, que não é descodificado por qualquer tARN endógeno, e aminoacil-tARN sintetases que aminoacilam preferencialmente (ou "carregam") o seu tARN cognato com apenas um aminoácido não natural especifico. 0 O-tARN também não é tipicamente aminoacilado por sintetases endógenas. Por exemplo, em E. coli, um par ortogonal irá incluir uma aminoacil-tARN sintetase que não reage de forma cruzada com nenhum dos tARN endógenos, por exemplo, que existem 40 em E. coli, e um tARN ortogonal que não é aminoacilado por qualquer uma das sintetases endógenas, por exemplo, das quais existem 21 em E. coli. São aqui descritos pares ortogonais para a codificação genética e a incorporação de aminoácidos alquinilo em proteínas numa eubactéria, por exemplo, E. coli, em que os componentes ortogonais não reagem de forma cruzada com os componentes endógenos de E. coli da maquinaria de tradução da célula hospedeira, mas que reconhecem o aminoácido não natural desejado e incorporam-no em proteínas, em resposta ao codão sem sentido âmbar, TAG. Os componentes ortogonais incluem aminoacil-tARN sintetases ortogonais derivadas de tirosil tARN sintetase de Methanococcus jannaschii, e o supressor âmbar mutante tirosil tARNCuA- Neste sistema, as aminoacil-tARN sintetases mutantes aminoacilam os tARN supressores com pPRO-Phe, e não com qualquer um dos vinte aminoácidos comuns. São aqui descritos métodos para identificar e produzir pares adicionais de tARN ortogonal - aminoacil-tARN sintetase, por exemplo, pares O-tARN / O-RS que podem ser utilizados para incorporar um aminoácido alquinilo numa proteína. Um O-tARN da invenção é capaz de mediar a incorporação de um aminoácido alquinilo numa proteína que é codificada por um polinucleótido, que compreende um codão seletor que é reconhecido pelo O-tARN, por exemplo, in 33 ΕΡ1794323Β1 vivo. 0 laço do anticodão do O-tARN reconhece o codão seletor num mARN, e incorpora o seu aminoácido, por exemplo, um aminoácido alquinilo, neste local no polipéptido. Uma aminoacil-tARN sintetase ortogonal da invenção aminoacila (ou carrega) preferencialmente o seu 0-tARN com apenas um aminoácido alquinilo especifico.
Por exemplo, tal como aqui demonstrado, o aminoácido alquinilo para-propargiloxifenilalanina (pPRO-Phe; veja-se figura IA, estrutura 1) , que pode ser direcionado para modificação de uma maneira altamente seletiva, foi incorporado seletivamente e eficientemente numa proteína numa célula eubacteriana (Escherichia coli, E. coli), em resposta a um codão seletor, por exemplo, o codão TAG. Uma vez incorporado numa proteína, o pPRO-Phe pode ser quimicamente direcionado no interior da célula, por exemplo, pode ser direcionado para modificação com um corante que transporta um grupo azido. 0 grupo azido numa molécula de corante pode reagir com o aminoácido alquinilo, e direcionar a proteína para a marcação com corante de uma maneira altamente seletiva. A capacidade para incorporar um aminoácido alquinilo de uma forma específica do local em proteínas pode facilitar o estudo das proteínas, bem como permitir a engenharia de proteínas com propriedades novas. Por exemplo, a expressão de proteínas que contêm alquinilo pode facilitar o estudo de proteínas por meio de marcação específica, alterar a função catalítica de enzimas, reticular proteínas com outras proteínas, moléculas pequenas e biomoléculas, etc.
tARN ORTOGONAL / AMINOACIL-tARN SINTETASES ORTOGONAIS E PARES DOS MESMOS
Os sistemas de tradução que são adequados para a produção de proteínas que incluem um ou mais aminoácidos não naturais são descritos em, por exemplo, publicações internacionais números WO 2002/086075, intitulada "Methods 34 ΕΡ1794323Β1 and composition for the production of orthogonal tRNA-aminoacyl-tRNA synthetase pairs"; WO 2002/085923, intitulada "In vivo incorporation of unnatural amino acids"; e WO 2004/094593, intitulada "Expanding the eukaryotic genetic code"; WO 2005/019415, depositada a 7 de julho de 2004; WO 2005/007870, depositada a 7 de julho de 2004; WO 2005/007624, depositada a 7 de julho de 2004. Tais sistemas de tradução compreendem geralmente células (gue podem ser células não eucarióticas, tais como a E. coli, ou células eucarióticas, tais como as leveduras) gue incluem um t ARN ortogonal (O-tARN), uma aminoacil-tARN sintetase ortogonal (O-RS), e um aminoácido não natural (por exemplo, na presente invenção, um aminoácido alquinilo), em que a 0-RS aminoacila o O-tARN com o aminoácido alquinilo. Um par ortogonal da invenção inclui um O-tARN, por exemplo, um tARN supressor, um tARN de desenquadramento, ou similares, e uma O-RS. Os componentes individuais são também fornecidos na invenção.
Em geral, quando um par ortogonal reconhece um codão seletor e carrega um aminoácido em resposta ao codão seletor, o par ortogonal é dito "suprimir" o codão seletor. Isto é, um codão seletor que não é reconhecido pelo sistema de maquinaria de tradução endógeno (por exemplo, da célula) não é normalmente traduzido, o que pode resultar no bloqueio da produção de um polipéptido, que de outra forma seria traduzido a partir do ácido nucleico. Um O-tARN da invenção reconhece um codão seletor e inclui, pelo menos, cerca de, por exemplo, uma eficiência de supressão de 45 %, de 50 %, de 60 %, de 75 %, de 80%, ou de 90% ou mais, na presença de uma sintetase cognata em resposta a um codão seletor, em comparação à eficiência de supressão de um 0-tARN que compreende ou é codificado por uma sequência polinucleotidica, tal como apresentada aqui na listagem de sequências. A O-RS aminoacila o O-tARN com um aminoácido não natural de interesse, tal como um aminoácido alquinilo. 35 ΕΡ1794323Β1 A célula usa o par O-tARN / O-RS para incorporar o aminoácido não natural numa cadeia polipeptidica em crescimento, por exemplo, através de um ácido nucleico que compreende um polinucleótido que codifica para um polipéptido de interesse, em que o polinucleótido compreende um codão seletor que é reconhecido pelo O-tARN. Em certos aspetos desejáveis, a célula pode incluir um par O-tARN / O-RS adicional, em que o O-tARN adicional é carregado pela O-RS adicional com um aminoácido não natural diferente. Por exemplo, um dos O-tARN pode reconhecer um codão de quatro bases e o outro pode reconhecer um codão de terminação. Como alternativa, vários codões de terminação diferentes ou vários codões de quatro bases diferentes podem reconhecer especificamente diferentes codões seletores.
Em certas realizações da invenção, uma célula tal como uma célula de E. coli que inclui um tARN ortogonal (0-tARN), uma aminoacil-tARN sintetase ortogonal (O-RS), um aminoácido alquinilo e um ácido nucleico que compreende um polinucleótido que codifica para um polipéptido de interesse, em que o polinucleótido compreende o codão seletor que é reconhecido pelo O-tARN. 0 sistema de tradução também pode ser um sistema isento de células, por exemplo, qualquer um de uma variedade de produtos comercialmente disponíveis de sistemas de transcrição / tradução "in vitro" em combinação com um par O-tARN / O-RS, e um aminoácido não natural, tal como aqui descrito.
Numa realização, a eficácia de supressão da O-RS e do O-tARN em conjunto é de cerca de, por exemplo, 5 vezes, 10 vezes, 15 vezes, 20 vezes, ou 25 vezes ou mais superior à eficácia de supressão do O-tARN sem a O-RS. Num aspeto, a eficácia de supressão da O-RS e do O-tARN em conjunto é de pelo menos cerca de, por exemplo, 35 %, 40 %, 45 %, 50 %, 60 %, 75 %, 80 %, ou 90 % ou mais da eficácia de supressão de um par de sintetase ortogonal, tal como aqui apresentado 36 ΕΡ1794323Β1 na listagem de sequências.
Tal como referido, a invenção inclui opcionalmente vários pares O-tARN / O-RS numa célula ou noutro sistema de tradução, o que permite a incorporação de mais do que um aminoácido não natural, por exemplo, um aminoácido alquinilo e um outro aminoácido não natural. Por exemplo, a célula pode ainda incluir um par O-tARN / O-RS adicional diferente e um segundo aminoácido não natural, em que este O-tARN adicional reconhece um segundo codão seletor, e esta O-RS adicional aminoacila preferencialmente o O-tARN com o segundo aminoácido não natural. Por exemplo, uma célula que inclui um par O-tARN / O-RS (em que o O-tARN reconhece, por exemplo, um codão seletor âmbar), pode ainda compreender um segundo par ortogonal, por exemplo, leucilo, lisilo, glutamilo, etc., (em que o segundo O-tARN reconhece um codão seletor diferente, por exemplo, um codão opala, um codão de quatro bases, ou semelhantes). Desejavelmente, os pares ortogonais diferentes são derivados a partir de fontes diferentes, o que pode facilitar o reconhecimento de codões seletores diferentes. 0 O-tARN e/ou a O-RS podem ser de ocorrência natural ou podem ser, por exemplo, derivados por mutação de um tARN e/ou RS que ocorrem naturalmente, por exemplo, através da geração de bibliotecas de tARN e/ou de bibliotecas de RS, a partir de qualquer um de uma variedade de organismos, e/ou utilizando qualquer uma de uma variedade de estratégias de mutações disponiveis. Por exemplo, uma estratégia para a produção de um par tARN ortogonal / aminoacil-tARN sintetase envolve a importação de um par tARN / sintetase heterólogo (para a célula hospedeira) de, por exemplo, uma fonte que não seja a célula hospedeira, ou de fontes múltiplas, para a célula hospedeira. As propriedades da sintetase heteróloga candidata incluem, por exemplo, que não carregue qualquer tARN da célula hospedeira, e as propriedades do tARN heterólogo candidato incluem, por 37 ΕΡ1794323Β1 exemplo, que não seja aminoacilado por qualquer sintetase da célula hospedeira. Para além disso, o tARN heterólogo é ortogonal a todas as sintetases da célula hospedeira.
Uma segunda estratégia para a geração de um par ortogonal envolve a geração de bibliotecas de mutantes a partir das quais rastrear e/ou selecionar um Ο-tARN ou uma O-RS. Estas estratégias também podem ser combinadas. tARN ortogonal (O-tARN)
Um tARN ortogonal (Ο-tARN) da invenção medeia desejavelmente a incorporação de um aminoácido não natural, tal como um aminoácido alquinilo, numa proteína que é codificada por um polinucleótido que compreende um codão seletor, que é reconhecido pelo Ο-tARN, por exemplo, in vivo ou in vitro. Em certas realizações, um Ο-tARN da invenção inclui, pelo menos, cerca de, por exemplo, uma eficácia de supressão de 45 %, de 50 %, de 60 %, de 75 %, de 80 %, ou de 90 % ou mais, na presença de uma sintetase cognata em resposta a um codão seletor, em comparação a um Ο-tARN que compreende ou é codificado por uma sequência polinucleotídica tal como estabelecida aqui nas sequências de Ο-tARN da listagem de sequências. A eficácia de supressão pode ser determinada por qualquer um de uma série de ensaios conhecidos na tecnologia. Por exemplo, pode ser utilizado um ensaio de repórter β-galactosidase, por exemplo, um plasmídeo derivado de lacZ (em que a construção tem um codão seletor na sequência de ácido nucleico de lacZ) é introduzido nas células de um organismo apropriado (por exemplo, um organismo onde os componentes ortogonais podem ser utilizados), juntamente com o plasmídeo que compreende um Ο-tARN da invenção. Também pode ser introduzida uma sintetase cognata (quer como um polipéptido ou um polinucleótido que codifica para a sintetase cognata quando expresso) . As células são cultivadas em meio até uma densidade desejada, por exemplo, a uma Οϋεοο de cerca de 38 ΕΡ1794323Β1 0,5, e são realizados ensaios de β-galactosidase, por exemplo, utilizando o BetaFluor™ β-galactosidase Assay Kit (Novagen). A percentagem de supressão pode ser calculada como a percentagem de atividade de uma amostra em relação a um controlo comparável, por exemplo, o valor observado da contrução derivada de lacZ, em que a contrução tem um codão sentido correspondente na posição desejada, em vez de um codão seletor.
Os exemplos de O-tARN são aqui apresentados na listagem de sequências. Vejam-se também aqui, as tabelas, os exemplos e as figuras para sequências de moléculas de 0-t ARN e 0-RS exemplares. Veja-se também aqui a secção intitulada "Sequências e variantes de ácidos nucleicos e polipéptidos". Numa molécula de ARN, tal como um mARN de 0-RS, ou uma molécula de 0-tARN, a timina (T) é substituída com uracilo (U) , em relação a uma dada sequência (ou vice versa para um ADN codificante) , ou complemento da mesma. Também podem estar presentes modificações adicionais nas bases.
Também são aqui descritas as variações conservadoras de 0-tARN. Por exemplo, as variações conservadoras de 0-tARN incluem aquelas moléculas que funcionam como os 0-tARN em particular, por exemplo, tal como aqui na listagem de sequências, e que mantêm a estrutura em forma de L do tARN em virtude de uma autocomplementaridade apropriada, mas que não têm uma sequência idêntica àquelas, por exemplo, na listagem de sequências, figuras ou exemplos apresentados aqui (e, desejavelmente, são de outro tipo que não moléculas de tARN do tipo selvagem). Veja-se também aqui, a secção intitulada "Sequências e variantes de ácidos nucleicos e polipéptidos". A composição que compreende um 0-tARN pode ainda incluir uma aminoacil-tARN sintetase ortogonal (0-RS), em que a 0-RS aminoacila preferencialmente o 0-tARN com um aminoácido não natural, tal como um aminoácido alquinilo. 39 ΕΡ1794323Β1
Em certas realizações, uma composição que inclui um O-tARN pode ainda incluir um sistema de tradução (por exemplo, in vitro ou in vivo). Também pode estar presente na célula um ácido nucleico que compreende um polinucleótido que codifica para um polipéptido de interesse, em que o polinucleótido compreende um codão seletor que é reconhecido pelo O-tARN, ou uma combinação de um ou mais destes. Veja-se também aqui, a secção intitulada "Aminoacil-tARN sintetases ortogonais". São também uma caracteristica da invenção os métodos para a produção de um tARN ortogonal (O-tARN). É também uma caracteristica da invenção um O-tARN produzido pelo método. Em certas realizações da invenção, o O-tARN pode ser produzido através da geração de uma biblioteca de mutantes. A biblioteca de tARN mutantes pode ser produzida utilizando várias técnicas de mutagénese conhecidas na tecnologia. Por exemplo, os tARN mutantes podem ser gerados por mutações especificas do local, por mutações pontuais aleatórias, por recombinação homóloga, por troca de ADN ou outros métodos de mutagénese recursivos, construção quimérica ou qualquer combinação dos mesmos.
Podem ser introduzidas mutações adicionais numa(s) posição (posições) especifica(s), por exemplo, numa(s) posição (posições) não conservadora(s), ou numa posição conservadora, numa(s) posição (posições) aleatória(s), ou numa combinação de ambas num laço ou região desejado de um tARN, por exemplo, um laço anticodão, a haste aceitadora, o braço ou laço D, um laço variável, o braço ou laço TPC, de outras regiões da molécula de tARN, ou uma combinação das mesmas. Tipicamente, as mutações num tARN incluem a mutação do laço do anticodão de cada membro da biblioteca de tARN mutantes, para permitir o reconhecimento de um codão seletor. 0 método pode ainda incluir a adição de uma sequência (CCA) adicional a um terminal do O-tARN. Tipicamente, um O-tARN possui uma melhoria da 40 ΕΡ1794323Β1 ortogonalidade para um organismo desejado, em comparação com o material de partida, por exemplo, a pluralidade de sequências de tARN, ao mesmo tempo que preserva a sua afinidade para uma RS desejada.
Os métodos incluem, opcionalmente, analisar a similaridade (e/ou a homologia inferida) das sequências de tARN e/ou de aminoacil-tARN sintetases, para determinar candidatos potenciais para um Ο-tARN, uma O-RS e/ou pares dos mesmos, que parecem ser ortogonais para um organismo especifico. Os programas de computador conhecidos na tecnologia e aqui descritos podem ser utilizados para a análise, por exemplo, podem ser utilizados os programas BLAST e pileup. Num exemplo para escolher componentes de tradução ortogonais potenciais para uso em E. coli, é escolhida uma sintetase e/ou um tARN que não apresenta similaridade de sequência com organismos eubacterianos.
Tipicamente é obtido um Ο-tARN por sujeição, por exemplo, a seleção negativa, uma população de células de uma primeira espécie, em que as células compreendem um membro da pluralidade de Ο-tARN potenciais. A seleção negativa elimina as células que compreendem um membro da biblioteca de Ο-tARN potenciais que é aminoacilado por uma aminoacil-tARN sintetase (RS) que é endógena à célula. Isto proporciona um conjunto de tARN que são ortogonais para a célula da primeira espécie.
Em certas realizações, na seleção negativa é introduzido um codão (codões) seletor(es) num polinucleótido que codifica para um marcador de seleção negativa, por exemplo, uma enzima que confere resistência a antibióticos, por exemplo, a β-lactamase, uma enzima que confere um produto detetável, por exemplo, a β-galactosidase, a cloranfenicol acetiltransferase (CAT), por exemplo, um produto tóxico, tal como a barnase, numa posição não essencial (por exemplo, produzindo ainda uma barnase funcional), etc. 0 rastreio / seleção é 41 ΕΡ1794323Β1 opcionalmente feito pelo crescimento da população de células na presença de um agente seletivo (por exemplo, um antibiótico, tal como a ampicilina). Numa realização, a concentração do agente de seleção é variada.
Por exemplo, para medir a atividade dos tARN supressores, é usado um sistema de seleção que é baseado na supressão in vivo do codão seletor, por exemplo, mutações sem sentido ou de desenquadramento introduzidas num polinucleótido que codifica para um marcador de seleção negativa, por exemplo, um gene para a β-lactamase (bla) . Por exemplo, são construídas variantes de polinucleótidos, por exemplo, variantes de bla, com um codão seletor numa determinada posição (por exemplo, A184). As células, por exemplo, bactérias, são transformadas com estes polinucleótidos. No caso de um tARN ortogonal, que não pode ser carregado eficientemente pelas sintetases endógenas de E. coli, a resistência a antibióticos, por exemplo, a resistência a ampicilina, deve ser de cerca de ou menos do que a das bactérias transformadas sem qualquer plasmídeo. Se o tARN não é ortogonal, ou caso uma sintetase heteróloga capaz de carregar o tARN seja coexpressa no sistema, é observado um maior nível de resistência a antibiótico, por exemplo, a ampicilina. São escolhidas células, por exemplo, bactérias, que são incapazes de crescer em placas de LB agar com concentrações de antibiótico iguais a cerca das células transformadas sem os plasmídeos.
No caso de um produto tóxico (por exemplo, ribonuclease ou barnase), quando um membro da pluralidade de tARN potenciais é aminoacilado pelas sintetases endógenas do hospedeiro, por exemplo, Escherichia coli, (isto é, não é ortogonal em relação ao hospedeiro, por exemplo, sintetases de Escherichia coli), o codão seletor é suprimido, e o produto polinucleótido tóxico produzido conduz à morte celular. As células que portam tARN ortogonais ou tARN não funcionais sobrevivem. 42 ΕΡ1794323Β1
Numa realização, o conjunto de tARN que são ortogonais a um organismo desejado, são então submetidos a uma seleção positiva, em que um codão seletor é colocado num marcador de seleção positiva, por exemplo, codificado por um gene de resistência a fármacos, tal como o gene da β-lactamase. A seleção positiva é realizada numa célula que compreende um polinucleótido que codifica ou compreende um membro do conjunto de tARN que são ortogonais à célula, um polinucleótido que codifica para um marcador de seleção positiva, e um polinucleótido que codifica para uma RS cognata. Em certas realizações, a segunda população de células compreende células que não foram eliminadas pela seleção negativa. Os polinucleótidos são expressos na célula, e a célula é cultivada na presença de um agente de seleção, por exemplo, a ampicilina. Os tARN são então selecionados para a sua capacidade de ser aminoacilados pela sintetase cognata coexpressa, e de inserir um aminoácido em resposta a este codão seletor. Normalmente, estas células mostram um aumento na eficiência de supressão em comparação com as células que albergam tARN não funcionais, ou tARN que não podem ser eficientemente reconhecidos pela sintetase de interesse. A célula que alberga os tARN não funcionais ou os tARN que não são eficazmente reconhecidos pela sintetase de interesse, são sensíveis ao antibiótico. Assim, os tARN que: (i) não são substratos para as sintetases endógenas do hospedeiro, por exemplo, Escherichia coli; (ii) podem ser aminoacilados pela sintetase de interesse; e (iii) são funcionais na tradução, sobrevivem a ambas as seleções.
Por conseguinte, o mesmo marcador pode ser quer um marcador positivo ou negativo, dependendo do contexto em que é rastreado. Isto é, o marcador é um marcador positivo se é rastreado para tal, mas um marcador negativo se é rastreado contra. 0 rigor da seleção, por exemplo, a seleção positiva, a 43 ΕΡ1794323Β1 seleção negativa ou ambas a seleção positiva e a negativa, nos métodos descritos anteriormente, inclui opcionalmente a variação do rigor da seleção. Por exemplo, como a barnase é uma proteína extremamente tóxica, o rigor da seleção negativa pode ser controlado através da introdução de diferentes números de codões seletores no gene da barnase, e/ou utilizando um promotor indutível. Em outro exemplo, a concentração do agente de seleção ou de rastreio é variada (por exemplo, a concentração de ampicilina). Num aspeto da invenção, o rigor é variado porgue a atividade desejada pode ser baixa durante as primeiras rondas. Assim, os critérios de seleção menos rigorosos são aplicados nas rondas iniciais, e os critérios mais rigorosos são aplicados em rondas posteriores de seleção. Em certas realizações, a seleção negativa, a seleção positiva ou ambas a seleção positiva e a negativa podem ser repetidas várias vezes. Podem ser usados múltiplos marcadores de seleção negativa diferentes, marcadores de seleção positiva ou marcadores de ambas a seleção positiva e a negativa. Em certas realizações, o marcador de seleção positiva e negativa pode ser o mesmo.
Podem ser utilizados na invenção outros tipos de seleções / rastreios para produzir componentes de tradução ortogonais, por exemplo, um O-tARN, uma O-RS e um par de 0-tARN / O-RS que carrega um aminoácido não natural, tal como um aminoácido alquinilo, em resposta a um codão seletor. Por exemplo, o marcador de seleção negativa, o marcador de seleção positiva ou ambos os marcadores de seleção positiva e negativa podem incluir um marcador que emite fluorescência ou catalisa uma reação luminescente, na presença de um reagente adequado. Numa outra realização, um produto do marcador é detetado por triagem de células ativadas por fluorescência (FACS) ou por luminescência. Opcionalmente, o marcador inclui um marcador com base em afinidade. Veja-se também, Francisco, J. A., et al., (1993) 44 ΕΡ1794323Β1
Production and fluorescence-activated cell sorting of Escherichia coli expressing a functional antibody fragment on the externai surface. Proc Natl Acad Sei USA. 90: 10444-8.
Podem ser encontrados métodos adicionais para a produção de um tARN recombinante ortogonal, por exemplo, nos pedidos de publicações internacionais WO 2002/086075, intitulado "Methods and compositions for the production of orthogonal tRNA aminoacyl-tRAN synthetase pairs"; WO 2004/094593, intitulado "Expanding the eukaryotic genetic code"; e WO 2005/019415, apresentado a 7 de julho de 2004. Veja-se também Forster et al., (2003) Programming peptidomimetic synthetases by translating genetic codes designed de novo, PNAS 100 (11): 6353-6357, e Feng et al., (2003), Expanding tRNA recognition of a tRNA synthetase by a single amino acid change, PNAS 100 (10): 5676-5681. Aminoacil-tARN sintetase ortogonal (O-RS)
Uma O-RS da invenção aminoacila preferencialmente, in vitro ou in vivo, um Ο-tARN com um aminoácido não natural, tal como um aminoácido alquinilo, por exemplo, a para-propargiloxifenilalanina. Uma O-RS da invenção pode ser fornecida ao sistema de tradução, por exemplo, uma célula, por um polipéptido que inclui uma O-RS, e/ou por um polinucleótido que codifica para uma O-RS ou uma porção da mesma. Por exemplo, um exemplo de O-RS compreende uma sequência de aminoácidos tal como apresentada aqui na listagem de sequências e nos exemplos, ou uma variante conservadora da mesma. Noutro exemplo, uma O-RS, ou uma porção da mesma, está codificada por uma sequência polinucleotidica que codifica para uma sequência que compreende aminoácidos na listagem de sequências ou nos exemplos aqui, ou uma sequência polinucleotidica complementar da mesma. Veja-se, por exemplo, as tabelas e os exemplos aqui para sequências de exemplos de moléculas de O-RS. Veja-se também aqui a seção intitulada "Sequências 45 ΕΡ1794323Β1 e variantes de ácidos nucleicos e polipéptidos". São também uma caracteristica da invenção os métodos para a identificação de uma aminoacil-tARN sintetase ortogonal (O-RS), por exemplo, uma O-RS, para utilizar com um O-tARN. Por exemplo, um método inclui sujeitar a seleção, por exemplo, a seleção positiva, uma população de células de uma primeira espécie, em que as células compreendem individualmente: 1) um membro de uma pluralidade de aminoacil-tARN sintetases (RS), (por exemplo, a pluralidade de RS pode incluir RS mutantes, RS derivadas de uma outra espécie que não a primeira espécie, ou ambas RS mutantes e RS derivadas de uma espécie que não a primeira espécie); 2) o tARN ortogonal (O-tARN) (por exemplo, a partir de uma ou mais espécies); e 3) um polinucleótido que codifica para um marcador de seleção (por exemplo, positiva) e compreende pelo menos um codão seletor. As células são selecionadas ou rastreadas para aquelas que mostram uma melhoria na eficiência da supressão em comparação com as células sem ou com uma quantidade reduzida do membro da pluralidade de RS. A eficiência de supressão pode ser medida por técnicas conhecidas na tecnologia e tal como aqui descritas. As células que têm um aumento na eficiência de supressão compreendem uma RS ativa que aminoacila o O-tARN. Um nível de aminoacilação (in vitro ou in vivo) pela RS ativa de um primeiro conjunto de tARN da primeira espécie é comparado com o nível de aminoacilação (in vitro ou in vivo) pela RS ativa de um segundo conjunto de tARN a partir da segunda espécie. 0 nível de aminoacilação pode ser determinado por uma substância detetável (por exemplo, um aminoácido marcado ou um aminoácido não natural, por exemplo, uma para-propargiloxifenilalanina marcada). É normalmente
selecionada a RS ativa, que aminoacila mais eficazmente o segundo conjunto de tARN em comparação com o primeiro conjunto de tARN, proporcionando, assim, uma aminoacil-tARN 46 ΕΡ1794323Β1 sintetase ortogonal eficiente (otimizada) para a utilização com o O-tARN. É também uma característica da invenção uma O-RS identificada pelo método.
Qualquer um de uma série de ensaios pode ser utilizado para determinar a aminoacilação. Estes ensaios podem ser realizados in vitro ou in vivo. Por exemplo, ensaios in vitro de aminoacilação são descritos em, por exemplo, Hoben e Soll (1985) Methods Enzymol. 113: 55-59. A aminoacilação também pode ser determinada utilizando um repórter, juntamente com os componentes de tradução ortogonais, e detetar o repórter numa célula que expresse um polinucleótido que compreende pelo menos um codão seletor que codifica para uma proteína. Veja-se também, WO 2002/085923, intitulado "In vivo incorporation of unnatural amino acids"; e WO 2004/094593, intitulado "Expanding the eukaryotic genetic code". A O-RS identificada pode ser manipulada adicionalmente para alterar a especificidade do substrato da sintetase, de modo a que apenas um aminoácido não natural desejado, por exemplo, um aminoácido alquinilo, mas não qualquer um dos 20 aminoácidos comuns, é carregado para o O-tARN. Os métodos para gerar uma aminoacil-tARN sintetase ortogonal com uma especificidade de substrato para um aminoácido não natural incluem a mutação da sintetase, por exemplo, no local ativo da sintetase, no local do mecanismo de edição na sintetase, em diferentes locais por combinação de diferentes domínios de sintetases, ou semelhantes, e aplicando um processo de seleção. É utilizada uma estratégia, a qual se baseia na combinação de uma seleção positiva, seguida por uma seleção negativa. Na seleção positiva, a supressão do codão seletor introduzido numa(s) posição (posições) não essencial (essenciais) de um marcador positivo permite que as células sobrevivam sob pressão da seleção positiva. Na presença de ambos os aminoácidos naturais e não naturais, os sobreviventes 47 ΕΡ1794323Β1 codificam assim sintetases ativas, carregando o tARN supressor ortogonal quer com um aminoácido natural como com um aminoácido não natural. Na seleção negativa, a supressão de um codão seletor introduzido numa(s) posição (posições) não essencial (essencias) de um marcador negativo remove as sintetases com especificidades de aminoácidos naturais. Os sobreviventes das seleções negativa e positiva codificam sintetases que aminoacilam (carregam) o tARN ortogonal supressor com apenas aminoácidos não naturais. Estas sintetases podem então ser submetidas a mutagénese adicional, por exemplo, rearranjo de ADN ou outros métodos de mutagénese recursiva.
Uma biblioteca de O-RS mutantes pode ser gerada utilizando várias técnicas de mutagénese conhecidas na tecnologia. Por exemplo, as RS mutantes podem ser geradas por mutações especificas do local, mutações pontuais aleatórias, recombinação homóloga, troca de ADN ou outros métodos de mutagénese recursivos, construção quimérica ou qualquer combinação dos mesmos. Por exemplo, uma biblioteca de RS mutantes pode ser produzida a partir de duas ou mais, por exemplo, "sub-bibliotecas" mais pequenas e menos diversas. Também estão incluídas na invenção as bibliotecas de RS quiméricas. Deve notar-se que as bibliotecas de tARN sintetases provenientes de diversos organismos (por exemplo, microrganismos, tais como eubactérias ou arqueobactérias) , tais como as bibliotecas que compreendem diversidade natural (veja-se, por exemplo, patente US n°. 6 238 884 de Short et al.; patente US n°. 5 756 316 de Schallenberger et al.; patente US n°. 5 783 431 de Petersen et al.; patente US n°. 5 824 485 de Thompson et al.; patente US n°. 5 958 672 de Short et al.), são opcionalmente construídas e rastreadas para pares ortogonais.
Uma vez que as sintetases são sujeitas à estratégia de seleção / rastreio positivo e negativo, estas sintetases 48 ΕΡ1794323Β1 podem então ser submetidas a mutagénese adicional. Por exemplo, pode ser isolado um ácido nucleico que codifica para a O-RS; podem ser gerados um conjunto de polinucleótidos que codificam para as O-RS mutadas (por exemplo, por mutagénese aleatória, por mutagénese especifica do local, por recombinação, ou qualquer combinação das mesmas) a partir do ácido nucleico; e, estas etapas individuais ou uma combinação destas etapas podem ser repetidas até que seja obtida uma O-RS mutada, que aminoacila preferencialmente o O-tARN com o aminoácido não natural, por exemplo, um aminoácido alquinilo. Num aspeto da invenção, as etapas são realizadas várias vezes, por exemplo, pelo menos duas vezes.
Também podem ser utilizados niveis de rigor de seleção / rastreio adicionais nos métodos da invenção, para produzir o O-tARN, a O-RS, ou pares dos mesmos. 0 rigor da seleção ou do rastreio pode ser variado em uma ou em ambas as etapas do método para produzir uma O-RS. Isto pode incluir, por exemplo, uma variação da quantidade de agente de seleção / rastreio que é usado, etc. Também podem ser realizadas rondas adicionais de seleções positivas e/ou negativas. A seleção ou o rastreio podem também compreender uma ou mais de uma alteração na permeabilidade do aminoácido, uma alteração na eficiência da tradução, uma alteração na fidelidade da tradução, etc. Tipicamente, a alteração de uma ou mais baseia-se numa mutação em um ou mais genes num organismo, no qual é utilizado um par tARN ortogonal - tARN sintetase para produzir a proteina.
Podem ser encontrados detalhes gerais adicionais para a produção de O-RS, e a alteração da especificidade do substrato da sintetase na publicação interna número WO 2002/086075, intitulada "Methods and compositions for the production of orthogonal tRNA aminoacyl-tRNA synthetase pairs", e em WO 2004/094593, intitulada "Expanding the eukaryotic genetic code". 49 ΕΡ1794323Β1
ORIGEM E ORGANISMO HOSPEDEIRO
Os componentes ortogonais de tradução (O-tARN e O-RS) da invenção podem ser derivados de qualquer organismo (ou de uma combinação de organismos) para uso num sistema de tradução de hospedeiro de qualquer outra espécie, com a ressalva de que os componentes O-tARN / O-RS e o sistema hospedeiro funcionem de forma ortogonal. Não é um requisito que o O-tARN e a O-RS sejam derivados do mesmo organismo. Num aspeto, os componentes ortogonais são derivados a partir de genes de Archaea (isto é, arqueobactérias) para o uso num sistema hospedeiro de eubactérias.
Por exemplo, o O-tARN ortogonal pode ser derivado de um organismo Archae, por exemplo, uma arqueobactéria, tal como Methanococcus jannaschii, Methanobacterium thermoautotrophicum, Halobacterium tal como Haloferax volcanii e espécies NRC-1 de Halobacterium, Archaeoglobus fulgidus, Pyrococcus furiosus, Pyrococcus horikoshii, Aeuropyrum pernix, Methanococcus maripaludis, Methanopyrus kandleri, Methanosarcina mazei (Mm), Pyrobaculum aerophilum, Pyrococcus abyssi, Sulfolobus solfataricus (Ss), Sulfolobus tokodaii, Thermoplasma acidophilum, Thermoplasma volcanium, ou semelhantes, ou uma eubactéria, tal como Escherichia coli, Thermus thermophilus, Bacillus stearothermphilus, ou semelhantes, enquanto que a O-RS ortogonal pode ser derivada de um organismo ou de uma combinação de organismos, por exemplo, uma arqueobactéria, tal como Methanococcus jannaschii, Methanobacterium thermoautotrophicum, Halobacterium tal como Haloferax volcanii e espécies NRC-1 de Halobacterium, Archaeoglobus fulgidus, Pyrococcus furiosus, Pyrococcus horikoshii, Aeuropyrum pernix, Methanococcus maripaludis, Methanopyrus kandleri, Methanosarcina mazei, Pyrobaculum aerophilum, Pyrococcus abyssi, Sulfolobus solfataricus, Sulfolobus tokodaii, Thermoplasma acidophilum, Thermoplasma volcanium, 50 ΕΡ1794323Β1 ou semelhantes, ou uma eubactéria, tal como Escherichia coli, Thermus thermophilus, Bacillus stearothermphilus, ou semelhantes. Numa realização, podem também ser utilizadas fontes eucarióticas, por exemplo, plantas, algas, protistas, fungos, leveduras, animais (por exemplo, mamíferos, insetos, artrópodes, etc.), ou semelhantes, como fontes de O-tARN e de O-RS.
Os componentes individuais de um par O-tARN / O-RS podem ser derivados do mesmo organismo ou de organismos diferentes. Numa realização, o par O-tARN / O-RS é do mesmo organismo. Alternativamente, o O-tARN e a O-RS do par 0-tARN / O-RS são de organismos diferentes. 0 O-tARN, a O-RS ou o par O-tAR / O-RS podem ser selecionados ou rastreados in vivo ou in vitro, e/ou utilizados numa célula, por exemplo, uma célula eubacteriana, para produzir um polipéptido com um aminoácido alquinilo. A célula eubacteriana usada não é limitada, por exemplo, Escherichia coli, Thermus thermophilus, Bacillus stearothermphilus, ou semelhantes. São também uma característica da invenção as composições de células eubacterianas que compreendem componentes de tradução da invenção.
Veja-se também, o pedido de publicação internacional número WO 2004/094593, intitulado "Expanding the eukaryotic genetic code", arquivado a 16 de abril de 2004, para o rastreio de O-tARN e/ou de O-RS numa espécie para o uso em outras espécies.
CODÕES SELETORES
Os codões seletores da invenção ampliam o quadro genético de codão da maquinaria biossintética de proteína. Por exemplo, um codão seletor inclui, por exemplo, um codão único de três bases, um codão sem sentido, tal como um codão de terminação, por exemplo, um codão âmbar (UAG), ou um codão opala (UGA), um codão não natural, pelo menos um codão de quatro bases, um codão raro, ou semelhantes. Pode 51 ΕΡ1794323Β1 ser introduzido um certo número de codões seletores num gene desejado, por exemplo, um ou mais, dois ou mais, mais do que três, etc. Ao utilizar codões seletores diferentes, podem ser utilizados vários pares tARN ortogonal / sintetase que permitem a incorporação simultânea especifica do local de vários aminoácidos não naturais, por exemplo, incluindo pelo menos um aminoácido alquinilo, utilizando estes codões seletores diferentes.
Numa realização, os métodos envolvem o uso de um codão seletor que é um codão de terminação, para a incorporação in vivo de um aminoácido alquinilo numa célula. Por exemplo, é produzido um Ο-tARN que reconhece o codão de terminação, e é aminoacilado por uma O-RS com um aminoácido alquinilo. Este Ο-tARN não é reconhecido pelas aminoacil-tARN sintetases que ocorrem naturalmente no hospedeiro. Pode ser utilizada a mutagénese dirigida ao local convencional para introduzir o codão de terminação no local de interesse num polinucleótido que codifica para um polipéptido de interesse. Veja-se, por exemplo, Sayers, J. R., et al., (1988), 5',3' Exonuclease in phosphorothioate-based oligonucleotide-directed mutagenesis. Nucleic Acids Res, 791-802. Quando a O-RS, o Ο-tARN e o ácido nucleico que codifica para um polipéptido de interesse são combinados, por exemplo, in vivo, o aminoácido alquinilo incorporado em resposta ao codão de terminação para dar um polipéptido que contém o aminoácido alquinilo ativo na posição especificada. Numa realização da invenção, o codão de terminação utilizado como um codão seletor é um codão âmbar, UAG, e/ou um codão opala, UGA. Num exemplo, um código genético em que o UAG e o UGA são ambos utilizados como um codão seletor pode codificar 22 aminoácidos, ao mesmo tempo que preserva o codão sem sentido ocre, UAA, que é o sinal de terminação mais abundante. A incorporação in vivo de aminoácidos alquinilo ativos pode ser feita sem perturbação significativa da célula 52 ΕΡ1794323Β1 hospedeira. Por exemplo, em células não eucarióticas, tais como a Escherichia coli, porque a eficácia de supressão para o codão UAG depende da competição entre o O-tARN, por exemplo, o tARN supressor âmbar, e o fator de libertação 1 (RF1) (que se liga ao codão UAG e inicia a libertação do péptido em crescimento a partir do ribossoma), a eficácia da supressão pode ser modulada, por exemplo, quer aumentando o nível expressão do Ο-tARN, por exemplo, o tARN supressor, ou utilizando uma estirpe deficiente em RF1. Em células eucarióticas, porque a eficácia de supressão para o codão UAG depende da competição entre o Ο-tARN, por exemplo, o tARN supressor âmbar, e um fator de libertação eucariótico (por exemplo, eRF) (que se liga a um codão de terminação e inicia a libertação do péptido em crescimento a partir do ribossoma) , a eficácia da supressão pode ser modulada, por exemplo, aumentando o nível de expressão de Ο-tARN, por exemplo, o tARN supressor. Para além disso, também podem estar presentes compostos adicionais, por exemplo, agentes de redução, tais como o ditiotretiol (DTT) .
Os aminoácidos alquinilo também podem ser codificados com codões raros. Por exemplo, quando a concentração de arginina numa reação de síntese de proteínas in vitro é reduzida, o codão de arginina raro, AGG, revelou-se eficiente para a inserção de Ala por um tARN sintético acilado com alanina. Veja-se, por exemplo, Ma et al., Biochemistry, 32: 7939 (1993). Neste caso, o tARN sintético compete com o tARNArg que ocorre naturalmente, que existe como uma espécie menor em Escherichia coli. Para além disso, alguns organismos não utilizam todos os codões tripleto. Um codão AGA não atribuído em Micrococcus luteus tem sido utilizado para a inserção de aminoácidos num extrato in vitro de transcrição / tradução. Veja-se por exemplo, Kowal e Oliver, Nucl. Acid. Res., 25: 4685 (1997) . Os componentes da invenção podem ser gerados para 53 ΕΡ1794323Β1 utilizarem estes codões raros in vivo.
Os codões seletores também podem compreender codões prolongados, por exemplo, codões de quatro ou mais bases, tais como, codões de quatro, cinco, seis ou mais bases. Os exemplos de codões de quatro bases incluem, por exemplo, AGGA, CUAG, UAGA, CCCU e semelhantes. Os exemplos de codões de cinco bases incluem, por exemplo, AGGAC, CCCCU, CCCUC, CUAGA, CUACU, UAGGC e semelhantes. Os métodos da invenção incluem a utilização de codões prolongados com base na supressão de desenquadramento. Os codões de quatro ou mais bases podem inserir, por exemplo, um ou vários aminoácidos não naturais, tais como um aminoácido alquinilo, na mesma proteina. Em outras realizações, os laços anticodão podem descodificar, por exemplo, pelo menos um codão de quatro bases, pelo menos um codão de cinco bases, ou, pelo menos, um codão de seis bases ou mais. Uma vez que existem 256 possíveis codões de quatro bases, podem ser codificados vários aminoácidos não naturais na mesma célula através do uso de um codão de quatro ou mais bases. Veja-se também, Anderson et al., (2002) Exploring the limits of codon and anticodon size, Chemistry and Biology, 9: 237-244; e, Magliery, (2001) Expanding the genetics code: selection of eficient suppressors of four-base codons and idenification of "shifty" four-base codons with a library approach in Escherichia coli, J. Mol. Biol. 307: 755-769.
Por exemplo, têm sido usados codões de quatro bases para incorporar aminoácidos não naturais em proteínas, utilizando métodos biossintéticos in vitro. Veja-se, por exemplo, Ma et al., (1993) Biochemistry, 32: 7939; e Hohsaka et al., (1999) J. Am. Chem. Soc., 121: 34. CGGG e AGGU foram utilizados para incorporar simultaneamente 2-naftilalanina e um derivado NBD de lisina em estreptavidina, in vitro, com dois tARN supressores de desenquadramento quimicamente acilados. Veja-se, por exemplo, Hohsaka et al., (1999) J. Am. Chem. Soc., 121: 54 ΕΡ1794323Β1 12194. Num estudo in vivo, Moore et al., examinaram a capacidade de derivados tARNtLeu com anticodões NCUA para suprimirem codões UAGN (N pode ser U, A, G ou C) , e verificaram que o quadrupleto UAGA pode ser descodificado por um t ARNLeu com um anticodão UCUA, com uma eficiência de 13 a 26 %, com pouca descodificação no quadro 0 ou -1. Veja-se Moore et al., (2000) J. Mol. Biol., 298: 195. Numa realização, podem ser utilizados na invenção codões prolonqados com base em codões raros ou codões sem sentido, que podem reduzir a leitura sentido e a supressão de desenquadramento em outros locais indesejados.
Para um dado sistema, um codão seletor pode também incluir um dos codões de três bases naturais, em que o sistema endóqeno não utiliza (ou utiliza raramente) o codão de base natural. Por exemplo, isto inclui um sistema que tem falta de um tARN que reconhece o codão de três bases natural, e/ou um sistema em que o codão de três bases é um codão raro.
Os codões seletores incluem opcionalmente pares de bases não naturais. Estes pares de bases não naturais expandem ainda mais o alfabeto qenético existente. Um par de bases adicional aumenta o número de codões tripleto de 64 para 125. As propriedades de pares de terceiras bases incluem o emparelhamento de base estável e seletivo, a incorporação enzimática eficiente no ADN com alta fidelidade por uma polimerase, e a continuação eficiente da extensão do oligonucleótido iniciador após a síntese do par de bases não natural nascente. As descrições de pares de bases não naturais que podem ser adaptadas para os métodos e composições incluem, por exemplo, Hirao et al., (2002) An unnatural base pair for incorporating amino acid analogues into protein, Nature Biotechnology, 20: 177-182. Veja-se também Wu, Y., et al., (2002) J. Am. Chem. Soc. 124: 14626-14630. Outras publicações relevantes estão listadas em seguida. 55 ΕΡ1794323Β1
Para o uso in vivo, o nucleosídeo não natural é permeável à membrana e é fosforilado para formar o trifosfato correspondente. Para além disso, a informação genética aumentada é estável e não é destruída por enzimas celulares. Os esforços anteriores por Benner e outros aproveitaram os padrões de ligação de hidrogénio, que são diferentes dos pares canónicos de Watson-Crick, o exemplo mais notável dos quais é o par iso-C : iso-G. Veja-se, por exemplo, Switzer et al., (1989) J. Am. Chem. Soc., 111: 8322; e Piccirilli et al., (1990) Nature, 343: 33; Kool, (2000) Curr. Opin. Chem. Biol., 4: 602. Estas bases em geral emparelham mal em algum grau com bases naturais, e não podem ser enzimaticamente replicadas. Kool e colaboradores demonstraram que as interações hidrofóbicas de empacotamento entre as bases podem substituir as ligações de hidrogénio, para conduzir a formação de pares de bases. Veja-se Kool, (2000) Curr. Opin. Chem. Biol., 4: 602; e Guckian e Kool, (1998) Angew. Chem. Int. Ed. Engl., 36, 2825. Num esforço para desenvolver um par de bases não naturais satisfazendo todos os requisitos anteriores, Schultz, Romesberg e colaboradores têm sistematicamente sintetizado e estudado uma série de bases hidrofóbicas não naturais. Um autopar PICS : PICS é encontrado ser mais estável do que os pares de bases naturais, e pode ser eficientemente incorporado no ADN pelo fragmento de Klenow da ADN polimerase I (KF) de E. coli. Veja-se, por exemplo, McMinn et al., (1999) J. Am. Chem. Soc., 121: 11586; e Ogawa et al., (2000) J. Am. Chem. Soc., 122: 3274. Um autopar 3MN : 3MN pode ser sintetizado por KF com eficácia e seletividade suficiente para a função biológica. Veja-se, por exemplo, Ogawa et al., (2000) J. Am. Chem. Soc., 122: 8803. No entanto, ambas as bases agem como um terminador de cadeia para replicação adicional. Foi recentemente evoluída uma ADN polimerase mutante que pode ser usada para replicar o autopar PICS. Para além disso, pode ser replicado um 56 ΕΡ1794323Β1 autopar 7AI. Veja-se, por exemplo, Tae et al., (2001) J. Am. Chem. Soc., 123: 7439. Também tem sido desenvolvido um novo par metalobase, Dipic : Py, o qual forma um par estável após a ligação a Cu(Il). Veja-se Meggers et al., (2000) J. Am. Chem. Soc., 122: 10714. Porque os codões prolongados e os codões não naturais são intrinsecamente ortogonais aos codões naturais, os métodos da invenção podem tirar partido desta propriedade para gerar tARN ortogonais para eles.
Também pode ser utilizado um sistema que evita a tradução para incorporar um aminoácido alquinilo num polipéptido desejado. Num sistema que evita a tradução, é inserida num gene uma grande sequência, mas não é traduzida em proteína. A sequência contém uma estrutura que serve como uma sugestão para induzir o ribossoma para passar por cima da sequência e retomar a tradução a jusante da inserção.
AMINOÁCIDOS NÃO NATURAIS
Tal como é aqui utilizado, um aminoácido não natural refere-se a qualquer aminoácido, aminoácido modificado, ou análogo de aminoácido que não a selenocisteína e/ou a pirrolisina, e os seguintes vinte aminoácidos alfa codificados geneticamente: alanina, arginina, asparagina, ácido aspártico, cisteína, glutamina, ácido glutâmico, glicina, histidina, isoleucina, leucina, lisina, metionina, fenilalanina, prolina, serina, treonina, triptofano, tirosina, valina. A estrutura genérica de um aminoácido alfa é ilustrada pela fórmula I: 57
I ΕΡ1794323Β1 HgN
R
Cq.H
Um aminoácido não natural é tipicamente qualquer estrutura possuindo a fórmula I, em que o grupo R é qualquer substituinte que não um que seja utilizado nos vinte aminoácidos naturais. Veja-se, por exemplo, Biochemistry por L. Stryer, 3a ed. 1988, Freeman and Company, Nova Iorque, para as estruturas dos vinte aminoácidos naturais. Note-se que, os aminoácidos não naturais da invenção podem ser compostos que ocorrem naturalmente que não os vinte aminoácidos alfa anteriores.
Uma vez que os aminoácidos não naturais da invenção normalmente diferem dos aminoácidos naturais da cadeia lateral, os aminoácidos não naturais formam ligações amida com outros aminoácidos, por exemplo, naturais ou não naturais, da mesma maneira em que são formadas em proteínas que ocorrem naturalmente. No entanto, os aminoácidos não naturais possuem grupos na cadeia lateral que os diferenciam dos aminoácidos naturais.
De interesse particular aqui são os aminoácidos não naturais que compreendem um grupo alquinilo reativo, por exemplo, um aminoácido não natural que compreende uma porção alcino que reage especificamente e regiosselectivamente com uma porção azido. Por exemplo, num aminoácido alquinilo, R na fórmula I inclui qualquer estrutura que contém alcino. Por exemplo, a para-propargiloxifenilalanina (abreviada pPRO-Phe; veja-se a figura IA) é um aminoácido não natural alquinilo desejado que encontra utilização na invenção. Não se pretende que a invenção esteja limitada à utilização de pPRO-Phe com componentes de tradução ortogonais. Por exemplo, são 58 ΕΡ1794323Β1 contemplados uma variedade de outros aminoácidos alquinilo (vejam-se as figuras 8A e 8B) , incluindo, mas não se limitando a, por exemplo, ácido 2-amino-4-pentinóico ácido 2-amino-3-(4-etinilfenil) propanoico ácido 2-amino-3-[4-(prop-2-inil) fenil] propanoico ácido 2-amino-3-(prop-2-iniloxi) propanoico ácido 2-amino-3-(prop-2-iniltio) propanoico ácido 3-[ ( (prop-2-iniloxi) carbonil]-2-aminopropanóico ácido 4-[((prop-2-iniloxi) carbonil]-2-aminobutanóico
Em outros aminoácidos não naturais, por exemplo, R na fórmula I compreende opcionalmente um alquilo-, arilo-, acilo-, hidrazina, ciano-, halo-, hidrazido, alcenilo, éter, borato, boronato, fosfo, fosfono, fosfina, enona, imina, éster, hidroxilamina, amina, e similares, ou qualquer combinação dos mesmos. Outros aminoácidos não naturais de interesse incluem, mas não estão limitados a, aminoácidos que compreendem um agente de ligação cruzada fotoactivável, aminoácidos marcados com rotação, aminoácidos fluorescentes, aminoácidos de ligação a metais, aminoácidos que contêm metal, aminoácidos radioativos, aminoácidos com novos grupos funcionais, aminoácidos que de forma covalente ou não covalentemente interagem com outras moléculas, aminoácidos fotoencapsulados e/ou fotoisomerizáveis, aminoácidos que contêm biotina ou um análogo de biotina, aminoácidos que contêm ceto, aminoácidos glicosilados, uma porção de sacarideo ligado à cadeia lateral do aminoácido, aminoácidos que compreendem polietileno glicol ou poliéter, aminoácidos substituídos com um átomo pesado, aminoácidos quimicamente cliváveis ou fotocliváveis, aminoácidos com uma cadeia lateral alongada em comparação com os aminoácidos naturais (por exemplo, poliéteres ou hidratos de carbono de cadeia longa, por exemplo, maior do que cerca de 5, maior do que cerca de 10 átomos de carbono, etc.), aminoácidos que contêm açúcar 59 ΕΡ1794323Β1 ligados a carbono, aminoácidos que contêm amino tioácido, e aminoácidos que contêm uma ou mais porções tóxicas.
Em outro aspeto, a invenção proporciona aminoácidos alquinilo que têm a estrutura geral ilustrada pela fórmula IV que se segue:
Um aminoácido alcino que tem esta estrutura é tipicamente, qualquer estrutura em que Ri representa um substituinte utilizado em um dos vinte aminoácidos naturais, e R2 representa um substituinte alquinilo. Assim, este tipo de aminoácido alquinilo pode ser visto como um derivado de aminoácido natural.
Tal como foi referido anteriormente, não se pretende que a invenção seja limitada ao uso do aminoácido não natural alquinilo, para-propargiloxifenilalanina (pPRO-Phe) . Na verdade, qualquer aminoácido alquinilo que possa ser utilizado num sistema de tradução ortogonal da invenção numa eubactéria está no âmbito da invenção. São conhecidos uma variedade de outros aminoácidos alquinilo, por exemplo, os aminoácidos alquinilo fornecidos na figura 8. Uma vez que algumas destas estruturas de aminoácido alquinilo são muito semelhantes a pPRO-Phe, contempla-se que alguns destes aminoácidos podem ser incorporados em proteínas em eubactérias utilizando os componentes ortogonais tARN e aminoacil-tARN sintetase aqui proporcionados, por exemplo, o Ο-tARN da SEQ ID NO: 1, e a O-RS das SEQ ID NO: 4, 6, 8, 10, 12, 14, 16, 18, ou variantes conservadoras das mesmas. Assim, a invenção também proporciona métodos para a incorporação de outros aminoácidos alquinilo para além de pPRO-Phe. Independentemente do facto de os componentes 60 ΕΡ1794323Β1 ortogonais fornecidos na tabela 4 (veja-se o exemplo 9) serem capazes de incorporar aminoácidos alquinilo para além de pPRO-Phe, a divulgação proporciona ensinamento suficiente para a construção de componentes de tARN ortogonal que irão incorporar estes outros aminoácidos alquinilo, e para além disso, esses componentes ortogonais estão dentro do âmbito da presente invenção.
Para além de aminoácidos não naturais que contêm cadeias laterais novas, tais como o grupo alquinilo, os aminoácidos não naturais alquinilo, também podem, opcionalmente, compreender estruturas de esqueleto modificadas, por exemplo, tal como ilustrado pelas estruturas com as fórmulas II e III: n
II X
III
em que Z normalmente compreende OH, NH2, SH, NH-R', ou S-R'; X e Y, que podem ser iguais ou diferentes, compreendem tipicamente S ou 0, e R e R', que são, opcionalmente, o mesmo ou diferentes, são selecionados tipicamente a partir da mesma lista de constituintes do grupo R descrito anteriormente para os aminoácidos não naturais possuindo a fórmula I, bem como hidrogénio. Por exemplo, os aminoácidos não naturais da invenção compreendem opcionalmente substituições no grupo amino ou carboxilo, tal como ilustrado pelas fórmulas II e III. Os aminoácidos não naturais deste tipo incluem, mas não estão limitados a, ácidos α-hidroxi, a-tioácidos α-aminotiocarboxilatos, por 61 ΕΡ1794323Β1 exemplo, com cadeias laterais correspondentes aos vinte aminoácidos naturais comuns, ou cadeias laterais não naturais alquinilo. Para além disso, as substituições no α-carbono incluem opcionalmente aminoácidos L, D, ou α-α-dissubstituídos, tais como o D-glutamato, a D-alanina, a D-metil-O-tirosina, o ácido aminobutirico, e semelhantes. Outras alternativas estruturais incluem aminoácidos cíclicos, tais como os análogos de prolina, bem como os análogos de prolina de anel de 3, 4, 6, 7, 8 e 9 membros, os β e γ aminoácidos tais como a β-alanina substituída e o ácido γ-amino butírico.
Por exemplo, muitos aminoácidos não naturais (incluindo alguns aminoácidos alquinilo) são baseados em aminoácidos naturais, tais como a tirosina, a serina, a cisteína, o aspartato, o glutamato, e outros semelhantes. Por exemplo, os aminoácidos alquinilo: ácido 2-amino-3-(prop-2-iniloxi) propanoico; ácido 2-amino-3-(prop-2-iniltio) propanoico; ácido 3-[((prop-2-iniloxi) carbonil]-2-aminopropanóico; e ácido 4-[((prop-2-iniloxi) carbonil]-2-aminobutanóico, podem todos ser derivados a partir de aminoácidos naturais.
Os análogos de tirosina incluem as tirosinas substituídas em para, as tirosinas substituídas em orto e as tirosinas substituídas em meta, em que a tirosina substituída compreende um grupo alquinilo, um grupo acetilo, um grupo benzoílo, um grupo amino, uma hidrazina, uma hidroxiamina, um grupo tiol, um grupo carboxilo, um grupo isopropilo, um grupo metilo, um hidrato de carbono de cadeia linear ou ramificada C6-C2o, um hidrato de carbono saturado ou insaturado, um grupo O-metilo, um grupo poliéter, um grupo nitro, ou outros semelhantes. Para além disso, também são contemplados os anéis de arilo multiplamente substituídos. Os análogos de glutamina da invenção incluem, mas não estão limitados a, derivados de α-hidroxi, derivados γ-substituídos, derivados cíclicos, e 62 ΕΡ1794323Β1 derivados de glutamina substituídos de amida. Os exemplos de análogos de fenilalanina, incluem, mas não estão limitados a, fenilalaninas substituídas em para, fenilalaninas substituídas em orto, e fenilalaninas substituídas em meta, em gue o substituinte compreende um grupo alquinilo, um grupo hidroxi, um grupo metoxi, um grupo metilo, um grupo alilo, um aldeído, um grupo nitro, um grupo tiol, ou um grupo ceto, ou outros semelhantes. Os exemplos específicos de aminoácidos não naturais incluem, mas não estão limitados a, uma p-propargiloxifenilalanina, uma 3,4-di-hidroxi-L-fenilalanina (DHP), uma 3,4,6-tri-hidroxi-L-fenilalanina, uma 3,4,5-tri-hidroxi-L-fenilalanina, uma 4-nitro-fenilalanina, uma p-acetil-L-fenilalanina, uma O-metil-L-tirosina, uma L-3-(2-naftil) alanina, uma 3-metilfenilalanina, uma 0-4-alil-L-tirosina, uma 4-propil-L-tirosina, uma 3-nitro-tirosina, uma 3-tiol-tirosina, uma tri-O-acetil-GlcNAcP-serina, uma L-Dopa, uma fenilalanina fluorada, uma isopropil-L-fenilalanina, uma p-azido-L-fenilalanina, uma p-acil-L-fenilalanina, uma p-benzoil-L-fenilalanina, uma L-fosfosserina, uma fosfonoserina, uma fosfonotirosina, uma p-iodo-fenilalanina, uma p-bromofenilalanina, uma p-amino-L-fenilalanina, e uma isopropil-L-fenilalanina, e outros semelhantes. São aqui fornecidas as estruturas de uma variedade de aminoácidos não naturais, vejam-se, por exemplo, as figuras ΙΑ, 8A e 8B. Veja-se também o pedido internacional publicado WO 2004/094593, intitulado "Expanding the eukaryotic genetic code". Síntese química de aminoácidos não naturais
Muitos dos aminoácidos não naturais fornecidos anteriormente estão disponíveis comercialmente, por exemplo, a partir de Sigma (EUA) ou de Aldrich (Milwaukee, WI, EUA). Aqueles que não estão disponíveis comercialmente são opcionalmente sintetizados, tal como proporcionado em várias publicações, ou utilizando métodos padrão conhecidos 63 ΕΡ1794323Β1 pelos peritos na tecnologia. Para técnicas de síntese orgânica, veja-se, por exemplo, Organic Chemistry de Fessendon e Fessendon (1982, segunda edição, Willard Grant Press, Boston Mass.); Advanced Organic Chemistry de March (terceira edição, 1985, Wiley and Sons, Nova Iorgue); e Advanced Organic Chemistry de Carey e Sundberg (terceira edição, Parts A and B, 1990, Plenum Press, Nova Iorgue). Publicações adicionais que descrevem a síntese de aminoácidos não naturais incluem, por exemplo, WO 2002/085923, intitulado "In vivo incorporation of unnatural amino acids"; Matsoukas et al., (1995) J. Med. Chem, 38, 4660-4669; King, F. E. & Kidd, D. A. A. (1949) A new synthesis of glutamine and of γ-dipeptides of glutamic acid from phthylated intermediates. J. Chem. Soc., 3315-3319; Friedman, O. M. & Chatterrji, R. (1959) Synthesis of derivatives of glutamine as model substrates for antitumor agents. J. Am. Chem. Soc. 81, 3750-3752; Craig, J. C. et al., (1988) Absolute configuration of the enantiomers of 7-chloro-4 [[4-(diethylamano)-1-methylbutyl] amino] quinoline (chloroquine). J. Org. Chem. 53, 1167-1170; Azoulay, M., Vilmont, M. & Frappier, F. (1991) Glutamine analogues as potential antimalarials, Eur. J. Med. Chem. 26, 201-5; Koskinen, A. Μ. P. & Rapoport, H. (1989) Synthesis of 4-substituted prolines as conformationally constrained amino acid analogues. J. Org. Chem. 54, 1859-1866; Christie, B. D. & Rapoport, H. (1985) Synthesis of optically pure pipecolates from L-asparagine. Application to the total synthesis of ( + ) -apovincamine through amino acid decarbonylation and iminium ion cyclization. J. Org. Chem. 1989: 1859-1866; Barton et al., (1987) Synthesis of novel a-amino acids and derivatives using radical chemistry: synthesis of L- and D-a-amino-adipic acids, L-a-aminopimelic acid and appropriate unsaturated derivatives. Tetrahedron Lett. 43: 4297-4308; e, Subasinghe et al., (1992) Quisqualic acid analogues: synthesis of beta- 64 ΕΡ1794323Β1 heterocyclic 2-aminopropanoic acid derivatives and their activity at a novel quisqualate-sensitized site. J. Med. Chem. 35: 4602-7. Veja-se também, a publicação internacional WO 2004/058946, intitulada "Protein arrays", arquivada a 22 de dezembro de 2003.
Absorção celular de aminoácidos não naturais A absorção de aminoácidos não naturais por uma célula é uma questão que é tipicamente considerada no desenho e seleção de aminoácidos não naturais, por exemplo, para incorporação numa proteína. Por exemplo, a elevada densidade de carga de a-aminoácidos sugere que estes compostos não são suscetíveis de serem permeáveis à célula. Os aminoácidos naturais são absorvidos para dentro da célula através de um conjunto de sistemas de transporte à base de proteínas, que apresentam muitas vezes diferentes graus de especificidade de aminoácido. Pode ser feito um rastreio rápido que avalia quais os aminoácidos não naturais, caso existam, são absorvidos pelas células. Veja-se, por exemplo, os ensaios de toxicidade em, por exemplo, a publicação internacional WO 2004/058946, intitulada "Protein arrays", arquivada a 22 de dezembro de 2003; e Liu e Schultz (1999) Progress toward the evolution of an organism with an expanded genetic code. PNAS 96: 4780-4785. Embora a absorção seja facilmente analisada com vários ensaios, uma alternativa para a conceção de aminoácidos não naturais que são passíveis de vias de absorção celular é proporcionar vias biossintéticas para criar aminoácidos in vi vo.
Biossíntese de aminoácidos não naturais Já existem muitas vias biossintéticas em células para a produção de aminoácidos e outros compostos. Embora possa 65 ΕΡ1794323Β1 não existir na natureza um método biossintético para um aminoácido não natural em particular, por exemplo, numa célula, a invenção proporciona tais métodos. Por exemplo, as vias biossintéticas para os aminoácidos não naturais são opcionalmente geradas na célula do hospedeiro, adicionando novas enzimas ou modificando vias da célula hospedeira já existentes. As novas enzimas adicionais são opcionalmente enzimas que ocorrem naturalmente ou enzimas que evoluíram artificialmente. Por exemplo, a biossintese de p-aminofenilalanina (tal como apresentada num exemplo em WO 2002/085923, supra) implica a adição de uma combinação de enzimas conhecidas de outros organismos. Os genes para estas enzimas podem ser introduzidos numa célula por transformação da célula com um plasmideo que compreende os genes. Os genes, quando expressos na célula, proporcionam uma via enzimática para sintetizar o composto desejado. Os exemplos dos tipos de enzimas que são adicionadas opcionalmente são proporcionados nos exemplos que se seguem. As sequências de enzimas adicionais são encontradas, por exemplo, no Genbank. As enzimas evoluídas artificialmente também são adicionadas opcionalmente a uma célula da mesma maneira. Deste modo, a maquinaria celular e os recursos de uma célula são manipulados para produzir aminoácidos não naturais.
Com efeito, pode ser usado qualquer um de uma variedade de métodos para a produção de novas enzimas para o uso em vias biossintét icas, ou para a evolução de vias existentes, para a produção de aminoácidos não naturais, in vitro ou in vivo. Podem ser aplicados muitos métodos disponíveis de enzimas evoluídas e outros componentes da via de biossintese na presente invenção para a produção de aminoácidos não naturais (ou, na verdade, para evoluir sintetases para terem novas especificidades de substratos ou outras atividades de interesse). Por exemplo, a troca de ADN é utilizada opcionalmente para desenvolver novas 66 ΕΡ1794323Β1 enzimas e/ou vias de ditas enzimas, para a produção de aminoácidos não naturais (ou a produção de novas sintetases), in vitro ou in vivo. Veja-se, por exemplo, Stemmer (1994), Rapid evolution of a protein in vitro by DNA shuffling, Nature 370 (4): 389-391; e, Stemmer, (1994), DNA shuffling by random fragmentation and reassembly: In vitro recombination for molecular evolution, Proc. Natl. Acad. Sei. USA, 91: 10747-10751. Uma abordagem relacionada troca as familias de genes relacionados (por exemplo, homólogos) para evoluir rapidamente enzimas com as caracteristicas desejadas. Um exemplo de tais métodos de "troca de familias de genes" é encontrado em Crameri et al., (1998) "DNA shuffling of a family of genes from diverse species accelerates directed evolution. Nature, 391 (6664) : 288-291. Também podem ser geradas novas enzimas (quer componentes da via biossintética ou sintetases) usando um procedimento de recombinação de ADN conhecido como "truncamento incremental para a criação de enzimas híbridas" ("ITCHY"), por exemplo, tal como descrito em Ostermeier et al., (1999) "A combinatorial approach to hybrid enzymes independent of DNA homology" Nature Biotech 17: 1205. Esta abordagem também pode ser utilizada para gerar uma biblioteca de enzimas ou de outras variantes das vias, que podem atuar como substratos para um ou mais métodos de recombinação in vitro ou in vivo. Veja-se, também, Ostermeier et al., (1999) "Combinatorial protein engineering by incremental truncation", Proc. Natl. Acad. Sei. USA, 96: 3562-67, e Ostermeier et al., (1999), "Incremental truncation as a strategy in the engineering of novel biocatalysts", Biological and Medicinal Chemistry, 7: 2139-44. Outra abordagem utiliza mutagénese em conjunto exponencial para produzir bibliotecas de enzimas ou de outras variantes das vias, que são, por exemplo, selecionadas por uma capacidade para catalisar uma reação de biossíntese relevante para a produção de um aminoácido 67 ΕΡ1794323Β1 não natural (ou uma nova sintetase). Nesta abordagem, pequenos grupos de resíduos numa sequência de interesse são aleatorizados em paralelo, para identificar, em cada posição alterada, os aminoácidos que conduzem a proteínas funcionais. Os exemplos destes procedimentos, que podem ser adaptados à atual invenção para produzir novas enzimas para a produção de aminoácidos não naturais (ou de novas sintetases) são encontrados em Delegrave & Youvan (1993) Biotechnology Research 11: 1548-1552. Em ainda outra abordagem, pode ser usada mutagénese aleatória, ou semialeatória, usando oligonucleótidos dopados ou degenerados, para o desenho da enzima e/ou do componente da via, por exemplo, utilizando os métodos de mutagénese geral de, por exemplo, Arkin e Youvan (1992) "Optimizing nucleotide mixtures to encode specific subsets of amino acids for semi-random mutagenesis" Biotechnology, 10: 297-300; ou Reidhaar-Olson et al., (1991) "Random mutagenesis of protein sequences using oligonucleotide cassettes" Methods Enzymol. 208: 564-86. Ainda outra abordagem, denominada muitas vezes por mutagénese "não estocástica", que utiliza a remontagem do polinucleótido e a mutagénese de local saturado, pode ser utilizada para produzir enzimas e/ou componentes da via, que podem então ser rastreados para uma capacidade de executar uma ou mais sintetases ou função de via biossintética (por exemplo, para a produção de aminoácidos não naturais in vivo) . Veja-se, por exemplo, Short "Non-stochastic generation of genetic vaccines and enzymes" WO 00/46344.
Uma alternativa para estes métodos de mutação envolve a recombinação de genomas inteiros de organismos e a seleção da progenia resultante para determinadas funções da via (muitas vezes referida como "troca de todo o genoma"). Esta abordagem pode ser aplicada para a presente invenção, por exemplo, por recombinação genómica e seleção de um organismo (por exemplo, E. coli ou outra célula) para uma 68 ΕΡ1794323Β1 capacidade de produzir um aminoácido não natural (ou um intermediário do mesmo). Por exemplo, os métodos ensinados nas seguintes publicações podem ser aplicados com o desenho da via para a evolução de vias existentes e/ou novas em células, para a produção de amino ácidos não naturais in vivo: Patnaik et al., (2002) "Genome shuffling of lactobacillus for improved acid tolerance" Nature Biotechnology, 20 (7) : 707-712; e Zhang et al., (2002) "Genome shuffling leads to rapid phenotypic improvement in bactéria" Nature, 7 de fevereiro, 415 (6872): 644-646.
Estão também disponíveis outras técnicas para o desenho de organismo e de via metabólica, por exemplo, para a produção dos compostos desejados, e também podem ser aplicadas para a produção de aminoácidos não naturais. Os exemplos de publicações que ensinam abordagens úteis para o desenho de via incluem: Nakamura e White (2003) "Metabolic engineering for the microbial production of 1,3 propanediol" Curr. Opin. Biotechnol. 14 (5): 454-9; Berry et al., (2002) "Application of metabolic engineering to improve both the production and use of Biotech índigo" J. Industrial Microbiology and Biotchnology 28: 127-133; Banta et al., (2002) "Optimizing an artificial metabolic pathway: Engineering the cofactor specificity of Corynebacterium 2,5-diketo-D-gluconic acid reductase for use in vitamin C biosynthesis" Biochemistry, 41 (2U), 6226-36; Selivonova et al., (2001) "Rapid evolution of novel traits in microorganisms" Applied and Environmental Microbiology. 67: 3645, e muitas outras.
Independentemente do método utilizado, tipicamente, o aminoácido não natural produzido com uma via biossintética desenhada da invenção, é produzido numa concentração suficiente para a biossíntese eficiente de proteínas, por exemplo, uma quantidade celular natural, mas não a tal ponto de modo a afetar significativamente a concentração de outros aminoácidos celulares ou de esgotar os recursos 69 ΕΡ1794323Β1 celulares. As concentrações típicas produzidas in vivo deste modo são de cerca de 10 mM a cerca de 0,05 mM. Uma vez que uma célula é desenhada para produzir as enzimas desejadas para uma via específica, e um aminoácido não natural é gerado, in vivo, as seleções são opcionalmente utilizadas para otimizar ainda mais a produção do aminoácido não natural, tanto para a síntese proteica ribossómica como para o crescimento celular.
Componentes ortogonais para a incorporação de para-propargiloxifenilalanina (pPRO-Phe) A invenção proporciona composições e métodos de produção de componentes ortogonais para a incorporação de um aminoácido alquinilo, por exemplo, a para-propargiloxifenilanina (pPRO-Phe), numa cadeia polipeptídica em crescimento, em resposta a um codão seletor, por exemplo, um codão de terminação âmbar, um codão sem sentido, um codão de quatro ou mais bases, etc., por exemplo, in vivo. Por exemplo, a invenção proporciona tARN ortogonais (0-tARN), aminoacil-tARN sintetases ortogonais (0-RS) e pares dos mesmos. Estes pares podem ser utilizados para incorporar a pPRO-Phe em cadeias polipeptídicas em crescimento. A composição da invenção inclui uma aminoacil-tARN sintetase ortogonal (0-RS), em que a 0-RS aminoacila preferencialmente um 0-tARN com uma pPRO-Phe. Em certas realizações, a O-RS compreende uma sequência de aminoácidos que compreende as SEQ ID NO: 4, > co 10, 12, 14, 16 ou 18, ou uma variante conservadora das mesmas. Em certas realizações da invenção, a O-RS aminoacila preferencialmente o O-tARN sobre qualquer tARN endógeno com um aminoácido alquinilo, tal como a pPRO-Phe, em que a 0-RS tem uma tendência para o 0-tARN, e em que a razão de O-tARN carregado com pPRO-Phe para o tARN endógeno carregado com a pPRO-Phe é maior do que 1:1, e mais preferencialmente em que a O-RS carrega o O-tARN exclusivamente ou quase 70 ΕΡ1794323Β1 exclusivamente.
Uma composição que inclui uma O-RS pode opcionalmente incluir ainda um tARN ortogonal (O-tARN), em que o O-tARN reconhece um codão seletor. Tipicamente, um O-tARN da invenção inclui, pelo menos, cerca de, por exemplo, uma eficiência de supressão de 45 %, de 50 %, de 60 %, de 75 %, de 80 %, ou de 90 % ou mais, na presença de uma sintetase cognata, em resposta a um codão seletor, em comparação à eficiência da supressão de um O-tARN que compreende ou é codificado por uma sequência polinucleotídica tal como apresentada na listagem de sequências (por exemplo, SEQ ID NO: 1) e nos exemplos aqui apresentados. Numa realização, a eficácia de supressão da O-RS e do O-tARN em conjunto é, por exemplo, 5 vezes, 10 vezes, 15 vezes, 20 vezes, 25 vezes ou mais superior à eficácia de supressão do O-tARN na ausência de uma O-RS. Num aspeto, a eficiência da supressão da O-RS e do O-tARN em conjunto é, pelo menos, 45 % da eficácia de supressão de um par tirosil-tARN sintetase ortogonal derivado de Methanococcus jannaschii.
Uma composição que inclui um O-tARN pode opcionalmente incluir uma célula (por exemplo, uma célula eubacteriana, tal como uma célula de E. coli e outras semelhantes), e/ou um sistema de tradução. É também proporcionada pela invenção uma célula (por exemplo, uma célula eubacteriana) que compreende um sistema de tradução, em que o sistema de tradução inclui um tARN ortogonal (O-tARN); uma aminoacil-tARN sintetase ortogonal (O-RS); e, um aminoácido alquinilo, por exemplo, a para-propargiloxifenilalanina (pPRO-Phe). Normalmente, a O-RS aminoacila preferencialmente o O-tARN sobre qualquer tARN endógeno com um aminoácido alquinilo, tal como a pPRO-Phe, em que a O-RS tem uma tendência para o O-tARN, e em que a razão de O-tARN carregado com a pPRO-Phe para o tARN endógeno carregado com a pPRO-Phe é maior do que 1:1, e mais preferencialmente, em que a O-RS carrega o O-tARNt 71 ΕΡ1794323Β1 exclusivamente ou quase exclusivamente. 0 O-tARN reconhece o primeiro codão seletor, e a O-RS aminoacila preferencialmente o O-tARN com a pPRO-Phe. Numa realização, o O-tARN compreende ou é codificado por uma sequência polinucleotidica, conforme estabelecido na SEQ ID NO: 1, ou uma sequência polinucleotídica complementar da mesma. Numa realização, a O-RS compreende uma sequência de aminoácidos tal como estabelecida em qualquer uma das SEQ ID NO: 4, 6, 8, 10, 12, 14, 16 ou 18, ou uma variante conservadora das mesmas.
Uma célula da invenção pode compreender ainda, opcionalmente, um par adicional diferente de O-tARN / O-RS, e um segundo aminoácido não natural, por exemplo, em que este O-tARN reconhece um segundo codão seletor, e esta O-RS aminoacila preferencialmente o O-tARN correspondente com o segundo aminoácido não natural, em que o segundo aminoácido é diferente de pPRO-Phe. Opcionalmente, uma célula da invenção inclui um ácido nucleico que compreende um polinucleótido que codifica para um polipéptido de interesse, em que o polinucleótido compreende um codão seletor que é reconhecido pelo O-tARN.
Em certas realizações, uma célula da invenção é uma célula eubacteriana, tal como E. coli, que inclui um tARN ortogonal (O-tARN), uma aminoacil-tARN sintetase ortogonal (O-RS), um aminoácido alquinilo, tal como a pPRO-Phe, e um ácido nucleico que compreende um polinucleótido que codifica para um polipéptido de interesse, em que o polinucleótido compreende o codão seletor que é reconhecido pelo O-tARN. Em certas realizações da invenção, a O-RS aminoacila preferencialmente o O-tARN com uma eficiência que é maior do que a eficiência com que a O-RS aminoacila qualquer tARN endógeno.
Em certas realizações da invenção, um O-tARN da invenção compreende ou é codificado por uma sequência polinucleotídica, tal como apresentada na listagem de 72 ΕΡ1794323Β1 sequências (por exemplo, a SEQ ID NO: 1) ou nos exemplos aqui apresentados, ou uma sequência polinucleotidica complementar da mesma. Em certas realizações da invenção, uma O-RS compreende uma sequência de aminoácidos conforme estabelecida na listagem de sequências, ou uma variante conservadora da mesma. Numa realização, a O-RS, ou uma porção da mesma, é codificada por uma sequência polinucleotidica que codifica para um aminoácido, tal como estabelecido na listagem de sequências e nos exemplos aqui, ou uma sequência polinucleotídica complementar da mesma. 0 O-tARN e/ou a O-RS da invenção podem ser derivados a partir de qualquer um de uma variedade de organismos (por exemplo, organismos eucarióticos e/ou não eucarióticos).
Também são uma caracteristica da invenção os polinucleotidos. Um polinucleotido da invenção inclui um polinucleótido artificial (por exemplo, de origem humana, e não de ocorrência natural) que compreende uma sequência de nucleótidos que codifica para um polipéptido, conforme estabelecido na listagem de sequências neste documento, e/ou é complementar a essa sequência de polinucleótido. Um polinucleótido da invenção pode também incluir um ácido nucleico que híbrida com um polinucleótido descrito anteriormente, sob condições altamente rigorosas, ao longo de substancialmente todo o comprimento do ácido nucleico. Um polinucleótido da invenção também inclui um polinucleótido que é, por exemplo, pelo menos 75 %, pelo menos 80 %, pelo menos 90 %, pelo menos 95 %, pelo menos 98 % ou mais idêntico ao de um tARN que ocorre naturalmente ou ao ácido nucleico codificado correspondente (mas um polinucleótido da invenção é outro que não um tARN que ocorre naturalmente ou ácido nucleico codificado correspondente), em que o tARN reconhece um codão seletor, por exemplo, um codão de quatro bases. Os polinucleótidos artificiais que são, por exemplo, pelo menos 80 %, pelo menos 90 %, pelo menos 95 %, pelo menos 98 % ou mais, 73 ΕΡ1794323Β1 idênticos a qualquer um dos anteriores e/ou a um polinucleótido que compreende uma variação conservadora de qualquer um dos anteriores, estão também incluídos nos polinucleótidos da invenção.
Os vetores que compreendem um polinucleótido da invenção são também uma característica da invenção. Por exemplo, um vetor da invenção pode incluir um plasmídeo, um cosmídeo, um fago, um vírus, um vetor de expressão, e/ou semelhantes. Uma célula que compreende um vetor da invenção é também uma característica da invenção.
Os métodos para a produção de componentes de um par 0-tARN / 0-RS são também aqui descritos. Os componentes produzidos por estes métodos são também uma característica da invenção. Por exemplo, os métodos de produção de pelo menos um tARN que é ortogonal a uma célula (0-tARN) incluem a geração de uma biblioteca de tARN mutantes; a mutação de um laço anticodão de cada membro da biblioteca de tARN mutantes para permitir o reconhecimento de um codão seletor, proporcionando assim uma biblioteca de 0-tARN potenciais, e submetendo a seleção negativa uma primeira população de células de uma primeira espécie, em que as células compreendem um membro da biblioteca de 0-tARN potenciais. A seleção negativa elimina as células que compreendem um membro da biblioteca de 0-tARN potenciais que é aminoacilado por uma aminoacil-tARN sintetase (RS) que é endógena à célula. Isto proporciona um conjunto de tARN que são ortogonais à célula da primeira espécie, proporcionando deste modo pelo menos um 0-tARN. Também é proporcionado um 0-tARN produzido pelos métodos da invenção.
Em certas realizações, os métodos compreendem ainda sujeitar a seleção positiva uma segunda população de células da primeira espécie, em que as células compreendem um membro do conjunto de tARN que são ortogonais à célula da primeira espécie, uma aminoacil-tARN sintetase cognata, 74 ΕΡ1794323Β1 e um marcador de seleção positiva. Utilizando a seleção positiva, as células são selecionadas ou rastreadas para aquelas células que compreendem um membro do conjunto de tARN que é aminoacilado pela aminoacil-tARN sintetase cognata, e que apresenta uma resposta desejada na presença do marcador de seleção positiva, proporcionando, assim, um Ο-tARN. Em certas realizações, a segunda população de células compreende células que não foram eliminadas pela seleção negativa.
Também são fornecidos os métodos para a identificação de uma aminoacil-tARN sintetase ortogonal que carrega um 0-tARN com um aminoácido alquinilo. Por exemplo, os métodos incluem sujeitar uma população de células de uma primeira espécie a uma seleção, em que as células compreendem cada uma: 1) um membro de uma pluralidade de aminoacil-tARN-sintetases (RS) (por exemplo, a pluralidade de RS pode incluir RS mutantes, RS derivadas de uma espécie que não seja uma primeira espécie, ou ambas RS mutantes e RS derivadas de uma espécie que não seja uma primeira espécie); 2) o tARN ortogonal (Ο-tARN) (por exemplo, a partir de uma ou mais espécies); e 3) um polinucleótido que codifica para um marcador de seleção positiva e compreende pelo menos um codão seletor.
As células (por exemplo, uma célula hospedeira) são selecionadas ou rastreadas para aquelas que mostram uma melhoria na eficiência da supressão em comparação com as células sem ou com uma quantidade reduzida do membro da pluralidade de RS. Estas células selecionadas / rastreadas compreendem uma RS ativa que aminoacila o Ο-tARN. É também uma caracteristica da invenção uma aminoacil-tARN sintetase ortogonal identificada pelo método. São também uma caracteristica da invenção os métodos para a produção de uma proteína numa célula (por exemplo, numa célula eubacteriana, tal como uma célula de E. coli ou semelhantes) com para-propargiloxifenilalanina (pPRO-Phe) 75 ΕΡ1794323Β1 numa posição específica. Por exemplo, um método inclui crescer, num meio apropriado, uma célula, em que a célula compreende um ácido nucleico que compreende pelo menos um codão seletor e codifica para uma proteína, proporcionando pPR, e incorporando pPR na posição especificada na proteína durante a tradução do ácido nucleico com pelo menos um codão seletor, produzindo deste modo a proteína. A célula compreende ainda: um tARN ortogonal (O-tARN) que funciona na célula e reconhece o codão seletor; e, uma aminoacil-tARN sintetase ortogonal (O-RS) que aminoacila preferencialmente o Ο-tARN com pPRO-Phe. É também uma característica da invenção a proteína produzida por este método. A invenção também proporciona métodos para a produção de composições que incluem proteínas, em que as proteínas compreendem, por exemplo, pPRO-Phe tal como definido nas reivindicações. Em certas realizações, a proteína compreende uma sequência de aminoácidos que é pelo menos 75 % idêntica à de uma proteína conhecida, por exemplo, uma proteína terapêutica, uma proteína de diagnóstico, uma enzima industrial, ou uma porção da mesma. Opcionalmente, a composição compreende um transportador farmaceuticamente aceitável.
SEQUÊNCIA E VARIANTES DE ÁCIDOS NUCLEICOS E POLIPÉPTIDOS
Tal como descrito anteriormente e em seguida, a invenção refere-se a sequências de polinucleótidos que codificam para, por exemplo, Ο-tARN e O-RS, e sequências de aminoácidos de polipéptidos, por exemplo, O-RS, e, por exemplo, composições, sistemas e métodos que compreendem as sequências referidas. São aqui divulgados os exemplos das sequências referidas, por exemplo, sequências de aminoácidos e de nucleótidos de Ο-tARN e O-RS (veja-se a tabela 4, por exemplo, SEQ ID NO: 5, 7, 9, 11, 13, 15, 17 e 76 ΕΡ1794323Β1 19). No entanto, um perito na tecnologia irá apreciar que a invenção, tal como definida nas reivindicações, não está limitada a essas sequências aqui divulgadas, por exemplo, tal como nos exemplos e na listagem de sequências. Um perito irá apreciar que a invenção também fornece, por exemplo, muitas sequências relacionadas com as funções aqui descritas, por exemplo, codificando um O-tARN ou uma O-RS. A construção e a análise de espécies de O-RS que são capazes de aminoacilar o O-tARN com a pPRO-Phe é descrita no exemplo 1. Este exemplo descreve as oito espécies de 0-RS que foram isoladas (veja-se, figura 3 e exemplo 9) . Tal como pode ser visto a partir destas sequências de aminoácidos, são observadas tendências de consenso parciais nas substituições de aminoácidos nos oito clones de O-RS mutantes. Pelo menos dois dos seguintes aminoácidos foram encontrados no bolso de ligação em mais do que um clone: Ala32, Prol07 / Glnl07, Algal58, Ilel59, e Alal62 / Prol62 (veja-se, SEQ ID NO: 21). As mutações Tyr32 -> Ala32 e Aspl58 ->· Alal58 podem resultar na perda de ligações de hidrogénio entre Tyr32, Aspl58 e o substrato natural tirosina, desfavorecendo assim a sua ligação. A ocorrência de pequenas e principalmente cadeias laterais hidrofóbicas pode ser esperado para facilitar a ligação de pPRO-Phe. Estas tendências de consenso permitem a criação de espécies adicionais de O-RS que estão previstas funcionar num sistema ortogonal com o O-tARN de SEQ ID NO: 1, num sistema hospedeiro eubacteriano para incorporar a pPRO-Phe. Estas tendências de consenso podem ser expressas da seguinte forma: TABELA 1 77 ΕΡ1794323Β1
Posição de aminoácido Aminoácido de tirosil-tARN sintetase do tipo selvagem de Methanococcus jannaschii (SEQ ID NO: 2) pPRO-PheRS ortogonal consenso (SEQ ID NO: 21) 32 Tyr Ala 107 Glu Pro ou Gin 110 Leu Leu 158 Asp Ala 159 Ile Ile 162 Leu Ala ou Pro
Assim, com base nessas tendências de consenso, pelo menos quatro pPRO-Phe sintetases ortogonais adicionais (pPRO-PheRS-conl até pPR0-PheRS-con4) podem ser racionalmente projetadas que não estão representadas nas oito espécies de pPRO-PheRS identificadas experimentalmente (ou seja, pPRO-PheRS-Ι até pPRO-PheRS-8). Estas são como se segue: TABELA 2
Posição de aminoácido SEQ ID NO: Espécies de tirosil-tARN sintetase de Methanococcus jawiaschii 32 107 110 158 159 162 2 do tipo selvagem Tyr Glu Leu Asp Ile Leu 21 pPRO-PheRS consenso Ala Pro / Gin Leu Ala Ile Ala / Pro 22 pPRO-PheRS-conl Ala Pro Leu Ala Ile Ala 23 pPRO-PheRS-con2 Ala Pro Leu Ala Ile Pro 24 pPRO-PheRS-con3 Ala Gin Leu Ala Ile Ala 25 pPRO-PheRS-con4 Ala Gin Leu Ala Ile Pro A invenção fornece polipéptidos (O-RS) e 78 ΕΡ1794323Β1 polinucleótidos que codificam para as O-RS. Para além disso, os polinucleótidos da invenção incluem, por exemplo, um polinucleótido que compreende uma sequência de nucleótidos tal como apresentada nas SEQ ID NO: 5, 7, 9, 11, 13, 15, 17 ou 19; um polinucleótido que é complementar ou que codifica para uma sequência de polinucleótido do mesmo. Um polinucleótido da invenção também inclui qualquer polinucleótido que codifica para uma sequência de aminoácidos que compreende as SEQ ID NO: 4, 6, 8, 10, 12, 14, 16 ou 18. Um polinucleótido da invenção também inclui um polinucleótido que codifica para um polipéptido da invenção.
Em certas realizações, um vetor (por exemplo, um plasmideo, um cosmideo, um fago, um virus, etc.) compreende um polinucleótido da invenção. Numa realização, o vetor é um vetor de expressão. Numa outra realização, o vetor de expressão inclui um promotor operacionalmente ligado a um ou mais dos polinucleótidos da invenção. Numa outra realização, uma célula compreende um vetor que inclui um polinucleótido da invenção.
Um perito também apreciará que muitas variantes das sequências divulgadas estão incluídas na invenção. Por exemplo, as variações conservadoras das sequências divulgadas que originam uma sequência funcionalmente idêntica estão incluídas na invenção. As variantes das sequências polinucleotídicas de ácidos nucleicos, em que as variantes hibridam com pelo menos uma sequência divulgada, são consideradas estar incluídas na invenção. Sub-sequências únicas das sequências aqui divulgadas, tal como determinado por, por exemplo, técnicas de comparação de sequência padrão, também estão incluídas na invenção. Variações conservadoras
Devido à degenerescência do código genético, "substituições silenciosas" (ou seja, substituições numa sequência de ácido nucleico que não resultam numa alteração 79 ΕΡ1794323Β1 de um polipéptido codificado) são uma caracteristica implícita de qualquer sequência de ácido nucleico que codifica para uma sequência de aminoácidos. Do mesmo modo, "substituições de aminoácidos conservadoras", em que um ou um número limitado de aminoácidos numa sequência de aminoácidos são substituídos por diferentes aminoácidos com propriedades altamente semelhantes, são também facilmente identificadas como sendo altamente semelhantes a uma construção divulgada. Tais variações conservadoras de cada sequência divulgada são uma caracteristica da presente invenção.
As "variações conservadoras" de uma sequência de ácido nucleico particular referem-se àqueles ácidos nucleicos que codificam sequências de aminoácidos idênticas ou essencialmente idênticas, ou, quando o ácido nucleico não codifica para uma sequência de aminoácidos, a sequências essencialmente idênticas. Um perito reconhecerá que substituições individuais, deleções ou adições que alteram, adicionam ou apagam um único aminoácido ou uma pequena percentagem de aminoácidos (tipicamente menos de 5 %, mais tipicamente menos de 4 %, 2 % ou 1 %) , numa sequência codificada são "variações conservativamente modificadas" onde as alterações resultam na deleção de um aminoácido, a adição de um aminoácido, ou a substituição de um aminoácido por um aminoácido quimicamente similar. Assim, "variações conservadoras" de uma sequência polipeptídica listada da presente invenção incluem substituições de uma pequena percentagem, tipicamente menos de 5 %, mais tipicamente menos de 2 % ou 1 %, dos aminoácidos da sequência de polipéptido, com um aminoácido do mesmo grupo de substituição conservadora. Finalmente, a adição de sequências que não alteram a atividade codificada de uma molécula de ácido nucleico, tal como a adição de uma sequência não funcional, é uma variação conservadora do ácido nucleico de base. 80 ΕΡ1794323Β1
As tabelas de substituição conservadora que fornecem aminoácidos funcionalmente semelhantes são bem conhecidas na tecnologia, em que um resíduo de aminoácido é substituído por outro resíduo de aminoácido possuindo propriedades químicas semelhantes (por exemplo, cadeias laterais aromáticas ou cadeias laterais carregadas positivamente) e, portanto, não altera substancialmente as propriedades funcionais da molécula de polipéptido. 0 que se segue apresenta exemplos de grupos que contêm aminoácidos naturais de propriedades químicas semelhantes, onde as substituições dentro de um grupo é uma "substituição conservadora". TABELA 3
Cadeias laterais não polares e/ou alifáticas Cadeias laterais polares, sem carga Cadeias laterais aromáticas Cadeias laterais com carga positiva Cadeias laterais com carga negativa Glicina Serina Alanina Treonina Fenilalanina Lisina Valina Cisteína Tirosina Arginina Aspartato Leucina Metionina Triptofano Histidina Glutamato Isoleucina Asparagina Prolina Glutamina
Hibridação de ácido nucleico A hibridação comparativa pode ser utilizada para identificar os ácidos nucleicos da invenção, incluindo as variações conservadoras de ácidos nucleicos da invenção, e este método de hibridação comparativa é um método preferido para distinguir os ácidos nucleicos da invenção. Para além disso, os ácidos nucleicos alvo que hibridam com um ácido nucleico representado pela SEQ ID NO: 5, 7, 9, 11, 13, 15, 81 ΕΡ1794323Β1 17 e 19, sob condições de elevado e ultra elevado e ultra-ultra elevado rigor são uma característica da invenção. Os exemplos de tais ácidos nucleicos incluem aqueles com uma ou algumas substituições de ácido nucleico silenciosas ou conservadoras, em comparação com uma determinada sequência de ácido nucleico.
Um ácido nucleico de teste é dito hibridar especificamente com um ácido nucleico sonda quando ele híbrida pelo menos 50 % tão bem com a sonda como com o alvo complementar perfeitamente correspondente, isto é, com uma razão de sinal para ruído de, pelo menos, metade tão alta como a hibridação da sonda com o alvo, sob condições em que a sonda perfeitamente correspondente se liga ao alvo complementar perfeitamente correspondente com uma razão de sinal para ruído que é, pelo menos, cerca de 5x - lOx tão alta quanto a observada para a hibridação com qualquer um dos ácidos nucleicos alvo não correspondentes.
Os ácidos nucleicos "hibridam" quando se associam, geralmente em solução. Os ácidos nucleicos hibridam devido a uma variedade de forças fisico-químicas bem caracterizadas, tais como a ligação de hidrogénio, a exclusão do solvente, o empilhamento de bases e semelhantes. Um guia abrangente para a hibridação de ácidos nucleicos é encontrado em Tijssen (1993) Laboratory techniques in biochemistry and molecular biology hybridization with nucleic acid probes parte I, capítulo 2, "OverView of principies of hybridization and the strategy of nucleic acid probe assays", (Elsevier, Nova Iorque), bem como em Current protocols in molecular biology, Ausubel et al., eds., Current Protocols, uma publicação conjunta entre Greene Publishing Associates, Inc. e John Wiley & Sons, Inc., (suplementado em 2004) ("Ausubel"); Hames e Higgins (1995) Gene probes 1 IRL Press na Oxford University Press, Oxford, Inglaterra; (Hames e Higgins 1) e Hames e Higgins (1995) Gene probes 2 IRL Press na Oxford University Press, 82 ΕΡ1794323Β1
Oxford, Inglaterra (Hames e Higgins 2) proporcionam detalhes sobre a síntese, marcação, deteção e guantificação de ADN e ARN, incluindo oligonucleótidos.
Um exemplo de condições de hibridação rigorosas para a hibridação de ácidos nucleicos complementares, gue têm mais de 100 resíduos complementares, num filtro num Southern ou Northern blot é de 50 % de formalina com 1 mg de heparina a 42 °C, com a hibridação a ser realizada durante a noite. Um exemplo de condições de lavagem rigorosas é uma lavagem a 0,2x de SSC a 65 °C durante 15 minutos (veja-se, Sambrook, supra, para uma descrição do tampão de SSC). Muitas vezes, a lavagem de elevado rigor é precedida por uma lavagem de baixo rigor para remover o sinal de fundo da sonda. Um exemplo de lavagem de baixo rigor é 2x de SSC a 40 °C durante 15 minutos. De um modo geral, uma razão de sinal para ruído de 5x (ou mais elevada) do que a observada para uma sonda não relacionada no teste de hibridação particular, indica a deteção de uma hibridação específica.
As "condições de lavagem de hibridação rigorosas" no contexto de experiências de hibridização de ácidos nucleicos, tais como hibridações Southern e Northern são dependentes da sequência, e são diferentes em diferentes parâmetros ambientais. Um guia extenso para a hibridação de ácidos nucleicos encontra-se em Tijssen (1993), supra, e em Hames e Higgins, 1 e 2. As condições rigorosas de hibridação e lavagem podem ser facilmente determinadas empiricamente para qualquer ácido nucleico de teste. Por exemplo, para determinar as condições rigorosas de hibridação e lavagem, as condições de hibridação e lavagem são aumentadas gradualmente (por exemplo, aumentando a temperatura, diminuindo a concentração de sal, aumentando a concentração de detergente e/ou aumentando a concentração de solventes orgânicos, tais como a formalina, na hibridação ou na lavagem), até que se alcança um conjunto selecionado de critérios. Por exemplo, em condições 83 ΕΡ1794323Β1 altamente rigorosas de hibridação e lavagem, as condições de hibridação e de lavagem são aumentadas gradualmente até que uma sonda se liga a um alvo complementar perfeitamente correspondente, com uma razão de sinal para ruído que é pelo menos 5 vezes tão elevada quanto a observada para a hibridação da sonda com um alvo não correspondente.
As condições "muito rigorosas" são selecionadas para serem iguais ao ponto de fusão térmico (Tm) para uma sonda particular. A Tm é a temperatura (sob força iónica e pH definidos) à qual 50 % da sequência de teste híbrida com uma sonda perfeitamente correspondente. Para os fins da presente invenção, em geral, condições altamente rigorosas de hibridação e lavagem são selecionadas para serem cerca de 5 °C mais baixas do que a Tm para a sequência especifica, a uma força iónica e pH definidos.
As condições de "ultra elevado rigor" de hibridação e de lavagem são aquelas em que as condições de rigor de hibridação e de lavagem são aumentadas até que a razão de sinal para ruído para a ligação da sonda com o ácido nucleico alvo complementar perfeitamente correspondente é pelo menos lOx tão elevada como a observada para a hibridação a qualquer um dos ácidos nucleicos alvo não complementares. Um ácido nucleico alvo que híbrida com uma sonda sob estas condições, com uma razão de sinal para ruído de, pelo menos, 1/2 da do ácido nucleico alvo complementar perfeitamente correspondente, é dito ligar-se à sonda sob condições de ultra elevado rigor.
Do mesmo modo, mesmo os níveis mais elevados de rigor podem ser determinados aumentando gradualmente as condições de hibridação e/ou de lavagem do ensaio de hibridação correspondente. Por exemplo, aqueles em que as condições de rigor de hibridação e de lavagem são aumentadas até que a razão de sinal para ruído para a ligação da sonda com o ácido nucleico alvo complementar perfeitamente correspondente é pelo menos lOx, 20x, 50x, lOOx, ou 500x ou 84 ΕΡ1794323Β1 mais tão elevada como a observada para a hibridação a qualquer um dos ácidos nucleicos alvo não correspondentes. Um ácido nucleico alvo que hibrida com uma sonda sob estas condições, com uma razão de sinal para ruído de, pelo menos, 1/2 do que a do ácido nucleico alvo complementar perfeitamente correspondente, é dito ligar-se à sonda sob condições de ultra-ultra elevado rigor.
Os ácidos nucleicos que não hibridam um com o outro sob condições rigorosas, são ainda substancialmente idênticos, se os polipéptidos para os quais eles codificam forem substancialmente idênticos. Isto ocorre, por exemplo, quando uma cópia de um ácido nucleico é criada usando a degenerescência máxima de codão permitida pelo código genético.
Sub-sequências únicas
Um ácido nucleico pode compreender uma sub-sequência única num ácido nucleico selecionado de entre as sequências de O-tARN e O-RS aqui divulgadas. A sub-sequência única é única quando comparada com um ácido nucleico que corresponde a qualquer sequência de ácido nucleico conhecida de O-tARN ou O-RS. 0 alinhamento pode ser realizado utilizando, por exemplo, BLAST configurado para os parâmetros por defeito. Qualquer sub-sequência única é útil, por exemplo, como uma sonda para identificar os ácidos nucleicos da invenção.
Do mesmo modo, um polipéptido pode compreender uma sub-sequência única num polipéptido selecionado a partir das sequências de O-RS aqui descritas. Aqui, a sub-sequência única é única em relação a um polipéptido que corresponde a qualquer sequência de polipéptido conhecida.
Um ácido nucleico alvo pode hibridar sob condições rigorosas com um oligonucleótido de codificação único que codifica para uma sub-sequência única num polipéptido 85 ΕΡ1794323Β1 selecionado a partir das sequências de O-RS, em que a sub-sequência única é única em relação a um polipéptido que corresponde a qualquer um dos polipéptidos controlo (por exemplo, sequências parentais a partir das quais foram derivadas as sintetases da invenção, por exemplo, por mutação). As sequências únicas são determinadas como descrito anteriormente.
Comparação, identidade e homologia de sequência
Os termos "idêntico" ou "percentagem de identidade", no contexto de duas ou mais sequências de ácidos nucleicos ou de polipéptidos, referem-se a duas ou mais sequências ou sub-sequências que são iguais ou têm uma determinada percentagem de resíduos de aminoácidos ou de nucleótidos que são os mesmos, quando comparados e alinhados para a correspondência máxima, medida utilizando um dos algoritmos de comparação de sequências descritas em seguida (ou outros algoritmos disponíveis para pessoas com conhecimentos), ou por inspeção visual. A frase "substancialmente idêntica", no contexto de dois ácidos nucleicos ou polipéptidos (por exemplo, os ADN que codificam para um O-tARN ou O-RS, ou a sequência de aminoácidos de uma O-RS), refere-se a duas ou mais sequências ou sub-sequências que têm pelo menos cerca de 60 %, cerca de 80 %, cerca de 90 - 95 %, cerca de 98 %, cerca de 99 % ou mais, de identidade de resíduos de nucleótidos ou aminoácidos, quando comparadas e alinhadas para a correspondência máxima, medida utilizando um algoritmo de comparação de sequência ou por inspeção visual. Tais sequências "substancialmente idênticas" são tipicamente consideradas como "homólogas", sem referência a ascendência real. De preferência, a "identidade substancial" existe ao longo de uma região das sequências que tenha pelo menos cerca de 50 resíduos de comprimento, mais preferencialmente 86 ΕΡ1794323Β1 ao longo de uma região de pelo menos cerca de 100 resíduos, e mais preferencialmente, as seguências são substancialmente idênticas ao longo de pelo menos cerca de 150 resíduos, ou ao longo de todo o comprimento das duas sequências a serem comparadas.
As proteínas e/ou sequências de proteína são "homólogas" quando elas são derivadas, naturalmente ou artificialmente, de uma proteína ancestral comum ou sequência de proteína. Do mesmo modo, os ácidos nucleicos e/ou as sequências de ácidos nucleicos são homólogos, quando eles são derivados, naturalmente ou artificialmente, de um ácido nucleico ancestral comum, ou sequência de ácido nucleico. Por exemplo, qualquer ácido nucleico de ocorrência natural pode ser modificado por qualquer método de mutagénese disponível, para incluir um ou mais codões seletores. Quando expresso, este ácido nucleico mutado codifica para um polipéptido que compreende um ou mais aminoácidos não naturais, por exemplo, um aminoácido alquinilo. O processo de mutação pode, naturalmente, alterar adicionalmente um ou mais codões padrão, mudando, assim, também um ou mais aminoácidos padrão na proteína mutante resultante. A homologia geralmente é inferida a partir de semelhança de sequência entre dois ou mais ácidos nucleicos ou proteínas (ou sequências dos mesmos). A percentagem precisa de similaridade entre as sequências que são úteis para estabelecer homologia varia com o ácido nucleico e a proteína em questão, mas tão pouco quanto 25 % de semelhança de sequências é rotineiramente utilizada para estabelecer a homologia. Níveis mais elevados de similaridade de sequência, por exemplo, 30 %, 40 %, 50 %, 60 %, 70 %, 80 %, 90 %, 95 %, ou 99 % ou mais, podem também ser utilizados para estabelecer a homologia. Os métodos de determinação de percentagens de similaridade de sequência (por exemplo, BLASTP e BLASTN usando parâmetros padrão) são aqui descritos e estão geralmente disponíveis. 87 ΕΡ1794323Β1
Para a comparação de sequências e a determinação de homologia, tipicamente uma sequência atua como uma sequência de referência à qual as sequências de teste são comparadas. Quando se utiliza um algoritmo de comparação de sequências, as sequências teste e de referência são introduzidas num computador, são designadas coordenadas de subsequência, se necessário, e são designados os parâmetros do programa do algoritmo de sequência. 0 algoritmo de comparação de sequências calcula então a percentagem de identidade de sequência para a(s) sequência(s) de teste em relação à sequência de referência, com base nos parâmetros do programa designados. 0 alinhamento ótimo de sequências para comparação pode ser realizado, por exemplo, pelo algoritmo de homologia local de Smith e Waterman, Adv. Appl. Math. 2: 482 (1981), pelo algoritmo de alinhamento de homologia de Needlernan e Wunsch, J. Mol. Biol. 48: 443 (1970), pela pesquisa pelo método de similaridade de Pearson e Lipman, Proc. Natl. Acad. Sei. USA 85: 2444 (1988), por implementações computadorizadas destes algoritmos (GAP, BESTFTT, FASTA, e TFASTA no pacote de software Wisconsin Genetics, Genetics Computer Group, 575 Science Dr., Madison, WI), ou por inspeção visual (veja-se geralmente Current protocols in molecular biology, Ausubel et al., eds., Current Protocols, uma publicação conjunta entre Greene Publishing Associates, Inc. e John Wiley & Sons, Inc., suplementadas até 2004) .
Um exemplo de um algoritmo que é adequado para determinar a percentagem de identidade de sequência e semelhança de sequências é o algoritmo BLAST, que está descrito em Altschul et al., J. Mol. Biol. 215: 403-410 (1990) . O software para a realização de análises de BLAST está disponível ao público através do National Center for Biotchnology Information (www.ncbi.nlm.nih.gov/). Este algoritmo envolve primeiramente identificar os pares de sequências de pontuação elevada (HSP) por identificação de 88 ΕΡ1794323Β1 palavras curtas de comprimento W na sequência de busca, que quer correspondem ou satisfazem alguma pontuação limite de valor positivo T quando alinhadas com uma palavra do mesmo comprimento numa base de dados de sequência. T é referido como o limite de pontuação de palavra vizinha (Altschul et al., supra). Estes acertos iniciais de palavras vizinhas funcionam como sementes para iniciar buscas para encontrar HSP mais longas que as contenham. Os acertos de palavras são então estendidos em ambas as direções ao longo de cada sequência, tão longe quanto a pontuação de alinhamento cumulativo pode ser aumentada. As pontuações cumulativas são calculadas usando, para sequências de nucleótidos, os parâmetros M (pontuação de recompensa para um par de resíduos correspondentes; sempre >0) e N (pontuação de penalidade para resíduos que não emparelham; sempre < 0) . Para as sequências de aminoácidos, é utilizada uma matriz de classificação para calcular a pontuação cumulativa. A extensão dos acertos de palavras em cada direção são interrompidas quando: a pontuação cumulativa do alinhamento decai pela quantidade X do seu valor máximo alcançado; a pontuação cumulativa vai para zero ou abaixo, devido à acumulação de um ou mais alinhamentos de resíduos de pontuação negativa; ou a extremidade de qualquer sequência é atingida. Os parâmetros do algoritmo BLAST W, T, e X determinaram a sensibilidade e a velocidade do alinhamento. O programa BLASTN (para as sequências de nucleótidos) utiliza por defeito um comprimento de palavra (W) de 11, uma expectativa (E) de 10, um ponto de corte de 100, M = 5, N = -4, e uma comparação de ambas as cadeias. Para as sequências de aminoácidos, o programa BLASTP utiliza por defeito um comprimento de palavra (W) de 3, uma expectativa (E) de 10, e a matriz de pontuação BLOSUM62 (veja-se Henikoff & Henikoff (1989) Proc. Natl. Acad. Sei. USA 89: 10915).
Para além de calcular a percentagem de identidade de 89 ΕΡ1794323Β1 sequência, o algoritmo BLAST realiza também uma análise estatística da similaridade entre duas sequências (veja-se, por exemplo, Karlin & Altschul, Proc. Natl. Acad. Sei. USA 90: 5873-5787 (1993)). Uma medida da similaridade fornecida pelo algoritmo BLAST é a menor probabilidade de soma (P (N) ) , que proporciona uma indicação da probabilidade pela qual uma correspondência entre duas sequências de nucleótidos ou de aminoácidos ocorreria por acaso. Por exemplo, um ácido nucleico é considerado semelhante a uma sequência de referência se a probabilidade da menor soma numa comparação entre o ácido nucleico teste com o ácido nucleico de referência é menor do que cerca de 0,1, mais preferencialmente inferior a cerca de 0,01, e mais preferivelmente menos do que cerca de 0,001.
Mutagénese e outras técnicas de biologia molecular O polinucleótido e os polipéptidos da invenção e os utilizados na invenção podem ser manipulados utilizando técnicas de biologia molecular. Os textos gerais que descrevem técnicas de biologia molecular incluem Berger e Kimmel, Guide to molecular cloning techniques, Methods in enzymology, volume 152, Academic Press, Inc., São Diego, CA (Berger); Sambrook et al., Molecular cloning - A laboratory manual (3a ed.), volume 1-3, Cold Spring Harbor Laboratory, Cold Spring Harbor, Nova Iorque, 2001 ("Sambrook") e Current protocols in molecular biology, F. M. Ausubel et al., eds., Current Protocols, uma publicação conjunta entre Greene Publishing Associates, Inc. e John Wiley & Sons, Inc., (suplementada até 2004) ("Ausubel"). Estes textos descrevem a mutagénese, a utilização de vetores, promotores e muitos outros assuntos relevantes relacionados com, por exemplo, a geração de genes que incluem codões seletores para a produção de proteínas que incluem aminoácidos alquinilo (por exemplo, a pPRO-Phe), tARN ortogonais, 90 ΕΡ1794323Β1 sintetases ortogonais e pares dos mesmos. São usadas na invenção vários tipos de mutagénese, por exemplo, para mutar moléculas de tARN, para produzir bibliotecas de tARN, para produzir bibliotecas de sintetases, para introduzir codões seletores que codificam para um aminoácido alquinilo numa proteína ou num polipéptido de interesse. Estas incluem, mas não se limitam a, mutagénese dirigida ao local, mutagénese aleatória de local, recombinação homóloga, troca de ADN, ou outros métodos de mutagénese recursivos, construção quimérica, mutagénese utilizando moldes contendo uracilo, mutagénese dirigida por oligonucleótido, mutagénese de ADN modificado com fosforotioato, mutagénese usando ADN de cadeia dupla com falhas, ou semelhantes, ou qualquer combinação das mesmas. Os métodos adequados adicionais incluem reparação de desemparelhamento local, mutagénese usando estirpes hospedeiras deficientes em reparação, restrição - seleção e restrição - purificação, mutagénese de eliminação, mutagénese por síntese total de genes, reparação de quebra de cadeia dupla, e assim por diante. A mutagénese, por exemplo, envolvendo construções quiméricas, também está incluída na presente invenção. Numa realização, a mutagénese pode ser guiada por informação conhecida da molécula que ocorre naturalmente ou alterada ou da molécula que ocorre naturalmente mutada, por exemplo, sequência, comparações de sequências, propriedades físicas, estrutura cristalina ou semelhantes.
As células hospedeiras são geneticamente manipuladas (por exemplo, transformadas, transduzidas ou transfectadas) com os polinucleótidos da invenção, ou construções que incluem um polinucleótido da invenção, por exemplo, um vetor da invenção, que pode ser, por exemplo, um vetor de clonagem ou um vetor de expressão. Por exemplo, as regiões de codificação para o tARN ortogonal, a tARN sintetase ortogonal, e a proteína a ser derivada, estão ligadas 91 ΕΡ1794323Β1 operativamente a elementos de controlo da expressão de genes que são funcionais na célula hospedeira desejada. Os vetores típicos contêm terminadores de transcrição e de tradução, sequências de iniciação de transcrição e tradução, e promotores úteis para a regulação da expressão do ácido nucleico alvo particular. Os vetores compreendem opcionalmente cassetes de expressão genéricas que contêm pelo menos uma sequência de terminação independente, sequências que permitem a replicação da cassete em eucariotas, ou procariotas, ou ambos (por exemplo, vetores de troca), e marcadores de seleção tanto para sistemas procarióticos e eucarióticos. Os vetores são adequados para a replicação e/ou a integração em procariotas, eucariotas, ou de preferência ambos. Veja-se Giliman & Smith, Gene 8: 81 (1979); Roberts, et al., Nature, 328: 731 (1987); Schneider, B. et al., Protein Expr. Purif. 6435: 10 (1995); Ausubel, Sambrook, Berger (todos supra) . O vetor pode ser, por exemplo, sob a forma de um plasmídeo, uma bactéria, um vírus, um polinucleótido nu, ou um polinucleótido conjugado. Os vetores são introduzidos em células e/ou micro-organismos por métodos padrão, incluindo a electroporação (From et al., Proc. Natl. Acad. Sei. USA 82, 5824 (1985)), a infeção por vetores virais, a penetração balística de alta velocidade de partículas pequenas com o ácido nucleico, quer no interior da matriz de pequenas esferas ou partículas, ou na superfície (Klein et al., Nature 327, 70-73 (1987)), e/ou semelhantes. É fornecido um catálogo de bactérias e de bacteriófagos úteis para a clonagem, por exemplo, pela ATCC, por exemplo, The ATCC catalogue of bactéria and bacteriophage (1996) Ghema et al., (eds.) publicado pela ATCC. São também encontrados os procedimentos básicos adicionais para a sequenciação, a clonagem e outros aspetos da biologia molecular e considerações teóricas subjacentes em Sambrook (supra), Ausubel (supra), e em Watson et al., 92 ΕΡ1794323Β1 (1992) Recombinant DNA, segunda edição, Scientific American Books, NY. Para além disso, essencialmente qualquer ácido nucleico (e virtualmente qualquer ácido nucleico marcado, quer padrão ou não padrão) pode ser personalizado ou encomendado de forma padrão a partir de qualquer de uma variedade de fontes comerciais, tais como Midland Certified Reagent Company (Midland, TX mcrc.com), The Great American Gene Company (Ramona, CA disponível na internet em genco.com), ExpressGen Inc. (Chicago, IL disponível na internet em expressgen.com), Operon Technologies Inc. (Alameda, CA) e muitos outros.
As células hospedeiras manipuladas podem ser cultivadas em meios de nutrientes convencionais modificados conforme apropriado para atividades como, por exemplo, etapas de rastreio, ativação de promotores ou seleção de transformantes. Estas células podem ser opcionalmente cultivadas em organismos transgénicos. Outras referências úteis, por exemplo, para o isolamento de células e cultura (por exemplo, para posterior isolamento do ácido nucleico) incluem Freshney (1994) Culture of animal cells, a manual of basic technique, terceira edição, Wiley-Liss, Nova Iorque, e as referências aí citadas; Payne et al., (1992) Plant cell tissue culture em Liquid Systems, John Wiley & Sons, Inc., Nova Iorque, NY; Gamborg e Phillips (eds.) (1995) Plant cell, tissue and organ culture; Fundamental methods Springer Lab Manual, Springer-Verlag (Berlim, Heidelberg, Nova Iorque) e Atlas e Parks (eds.) The handbook of microbiological media (1993) CRC Press, Boca Raton, FL.
PROTEÍNAS E POLIPÉPTIDOS DE INTERESSE
Uma vantagem significativa dos aminoácidos alquinilo (mas não se limitando a) é que as proteínas que compreendem o aminoácido alquinilo podem ser utilizadas para reticular 93 ΕΡ1794323Β1 ou conjugar as proteínas com qualquer uma de uma variedade de moléculas pequenas, biomoléculas ou outras proteínas, etc. As proteínas ou os polipéptidos de interesse com pelo menos um aminoácido alquinilo são uma característica da invenção. A invenção também inclui polipéptidos ou proteínas com pelo menos um aminoácido alquinilo produzido usando as composições e métodos da invenção. Pode também estar presente com a proteína um excipiente (por exemplo, um excipiente farmaceuticamente aceitável).
Opcionalmente, uma proteína da invenção pode incluir uma modificação pós-tradução (para além da possível modificação posterior do resíduo de aminoácido alquinilo), numa posição de um único aminoácido ou várias posições, ou a proteína pode ter uma pluralidade de diferentes tipos de modificações.
Os métodos para a produção de uma proteína numa célula com um aminoácido alquinilo numa posição especifica, tal como definido nas reivindicações, são também uma característica da invenção. Por exemplo, um método inclui crescer, num meio apropriado, a célula, em que a célula compreende um ácido nucleico que compreende pelo menos um codão seletor e codifica para uma proteína; e, proporcionando o aminoácido alquinilo; em que a célula compreende adicionalmente: um tARN ortogonal (O-tARN) que funciona na célula e reconhece o codão seletor; e, uma aminoacil-tARN sintetase ortogonal (O-RS) que aminoacila preferencialmente o Ο-tARN com o aminoácido alquinilo.
Em certas realizações, a O-RS compreende uma tendência para a aminoacilação do Ο-tARN cognato sobre qualquer tARN endógeno num sistema de expressão. A razão relativa entre o Ο-tARN e o tARN endógeno que é carregada pela O-RS, quando o Ο-tARN e a O-RS estão presentes em concentrações molares iguais, é maior do que 1:1, de preferência pelo menos cerca de 2:1, mais de preferência de 5:1, ainda mais preferivelmente de 10:1, ainda mais preferivelmente de 94 ΕΡ1794323Β1 20:1, ainda mais preferivelmente de 50:1, ainda mais preferivelmente de 75:1, ainda mais preferivelmente de 95:1, 98:1, 99:1, 100:1, 500:1, 1000:1, 5000:1 ou superior. A invenção também proporciona métodos para a produção de composições que incluem proteínas, em que as proteínas compreendem um aminoácido alquinilo, tal como definido nas reivindicações. Em certas realizações, a proteína compreende uma sequência de aminoácidos que é pelo menos 75 % idêntica à de uma proteína terapêutica, uma proteína de diagnóstico, uma enzima industrial ou uma porção das mesmas.
As composições feitas pelos métodos da invenção são opcionalmente numa célula. Os pares O-tARN / O-RS ou os componentes individuais podem então ser utilizados na maquinaria de tradução de um sistema hospedeiro, o que resulta num aminoácido alquinilo a ser incorporado numa proteína. As publicações internacionais números WO 2004/094593, arquivada a 16 de abril de 2004, intitulada "Expanding the eukaryotic genetic code", e a WO 2002/085923, intitulada "In vivo incorporation of unnatural amino acids", descrevem este processo. Por exemplo, quando um par O-tARN / O-RS é introduzido num hospedeiro, por exemplo, uma célula de Escherichia coli, o par conduz à incorporação in vivo de um aminoácido alquinilo, tal como a para-propargiloxifenyilalanina, numa proteína em resposta a um codão seletor. A para-propargiloxifenilalanina que é adicionada ao sistema é um aminoácido de síntese, tal como um derivado de uma fenilalanina ou tirosina, que pode ser adicionado exogenamente ao meio de crescimento. Opcionalmente, as composições da presente invenção podem estar num sistema de tradução in vitro, ou num (nuns) sistema(s) in vivo.
Uma célula da invenção proporciona a capacidade de sintetizar proteínas que compreendem aminoácidos não naturais em grandes quantidades úteis. Num aspeto, a 95 ΕΡ1794323Β1 composição inclui, opcionalmente, por exemplo, pelo menos 10 microgramas, pelo menos 50 microgramas , pelo menos 75 microgramas, pelo menos 100 microgramas, pelo menos 200 microgramas, pelo menos 250 microgramas, pelo menos 500 microgramas, pelo menos 1 miligrama, pelo menos 10 miligramas ou mais, da proteína que compreende um aminoácido alquinilo, ou uma quantidade que pode ser conseguida com métodos in vivo de produção de proteína (são aqui proporcionados pormenores sobre a produção de proteína recombinante e purificação). Num outro aspeto, a proteína está opcionalmente presente na composição a uma concentração de, por exemplo, pelo menos 10 microgramas de proteína por litro, pelo menos 50 microgramas de proteína por litro, pelo menos 75 microgramas de proteína por litro, pelo menos 100 microgramas de proteína por litro, pelo menos 200 microgramas de proteína por litro, pelo menos 250 microgramas de proteína por litro, pelo menos 500 microgramas de proteína por litro, pelo menos 1 miligrama de proteína por litro, ou, pelo menos, 10 miligramas de proteína por litro ou mais, em, por exemplo, um lisado celular, um tampão, um tampão farmacêutico, ou outra suspensão líquida (por exemplo, num volume de, por exemplo, qualquer valor desde cerca de 1 nl a cerca de 100 1) . A produção de grandes quantidades (por exemplo, maior do que a que geralmente é possível com outros métodos, por exemplo, a tradução in vitro) de uma proteína numa célula incluindo pelo menos um aminoácido alquinilo é uma caracteristica da invenção. A incorporação de um aminoácido alquinilo pode ser feita, por exemplo, para ajustar mudanças na estrutura e/ou na função da proteína, por exemplo, para alterar o tamanho, a acidez, a nucleofilicidade, a ligação de hidrogénio, a hidrofobicidade, a acessibilidade a locais alvo da protease, direcionar a uma porção (por exemplo, para uma matriz de proteína), etc. As proteínas que incluem um 96 ΕΡ1794323Β1 aminoácido alquinilo podem ter melhores ou mesmo totalmente novas propriedades catalíticas ou físicas. Por exemplo, as propriedades que se seguem são modificadas opcionalmente por inserção de um aminoácido alquinilo numa proteína: toxicidade, biodistribuição, propriedades estruturais, propriedades espectroscópicas, propriedades químicas e/ou fotoquímicas, capacidade catalítica, meia-vida (por exemplo, meia-vida no soro), capacidade de reagir com outras moléculas, por exemplo, covalentemente ou não covalentemente, e semelhantes. As composições, incluindo as proteínas, que incluem pelo menos um aminoácido alquinilo são úteis para, por exemplo, novas terapêuticas, diagnóstico, enzimas catalíticas, enzimas industriais, proteínas de ligação (por exemplo, anticorpos) e, por exemplo, o estudo da estrutura e função das proteínas. Veja-se, por exemplo, Dougherty, (2000) Unnatural amino acids as probes of protein structure and function, Current Opinion in Chemical Biology, 4: 645-652.
Uma composição pode incluir pelo menos uma proteína com pelo menos um, por exemplo, pelo menos dois, pelo menos três, pelo menos quatro, pelo menos cinco, pelo menos seis, pelo menos sete, pelo menos oito, pelo menos nove, ou, pelo menos dez ou mais aminoácidos não naturais, por exemplo; aminoácidos alquinilo e/ou outros aminoácidos não naturais. Os aminoácidos não naturais podem ser o mesmo ou diferente, por exemplo, pode haver 1, 2, 3, 4, 5, 6, 7, 8, 9, ou 10 ou mais locais diferentes na proteína que compreende 1, 2, 3, 4, 5, 6, 7, 8, 9, ou 10 ou mais aminoácidos não naturais diferentes. Alternativamente, uma composição compreende uma proteína com pelo menos um, mas menos do que todos, de um determinado aminoácido presente na proteína é substituído com o aminoácido alquinilo. Para uma dada proteína, com mais do que um aminoácidos não naturais, os aminoácidos não naturais podem ser iguais ou diferentes (por exemplo, a proteína pode incluir dois ou mais tipos diferentes de 97 ΕΡ1794323Β1 aminoácidos não naturais, ou pode incluir dois do mesmo aminoácido não natural) . Para uma dada proteína, com mais do que dois aminoácidos não naturais, os aminoácidos não naturais podem ser iguais, diferentes ou uma combinação de um aminoácido não natural múltiplo do mesmo tipo com pelo menos um aminoácido não natural diferente.
Essencialmente, qualquer proteína (ou uma porção da mesma) que inclui um aminoácido alquinilo (e qualquer ácido nucleico codificante correspondente, por exemplo, que inclui um ou mais codões seletores) pode ser produzida usando as composições e os métodos aqui apresentados. Não é feita qualquer tentativa para identificar as centenas de milhares de proteínas conhecidas, qualquer uma das quais pode ser modificada para incluir um ou mais aminoácidos não naturais, por exemplo, adaptando quaisquer métodos disponíveis para mutação para incluir um ou mais codões seletores apropriados num sistema de tradução relevante. Os repositórios comuns de sequência de proteínas conhecidas incluem GenBank EMBL, DDBJ e o NCBI. Podem ser facilmente identificados outros repositórios através de pesquisa na internet.
Normalmente, as proteínas são, por exemplo, pelo menos 60 %, pelo menos 70 %, pelo menos 75 %, pelo menos 80 %, pelo menos 90 %, pelo menos 95 %, ou, pelo menos 99 % ou mais idênticas a qualquer proteína disponível (por exemplo, uma proteína terapêutica, uma proteína de diagnóstico, uma enzima industrial, ou uma porção da mesma, e semelhantes), e compreendem um ou mais aminoácidos não naturais. Os exemplos de proteínas terapêuticas, de diagnóstico, e outras que podem ser modificadas para compreender um ou mais
Aminoácido alquinilo podem ser encontrados, mas não estão limitados a, aqueles em publicações internacionais WO 2004/094593, arquivada a 16 de abril de 2004, intitulada "Expanding the eukaryotic genetic code", e WO 2002/085923, 98 ΕΡ1794323Β1 intitulada "In vivo incorporation of unnatural amino acids". Os exemplos de proteínas terapêuticas, de diagnóstico, e outras que podem ser modificadas para compreender um ou mais aminoácidos alquinilo incluem, mas não estão limitados a, por exemplo, alfa-1 antitripsina, angiostatina, fator antihemolítico, anticorpos (pormenores adicionais sobre os anticorpos encontram-se abaixo), apolipoproteína, apoproteína, fator natriurético atrial, polipéptido natriurético atrial, péptidos atriais, quimiocinas C-X-C (por exemplo, T39765, NAP-2, ENA-78, Gro-a, Gro-b, Gro-C, IP-10, GCP-2, NAP-4, SDF-1, PF 4, MIG), calcitonina, quimiocinas CC (por exemplo, proteína 1 quimioatractiva de monócitos, proteína 2 quimioatractiva de monócitos, proteína 3 quimioatractiva de monócitos, proteína 1 alfa inflamatória de monócitos, proteína 1 beta inflamatória de monócitos, RANTES, 1309, R83915, R91733, HCC1, T58847, D31065, T64262), ligando CD40, ligando C-kit, colageno, fator estimulante de colónias (CSF), fator 5a de complemento, inibidor do complemento, recetor 1 do complemento, citocinas, (por exemplo, péptido 78 ativador de neutrófilos epiteliais, GROa/MGSA, GROP, GROy, MIP-lOC, ΜΙΡ-ΐδ, MCP-1), fator de crescimento epidérmico (EGF), eritropoietina ("EPO"), toxinas A e B esfoliantes, fator IX, fator VII, fator VIII, fator X, fator de crescimento fibroblástico (FGF), fibrinogénio, fibronectina, G-CSF, GM-CSF, glucocerebrosidase, gonadotrofina, fatores de crescimento, proteínas Hedgehog (por exemplo, Sonic, Indian, Desert), hemoglobina, fator de crescimento de hepatócitos (HGF), hirudina, albumina sérica humana, insulina, fator de crescimento semelhante a insulina (IGF), interferóes (por exemplo, IFN-a, IFN-β, IFN-γ) , interleucinas (por exemplo, IL-1, IL-2, IL-3, IL-4, IL-5, IL-6, IL-7, IL-8, IL-9, IL-10, IL-11, IL-12, etc.), fator de crescimento de queratinócitos (KGF), lactoferrina, fator inibidor de leucemia, luciferase, neurturina, fator 99 ΕΡ1794323Β1 inibitório de neutrófilos (NIF), oncoestatina M, proteína osteogénica, hormona da paratiroide, PD-ECSF, PDGF, hormonas peptídicas (por exemplo, hormona de crescimento humano), pleiotropina, proteína A, proteína G, exotoxinas pirogénicas A, B, e C, relaxina, renina, SCF, recetor I de complemento solúvel, I-CAM 1 solúvel, recetores de interleucina solúvel (IL-1, 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 14, 15) , recetor de TNF solúvel, somatomedina, somatostatina, somatotropina, estreptoquinase, superantígenos, ou seja, enterotoxinas estafilocócicas (SEA, SEB, SEC1, SEC2, SEC3, SED, SEE), superóxido dismutase (SOD), toxina do síndrome de choque tóxico (TSST-1), timosina alfa 1, ativador do plasminogénio tecidual, fator beta de necrose tumoral (TNF beta) , recetor do fator de necrose tumoral (TNFR) , fator alfa de necrose tumoral (TNF alfa), fator de crescimento endotelial vascular (VEGEF), urocinase e muitos outros.
Uma classe de proteínas que podem ser feitas usando as composições e métodos para a incorporação in vivo de aminoácidos alquinilo aqui descritos, inclui os moduladores da transcrição ou uma porção dos mesmos. Os exemplos de moduladores de transcrição incluem os genes e as proteínas moduladoras de transcrição que modulam o crescimento celular, diferenciação, regulação, ou semelhantes. Os moduladores de transcrição são encontrados em procariotas, vírus e eucariotas, incluindo fungos, plantas, leveduras, insetos e animais, incluindo mamíferos, proporcionando uma ampla gama de alvos terapêuticos. Será apreciado que os ativadores de expressão e de transcrição regulam a transcrição por muitos mecanismos, por exemplo, por ligação a recetores, estimulando uma cascata de transdução de sinal, regulando a expressão de fatores de transcrição, por ligação a promotores e potenciadores, por ligação às proteínas que se ligam a promotores e potenciadores, por desenrolamento de ADN, por excisão de pre-mARN, por 100 ΕΡ1794323Β1 poliadenilação de ARN, e por degradação de ARN.
Uma classe de proteínas (por exemplo, proteínas com um ou mais aminoácidos alquinilo) incluem proteínas biologicamente ativas, tais como as citocinas, as moléculas inflamatórias, os fatores de crescimento, os seus recetores, e produtos de oncogenes, por exemplo, interleucinas (por exemplo, IL-1, IL-2, IL-8, etc.) / interferões, FGF, IGF-I, IGF-II, FGF, PDGF, TNF, TGF-a, TGF-β, EGF, KGF, SCF / c-Kit, CD40L / CD40, VLA-4 / VCAM-1, ICAM-1 / LFA-1, e hialurina / CD44; moléculas de transdução de sinal e os produtos de oncogenes correspondentes, por exemplo, Mos, Ras, Raf e Met; e ativadores e supressores da transcrição, por exemplo, p53, Tat, Fos, Myc, Jun, Myb, Rei, e recetores de hormonas esteroides, tais como os de estrogénio, progesterona, testosterona, aldosterona, o ligando do recetor LDL e a corticosterona.
As enzimas (por exemplo, as enzimas industriais) ou porções das mesmas, podem incluir, pelo menos, um aminoácido alquinilo. Os exemplos de enzimas incluem, mas não estão limitados a, por exemplo, arnidases, racemases de aminoácidos, acilases, dehalogenases, dioxigenases, peroxidases de diarilpropano, epimerases, hidrolases de epóxido, esterases, isomerases, quinases, glucose isomerases, glicosidases, glicosil transferases, haloperoxidases, monooxigenases (por exemplo, p450), lipases, peroxidases de lenhina, hidratases de nitrilo, nitrilases, proteases, fosfatases, subtilisinas, transaminase e nucleases.
Muitas destas proteínas estão disponíveis comercialmente (veja-se, por exemplo, o catálogo e a lista de preços de 2002 da Sigma Biosciences), e são bem conhecidas as sequências e genes correspondentes de proteínas e, normalmente, muitas variantes das mesmas, (veja-se, por exemplo, Genbank) . Qualquer uma delas pode ser modificada pela inserção de um ou mais aminoácido 101 ΕΡ1794323Β1 alquinilo de acordo com a invenção, por exemplo, para alterar a proteína em relação a uma ou mais propriedades terapêuticas, de diagnóstico ou enzimáticos de interesse. Os exemplos de propriedades terapeuticamente relevantes incluem a semivida no soro, a semivida de prateleira, a estabilidade, a imunogenicidade, a atividade terapêutica, a detetabilidade (por exemplo, pela inclusão de grupos repórter (por exemplo, marcadores ou locais de ligação de marcadores) nos aminoácidos não naturais, por exemplo, aminoácidos alquinilo), redução de LD50 ou outros efeitos secundários, capacidade de entrar no corpo através do trato gástrico (por exemplo, disponibilidade oral), ou outros semelhantes. Os exemplos de propriedades de diagnóstico incluem a meia-vida de prateleira, a estabilidade, a atividade de diagnóstico, a detetabilidade, ou semelhantes. Os exemplos de propriedades enzimáticas relevantes incluem a meia-vida de prateleira, a estabilidade, a atividade enzimática, a capacidade de produção, ou semelhantes.
Uma variedade de outras proteínas pode também ser modificada para incluir um ou mais aminoácido alquinilo utilizando células eubacterianas e métodos da invenção, tal como definido nas reivindicações. Por exemplo, substituindo um ou mais aminoácidos naturais em uma ou mais proteínas de vacina com um aminoácido alquinilo, por exemplo, nas proteínas de fungos infeciosos, por exemplo, espécies de Aspergillus, Candida; bactérias, particularmente E. coli, que serve de modelo para as bactérias patogénicas, assim como bactérias medicamente importantes tais como Staphylococci (por exemplo, aureus) ou Streptococci (por exemplo, pneumoniae); protozoários tais como esporozoa (por exemplo, Plasmodia), rizopodes (por exemplo, Entamoeba) e flagelados (Trypanosoma, Leishmania, Trichomonas, Giardia, etc.); vírus tais como vírus ( + ) de ARN (os exemplos incluem os poxvírus, por exemplo, vaccinia; picornavírus, por exemplo, polio; togavírus, por exemplo, rubéola; 102 ΕΡ1794323Β1 flavivírus, por exemplo, HCV, e coronavírus), vírus (-) de ARN (por exemplo, rabdovírus, por exemplo, VSV; paramixovimses, por exemplo, RSV; ortomixovimses, por exemplo, influenza; buniavírus; e arenavírus), vírus dsADN (por exemplo, reovírus) , vírus de ARN para ADN, isto é, retrovírus, por exemplo, VIH e HTLV, e determinados vírus de ADN para ARN, tais como a hepatite B.
As proteínas relacionadas com agricultura, tais como as proteínas de resistência a insetos (por exemplo, as proteínas Cry), enzimas de produção de amido e lípidos, toxinas de plantas e de insetos, proteínas de resistência à toxina, proteínas de desintoxicação de micotoxinas, enzimas de crescimento de plantas (por exemplo, ribulose 1,5-bisfosfato carboxilase / oxigenase, "RUBISCO"), lipoxigenase (LOX) e fosfoenolpiruvato (PEP) carboxilase, são também alvos adequados para a modificação de aminoácido alquinilo. A proteína ou o polipéptido de interesse (ou uma porção do mesmo) nos métodos e/ou composições da invenção é codificada por um ácido nucleico. Tipicamente, o ácido nucleico compreende pelo menos um codão seletor, pelo menos dois codões seletores, pelo menos três codões seletores, pelo menos quatro codões seletores, pelo menos cinco codões seletores, pelo menos seis codões seletores, pelo menos sete codões seletores, pelo menos oito codões seletores, pelo menos nove codões seletores, dez ou mais codões seletores.
Os genes que codificam para as proteínas ou polipéptidos de interesse podem ser mutados, utilizando métodos bem conhecidos para um perito na tecnologia, e aqui descritos em "Mutagénese e outras técnicas de biologia molecular", para incluir, por exemplo, um ou mais codões seletores para a incorporação de um aminoácido alquinilo. Por exemplo, um ácido nucleico para uma proteína de interesse é mutado para incluir um ou mais codões 103 ΕΡ1794323Β1 seletores, proporcionando a inserção de um ou mais aminoácidos alquinilo. A invenção inclui qualquer variante, por exemplo, mutante, versões de qualquer proteína, por exemplo, incluindo pelo menos um aminoácido alquinilo. Da mesma forma, a invenção também inclui os ácidos nucleicos correspondentes, ou seja, qualquer ácido nucleico com um ou mais codões seletores que codifica para um ou mais aminoácidos alquinilo.
Para fazer uma proteína que inclui um aminoácido alquinilo, pode-se utilizar células hospedeiras e organismos que são adaptados para a incorporação in vivo do aminoácido alquinilo através de pares tARN / RS ortogonais. As células hospedeiras são geneticamente manipuladas (por exemplo, transformadas, transduzidas ou transfectadas) com um ou mais vetores que expressam o tARN ortogonal, a tARN sintetase ortogonal, e um vetor que codifica para a proteína a ser derivada. Cada um destes componentes pode estar no mesmo vetor, ou cada um deles pode estar num vetor separado, ou dois componentes podem estar num vetor e o terceiro componente num segundo vetor. 0 vetor pode estar, por exemplo, sob a forma de um plasmídeo, uma bactéria, um vírus, um polinucleótido nu ou um polinucleótido conjugado.
Definição de polipéptidos por imunoreatividade
Os polipéptidos aqui descritos fornecem uma variedade de novas sequências de polipéptidos (por exemplo, polipéptidos que compreendem aminoácidos alquinilo, no caso de proteínas sintetizadas nos sistemas de tradução deste documento, ou, por exemplo, no caso de sintetases novas, sequências novas de aminoácidos padrão), os polipéptidos também proporcionam novas características estruturais que podem ser reconhecidas, por exemplo, em ensaios imunológicos. Podem ser produzidos antissoros, os quais se ligam especificamente aos polipéptidos aqui descritos. 0 104 ΕΡ1794323Β1 termo "anticorpo", tal como aqui utilizado, inclui, mas não está limitado a, um polipéptido substancialmente codificado por um gene de imunoglobulina ou genes de imunoglobulina, ou fragmentos dos mesmos, que se ligam e reconhecem especificamente um analito (antigénio). Os exemplos incluem anticorpos policlonais, monoclonais, quiméricos, e anticorpos de cadeia simples, e semelhantes. Os fragmentos de imunoglobulinas, incluindo os fragmentos Fab e os fragmentos produzidos por uma biblioteca de expressão, incluindo a exibição do fago, estão também incluídos no termo "anticorpo", tal como aqui utilizado. Veja-se, por exemplo, Paul, Fundamental Immunology, 4a ed., 1999, Raven Press, Nova Iorque, para a estrutura e terminologia do anticorpo.
De modo a produzir antissoros para utilizar num imunoensaio, é produzido e purificado um ou mais dos polipéptidos imunogénicos tal como aqui descrito. Por exemplo, a proteína recombinante pode ser produzida numa célula recombinante. Uma estirpe consanguínea de ratinhos (utilizada neste ensaio porque os resultados são mais reprodutíveis devido à identidade genética virtual dos ratinhos) é imunizada com a(s) proteína (s) imunogénica (s) em combinação com um adjuvante padrão, tal como o adjuvante de Freund, e um protocolo de imunização padrão em ratinho (veja-se, por exemplo, Harlow e Lane (1988), Antibodies, a laboratory manual, Cold Spring Harbor Publications, Nova Iorque, para uma descrição padrão de geração de anticorpos, os formatos e as condições de imunoensaio que podem ser usados para determinar a imunorreatividade específica. Os detalhes adicionais em proteínas, anticorpos, antissoros, etc., podem ser encontrados nas publicações internacionais números WO 2004/094593, intitulada "Expanding the eukaryotic genetic code"; WO 2002/085923, intitulada "In vivo incorporation of unnatural amino acids"; WO 2004/035605, intitulada "Glycoprotein synthesis"; e WO 105 ΕΡ1794323Β1 2004/058946, intitulada "Protein arrays".
USO DE O-tARN E DE O-RS E DE PARES O-tARN / O-RS
As composições feitas pelos métodos da invenção estão opcionalmente numa célula. Os pares O-tARN / O-RS ou os componentes individuais aqui descritos podem ser utilizados na maquinaria de tradução de um sistema hospedeiro, o que resulta em um aminoácido alquinilo a ser incorporado numa proteína. A publicação internacional número WO 2002/085923 por Schultz, et al., intitulada "In vivo incorporation of unnatural amino acids" descreve este processo. Por exemplo, quando um par O-tARN / O-RS é introduzido num hospedeiro, por exemplo, Escherichia coli, o par conduz à incorporação in vivo de um aminoácido alquinilo, que pode ser adicionado exoqenamente ao meio de crescimento, numa proteína, por exemplo, uma proteína mioglobina de teste ou uma proteína terapêutica, em resposta a um codão seletor, por exemplo, um codão sem sentido âmbar. Opcionalmente, as composições da invenção podem estar num sistema de tradução in vitro, ou num (nuns) sistema (s) celular (es) in vivo. As proteínas com o aminoácido alquinilo podem ser usadas em qualquer uma de uma vasta gama de aplicações. Mais concretamente, a porção alquinilo incorporada numa proteína pode servir como um alvo para qualquer uma de uma ampla gama de modificações, por exemplo, reticulação com outras proteínas, com pequenas moléculas, tais como marcadores ou corantes e/ou biomoléculas. Com estas modificações, a incorporação do aminoácido alquinilo pode resultar em proteínas terapêuticas melhoradas, e podem ser utilizadas para modificar ou melhorar a função catalítica de enzimas. Em alguns aspetos, a incorporação e alteração subsequente de um aminoácido alquinilo numa proteína pode facilitar estudos sobre a estrutura da proteína, as interações com outras proteínas, e outros semelhantes. 106 ΕΡ1794323Β1
KITS São aqui divulgados kits. Por exemplo, um kit para a produção de uma proteina que compreende pelo menos um aminoácido alquinilo numa célula, em que o kit inclui um recipiente que contém uma sequência de polinucleótido que codifica para um O-tARN, e/ou um O-tARN, e/ou uma sequência de polinucleótido que codifica para uma O-RS, e/ou uma 0-RS. Numa realização, o kit inclui ainda um aminoácido alquinilo tal como a para-propargiloxifenilalanina. Numa outra realização, o kit compreende ainda materiais de instrução para produzir a proteina.
EXEMPLOS
Os exemplos que se seguem são oferecidos para ilustrar, mas não para limitar a invenção reivindicada. EXEMPLO 1
Evolução de um par tARN ortogonal / sintetase para a incorporação de um aminoácido alquinilo em proteínas em E. coli
Ao evoluir a especificidade de pares tARN ortogonais -sintetase, incorporámos seletivamente e eficientemente um número de aminoácidos não naturais em proteínas, em resposta a codões sem sentido e de desvio de enquadramento, em ambos os procariotas e os eucariotas (Anderson et al., (2004) Proc. Natl. Acad. Sei. U.S.A., 101: 7566; Alfonta et al., (2003) J. Am. Chem. Soc ., 125: 14662; Wang (D Γ+ 0) 1—1 > (2003) i Proc. Natl. Acad. Sei . U.S.A., 100 : 56; Chin et al., (2003) Science 301: 964 ; Chin et al., (2002 ) Proc. Natl. Acad. Sei. U.S.A., 99: 11020, e Wang et al. , (2001)
Science 292: 498). A presente invenção proporciona composições e métodos para a incorporação de biossíntese de aminoácidos reativos contendo uma porção alquinilo em 107 ΕΡ1794323Β1 proteínas, utilizando a maquinaria de tradução de E. coli. A biossíntese utilizando componentes de tradução de E. coli pode ocorrer in vivo (por exemplo, na célula de E. coli) , ou in vitro utilizando extratos celulares brutos ou componentes de tradução purificados. 0 grupo alquinilo que é incorporado em proteínas é rapidamente e especificamente conjugado com porções contendo azido, proporcionando assim um alvo útil para a modificação / manipulação de proteínas. A química de grupos alquinilo e azido (tal como mostrado na figura 1B) é completamente ortogonal às químicas de todos os grupos funcionais endógenos presentes nas proteínas. Um exemplo da sua reatividade única é a formação irreversível de triazóis por uma cicloadição [3+2] (veja-se, figura 1B; e Padwa, em Comprehensive Organic Synthesis; [Trost, B. M. ed.] Pergamon: Oxford, 1991, vol. 4, p. 1069; Huisgen, em 1,3-Dipolar Cycloaddizion Chemistry, [Padwa, A., ed.] Wiley: Nova Iorque, 1984, p. 1) . Quando esta reação é realizada na presença de cobre (I) , à temperatura ambiente, em meio aquoso (condições suaves o suficiente para modificar amostras biológicas), procede de uma forma completamente regio-seletiva (Rostovtsev et al., (2002) Angew. Chem. Int. Ed., 41: 2596) , e pode ser utilizada para modificar seletivamente as proteínas nas quais foram introduzidos os grupos funcionais azido e alquinilo (Deiters et al., (2003) : J. Am. Chem. Soc., 125: 11782; Wang et al. , (2003) J. Am. Chem. Soc., 125.: 3192; Link e Tirrell (2003) J. Am. Chem. Soc., 125: 11164). A invenção aqui descrita proporciona pares tARN ortogonal / tARN - sintetase derivados de componentes de Methanococcus jannaschii, que incorporam seletivamente o aminoácido alquinilo para-propargiloxifenilalanina (abreviado pPRO-Phe; também conhecido como ácido 2-amino-3-[ 4-(prop-2-iniloxi) fenil] propiónico de acordo com a nomenclatura IUPAC; estrutura mostrada na figura IA, e é 108 ΕΡ1794323Β1 atribuída a designação de estrutura química 1) num sistema hospedeiro de E. coli. 0 presente estudo demonstra que pPRO-Phe é incorporado seletivamente em proteínas expressas em E. coli, utilizando os novos reagentes tARN ortogonal e tARN sintetase aqui proporcionados.
Relatamos aqui a evolução de um par tARN ortogonal -sintetase derivado de um par tirosil tARN de M. jannaschii / tARN - sintetase (MjTyrRS/tARNCuA) , em que o par ortogonal não tem afinidade ou tem afinidade muito baixa para nenhum dos aminoácidos comuns (isto é, que ocorrem naturalmente). 0 tARN ortogonal sintetase derivado carrega seletivamente o supressor âmbar TARNcija com pPRO-Phe, e, para além disso, o tARN aminoacilado supressor (isto é, o tARN "carregado") é utilizado como um substrato pela maquinaria de tradução endógena de E. coli para incorporar pPRO-Phe, em resposta a um codão de terminação âmbar TAG (um codão seletor) encontrado num transcripto. A ortogonalidade (Steer e Schimmel (1999) Biol. Chem., 274: 35601) deste par tARN / sintetase garante que nem o tARN nem a sintetase reagem de forma cruzada com os tARN ou sintetases endógenas de E. coli, e que o aminoácido não natural é entregue apenas em resposta a um codão âmbar sem sentido, TAG.
Foi gerada uma biblioteca de ~ 107 diferentes tirosil tARN de M. jannaschii - sintetases, por mutagénese da tirosil tARN de M. jannaschii - sintetase do tipo selvagem. Para criar a biblioteca de MjTyrRS, as cinco posições direcionadas para a mutação foram primeiramente convertidas para codões de alanina. O gene MjTyrRS foi expresso sob o controlo do promotor e terminador GInRS de E. coli no plasmídeo pBK-JYRS, um plasmídeo derivado de pBR322 com resistência à canamicina. Para se obter o plasmídeo pBK-JYA5, os resíduos de Tyr32, Glu107, Asp158, Ile159, e Leu162 foram substituídos por Ala por mutagénese dirigida ao local. Foram usados oito oligonucleótidos com NNK (N = A + T + G + C, e K = G + T) nos locais de mutação para a 109 ΕΡ1794323Β1 amplificação por PCR do mutante Ala5 MjTyrRS (pBK-JYA5), e ligados de novo ao pBK-JYA5 digerido em Nde I - Pst I, para gerar a biblioteca de MjTyrRS. Os vetores ligados foram transformados em células DH10B competentes de E. coli para produzir uma biblioteca de 1,6 x -109 unidades formadoras de colónias.
As sequências polinucleotidicas e de aminoácidos da molécula tirosil tARN de M. jannaschii - sintetase do tipo selvagem são mostradas na figura 2, e são também fornecidas nas SEQ ID NOS: 3 e 2, respetivamente. A mutagénese consistiu em aleatorizar cinco resíduos de locais ativos (Tyr32, Glul07, Aspl58, Ilel59, e Leul62), com base numa estrutura de cristal homóloga da tirosil tARN - sintetase de Bacillus stearothermophilus. A seguir à mutagénese, o conjunto de sintetases foi então passado através de rondas de seleção positivas e negativas. A seleção positiva é baseada na supressão de um codão de terminação âmbar num local permissivo (Aspll2) no gene de cloranfenicol acetiltransferase (CAT). Quando células de E. coli portadoras da biblioteca mutante de MjTyrRS, foram cultivados em meio mínimo na presença de pPRO-Phe (1 mM) e de cloranf enicol (80 pg/ml) o gene CAT mutado e um supressor âmbar tARNCUA coexpresso de Mj, as únicas células sobreviventes são aquelas células que contêm uma sintetase mutante que aminoacila o TARNCua quer com um aminoácido endógeno ou com pPRO-Phe. Os genes sintetase da biblioteca foram então transformados em células que contêm um gene mutado que codifica para a proteína barnase tóxica, que tem três mutações de âmbar em locais permissivos (Gln2, Asp44, Gly65). O vetor que transporta o repórter da barnase também contém o tARN supressor. O crescimento destas células na ausência de pPRO-Phe selecionou contra sintetases capazes de aceitar aminoácidos endógenos como um substrato. Após três rondas de seleção, foram pesquisados 96 clones para a dependência da taxa de crescimento na 110 ΕΡ1794323Β1 presença ou na ausência de pPRO-Phe, e foram identificados oito clones candidatos, e sequenciados. As substituições de aminoácidos observadas nestes clones são mostradas na figura 3. As sequências de polinucleótidos e de aminoácidos dos oito clones também é fornecida nas SEQ ID NOS: 4 até 19. São observadas tendências consenso nas substituições de aminoácidos nos oito clones O-RS mutantes. Foi encontrada uma preponderância dos aminoácidos que se seguem no bolso de ligação da maioria dos clones: Ala32, Prol07 / Glnl07, Alal58, Ilel59, e Alal62 / Prol62. As mutações Tyr32 ->· Ala32 e Aspl58 -► 7Alal58 podem resultar na perda de ligações de hidrogénio entre Tyr32, Aspl58 e o substrato natural tirosima, desfavorecendo assim a sua ligação. Pode ser esperada a ocorrência de cadeias laterais pequenas e principalmente hidrofóbicas para facilitar a ligação de pPRO-Phe. Também foi observada uma mutação adicional LeullO -> PhellO em um dos clones (pPRO-PheRS-1) . A sintetase pPRO-PheRS-1 foi selecionada para posterior caracterização. Esta sintetase confere resistência ao cloranfenicol em E. coli, com valores de IC50 de 110 e 5 pg/ml na presença e na ausência de pPRO-Phe, respetivamente. A grande diferença entre a resistência ao cloranfenicol com e sem pPRO-Phe sugere uma especificidade substancial in vivo de pPRO-PheRS-1 para o aminoácido não natural pRPO-Phe. EXEMPLO 2
Incorporação especifica do local de um aminoácido alquinilo numa proteina em E. Coli O tARNcuA supressor âmbar mutante e o par ortogonal pPRO-PheRS-1 foram usados em E. coli para incorporar seletivamente pPRO-Phe em mioglobina de esperma de baleia, uma proteina monomérica de 153 resíduos contendo heme, que 111 ΕΡ1794323Β1 tem sido o foco de um certo número de estudos estruturais, mecanisticos, e de dobragem de proteínas (Reedy e Gibney (2004) Chem. Rev., 104: 617, e referências aí; Uzawa et al., (2004) Proc. Natl. Acad. Sei. U.S.A., 101: 1171, e referências aí; Wright e Baldwin, em Frontiers in Molecular Biology: Mechanisms of Protein Folding, [Pain, R., ed.] Oxford University Press, Londres, 2000, pp. 309).
Para produzir mioglobina modificada com alquinilo, o quarto codão do quadro de leitura aberta da mioglobina (Ser4) foi mutado para TAG (terminação âmbar), e foi adicionado um marcador 6 x His terminal-C (hexahistidina) ao quadro de leitura aberta. Para expressar a proteína mutante, o plasmídeo pBAD/JYAMB-4TAG (que codifica para o gene mutante da mioglobina de esperma de baleia com um promotor de arabinose e um terminador rrnB, o tirosil tARNcua num promotor lpp e um terminador rrnC; e um marcador de resistência à tetraciclina) foi cotransformado com um vetor pBK (que codifica para a sintetase mutante e um gene de resistência à canamicina) em células DH10B de E. coli. As células foram amplificadas em meio de Luria-Bertani (5 ml) suplementado com tetraciclina (25 mg/1) e canamicina (30 mg/1), foram lavadas com tampão de fosfato, e usadas para inocular 500 ml de meio mínimo de glicerol líquido (suplementado com 0,3 mM de leucina) contendo os antibióticos adequados, pPRO-Phe (1 mM), e arabinose (0,002 %) . As células foram cultivadas até à saturação e em seguida foram recolhidas por centrifugação. A proteína foi purificada utilizando cromatografia de afinidade-Ni, com um rendimento de 2 mg/1 após a purificação por cromatografia de afinidade-Uni, e estimado em 90% homogéneo por SDS-PAGE / coloração Gelcode®Blue (Pierce Biotechnology, Inc.). Foi obtido um rendimento total de ~ 1 mg de mioglobina mutante. A proteína assim produzida é visualizada na figura 4, poço 1, usando tanto coloração Gelcode®Blue e Western blot utilizando um anticorpo anti-His6. Na ausência de pPRO-Phe, 112 ΕΡ1794323Β1 não era visível mioglobina depois da coloração ou do Western blot (utilizando um anticorpo anti-His6), indicando uma elevada seletividade da sintetase evoluída (veja-se, figura 4, poço 2). EXEMPLO 3
Confirmação por espectrometria de massa da incorporação do aminoácido alquinilo numa proteina em E. coli
Para confirmar melhor a identidade do aminoácido incorporado no local de um codão de terminação âmbar na mioglobina mutante, foi submetida a cromatografia líquida / espectrometria de massa em tandem uma digestão tríptica da mioglobina. A mioglobina mutante utilizada nesta experiência continha um codão de terminação âmbar desenhado na posição 74. A incorporação de pPRO-Phe nesta posição (pPRO-Phe74) foi testada na mutação 74. A mioglobina-74TAG mutante foi usada em vez da Ser4 -> TAG (terminação âmbar) descrita anteriormente, devido à melhoria das propriedades para a análise por LC MS/MS.
Após a expressão em eubactérias, a mioglobina 74TAG foi purificada utilizando uma coluna de afinidade de níquel. As bandas de proteína foram visualizadas por coloração Gelcode®Blue de um gel de SDS-PAGE. As bandas de gel correspondentes à mioglobina mutante foram excisadas a partir do gel de poliacrilamida, cortadas em cubos de 1,5 mm, e submetidas a hidrólise de tripsina, essencialmente como descrito (Shevchenko et al., (1996) Anal. Chem. 68: 850-858).
Os péptidos trípticos que contêm o aminoácido não natural foram analisados por HPLC de fase reversa de
nanofluxo / μΕ-SI / MS com um espectrómetro de massa de captura de iões LCQ. A análise de cromatografia líquida e espectrometria de massa em tandem (LC-MS/MS) foi realizada num espectrómetro de massa de captura de iões Finnigan LCQ 113 ΕΡ1794323Β1
Deca (Thermo Finnigan), equipado com uma HPLC de nanospray (Agilent 1100 series).
Os iões precursores que correspondem aos iões com carga única ou dupla do péptido HGVTVLTALGY*ILK (SEQ ID NO: X) , que contém o aminoácido não natural (denotado Y*) , foram separados e fragmentados com um espectrómetro de massa de captura de iões. Os resultados desta análise encontram-se na figura 5. As massas dos iões fragmentados podiam ser inequivocamente atribuídas, confirmando a incorporação específica do local de pPRO-Phe. As rondas de LC MS/MS não sugeriram a incorporação de qualquer aminoácido natural nesta posição, confirmando a elevada seletividade da sintetase evoluída. EXEMPLO 4
Derivação de uma proteína que contém um aminoácido alquinilo por cicloadição [3+2]
As proteínas que contêm grupos funcionais alquinilo podem ser direcionadas de forma eficaz para a modificação pelo uso de uma reação de cicloadição [3+2]. O presente exemplo descreve a derivação da mioglobina alquinilo com duas moléculas diferentes de corante contendo azido. A mioglobina mutante usada neste exemplo incorporou pPRO-Phe no quarto codão (Ser4 -► pPRO-Phe4), tal como descrito no exemplo 1. A mioglobina Ser4 -► pPRO-Phe4 foi produzida em E. coli tal como descrito no exemplo 2, em seguida foi derivada com os corantes azido funcionalizados 2 ou 3, que contêm o fluoróforo dansilo e fluoresceína, respetivamente (tal como se mostra nas figuras 6A e 6B; veja-se também, Deiters et al., (2003) J. Am. Chem. Soc., 125: 11782; Wang et al., (2003) J. Am. Chem. Soc., 125: 3192; Link e Tirrell (2003) J. Am. Chem. Soc., 125: 11164). A reação de derivação por cicloadição [3+2] é ilustrada na figura 7A. 114 ΕΡ1794323Β1
Para a reação de cicloadição, foram adicionados 1 μΐ de CuS04 (solução stock a 50 mM em H20; 1 mM no volume final de reação), 2 μΐ de corante 2 ou 3 (50 mM em EtOH), 2 μΐ de tris (l-benzil-lH-[1,2,3] triazol-4-ilmetil) amina (50 mM em DMSO) , e 1 mg de fio de Cu ou 1 μΐ de tris (carboxietil) fosfina (100 mM em H20) (como agentes de redução) a 45 μΐ de mioglobina mutante purificada (~ 0,5 mg/ml) em tampão de fosfato a 0,1 M (pH = 8). Após 8 horas à temperatura ambiente, ou durante a noite a 4 °C, foram adicionados 450 μΐ de H20, e a mistura foi passada através de uma membrana de diálise (corte de 10 kDa) . Depois de lavar o sobrenadante com 2 x 500 μΐ de tampão de fosfato por centrifugação, a solução foi levada a um volume de 50 μΐ. O uso de fio de Cu ou de tris (carboxietil) fosfina (2 mM) como agentes de redução conduz geralmente a uma eficiência de marcação semelhante. Em contraste com as observações anteriores (Wang et ai., (2003) J. Am. Chem. Soc., 125: 3192), a presença ou a ausência do ligando tris (1-benzil-lH-[1,2,3] triazol-4-ilmetil) amina não teve uma influência considerável sobre o resultado destas reações. Uma amostra de 20 μΐ das proteínas marcadas com fluorescência (Blake (2001) Curr. Opin. Pharmacol., 1: 533; Wouters et al., (2001) Trends in Cell Biology 11: 203;
Zacharias et al., (2000) Curr. Opin. Neurobiol., 10: 416) foi então analisada por SDS-PAGE e visualizada em gel. A mioglobina mutante modificada com o corante dansilo 2 (λ0Χ = 337 nm, λ0ΐη = 506 nm) foi visualizada em gel a 360 ± 30 nm, utilizando um densitómetro Eagle Eye (Stratagene). A ligação do corante fluoresceína 3 (λΘΧ = 495 nm, λΘΓη = 516 nm) foi visualizada a 450 ± 30 nm, com um Storm
Phosphorimager (Molecular Dynamics). Os resultados desta imagiologia fluorescente são mostrados na figura 7B. A mioglobina mutante é marcada de forma eficaz por ambos os corantes 2 e 3. A eficiência de marcação foi ~ 75 %, tal 115 ΕΡ1794323Β1 como determinado pela comparação dos valores de A280M495 para a mioglobina marcada com 3 (veja-se Wang et al., (2003) J. Am. Chem. Soc., 125: 3192). A seletividade desta biocon jugação foi verificada pelo facto de não ter sido observada nenhuma reação entre a mioglobina do tipo selvagem e 2 ou 3 (resultados não apresentados). A descrição aqui fornecida demonstra que um aminoácido alquinilo, por exemplo, para-propargiloxifenilalanina, pode ser incorporado eficientemente e seletivamente em proteínas num organismo, por exemplo, E. coli. Estes aminoácidos podem então ser direcionados quimicamente na proteína para a conjugação, por exemplo, por cicloadição [3+2] usando porções azido, e, para além disso, onde esta modificação direcionada é altamente específica e regiosselectiva. A capacidade de incorporar aminoácidos alquinilo de forma específica do local em proteínas, proporciona uma ferramenta valiosa no estudo de qualquer proteína onde é desejada a conjugação ou modificação de proteínas. EXEMPLO 5 Síntese do aminoácido não natural alquinilo para-propargiloxif enilalanina O aminoácido não natural alquinilo para- propargiloxif enilalanina (abreviado pPRO-Fen; veja-se a figura IA, composto 1) foi sintetizado a partir de ΛΤ-Boc-tirosina, disponível comercialmente, em três etapas (veja-se, Deiters et al., (2003) J. Am. Chem. Soc., 125: 11782; Wang et al., (2003) J. Am. Chem. Soc., 125: 3192; Link e
Tirrell (2003) J. Am. Chem. Soc., 125: 11164), com um rendimento global de 81 %. ETAPA 1 A N-terc-butoxicarbonil-tirosina (2 g, 7 mmol, 1 equiv.) e o K2C03 (3 g, 21 mmol, 3 equiv.) foram suspensos em DMF anidro (15 ml). Foi adicionado lentamente brometo de 116 ΕΡ1794323Β1 propargilo (2,1 ml, 21 mmol, 3 equiv., solução a 80 % em tolueno), e a mistura de reação foi agitada durante 18 h à temperatura ambiente. Foram adicionados água (75 ml) e Et20 (50 ml) , as camadas foram separadas, e a fase aquosa foi extraida com Et20 (2 x 50 ml) . As camadas orgânicas combinadas foram secas (MgS04) e o solvente foi removido sob pressão reduzida. O produto (4), mostrado e indicado em seguida, foi obtido como um óleo amarelo (2,3 g, 91 %), e foi utilizado na etapa seguinte sem purificação adicional. ΕΡ1794323Β1
éster propargilo de ácido 2-terc-butoxicarbonilamino-3-[4-(prop-2-iniloxi) fenil]-propiónico (composto 4) ETAPA 2
Foi cuidadosamente adicionado cloreto de acetilo (7 ml) a metanol (60 ml) a 0 °C, para dar uma solução a 5 M de HC1 anidro em MeOH. Foi adicionado o produto da etapa anterior (composto 4, 2 g, 5,6 mmol), e a reação foi agitada durante 4 h enquanto se deixou aquecer até à temperatura ambiente. Após a remoção dos voláteis sob pressão reduzida foi obtido um sólido amarelado (composto 5, mostrado e indicado em seguida, 1,6 g, 98 %) , o qual foi utilizado diretamente na etapa seguinte. o
éster propargilo de ácido 2-amino-3-[4-(prop-2-iniloxi) fenil]-propiónico (composto 5) ETAPA 3 O éster propargilo (1,6 g, 5,5 mmol) da etapa anterior 117 ΕΡ1794323Β1 (5) foi dissolvido numa mistura de solução aquosa de 2 N de NaOH (14 ml) e MeOH (10 ml). Após agitação durante 1,5 h à temperatura ambiente, o pH foi ajustado para 7 pela adição de HC1 concentrado. Foi adicionada água (20 ml) e a mistura foi mantida a 4 °C durante a noite. O precipitado foi filtrado, foi lavado com H20 gelada, e foi seco sob vácuo obtendo-se 1,23 g (90 %) de pPRO-Phe (1) como um sólido branco. ΧΗ RMN (400 MHz, D20; como o sal de potássio em D20) δ 7,20 (d, J = 8,8 Hz, 2 H) , 6,99 (d, J = 8,8 Hz, 2 H) , 4,75 (s, 2 H) , 3,50 (dd, J= 5,6, 7,2 Hz, 1 H) , 2,95 (dd, J = 5,6, 13,6 Hz, 1 H) , 2,82 (dd, J = 7,2, 13,6 Hz, 1 H) ; 13C RMN (100 MHz, D20) δ 181,3, 164, 9, 155, 6, 131,4, 130,7, 115,3, 57,3, 56, 1, 39, 3; HRMS (Cl) m/z 220, 0969 [Ci2H13N03 (M+l) requer 220,0968].
para-propargiloxifenilalanina (composto 1) EXEMPLO comparativo 6 Síntese do marcador azido 2 O marcador azido 2 (veja-se a figura 6A; composto 2) foi sintetizado de acordo com o protocolo que se segue. Foi adicionada 3-azidopropilamina (371 mg, 3,71 mmol, 3 equiv.) (sintetizada de acordo com Carboni et al., (1993) Org.
Chem., 58: 3736-3741) a uma solução de cloreto de dansilo (500 mg, 1,85 mmol, 1 equiv.) e trietilamina (258 μΐ, 1,85 mmol, 1 equiv.) em CH2C12 (10 ml) a 0 °C. Após agitação durante 1 h, a mistura de reação foi aquecida até à temperatura ambiente e foi agitada durante uma hora adicional. Os voláteis foram removidos in vácuo, e o produto em bruto foi purificado por cromatografia em gel de sílica (Et20 / hexanos = 1:1) dando origem a 2 (548 mg, 89 118 ΕΡ1794323Β1 %) como um óleo amarelo. 2H RMN (400 MHz, CDCI3) δ 8,55 (d, J= 8,4 Hz, 1 H) , 8,29 (d, J= 8,8 Hz, 1 H) , 8,23 (dd, J = 1,2, 7,2 Hz, 1 H) , 7, 56 - 7,49 (comp, 2 H, 7,18 (d, J= 7,6 Hz, 1 H) , 5,24 (s largo, 1 H) , 3,21 (t, J = 6,4 Hz, 2 H) , 2,95 (dt, J = 6,4 Hz, 2 H) , 2,89 (s, 6 H) , 1,62 (quin, J = 6,4 Hz, 2 H) ; 13C RMN (100 MHz, CDC13) δ 134,3, 130,4, 129, 7, 129, 4, 128,4, 123, 3, 118, 8, 115, 3, 48, 6, 45, 4, 40, 6, 28,7 (nem todos os sinais de átomos de carbono quaternários são visíveis no espectro de 13C RMN); HRMS (Cl) m/z 334,1336 [C15H20N5O2S (M+l) requer 334,1332].
Marcador azido 2 (composto 2) EXEMPLO comparativo 7 Síntese do marcador azido 3 O marcador azido 3 (veja-se a figura 6B; composto 3) foi sintetizado de acordo com o protocolo que se segue. Foi adicionado EDC1 (83 mg, 0,43 mmol, 1 equiv.) a uma solução de fluoresceinamina (150 mg, 0,43 mmol, 1 equiv.) e ácido 4-(3-azido-propilcarbamoil)-butirico (92 mg, 0,43, 1 equiv.) em piridina (2 ml) à temperatura ambiente. (O ácido 4-(3-azidopropilcarbamoil)-butirico foi sintetizado por reação de 3-azidopropilamina com anidrido de ácido glutárico.) A suspensão foi agitada durante a noite, e a mistura de reação foi vertida em H20 (15 ml) . A solução foi acidificada (pH < 2) por adição de HC1 concentrado. Após agitação durante lho precipitado foi filtrado, foi lavado com HC1 a 1 N (3x3 ml) , e foi dissolvido numa pequena quantidade de EtOAc. A adição de hexanos conduziu à 119 ΕΡ1794323Β1 precipitação de 3 como cristais cor de laranja, que foram recolhidos e secos sob vácuo (200 mg, 8 6 %) . 3H RMN (40 0 MHz, CD3OD) δ 8,65 (s, 1 H) , 8,15 (d, J = 8,4 Hz, 1 H) , 7,61 - 7,51 (comp, 2 H), 7,40 (d, J = 8, 4 Hz, 1 H), 7,35 (s largo, 2 H), 7,22 - 7,14 (comp, 2 H), 6,85 - 6,56 (comp, 3 H) , 3,40 - 3,24 (comp, 4 H) , 2,54 (t, J = 7,2 Hz, 2 H) , 2,3 9 - 2,30 (comp, 2 H), 2,10 - 1,99 (comp, 2 H) , 1,82 - 1,72 (comp, -2 H) ; 13C RMN (100 MHz, CD3OD) δ 175,7, 174,4, 172.4, 167, 9, 160,8, 143, 0, 134,3, 132, 9, 131,8, 129, 6, 124.4, 123,3, 121,1, 118,5, 103,5, 50,2, 38,0, 37,2, 36,2, 29, 8, 22, 9; 4 HRMS (Cl) m/z 544,1835 [C28H25N5O7 (M+l) requer 544,1827].
Ό O
Marcador de azido 3 (composto 3) EXEMPLO 8
Exemplos de O-RS' e de O-tARN para a incorporação de aminoácidos alquinilo em E. coli
Um exemplo de O-tARN compreende a SEQ ID NO: 1 (veja-se o exemplo 9, tabela 4) . Os exemplos de O-RS incluem as sequências de aminoácidos proporcionadas na SEQ ID NO: 4, 6, 8, 10, 12, 14, 16 e 18 (veja-se a figura 3 e o exemplo 9, tabela 4).
Os exemplos de polinucleótidos que codificam para as O-RS ou porções das mesmas incluem qualquer polinucleótido que codifica uma sequência de aminoácidos que compreende a SEQ ID NO: 4, 6, 8, 10, 12, 14, 16 e 18. Por exemplo, os polinucleót idos proporcionados na SEQ ID NO: 5, 7, 9, 11, 13, 15, 17 e 19 codificam para exemplos de O-RS. 120 ΕΡ1794323Β1 EXEMPLO 9
Sequências de nucleótidos e de aminoácidos
Este exemplo proporciona sequências de nucleótidos e de aminoácidos para os vários polinucleótidos e polipéptidos, respetivamente. As sequências proporcionadas na tabela 4 que se segue destinam-se a fornecer apenas exemplos, e não se pretende que a invenção seja limitada de qualquer maneira às sequências fornecidas na tabela 4. TABELA 4 SEQ ID NO: Descrição SEQUÊNCIA 1 mutRNAj£A CCGGCGGtJAGUUCAGCAGGGCAGAACGGCGG ACICTAAAUCCGCAUGGCGCUGGUUCAAAUC CGGCCCGCCGGACCA 2 Sequência de aminoácidos de tirosil-tARN sintetase do tipo selvagem de Methanococcus jannaschii (MjTyrRS) MDEFEMIKRNTSEI1SEKELRSVI.KKDEKSA YIGFERS<3KimJGHYI>QIKKMIDLQNAGE-DI I ILLADLHAYIiNQKGELDEI rki gdymkkvf EAMGLKAKYVYGSEPQLDKDYTlilJVYELAIiK ITLKRARRSMELlARlOilMPKVAEVIYPlMO VNDIHYLGVDVAtOâMEQRKIHMIjARELLPK KWCI HNPVLTGIiDGEGKMSSSKGNF IAVDD SPERTRATCIKKftYCPAGWEGNPIMEIAKYP' Ι,ΕΥΡΙίΤΪΚΚΡΕΚΡΟΟΟΙ.ΤνΝ'βΥΕΕηΕεΕΕΚΝ KEIaHPM£)r.KNAVAEEDIKIIiEPIRKRIj 3 Sequência de nucleótidos de tirosil-tARN sintetase do tipo selvagem de Methanococcus jannaschii (MjTyrRS) ATCGACGAATTTGAAATGATAAAGAGAAACACAT CTGAAATTATCAGCGAGGAAGAGTTAAGAGAGGT tttaaaaaaagatgaaaaatctgccxacataggt WraAACCAAtíTGGTAAAATACATITtAGGGCATT atctccaaataaaraagatgattguítttacaaaa tgcgggatttgatataattatattgttggctgat ttacacgcctait-paaaccagaaaggagagttgg ATQAGATTAGAAAAATAGoAÍVíTTATAAGAAAAA AGTTTTTGAAQCAATGGGGTTAAAGOCAAAAtAT GTC-iATGGAAOTSAATTCCjWSCTTGATAAGGATT ATACACTGAATGTCTATAOATTGOCTTTAAAAAC TACCTTAÁAAAGAGCAAGAAaGAGTATGGAACTT ATAGCAAGAGAGGATOAAftATCCÃÃAGGTTdCTG MGTTATCTATCCAAFAATCCAGGTTAAWATAT TCATTATTTAGGCGTOGATGTTGeÃGTTGGAGeG ATGGAGCAGAGAAAftATACACATGTTAGCAAGOG AGCTTTTACCAAAAAAGSTTSTTTGTAÍTCACAA ccctqtcttaacgggtttggatggasaaggaaag ATGAGTTCTTCAAAAGfíGAATTTTATASCTGTTG ATGACGCTCCAGAAGAGATTAGGGCTAAGATAAA gaaagcatactgcccagciggagttgttgaagga aatccaataatqgàgatagctaaatacttccttg ÀATATCCTTTAAeCATAAAAÃGGCCAOAAAAATT tqgtggasattítgacagttaataGCtatgaggag TTAGAGAGOTTATTTAAAAATAAGGAATTGCATC CAATGGATTTAAAAA.ATGGÓGTAGCTGAAGAACT tataaagattttagagccaattaoaaagagatta 121 ΕΡ1794323Β1
4 pPRO-PheRS-1; Sequência de aminoácidos do isolado 1 de aminoacil-tARN sintetase para-propargiloxifenilalanina (derivado a partir de tirosil-tARN sintetase do tipo selvagem de Methanococcus jannaschii), que possui as alterações de aminoácidos: Tyr32 - Ala32 Glul07 - Prol07 LeullO PhellO Aspl58 Alal58 Leul62 - Alal62 MDEPEWIKRHTSEIISEEELKSVX.KKDEKSA AIGFEPSGKIHICHYtOIKKMIDLQtJAGFDI 2 ILl>ADljHA.YtjNQKGEIiDEIRKIGDYMKKVF èamglkakyvygspfqFdkdyimjvyrxal KTTLKRARRSMEL2 AREDEMPKVAWIYPIM QVIíAIHYAGVDVAVGGM EQRK X FKKWCIHNFVIjTGÍiDGEGKMSSSítOíFIAV DDSPEEIRAKIKKAYCPAGWEGWPIMRTAK YFLEYPLTIKftPEKFGGDLTVNSYEELE-SLF KKKELHPKDLKNAVAEEliIKILEPIRKRIi 5 Sequência de nucleótidos de pPRO-PheRS-1 ATGGACGAATFTOAAATGATAAAGAGAAACACAT ctgaaattatcagcgaggaagagttaagagággt Í?TAAAAAAAGATGAAAAATCT<3CTGCGATAGG TTTTGAACCAAGTGGTAftAATACATTTAQGGCAT TATCTCCAAATAAAAAAGATGATTGATTTACAAA ATGCTGGATTTGATA^AATTATATTGTTCGCTGA totacacgcctatttaaaccagaaaggagagttg GATGAGATTAGAAAAATAGGAGA2TATAACAAAA AAQXTtTTGAAGCAATGGGGTTAAAOGCAAAATA tgtttatggaagtCCGítccagTTTgataagg . ATTATACACTdAATGTqTA^AG AT'fGGCm>TAAA; AACTACCTIAAAAAGAGCAAQAAGGAGTATGGAA CTTATAQCAAGAGAGGATCAAAATOCAAAGGTTG ' ctgaagttatctatccaataatocaggttaatQC AATTcattatGCTggcgíptgatgttgcagmo GAGGGATGGAGCAGAGAAAAAmCACATGÍTAGC AAGGGAGCTTTTACCAAAAAAGSTKUTOraTÃST ' CACAACCCTGTCTTAACGGGTTTGGATGC3AGAACS GAAAGATCíAGTTCTTCAAAAGGGAATTTTATAGC, TGTTGATGACTCTCCAGAAGAGATTAGGGCTAAG ataaagbaagcatactgcccagciggagttgctg AAGGAAATCCAATAATGGAGATAQCTAAATACTT ccttgaatatcctttaaccasaaaaaggccagaa AAAOTTGGTGOAOÁTTrGACAGTTAATAGCTATG AGGAGTTAGAGAGTTTATTTAAAAATAAGGAATT GCATCCAATGQATTTAAAAAATGCTGTAGCTSAA GAACTTATAAAGATTTTAGAGCCA&TTASAAAGA GATtfA 122 ΕΡ1794323Β1
6 pPRO-PheRS-2 ; Sequência de aminoácidos do isolado 2 de aminoacil-tARN sintetase para-propargiloxifenilalanina, que possui as alterações de aminoácidos: Tyr32 — Ala32 Glul07 — Lysl07 Aspl58 — Alal58 Leul62 - Alal62 derivado a partir de tirosil-tARN sintetase do tipo selvagem de Methanococcus jannaschii MDEFEMIKRNTSHIISEEEIjREV1>KKDSKSA AXtíFEPSGKIHLGHYLQIKKMlDtjQNAGFDI XXLLADLHAYLNOKGELDEIRKIGDYNKKVF· EAKGLKAKYVYGSKFQLDKDYTLNVYRLAL KTTLKRARRSMELIAREDEMPKVABVIYPIM QVNAIHYACWDVAVG(3<EQRK I HMIiAR-ELTj PKKWCIHWPVLTGIjDGEGKMSSSKGKFIAV ddspeeirakikkaycpagwegkpimkiak YFLEYPliTIKRPBKFCíGDÍjWNSyEKJjESl.P KNRELHPMDliKKAVAEELIKIIíE&IRKRi 7 Sequência de nucleótidos de pPRO-PheRS-2 atggacgaatttgaaatcataaagagaaacacat ctgaaattatcagcgaggaagagttaagagaggt tctaaaaaaagatgaaaaatctgctGCGatagg ttttoaaccaagtggtaaaatacatttagggcat tatotccaaataaaaaagatgattgatttacaaa atgctggatttoatataattatattcttggctga tttacacgcctatttaaaccagaãaggagagttg GATGAGAròAGRAAAATAQGAGATTATAACAAAA a&gtttttgaagcaatggggttaaaggcaaaata tgtttatggaagtAAjG-ptccagC TTgataagg ATTATACACT&AATGTCTATAGATTGGCTTTAAA AACTACC TTAAAAAGAGCAAGAAGOAGTATGGAA CTTATAGCAAGAGACGATGMAATCCAAAGGTTG CrOAAGTTATCTATCCAATAATGCAGGTTAATGC AATTcatcatGCCggcgitgatcttgcagttg GAGGGATGGAGCAGAGAAAAATACACATGTTAGC AAGGGAGCTTTTACCaAAAA&GGTTGTTTOTAirr CACAACCCTGTCTTAACGGGTTTGGATGGAGAAG GAAAGATGAGTTCTTCAAAAGGGAATTTTATAGC tgttgatgactctccagaagagattagggctaag ATAAAGAAAGCATACTGCCCAGCTSSAGTTGTTS aaggaaatccaataatggagatagctaaatactt ccttgaatatcctttaaccataaaaaggccagaa AAATTTGGTGGAGATTTG&CAGTTAATAGCTATG aggagttagagagtttacttaaaaataaggaatt gcatccaatggatttaaaaaatgctgtagctgaa gaacttataaagattttagagccaattagaaaga GAfTA 123 ΕΡ1794323Β1
8 pPRO-PheRS-3; Sequência de aminoácidos do isolado 3 de aminoacil-tARN sintetase para-propargiloxifenilalanina, que possui as alterações de aminoácidos: Tyr32 — Ala32 Glul07 - Argl07 Aspl58 — Alal58 Leul62 — Prol62 derivado a partir de tirosil-tARN sintetase do tipo selvagem de Methanococcus jannaschii MJErEMIKRNTSEmSEEELREiniKKQEKSft· AlGFEPÍiGK-tHTjGHTfliQIKKMIDIíQKAGFDI riI.IADÍjKAYÍ.NQKGELDElRKXGDYNKK.VP EAMGLKAKYWGSRFQliDKDYTTjNVyRtiM, KTTI.KRAKRSMELIAREEENPIWAEVIYPXK qvnAIhyPgvdvavggmrqrkihmlareli, PKKWCIHKPVI/TGIfDGBGKMSSSKGUFIAV DDSPEEIRAKIKKAYCPAGWEGWPIMEIAK YFLEYPLTrKRPEKFGGDLTVMSYEELESLP K11KE1jHPMD1íKWAVAF.EI)TKXLEP,T.RKRIi 9 Sequência de nucleótidos de pPRO-PheRS-3 atggacgaattogaaatsataaagagaaacacat ctgaaattatcagcgaggasgagitaagagagct tttaaaaaaagatgaaaaatctgctG CGatagg ttttgaaccaagtggtaaaatacatttagggcat wtctccaaataaaaaagatgattgatttacaaa atgctosatttgatataactatattgttggctga ^TACACGCCTATTCAAACCAGAAAGGAGAGOTG gatqagattagaaaaataggacsattataacaãaa AAGTTTTTGAAGCAATGGGC3TTAAAGG CAAAATA tgtttatggaagtCGGttccagCTTgaxaagg ATTATACACÍTGAATGTCTATAGATTGGCTTaaAA aactaocxyaaaaagagcaagaaggastatggaa cttatagcaagagaggatgaaaatccaaaggtto ctgaagttatctatccaataatgcaggttaatGC A&.TTcatoatCCGggcgttgatgttgcagws gagggavggagcagagaaaaatacacatgttagc AAGGGAGCTTTTACCAAAAAAGGTÍGTTTGTATT CACAACCCTGTCTTAACGGGTTTGGATGGAGAAG GAAAGATGAGOTCTTCAAAAGGGAATTTTATAGC TGTTGATGACXCTCCAGAAGãGATTAGGGCTAAG ATAAAGAAAGCATACTGCCCAGCTGGAGTOGrPG AAGGAAATCCAATAATGGAGAIAGCTAAATACTT eCTOGAATATCCTTTAACCATAAAAAGGCCAGAA AAATTTGGÍGGAGATTTGACAGTY&ATAGCTATG AGGAGTTAGAGAGrTTATTTAAAAATAAGGAATT GCATCCAATGGATTTAAAAAAIGCTGTAGCTGAA GAACTTATAAAGArWTAHAGCCAATTAGAAAGA GATTA 124 ΕΡ1794323Β1
10 pPRO-PheRS-4; Sequência de aminoácidos do isolado 4 de aminoacil-tARN sintetase para-propargiloxifenilalanina, que possui as alterações de aminoácidos: Tyr32 - Hi32 Glul07 - Alal07 Aspl58 — Alal58 Leul62 — Prol62 derivado a partir de tirosil-tARN sintetase do tipo selvagem de Methanococcus jannaschii MDKFEMXKRNTSEIISEEEbR£VLKKDEKSA HXGFEPSGKIHLGHYLQIKKMXDLQWAGPDI ΙΐωίΑΙΛΗΑΥΧ,ΗΟΚαΕ^ΠΒΧΚΚΧΟΟΥΚΚΚνΡ ÊAMGIiKAKYVYGSllFQlffiKOYTIiNVyRIAL KTTLKRARRSl^lARSDENPKVAEVIYPIM QVtJft.lHYPGVDVAVGGMEQRKIHMLÀRSliIj PKKVVCIHOTVLTClíSGEGKMSSSKGKfFIAV DDSPEEXRRKIKKAYCPASWSOÍPXMEIAK YFLEYPLTIKRPEKFGGDLTVN5YEEL.ÉSI.F KNKEIjHPMDLKMAVAEELIKILEPIRKKL 11 Sequência de nucleótidos de pPRO-PheRS-4 ATGOACGAATTTGAAATGATAAAfiAGAAACACAT CTCSAAATTATCAGCGA<3GAAGAG3*TAAGAGAGGT tttaaaaaaaõatgaaaaatctoctCATatagg ttttgaaccaagtggtaaaatacatttagggcat TATCTCCAAATAAAAAAGATGATrGATTTACAAA atgcxggatttgatataattatattgttggctga tttacacgcctatttaaaccagaaasgaqagttg gatgagattaqaaaaataggagatuataãcaaaa aagtotttgaagcaatgqggttaaaggcaaaata tgtmatggaagtGCTttccagCTTgataagg attatacactgaatgtctatagattggctttaaa aactaccttaaaaagagcaagaaggagtatggaa cttataggaagagaggatgaaaatccaaaggttg ctgaagttatctatccaataatgcaggtíaatGC AA.TTcattatCCTggcgttgatgttgcagttg Gagggatggagcagagaaaaatacacatgttagc AAGGGAGCTTTTACCAAAAAAGCSrTGTTTGTATT CACAa.CCCTGTCTtAACGGGTTiXíGATGGAGAAG GAAAOArGAGTTOTTCAAAAGQOAATTTTATAGC TGTTGATGACTCTCCAGAAeAGATTAGGGCTAAG ATAAAGAAAGCATACTÍKCCAGCTGGAGTTGTTG aaggaaatccaataatggagAtagctaaatactt CCrTGAATATCCSTTAACCAÍAAAAAGGCCAGÍUi AAATTTGGTGGAQATOTGACAGTTAATAGCTATS AOGAGTTAGAGAGTíTTATTTAAAAATAAGSAATT GCATCCAATGGATTTAAAAAATGCTGTAGCTOAA GAACTTATAAAGATTWAGAGCCAATTAGAAAGA GATTA 125 ΕΡ1794323Β1
12 pPRO-PheRS-5; Sequência de aminoácidos do isolado 5 de aminoacil-tARN sintetase para-propargiloxifenilalanina, que possui as alterações de aminoácidos: Tyr32 - Ser32 Glul07 - Glnl07 Aspl58 — Alal58 Leul62 - Alal62 derivado a partir de tirosil-tARN sintetase do tipo selvagem de Methanococcus jannaschii SlGFEPSGklHLpHYLQlKKMIDLQKAGFBI I lUjADJjHAyLNQKGELDEl RK XGDYNKKVF eamglkakyvygsQfqldkdytlnvyrlal, KTTLKRARRSMELIAREDENPKVAEVXYPXM QVHAXHYAGVDVAVGGMEQRKIHMLAÍÍE1,L· PKKWCXHNPVI,TGLDGEGK«SSSkGKFIAV DDSPSEIRAKIKKAYCPAGWEGNPIMEXAK YFLEYPLTrKRPEKFGGDLWNSYEKLEStF KNKELHPMDLKHAVAEELIKILEP.TRKRIj 13 Sequência de nucleótidos de pPRO-PheRS-5 atggacgaatttgaaatgataaagacaaacacat CTQAAATTATCAGCSAGGAAQAGTTAAGAGAGGT twaaaaaaagatgaaaaatctgctTCGatagg tttxgaaccaagtgstaaaatacatttágggcat tatctccaaaxaaaaaagaxgattgatttacaaa atgctggatttgatataattatattgttggctga tttacacgcctatttaaaccagaaagqagagttg GATGAGATTAGAAAAAÍAGGAGATTATAACAAAA AAGTTTTTGAAaCAATGGGGTXAAAGGCAAAATA tg tttatggaagtCAGttccagCTTgataagg ATiiAÍACACTOAATGTCTATAGATTGGCTTTAAA AACmCCTTAAAAAGAGCAAGAAGGAGTATGGAA CTTATAGCAAGACAGGATGAAAATCCAAAGGXTG CTGAJíOTTATCTATCCAATAATGCAGGTTAATGC AATTcattatGCCggcgítgatgttgcagttg gasggaxggrgcagagaaaaatacacatgttagc AAGGGAgcTTTTACCAAAAAAGGTTGTTTGTATT CACAACCCTGTCTXAACSeeTTTGGATGGAGAAQ GAAAGATGAGTTCTTCAAAA{3GGAATTTTATAGC TOFTGATC^TCWX^GMGAGATTAGGGeTAAQ ATAAAGAAAGCATACTGCCCAeCTCGAGTTGXTG AAGGAAMCCiUVIAATGSAGATAGCTAAATACTT ccttsaatatccttxaaccataaaaaogccasaa AAAT^GGTGGASATTTaACAGTTAATAGCTATG AGGAGXTAGASASTTTATTTAAAAATAAGGAATT GCATCOUTGOATTTAAAAAATGCXGTAGCTGAA QAACTTAXAAAGATTTTAGASCCAATTAGAAAGA GATXA 126 ΕΡ1794323Β1
14 pPRO-PheRS-6; Sequência de aminoácidos do isolado 6 de aminoacil-tARN sintetase para-propargiloxifenilalanina, que possui as alterações de aminoácidos: Tyr32 Thr32 GlulO7 Serl07 Aspl58 -> Leul58 Ilel59 -> Hisl59 Leul62 -> Prol62 derivado a partir de tirosil-tARN sintetase do tipo selvagem de Methanococcus jannaschii KDEFEMXitEtTO5E2ISEEEnjHEVX<KKBEKSA, , TlGFEP SGKIHIiGHYIíQIKKMIDLQNAGFDI ΙΙΕΙΑ^ΗΑΉΜΩΚβΕω^ΚΚίαΟΥΝΚΚνΡ 2 AMGLKAKYVYG S S FQliDKDY TLNVYRLAL XTTL.KRARSSMELIAREDENPKVAEVIYPIM QVNI<HHYF{?VDVAVGGMSQP.KIHKIiARF.IjIi pkkwcíhkpvltgldgegkmssskojfiav DDSPEErRAKIKKAYCPAGWEGNPIMEIAK YFIiEYPLTIKRPEKFGSELTVHSYEELESLP KNKELHPMCtKMAVAEELIKILEPIKKRL 15 Sequência de nucleótidos de pPRO-PheRS-6 ATGGACGA&TTTGA&ATQATAAAGAGAAACACAT ctgaaattatcagcgaggaagagttaagagaggt tttaâaaaaagatgaaaaatctgctACGatagg ttttgaaccaagtggtaaaatacatttagggcat tatctccaaataaaaaagatgaíttgatttacaaa ATGCTGGATTTGATATAATTATATTGTTGGCTGA YTYACACGCCTATTTAAACCAGAAAGQAGAGTTG GATOAGArrAGAAAAATAGGAGATTA-TAACAAAA AAjGTTTTTGAAGCAATGGGGTYAAAGGCAAAATA TSrrTATGGáAGTTCGTTCCAGCTTGATAAGG attatacactgaatgtctatagattgsctttaaa AACTACCTTAARAAGA<3CAASAAGGACÍ'1!ATGGAA CTTATAGCAACAGAGGATGAAAATCCAAAGGTTG ctgaagttatctatccaataatgcaggttaatCT TC&TcattatCCGggcgttsatsttgcagttg gagggatggagcagagaaaaatacacatgttagc AAGGGAGCTTTTACCAAAAAAGGTTGTTTGTATT CACAACCCTGTCTTAACGGGTTTGGATGGAGAAQ GAAAGATGAGTTCYYCAAAAGGGAA-PTTTATAGC tgttgatgactctccagaacagattagggctaag ATAAAGAAAGCATACTGCCCAGCTGGAGTTCTTG AAíKAAATCCAATAATGGAGATAGCTAAATACTT CCTTGAATATCCTTTAACCATAAAAAGGCCAGAA aaatttggtggagatttgacagttaataoctatg AGGAGTTAGAGAGTTTATTTAAAAATAAGGAATT GCATCCAATQGATTTAAAAAATGCTGTAGCTGAA GAACTTATAAAGATTTTAGAGCCAATTAGAAAGA GATTA 127 ΕΡ1794323Β1 16 pPRO-PheRS-7; Sequência de aminoácidos do isolado 7 de aminoacil-tARN sintetase para-propargiloxifenilalanina, que possui as alterações de aminoácidos: Tyr32 - Ala32 Glul07 - Glnl07 Aspl58 Prol58 Ilel59 Glyl59 Leul62 Thrl62 derivado a partir de tirosil-tARN sintetase do tipo selvagem de Methanococcus jannaschii ;ΜΟΚΕ^1Κΐα4Τ5ΕΙΙ32ΕΕ1.ΙΙΕνΐ,?ΚαΕΚ5Αί; AlGPEPSGKIHLGíiYLQIKKMIDLQrJAGFDl I XLLADIiHATLiNQKGELDEI RKIGDYHKKVF EAMG1jKAKYVYGSQFQ1.DKDYTJjMVYRIAL KTTLKRARRSMELIAKEDBNPKVAEVIYPIM •QVNPGHYTGVBVAVGC^QRKIHMIARELI. PKKWC1HSPVLTGLDGEGKMSSSKOÍFIAV DDSPEEIRAKÍKKAYCPAGVVEGNPIMEIAK. YFr.EYPLTiKRPEKFGGDLTVKSYEELESrjF IOTKEJjHPMDLKNAVASKIoI KILEP1 RKRli 17 Sequência de nucleótidos de pPRO-PheRS-7 ATGGAOGAATT-TGaAATGATAAAGAGAAACACAT ctgaaattatcagcgagcíaagagttaagagaggt TTTAftAAAAAGATGARASATCTGCTGCTATAGG TTTTGAACCAAGTGGTAftAATACATTTAGGGCAT TATCTCCAAATAAAAAAGATGATTGATTTACAAS. ATGCTGGATTTGATATâATTATATTGTTOGCTGA TTTACACGCCrA'ITÍ’AAACCAGAAAGGAGAGTTG GATGASATTAGAaAAATASGiWSATTATAACAAAA AAGiTTmÇiAAGCAAiKJGGGTTAAAGGCAAAATA tstttatggaagoÕCttccagCTICsataagg ATTATACACTQAATGTCTATAGATTGGCTTTAAA WICTACCTTAAAAASA«CAAGAAGGAGTATGGAA CTTATAGCftAGAGAGGATGAAAATCCAAAGGTTG ctgaagttatctaíccaataatgcaggtta&tCC GSQQcattatACGgocgtogatgídtgcãgttg gagggatsgagcagagaraaatacacatgttagc AAGGGACtCTTTTACCAAAAAAGGTTGTTTGTATT cacaaccctgtcttaacgggtttggatggagaag GWiACATGAGTÍCTTCAftAAGGGAATTiTATAGC TGTTGATGACTCTCCAGAAGAGATTAGGGCTAAG ATAAAG&aAGCATACTGCCCAGCTGGAGTTQTTO AAGGAAATCCAATAATGGAGATASCTAAATACTT ccttgaatatcctttaaccataaaaaggccagaa AAATTTGGTGGA&ATTTGAC&GTTAATAGCmTO AGGAGSTAGASAGCTTATOAAAAATAAGGAMT GCATCCAATGGATTTAAAAAATGCTGTAGCTSAA GAACTTATAAAGATTTTAGAGCCAATTAGAAAGA GAITA ’ 128 ΕΡ1794323Β1
18 pPRO-PheKS-8; Sequência de aminoácidos do isolado 8 de aminoacil-tARN sintetase para-propargiloxifenilalanina, que possui as alterações de aminoácidos: Tyr32 - Ala32 Glul07 - Prol07 Aspl58 — Serl58 Ilel59 - Leul59 Leul62 - Hisl62 derivado a partir de tirosil-tARN sintetase do tipo selvagem de Methanococcus jannaschii AXGFERSGKIHLGHyLQlKKHIDLQNAGFDI I ILLADLHAYLNQKGEIjDEI RKXGDYNKKVF EAMGNKAKYWGSPFQI^KDYTNNVYRLAL KTTLKRASRSKELIAREDENPKVAEVTYPIM ςνΝ8ΙιΗΥΗί3νΐΐνΑνθ(3ΜΕΟΚΚΙΗΙ®ϋΑΚΕηΐ. PKKWCtHNPVLTGLDGEGKMSSSKGNFXAV DDSPEEIRAKIKKAYCPAGWEGNPIMEIAK YFI/EyPliTXKRPEKFGGDLTVWSYEELJESLP KNKEI»HPMDjjKNAVAEELIKILEPlRKRXi 19 Sequência de nucleótidos de pPRO-PheRS-8 ATGGACGAATOTGAAAitíÁTAAAGAGAAACACAT CTGAAATTATCAGCGASGAAGAGTTAAGAGAGGT CTTAàAAAAAGAXGAAAAATCTGCTGCTATAGG TTTTGAACCAAGTGGTAAAATACATTXAGGGCAT TATOTCCAAATAAAAAAGATGATTGATTTACAAA atgctggatttgatataattatattgttggctqa TTTACACGCCTAITTAftACCAGAAAGGAGAGTTQ gAtgagattâgaaaamaggagattataacaaaa AAGTTTXTGAAGCAATGGGGTTAãAGGCAAAATA TGTTTATGGAAG?rCCTTTCCAGCTTt3ATAAGG ATTATACACIGAATGTCTAYAGATTGGCTÍTAAA AACTACCTTAAAAAGAGCAA3AAGGAGTATGGAA CTTAXAGCAAGAGAQGATGAAAAXCCAAASGTXQ ctgaagttatctatccaataaxgcaggttaatTC TCTGcattatCATggcgttgatgttgcagttg gagggaxggagcagagaaaaatacacatgttagc AAGCKSAGCTTCTACCAAAAÃASOTXGXTTGTATT CACAACCCTOTCTTAACGGGrrTGGATGGAGAAS GAAAGATGAOXTCTTCAAAAGGGAATTTTATAGC TGTTGATGACTCTCCAG&AGAGATTAGGGCTAAG àTAAAGAAAGGATACXGCCCAGÇTGGAGTTGTTG AAGGAAATCCAATAATGGAGATAGCTAAATACTT ccttgaataxcctttaaccataaaaaggcc&gaa AAATTTGGTGGftGATTTGACAGTTAATAGCTATG AGGAGTTAGA.GAGTTTATTTAAAAATAAGGAAT'? gcatccaatggatttasaaaatgcigtagctgáa GAACXTATAAAGATTTTAâAGCCAATTAGAAAGA GATTA 20 Péptido triptico da mioglobina mutante (74-TAG) usado na análise de espectroraetria de massa HGVTVLTALGY' ILK 21 pPRO-PheRS-consenso; Sequência de aminoácidos consenso de aminoacil-tARN sintetase para-propargiloxifenilalanina KDEFBMIKKNTSEI ISEEEL.RBVU&CKDEKSA AlGFEPSGKIHliGiriLQIKKMIDIjQNAGFDI X ILLADLHAyLNQKGEIjDEX RKXGDYNKKVF EAMGLKAKYVYGS [p/03 fqldxdytlkvy RWlLKTTLKRARRSNEIíIAREDSNPKVAEVI . YRIMQVNAIHY lA/Pj GVDVAVGGEÍEQRKI HMLARELLPKKWCIHNPVLTGLDGEGKKSS SKGMFIAVDDSPSSIRAXIKKAYC PAGWEG ffPIMEXAKYFLEYRLTlKRPÈKFGGDLTVNS YEELESLFKNKELHPMDIJ^AVAEELIKILE PIRKRL 129 ΕΡ1794323Β1
22 pPro-PheRS-conl MDEFEMIKRNTSEXISEEELREVI/iíKDEKSA Aigfepsgkihlghyxqíkkmidlqnagfdi I HiIjADLI-iA.yXiWQKGELDHIRXIGDVWKKVF EAMGEKAKYVYGSPFQLDKDYTLBVYRIAIiK TTLKSAIWSMÉI/IAREDEKIPKVAEVIXPIMO VWAIHYAGVDVAVGGKEQRKIKMIiARELI.P KKWCIHHPVLTGLDGEGKMSSSKGNFTAVD DSPEEIRAKIKKAYCFAGVVEGNPIMEIAKY FLEYPLTIKRPEKFGGDLTVNSYEKLEStiFK WKELHPMDL.KNAVAEELI KXLEPIRKRL 23 pPro-PheRS-con2 MDEFEMIKRKTSEIISEEEI.REVI.KKDEKSA AlGFEPSGKIHLGHYIiQIKKMIDLQEfAGFDI ΙΙΕΕΜΪΙ.ΗΑΥΙιΚίΟΚσΕΕηΕΙΕΚΐαθΥΗΚΚνΕ EAMGIJCAKYVYGSPFQUDKDYTLWYRLAMC TTLKRARRSMELIAREDÉNPCTAE1/IYPIMQ VKAI HYPGVDVAVGGMEQRKIHMLARE LL P KKVVC I HM PYLTGr. f )G HGK MS S SKGMFI AVD DSPSEIRAKIKSAYCPAGWEGWPIMEIAKY FLEYPLTXKRPEEFGGDXjTVHSYEEIíESEFK NKSLH PMDLKHAVAEEL IKI bE PIRKRI. 24 pPro-PheRS-con3 HDEPKKIKRMTSEII SEEELREVLKXDEKSA AlGFEPSGKIHLGHYLQIKKMIDIiQKrAGFDI IIXjLADLHAYLIffQKGELDEIRKIGDYNKKVF EAMGLKAK YVYG S QF QADKB YTLNVYRXjALK ΤΤΕΚΚΑΚΚ5ΜΕΙ,ΙΑίΡΙΕηΕΝΡΚνΑΕνΐΥΡΧΜ3 vwAihyAgvdvavggkeqrkihmlarellp KKWCIHSIPVLTGIiDGSGKMSSSKGNFIAVD DS PEEIRAKIKKAYC PAGWEGNP ΣΜ3ΙAKY FLEYPLTIKRPEKFGGDLTVSfSYEE&ESLFK IXKSLHPMDLKIJAVAEELIKILjEPIRKRIj 25 pPro-PheRS-con4 MDEFEMIKRNTSEII SEEEliREVLKKDEKSA AIGFEPSGKIHLGHYLQIKKMIDIiQBÍAGFDI IILLADLHAYLNQKGELDEIRKIGDYtKKVF EAMGXKAKYVYGSQFQLDKDYTLNVYRLAEiK TTLKRARRSMELIAREDBiíPKVAEVIYPIMQ VNAIHYPGVDVAVGGMEQRKIHMIíAREI.ÍiP ΚΚννυΐΗΝΡνΐίΤΰΕ1Χ5ΕδΚΜ5Ε3ΚΟΝΡΙΑνΏ DSPEEIRAKIRKAYCPAGWEGNPIMEXAKY FLEYPXjTIKRPEKFGGDI/TVIÍSYSELES.LFK NKELHEMDLKmVAEELIKtliEPIRKSL 130 ΕΡ1794323Β1
DOCUMENTOS REFERIDOS NA DESCRIÇÃO
Esta lista de documentos referidos pelo autor do presente pedido de patente foi elaborada apenas para informação do leitor. Não é parte integrante do documento de patente europeia. Não obstante o cuidado na sua elaboração, o IEP não assume qualquer responsabilidade por eventuais erros ou omissões.
Documentos de patentes citados na descrição wo 2002086075 A [0005] [0077] [0083] [0106] [0114] wo 2002085923 A [0005] [0077] [0083] [0109] [0141] [0143] [0203] [0209] [0220] [0221] WO 2004094593 A [0005] [0083] [0106] [0109] [0114] [0119] [0140] [0203] [0209] [0220] WO 2005019415 A [0005] [0077] [0083] [0106] wo 2005007870 A [0005] [0077] [0083] wo 2005007624 A [0005] [0077] [0083] us 2003108885 Al [0007] wo 02085923 A [0010] wo 20409459 A [0077] us 6238884 B, Short [0111] us 5756316 A, Schallenberger [0111] us 5783431 A, Petersen [0111] us 5824485 A, Thompson [0111] us 5958672 A, Short [0111] wo 2004058946 A [0141] [0142] [0220] wo 0046344 A [0144] wo 2004035605 A [0220]
Literatura de não patentes citada na descrição • LEMINEUX, G. A.; BERTOZZI, C. R. TIBTECH, 1996, vol. 16, 506 [0002] • A. BOCK et al. Molecular Microbiology, 1991, vol. 5, 515-20 [0004] 131 ΕΡ1794323Β1 • G. SRINIVASAN et al. Science, 2002, vol. 296, 1459-62 [0004] • WANG et al. Science, 2001, vol. 292, 498-500 [0005] [0008] • CHIN et al. Journal of the American Chemical Society, 2002, vol. 124, 9026-9027 [0005] • CHIN; SCHULTZ. ChemBioChem, 2002, vol. 11, 1135-1137 [0005] • CHIN et al. PNAS United States of America, 2002, vol. 99, 11020-11024 [0005] • WANG; SCHULTZ. Chem. Comm., 2002, 1-10 [0005] • KOBAYASHI et al. Nature Structural Biology, 2003, vol. 10 [6] , 425-432 [0009] • PADWA. Comprehensive Organic Synthesis. Pergamon, 1991, vol. 4, 1069-1109 [0068] • HUISGEN. 1,3-Dipolar Cycloaddition Chemistry. Wiley, 1984, 1-176 [0068] • TORNOE et al. J. Org. Chem., 2002, vol. 67, 3057-3064 [0068] • ROSTOVTSEV et al. Angew. Chem., Int. Ed., 2002, vol. 41, 2596-2599 [0068] • The chemistry of the azido group. PATAI, SAUL. The Chemistry of Functional Groups. Interscience Publishers, 1971 [0071] • DEITERS et al. Site-specific PEGylation of proteins containing unnatural amino acids. Bioorganic & Medicinal Chemistry Letters, 2004, vol. 14, 5743-5745 [0073] • FRANCISCO, J. A. et al. Production and fluorescence-activated cell sorting of Escherichia coli expressing a functional antibody fragment on the externai surface. Proc Natl Acad Sei USA, 1993, vol. 90, 10444-8 [0105] • FORSTER et al. Programming peptidomimetic synthetases by translating genetic codes designed de novo. PNAS, 2003, vol. 100 (11), 6353-6357 [0106]
• FENG et al. Expanding tRNA recognition of a tRNA 132 ΕΡ1794323Β1 synthetase by a single amino acid change. PNAS, 2003, vol. 100 (10), 5676-5681 [0106] • HOBEN; SOLL. Methods Enzymol, 1985, vol. 113, 55-59 [0109] • SAYERS, J.R. et al. 5', 3' Exonuclease in phosphorothioate-based oligonucleotide-directed mutagenesis. Nucleic Acids Res, 1988, 791-802 [0121] • MA et al. Biochemistry, 1993, vol. 32, 7939 [0123] [0125] • KOWAL; OLIVER. Nucl. Acid. [0123] Res., 1997, vol. 25, 4685 • ANDERSON et al. Exploring the Limits of Codon and
Anticodon Size. Chemistry and Biology, 2002, vol. 9, 237-244 [0124] • MAGLIERY. Expanding the Genetics Code: Selection of
Efficient Suppressors of Four-base Codons and Identification of '' Shifty' ' Four-base Codons with a Library Approach in Escherichia coli. J. Mol. Biol., 2001, vol. 307, 755-769 [0124] • HOHSAKA et al. J. Am. Chem. Soc., 1999, vol. 121, 34 [0125] • HOHSAKA et al. J. Am. Chem. Soc., 1999, vol. 121, 12194 [0125] • MOORE et al. J. Mol. Biol., 2000, vol. 298, 195 [0125] • HIRAO et al. An unnatural base pair for incorporating amino acid analogues into protein. Nature biotechnology, 2002, vol. 20, 177-182 [0127] • WU, Y. et al. J. Am. Chem. Soc., 2002, vol. 124, 14626- 14630 [0127] • SWITZER et al. J. Am. Chem. Soc., 1989, vol. 111, 8322 [0128] • PICCIRILLI et al. Nature, 1990, vol. 343, 33 [0128] • KOOL. Curr. Opin. Chem. Biol., 1990, vol. 4, 602 [0128] • KOOL. Curr. Opin. Chem. Biol., 2000, vol. 4, 602 [0128] • GUCKIAN; KOOL. Angew. Chem. Int. Ed. Engl., 19 98, vol. 36, 2825 [0128] 133 ΕΡ1794323Β1 • MCMINN et al. J. Am. Chem. Soc., 1999, vol. 121, 11586 [0128] • OGAWA et al. J. Am. Chem. Soc., 2000, vol. 122 , 3274 [0128] • OGAWA et al. J. Am. Chem. Soc., 2000, vol. 122 , 8803 [0128] • TAE et al. J. Am. Chem . Soc., 2001, vol. 123, 7439 [0128] • MEGGERS et al. J. Am. Chem. Soc., 2000, vol. 122, 10714 [0128] • Biochemistry, 1988 [0131] • FESSENDON; FESSENDON. Organic Chemistry . Willard Grant Press, 1982 [0141] • MARCH. Advanced Organic Chemistry. Wiley and Sons , 1985 [0141] • CAREY; SUNDBERG. Advanced Organic Chemistry. Plenum Press, 1990 [0141] • MATSOUKAS et al. J. Med. Chem., 1995, vol. 38, 4660-4669 [0141] • KING, F.E.; KIDD, D.A.A. A New Synthesis of Glutamine and of D-Dipeptides of Glutamic Acid from Phthylated Intermediates. J. Chem. Soc., 1949, 3315-3319 [0141] • FRIEDMAN, O.M. ; CHATTERRJI, R. Synthesis of Derivatives of Glutamine as Model Substrates for Anti-Tumor Agents. J. Am. Chem. Soc., 1959, vol. 81, 3750-3752 [0141] • CRAIG, J.C. et al. Absolute Configuration of the
Enantiomers of 7-Chloro-4 [[4-(diethylamano)-1- methylbutyl]amino]quinoline (Chloroquine). J. Org. Chem., 1988, vol. 53, 1167-1170 [0141] • AZOULAY, M.; VILMONT, M. ; FRAPPIER, F. Glutamine analogues as Potential Antimalarials. Eur. J. Med. Chem., 1991, vol. 26, 201-5 [0141] • KOSKINEN, A.M.P.; RAPOPORT, H. Synthesis of 4-Substituted Prolines as Conformationally Constrained Amino Acid Analogues. J. Org. Chem., 1989, vol. 54, 1859-1866 [0141] • CHRISTIE, B.D.; RAPOPORT, H. Synthesis of Optically Pure 134 ΕΡ1794323Β1
Pipecolates from L-Asparagine. Application to the Total Syntlzesis of (+)-Apovincamine through Amino Acid
Decarbonylation and Iminium Ion Cyclization. J. Org. Chem., 1985, 1859-1866 [0141] • BARTON et al. Synthesis of Novel a-Amino-Acids and
Derivatives Using Radical Chemistry: Synthesis of L- and D-a-Amino-Adipic Acids, L-a-aminopimelic Acid and
Appropriate Unsaturated Derivatives. Tetrahedron Lett., 1987, vol. 43, 4297-4308 [0141] • SUBASINGHE et al. Quisqualic acid analogues: synthesis of beta-heterocyclic 2-aminopropanoic acid derivatives and their activity at a novel quisqualate- sensitized site. J. Med. Chem., 1992, vol. 35, 4602-7 [0141] • LIU; SCHULTZ. Progress toward the evolution of an organism with an expanded genetic code. PNAS, 1999, vol. 96, 4780-4785 [0142] • STEMMER. Rapid evolution of a protein in vitro by DNA shuffling. Nature, 1994, vol. 370 (4), 389-391 [0144] • STEMMER. DNA shuffling by random fragmentation and reassembly: In vitro recombination for molecular evolution. Proc. Natl. Acad. Sei. USA., 1994, vol. 91, 10747-10751 [0144] • CRAMERI et al. DNA shuffling of a family of genes from diverse species accelerates directed evolution. Nature, 1998, vol. 391 (6664), 288-291 [0144] • OSTERMEIER et al. A combinatorial approach to hybrid enzymes independent of DNA homology. Nature Biotech, 1999, vol. 17, 1205 [0144] • OSTERMEIER et al. Combinatorial Protein Engineering by Incremental Truncation. Proc. Natl. Acad. Sei. USA, 1999, vol. 96, 3562-67 [0144] • OSTERMEIER et al. Incremental Truncation as a Strategy in the Engineering of Novel Biocatalysts. Biological and Medicinal Chemistry, 1999, vol. 7, 2139-44 [0144] • DELEGRAVE; YOUVAN. Biotechnology Research, 1993, vol. 11, 135 ΕΡ1794323Β1 1548-1552 [0144] • ARKIN; YOUVAN. Optimizing nucleotide mixtures to encode specific subsets of amino acids for semi-random mutagenesis. Biotechnology, 1992, vol. 10, 297-300 [0144] • REIDHAAR—OLSON et al. Random mutagenesis of protein seguences using oligonucleotide cassettes. Methods Enzymol, 1991, vol. 208, 564-86 [0144] • PATNAIK et al. Genome shuffling of lactobacillus for improved acid tolerance. Nature Biotechnology, 2002, vol. 20 (7), 707-712 [0145] • ZHANG et al. Genome shuffling leads to rapid phenotypic improvement in bactéria. Nature, 07 February 2002, vol. 415 (6872), 644-646 [0145] • NAKAMURA; WHITE. Metabolic engineering for the microbial production of 1,3 propanediol. Curr. Opin. Biotechnol., 2003, vol. 14 (5), 454-9 [0146] • BERRY et al. Application of Metabolic Engineering to improve both the production and use of Biotech índigo. J. Industrial Microbiology and Biotechnology, 2002, vol. 28, 127-133 [0146] • BANTA et al. Optimizing an artificial metabolic pathway:
Engineering the cofactor specificity of Corynebacterium 2,5-diketo-D-gluconic acid reductase for use in vitamin C biosynthesis. Biochemistry, 2002, vol. 41 (2U), 6226-36 [0146] • SELIVONOVA et al. Rapid Evolution of Novel Traits in Microorganisms. Applied and Environmental Microbiology., 2001, vol. 67, 3645 [0146] • OverView of principies of hybridization and the strategy of nucleic acid probe assays. TIJSSEN. Laboratory Techniques in Biochemistry and Molecular Biology— Hybridization with Nucleic Acid Probes. Elsevier, 1993 [0176] • Current Protocols in Molecular Biology. Current
Protocols, 2004 [0176] [0190] [0193] 136 ΕΡ1794323Β1 HAMES; HIGGINS. Gene Probes 1. IRL Press at Oxford University Press, 1995 [0176] HAMES; HIGGINS. Gene Probes 2 . IRL Press at Oxford University Press, 1995 [0176] SMITH; WATERMAN. [0190] Adv. Appl. Math. , 1981, vol. 2, 482 NEEDLERNAN; WUNSCH. J. Mol. Biol, 1970, vol. 48, 443 [0190] PEARSON; LIPMAN. Proc. Nat'l. Acad. Sei. USA, 1988, vol. 85, 2444 [0190] • ALTSCHUL et al. J. Mol. Biol, 1990, vol. 215, 403-410 [0191] • HENIKOFF; HENIKOFF. Proc. Natl. Acad. Sei. USA, 1989, vol. 89, 10915 [0191] • KARLIN; ALTSCHUL. Proc. Nat'l. Acad. Sei. USA, 1993, vol. 90, 5873-5787 [0192] • Guide to Molecular Cloning Techniques. BERGER; KIMMEL. Methods in Enzymology. Academic Press, Inc, vol. 152 [0193] • SAMBROOK et al. Molecular Cloning - A Laboratory Manual. Cold Spring Harbor Laboratory, vol. 1 [0193] • GILIMAN; SMITH. Gene, 1979, vol. 8, 81 [0195] • ROBERTS et al. Nature, 1987, vol. 328, 731 [0195] • SCHNEIDER, B. et al. Protein Expr. Purif., 1995, vol. 6435, 10 [0195] • FROM et al. Proc. Natl. Acad. Sei. USA, 1985, vol. 82, 5824 [0195] • KLEIN et al. Nature, 1987, vol. 327, 70-73 [0195] • The ATCC Catalogue of Bactéria and Bacteriophage. ATCC, 1996 [0196] • WATSON et al. Recombinant DNA. Scientific American Books, 1992 [0196] • FRESHNEY. Culture of Animal Cells, a Manual of Basic
Technique. Wiley- Liss, 1994 [0197] • PAYNE et al. Plant Cell and Tissue Culture in Liquid 137 ΕΡ1794323Β1
Systems, 1992 [0197] • Plant Cell, Tissue and Organ Culture; Fundamental Methods Springer Lab Manual. Springer-Verlag, 1995 [0197] • The Handbook of Microbiological Media. CRC Press, 1993 [0197] • DOUGHERTY. Unnatural Amino Acids as Probes of Protein Structure and Function. Current Opinion in Chemical Biology, 2000, vol. 4, 645-652 [0205] • PAUL. Fundamental Immunology. Raven Press, 1999 [0219] HARLOW; LANE. Antibodies, A Laboratory Manual. Cold Spring Harbor Publications, 1988 [0220] ANDERSON et al. Proc. Natl. Acad. Sei. U.S.A., 2004, vol. 101, 7566 [0224] ALFONTA et al. J. Am. Chem, . Soc., 2003, vol. 125, 14662 [0224] WANG et al. Proc. Natl. Acad. Sei. U.S.A., 2003, vol. 100, 56 [0224] • CHIN et al. Science, 2003, vol. 301, 964 [0224] • CHIN et al. Proc. Natl. Acad. Sei., 2002, vol. 99, 11020 [0224] • WANG et al. Science, 2001, vol. 292, 498 [0224] • PADWA. Comprehensive Organic Synthesis. Pergamon, 1991, vol. 4, 1069 [0225] • HUISGEN. 1,3-Dipolar Cycloaddizion Chemistry. Wiley, 1984, 1 [0225] • ROSTOVTSEV et al. Angew. Chem. Int. Ed., 2002, vol. 41, 2596 [0225] DEITERS et al . J. Am. Chem. Soc., 2003, vol. 125, 11782 [0225] [0241] [0245] WANG et al. J. Am. Chem. Soc., 2003, vol. 125, 3192 [0225] [0241] [0243] [0245] LINK; TIRRELL . J. Am. Chem. Soc., 2003, vol. 125, 11164 [0225] [0241] [0245] STEER ; SCHIMMEL. Biol. Chem., 1999, vol. 27 4, 35601 138 [0227] ΕΡ1794323Β1 • REEDY; GIBNEY. Chem. Rev., 2004, vol. 104, 617 [0233] • UZAWA et al. Proc. Natl. Acad. Sei. U.S.A., 2004, vol. 101, 1171 [0233] • WRIGHT; BALDWIN. Frontiers in Molecular Biology: Mechanisms of Protein Folding. Oxford University
Press, 2000, 309 [0233] • SHEVCHENKO et al. Anal. Chem., 1996, vol. 68, 850-858 [0237] • WANG et al. J. Am. Chem. Soc, 2003, vol. 125, 3192 [0243] • BLAKE. Curr. Opin. Pharmacol., 2001, vol. 1, 533 [0243] • WOUTERS et al. Trends in Cell Biology, 2001, vol. 11, 203 [0243] • ZACHARIAS et al. Curr. Opin. Neurobiol., 2000, vol. 10, 416 [0243] • CARBONI et al. Org. Chem., 1993, vol. 58, 3736-3741 [0249]
Lisboa, 22 de Outubro de 2014 139

Claims (21)

  1. ΕΡ1794323Β1 REIVINDICAÇÕES 1. Uma célula eubacteriana que compreende uma primeira sintetase ortogonal de aminoacil-tARN (O-RS) que funciona na célula, em que a O-RS aminoacila preferencialmente um primeiro tARN ortogonal (O-tARN), com um primeiro aminoácido não natural que é um aminoácido alquinilo; em que o aminoácido alquinilo é uma tirosina substituída em para ou uma fenilalanina substituída em para, em que a tirosina ou a fenilalanina está substituída na posição com um grupo etinilo ou propinilo; e em que a O-RS aminoacila o Ο-tARN com o primeiro aminoácido não natural com uma eficiência de supressão de pelo menos 50 % da eficiência de supressão de um par sintetase ortogonal, em que dito par é o Ο-tARN com a SEQ ID NO: 1 e um polipeptídeo de sintetase que compreende uma sequência de aminoácidos selecionada a partir de qualquer uma das SEQ ID NO: 4, 6, 8, 10, 12, 14, 16, 18, 21, 22, 23, 24 e 25.
  2. 2. Um método de produção de uma proteína que compreende um aminoácido alquinilo não natural numa célula eubacteriana, em que o aminoácido alquinilo está numa posição especificada, compreendendo o método: (a) proporcionar uma célula eubacteriana que compreende: (i) uma sintetase ortogonal de aminoacil-tARN (O-RS); (ii) um tARN ortogonal (O-tARN), em que a O-RS referida aminoacila preferencialmente o O-tARN referido com o aminoácido alquinilo referido, com uma eficiência de supressão de pelo menos 50 % da eficiência de supressão de um par sintetase ortogonal, 1 ΕΡ1794323Β1 em que o dito par é o O-tARN com a SEQ ID NO: 1 e um polipéptido de sintetase que compreende uma sequência de aminoácidos selecionada a partir de qualquer uma das SEQ ID NO: 4, 6, 8, 10, 12, 14, 16, 18, 21, 22, 23, 24 e 25; (iii) um ácido nucleico que codifica para a proteína referida, em que o ácido nucleico compreende pelo menos um codão seletor que é reconhecido pelo O-tARN; e, (iv) o aminoácido alquinilo referido, em que o aminoácido alquinilo é uma tirosina substituída em para ou uma fenilalanina substituída em para, em que a tirosina ou a fenilalanina está substituída na posição para com um grupo etinilo ou propinilo; e, (b) o crescimento da célula referida; (c) a incorporação do aminoácido alquinilo referido na posição especificada referida na proteína codificada pelo ácido nucleico durante a tradução da proteína, em que a posição especificada na proteína corresponde à posição do codão seletor no ácido nucleico referido, produzindo assim a proteína referida, que compreende o aminoácido alquinilo referido na posição especificada.
  3. 3. A célula da reivindicação 1 ou o método da reivindicação 2 em que a célula eubacteriana é uma célula de E. coli.
  4. 4. A célula da reivindicação 1, o método da reivindicação 2, em que: (i) a 0-RS é pelo menos 95 % idêntica a uma sintetase de aminoacil-tARN de Methanococcus jannaschii·, ou 2 ΕΡ1794323Β1 (ii) a O-RS é pelo menos 95 % idêntica a uma sintetase de tirosil-tARN de Methanococcus jannaschii; ou (iii) a O-RS é pelo menos 95 % idêntica à sintetase de tirosil-tARN do tipo selvagem de Methanococcus jannaschii, possuindo a sequência de aminoácidos da SEQ ID NO: 2; ou (iv) a O-RS é pelo menos 95 % idêntica à sintetase de tirosil-tARN do tipo selvagem de Methanococcus jannaschii, que possui a sequência de aminoácidos da SEQ ID NO: 2, em que a O-RS compreende uma sequência de aminoácidos que compreende: (a) alanina, histidina, serina ou treonina numa posição que corresponde à posição de aminoácido 32 da SEQ ID NO: 21; (b) prolina, glutamina, lisina, arginina, serina ou alanina numa posição que corresponde à posição de aminoácido 107 da SEQ ID NO: 21; (c) alanina, leucina, prolina ou serina numa posição que corresponde à posição de aminoácido 158 da SEQ ID NO: 21; e (d) alanina, histidina, treonina ou prolina numa posição que corresponde à posição de aminoácido 162 da SEQ ID NO: 21; ou (v) a O-RS é pelo menos 95 % idêntica à sintetase de tirosil-tARN do tipo selvagem de Methanococcus jannaschii, que possui a sequência de aminoácidos da SEQ ID NO: 2, em que a O-RS compreende uma sequência de aminoácidos que compreende: 3 ΕΡ1794323Β1 (a) a alanina numa posição que corresponde à posição de aminoácido 32 da SEQ ID NO: 21; (b) a prolina ou a glutamina numa posição que corresponde à posição de aminoácido 107 da SEQ ID NO: 21; (c) a alanina numa posição que corresponde à posição de aminoácido 158 da SEQ ID NO 21; e (d) a alanina ou a prolina numa posição que corresponde à posição de aminoácido 162 da SEQ ID NO 21; ou (vi) a O-RS compreende uma sequência de aminoácidos selecionada a partir da SEQ ID NO: 4, 6, 8, 10, 12, 14, 16, 18, e variantes conservadoras da mesma.
  5. 5. A célula da reivindicação 1, o método da reivindicação 2, em que a célula compreende um polinucleótido que codifica para a O-RS, em que a O-RS compreende uma sequência de aminoácidos selecionada a partir da SEQ ID NO: 4, 6, 8, 10, 12, 14, 16, 18, e variantes conservadoras da mesma.
  6. 6. A célula ou o método da reivindicação 5, em que o polinucleótido é selecionado a partir das sequências de nucleótidos da SEQ ID NO: 5, 7, 9, 11, 13, 15, 17 ou 19.
  7. 7. A célula da reivindicação 1 ou o método da reivindicação 2, em que: (a) o O-tARN é um tARN supressor âmbar; ou (b) o Ο-tARN compreende ou é codificado por uma sequência polinucleotidica estabelecida na SEQ ID NO: 1. 4 ΕΡ1794323Β1
  8. 8. A célula da reivindicação 1 ou o método da reivindicação 2, em que o aminoácido alquinilo referido é a para-proparqiloxifenilalanina.
  9. 9. A célula da reivindicação 1 ou o método da reivindicação 2, que compreende um ácido nucleico que compreende pelo menos um codão seletor, em que o codão seletor referido é reconhecido pelo primeiro O-tARN referido.
  10. 10. A célula ou o método da reivindicação 9, que compreende uma sequnda O-RS e um segundo O-tARN, em que a segunda O-RS aminoacila preferencialmente o segundo O-tARN com um segundo aminoácido não natural, que é diferente do primeiro aminoácido não natural, e em que o segundo O-tARN reconhece um codão seletor que é diferente do codão seletor reconhecido pelo primeiro O-tARN.
  11. 11. A célula da reivindicação 1 que compreende o aminoácido alquinilo referido.
  12. 12. A célula da reivindicação 11 em que o aminoácido alquinilo referido é a para-propargiloxifenilalanina.
  13. 13. A célula da reivindicação 1 que compreende um sistema de tradução.
  14. 14. A célula da reivindicação 13, compreendendo o sistema de tradução referido: (a) a O-RS referida; (b) o O-tARN referido; (c) um ácido nucleico que codifica para um polipéptido de 5 ΕΡ1794323Β1 interesse, o ácido nucleico que compreende pelo menos um codão seletor, em que o codão seletor é reconhecido pelo O-tARN referido; e, (d) um aminoácido alquinilo em que a O-RS referida é capaz de carregar o O-tARN referido com o aminoácido alquinilo referido. 15. 0 método da reivindicação 2, em que a proteína referida compreende uma proteína terapêutica do tipo selvagem, uma proteína de diagnóstico, uma enzima industrial ou uma porção da mesma. 16. 0 método da reivindicação 15, em que, depois de se ter obtido a proteína referida, a proteína é formulada numa composição com um transportador farmaceuticamente aceitável. 17. 0 método da reivindicação 2, em que a proteína referida é modificada na posição especificada referida. 18. 0 método da reivindicação 17, em que a proteína referida compreende uma ligação triazol na posição especificada referida.
  15. 19. Um polipéptido que é pelo menos 90 % idêntico à sintetase de tirosil aminoacil-tARN de Methanococcus jannaschii com a SEQ ID NO: 2, em que o polipéptido tem uma sequência de aminoácidos que compreende: (a) alanina, histidina, serina ou treonina numa posição que corresponde à posição de aminoácido 32 da SEQ ID NO: 21; (b) prolina, glutamina, lisina, arginina, serina ou 6 ΕΡ1794323Β1 alanina numa posição que corresponde à posição de aminoácido 107 da SEQ ID NO: 21; (c) alanina, leucina, prolina ou serina numa posição que corresponde à posição de aminoácido 158 da SEQ ID NO: 21; e (d) alanina, histidina, treonina ou prolina numa posição que corresponde à posição de aminoácido 162 da SEQ ID NO: 21; e em que o polipéptido é uma sintetase de aminoacil-tARN capaz de aminoacilar preferencialmente um tARN ortogonal (Ο-tARN) com um aminoácido alquinilo, em que o aminoácido alquinilo é uma tirosina substituída em para ou uma fenilalanina substituída em para, em que a tirosina ou a fenilalanina está substituída na posição para com um grupo etinilo ou propinilo; e em que a O-RS aminoacila o Ο-tARN com o primeiro aminoácido não natural com uma eficiência de supressão de pelo menos 50 % da eficiência de supressão de um par sintetase ortogonal, em que o par é o Ο-tARN da SEQ ID NO: 1 e um polipéptido de sintetase que compreende uma sequência de aminoácidos selecionada a partir de qualquer uma das SEQ ID NO: 4, 6, 8, 10, 12, 14, 16, 18, 21, 22, 23, 24 e 25.
  16. 20. O polipéptido da reivindicação 19, que possui uma sequência de aminoácidos que compreende: (a) a alanina numa posição que corresponde à posição de aminoácido 32 da SEQ ID NO: 21; (b) a prolina ou a glutamina numa posição que corresponde à posição de aminoácido 107 da SEQ ID NO: 21; 7 ΕΡ1794323Β1 (c) a alanina numa posição que corresponde à posição de aminoácido 158 da SEQ ID NO: 21; e (d) a alanina numa posição que corresponde à posição de aminoácido 162 da SEQ ID NO: 21.
  17. 21. Um polipéptido que compreende uma sequência de aminoácidos apresentada na SEQ ID NO: 4, 6, 8, 10, 12, 14, 16, 18, ou uma variante conservativa da mesma, em que o polipéptido referido é uma sintetase de aminoacil-tARN capaz de aminoacilar preferencialmente um tARN ortogonal (O-tARN) numa célula eubacteriana com um aminoácido alquinilo, em que o aminoácido alquinilo é uma tirosina que está substituída na posição para com um grupo etinilo ou propinilo, ou o aminoácido alquinilo é uma fenilalanina que está substituída na posição para com um grupo etinilo ou propinilo; e em que a O-RS aminoacila o Ο-tARN com o primeiro aminoácido não natural com uma eficiência de supressão de pelo menos 50 % da eficiência de supressão de um par sintetase ortogonal, em que o par é o O-tARNt da SEQ ID NO: 1 e um polipéptido de sintetase, que compreende uma sequência de aminoácidos selecionada a partir de qualquer uma das SEQ ID NO: 4, 6, 8, 10, 12, 14, 16, 18, 21, 22, 23, 24 e 25.
  18. 22. Um polinucleótido que codifica para um polipéptido de qualquer uma das reivindicações de 19 a 21.
  19. 23. O polinucleótido da reivindicação 22, em que o polinucleótido é selecionado a partir da SEQ ID NO: 5, 7, 9, 11, 13, 15, 17 e 19.
  20. 24. Um vetor que compreende um polinucleótido da reivindicação 22. 8 ΕΡ1794323Β1 25. 0 vetor da reivindicação 24 em que o vetor é um vetor de expressão.
  21. 26. Uma célula que compreende o vetor da reivindicação 24. Lisboa, 22 de Outubro de 2014 9
PT58120080T 2004-09-21 2005-09-20 Incorporação in vivo de aminoácidos alquinilo em proteínas em eubactérias PT1794323E (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US61222004P 2004-09-21 2004-09-21
US63087604P 2004-11-24 2004-11-24
US63415104P 2004-12-07 2004-12-07

Publications (1)

Publication Number Publication Date
PT1794323E true PT1794323E (pt) 2014-10-30

Family

ID=36090646

Family Applications (1)

Application Number Title Priority Date Filing Date
PT58120080T PT1794323E (pt) 2004-09-21 2005-09-20 Incorporação in vivo de aminoácidos alquinilo em proteínas em eubactérias

Country Status (13)

Country Link
US (2) US7718410B2 (pt)
EP (2) EP1794323B1 (pt)
JP (2) JP2008513039A (pt)
CN (1) CN101151366B (pt)
AU (1) AU2005286722B2 (pt)
BR (1) BRPI0515547A (pt)
CA (1) CA2580840A1 (pt)
ES (2) ES2519444T3 (pt)
IL (3) IL182035A0 (pt)
MX (1) MX2007003142A (pt)
PL (1) PL1794323T3 (pt)
PT (1) PT1794323E (pt)
WO (1) WO2006034332A2 (pt)

Families Citing this family (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2444098C (en) * 2001-04-19 2016-06-21 The Scripps Research Institute Methods and composition for the production of orthogonal trna-aminoacyltrna synthetase pairs
WO2004035605A2 (en) * 2002-10-16 2004-04-29 The Scripps Research Institute Glycoprotein synthesis
CN103215228A (zh) 2003-04-17 2013-07-24 斯克利普斯研究院 扩展真核生物遗传密码
DE602004011789T2 (de) 2003-07-07 2009-02-12 The Scripps Research Institute, La Jolla Zusammensetzungen der orthogonalen Lysyl-tRNA und Aminoacyl-tRNA Synthetase Paaren und ihre Verwendungen
JP2008513806A (ja) * 2004-09-22 2008-05-01 ザ スクリップス リサーチ インスティテュート Nmr試験のための蛋白質の部位特異的標識
JP5135504B2 (ja) * 2004-10-27 2013-02-06 ザ スクリプス リサーチ インスティチュート 非天然アミノ酸のインビボ組込み用直交翻訳成分
BRPI0617191A2 (pt) * 2005-10-12 2011-07-19 Scripps Research Inst modificação pós-traducional de polipeptìdeos expressos em fagos
WO2007092475A2 (en) * 2006-02-06 2007-08-16 Franklin And Marshall College Site-specific incorporation of fluorinated amino acids into proteins
WO2007103490A2 (en) 2006-03-09 2007-09-13 The Scripps Research Institute System for the expression of orthogonal translation components in eubacterial host cells
CN101405401B (zh) 2006-03-16 2013-03-27 斯克利普斯研究院 含非天然氨基酸苯基硒代半胱氨酸的蛋白质的遗传编程表达
US8192952B2 (en) * 2006-05-23 2012-06-05 The Scripps Research Institute Genetically encoded fluorescent coumarin amino acids
JP5385143B2 (ja) * 2006-09-21 2014-01-08 ザ スクリプス リサーチ インスティチュート 真正細菌における選択的に硫酸化された蛋白質の遺伝的にプログラムされた発現
CN101535338A (zh) 2006-10-18 2009-09-16 斯克利普斯研究院 在哺乳动物细胞中将非天然氨基酸遗传掺入蛋白质
KR20100088618A (ko) 2007-10-25 2010-08-09 더 스크립스 리서치 인스티튜트 리덕타제 내로의 3-아미노티로신의 유전적 도입
EP2220218A4 (en) * 2007-11-02 2010-12-08 Scripps Research Inst BORONIC AMINO ACID GENETICALLY CODED
AU2008325239A1 (en) 2007-11-02 2009-05-14 The Scripps Research Institute Directed evolution using proteins comprising unnatural amino acids
US8647840B2 (en) 2007-12-11 2014-02-11 The Scripps Research Institute In vivo unnatural amino acid expression in the methylotrophic yeast Pichia pastoris
MX2010008633A (es) * 2008-02-08 2010-09-30 Scripps Research Inst Ruptura de tolerancia inmunologica con un aminoacido no natural geneticamente codificado.
KR101367219B1 (ko) 2008-04-30 2014-03-14 지멘스 메디컬 솔루션즈 유에스에이, 인크. 기질 기재 pet 조영제
US20090197339A1 (en) * 2008-12-10 2009-08-06 The Scripps Research Institute In vivo unnatural amino acid expression in the methylotrophic yeast pichia pastoris
JP5959201B2 (ja) * 2008-12-10 2016-08-02 ザ スクリプス リサーチ インスティテュート 化学的に反応性の非天然アミノ酸を使用するキャリア−ペプチド接合体の製造
GB2470770A (en) 2009-06-04 2010-12-08 Medical Res Council Incorporation of unnatural amino acids having an orthogonal functional group into polypeptides using orthogonal tRNA/tRNA synthetase pairs
US8828395B2 (en) 2009-12-11 2014-09-09 Atyr Pharma, Inc. Antibodies that bind tyrosyl-tRNA synthetases
JP5964304B2 (ja) 2010-08-25 2016-08-03 エータイアー ファーマ, インコーポレイテッド チロシルtRNA合成酵素のタンパク質フラグメントに関連した治療用、診断用および抗体組成物の革新的発見
US9714419B2 (en) 2011-08-09 2017-07-25 Atyr Pharma, Inc. PEGylated tyrosyl-tRNA synthetase polypeptides
WO2013171485A1 (en) 2012-05-18 2013-11-21 Medical Research Council Methods of incorporating an amino acid comprising a bcn group into a polypeptide using an orthogonal codon encoding it and an orthorgonal pylrs synthase.
CN103571804B (zh) * 2012-08-10 2015-08-12 中国科学院生物物理研究所 3-吡唑基酪氨酸翻译系统及其应用
EP2948469A4 (en) 2013-01-23 2016-11-02 Univ Leland Stanford Junior STABILIZED HEPATITIS B CORE POLYPEPTIDE
US9255255B2 (en) 2013-03-04 2016-02-09 The Board Of Trustees Of The Leland Stanford Junior University Synthesis of linear and branched polymers of polypeptides through direct conjugation
UY35368A (es) 2013-03-08 2014-10-31 Irm Llc Péptidos y composiciones para el tratamiento de daño articular
EP3021942A4 (en) 2013-07-19 2017-04-19 The Regents of The University of California Milk fat globule epidermal growth factor 8 regulates fatty acid uptake
GB2528227A (en) 2014-03-14 2016-01-20 Medical Res Council Cyclopropene amino acids and methods
CN106084017B (zh) * 2016-06-13 2019-11-22 浙江大学 一种大肠杆菌水通道蛋白AQPZ中整合非天然氨基酸pPpa的方法
CN109996809A (zh) 2016-11-14 2019-07-09 诺华股份有限公司 与促融合蛋白minion相关的组合物、方法和治疗用途
WO2018087727A1 (en) 2016-11-14 2018-05-17 Novartis Ag Methods and compositions for treatment of cartilage damage and arthritis
EP3927815A2 (en) * 2019-02-20 2021-12-29 Novo Nordisk A/S Aminoacyl-trna synthetases and uses hereof
KR102152939B1 (ko) * 2019-04-30 2020-09-07 한국화학연구원 공유결합성 트리아졸로 연결된 가시광선 흡수 광촉매, 이의 제조방법 및 이를 이용한 아자이드-알카인 고리화 첨가반응으로 트리아졸 유도체를 제조하는 방법
CN114107394B (zh) * 2021-11-05 2024-01-30 中国科学院精密测量科学与技术创新研究院 一种慢病毒转移载体、表达PylRS及tRNACUA的细胞系及制备方法与应用

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2444098C (en) 2001-04-19 2016-06-21 The Scripps Research Institute Methods and composition for the production of orthogonal trna-aminoacyltrna synthetase pairs
WO2004035605A2 (en) * 2002-10-16 2004-04-29 The Scripps Research Institute Glycoprotein synthesis
PT1578949E (pt) 2002-10-16 2009-07-14 Scripps Research Inst Incorporação específica do local de cetoaminoácidos em proteínas
MXPA05006836A (es) 2002-12-22 2005-08-16 Scripps Research Inst Colecciones ordenadas de proteinas.
CN103215228A (zh) 2003-04-17 2013-07-24 斯克利普斯研究院 扩展真核生物遗传密码
MXPA05013833A (es) 2003-06-18 2006-05-17 Scripps Research Inst Adiciones al codigo genetico de aminoacidos reactivos no naturales.
EP1704242A4 (en) 2003-07-07 2008-06-18 Scripps Research Inst COMPOSITIONS WITH PAIRS OF ORTHOGONAL LEUCYL-TRNA AND AMINOACYL-TRNA-SYNTHETASE AND USES THEREOF
US7527943B2 (en) 2003-07-07 2009-05-05 The Scripps Research Institute Compositions of orthogonal glutamyl-tRNA and aminoacyl-tRNA synthetase pairs and uses thereof
DE602004011789T2 (de) 2003-07-07 2009-02-12 The Scripps Research Institute, La Jolla Zusammensetzungen der orthogonalen Lysyl-tRNA und Aminoacyl-tRNA Synthetase Paaren und ihre Verwendungen
JP5135504B2 (ja) 2004-10-27 2013-02-06 ザ スクリプス リサーチ インスティチュート 非天然アミノ酸のインビボ組込み用直交翻訳成分

Also Published As

Publication number Publication date
WO2006034332A3 (en) 2007-12-06
EP1794323B1 (en) 2014-08-06
EP1794323A2 (en) 2007-06-13
US7824893B2 (en) 2010-11-02
CA2580840A1 (en) 2006-03-30
IL182035A0 (en) 2007-07-24
WO2006034332A2 (en) 2006-03-30
BRPI0515547A (pt) 2008-07-29
ES2666693T3 (es) 2018-05-07
ES2519444T3 (es) 2014-11-07
US7718410B2 (en) 2010-05-18
IL218089A (en) 2014-01-30
EP2770053B1 (en) 2018-02-21
IL218090A (en) 2014-02-27
US20080220472A1 (en) 2008-09-11
IL218089A0 (en) 2012-03-29
CN101151366A (zh) 2008-03-26
JP2008513039A (ja) 2008-05-01
PL1794323T3 (pl) 2015-02-27
CN101151366B (zh) 2012-12-19
JP2013009682A (ja) 2013-01-17
EP2770053A1 (en) 2014-08-27
IL218090A0 (en) 2012-03-29
US20060073507A1 (en) 2006-04-06
AU2005286722B2 (en) 2010-12-02
MX2007003142A (es) 2007-07-04
EP1794323A4 (en) 2008-08-27
AU2005286722A1 (en) 2006-03-30
JP5823941B2 (ja) 2015-11-25

Similar Documents

Publication Publication Date Title
ES2666693T3 (es) Incorporación in vivo de alquinil aminoácidos a proteínas en eubacterias
EP1994165B1 (en) Genetically programmed expression of proteins containing the unnatural amino acid phenylselenocysteine
US8114629B2 (en) Site specific incorporation of keto amino acids into proteins
US9783798B2 (en) Site-specific incorporation of redox active amino acids into proteins
MX2008014776A (es) Aminoacidos de cumarina fluorescentes geneticamente codificados.